Está en la página 1de 30

Instituto Tecnológico de Orizaba

ESTADÍSTICA
DESCRIPTIVA

Mario Leoncio Arrioja Rodríguez


Estadística Descriptiva
Introducción

Frecuentemente los datos obtenidos en el


muestreo son tan numerosos, que pueden ser
virtualmente inútiles, a menos que se
condensen convenientemente a través de las
técnicas que proporciona la Estadística
Descriptiva, las cuales se pueden clasificar en
tres grupos:
 Tablas o Cuadros,
 Gráficas, y
 Estimación de Parámetros

2
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
TABLAS O CUADROS

Estas permiten mostrar sólo los datos relevantes para facilitar


el análisis de los mismos, los elementos mas importantes que
los constituyen son:
1. Número
Tabla No. 1
2. Título - Lo más condensado y
Número de Habitantes por Sexo y Entidad
claro posible Federativa en la República Mexicana
3. Encabezados Número de Habitantes
Estado Hombres Mujeres Total
Aguascalientes

4. Cuerpo o Matriz

Zacatecas

5. Origen de los datos Fuente: XXV Censo de Población, INEGI

3
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
EJEMPLO 1: TABLAS DE DATOS DE DOS VARIABLES

Velocidad de corte 40 RPM 60 RPM 80 RPM 100 RPM


La configuración Tipo 2 Tipo 3

Velocidad de corte
Configuración 40 RPM 60 RPM 80 RPM 100 RPM

Vel. Observaciones
2 Conf.
Corte 1 2 … n
1
40
2
1
Velocidad de Configuración 60
Corte 2
1 2
1
80
40 RPM 2
60 RPM 1
100
2
80 RPM

100 RPM
Estadística Descriptiva
EJEMPLO 2: TABLA DE DATOS DE TRES VARIABLES
Velocidad de corte 40 RPM 60 RPM 80 RPM 100 RPM
La configuración Tipo 2 Tipo 3
Tamaño de la broca 1/16 Plg 1/8 Plg 1/4 Plg
Tamaño de Broca 1/16 Plg 1/8 Plg 1/4 Plg
Velocidad de corte 40 60 80 100 40 60 80 100 40 60 80 100
1
Configuración
2

Tamaño Observaciones
Vel. Corte Conf.
Broca 1 2 … n
Velocidad de corte 1/16
Tamaño de Configuración
1 1/8
la broca 40 RPM 60 RPM 80 RPM 100 RPM
1/4
1 40
1/16 Plg 1/16
2 2 1/8
1 1/4
1/8 Plg 1/16
2
1 1/8
1
1/4 Plg 60
1/4
2 1/16
2 1/8
1/4
1/16
1 1/8
Las tablas de mas de una entrada 1/4
80
distribuida en filas y columnas es mas 1/16
2 1/8
compacta. 1/4
1/16
1 1/8
1/4
100
1/16
2 1/8
1/4
Estadística Descriptiva
TABLAS DE FRECUENCIA
Son un caso especial de tablas, es un paso intermedio en el
análisis de datos. El paso inicial, que es crítico, es la
determinación del número de clases, cuando estas no están
limitadas por el problema
Algunas Reglas para Determinar el Número de Clases:

♦ Regla empírica : 5 ≤ k ≤ 15
2 k −1 = n
♦ Regla de Stuges : (k − 1) log(2) = log(n)
o 2k-1 < n ≤ 2k k −1 =
1
log(n)
o k = 1 + 3.3 log n log(2)
k − 1 = 3.322 log(n)
k = 1 + 3.322 log(n)
donde:
k = número de clases
n = número de datos o tamaño de la muestra

6
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
TABLAS DE FRECUENCIA
Los restantes elementos necesarios en la construcción de la
tabla de frecuencia o para la realización de análisis
posteriores son:

Rango = R = Xmax - Xmín

Ancho de Clase = AC = Rango / k

Longitud de Clase= LC = Ancho de Clase + Unidad Mínima

Marca de Clase = mi = (Límitesup + Límiteinf) / 2


= mi-1 + Longitud de Clase

También la longitud de clase se puede obtener mediante:


LC= mi+1 - mi
7
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
TABLAS DE FRECUENCIA
Los Límites de Clase se obtienen a partir de la información
anterior de diversas maneras:
Ejemplo:
Xmin = 33 1. El primer límite inferior (LI1) es igual a
Xmax = 97
AC = 10
Xmín
Clases 2. El límite superior es: LSi = LIi + AC
33 - 43 3. Los restantes LIi pueden obtenerse por:
44 - 54 a. LIi = LSi-1 + Unidad Mínima
55 - 65 b. LIi = LIi-1 + LC
66 - 76 4. Los restantes LSi pueden obtenerse
como en el paso 2 o por LSi = LSi-1 + LC
77 - 87
5. Se continuará poniendo límites hasta
88 - 98 que Xmax ≤ LSi
8
agosto de 2010 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
TABLAS DE FRECUENCIA
La obtención del número de elementos que caen en cada
clase, conocida como frecuencia de clase absoluta fi , se
puede obtener mediante varia técnicas, como:

Clases m1 fi
33 - 43 38 Múltiplos de Cinco:
44 - 54 49
55 - 65 60
66 - 76 71 Múltiplos de Diez:
77 - 87 82
88 - 98 93

9
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
TABLAS DE FRECUENCIA

Las columnas mas frecuentes en una tabla de frecuencia


son: Clases m f f% F F% 1-F 1-F %
1 i i i i i i

33 - 43 38 7 8.43 7 8.43 83 100.00


44 - 54 49 9 10.84 16 19.28 76 91.57
55 - 65 60 17 20.48 33 39.76 67 80.72
66 - 76 71 26 31.33 59 71.08 50 60.24
77 - 87 82 18 21.69 77 92.77 24 28.92
88 - 98 93 6 7.23 83 100 6 7.23

mi Marca de clase
fi Frecuencia de clase absoluta
f i% Frecuencia de clase relativa
Fi Frecuencia de clase acumulada absoluta
Fi% Frecuencia de clase acumulada relativa
1-Fi Frecuencia de clase acumulada inversa absoluta
1-Fi% Frecuencia de clase acumulada inversa relativa
10
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
GRÁFICAS

Permiten observar fácilmente algunas características de


la población. Los elementos que conforman las gráficas
son básicamente los mismos que conforman los
cuadros.

Miles de Pesos
600
3. Cuerpo de la gráfica 400 Producto 1
200 Producto 2
0
4. Leyendas de los ejes
2007
5. Fuente de donde provienen Fuente: Archivos de la empresa

1. Número de gráfica Gráfica No. 1 Ventas Mensuales de la Compañía

2. Título de la gráfica

11
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
Gráficas: Ejemplos
Las gráficas de barras ilustran las
comparaciones entre elementos
individuales, enfatizando los valores y no
el tiempo o distancia entre las categorías
Tiempo de realización de una tarea
100 Los gráficos de línea facilitan mostrar
las tendencias entre los datos a
Núm. de Trabajadores

80

60

40
S…
intervalos idénticos.
20

0
87.5 105.5 123.5
minutos
141.5 159.5
Se puede mejorar la apariencia pero
no siempre la claridad si se usan
figuras y efectos en tercera dimensión.

Las gráficas de barras 1

apiladas muestran la 2
3
relación de cada 4
elemento con el todo 5
12
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
GRÁFICAS: LA PROPORCIÓN

Regla empírica: La longitud del eje Y debe ser


unas ¾ partes la longitud del eje X.

13
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
GRÁFICAS Y LA TABLA DE FRECUENCIA

Las columnas adicionales, que se requiere obtener en la


tabla de frecuencia, dependen del tipo de gráfica que se
necesite dibujar.
Gráfica Datos Notas
Barras / Histograma, X-Y, Si hay mas de una variable por
fi, mi
Diagrama de Dispersión, etc. cada una de ellas habrá una fi
Se deben agregar al inicio y al final
Polígono de Frecuencia fi, mi
una clase con frecuencia cero
Ojiva menor que Fi, LRS
Ojiva mayor que 1-Fi, LRI
Pastel, Anillo fi

14
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMACIÓN DE PARÁMETROS

En otros casos se requiere resumir los datos en valores


numéricos que representan ciertas características
particulares de cada población (parámetros) a los que se
llama estimadores.
Existe una gran cantidad de parámetros, pero los que
tienen un mayor uso en la práctica de la estadística,
entran en las primeras dos clases de estimación de
parámetros:
• De tendencia central: media, moda y mediana.
• De variabilidad o dispersión: rango, varianza,
desviación estándar y desviación media.

15
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIA

Es el promedio que más comúnmente se utiliza para


describir una serie de datos. Existen varias medias, de
estas la más usada es la media aritmética conocida
simplemente como media (las otras son la media
ponderada, la media geométrica y la media armónica).
Simbólicamente se escribe como:
n

∑X i
Para Datos Simples: X = i =1

n
k

∑fm i i
Para Datos Agrupados: X= i =1
n

16
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIA

Sea X la variable peso en Kg. Supóngase que se desea


obtener el peso promedio de un lote de 50 cajas de libros
para lo cual se obtiene una muestra de tres cajas del mismo,
siendo sus valores observados : 54, 59 y 63.
Son Datos Simples:
n

∑X i
X= i =1

17
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIA
En una investigación sobre la mortalidad de personas con
seguro de vida de la compañía X, en la ciudad de Orizaba
durante el año de 2009. Se obtuvo una muestra
encontrándose los siguientes valores:
Grupos Número de Marca de (fi) (mi)
de Edad Muertes Clase (mi)
50 - 54 16 52.5 840
55 – 59 58 57.5 3,335
60 – 64 180 62.5 11,250
65 – 69 513 67.5 34,627.5
767 50,052.5
Datos Agrupados:
k

∑ f i mi X=
50,052.5
= 65.26
X= i =1 767
n
18
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MODA
Se utiliza para determinar cual es el valor que ocurre con
más frecuencia en los datos. Es el único estimador que
puede no existir, existir una o existir mas de una vez.
Para Datos Simples: Sólo se contabiliza la ocurrencia de cada valor,
aquel que ocurra más veces ese será la moda.
Para Datos Agrupados:
 f modal − f modal−1 
X MODA = LRI +   LC
 ( f modal − f modal−1 ) + ( f modal − f modal+1 ) 
Donde:
LRI = Límite Real Inferior de la clase modal
fmodal = frecuencia de la clase modal
fmodal-1 = frecuencia de la clase anterior a la clase modal
fmodal+1 = frecuencia de la clase posterior a la clase modal
LC = longitud de clase

19
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MODA

Identificar a la clase modal, la de fi mayor, para a partir


de ahí obtener las frecuencias para aplicar la fórmula
Clases m1 fi
33 - 43 38 7 Frec. Modal  26 − 17 
X MODA = 65.5 +  11
 (26 − 17 ) + (26 − 18)
44 - 54 49 9 26
55 - 65 60 17 Clase Modal

66 - 76 71 4
26 Moda
LRI
77 - 87 82 18
65.5 71.32
88 - 98 93 6

Datos Agrupados:

 f modal − f modal−1 
X MODA = LRI +   LC
 ( f modal − f modal−1 ) + ( f modal − f modal+1 ) 

20
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIANA
Permite obtener el valor que se encuentra exactamente en
la posición central de una serie de datos.
Para Datos Simples: Ordenar los valores de menor a mayor y elegir
al que se encuentra en la posición central.
 
Impar: X MED = X n +1 Par: X MED 
=  X n + X n +1  2
2  2 2 

 n m −1 
 2 − ∑ fi 
Para Datos Agrupados:
X MED = LRI +  i =1
 LC
 fm 
Donde:  
LRI = Límite Real Inferior de la clase mediana
n = Tamaño de muestra
fi = Frecuencia de la clase i
fm = Frecuencia de la clase mediana
LC = Longitud de clase
21
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE TENDENCIA CENTRAL: MEDIANA
Identificar a la clase mediana, en la columna Fi, la que tiene
el dato en la posición (n+1)/2, si es impar o n/2 si es par, y
aplicar la fórmula
 83 
 2 − 33 
Clases m1 fi Fi Lugar Med.
33 - 43 38 7 7 42 X MED = 66.5 +  11
44 - 54 49 9 16
Clase Med.
 26 
55 - 65 60 17 33
4  
Fi-1
66 - 76 71 26 59 33 Mediana
77 - 87 82 18 77 LRI
65.5 69.096
88 - 98 93 6 83

Para Datos Agrupados:


 n m −1 
 2 − ∑ fi 
X MED = LRI +  i =1
 LC
 fm 
 
22
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: RANGO

Es la medida mas burda de variabilidad. Permite tener una


idea muy general del grado de dispersión de un conjunto
de datos, sólo usa dos valores: el mayor y el menor de
ellos.

R=Xmax – Xmin

23
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: VARIANZA / DESVIACIÓN
ESTÁNDAR
Es el estimador mas utilizado para medir la dispersión de
conjunto de datos, la varianza (S2) no es fácil de interpretar,
la desviación estándar (S) si.
n

∑( X −X)
2

Para Datos Simples: i

Donde: S 2
= i =1

n −1
xi = i-ésimo dato
X = Media aritmética
n = tamaño de muestra S = S2
k

∑ f (m − X )
2
Para Datos Agrupados: i i
S2 = i =1

n −1
Donde:
mi = Marca de la clase i
fi = Frecuencia de la clase i
24
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: VARIANZA / DESVIACIÓN
ESTÁNDAR
Sea X la variable peso en Kg. Supóngase que se desea
obtener el peso promedio de un lote de 50 cajas de libros
para lo cual se obtiene una muestra de tres cajas del mismo,
siendo sus valores observados : 54, 59 y 63.
Para Datos Simples: n

∑( X −X)
2
i
S2 = i =1

n −1

S = 4.51

25
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: VARIANZA / DESVIACIÓN
ESTÁNDAR
Para Datos Agrupados:
k

∑ fi ( mi − X )
2

S =
2 i =1

n −1

Se recomienda calcular columnas adicionales en la tabla de


frecuencia para aplicar la fórmula

Lím. Inf. Lím. Sup. mi fi (mi-media)2 fi(mi-media)2

33 43 38 7 873.45 6,114.16 18,132.51


44 54 49 9 344.26 3,098.33 S2 =
55 65 60 17 57.07 970.13 83 − 1
66 76 71 26 11.87 308.71
Desviación
77 87 82 18 208.68 3,756.25 Varianza
Estándar
88 98 93 6 647.49 3,884.93 221.13 14.870
18,132.51

26
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: DESVIACIÓN MEDIA

Este estimador de variabilidad no es muy popular, sin


embargo proporciona una medida que es fácil de
interpretar.
n

Para Datos Simples: ∑X i −X


DM = i =1
Donde: n −1
Xi = i-ésimo dato
X = Media aritmética
n = tamaño de muestra
k
Para Datos Agrupados: ∑f i mi − X
DM = i =1

Donde: n −1
mi = Marca de la clase i
fi = Frecuencia de la clase i
27
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: DESVIACIÓN MEDIA

Sea X la variable peso en Kg. Supóngase que se desea


obtener el peso promedio de un lote de 50 cajas de libros
para lo cual se obtiene una muestra de tres cajas del mismo,
siendo sus valores observados : 54, 59 y 63.
Para Datos Simples: n

∑X i −X
DM = i =1
n −1

54 − 58.67 + 59 − 58.67 + 63 − 58.67 9.33


DM = = = 4.67
3 −1 2

28
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
Estadística Descriptiva
ESTIMADORES DE DISPERSIÓN: DESVIACIÓN MEDIA

Para Datos Agrupados:


k

∑f i mi − X
DM = i =1
n −1

Se recomienda calcular columnas adicionales en la tabla de


frecuencia para aplicar la fórmula
Lím. Inf. Lím. Sup. mi fi |mi-media| fi|mi-media|

33 43 38 7 29.554 206.88 1,004.6


DM =
83 − 1
44 54 49 9 18.554 166.99
55 65 60 17 7.5542 128.42
66 76 71 26 3.4458 89.59
Desviación
77 87 82 18 14.446 260.02 Media
88 98 93 6 25.446 152.67 12.251
1,004.6

29
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com
EJERCICIOS RECOMENDADOS
● Ejemplos de un problema que requiera de la obtención de
datos por censo y uno que requiera muestreo
● Análisis Crítico de Cuadros / Tablas y de Gráficas en libros,
revistas e Internet
● Prácticas:
o DE-EB-01 Elaboración de la Tabla de Datos I (Unifactorial y
Bifactorial)
o DE-EB-02 Elaboración de la Tabla de Datos III (Trifactorial)
o ED-TF-01y ED-TF-02 Tabla de Frecuencia
o ED-GR-01y ED-GR-02 Construcción de gráficas
o ED-EP-01 Cálculo de estimadores de tendencia central de datos
simples
o ED-EP-02 Cálculo de estimadores de dispersión de datos simples
o ED-EP-03 Cálculo de estimadores de tendencia central de datos
agrupados
o ED-EP-04 Cálculo de estimadores de dispersión de datos agrupados
● Resolver ejercicios utilizando el ejercitador ó el verificador de
estimaciones
30
febrero de 2011 Mario Leoncio Arrioja Rodríguez mlarrioja@gmail.com

También podría gustarte