Documentos de Académico
Documentos de Profesional
Documentos de Cultura
04 Estadistica
04 Estadistica
SEMANA 4
ÍNDICE
2
ESTE DOCUMENTO CONTIENE LA SEMANA 4
MEDIDAS DE DISPERSIÓN
APRENDIZAJES ESPERADOS
Durante esta semana se trabajará el tema correspondiente a las medidas de dispersión. Para esto
se presentarán definiciones teóricas apoyadas de ejemplos y ejercicios desarrollados los cuales
ilustrarán las principales aplicaciones de estas medidas en el contexto de la estadística.
RANGO O RECORRIDO
En el caso que los datos se encuentren no agrupados se puede definir al estadígrafo como la
diferencia entre la mayor y la menor de las observaciones.
Si los datos están agrupados, para calcular el recorrido, se tiene que revisar la tabla de distribución
de frecuencias. Primero se selecciona el límite superior del último intervalo y, luego, el límite
inferior del primer intervalo y se calcula la diferencia entre estos valores la fórmula para calcularlo
es:
3
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Si se comparan las representaciones gráficas de las distribuciones A y B; claramente la
distribución B posee una mayor dispersión de los datos.
CÁLCULO DE LA VARIANZA
FÓRMULA PARA DATOS NO AGRUPADOS
Esta es utilizada para calcular la varianza cuando la muestra de datos no se encuentra agrupada
(tabla distribución de frecuencia) es:
Por ejemplo, si se compara la dispersión de los siguientes datos, los cuales corresponden a las
notas de dos grupos de alumnos:
Grupo 1:
Grupo 2:
Antes de calcular ya se puede adelantar, mirando las distribuciones, que el Grupo 2 tiene mayor
dispersión de notas.
4
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Calculando:
GRUPO 1
GRUPO 2
Reemplazamos: =
Por ejemplo, los siguientes datos (agrupados) corresponden a las notas de dos grupos de
estudiantes, de los cursos A y B.
5
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Curso A Curso B
Notas Xi ni Ni fi Notas Xi ni Ni fi
[1,0-1,8) 1,4 9 9 0,18 [1,0-1,8) 1,4 8 8 0,16
[1,8-2,6) 2,2 4 13 0,08 [1,8-2,6) 2,2 10 18 0,20
[2,6-3,4) 3 14 27 0,28 [2,6-3,4) 3 11 29 0,22
[3,4-4,2) 3,8 8 35 0,16 [3,4-4,2) 3,8 9 38 0,18
[4,2-50) 4,6 7 42 0,14 [4,2-50) 4,6 7 45 0,14
[5,0-5,8) 5,4 6 48 0,12 [5,0-5,8) 5,4 3 48 0,06
[5,8-6,6) 6,2 2 50 0,04 [5,8-6,6) 6,2 2 50 0,04
50 1 50 1
Calculando:
Promedio Curso A
Remplazamos
Promedio Curso B
Remplazamos
6
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Curso A
Notas Xi ni Ni fi
[1,0-1,8) 1,4 9 9 0,18 0,25 4,1 36,6
[1,8-2,6) 2,2 4 13 0,08 0,18 1,5 5,9
[2,6-3,4) 3,0 14 27 0,28 0,84 0,2 2,4
[3,4-4,2) 3,8 8 35 0,16 0,61 0,1 1,2
[4,2-50) 4,6 7 42 0,14 0,64 1,4 9,8
[5,0-5,8) 5,4 6 48 0,12 0,65 3,9 23,6
[5,8-6,6) 6,2 2 50 0,04 0,25 7,8 15,5
50 1 3,42 1,939
Curso B
Notas Xi ni Ni fi
[1,0-1,8) 1,4 8 8 0,16 0,22 3,3 26,6
[1,8-2,6) 2,2 10 18 0,20 0,44 1,0 10,5
[2,6-3,4) 3,0 11 29 0,22 0,66 0,1 0,6
[3,4-4,2) 3,8 9 38 0,18 0,68 0,3 3,0
[4,2-50) 4,6 7 45 0,14 0,64 1,9 13,3
[5,0-5,8) 5,4 3 48 0,06 0,32 4,7 14,2
[5,8-6,6) 6,2 2 50 0,04 0,25 8,9 17,7
50 1 3,22 1,751
7
ESTE DOCUMENTO CONTIENE LA SEMANA 4
CÁLCULO DE LA DESVIACIÓN TÍPICA O ESTÁNDAR CON DATOS NO
AGRUPADOS Y AGRUPADOS
Ejemplo para datos no agrupados: Para los siguientes datos de las estaturas de dos grupos de
mujeres, comparar dispersión entre el Grupo 1 y el Grupo 2, cuyas estaturas son:
Grupo 1:
1,56 - 1,81 - 1,75 - 1,98 - 1,59 - 1,80
Y el Grupo 2, siendo las estaturas: 1,76 - 1,86 - 1,96 - 1,76 - 1,61 - 1,89
Solución:
8
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Ejemplo 2: Los siguientes datos (agrupados) corresponden a las estaturas (en centímetros) de dos
grupos de varones. ¿En qué grupo hay mayor dispersión de estaturas?
Grupo A Grupo B
Estaturas Xi ni Ni fi Estaturas Xi ni Ni fi
[149;157) 153 5 5 0,13 [149;157) 153 2 5 0,04
[157;165) 161 4 9 0,10 [157;165) 161 8 9 0,18
[165;173) 169 7 16 0,18 [165;173) 169 7 16 0,16
[173;181) 177 8 24 0,20 [173;181) 177 11 24 0,24
[181;189) 185 10 34 0,25 [181;189) 185 10 34 0,22
[189;197) 193 6 40 0,15 [189;197) 193 7 40 0,16
40 45
Solución:
Grupo A
Estaturas Xi ni Ni fi
[149;157) 153 5 5 0,13 19,13 501,76 2508,8
[157;165) 161 4 9 0,10 16,10 207,36 829,4
[165;173) 169 7 16 0,18 29,58 40,96 286,7
[173;181) 177 8 24 0,20 35,40 2,56 20,5
[181;189) 185 10 34 0,25 46,25 92,16 921,6
[189;197) 193 6 40 0,15 28,95 309,76 1858,6
40 media 175,40 Varianza 164,76
Desv.
12,84
Standard
Desarrollo Grupo B
Grupo B
Estaturas Xi ni Ni fi
[149;157) 153 2 5 0,04 6,80 534,1 1068,2
[157;165) 161 8 9 0,18 28,62 228,3 1826,8
[165;173) 169 7 16 0,16 26,29 50,6 354,0
[173;181) 177 11 24 0,24 43,27 0,8 8,7
[181;189) 185 10 34 0,22 41,11 79,0 790,1
[189;197) 193 7 40 0,16 30,02 285,2 1996,6
45 media 176,11 Varianza 137,4
Desv.
11,7
Standard
9
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Revisando los resultados el grupo B tiene menor dispersión que el grupo A
COEFICIENTE DE ASIMETRÍA
Karl Pearson (1895) desarrolló una medida para evaluar el sesgo de una distribución, denominada
coeficiente de asimetría (C. A).
PERCENTILES
Cuando se tiene una muestra de valores perteneciente a una variable continua, se pueden ordenar
los valores de menor a mayor y de acuerdo a la posición de cada valor numérico, se puede
determinar el porcentaje de elementos (valores) que son menores o mayores a un determinado
punto de corte, por lo tanto, cuando se habla de percentiles, se está dividiendo la muestra de
datos en 99 puntos de corte que dividen a la población en 100 partes de igual frecuencia.
Ejemplo: Si “x” es 30 y “n” es 50, entonces el percentil 30 (P30) es un número tal que garantiza que
en la muestra un 30% (15 observaciones) son menores que (P30) y un 70% (35 observaciones) son
mayores a (P30). Algunos casos particulares son:
10
ESTE DOCUMENTO CONTIENE LA SEMANA 4
CÁLCULO DEL PERCENTIL EN DATOS AGRUPADOS
La fórmula para el cálculo del percentil es la siguiente:
11
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Ejemplo 1: Considérese el siguiente cuadro de distribución, correspondiente a los pesos de un
grupo de mujeres:
12
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Consideremos el problema inverso, es decir, se conoce el percentil y queremos determinar qué
porcentaje de las observaciones es menor o mayor que él.
En el ejemplo anterior de los pesos del grupo de mujeres, se quería determinar, qué porcentaje de
ellas pesa menos de 77 kg. Pero al mirar la tabla de frecuencias, el resultado no es tan directo y se
tiene que encontrar el intervalo en donde se encuentra el peso (77 kg), es decir i = 4, de este
intervalo y aplicando la fórmula, se desprende que:
Esto quiere decir que el 69,7% de las mujeres pesa menos de 77 kg.
CUARTILES
Cuando se habla de cuartiles la definición se basa en los percentiles, ya que los cuartiles generan 3
puntos de corte que dividen el conjunto de datos en cuatro grupos con la misma frecuencia
(Pagano, 2011).
13
ESTE DOCUMENTO CONTIENE LA SEMANA 4
El primer cuartil Q1 es el valor que corresponde al punto por debajo del cual se encuentra el 25%
de las observaciones, el segundo cuartil Q2 corresponde a la mediana, es decir separa el 50%
superior de un conjunto de observaciones, del 50% inferior, el tercer cuartil Q3, corresponde al
punto que acumula al 75% de las observaciones.
DIAGRAMA DE CAJA
El diagrama de caja permite resumir la dispersión de los datos en una gráfica.
14
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Diagrama de caja para la variable ingreso
15
ESTE DOCUMENTO CONTIENE LA SEMANA 4
COEFICIENTE DE VARIACIÓN
El coeficiente de variación es una estandarización de la desviación estándar y su principal utilidad
es que permite comparar la variabilidad de dos conjuntos de observaciones en distintas escalas de
medidas. Cuando las variables de dos distribuciones se expresan en unidades diferentes (años,
centímetros, toneladas, entre otros) no tiene sentido comparar algunos de los estadígrafos de
dispersión, pues estos quedan influenciados por el valor numérico de dichas unidades. Esta
dificultad se puede superar mediante el coeficiente de variación (Pagano, 2011).
Es importante considerar que el coeficiente de variación (C.V.) es una medida muy útil cuando:
1. Los datos están en unidades diferentes (como dólares y días de inasistencia).
2. Los datos están en las mismas unidades, pero las medias muy distantes (como sucede con los
ingresos de los ejecutivos y los ingresos de los empleados no calificados).
3. Cuando se desea comparar la variabilidad de dos conjuntos de datos.
A continuación, se presentarán las fórmulas que se utilizan para el cálculo del coeficiente de
variación con datos no agrupados y agrupados
Caso muestra:
Ejemplo: Considérese el caso anterior de las estaturas (en centímetros) de dos grupos de varones.
¿En qué grupo hay mayor dispersión de estaturas?
16
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Ejemplo de cálculo del coeficiente de variación: En una empresa se desea comparar la variación
en los ingresos mensuales de los ejecutivos y los ingresos mensuales de los trabajadores no
calificados.
Un error muy común es afirmar que hay mayor dispersión en los ingresos mensuales de los
ejecutivos comparando la desviación estándar $50.000 > $1.200 sin embargo, las medias están tan
distantes que se necesitan convertir a un coeficiente para efectuar una comparación significativa
de la variación en los ingresos mensuales.
Conclusión: Para los ejecutivos, C.V = 10% y para los trabajadores no calificados; C.V = 10%
No existe diferencia entre la dispersión relativa de sueldos de los ejecutivos y los trabajadores no
calificados.
17
ESTE DOCUMENTO CONTIENE LA SEMANA 4
COMENTARIO FINAL
Durante esta semana aprendimos a calcular las distintas medidas de dispersión tanto para datos
No agrupados como para datos agrupados, cuando la medida de las variables es la misma
utilizaremos la desviación estándar como el estadígrafo para realizar el análisis e interpretación de
resultados, ya que no cambia la magnitud de la variable, a diferencia de la varianza cuyos valores y
obviamente las unidades respectivas se encuentran al cuadrado, además deben recordar que
cuando la unidad de las medidas es distinta el mejor estadígrafo que podemos utilizar es el
coeficiente de variación, otra de las medidas que podemos aplicar con bastante frecuencia es el
cálculo de los percentiles, ya que si quisiéramos saber el porcentaje de casos que se encuentra
sobre o bajo un determinado valor, nuestra respuesta tiene que estar relacionada con aplicar la
fórmula del cálculo de percentil.
18
ESTE DOCUMENTO CONTIENE LA SEMANA 4
REFERENCIAS
Anderson David R., Sweeney Dennis J., Williams Thomas A. (2008). Estadística para
administración y economía (10ª edición). Cencage Learning
Pagano, Robert R. (2011). Estadística para las ciencias del comportamiento (9ª edición).
Cencage Learning.
19
ESTE DOCUMENTO CONTIENE LA SEMANA 4