Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas de Dispersión PDF
Medidas de Dispersión PDF
Medidas de dispersión
Las medidas de dispersión o variabilidad son números que miden el grado de separación de los datos con
respecto a un valor central, que generalmente es la media aritmética.
Las principales medidas de dispersión son: el rango, el rango intercuartil, la varianza, la desviación estándar, y el
coeficiente de variación.
Primero se ordenan los datos en forma creciente y luego se calcula usando la definición.
EJEMPLO: Calcular el rango de los 12 salarios de los trabajadores de una empresa (en dólares)
54 37 63 65 71 73 49 55 54 61 71 45
Solución:
37 45 49 54 54 55 61 63 65 71 71 73
𝑅 = 73 − 37 = 36
Primero se ordenan los datos en forma creciente y luego se calcula usando la definición.
Ejemplo: Hallar el rango de la distribución de frecuencias del número de hijos por familia
𝒙𝒊 𝒇𝒊
0 1
1 4
2 7
3 6
4 2
Total 20
Solución:
𝑅 =4−0 =4
B2. Rango para datos agrupados por intervalos
Hay dos formas de hallar el rango, la primera es usando las marcas de clase y la segunda usando el límite inferior
del primer intervalo y el límite superior del ultimo intervalo.
Ejemplo: Hallar el rango de una muestra de 45 salarios quincenales agrupados en la siguiente distribución de
frecuencias:
Intervalos mi fi
[26,34[ 30 1
[34,42[ 38 2
[42,50[ 46 4
[50,58[ 54 10
[58,66[ 62 16
[66,74[ 70 8
[74,82] 78 4
Total 45
Solución
𝑅1 = 78 − 30 = 48
𝑅2 = 82 − 26 = 56
Definición.- El rango intercuartil 𝑅𝐼, es el número que resulta de la diferencia entre sus cuartiles tercero y
primero. Esto es,
𝑅𝐼 = 𝑄3 − 𝑄1 = 𝑃75 − 𝑃25
El rango intercuartil es una medida que excluye el 25 % más alto (cuarto superior) y el 25 % más bajo (cuarto
inferior), dando un rango dentro del cual se encuentra el 50% central de los datos observados y a diferencia del
rango de los datos no se encuentra afectada por los valores extremos.
Si el rango intercuartil es muy pequeño entonces describe alta uniformidad o pequeña variabilidad de los valores
centrales.
NOTA. Si la distribución de frecuencias tiene marcada asimétrica, el rango intercuartil es preferible a la desviación
estándar como medida de la dispersión.
Primero se ordenan los datos en forma creciente y luego se calcula usando la posición del percentil.
EJEMPLO: Calcular el rango intercuartil de los 12 salarios de los trabajadores de una empresa (en dólares)
54 37 63 65 71 73 49 55 54 61 71 45
Solución:
37 45 49 54 54 55 61 63 65 71 71 73
12(25) 49 + 54
𝑃𝑜𝑠(𝑃25 ) = + 0.5 = 3.5 ⇒ 𝑃25 = = 51.5
100 2
12(75) 65 + 71
𝑃𝑜𝑠(𝑃75 ) = + 0.5 = 9.5 ⇒ 𝑃75 = = 68
100 2
𝑅𝐼 = 68 − 51.5 = 16.5
Primero se ordenan los datos en forma creciente y luego se calcula los percentiles usando la posición de cada
percentil.
Ejemplo: Hallar el rango intercuartil de la distribución de frecuencias del número de hijos por familia
𝒙𝒊 𝒇𝒊 𝑭𝒊
0 1 1
1 4 5
2 7 12
3 6 18
4 2 20
Total 20
Solución:
20(25) 1+2
𝑃𝑜𝑠(𝑃25 ) = + 0.5 = 5.5 ⇒ 𝑃25 = = 1.5
100 2
20(75) 3+3
𝑃𝑜𝑠(𝑃75 ) = + 0.5 = 15.5 ⇒ 𝑃75 = =3
100 2
𝑅𝐼 = 3 − 1.5 = 1.5
Primero se ordenan los datos en forma creciente y luego se calcula usando la posición del percentil.
Ejemplo: Hallar el rango intercuartil de una muestra de 45 salarios quincenales agrupados en la siguiente
distribución de frecuencias:
Intervalos mi fi Fi
[26,34[ 30 1 1
[34,42[ 38 2 3
[42,50[ 46 4 7
[50,58[ 54 10 17
[58,66[ 62 16 33
[66,74[ 70 8 41
[74,82] 78 4 45
Total 45
Solución
45(25)
45(25) −7
𝑃𝑜𝑠(𝑃25 ) = + 0.5 = 11.75 ⇒ 𝑃25 = 50 + 100 (8) = 53.4
100 10
45(75)
45(75) − 33
𝑃𝑜𝑠(𝑃75 ) = + 0.5 = 34.25 ⇒ 𝑃75 = 66 + 100 (8) = 66.75
100 8
Definición.- La varianza se define como la media aritmética de los cuadrados de las diferencias de los datos con
respecto a su media aritmética.
La varianza es una medida de dispersión con unidades de medición al cuadrado, por ejemplo, $2 , 𝐾𝑚2 , etc.
𝑆 = √𝑆 2
Cálculo de la varianza
EJEMPLO: Calcular la varianza de los 12 salarios de los trabajadores de una empresa (en dólares)
54 37 63 65 71 73 49 55 54 61 71 45
Solución:
37 45 49 54 54 55 61 63 65 71 71 73
𝑥̅ = 58.17
∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑆2 =
𝑛−1
Ejemplo: Hallar la varianza de la distribución de frecuencias del número de hijos por familia
𝒙𝒊 𝒇𝒊
0 1
1 4
2 7
3 6
4 2
Total 20
Solución:
𝑥̅ = 2.2
La varianza de 𝑛 valores de una variable estadística continua 𝑋 son agrupados en 𝑘 intervalos, con marcas de
clase 𝑚1 , 𝑚2 , … , 𝑚𝑘 con frecuencias absolutas respectivas 𝑓1 , 𝑓2 , … , 𝑓𝑘 y cuya media aritmética es 𝑥̅ se calcula
utilizando la fórmula:
∑𝑘𝑖=1 𝑓𝑖 (𝑚𝑖 − 𝑥̅ )2
𝑆2 =
𝑛−1
Ejemplo: Hallar la varianza de una muestra de 45 salarios quincenales agrupados en la siguiente distribución de
frecuencias:
Intervalos mi fi
[26,34[ 30 1
[34,42[ 38 2
[42,50[ 46 4
[50,58[ 54 10
[58,66[ 62 16
[66,74[ 70 8
[74,82] 78 4
Total 45
Solución
𝑥̅ = 59.87
Propiedad
Si cada uno de los 𝑛 valores 𝑥¡ es transformado en: 𝑌 = 𝑎 𝑋 + 𝑏 , siendo 𝑎 y 𝑏 constantes, entonces, la varianza
de los 𝑛 valores 𝑌, es:
𝑆 2 𝑌 = 𝑎2 𝑆 2 𝑋
Definición.- El coeficiente de variación, CV, es una medida de dispersión relativa (libre de unidades de medidas),
que se define como el cociente entre la desviación estándar y la media aritmética. Esto es:
𝑆
𝐶𝑉 =
𝑥̅
El coeficiente de variación se utiliza para comparar la variabilidad de dos o más series de datos que tengan medias
iguales o diferentes o que tengan unidades de medidas iguales o diferentes (por decir, una serie en kilogramos y
otra serie en metros).
Ejemplo: Si dos secciones L y R de Estadística I, tienen la misma desviación estándar igual a 14, no podemos
concluir que los dos horarios tienen la misma variabilidad.
Así mismo, si las desviaciones estándares de L y R son iguales a 2 y 4 respectivamente no podemos concluir que
las notas de R son más dispersas que las de L. La variabilidad depende de las medias de los dos grupos.
Si la media del horario L es 16 y la media del horario R es 11, los coeficientes de variación respectivos son:
2
𝐶𝑉1 = = 0.125 = 12.50%
16
4
𝐶𝑉2 = = 0.3636 = 36.36%
11
La sección R presenta mayor variabilidad que la sección L.
Ejemplo: En una evaluación de Matemáticas y Estadística resultan las medias 13 y 17 y la desviaciones estándar 3
y 4, respectivamente. Si un estudiante obtiene 14 en Matemáticas y 16 en Estadística, ¿en cuál de los dos cursos
tiene mejor rendimiento relativo?
𝑥 − 𝑥̅ 14 − 13
𝑧1 = = = 0.3333
𝑠 3
𝑥 − 𝑥̅ 16 − 17
𝑧2 = = = −0.25
𝑠 4
PROBLEMA
Los siguientes datos muestran los calificativos de 20 personas sometidos a una prueba de aptitud. Los 20
estudiantes fueron divididos en dos grupos, al grupo 1 se calificó de 0 a 100 y al grupo 2 de 0 a 20 :
Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15.
a) Calcule la media y la desviación estándar en cada grupo, ¿cuál de los grupos es más homogéneo?
6.73
𝐶𝑉1 = = 0.0784 = 7.84%
85.8
2.31
𝐶𝑉2 = = 0.1383 = 13.83%
16.7
El grupo más homogéneo es el grupo 1.
b) ¿Se puede aceptar que el estudiante con 73 puntos del grupo 1 tiene mayor aptitud que el estudiante con 13
puntos del grupo 2?
𝑥 − 𝑥̅1 73 − 85.8
𝑧1 = = = −1.9019
𝑠 6.73
𝑥 − 𝑥̅2 13 − 16.7
𝑧2 = = = −1.6017
𝑠 2.31
No se puede aceptar pues el estudiante del segundo grupo tiene mayor aptitud.