Medidas de Dispersión
Las medidas de dispersión nos indican que tan dispersos están los datos entre sí;
ayudan a determinar aspectos de homogeneidad o heterogeneidad en un conjunto
de datos.
Variación o dispersión: es el grado en que los datos u observaciones de una
distribución tienden a concentrarse o extenderse alrededor de un valor central
(promedio).
Una medida de dispersión pequeña indica que los datos se acumulan con
proximidad alrededor de la media aritmética. Por consiguiente, la media se
considera representativa de los datos. Caso contrario una medida de dispersión
grande indica que la media no es confiable.
Una medida de dispersión sirve para evaluar la confiabilidad de dos o más medidas
de ubicación.
Las medidas de dispersión o variabilidad más conocidas son: el rango, la desviación
media, la desviación típica o estándar, la varianza y el coeficiente de variación.
La medida de variación más utilizada es la desviación típica o estándar.
La varianza y la desviación estándar proporcionan la distancia promedio de
cualquier observación del conjunto de datos con respecto a la media de la
distribución. Cada población tiene una varianza. La raíz cuadrada de la varianza es
la desviación.
Rango
La medida de dispersión más simple es el rango. Representa la diferencia entre los
valores máximo y mínimo de un conjunto de datos
Ing. Alejandrina Flores Reyes
Una desventaja del rango es que solo considera dos valores
Desviación Media
Mide la cantidad media respecto de la cual los valores de una población o muestra
varían.
Desviación media: es la media aritmética de los valores absolutos de las
desviaciones con respecto a la media aritmética.
En donde:
𝑥 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛.
𝑥̅ = 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠.
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
| | = 𝑣𝑎𝑙𝑜𝑟 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜
EJEMPLO
Cinco representantes de servicio al cliente de una tienda de electrodomésticos
trabajaron el fin de semana Las cantidades de electrodomésticos que vendieron
son las siguientes:
5 8 10 4 3
Calcular la desviación media.
Solución:
Lo primero que debemos hacer es calcular la media:
∑𝑥 5 + 8 + 10 + 4 + 3
𝑥̅ = = =6
𝑛 5
Ing. Alejandrina Flores Reyes
𝑥 − 𝑥̅ |𝑥 − 𝑥̅ |
X ∑|𝑥 − 𝑥̅ | 12
5 5 – 6 = -1 |−1|=1 𝐷𝑀 = = = 2.4
𝑛 5
8 8–6=2 |2|=2
10 10 – 6 = 4 |4|=4 Interpretación: el promedio de las
4 4–6=-2 |−2|=2 desviaciones de los datos de la venta del
3 3–6=-3 |−3|=3 fin de semana con respecto a la media fue
∑(𝑥 − 𝑥̅ ) = 0 ∑|𝑥 − 𝑥̅ | = 12 de 2.4
Desviación estándar o Desviación típica
Esta medida de dispersión al igual que la desviación media- indica el promedio de
las desviaciones de los datos con respecto a su media. El símbolo S se utiliza para
denotar la desviación estándar de la muestra y el símbolo 𝝈 para la Desviación
Estándar de la población.
En la desviación media se trabaja con el valor absoluto de las desviaciones, la
varianza y la desviación estándar (o desviación típica) lo hacen con el cuadrado de
las desviaciones.
La desviación estándar se expresa en las mismas unidades de los datos.
La fórmula para calcular la Desviación Estándar de la muestra y la población para
datos no agrupados son las siguientes:
Donde:
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛.
𝑥 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛.
𝑁 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛.
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛
Ing. Alejandrina Flores Reyes
Donde:
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑡𝑟𝑎.
𝑥 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛.
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
EJEMPLO
Con los datos del ejemplo anterior vamos a calcular la desviación estándar.
5 8 10 4 3
Solución:
Lo primero que debemos hacer es calcular la media:
∑𝑥 5 + 8 + 10 + 4 + 3
𝑥̅ = = =6
𝑛 5
𝑥 − 𝑥̅ (𝑥 − 𝑥̅ )2
X
5 5 – 6 = -1 (−1)2 = 1
∑(𝑥 − 𝑥̅ )2 34
8 8–6=2 (2)2 = 4 𝑠=√ =√ = 2.92
10 10 – 6 = 4 (4)2 = 16 𝑛−1 5−1
4 4–6=-2 (−2)2 = 4
3 3–6=-3 (−3)2 = 9 Interpretación: en promedio los datos de
∑(𝑥 − 𝑥̅ ) = 0 ∑(𝑥 − 𝑥̅ )2 = 34 las ventas se desvían respecto de su
media 2.92 unidades.
Ing. Alejandrina Flores Reyes
Calculo de la desviación estándar con datos agrupados
Para calcular la desviación estándar con datos agrupados para una muestra o para
una población, utilizaremos las siguientes formulas:
Desviación estándar de la muestra
∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅)𝟐 𝒇𝒊
𝒔=√
𝒏−𝟏
Donde:
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑥𝑖 = 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝑛 = 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Desviación estándar de la población
∑𝒏𝒊=𝟏(𝒙𝒊 − 𝝁
̅ )𝟐 𝒇𝒊
𝝈=√
𝑵
Donde:
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛
𝑥𝑖 = 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝑛 = 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛
Ing. Alejandrina Flores Reyes
Varianza
Es una medida de dispersión que se obtiene al elevar al cuadrado la desviación
estándar. Se denota por 𝒔𝟐 para la muestra y 𝝈𝟐 para la población.
La varianza se interpreta sencillamente como el cuadrado del promedio de las
desviaciones de los datos con respecto a su media.
La varianza no es negativa y es cero solo si todas las observaciones son las mismas.
Medidas de dispersión relativa
Estas son medidas de dispersión que se comparan con otra medida que puede ser
de tendencia central.
La desviación estándar es una medida de dispersión absoluta y expresa la variación
en las mismas unidades de los datos originales.
Una medida de dispersión relativa nos da una idea general de la magnitud de la
desviación estándar en relación con la magnitud de la media. La medida que vamos
estudiar es el coeficiente de variación denotado como CV se expresa en porcentaje
y se calcula de la siguiente manera:
𝜎 𝑠
𝑐𝑣 = 𝜇 𝑥 100% 𝑐𝑣 = 𝑥̅ 𝑥 100 %
Ing. Alejandrina Flores Reyes
Donde:
𝑐𝑣 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
El coeficiente de variación es una medida relativa que resulta de utilidad al comparar
la cantidad de variación en grupos de datos que posean medias diferentes.
EJEMPLO
El peso en libras de 33 niños con edades de 1 año se refleja en la siguiente
distribución de frecuencias:
Peso f
5-9 5 Calcular: desviación estándar, varianza y coeficiente de variación.
10 - 14 8 interprete
15 - 19 4
20 - 24 10
25 - 29 6
n= 33
Solución:
El primer paso es calcular la media para datos agrupados
El segundo paso, para calcular la varianza necesitamos la columna de la diferencia
de la marca de clase y la media, la columna del cuadrado de esa diferencia y la de
la frecuencia multiplicada por dicha diferencia al cuadrado.
Peso 𝑓𝑖 𝑥𝑖 𝑥𝑖 − 𝑥̅ (𝑥𝑖 − 𝑥̅ )2 (𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝑓𝑖 𝑥𝑖
5-9 5 7 35 -10.61 112.57 562.85
10 - 14 8 12 96 -5.61 31.47 251.76
15 - 19 4 17 68 -0.61 0.37 1.48
20 - 24 10 22 220 4.39 19.27 192.7
25 - 29 6 27 162 9.39 88.17 529.02
n= 33 ∑ = 581 1,537.81
Ing. Alejandrina Flores Reyes
∑ 𝒇𝒊 𝒙𝒊 𝟓𝟖𝟏
̅=
𝒙 = = 𝟏𝟕. 𝟔𝟏
𝒏 𝟑𝟑
∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅)𝟐 𝒇𝒊 𝟏, 𝟓𝟑𝟕. 𝟖𝟏
𝒔=√ = √ = 𝟔. 𝟗𝟑
𝒏−𝟏 𝟑𝟑 − 𝟏
Interpretación: Los pesos de los niños se desvían con respecto a su media en 6.93
libras.
𝒔𝟐 = (𝟔. 𝟗𝟑)𝟐 = 𝟒𝟖. 𝟎𝟐
Interpretación: El cuadrado de la desviación respecto de su media es 48.02 libras.
𝑠 6.93
𝑐𝑣 = 𝑥 100 % = 𝑥100% = 39.35%
𝑥̅ 17.61
Interpretación: el coeficiente de variación indica que los pesos de los niños se
dispersan con respecto a su media en un 39.35%.
EJEMPLO
Una máquina diseñada para producir dosis de cierto medicamento tiene una dosis
media de 100cc con una desviación estándar de 5. 22cc. Otra produce 180cc como
promedio con una desviación estándar de 8.6cc. ¿Cuál de las dos máquinas tiene
la mejor exactitud desde el punto de vista de la dispersión?
Datos
máquina #1 máquina #2
Media o promedio 100cc 180cc
Desviación estándar 5.22cc 8.5cc
𝑠 5.22 𝑠 8.5
𝑐𝑣1 = 𝑥̅ 𝑥 100 % = 𝑥100% = 5.22% 𝑐𝑣2 = 𝑥̅ 𝑥 100 % = 180 𝑥100% = 4.72%
100
Respuesta: La máquina menos exacta es aquella que tiene mayor coeficiente de
variación. En este caso es la máquina #1.
Ing. Alejandrina Flores Reyes