0% encontró este documento útil (0 votos)
82 vistas8 páginas

Medidas de Dispersión en Estadística

Las medidas de dispersión indican qué tan dispersos están los datos alrededor de un valor central como el promedio. Algunas medidas comunes son el rango, la desviación media, la desviación estándar y la varianza, siendo esta última la más utilizada. Una medida de dispersión pequeña significa que los datos se concentran cerca del promedio, mientras que una grande indica que el promedio no es confiable.

Cargado por

Soren Varela
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
82 vistas8 páginas

Medidas de Dispersión en Estadística

Las medidas de dispersión indican qué tan dispersos están los datos alrededor de un valor central como el promedio. Algunas medidas comunes son el rango, la desviación media, la desviación estándar y la varianza, siendo esta última la más utilizada. Una medida de dispersión pequeña significa que los datos se concentran cerca del promedio, mientras que una grande indica que el promedio no es confiable.

Cargado por

Soren Varela
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Medidas de Dispersión

Las medidas de dispersión nos indican que tan dispersos están los datos entre sí;
ayudan a determinar aspectos de homogeneidad o heterogeneidad en un conjunto
de datos.

Variación o dispersión: es el grado en que los datos u observaciones de una


distribución tienden a concentrarse o extenderse alrededor de un valor central
(promedio).

Una medida de dispersión pequeña indica que los datos se acumulan con
proximidad alrededor de la media aritmética. Por consiguiente, la media se
considera representativa de los datos. Caso contrario una medida de dispersión
grande indica que la media no es confiable.

Una medida de dispersión sirve para evaluar la confiabilidad de dos o más medidas
de ubicación.

Las medidas de dispersión o variabilidad más conocidas son: el rango, la desviación


media, la desviación típica o estándar, la varianza y el coeficiente de variación.

La medida de variación más utilizada es la desviación típica o estándar.

La varianza y la desviación estándar proporcionan la distancia promedio de


cualquier observación del conjunto de datos con respecto a la media de la
distribución. Cada población tiene una varianza. La raíz cuadrada de la varianza es
la desviación.

Rango

La medida de dispersión más simple es el rango. Representa la diferencia entre los


valores máximo y mínimo de un conjunto de datos

Ing. Alejandrina Flores Reyes


Una desventaja del rango es que solo considera dos valores

Desviación Media
Mide la cantidad media respecto de la cual los valores de una población o muestra
varían.
Desviación media: es la media aritmética de los valores absolutos de las
desviaciones con respecto a la media aritmética.

En donde:
𝑥 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛.
𝑥̅ = 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠.
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
| | = 𝑣𝑎𝑙𝑜𝑟 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜

EJEMPLO

Cinco representantes de servicio al cliente de una tienda de electrodomésticos


trabajaron el fin de semana Las cantidades de electrodomésticos que vendieron
son las siguientes:

5 8 10 4 3

Calcular la desviación media.

Solución:

Lo primero que debemos hacer es calcular la media:

∑𝑥 5 + 8 + 10 + 4 + 3
𝑥̅ = = =6
𝑛 5

Ing. Alejandrina Flores Reyes


𝑥 − 𝑥̅ |𝑥 − 𝑥̅ |
X ∑|𝑥 − 𝑥̅ | 12
5 5 – 6 = -1 |−1|=1 𝐷𝑀 = = = 2.4
𝑛 5
8 8–6=2 |2|=2
10 10 – 6 = 4 |4|=4 Interpretación: el promedio de las
4 4–6=-2 |−2|=2 desviaciones de los datos de la venta del
3 3–6=-3 |−3|=3 fin de semana con respecto a la media fue
∑(𝑥 − 𝑥̅ ) = 0 ∑|𝑥 − 𝑥̅ | = 12 de 2.4

Desviación estándar o Desviación típica

Esta medida de dispersión al igual que la desviación media- indica el promedio de


las desviaciones de los datos con respecto a su media. El símbolo S se utiliza para
denotar la desviación estándar de la muestra y el símbolo 𝝈 para la Desviación
Estándar de la población.
En la desviación media se trabaja con el valor absoluto de las desviaciones, la
varianza y la desviación estándar (o desviación típica) lo hacen con el cuadrado de
las desviaciones.

La desviación estándar se expresa en las mismas unidades de los datos.

La fórmula para calcular la Desviación Estándar de la muestra y la población para


datos no agrupados son las siguientes:

Donde:

𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛.


𝑥 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛.
𝑁 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛.
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛

Ing. Alejandrina Flores Reyes


Donde:

𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑡𝑟𝑎.


𝑥 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛.
𝑛 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

EJEMPLO

Con los datos del ejemplo anterior vamos a calcular la desviación estándar.

5 8 10 4 3

Solución:

Lo primero que debemos hacer es calcular la media:

∑𝑥 5 + 8 + 10 + 4 + 3
𝑥̅ = = =6
𝑛 5

𝑥 − 𝑥̅ (𝑥 − 𝑥̅ )2
X
5 5 – 6 = -1 (−1)2 = 1
∑(𝑥 − 𝑥̅ )2 34
8 8–6=2 (2)2 = 4 𝑠=√ =√ = 2.92
10 10 – 6 = 4 (4)2 = 16 𝑛−1 5−1
4 4–6=-2 (−2)2 = 4
3 3–6=-3 (−3)2 = 9 Interpretación: en promedio los datos de
∑(𝑥 − 𝑥̅ ) = 0 ∑(𝑥 − 𝑥̅ )2 = 34 las ventas se desvían respecto de su
media 2.92 unidades.

Ing. Alejandrina Flores Reyes


Calculo de la desviación estándar con datos agrupados

Para calcular la desviación estándar con datos agrupados para una muestra o para
una población, utilizaremos las siguientes formulas:

Desviación estándar de la muestra

∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅)𝟐 𝒇𝒊
𝒔=√
𝒏−𝟏

Donde:
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑥𝑖 = 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝑛 = 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Desviación estándar de la población

∑𝒏𝒊=𝟏(𝒙𝒊 − 𝝁
̅ )𝟐 𝒇𝒊
𝝈=√
𝑵
Donde:
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛
𝑥𝑖 = 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝑛 = 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛

Ing. Alejandrina Flores Reyes


Varianza

Es una medida de dispersión que se obtiene al elevar al cuadrado la desviación


estándar. Se denota por 𝒔𝟐 para la muestra y 𝝈𝟐 para la población.

La varianza se interpreta sencillamente como el cuadrado del promedio de las


desviaciones de los datos con respecto a su media.

La varianza no es negativa y es cero solo si todas las observaciones son las mismas.

Medidas de dispersión relativa

Estas son medidas de dispersión que se comparan con otra medida que puede ser
de tendencia central.

La desviación estándar es una medida de dispersión absoluta y expresa la variación


en las mismas unidades de los datos originales.

Una medida de dispersión relativa nos da una idea general de la magnitud de la


desviación estándar en relación con la magnitud de la media. La medida que vamos
estudiar es el coeficiente de variación denotado como CV se expresa en porcentaje
y se calcula de la siguiente manera:

𝜎 𝑠
𝑐𝑣 = 𝜇 𝑥 100% 𝑐𝑣 = 𝑥̅ 𝑥 100 %

Ing. Alejandrina Flores Reyes


Donde:
𝑐𝑣 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙

El coeficiente de variación es una medida relativa que resulta de utilidad al comparar


la cantidad de variación en grupos de datos que posean medias diferentes.

EJEMPLO

El peso en libras de 33 niños con edades de 1 año se refleja en la siguiente


distribución de frecuencias:

Peso f
5-9 5 Calcular: desviación estándar, varianza y coeficiente de variación.
10 - 14 8 interprete
15 - 19 4
20 - 24 10
25 - 29 6
n= 33

Solución:

El primer paso es calcular la media para datos agrupados


El segundo paso, para calcular la varianza necesitamos la columna de la diferencia
de la marca de clase y la media, la columna del cuadrado de esa diferencia y la de
la frecuencia multiplicada por dicha diferencia al cuadrado.

Peso 𝑓𝑖 𝑥𝑖 𝑥𝑖 − 𝑥̅ (𝑥𝑖 − 𝑥̅ )2 (𝑥𝑖 − 𝑥̅ )2 𝑓𝑖


𝑓𝑖 𝑥𝑖
5-9 5 7 35 -10.61 112.57 562.85
10 - 14 8 12 96 -5.61 31.47 251.76
15 - 19 4 17 68 -0.61 0.37 1.48
20 - 24 10 22 220 4.39 19.27 192.7
25 - 29 6 27 162 9.39 88.17 529.02
n= 33 ∑ = 581 1,537.81

Ing. Alejandrina Flores Reyes


∑ 𝒇𝒊 𝒙𝒊 𝟓𝟖𝟏
̅=
𝒙 = = 𝟏𝟕. 𝟔𝟏
𝒏 𝟑𝟑

∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
̅)𝟐 𝒇𝒊 𝟏, 𝟓𝟑𝟕. 𝟖𝟏
𝒔=√ = √ = 𝟔. 𝟗𝟑
𝒏−𝟏 𝟑𝟑 − 𝟏
Interpretación: Los pesos de los niños se desvían con respecto a su media en 6.93
libras.

𝒔𝟐 = (𝟔. 𝟗𝟑)𝟐 = 𝟒𝟖. 𝟎𝟐


Interpretación: El cuadrado de la desviación respecto de su media es 48.02 libras.

𝑠 6.93
𝑐𝑣 = 𝑥 100 % = 𝑥100% = 39.35%
𝑥̅ 17.61

Interpretación: el coeficiente de variación indica que los pesos de los niños se


dispersan con respecto a su media en un 39.35%.

EJEMPLO

Una máquina diseñada para producir dosis de cierto medicamento tiene una dosis
media de 100cc con una desviación estándar de 5. 22cc. Otra produce 180cc como
promedio con una desviación estándar de 8.6cc. ¿Cuál de las dos máquinas tiene
la mejor exactitud desde el punto de vista de la dispersión?

Datos

máquina #1 máquina #2
Media o promedio 100cc 180cc

Desviación estándar 5.22cc 8.5cc

𝑠 5.22 𝑠 8.5
𝑐𝑣1 = 𝑥̅ 𝑥 100 % = 𝑥100% = 5.22% 𝑐𝑣2 = 𝑥̅ 𝑥 100 % = 180 𝑥100% = 4.72%
100

Respuesta: La máquina menos exacta es aquella que tiene mayor coeficiente de


variación. En este caso es la máquina #1.

Ing. Alejandrina Flores Reyes

También podría gustarte