Está en la página 1de 13

Medidas de dispersión

Aspectos a considerar
• La segunda característica más importante que
describe un conjunto de datos, es su
dispersión; es decir, la medición de la cantidad
de variación o diseminación de los datos.
• De esta forma se puede determinar si los
valores están relativamente cercanos, lo que
permite juzgar la confiabilidad de la medida.
• Observaremos tres (3) medidas:
• Rango
• Varianza
• Desviación estándar
Rango (para datos individuales)
• En estadística, es la diferencia entre el valor máximo y el valor
mínimo en un grupo de números aleatorios. Se le suele simbolizar
con 𝑹.
• Consideremos los siguientes datos individuales:

185 165 170 182 155

Para determinar el rango sólo basta buscar el valor máximo y restarle el menor:

𝑅 = 𝑉𝑚𝑎𝑥 – 𝑉𝑚𝑖𝑛 = 185 – 155 = 𝟑𝟎


Rango (para datos agrupados)
• En el caso de datos agrupados, el rango es la diferencia entre el
Limite superior del último intervalo y el Limite inferior del primer
intervalo. Se expresa mediante la fórmula 𝑅 = 𝐿𝑚 − 𝐿𝑜

𝐿𝑜
𝑅 = 𝐿𝑚 − 𝐿𝑜 = 1230 − 930 = 𝟑𝟎𝟎

Vale mencionar que ambos rangos son válidos, pero si


se disponen de los datos individuales se considera válido
el rango de los datos individuales. Lo mismo debe
considerarse en las siguientes medidas de dispersión.
𝐿𝑚
Varianza (para datos individuales)
• La varianza es la medida de dispersión más utilizada, la cual nos dice
qué tan dispersos se encuentran los datos, en promedio de la media
aritmética. Se utiliza la letra griega sigma elevada al cuadrado para
representarla en la fórmula (aunque también se utiliza 𝑆 2 ):
𝟐
𝟐
σ 𝒙𝒊 − 𝝁 (para poblaciones)
𝝈 =
𝑵
𝟐
𝟐
σ 𝒙𝒊 − ഥ
𝒙 (para muestras grandes)
𝑺 =
𝒏
Recordemos que 𝜇 es la media de la población, 𝑥ҧ es la media de la muestra, 𝑁 es el tamaño de la población,
𝑛 es el tamaño de la muestra, y 𝑥𝑖 es el 𝑖 valor de los datos a procesar.
Varianza (para datos individuales)
Para la muestra de datos individuales siguientes determinar la varianza:
185 165 170 182 155

𝟐
𝟐
σ 𝒙𝒊 − ഥ
𝒙 𝟔𝟎𝟗. 𝟐
𝑺 = = = 𝟏𝟓𝟐. 𝟑
𝒏−𝟏 𝟒
Se aplica factor de corrección
de Bessel para muestras de 30
valores o menos.

Puesto que la varianza se basa en los datos de una muestra y no en toda la población,
es improbable que la varianza de la muestra sea igual a la varianza de la población. Para
estimar mejor la varianza de la población, utilice un intervalo de confianza.
Varianza (para datos agrupados)
• En estos casos se asume por lo regular que es una muestra grande,
por lo que la fórmula sería la siguiente:

σ 𝑓𝑖 𝑥𝑖 − 𝑥ҧ 2 Donde vale destacar que 𝑓𝑖 es la frecuencia del intervalo,


2 y 𝑥𝑖 es el punto medio del intervalo
𝑆 =
𝑛
Varianza (para datos agrupados)
• Consideremos resolver el problema del tema anterior de medidas de
tendencia central para determinar la varianza:
Varianza (para datos agrupados)

Puede que resulte confuso tener


un resultado tan alto, pero
recordemos que el resultado es la
𝑺𝟐
dispersión con respecto a media
al cuadrado.
Desviación estándar
(para datos individuales y grupales)
• En estadística, la desviación estándar (también conocida como
desviación típica y representada de forma abreviada por la letra
griega minúscula sigma 𝝈 o la letra latina 𝑠, así como por las siglas 𝑆𝐷
-de standard deviation- en algunos textos traducidos del inglés) es
una medida que se usa para cuantificar la variación o dispersión de un
conjunto de datos numéricos. Y como resulta obvio, la fórmula es:

𝜎= 𝜎2 Por lo tanto sólo basta determinar la raíz cuadrada


de la varianza para obtener la desviación estándar.

𝑠= 𝑆2
Desviación estándar (para datos individuales)
Para la muestra de datos individuales siguientes determinar la 𝑆𝐷:
185 165 170 182 155

𝒔= 𝑺𝟐 = 𝟏𝟓𝟐. 𝟑 = 𝟏𝟐. 𝟑𝟒𝟏

𝟐
σ 𝒙𝒊 − ഥ
𝒙 𝟔𝟎𝟗. 𝟐
𝑺𝟐
𝝈 = = = 𝟏𝟓𝟐. 𝟑
𝒏−𝟏 𝟒
Desviación estándar (para datos agrupados)

𝒔= 𝑺𝟐 = 𝟒𝟖𝟖𝟓. 𝟎𝟔 = 𝟔𝟗. 𝟖𝟗𝟑


𝑺𝟐
¡Gracias!

También podría gustarte