Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística I
Medidas de Dispersión
www.rodrivelp.blogspot.com
TABLA DE CONTENIDO
MEDIDAS
DE
DISPERSIÓN
1. Introducción
2. Rango o Recorrido
3. Desviación Media Absoluta
4. Desviación Estándar
5. Coeficiente de variación
3
ESTADÍSTICA MEDIDAS DE DISPERSIÓN
MEDIDAS DE DISPERSIÓN
1. INTRODUCCIÓN.
Son medidas que nos permiten hacer una descripción más completa de un conjunto de datos y analizar
que tanto están concentrados o dispersos respecto a su media.
Como podemos observar en el siguiente ejemplo comparativo de notas de tres estudiantes, aunque
tienen el mismo promedio, este valor no da una descripción completa de cada conjunto de datos.
Es por esto que se recurre a las medidas de dispersión, las más utilizadas son:
Rango o Recorrido
Desviación Media Absoluta
Varianza
Desviación Típica
Coeficiente de variación de Pearson.
2. RANGO O RECORRIDO
Mide la amplitud del conjunto de datos y es la diferencia entre el valor máximo y el valor mínimo del
conjunto de datos. Tiene el inconveniente que sólo tiene en cuenta los dos valores extremos y pasa
por alto el resto de observaciones.
R = Xmáx - XMÍN
Ejemplo:
Supóngase que los siguientes son los salarios por hora de los empleados de dos compañías A y B
SALARIOS SALARIOS
COMPAÑÍA A COMPAÑÍA B
2.000 6.000 7.500 7.500 9.000 10.000 5.500 6.000 6.500 7.500 8.000 8.500
∑ 𝑋𝑖 ∑ 𝑋𝑖
𝑋̅𝐴 = 𝑋̅𝐵 =
𝑁 𝑁
𝑋̅𝐴 = $ 7.000 𝑋̅𝐵 = $ 7.000
RA = Xmáx – Xmín RB = Xmáx – Xmín
RA = 10.000 – 2.000 RB = 8.500 – 5.500
R A = 8.000 R B = 3.000
𝑋̅𝐴 = 𝑋̅𝐵
7.000=7.000
RA > R B
8.000>3.000
Aunque observamos que los promedios son iguales, la medida del Rango o Recorrido indica que los salarios de la compañía A
están mucho más dispersos que los salarios de la compañía B.
El siguiente par de gráficos muestra el comportamiento de cada uno de los datos alrededor de la media, en los que se ve
claramente la distribución de los datos alrededor de ella y su mayor o menor dispersión. Como no es muy práctico generar un
dibujo para cada problema, El valor de la dispersión sirve como parámetro de comparación entre dos conjuntos de datos
4
ESTADÍSTICA MEDIDAS DE DISPERSIÓN
Compañía A
2000 2500 3000 3500 4000 4500 5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000
Compañía B
2000 2500 3000 3500 4000 4500 5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000
Es una medida estadística que muestra el grado de dispersión de los datos con respecto a la media;
El cálculo de la Desviación Media Absoluta para datos sin agrupar se calcula como el promedio del
valor absoluto de las diferencias entre los valores de cada variable Xi con la media aritmética.
∑|𝑋𝐼 − 𝑋|
𝐷. 𝑀. 𝐴. =
𝑁
Ejemplo:
Calcular la Desviación Media Absoluta de los salarios de las compañías A y B.
Xi 𝑋𝐼 − 𝑋 |𝑋𝐼 − 𝑋|
2.000 -5.000 5.000
6.000 -1.000 1.000
7.500 500 500
7.500 500 500
9.000 2.000 2.000
10.000 3.000 3.000
∑|𝑋𝐼− 𝑋| 12.000
𝐷. 𝑀. 𝐴. = = = 2.000
𝑁 6
5
ESTADÍSTICA MEDIDAS DE DISPERSIÓN
𝐷. 𝑀. 𝐴. = 1.000
Podemos concluir que comparando las Desviaciones Medias de las compañías A y B, 2.000 y 1000,
indican que los salarios de la compañía A está más dispersos que los salarios de la compañía B.
El cálculo de la Desviación Media Absoluta para datos agrupados se obtiene de manera similar al
proceso anterior, teniendo en cuenta la frecuencia y tomando el valor de X i como el punto medio
de cada intervalo, conocido como marca de clase.
∑ 𝑓𝑖. |𝑋𝑖 − 𝑋|
𝐷. 𝑀. 𝐴. =
𝑁
Ejemplo:
Obtener la D.M.A. del siguiente conjunto de datos agrupados de una muestra:
Intervalo Frecuencia
4 – 10 12
10 – 16 11
16 – 22 13
22 – 28 19
28 – 34 21
34 – 40 16
40 – 46 8
Solución:
Se construye una tabla en la que se agregan cada uno de los elementos requeridos en la fórmula
de cálculo.
∑ 𝑓𝑖. 𝑋𝑖 2536
𝑋 = = = 25,36
𝑁 100
Cuando nos presentan una serie de datos y están sin agrupar la Desviación Estándar 𝜎 para una
población se calcula mediante la siguiente fórmula.
2
∑ (𝑋𝐼 − 𝑋)
𝜎= √
𝑁
Si se trata de una muestra, la Desviación Estándar s se calcula de forma idéntica sólo que se divide
entre N-1
2
∑ (𝑋𝐼 − 𝑋)
𝑠= √
𝑁−1
En ambas fórmulas la parte interior de la raíz cuadrada es conocida como varianza de una población
y varianza de una muestra
Ejemplo:
Obtener la desviación estándar del siguiente conjunto de datos de una muestra de una población:
45, 45, 46, 47, 47, 47, 48, 48, 48, 49, 49, 49, 49, 49, 50, 50, 50, 50, 50, 51, 51, 52, 52, 52, 52, 53, 53, 50
Solución:
Para simplificar un poco los cálculos nos ayudamos ordenándolos en una tabla y disponemos las columnas necesarias para
hacer los cálculos que se piden en la fórmula; ojo que esto no indica que los datos están agrupados en intervalo de clases.
∑ 𝑓𝑖. 𝑋𝑖 1382
𝑋 = = = 49,357
𝑁 28
2
∑ 𝑓. (𝑋𝐼 − 𝑋) 134,4272
𝑠= √ =√ = 2,231
𝑁−1 28 − 1
7
ESTADÍSTICA MEDIDAS DE DISPERSIÓN
Ejemplo:
Obtener la desviación estándar del siguiente conjunto de datos agrupados de una muestra:
Intervalo f
4 – 10 12
10 – 16 11
16 – 22 13
22 – 28 19
28 – 34 21
34 – 40 16
40 - 46 8
100
Solución:
Agregamos las columnas necesarias para hacer los cálculos que se piden en la fórmula:
∑ 𝑓𝑖. 𝑋𝑖 2536
𝑋 = = = 25,36
𝑁 100
2
∑ 𝑓. (𝑋𝐼 − 𝑋) 11.580,8555
𝑠= √ =√ = 10,82
𝑁−1 100 − 1
1. El 68,27% de los casos están entre una desviación estándar por encima de la media y una
desviación estándar por debajo, es decir, que están entre: 𝑋 - s y 𝑋 + s.
2. El 95,45% de los casos están entre dos desviación estándar por encima de la media y dos
desviación estándar por debajo, es decir, que están entre: 𝑋 - 2s y 𝑋 + 2s.
3. El 99,73% de los casos están entre tres desviación estándar por encima de la media y tres
desviación estándar por debajo, es decir, que están entre: 𝑋 - 3s y 𝑋 + 3s.
8
ESTADÍSTICA MEDIDAS DE DISPERSIÓN