Documentos de Académico
Documentos de Profesional
Documentos de Cultura
o Teniendo en cuenta el papel que desempeña las medidas de Posición como puntos de referencia alrededor del
cual se distribuyen los valores Xi , puede observarse valores de Xi mayores, menores o iguales a la medida de
posición elegida ( por ejemplo la media, mediana, moda etc.) .
o Así se observa la distancia de los valores Xi respecto al punto de referencia elegido.
o Esta distancia se denomina también diferencia o dispersión de los valores Xi y se analiza a través de los
Indicadores de Dispersión.
o Nos van a dar una idea sobre la representatividad de las medidas centrales, a mayor dispersión menor
representatividad
o Conclusión: Las medidas de dispersión son valores que permiten analizar el grado de VARIABILIDAD ó dispersión
de los valores observados, respecto al valor de posición central
1
o Notación: Varianza: S2 = V(X)= Var(X)
Desviación Estándar: S = DE.
➢ RANGO O RECORRIDO:
o Es una medida absoluta de dispersión.
o Se utiliza sólo para un tamaño de muestra muy pequeño (menos de 10).
o Mide la dispersión de los datos considerando el valor más grande de la variable con el valor
más pequeño.
o Se expresa en la misma unidad de medida que la variable del problema (cms, grs, horas,
soles, etc.)
o Notación: R.
Así: En la descripción de un conjunto de datos, para que el análisis sea más completo, además de calcular la
medida de posición que lo represente, debe tenerse una idea del grado de concentración o de dispersión
de las observaciones alrededor de dicho valor representativo.
2
OBTENCIÓN E INTERPRETACIÓN DE ALGUNAS MEDIDAS DE DISPERSIÓN IMPORTANTES
PROBLEMA 1: MEDIDAS DE DISPERSIÓN EN DATOS SIN TABULAR
(DATOS ORIGINALES)
X: Tiempo de servicio de 12 empleados de una empresa (años)
Xi : 4 3 5 6 7 4 8 2 2 3 2 2
1) VARIANZA
∑ (𝑋𝑖 −𝑋̅)2
S2 = 𝑛−1
∑ 𝑿𝒊
̅=
Donde 𝑿 𝒏
media = 𝑋̅ = 4
∑ (𝑋𝑖 −4)2
S2 =
12−1
(4−4)2 + (3−4)2 + (5−4)2 + (6−4)2 + (7−4)2 + (4−4)2 + (8−4)2+ (2−4)2+ (2−4)2 + (3−4)2 + (2−4)2+ (2−4)2
S2 = =
12−1
48
S2 = = 4.3636 años2
11
En la práctica, esta fórmula es expresada en otra forma, de tal manera que facilite los cálculos para obtener el valor de
la varianza.
Así se tiene la siguiente expresión
𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2
S2 =
𝑛(𝑛−1)
3
Xi Xi2
4 16
3 9
5 25 12(240 )− ( 48 )2
6 36 S2 =
12(12−1)
7 49
4 16
8 64
2880− 2304 576
2 4 S2 = =
12(12−1) 132
2 4
3 9 576
S2 =
2 4 132
2 4
12 12
Xi = 48 años S2 = 4.3636 años2
Xi2 = 240 años2
𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2
S2 =
𝑛(𝑛−1)
Interpretación de la varianza:
El tiempo de servicio observado de los 12 empleados se dispersa respecto al tiempo de servicio promedio en 4.3636
años2 aproximadamente.
2) DESVIACIÓN ESTÁNDAR:
Fórmula para obtener el valor de la Desviación Estándar:
S = DE = √𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂
DE = 2.09 años
Interpretación:
El tiempo de servicio observado de los 12 empleados se dispersa respecto al tiempo de servicio promedio en
aproximadamente 2.09 años.
Ejemplo: X es Edad en años
Promedio 16 años con DE=0 años 16 16 16 16 16 16
CV% = 0/16*100 = 0%
Promedio 16años con DE=1.41años 16 15 14 16 17 18
CV% = 1.41/16*100 = 8.8%
Promedio 15.8 aprox 16 con DE=2.14 16 13 14 16 17 19
CV% = 2.14/15.8*100 = 14.3%
4
Dado que en este ejemplo el C.V.% = 52,25% es mayor del 33 %, el conjunto de datos observado es
heterogéneo y el promedio en este caso no es muy representativo.
RANGO O RECORRIDO.
- Fórmula para obtención del Rango:
Xi ni
Tiempo de Servicio(años) Nº de empleados
2 10
4 25
8 12
10 1
11 2
Número de valores diferentes k=5 n = 50
̅ = ∑ 𝑿𝒊 𝒏𝒊
𝑿 𝒏
Interpretación: El tiempo de servicio promedio de los 50 empleados es 4.96 años
2) VARIANZA:
Por definición, la varianza se expresa de la siguiente manera:
∑ (𝑋𝑖 −𝑋̅)2 𝑛𝑖
S2 = 𝑛−1
319.92
S2 = = 6.529 años2
50−1
5
50 ∑ 𝑋𝑖 2 𝑛𝑖 − ( ∑ 𝑋𝑖 𝑛𝑖 )2
S2 = 50(50−1)
50(1550)− (248)2
S2 = 50(50−1)
S2 = 6.529 años2
3) DESVIACIÓN ESTÁNDAR:
S = DE = √𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂
DE = 2.09 años
Interpretación:
El tiempo de servicio observado de los 50 empleados se dispersa respecto al tiempo de servicio promedio en
aproximadamente 2.56 años.
4) COEFICIENTE DE VARIABILIDAD:
𝑺
CV.% = 𝑿̅ *100
𝟐.𝟓𝟔
para el problema planteado: cv.% = 𝟒.𝟗𝟔 *100 cv.% = 51.52%
5) RANGO O RECORRIDO:
R = Xmax - Xmin
R = 11 años - 2 años R = 9 años
Interpretación: La diferencia entre el tiempo de servicio del empleado más antiguo y el de menor
antigüedad es de 9 años.
̅ = ∑ 𝑿𝒊 𝒏𝒊 =
𝑿
𝟒𝟐𝟒
= 8.48 años
𝒏 𝟓𝟎
6
Interpretar: El tiempo de servicio promedio de los 50 empleados es 8.48 años
∑ (𝑋𝑖 −𝑋̅)2 𝑛𝑖
S2 = 𝑛−1
982.98
S2 = S2 = 20.0608 años2
50−1
S2 = 20.0608
Interpretar: El tiempo de servicio de los 50 empleados se dispersa respecto al tiempo de servicio promedio en 20.0608
años2.
S = DE = √𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂
Interpretar: El tiempo de servicio observado de los 50 empleados se dispersa respecto al tiempo de servicio promedio
en aproximadamente 4.48 años
7
5) COEFICIENTE DE VARIABILIDAD:
𝑺
CV.% = 𝑿̅ *100
𝟒.𝟒𝟖
CV.% = 𝟖.𝟒𝟖 *100 CV.% = 52.53%
Interpretar: El tiempo de servicio observado de los 50 empleados se dispersa respecto al tiempo de servicio
promedio en aproximadamente el 52.83%
Interpretar:
La diferencia entre el tiempo de servicio del empleado más antiguo y el de menor antigüedad es de 18
años.
fi fi fi
20 20 20
10 10 10
0 0 0
20 X X X
Existen varios indicadores que se pueden utilizar para analizar la asimetría de una distribución de
frecuencias, los más prácticos y sencillos son:
̅ −𝑴𝒅
𝑿
a) CAs = Se utiliza cuando la distribución de frecuencias tiene un solo valor
𝑺
modal.
̅ −𝑴𝒆 )
𝟑( 𝑿
CAs =
𝑺
8
CAs representa al coeficiente de asimetría de una distribución de frecuencias.
S: Desviación estándar.
Significa que :
- la distribución de los datos tiene una deformación o ramificación más extendida
hacia la izquierda,
- es decir hacia los valores más pequeños de la variable,
- lo cual indica que pocos valores se distribuyen alrededor de los valores pequeños
de la variable
- y por tanto hay predominio de los valores más grandes.
Significa que:
- la distribución de los datos tiene una deformación o ramificación más extendida
hacia la derecha,
- es decir hacia los valores más grandes de la variable,
- lo cual indica que pocos valores se distribuyen alrededor de los valores grandes
de la variable
- y por tanto hay predominio de los valores más pequeños.
Si Promedio = Mediana = Moda se tiene una distribución Simétrica, puesto que su coeficiente de
asimetría será igual a cero.
Si Moda < Mediana < Promedio se tiene una distribución Asimétrica hacia la derecha, puesto que
su coeficiente de asimetría será mayor que cero.
Si Promedio < Mediana < Moda se tiene una distribución Asimétrica hacia la izquierda, puesto que
su coeficiente de asimetría será menor que cero.
9
• Indican si los datos están muy dispersos o no, respecto al valor promedio.
Observar los gráficos
• La Kurtosis de una distribución de frecuencias se analiza comparando dicha distribución con la forma
de la Curva Normal
La curva Normal se caracteriza por ser término medio elevada y su coeficiente de apuntamiento
obtenido en base a percentiles es igual a 0.263.
Existen varios indicadores que permiten analizar el apuntamiento de una distribución de frecuencias,
el más sencillo y práctico es :
𝑷𝟕𝟓 −𝑷𝟐𝟓
CAp =
𝟐(𝑷𝟗𝟎 −𝑷𝟏𝟎
Si se utiliza percentiles, considerar como punto de comparación el CAp = 0.263, que es el
coeficiente de apuntamiento de la Distribución Normal
fi fi fi
20 20 20
10 10 10
0 0 0
10 X X X
10
Si una distribución de frecuencias no es ni muy elevada ni muy achatada, se denomina distribución
Mesocúrtica e indica que la dispersión de los datos no es muy pequeña ni muy grande
Análisis de Asimetría :
Ejemplo1: Se observa el Tiempo de servicio de los empleados de una empresa y en una muestra se tiene la
media, moda y desviación estándar cuyos valores son 8.48años, 6.24 años y 4.48años
respectivamente . Calcular y analizar la asimetría de la distribución de frecuencias
Puesto que en este problema se tiene una sola moda, entonces se puede utilizar la siguiente fórmula
̅ −𝑴𝒅
𝑿
CAs =
𝑺
Este valor es mayor que cero, por tanto la distribución de los 50 empleados
según su tiempo de servicio es asimétrica hacia la derecha.
Interpretación: Significa que pocos empleados se distribuyen alrededor de los valores más altos del
tiempo de servicio.
Ejemplo2: Se observa el Tiempo de servicio de los empleados de una empresa y en una muestra se tiene
el cuartil 3, el cuartil1, el percentil90 y el percentil10 cuyos valores son 11.5años, 5.34 años, 15.875 años y
2.15 años respectivamente. Calcular y analizar la curtosis de la distribución de frecuencias
𝑷𝟕𝟓 −𝑷𝟐𝟓
CAp =
𝟐(𝑷𝟗𝟎 −𝑷𝟏𝟎)
𝟏𝟏.𝟓𝒂ñ𝒐𝒔−𝟓.𝟑𝟒𝒂ñ𝒐𝒔
CAp = CAp = 0.2244
𝟐(𝟏𝟓.𝟖𝟕𝟓𝒂ñ𝒐𝒔−𝟐.𝟏𝟓𝒂ñ𝒐𝒔)
Ap = 0.2244 es menor que 0.263, luego, la distribución de los empleados según su tiempo de servicio
es menos elevada de lo Normal.
Interpretación: El tiempo de servicio de los empleados es heterogénea porque se observa una elevación
menor a la de la Normal.
CONCLUSIÓN:
CAs de la distribución Normal es CERO