Está en la página 1de 11

MEDIDAS DE DISPERSIÓN

MEDIDAS DE DISPERSIÓN O DE VARIABILIDAD:

o Teniendo en cuenta el papel que desempeña las medidas de Posición como puntos de referencia alrededor del
cual se distribuyen los valores Xi , puede observarse valores de Xi mayores, menores o iguales a la medida de
posición elegida ( por ejemplo la media, mediana, moda etc.) .
o Así se observa la distancia de los valores Xi respecto al punto de referencia elegido.
o Esta distancia se denomina también diferencia o dispersión de los valores Xi y se analiza a través de los
Indicadores de Dispersión.
o Nos van a dar una idea sobre la representatividad de las medidas centrales, a mayor dispersión menor
representatividad

o Conclusión: Las medidas de dispersión son valores que permiten analizar el grado de VARIABILIDAD ó dispersión
de los valores observados, respecto al valor de posición central

Gráficamente se observa mayor dispersión en el histograma de la izquierda

PRINCIPALES MEDIDAS DE DISPERSIÓN:

➢ VARIANZA Y DESVIACIÓN ESTÁNDAR.


o Son medidas absolutas de Dispersión.
o Se utilizan para analizar el grado de dispersión o variabilidad de los datos observados respecto
al valor representativo que es el promedio.
o Tienen la misma unidad de medida que la variable del problema.
Así:
Sí la variable se mide en cms, grs, hrs, soles, etc.
2 2 2
La varianza se mide en cms , grs , hrs , soles2 respectivamente.
La Desviación Estándar se mide en: cms, grs, horas, soles, respectivamente.

1
o Notación: Varianza: S2 = V(X)= Var(X)
Desviación Estándar: S = DE.

➢ RANGO O RECORRIDO:
o Es una medida absoluta de dispersión.
o Se utiliza sólo para un tamaño de muestra muy pequeño (menos de 10).
o Mide la dispersión de los datos considerando el valor más grande de la variable con el valor
más pequeño.
o Se expresa en la misma unidad de medida que la variable del problema (cms, grs, horas,
soles, etc.)
o Notación: R.

➢ COEFICIENTE DE VARIACIÓN O DE VARIABILIDAD:CV%

o Es una medida relativa de dispersión.


o En este caso el valor de la desviación estándar se compara respecto al valor del promedio.
o Se expresa en porcentaje.
o No depende de la unidad de medida de la variable, razón por la cual se utiliza:
a) Para hacer comparaciones de la variabilidad entre variables con diferente unidad
de medida. Ejemplo: Peso con talla, tiempo de servicio con ingreso, etc.
b) Para hacer comparaciones de la variabilidad entre variables con igual unidad de
medida, pero de diferente magnitud.
Ejemplo: peso de la madre con el peso de su hijo recién nacido, cantidad de dinero
que tienen los padres con la cantidad de propina de los hijos menores de edad.
o El coeficiente de variabilidad también se utiliza para analizar si el conjunto de datos es
homogéneo o no respecto al valor promedio, y por tanto permite analizar si el promedio es
representativo o no para dicho conjunto de datos.
o Así: En muchos casos, cuando el coeficiente de Variabilidad es menor del 33 %, se acepta al
promedio como medida representativa del conjunto observado de datos, puesto que los datos
son relativamente homogéneos, en caso contrario, el conjunto de datos es heterogéneo y por
tanto el valor promedio no se considera representativo para dicho conjunto de datos.
o Notación: CV %

Así: En la descripción de un conjunto de datos, para que el análisis sea más completo, además de calcular la
medida de posición que lo represente, debe tenerse una idea del grado de concentración o de dispersión
de las observaciones alrededor de dicho valor representativo.

2
OBTENCIÓN E INTERPRETACIÓN DE ALGUNAS MEDIDAS DE DISPERSIÓN IMPORTANTES
PROBLEMA 1: MEDIDAS DE DISPERSIÓN EN DATOS SIN TABULAR
(DATOS ORIGINALES)
X: Tiempo de servicio de 12 empleados de una empresa (años)

Xi : 4 3 5 6 7 4 8 2 2 3 2 2

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12

1) VARIANZA

Por definición, la varianza se expresa así:

∑ (𝑋𝑖 −𝑋̅)2
S2 = 𝑛−1
∑ 𝑿𝒊
̅=
Donde 𝑿 𝒏

media = 𝑋̅ = 4

Xi (Xi - X)2 = (Xi - 4)2


4 (4 - 4)2
3 (3 - 4)2
5 (5 - 4)2
6 (6 - 4)2
7 (7 - 4)2
4 (4 - 4)2
8 (8 - 4)2
2 (2 - 4)2
2 (2 - 4)2
3 (3 - 4)2
2 (2 - 4)2
2 (2 - 4)2
12 12
 Xi = 48 años (Xi - X)2 =(Xi - 4)2 = 48

∑ (𝑋𝑖 −4)2
S2 =
12−1

(4−4)2 + (3−4)2 + (5−4)2 + (6−4)2 + (7−4)2 + (4−4)2 + (8−4)2+ (2−4)2+ (2−4)2 + (3−4)2 + (2−4)2+ (2−4)2
S2 = =
12−1

48
S2 = = 4.3636 años2
11

En la práctica, esta fórmula es expresada en otra forma, de tal manera que facilite los cálculos para obtener el valor de
la varianza.
Así se tiene la siguiente expresión
𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2
S2 =
𝑛(𝑛−1)

En el problema planteado, el valor de la Varianza se calcula de la siguiente manera: n = 12


12 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2
S2 =
12(12−1)

3
Xi Xi2
4 16
3 9
5 25 12(240 )− ( 48 )2
6 36 S2 =
12(12−1)
7 49
4 16
8 64
2880− 2304 576
2 4 S2 = =
12(12−1) 132
2 4
3 9 576
S2 =
2 4 132
2 4
12 12
 Xi = 48 años S2 = 4.3636 años2
 Xi2 = 240 años2

𝑛 ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 )2
S2 =
𝑛(𝑛−1)

Interpretación de la varianza:
El tiempo de servicio observado de los 12 empleados se dispersa respecto al tiempo de servicio promedio en 4.3636
años2 aproximadamente.

2) DESVIACIÓN ESTÁNDAR:
Fórmula para obtener el valor de la Desviación Estándar:
S = DE = √𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂

DE = √𝟒. 𝟑𝟔𝟑𝟔 𝑎ñ𝑜𝑠 2

DE = 2.09 años
Interpretación:
El tiempo de servicio observado de los 12 empleados se dispersa respecto al tiempo de servicio promedio en
aproximadamente 2.09 años.
Ejemplo: X es Edad en años
Promedio 16 años con DE=0 años 16 16 16 16 16 16
CV% = 0/16*100 = 0%
Promedio 16años con DE=1.41años 16 15 14 16 17 18
CV% = 1.41/16*100 = 8.8%
Promedio 15.8 aprox 16 con DE=2.14 16 13 14 16 17 19
CV% = 2.14/15.8*100 = 14.3%

COEFICIENTE DE VARIACIÓN O DE VARIABILIDAD:


-Fórmula para la obtención del Coeficiente de Variación:
𝑺
CV.% = 𝑿̅ *100
𝟐.𝟎𝟗
Para el problema planteado: CV.% = *100 CV.% = 0,5225 X 100 entonces
𝟒
CV.% = 52.25%
Interpretación:
El tiempo de servicio observado de los 12 empleados se dispersa respecto al tiempo de servicio promedio
en aproximadamente el 52.25%.

4
Dado que en este ejemplo el C.V.% = 52,25% es mayor del 33 %, el conjunto de datos observado es
heterogéneo y el promedio en este caso no es muy representativo.
RANGO O RECORRIDO.
- Fórmula para obtención del Rango:

R = Xmáx - Xmín donde: Xmáx = Valor más grande de X


Xmín = Valor más pequeño de X
Para el problema planteado:
R = 8 años - 2 años = 6 años
Interpretación:
La diferencia entre el empleado de mayor antigüedad y el de menor antigüedad en la empresa es de 6 años.

PROBLEMA 2: MEDIDAS DE DISPERSIÓN EN DATOS TABULADOS SIN INTERVALOS

Xi ni
Tiempo de Servicio(años) Nº de empleados
2 10
4 25
8 12
10 1
11 2
Número de valores diferentes k=5 n = 50

̅ = ∑ 𝑿𝒊 𝒏𝒊
𝑿 𝒏
Interpretación: El tiempo de servicio promedio de los 50 empleados es 4.96 años

2) VARIANZA:
Por definición, la varianza se expresa de la siguiente manera:

∑ (𝑋𝑖 −𝑋̅)2 𝑛𝑖
S2 = 𝑛−1

Xi ni Xini (𝑋𝑖 − 𝑋̅ )2 𝑛𝑖 = (𝑋𝑖 − 4.96)2 𝑛𝑖


Tiempo de Servicio(años) Nºde empleados
2 10 20 (2 - 4.96)2 (10)
= 87.616
4 25 100 (4 - 4.96)2 25
= 23.040
8 12 96 (8 - 4.96)212
= 110.899
10 1 10 (10 - 4.96)2 1
= 25.402
11 2 22 (11 - 4.96)2 2
= 72.963
Número de valores diferentes k = 5 n =50 Xini=248 años ∑ (𝑋𝑖 − 𝑋̅)2 𝑛𝑖 = ∑ (𝑋𝑖 − 4.96)2 𝑛𝑖 = 319.92 años2

319.92
S2 = = 6.529 años2
50−1

Otra expresión de la Fórmula para calcular el valor de la varianza:


En la práctica, la fórmula anterior es expresada en otra forma, de tal manera que facilite los cálculos para obtener
el valor de la varianza.
𝑛 ∑ 𝑋𝑖 2𝑛𝑖 − ( ∑ 𝑋𝑖 𝑛𝑖 )2
S2 = 𝑛(𝑛−1)
Xi ni Xini Xi2 ni
Tiempo de Servicio(años) Nºde empleados
2 10 20 40
4 25 100 400
8 12 96 768
10 1 10 100
11 2 22 242
Número de valores diferentes k = 5 n =50 Xini=248 años Xi ni=1550 años2
2

5
50 ∑ 𝑋𝑖 2 𝑛𝑖 − ( ∑ 𝑋𝑖 𝑛𝑖 )2
S2 = 50(50−1)

50(1550)− (248)2
S2 = 50(50−1)

77500− (248)2 15996


S2 = = = 6.529 años2
50(50−1) 2450

S2 = 6.529 años2

Interpretación: El tiempo de servicio de los 50 empleados se dispersa respecto al tiempo de servicio


promedio en 6.529 años2.

3) DESVIACIÓN ESTÁNDAR:

S = DE = √𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂

DE = √𝟔. 𝟓𝟐𝟗 𝑎ñ𝑜𝑠 2

DE = 2.09 años

Interpretación:
El tiempo de servicio observado de los 50 empleados se dispersa respecto al tiempo de servicio promedio en
aproximadamente 2.56 años.

4) COEFICIENTE DE VARIABILIDAD:
𝑺
CV.% = 𝑿̅ *100

𝟐.𝟓𝟔
para el problema planteado: cv.% = 𝟒.𝟗𝟔 *100 cv.% = 51.52%

interpretación: El tiempo de servicio observado de los 50 empleados se dispersa respecto al


tiempo de servicio promedio en aproximadamente el 51.52%

5) RANGO O RECORRIDO:
R = Xmax - Xmin
R = 11 años - 2 años R = 9 años

Interpretación: La diferencia entre el tiempo de servicio del empleado más antiguo y el de menor
antigüedad es de 9 años.

PROBLEMA 3: MEDIDAS DE DISPERSIÓN EN DATOS TABULADOS USANDO


INTERVALOS
Tiempo de servicio N°de Empleados ni
2-5 10
5-8 22
8-11 5
11-14 3
14-17 8
17-20 2
Número de Intervalos k= 6 n = 50

̅ = ∑ 𝑿𝒊 𝒏𝒊 =
𝑿
𝟒𝟐𝟒
= 8.48 años
𝒏 𝟓𝟎
6
Interpretar: El tiempo de servicio promedio de los 50 empleados es 8.48 años

2) VARIANZA : Por definición, la varianza se expresa de la siguiente manera:

∑ (𝑋𝑖 −𝑋̅)2 𝑛𝑖
S2 = 𝑛−1

Xi ni Punto Medio Xi (𝑋𝑖 − 𝑋̅)2 𝑛𝑖 = (Xi – 8.48)2 ni


Tiempo de Servicio(años) Nºde empleados
2-5 10 3.5 (3.5 – 8.48)2 10 = 248.004
5-8 22 6.5 (6.5 – 8.48)2 22 = 86.249
8-11 5 9.5 (9.5– 8.48)2 5 = 5.202
11-14 3 12.5 (12.5 – 8.48)2 3 = 48.481
14-17 8 15.5 (15.5 – 8.48)2 8 = 394.243
17-20 2 18.5 (18.5 – 8.48)2 2 = 200.801
Número de intervalos k = 6 n =50 ∑ (𝑋𝑖 − 𝑋̅)2 𝑛𝑖 = ∑ (𝑋𝑖 − 8.48)2 𝑛𝑖 = 982.980 años2

982.98
S2 = S2 = 20.0608 años2
50−1

Otra expresión de la Fórmula para calcular el valor de la varianza:


En la práctica, la fórmula anterior es expresada en otra forma, de tal manera que facilite los cálculos para obtener
el valor de la varianza.
𝑛 ∑ 𝑋𝑖 2𝑛𝑖 − ( ∑ 𝑋𝑖 𝑛𝑖 )2
S2 =
𝑛(𝑛−1)

Tiempo de servicio N°de Empleados ni Punto Medio Xi Xini Xi2ni


2-5 10 3.5 35.0 122.5
5-8 22 6.5 143.0 929.5
8-11 5 9.5 47.5 451.25
11-14 3 12.5 37.5 468.75
14-17 8 15.5 124.0 1922.00
17-20 2 18.5 37.0 684.5
Número de Intervalos k= 6 n = 50 Xini= 424.0 años Xi2ni=4578.5 años2

50(4578.5 )−(424)2 49249


S2 = =
50(50−1) 2450

S2 = 20.0608
Interpretar: El tiempo de servicio de los 50 empleados se dispersa respecto al tiempo de servicio promedio en 20.0608
años2.

3) DESVIACIÓN ESTÁNDAR: Fórmula para calcular su valor

S = DE = √𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂

S = DE = √𝟐𝟎. 𝟎𝟔𝟎𝟖 𝑎ñ𝑜𝑠 2


S = 4.48 años

Interpretar: El tiempo de servicio observado de los 50 empleados se dispersa respecto al tiempo de servicio promedio
en aproximadamente 4.48 años

7
5) COEFICIENTE DE VARIABILIDAD:

𝑺
CV.% = 𝑿̅ *100

𝟒.𝟒𝟖
CV.% = 𝟖.𝟒𝟖 *100 CV.% = 52.53%

Interpretar: El tiempo de servicio observado de los 50 empleados se dispersa respecto al tiempo de servicio
promedio en aproximadamente el 52.83%

4) RANGO O RECORRIDO : R = Xmax - Xmin

R = 20 años - 2 años = 18 años


R = 18 años aproximadamente

Interpretar:
La diferencia entre el tiempo de servicio del empleado más antiguo y el de menor antigüedad es de 18
años.

MEDIDAS DE DEFORMACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIA:

A) MEDIDAS DE DEFORMACION HORIZONTAL(ASIMETRÍA):

• Permiten analizar la asimetría de las distribuciones de frecuencias.


• Indican si la asimetría se da hacia la derecha o hacia la izquierda del recorrido de la variable.
• Observando los siguientes histogramas:

fi fi fi
20 20 20

10 10 10

0 0 0
20 X X X

a) Asimetría Positiva b) Simetría c) Asimetría Negativa


o hacia la derecha hacia la izquierda
CAs > 0 CAs = 0 CAs < 0
• COEFICIENTE DE ASIMETRÍA (CAs):

Existen varios indicadores que se pueden utilizar para analizar la asimetría de una distribución de
frecuencias, los más prácticos y sencillos son:

̅ −𝑴𝒅
𝑿
a) CAs = Se utiliza cuando la distribución de frecuencias tiene un solo valor
𝑺
modal.

b) Si la distribución de frecuencias tiene más de un valor modal se puede utilizar:

̅ −𝑴𝒆 )
𝟑( 𝑿
CAs =
𝑺

8
CAs representa al coeficiente de asimetría de una distribución de frecuencias.
S: Desviación estándar.

• ANÁLISIS DEL COEFICIENTE DE ASIMETRÍA (CAS):

Si CAs < 0 : La distribución de los datos presenta Asimetría hacia la Izquierda.

Significa que :
- la distribución de los datos tiene una deformación o ramificación más extendida
hacia la izquierda,
- es decir hacia los valores más pequeños de la variable,
- lo cual indica que pocos valores se distribuyen alrededor de los valores pequeños
de la variable
- y por tanto hay predominio de los valores más grandes.

Si CAs > 0 : La distribución de los datos presenta Asimetría hacia la Derecha.

Significa que:
- la distribución de los datos tiene una deformación o ramificación más extendida
hacia la derecha,
- es decir hacia los valores más grandes de la variable,
- lo cual indica que pocos valores se distribuyen alrededor de los valores grandes
de la variable
- y por tanto hay predominio de los valores más pequeños.

Si CAs = 0 : La distribución es simétrica.


- Los datos se distribuyen alrededor de su valor Central
- sin mostrar predominio hacia los valores más grandes, ni hacia los valores pequeños
de la variable.

• ANALISIS DE LA ASIMETRÍA DE UNA DISTRIBUCION COMPARANDO PROMEDIO, MEDIANA Y MODA

Si Promedio = Mediana = Moda se tiene una distribución Simétrica, puesto que su coeficiente de
asimetría será igual a cero.

Si Moda < Mediana < Promedio se tiene una distribución Asimétrica hacia la derecha, puesto que
su coeficiente de asimetría será mayor que cero.

Si Promedio < Mediana < Moda se tiene una distribución Asimétrica hacia la izquierda, puesto que
su coeficiente de asimetría será menor que cero.

B. MEDIDAS DE DEFORMACION VERTICAL (Apuntamiento o Kurtosis):

• Permiten analizar el grado de elevación de una distribución de frecuencias

9
• Indican si los datos están muy dispersos o no, respecto al valor promedio.
Observar los gráficos

• La Kurtosis de una distribución de frecuencias se analiza comparando dicha distribución con la forma
de la Curva Normal
La curva Normal se caracteriza por ser término medio elevada y su coeficiente de apuntamiento
obtenido en base a percentiles es igual a 0.263.

• COEFICIENTE DE APUNTAMIENTO O KURTOSIS (CAp):

Existen varios indicadores que permiten analizar el apuntamiento de una distribución de frecuencias,
el más sencillo y práctico es :

𝑷𝟕𝟓 −𝑷𝟐𝟓
CAp =
𝟐(𝑷𝟗𝟎 −𝑷𝟏𝟎
Si se utiliza percentiles, considerar como punto de comparación el CAp = 0.263, que es el
coeficiente de apuntamiento de la Distribución Normal

✓ Si CAp = 0.263, la distribución es término medio elevada (elevación normal)

✓ Si CAp < 0.263, la distribución es más baja de lo normal.

✓ Si CAp > 0.263, la distribución es más alta de lo normal.


• Observar los siguientes histogramas:

fi fi fi
20 20 20

10 10 10

0 0 0
10 X X X

CAp < 0.263 CAp = 0.263 CAp > 0.263

Distribución más Distribución con Distribución más


Baja de lo Normal elevación Normal elevada de lo Normal

• Análisis de la Kurtosis de una Distribución de Frecuencias:

- Si una distribución tiene un pico o apuntamiento relativamente elevado, la distribución es más


elevada de lo normal (se denomina distribución Leptocúrtica) e indica que la dispersión de los
datos es muy pequeña, describiendo que los Datos son Homogéneos.

- Si la distribución de frecuencias es relativamente achatada, la distribución es más baja de lo normal


(se denomina distribución Platicúrtica) e indica que la dispersión de los datos es muy grande,
describiendo que los Datos son Heterogéneos.

10
Si una distribución de frecuencias no es ni muy elevada ni muy achatada, se denomina distribución
Mesocúrtica e indica que la dispersión de los datos no es muy pequeña ni muy grande

Análisis de Asimetría :

Ejemplo1: Se observa el Tiempo de servicio de los empleados de una empresa y en una muestra se tiene la
media, moda y desviación estándar cuyos valores son 8.48años, 6.24 años y 4.48años
respectivamente . Calcular y analizar la asimetría de la distribución de frecuencias

Puesto que en este problema se tiene una sola moda, entonces se puede utilizar la siguiente fórmula

̅ −𝑴𝒅
𝑿
CAs =
𝑺

𝟖.𝟒𝟖 𝒂ñ𝒐𝒔 −𝟔.𝟐𝟒 𝒂ñ𝒐𝒔


CAs = CAs = 0.5
𝟒.𝟒𝟖 𝒂ñ𝒐𝒔

Este valor es mayor que cero, por tanto la distribución de los 50 empleados
según su tiempo de servicio es asimétrica hacia la derecha.

Interpretación: Significa que pocos empleados se distribuyen alrededor de los valores más altos del
tiempo de servicio.

Análisis de Apuntamiento o curtosis:

Ejemplo2: Se observa el Tiempo de servicio de los empleados de una empresa y en una muestra se tiene
el cuartil 3, el cuartil1, el percentil90 y el percentil10 cuyos valores son 11.5años, 5.34 años, 15.875 años y
2.15 años respectivamente. Calcular y analizar la curtosis de la distribución de frecuencias

𝑷𝟕𝟓 −𝑷𝟐𝟓
CAp =
𝟐(𝑷𝟗𝟎 −𝑷𝟏𝟎)

𝟏𝟏.𝟓𝒂ñ𝒐𝒔−𝟓.𝟑𝟒𝒂ñ𝒐𝒔
CAp = CAp = 0.2244
𝟐(𝟏𝟓.𝟖𝟕𝟓𝒂ñ𝒐𝒔−𝟐.𝟏𝟓𝒂ñ𝒐𝒔)

Ap = 0.2244 es menor que 0.263, luego, la distribución de los empleados según su tiempo de servicio
es menos elevada de lo Normal.

Interpretación: El tiempo de servicio de los empleados es heterogénea porque se observa una elevación
menor a la de la Normal.

CONCLUSIÓN:
CAs de la distribución Normal es CERO

Si CAs = 0 la Distribución simétrica


Si CAs < 0 la Distribución asimétrica hacia la izquierda
Si CAs > 0 la Distribución asimétrica hacia la derecha

CAp de la distribución Normal cuando se considera percentiles es igual a 0.263

Si CAp = 0.263 la Distribución término medio elevada


Si CAp > 0.263 la Distribución más elevada de lo normal (significa que los datos son homogéneos
respecto al promedio)
Si CAp < 0.263 la Distribución menos elevada de lo normal (significa que los datos no son
homogéneos respecto al promedio
11

También podría gustarte