Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas de Dispersión-Asimetria
Medidas de Dispersión-Asimetria
MEDIDAS DE DISPERSIÓN
Plan de clase
• Competencias
• Motivación.
Inicio • Saberes previos.
• Retroalimentación.
• Autoevaluación
Cierre
Competencias
Al termino de la sesión, el
estudiante estará en capacidad
de:
Definir y calcular medidas de
dispersión.
Determinar la calidad del
estimador utilizando medidas de
dispersión apropiadas.
Interpretar un gráfico de caja.
Resolver problemas de
aplicación sobre los conceptos
desarrollados.
INTRODUCCIÓN
Ejemplo
Del ejemplo anterior, tenemos:
500 – 2050 = -1550
1500 – 2050 = -550
6250 – 2050 = 4200
Medidas de Dispersión
• Rango: Corresponde a la diferencia entre el dato mayor y el dato
menor.
datos desagrupados
Ejemplo 1.
Ante la pregunta sobre número de hijos por familia, una muestra de
12 hogares, marcó las siguientes respuestas:
2 1 2 4 1 3
2 3 2 0 5 1
Calcula el rango de la variable
Solución.
Rango 5 0 5
Ejemplo 2.
Hay dos conjuntos sobre la cantidad de lluvia (mm) en
Ancash y La Libertad en un año.
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Ancash 86 135 178 170 231 290 ## 305 244 122 66 71
La Libertad 40 77 83 89 147 168 ## 252 209 101 32 13
Calcula el rango en cada una de las ciudades.
Solución.
Aplicando la fórmula correspondiente tenemos:
8 cms.
6 cms
8 cms.
6 cms
8 cms.
6 cms
8 cms.
10 cms
6 cms
8 cms.
0,89 0,943
La raíz cuadrada de la varianza se llama desviación estándar
Análisis de la variabilidad
10 cms
6 cms
8 cms.
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8 = 7,44
9
7,44
Promedio
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224
=
9 9
7,44
Promedio
Solución.
(2 2.16)2 (1 2.16)2 (2 2.16)2 (4 2.16)2 (1 2.16)2 (3 2.16)2 (2 2.16)2 (3 2.16)2 (2 2.16)2 (0 2.16)2 (5 2.16)2 (1 2.16)2
s2
12 1
21.6672
s2 1.9697
11
Ejemplo
A continuación se muestran dos conjuntos de datos obtenidos a partir
de un experimento químico que realizaron dos estudiantes distintos.
Calcular la varianza.
Estudiante A x
8 12 7 9 3 10 12 11 12 14
9.8
10
Estudiante B 7 6 7 15 12 11 9 9 13 11
x 10
10
Ahora aplicamos la fórmula correspondiente
Solución (Continuación).
Estudiante A
2 (8 9.8)2 (12 9.8) 2 (7 9.8) 2 (9 9.8) 2 (3 9.8) 2 (10 9.8) 2 (12 9.8) 2 (11 9.8) 2 (12 9.8) 2 (14 9.8) 2
s
10 1
91.6
s2 9.16
10
Estudiante B
(7 10)2 (6 10) 2 (7 10) 2 (15 10) 2 (12 10) 2 (11 10) 2 (9 10) 2 (9 10) 2 (13 10) 2 (11 10) 2
2
s
10 1
76
s2 7.6
10
Ejemplo
2 1 2 4 1 3 2 3 2 0 5 1
Solución.
x 2.16
221.6672
s 1.9697
11
S 1.9697 1.4034
Ejemplo 2.
Considerando nuevamente el segundo ejemplo que estudiaste para
calcular la varianza, tenemos:
A continuación se muestran dos conjuntos de datos obtenidos a partir
de un experimento químico que realizaron dos estudiantes distintos.
Calcular la varianza.
Volumen de ácido medido (cm^3)
Estudiante A 8 12 7 9 3 10 12 11 12 14
Estudiante B 7 6 7 15 12 11 9 9 13 11
Solución.
Una vez que has calculado la media y la varianza, es necesario calcular
la desviación estándar a partir de la obtención de la raíz cuadrada de la
varianza.
Estudiante A 91.6
s2 9.16 S 9.16 3.026
10
Estudiante B
76
s2 7.6 S 7.6 2.756
10
Propiedades de la Varianza
• La varianza es siempre un número no negativo; es decir:
V(X)≥0.
• La varianza de una constante es igual a cero; es decir:
V(k)=0, k es una constante.
X±b s2 s
cX c2 s2 cs
cX±b c 2 s2 cs
Ejemplo 1.
Frecuenci
Número de viajeros
i a xi fi
(xi )
(fi)
1 12 3 36
2 13 3 39
3 14 6 84
4 15 3 45
5 16 5 80
Total 70 20 284
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (xi )2.
Número de Frecuencia
i xi f i xi2
viajeros (xi ) (fi)
1 12 3 36 144
2 13 3 39 169
3 14 6 84 196
4 15 3 45 225
5 16 5 80 256
Total 70 20 284 990
Solución (Continuación).
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
Solución (Continuación).
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
284 2
4070
s2 20 1.9579
19
s 1.9579 1.3992
Ejemplo 2. De acuerdo a la siguiente tabla, calcula la varianza y la desviación estándar:
NOTA FREC. ABSOLUTA FREC. ABSOLUTA FREC RELATIVA
FREC. RELATIVA %
x f ACUMULADA ACUMULADA %
1.2 1 1 0.1 0.1
1.4 2 3 0.2 0.3
1.6 3 6 0.3 0.6
1.8 8 14 0.8 1.4
2.0 14 28 1.4 2.8
2.2 18 46 1.8 4.6
2.4 19 65 1.9 6.5
2.6 22 87 2.2 8.7
2.8 25 112 2.5 11.2
3.0 26 138 2.6 13.8
3.2 27 165 2.7 16.5
3.4 31 196 3.1 19.6
3.6 35 231 3.5 23.1
3.8 38 269 3.8 26.9
4.0 45 314 4.5 31.4
4.2 46 360 4.6 36.0
4.4 48 408 4.8 40.8
4.6 52 460 5.2 46.0
4.8 58 518 5.8 51.8
5.0 60 578 6.0 57.8
5.2 56 634 5.6 63.4
5.4 54 688 5.4 68.8
5.6 51 739 5.1 73.9
5.8 50 789 5.0 78.9
6.0 46 835 4.6 83.5
6.2 44 879 4.4 87.9
6.4 40 919 4.0 91.9
6.6 32 951 3.2 95.1
6.8 31 982 3.1 98.2
7.0 18 1000 1.8 100
TOTAL 1000 4717 23970.12
Solución: El primer paso es calcular xi fi:
NOTA FREC. ABSOLUTA FREC. ABSOLUTA FREC. RELATIVA FREC RELATIVA
x f ACUMULADA % ACUMULADA % x i fi
1.2 1 1 0.1 0.1 1.2
1.4 2 3 0.2 0.3 2.8
1.6 3 6 0.3 0.6 4.8
1.8 8 14 0.8 1.4 14.4
2.0 14 28 1.4 2.8 28
2.2 18 46 1.8 4.6 39.6
2.4 19 65 1.9 6.5 45.6
2.6 22 87 2.2 8.7 57.2
2.8 25 112 2.5 11.2 70
3.0 26 138 2.6 13.8 78
3.2 27 165 2.7 16.5 86.4
3.4 31 196 3.1 19.6 105.4
3.6 35 231 3.5 23.1 126
3.8 38 269 3.8 26.9 144.4
4.0 45 314 4.5 31.4 180
4.2 46 360 4.6 36.0 193.2
4.4 48 408 4.8 40.8 211.2
4.6 52 460 5.2 46.0 239.2
4.8 58 518 5.8 51.8 278.4
5.0 60 578 6.0 57.8 300
5.2 56 634 5.6 63.4 291.2
5.4 54 688 5.4 68.8 291.6
5.6 51 739 5.1 73.9 285.6
5.8 50 789 5.0 78.9 290
6.0 46 835 4.6 83.5 276
6.2 44 879 4.4 87.9 272.8
6.4 40 919 4.0 91.9 256
6.6 32 951 3.2 95.1 211.2
6.8 31 982 3.1 98.2 210.8
7.0 18 1000 1.8 100 126
TOTAL 1000 4717 23970.12
Solución (Continuación).Después se obtiene el cuadrado de la variable x, o sea, (x i )2.
FREC. FREC. FREC
NOTA FREC.
ABSOLUTA ABSOLUTA RELATIVA
x RELATIVA %
f ACUMULADA ACUMULADA % x i fi xi 2
1.2 1 1 0.1 0.1 1.2 1.44
1.4 2 3 0.2 0.3 2.8 1.96
1.6 3 6 0.3 0.6 4.8 2.56
1.8 8 14 0.8 1.4 14.4 3.24
2.0 14 28 1.4 2.8 28 4
2.2 18 46 1.8 4.6 39.6 4.84
2.4 19 65 1.9 6.5 45.6 5.76
2.6 22 87 2.2 8.7 57.2 6.76
2.8 25 112 2.5 11.2 70 7.84
3.0 26 138 2.6 13.8 78 9
3.2 27 165 2.7 16.5 86.4 10.24
3.4 31 196 3.1 19.6 105.4 11.56
3.6 35 231 3.5 23.1 126 12.96
3.8 38 269 3.8 26.9 144.4 14.44
4.0 45 314 4.5 31.4 180 16
4.2 46 360 4.6 36.0 193.2 17.64
4.4 48 408 4.8 40.8 211.2 19.36
4.6 52 460 5.2 46.0 239.2 21.16
4.8 58 518 5.8 51.8 278.4 23.04
5.0 60 578 6.0 57.8 300 25
5.2 56 634 5.6 63.4 291.2 27.04
5.4 54 688 5.4 68.8 291.6 29.16
5.6 51 739 5.1 73.9 285.6 31.36
5.8 50 789 5.0 78.9 290 33.64
6.0 46 835 4.6 83.5 276 36
6.2 44 879 4.4 87.9 272.8 38.44
6.4 40 919 4.0 91.9 256 40.96
6.6 32 951 3.2 95.1 211.2 43.56
6.8 31 982 3.1 98.2 210.8 46.24
7.0 18 1000 1.8 100 126 49
Solución (Continuación).Ahora se multiplica el cuadrado de la variable por la frecuencia, es decir, (f ixi2).
FREC
FREC. FREC.
NOTA FREC. RELATIVA
ABSOLUTA ABSOLUTA
x RELATIVA % ACUMULADA
f ACUMULADA
% x i fi xi2 fixi2
1.2 1 1 0.1 0.1 1.2 1.44 1.44
1.4 2 3 0.2 0.3 2.8 1.96 3.92
1.6 3 6 0.3 0.6 4.8 2.56 7.68
1.8 8 14 0.8 1.4 14.4 3.24 25.92
2.0 14 28 1.4 2.8 28 4 56
2.2 18 46 1.8 4.6 39.6 4.84 87.12
2.4 19 65 1.9 6.5 45.6 5.76 109.44
2.6 22 87 2.2 8.7 57.2 6.76 148.72
2.8 25 112 2.5 11.2 70 7.84 196
3.0 26 138 2.6 13.8 78 9 234
3.2 27 165 2.7 16.5 86.4 10.24 276.48
3.4 31 196 3.1 19.6 105.4 11.56 358.36
3.6 35 231 3.5 23.1 126 12.96 453.6
3.8 38 269 3.8 26.9 144.4 14.44 548.72
4.0 45 314 4.5 31.4 180 16 720
4.2 46 360 4.6 36.0 193.2 17.64 811.44
4.4 48 408 4.8 40.8 211.2 19.36 929.28
4.6 52 460 5.2 46.0 239.2 21.16 1100.32
4.8 58 518 5.8 51.8 278.4 23.04 1336.32
5.0 60 578 6.0 57.8 300 25 1500
5.2 56 634 5.6 63.4 291.2 27.04 1514.24
5.4 54 688 5.4 68.8 291.6 29.16 1574.64
5.6 51 739 5.1 73.9 285.6 31.36 1599.36
5.8 50 789 5.0 78.9 290 33.64 1682
6.0 46 835 4.6 83.5 276 36 1656
6.2 44 879 4.4 87.9 272.8 38.44 1691.36
6.4 40 919 4.0 91.9 256 40.96 1638.4
6.6 32 951 3.2 95.1 211.2 43.56 1393.92
6.8 31 982 3.1 98.2 210.8 46.24 1433.44
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la
fórmula
(∑ )
𝑘 2
𝑘
𝑥𝑖 𝑓 𝑖
∑ 2 𝑖=1
𝑓 𝑖 𝑥 −
𝑖
2 𝑖=1 𝑛
𝑠 =
𝑛 −1
471 7 2
23970.12 −
2 1000 Varianza
𝑠 = =1.7217
1000 − 1
Casos: Conclusión:
CV ≤ 10% El conjunto de datos es homogéneo.
10% < CV ≤ 30% El conjunto de datos es variable.
CV > 30% El conjunto de datos es heterogéneo.
Ejemplo 1.
En dos cursos los promedios que sacaron sus alumnos fueron 6.1 y
4.3 y las desviaciones estándar respectivas fueron 0.6 y 0.45
respectivamente. ¿En qué curso hay mayor dispersión?
Solución
0 .6 0.45
CV A (100%) 9.8% CVB (100%) 10.4%
6 .1 4.3
(12) 1 001112222234
10 1 55566789
2 2 00
Bloque B:
Calificaciones Nº de estudiantes
[5, 8> 3
[8, 11> 5
[11, 14> 9
[14, 17> 7
[17, 20] 1
a) ¿En cuál de los dos bloques las calificaciones son más homogéneas?
b) Si en el Bloque B, las calificaciones se incrementan en 5% más un punto,
¿la variabilidad aumenta o disminuye?
Solución :
a) Para el aula A:
Para el aula B:
[1.05, 1.45> 3
[1.45, 1.85> 9
[1.85, 2.25> 15
[2.25, 2.65> 8
Totales 35
Además:
4 4
xif = 68.9500 y x 2 f 140.2475
i i i
i=1 i=1
Para la línea 2:
Focos en la línea 2 agrupados por su tiempo de vida
12
12
10
8
8
Frecuencia
6
5
0
1,05 1,45 1,85 2,25 2,65
Tiempo de vida
10
5
Los policías de transito de una ciudad controlaron la
rapidez de algunos automóviles que trasladaban por
una autopista y obtuvieron los siguientes datos:
Notas de estudiantes en
examen de matemática
Nota f
[2,0-3,0[ 2
[3,0-4,0[ 5
[4,0-5,0[ 8
[5,0-6,0[ 10
[6,0-7,0[ 5
LOCAL B
Cantidad de gasolina Cantidad de ventas
(litros)
90
172
190
125
86
37
Diagrama de Caja
En años recientes se ha empleado con éxito un resumen
gráfico, llamado diagrama de caja, para describir varias de
las características más destacadas de un conjunto de datos.
Entre estas características están (1) centro, (2) dispersión,
(3) naturaleza y magnitud de cualquier desviación respecto
a la simetría y (4) identificación de valores atípicos,
observaciones bastante alejadas del grueso de los datos.
Mediana
Valor Valor
mínimo Q1 Q2 máximo
12 14 16 18 20 22 24 26 28 30 32 34 36
Minutos
Ejemplo 2
La empresa GyS manufacturas, ha evaluado el rendimiento de 15 de sus empleados
en tres sedes. Los puntajes alcanzados por los empleados se muestran en la tabla
siguiente:
MIDE EL GRADO
DE ASIMETRÍA
DE LA
DISTRIBUCIÓN
CON RESPECTO
A LA MEDIA
EL COEFICIENTE DE ASIMETRÍA, SE REPRESENTA
MEDIANTE LA SIGUIENTE ECUACIÓN MATEMÁTICA:
(G1 = 0): SE ACEPTA (G1 > 0): LA CURVA (G1 < 0): LA CURVA
1.
2.
3.
QUE LA ES ES
DISTRIBUCIÓN ES ASIMÉTRICAMENTE ASIMÉTRICAMENTE
SIMÉTRICA, ES POSITIVA POR LO NEGATIVA POR LO
DECIR, EXISTE QUE LOS VALORES QUE LOS VALORES
APROXIMADAMENTE SE TIENDEN A SE TIENDEN A
LA MISMA CANTIDAD REUNIR MÁS EN LA REUNIR MÁS EN LA
DE VALORES A LOS PARTE IZQUIERDA PARTE DERECHA DE
DOS LADOS DE LA QUE EN LA DERECHA LA MEDIA.
MEDIA. DE LA MEDIA.
• PARA RESOLVER ESTE EJERCICIO, SE
EJERCICIO TOMARÁN LOS DATOS DEL EJERCICIO
ANTERIOR, PARA SU RESPECTIVA
CONTINUIDAD Y MEJOR
ENTENDIMIENTO:
-
21 -49.02
49.0 13.40 24.66
21 =
2-
22
22 -18.82
18.8 7.08 24.66 =
2 24.66
23
23 -4.57
-4.57 2.76 =
24
24 -0.29
-0.29 0.44 24.66 =
25
25 0.04
0.04 0.12 24.66 =
26
26 2.41
2.41 1.80 24.66 =
27
27
12.8
12.81 5.48 24.66 =
1
28
28
37.2
37.26 11.16 24.66 =
6 =
29
29
81.7
81.75 18.84 24.66
5 =
30
30
152.2
152.27 28.52 24.66
7
186.84 89.6
30
30
REEMPLAZAMOS ESTOS DATOS EN LA
FÓRMULA DE ASIMETRÍA
LA EXPRESIÓN QUEDARÍA:
CURTOSIS
SE MIDE EN
COMPARACI
ÓN A LA
CURVA
SIMÉTRICA SE COMPARA LA
NORMAL DISPERSIÓN DE
LOS DATOS
OBSERVADOS
CERCANOS AL
VALOR
CENTRAL
DE ACUERDO A SU VALOR, LA 'PUNTUDEZ' DE LOS
DATOS PUEDE CLASIFICARSE EN TRES GRUPOS:
LEPTOCÚRTICOS, CON VALORES GRANDES
PARA EL COEFICIENTE
24.66 =
21
21 179.44
179.44
24.66 =
22
22 50.06
50.06 24.66 =
23
23 7.59
7.59 24.66 =
24
24 0.19
0.19 24.66 =
25
25 0.01
0.01 24.66 =
26
26 3.22
3.22
24.66 =
27 29.98
27 29.98
24.66 =
28
28 124.45
124.45 =
24.66
29
29 354.78
354.78 =
24.66
30
30 813.14
813.14
1562.86
SABEMOS QUE:24.66
X =
REEMPLAZAMOS LOS DATOS
OBTENIDOS EN:
2
2
2
VERIFICANDO LO APRENDIDO