Está en la página 1de 66

ESTADÍSTICA GENERAL

MEDIDAS DE DISPERSIÓN
Plan de clase
• Competencias
• Motivación.
Inicio • Saberes previos.

• Medidas de dispersión. Varianza, desviación estándar y coeficiente de


variación.
Contenido de • Gráfico de caja.
sesión • Ejemplos.

• Retroalimentación.
• Autoevaluación
Cierre
Competencias
Al termino de la sesión, el
estudiante estará en capacidad
de:
 Definir y calcular medidas de
dispersión.
 Determinar la calidad del
estimador utilizando medidas de
dispersión apropiadas.
 Interpretar un gráfico de caja.
 Resolver problemas de
aplicación sobre los conceptos
desarrollados.
INTRODUCCIÓN

500 1500 2000 2050 2100 6250


Medidas de Dispersión
Las medidas de dispersión o variabilidad miden el grado de
concentración de los datos con respecto a un valor central.
Para medir el grado de concentración de los datos se tienen
en cuenta las desviaciones.
Las desviaciones son las diferencias entre los valores de los
datos y la media de estos.

Ejemplo
Del ejemplo anterior, tenemos:
500 – 2050 = -1550
1500 – 2050 = -550
6250 – 2050 = 4200
Medidas de Dispersión
• Rango: Corresponde a la diferencia entre el dato mayor y el dato
menor.

• Deviación (d) es asociada a un valor x1 de la variable con respecto de


la media aritmética x, se define como al diferencia entre

Desviación media: es la media aritmética de los valores absolutos de las


desviaciones de los datos respecto a la media aritmética . Se puede
interpretar como la distancia promedio de los datos y la media aritmética.
Se calcula usando la siguiente formula

datos desagrupados

Para datos agrupados en clases se tiene


RANGO

Mide la amplitud de los valores de la muestra y se calcula por


diferencia entre el valor más elevado (Límite superior) y el valor más
bajo (Límite inferior).
FÓRMULA Rango  X MAX  X MIN

Ejemplo 1.
Ante la pregunta sobre número de hijos por familia, una muestra de
12 hogares, marcó las siguientes respuestas:
2 1 2 4 1 3
2 3 2 0 5 1
Calcula el rango de la variable
Solución.
Rango  5  0  5
Ejemplo 2.
Hay dos conjuntos sobre la cantidad de lluvia (mm) en
Ancash y La Libertad en un año.
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Ancash 86 135 178 170 231 290 ## 305 244 122 66 71
La Libertad 40 77 83 89 147 168 ## 252 209 101 32 13
Calcula el rango en cada una de las ciudades.
Solución.
Aplicando la fórmula correspondiente tenemos:

Ancash Rango  305mm  66mm  239mm


La Libertad
Rango  252mm  13mm  239mm

En este caso se puede observar que el rango es el


mismo para ambos casos aunque las cantidades
sean diferentes.
Varianza y Desviación Estándar
Las medidas de dispersión o variabilidad que se estudiarán son:
1. Varianza (s2)
La varianza mide la dispersión de los datos con respecto a la media.
Si los datos se encuentran cerca de la media entonces la varianza
será pequeña, en caso contrario la varianza será grande.
2. Desviación Estándar (s)
La desviación estándar es la raíz cuadrada de la varianza y mide la
desviación promedio de cada observación con respecto a la media.
Observación
es la notación de la varianza muestral y es la notación de la
varianza poblacional.
Fórmulas para el cálculo de la Varianza
• Datos no agrupados: • Datos agrupados:

Obteniendo la forma abreviada:


Análisis de la variabilidad

8 cms.

Aquí tenemos 9 rectángulos cuya altura es de 8


centímetros (y todos tienen la misma base).
¿Existe alguna variación respecto de su altura entre estos
rectángulos?
¿Cuál es el promedio de la altura de estos
rectángulos?
8+8+8+8+8+8+8+8+8 72
= =8
9 9
Análisis de la variabilidad
10 cms

6 cms

8 cms.

El quinto rectángulo y el octavo rectángulo en un acto de


rebeldía cambiaron su altura. El quinto rectángulo, ahora
de color rojo, mide 10 centímetros, y el octavo rectángulo, de
color azul, mide 6 centímetros?
¿Cuál es el nuevo promedio de estos 9 rectángulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9 = 72 = 8
9

... ¡el mismo promedio! Pero... ¿ha habido variación?


Análisis de la variabilidad
10 cms

6 cms

8 cms.

El rectángulo rojo tiene +2 centímetros sobre el promedio, y el


rectángulo azul tiene –2 centímetros bajo el promedio. Los otros
rectángulos tienen cero diferencia respecto del promedio.

Si sumamos estas diferencias de la altura respecto del promedio,


tenemos
0+0+0+0+2+0+0–2+0 =0

Este valor nos parece indicar que ¡no ha habido variabilidad! Y


sin embargo, ante nuestros ojos, sabemos que hay variación.
Análisis de la variabilidad
10 cms

6 cms

8 cms.

Una forma de eliminar los signos menos de aquellas diferencias


que sean negativas, esto es de aquellos mediciones que estén bajo
el promedio, es elevar al cuadrado todas las diferencias, y luego
sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectángulos, es
decir lo dividimos por el número de rectángulos que es 9
8
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = = 0,89
9 9
Análisis de la variabilidad

10 cms

6 cms

8 cms.

Se dice entonces que la varianza fue de 0,89

Observemos que las unidades involucradas en el cálculo de la


varianza están al cuadrado. En rigor la varianza es de 0,89
centímetros cuadrados. De manera que se define

0,89  0,943
La raíz cuadrada de la varianza se llama desviación estándar
Análisis de la variabilidad
10 cms

6 cms

8 cms.

Que la desviación estándar haya sido de 0,943 significa que en


promedio la altura de los rectángulos variaron (ya sea aumentando, ya
sea disminuyendo) en 0,943 centímetros.
Es claro que esta situación es “en promedio”, puesto que sabemos
que los causantes de la variación fueron los rectángulos quinto y
octavo. Esta variación hace repartir la “culpa” a todos los demás
rectángulos que se “portaron bien”.

La desviación estándar mide la dispersión de los datos respecto del


promedio
Análisis de la variabilidad
10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.
7 cms.
6 cms
4 cms

¿Cuál es la varianza y la desviación estándar de las alturas de los


rectángulos?
En primer lugar debemos calcular el promedio

8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8 = 7,44
9

Luego debemos calcular la varianza


Análisis de la variabilidad
10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.
7 cms.
6
4 cms
cms

0,56 2,56 0,56 -0,44 -1,44


0,56
-3,44
0,56 0,56

7,44

Promedio

0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224
=
9 9

Este es el valor de la varianza = 2,469


Análisis de la variabilidad
10 cms
8 cms. 8 cms. 8 cms. 8 cms. 8 cms.
7 cms. 6 cms
4 cms

7,44

Promedio

Si la varianza fue de 2,469, entonces la desviación estándar es de...


2, 469  1,57

Lo que significa que, en promedio, los rectángulos se desviaron más


o menos (más arriba o más abajo) en 1,57 centímetros.
La varianza siempre será mayor que cero. Mientras más se aproxima a
cero, más concentrados están los valores de la serie alrededor de la
media. Por el contrario, mientras mayor sea la varianza, más dispersos
están.
Ejemplo 1.
Calcula la varianza para los siguientes datos
2 1 2 4 1 3 2 3 2 0 5 1

Solución.

Primero es necesario obtener la media. En este caso x  2.16

Ahora aplicamos la fórmula correspondiente

(2  2.16)2  (1  2.16)2  (2  2.16)2  (4  2.16)2  (1  2.16)2  (3  2.16)2  (2  2.16)2  (3  2.16)2  (2  2.16)2  (0  2.16)2  (5  2.16)2  (1  2.16)2
s2 
12  1

21.6672
s2   1.9697
11
Ejemplo
A continuación se muestran dos conjuntos de datos obtenidos a partir
de un experimento químico que realizaron dos estudiantes distintos.
Calcular la varianza.

Volumen de ácido medido (cm^3)


Estudiante A 8 12 7 9 3 10 12 11 12 14
Estudiante B 7 6 7 15 12 11 9 9 13 11
Solución.

Primero es necesario obtener la media de cada conjunto de datos. En


este caso

Estudiante A x
8  12  7  9  3  10  12  11  12  14
 9.8
10

Estudiante B 7  6  7  15  12  11  9  9  13  11
x  10
10
Ahora aplicamos la fórmula correspondiente
Solución (Continuación).

Estudiante A

2 (8  9.8)2  (12  9.8) 2  (7  9.8) 2  (9  9.8) 2  (3  9.8) 2  (10  9.8) 2  (12  9.8) 2  (11  9.8) 2  (12  9.8) 2  (14  9.8) 2
s 
10  1

91.6
s2   9.16
10

Estudiante B

(7  10)2  (6  10) 2  (7  10) 2  (15  10) 2  (12  10) 2  (11  10) 2  (9  10) 2  (9  10) 2  (13  10) 2  (11  10) 2
2
s 
10  1

76
s2   7.6
10
Ejemplo

Si retomamos el ejemplo 1 que corresponde a la varianza:

Calcula la desviación estándar para los siguientes datos

2 1 2 4 1 3 2 3 2 0 5 1

Solución.

Una vez que hemos calculado la media y la varianza, sólo resta


calcular la raíz cuadrada de la varianza.

x  2.16
221.6672
s   1.9697
11

S  1.9697  1.4034
Ejemplo 2.
Considerando nuevamente el segundo ejemplo que estudiaste para
calcular la varianza, tenemos:
A continuación se muestran dos conjuntos de datos obtenidos a partir
de un experimento químico que realizaron dos estudiantes distintos.
Calcular la varianza.
Volumen de ácido medido (cm^3)
Estudiante A 8 12 7 9 3 10 12 11 12 14
Estudiante B 7 6 7 15 12 11 9 9 13 11
Solución.
Una vez que has calculado la media y la varianza, es necesario calcular
la desviación estándar a partir de la obtención de la raíz cuadrada de la
varianza.

Estudiante A 91.6
s2   9.16 S  9.16  3.026
10

Estudiante B
76
s2   7.6 S  7.6  2.756
10
Propiedades de la Varianza
• La varianza es siempre un número no negativo; es decir:
V(X)≥0.
• La varianza de una constante es igual a cero; es decir:
V(k)=0, k es una constante.

Nuevo Nueva varianza Nueva desviación


dato estándar

X±b s2 s
cX c2 s2 cs
cX±b c 2 s2 cs
Ejemplo 1.

Se han registrado durante 20 días, el número de viajeros que hacen


reservaciones a una agencia de viajes pero que no las hacen
efectivas:

Número de viajeros Frecuencia


i (xi ) (fi)
1 12 3
2 13 3
3 14 6
4 15 3
5 16 5
Total 70 20
Calcula las medidas de dispersión de la variable en estudio. Interpreta
Solución.
Tal como lo indica la fórmula, primero es necesario multiplicar la
variable (xi ) por la frecuencia (fi) y añadirlo como una columna a la
tabla.

Frecuenci
Número de viajeros
i a xi fi
(xi )
(fi)
1 12 3 36
2 13 3 39
3 14 6 84
4 15 3 45
5 16 5 80
Total 70 20 284
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (xi )2.

Número de Frecuencia
i xi f i xi2
viajeros (xi ) (fi)
1 12 3 36 144
2 13 3 39 169
3 14 6 84 196
4 15 3 45 225
5 16 5 80 256
Total 70 20 284 990
Solución (Continuación).

Ahora se multiplica el cuadrado de la variable por la frecuencia, es decir,


(fixi2).

Número de Frecuencia fixi2


i xi f i x 2
viajeros (xi ) (fi) i

1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
Solución (Continuación).

Una vez obtenidos todos los datos anteriores, se procede a aplicar la


fórmula 2
 k 
k
  xi f i 
 i 1 
 f x
i i
2

n
s 2  i 1
n 1

Número de viajeros Frecuencia fixi2


i xi fi xi2
(xi ) (fi)

1 12 3 36 144 432

2 13 3 39 169 507

3 14 6 84 196 1176

4 15 3 45 225 675

5 16 5 80 256 1280

Total 70 20 284 990 4070


Solución (Continuación).

Número de Frecuencia fixi2


i xi fi x 2
viajeros (xi ) (fi) i

1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070

284 2
4070 
s2  20  1.9579
19
s  1.9579  1.3992
Ejemplo 2. De acuerdo a la siguiente tabla, calcula la varianza y la desviación estándar:
NOTA FREC. ABSOLUTA FREC. ABSOLUTA FREC RELATIVA
FREC. RELATIVA %
x f ACUMULADA ACUMULADA %
1.2 1 1 0.1 0.1
1.4 2 3 0.2 0.3
1.6 3 6 0.3 0.6
1.8 8 14 0.8 1.4
2.0 14 28 1.4 2.8
2.2 18 46 1.8 4.6
2.4 19 65 1.9 6.5
2.6 22 87 2.2 8.7
2.8 25 112 2.5 11.2
3.0 26 138 2.6 13.8
3.2 27 165 2.7 16.5
3.4 31 196 3.1 19.6
3.6 35 231 3.5 23.1
3.8 38 269 3.8 26.9
4.0 45 314 4.5 31.4
4.2 46 360 4.6 36.0
4.4 48 408 4.8 40.8
4.6 52 460 5.2 46.0
4.8 58 518 5.8 51.8
5.0 60 578 6.0 57.8
5.2 56 634 5.6 63.4
5.4 54 688 5.4 68.8
5.6 51 739 5.1 73.9
5.8 50 789 5.0 78.9
6.0 46 835 4.6 83.5
6.2 44 879 4.4 87.9
6.4 40 919 4.0 91.9
6.6 32 951 3.2 95.1
6.8 31 982 3.1 98.2
7.0 18 1000 1.8 100
TOTAL 1000 4717 23970.12  
Solución: El primer paso es calcular xi fi:
NOTA FREC. ABSOLUTA FREC. ABSOLUTA FREC. RELATIVA FREC RELATIVA
x f ACUMULADA % ACUMULADA % x i fi
1.2 1 1 0.1 0.1 1.2
1.4 2 3 0.2 0.3 2.8
1.6 3 6 0.3 0.6 4.8
1.8 8 14 0.8 1.4 14.4
2.0 14 28 1.4 2.8 28
2.2 18 46 1.8 4.6 39.6
2.4 19 65 1.9 6.5 45.6
2.6 22 87 2.2 8.7 57.2
2.8 25 112 2.5 11.2 70
3.0 26 138 2.6 13.8 78
3.2 27 165 2.7 16.5 86.4
3.4 31 196 3.1 19.6 105.4
3.6 35 231 3.5 23.1 126
3.8 38 269 3.8 26.9 144.4
4.0 45 314 4.5 31.4 180
4.2 46 360 4.6 36.0 193.2
4.4 48 408 4.8 40.8 211.2
4.6 52 460 5.2 46.0 239.2
4.8 58 518 5.8 51.8 278.4
5.0 60 578 6.0 57.8 300
5.2 56 634 5.6 63.4 291.2
5.4 54 688 5.4 68.8 291.6
5.6 51 739 5.1 73.9 285.6
5.8 50 789 5.0 78.9 290
6.0 46 835 4.6 83.5 276
6.2 44 879 4.4 87.9 272.8
6.4 40 919 4.0 91.9 256
6.6 32 951 3.2 95.1 211.2
6.8 31 982 3.1 98.2 210.8
7.0 18 1000 1.8 100 126
TOTAL 1000 4717 23970.12   
Solución (Continuación).Después se obtiene el cuadrado de la variable x, o sea, (x i )2.
FREC. FREC. FREC
NOTA FREC.
ABSOLUTA ABSOLUTA RELATIVA
x RELATIVA %
f ACUMULADA ACUMULADA % x i fi xi 2
1.2 1 1 0.1 0.1 1.2 1.44
1.4 2 3 0.2 0.3 2.8 1.96
1.6 3 6 0.3 0.6 4.8 2.56
1.8 8 14 0.8 1.4 14.4 3.24
2.0 14 28 1.4 2.8 28 4
2.2 18 46 1.8 4.6 39.6 4.84
2.4 19 65 1.9 6.5 45.6 5.76
2.6 22 87 2.2 8.7 57.2 6.76
2.8 25 112 2.5 11.2 70 7.84
3.0 26 138 2.6 13.8 78 9
3.2 27 165 2.7 16.5 86.4 10.24
3.4 31 196 3.1 19.6 105.4 11.56
3.6 35 231 3.5 23.1 126 12.96
3.8 38 269 3.8 26.9 144.4 14.44
4.0 45 314 4.5 31.4 180 16
4.2 46 360 4.6 36.0 193.2 17.64
4.4 48 408 4.8 40.8 211.2 19.36
4.6 52 460 5.2 46.0 239.2 21.16
4.8 58 518 5.8 51.8 278.4 23.04
5.0 60 578 6.0 57.8 300 25
5.2 56 634 5.6 63.4 291.2 27.04
5.4 54 688 5.4 68.8 291.6 29.16
5.6 51 739 5.1 73.9 285.6 31.36
5.8 50 789 5.0 78.9 290 33.64
6.0 46 835 4.6 83.5 276 36
6.2 44 879 4.4 87.9 272.8 38.44
6.4 40 919 4.0 91.9 256 40.96
6.6 32 951 3.2 95.1 211.2 43.56
6.8 31 982 3.1 98.2 210.8 46.24
7.0 18 1000 1.8 100 126 49
Solución (Continuación).Ahora se multiplica el cuadrado de la variable por la frecuencia, es decir, (f ixi2).
FREC
FREC. FREC.
NOTA FREC. RELATIVA
ABSOLUTA ABSOLUTA
x RELATIVA % ACUMULADA
f ACUMULADA
% x i fi xi2 fixi2
1.2 1 1 0.1 0.1 1.2 1.44 1.44
1.4 2 3 0.2 0.3 2.8 1.96 3.92
1.6 3 6 0.3 0.6 4.8 2.56 7.68
1.8 8 14 0.8 1.4 14.4 3.24 25.92
2.0 14 28 1.4 2.8 28 4 56
2.2 18 46 1.8 4.6 39.6 4.84 87.12
2.4 19 65 1.9 6.5 45.6 5.76 109.44
2.6 22 87 2.2 8.7 57.2 6.76 148.72
2.8 25 112 2.5 11.2 70 7.84 196
3.0 26 138 2.6 13.8 78 9 234
3.2 27 165 2.7 16.5 86.4 10.24 276.48
3.4 31 196 3.1 19.6 105.4 11.56 358.36
3.6 35 231 3.5 23.1 126 12.96 453.6
3.8 38 269 3.8 26.9 144.4 14.44 548.72
4.0 45 314 4.5 31.4 180 16 720
4.2 46 360 4.6 36.0 193.2 17.64 811.44
4.4 48 408 4.8 40.8 211.2 19.36 929.28
4.6 52 460 5.2 46.0 239.2 21.16 1100.32
4.8 58 518 5.8 51.8 278.4 23.04 1336.32
5.0 60 578 6.0 57.8 300 25 1500
5.2 56 634 5.6 63.4 291.2 27.04 1514.24
5.4 54 688 5.4 68.8 291.6 29.16 1574.64
5.6 51 739 5.1 73.9 285.6 31.36 1599.36
5.8 50 789 5.0 78.9 290 33.64 1682
6.0 46 835 4.6 83.5 276 36 1656
6.2 44 879 4.4 87.9 272.8 38.44 1691.36
6.4 40 919 4.0 91.9 256 40.96 1638.4
6.6 32 951 3.2 95.1 211.2 43.56 1393.92
6.8 31 982 3.1 98.2 210.8 46.24 1433.44
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la
fórmula

(∑ )
𝑘 2

𝑘
𝑥𝑖 𝑓 𝑖

∑ 2 𝑖=1
𝑓 𝑖 𝑥 −
𝑖
2 𝑖=1 𝑛
𝑠 =
𝑛 −1

471 7 2
23970.12 −
2 1000 Varianza
𝑠 = =1.7217
1000 − 1

𝑠= √ 1.7217=1.3121 Desviación estándar


Coeficiente de Variación
El Coeficiente de variación es una medida de dispersión relativa
que nos permite comparar la variabilidad de dos o más
conjuntos de datos que se encuentran en unidades de medidas
diferentes.

Para tener en cuenta:

Casos: Conclusión:
CV ≤ 10% El conjunto de datos es homogéneo.
10% < CV ≤ 30% El conjunto de datos es variable.
CV > 30% El conjunto de datos es heterogéneo.
Ejemplo 1.

En dos cursos los promedios que sacaron sus alumnos fueron 6.1 y
4.3 y las desviaciones estándar respectivas fueron 0.6 y 0.45
respectivamente. ¿En qué curso hay mayor dispersión?
Solución

Para responder esto, debemos obtener el coeficiente de variación


aplicando la fórmula
S
CV   100%
x

0 .6 0.45
CV A  (100%)  9.8% CVB  (100%)  10.4%
6 .1 4.3

Claramente, el curso A tiene una dispersión menor que el B, pese a


presentar una mayor desviación estándar.
Ejemplo:
A continuación, se presentan las distribuciones de las calificaciones de dos bloques
(Bloque A y Bloque B) del curso Estadística para Ingeniería I:
Bloque A:
Leaft Unit=1.0
  Tallo Hojas
5 0 55689

(12) 1 001112222234
10 1 55566789
2 2 00

Bloque B:

Calificaciones Nº de estudiantes
[5, 8> 3
[8, 11> 5
[11, 14> 9
[14, 17> 7
[17, 20] 1
a) ¿En cuál de los dos bloques las calificaciones son más homogéneas?
b) Si en el Bloque B, las calificaciones se incrementan en 5% más un punto,
¿la variabilidad aumenta o disminuye?

Solución :
a) Para el aula A:

Para el aula B:

En el aula A, las calificaciones son más homogéneas porque existe menor


variabilidad.
b)

El aumento del 5% de las calificaciones del bloque B, produce una


disminución de la variabilidad.
Ejercicio Resuelto
El jefe de producción de una empresa que fabrica focos ahorradores quiere obtener
información estadística acerca del tiempo de vida de los focos producidos en sus dos
líneas de producción. Para esto, ha tomado muestras de focos de ambas líneas,
obteniendo los siguientes resultados:
Para la línea 1:

Tiempo de vida Nº de focos


(en miles de horas) en la línea 1

[1.05, 1.45> 3
[1.45, 1.85> 9
[1.85, 2.25> 15
[2.25, 2.65> 8
Totales 35

Además:
4 4
 xif = 68.9500 y  x 2 f  140.2475
i i i
i=1 i=1
Para la línea 2:
Focos en la línea 2 agrupados por su tiempo de vida
12
12

10

8
8
Frecuencia

6
5

0
1,05 1,45 1,85 2,25 2,65
Tiempo de vida

Luego de realizar los cálculos necesarios, responda:


a) ¿Cuál de las dos líneas presenta tiempos de vida menos variables?
0.3604
CV1 = = 0.1829
1.97
0.4014
CV2 = = 0.2246
1.7875
Los focos de la línea 1presentan tiempos de vida menos variables.
b) Para corregir los errores en la toma de los
tiempos de vida en ambas líneas, se realizan los
siguientes cambios: En la línea 1, los tiempos se
incrementaron en 10% más 150 horas y en la
línea 2, los tiempos se incrementaron en 600
horas. ¿En cuál de las dos líneas, se presentan
tiempos más homogéneos luego de los cambios?
Ejemplo:
La siguiente tabla muestra la duración de unas
baterías alcalinas

Duración (horas) Frecuencia


[40-45[ 22
[45-50[ 16
[50-55[ 10
[55-60[ 8

a)¿Calcular la duración promedio de una pila?


b)¿Calcular la desviación estándar y la varianza?
Ejercicios
1) Calcula el rango y la desviación media y la desviación estándar de
la venta de electrodomésticos realizadas en una tienda durante 10
días 72-63-84-60-72-80-90-81-78-78.
2) En la tabla se muestran las notas de 30 estudiantes en una prueba
de matemáticas. Calcula la varianza y la desviación estándar.

Notas de los estudiantes en un examen de matemáticas


Nota f
2
5

10

5
Los policías de transito de una ciudad controlaron la
rapidez de algunos automóviles que trasladaban por
una autopista y obtuvieron los siguientes datos:

Rapidez (km/h) Cantidad de autos


8
21
57
10
4
a) Calcule el rango, la desviación estándar.
Interpreta los resultados
En la tabla se muestran os notas de 30 estudiantes
en una prueba de matemática

Notas de estudiantes en
examen de matemática
Nota f
[2,0-3,0[ 2
[3,0-4,0[ 5
[4,0-5,0[ 8
[5,0-6,0[ 10
[6,0-7,0[ 5

a) Calcular la desviación estándar e interprétala


COMPARACION DE MUESTRAS
Cuando se tienen dos o mas muestras, se pueden
comparar sus características utilizando las medias de
tendencia central de posición y las de dispersión, y a
partir de ellas obtener conclusiones.
Nota: Nos es necesario que las muestras sean del
mismo tamaño.
Ejemplo
Una estación de bencina reporto las siguientes
distribuciones de frecuencia, la que relaciona la
cantidad de litros de bencina vendidas aun grupo de
clientes en un día lunes en dos locales diferentes.
LOCAL A
Cantidad de gasolina Cantidad de ventas ANALICE
(litros) Utilice la media y la
110 varianza para
determinar cual de
157 los dos locales les
204 va mejor.
88
85
56

LOCAL B
Cantidad de gasolina Cantidad de ventas
(litros)
90
172
190
125
86
37
Diagrama de Caja
En años recientes se ha empleado con éxito un resumen
gráfico, llamado diagrama de caja, para describir varias de
las características más destacadas de un conjunto de datos.
Entre estas características están (1) centro, (2) dispersión,
(3) naturaleza y magnitud de cualquier desviación respecto
a la simetría y (4) identificación de valores atípicos,
observaciones bastante alejadas del grueso de los datos.

(Jay L. Devore, Probabilidad y Estadística para Ingeniería y Ciencias)


Pasos para construir un Diagrama de
Cajas

• Ordenar los datos de menor a mayor.


• Calcular los cuartiles: Q1, Q2=Me y Q3.
• Calcular la cuarta dispersión: fs= Q3 – Q1.
• Trazar el diagrama correspondiente.
Ejemplo 1

Mediana
Valor Valor
mínimo Q1 Q2 máximo

12 14 16 18 20 22 24 26 28 30 32 34 36

Minutos
Ejemplo 2
La empresa GyS manufacturas, ha evaluado el rendimiento de 15 de sus empleados
en tres sedes. Los puntajes alcanzados por los empleados se muestran en la tabla
siguiente:

En base a este gráfico, responda:


¿En cuál de las tres sedes se obtuvo puntajes más homogéneos?, justifique.
En la sede 2, comparando los rangos u observando el tamaño de las cajas.
Para la sede 2, ¿Qué tipo de asimetría tiene en el 50% central de las puntuaciones?
Tiene asimetría positiva
 
¿Cómo se llaman los valores que están representados por los
asteriscos?

Valores atípicos o outliers.

Para la sede 2, ¿por qué el bigote es más largo en el 25%


inferior en comparación con el 25% superior?
Porque existe mayor variabilidad.

¿Es posible que el puntaje promedio de los empleados de la


sede 3 sea 70 puntos? Justifique.
No, porque presenta asimetría positiva y en este caso el
promedio es mayor que la mediana que es aproximadamente
75 puntos.
COEFICIENTE DE ASIMETRÍA
¿QUÉ ES ASIMETRÍA?
ESTA MEDIDA NOS PERMITE
IDENTIFICAR SI LOS DATOS SE
DISTRIBUYEN DE FORMA
UNIFORME ALREDEDOR DEL
PUNTO CENTRAL (MEDIA
ARITMÉTICA). LA ASIMETRÍA
PRESENTA TRES ESTADOS
DIFERENTES
COEFICIENTE DE ASIMETRÍA
UN VALOR POSITIVO DE
ESTE INDICADOR
SIGNIFICA QUE LA UN RESULTADO
DISTRIBUCIÓN SE NEGATIVO SIGNIFICA
ENCUENTRA SESGADA QUE LA DISTRIBUCIÓN
HACIA LA IZQUIERDA SE SESGA A LA
(ORIENTACIÓN DERECHA.
POSITIVA).

MIDE EL GRADO
DE ASIMETRÍA
DE LA
DISTRIBUCIÓN
CON RESPECTO
A LA MEDIA
EL COEFICIENTE DE ASIMETRÍA, SE REPRESENTA
MEDIANTE LA SIGUIENTE ECUACIÓN MATEMÁTICA:

(G1 = 0): SE ACEPTA (G1 > 0): LA CURVA (G1 < 0): LA CURVA
1.

2.

3.
QUE LA ES ES
DISTRIBUCIÓN ES ASIMÉTRICAMENTE ASIMÉTRICAMENTE
SIMÉTRICA, ES POSITIVA POR LO NEGATIVA POR LO
DECIR, EXISTE QUE LOS VALORES QUE LOS VALORES
APROXIMADAMENTE SE TIENDEN A SE TIENDEN A
LA MISMA CANTIDAD REUNIR MÁS EN LA REUNIR MÁS EN LA
DE VALORES A LOS PARTE IZQUIERDA PARTE DERECHA DE
DOS LADOS DE LA QUE EN LA DERECHA LA MEDIA.
MEDIA. DE LA MEDIA.
• PARA RESOLVER ESTE EJERCICIO, SE
EJERCICIO TOMARÁN LOS DATOS DEL EJERCICIO
ANTERIOR, PARA SU RESPECTIVA
CONTINUIDAD Y MEJOR
ENTENDIMIENTO:
-
21 -49.02
49.0 13.40 24.66
21 =
2-
22
22 -18.82
18.8 7.08 24.66 =
2 24.66
23
23 -4.57
-4.57 2.76 =
24
24 -0.29
-0.29 0.44 24.66 =
25
25 0.04
0.04 0.12 24.66 =
26
26 2.41
2.41 1.80 24.66 =
27
27
12.8
12.81 5.48 24.66 =
1
28
28
37.2
37.26 11.16 24.66 =
6 =
29
29
81.7
81.75 18.84 24.66
5 =
30
30
152.2
152.27 28.52 24.66
7
186.84 89.6

SABEMOS QUE: X = 24.66


24.66
ENTONCES SABIENDO QUE:
186.84
89.6

30
30
REEMPLAZAMOS ESTOS DATOS EN LA
FÓRMULA DE ASIMETRÍA
LA EXPRESIÓN QUEDARÍA:
CURTOSIS

SE MIDE EN
COMPARACI
ÓN A LA
CURVA
SIMÉTRICA SE COMPARA LA
NORMAL DISPERSIÓN DE
LOS DATOS
OBSERVADOS
CERCANOS AL
VALOR
CENTRAL
DE ACUERDO A SU VALOR, LA 'PUNTUDEZ' DE LOS
DATOS PUEDE CLASIFICARSE EN TRES GRUPOS:   
LEPTOCÚRTICOS, CON VALORES GRANDES
PARA EL COEFICIENTE

MESOCÚRTICOS, CON VALORES MEDIANOS


PARA EL COEFICIENTE.

PLATICÚRTICOS, CON VALORES PEQUEÑOS


PARA EL COEFICIENTE. 
Para calcular el coeficiente de Curtosis se utiliza la
ecuación:

• (g2 = 0) la distribución es Mesocúrtica: Al igual


que en la asimetría es bastante difícil  encontrar
un coeficiente de Curtosis de cero (0), por lo que
se suelen aceptar los valores cercanos (± 0.5
aprox.).
• (g2 > 0) la distribución es Leptocúrtica.
• (g2 < 0) la distribución es Platicúrtica.
• PARA RESOLVER ESTE EJERCICIO, SE
EJERCICIO: TOMARÁN LOS DATOS DEL EJERCICIO
ANTERIOR, PARA SU RESPECTIVA
CONTINUIDAD Y MEJOR ENTENDIMIENTO:

24.66 =
21
21 179.44
179.44
24.66 =
22
22 50.06
50.06 24.66 =
23
23 7.59
7.59 24.66 =
24
24 0.19
0.19 24.66 =
25
25 0.01
0.01 24.66 =
26
26 3.22
3.22
24.66 =
27 29.98
27 29.98
24.66 =
28
28 124.45
124.45 =
24.66
29
29 354.78
354.78 =
24.66
30
30 813.14
813.14
1562.86

SABEMOS QUE:24.66
X =
REEMPLAZAMOS LOS DATOS
OBTENIDOS EN:

2
2

2
VERIFICANDO LO APRENDIDO

Los ingresos semanales de los 25


trabajadores de un hotel tienen un
coeficiente de variación del 15%. Por
incremento del costo de vida, se decide
hacer un aumento del 20% de los
ingresos semanales más un adicional de
60 soles; por lo que, el nuevo
coeficiente de variación es igual al 10%.
a) ¿Cuál es el valor del ingreso semanal
promedio y la desviación estándar antes
del aumento?
b) ¿Cuánto dinero necesita el hotel para
pagar los ingresos semanales después
del aumento?

También podría gustarte