MEDIAS DE DISPERSION
VARIANZA
La varianza es una medida de variabilidad que utiliza todos los datos.
Est basada en la diferencia entre los valores de cada observacin (xi) y la media. (x para una
muestra, m para una poblacin).
La varianza es el promedio de las diferencias al cuadrado entre cada valor de dato y la media.
Si el conjunto de DATOS ES UNA MUESTRA, la varianza se denota por s2.
2
(
x
x
)
i
s2
n 1
CUANDO LOS DATOS SON AGRUPADOS
Si el conjunto de DATOS ES UNA MUESTRA, la varianza es:
f (X
x)2
n 1
2
(
x
i
2
N
f (X
)2
DESVIACION ESTANDAR
La desviacin estndar de un conjunto de datos es la raz cuadrada positiva de la varianza.
Se mide en las mismas unidades que los datos, hacindola ms comparable, que la variancia, a
la media.
Si el conjunto de DATOS ES UNA MUESTRA, la desviacin estndar se denota por s.
s s2
[Escriba aqu]
[Escriba aqu]
Si el conjunto de DATOS ES UNA POBLACIN, la desviacin estndar se denota por
(sigma).
2
COEFICIENTE DE VARIACION
El coeficiente de variacin indica que tan grande es la desviacin estndar rn relacin al
promedio.
s
(100)
x
Si
como sigue:
(100)
Sesgo
No hay sesgo. La distribucin
es insesgada
[Escriba aqu]
>0
<0
Curtosis
Mide qu tan puntiaguda es una distribucin, con respecto a la Normal.
La distribucin Normal se considera mesocrtica, es el trmino medio.
Las distribuciones mas puntiagudas que la Normal se llaman leptocrticas
Las distribuciones menos puntiagudas que la Normal se conocen como
platocrticas
Funcin Curtosis
Curtosis
=3
Mesocrtica
>3
Leptocrtica
<3
Platocrtica
TEOREMA DE CHEBYSHEV
Al menos (1 - 1/k2) de los elementos en un conjunto de datos estar dentro de las k desviaciones
estndar del promedio donde k es cualquier valor mayor que 1.
Al menos 75% de los elementos deben estar entre k = 2 desviaciones estndar de la
media.
Al menos 89% de los elementos deben estar entre
k = 3 desviaciones estndar de la media.
Al menos 94% de los elementos deben estar entre
[Escriba aqu]
[Escriba aqu]
k = 4 desviaciones estndar de la media.
Cualquiera que sea la forma de la distribucin de los datos:
al menos el 75% de los valores (poblacin) caern dentro de 2 desviaciones estndar respecto
de la media de la distribucin:
X 2S
al menos el 89% de los valores (poblacin) caern dentro de 3 desviaciones estndar respecto
de la media de la distribucin:
X 3S
1) EJEMPLO RESUELTO
El nmero de dis necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales
caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media, mediana, moda,
varianza y desviacin tpica.
SOLUCIN:
La media: suma
de todos los valores de una variable dividida entre el nmero total de datos de los que se
dispone:
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo.
Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que se
encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez
60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media
aritmtica de la distribucin.
[Escriba aqu]
[Escriba aqu]
Sx2=
S = 427,61 = 20.67
El rango: diferencia entre el valor de las observaciones mayor y el menor
80 - 15 = 65 das
El coeficiente de variacin: cociente entre la desviacin tpica y el valor absoluto de la media aritmtica
CV = 20,67/52,3 = 0,39
2) EJEMPLO
El precio de un interruptor magentotrmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25,
29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadstica, ms abajo) diagrama de barras
y el diagrama de caja.
SOLUCIN:
(Utilizar la calculadora de debajo)
[Escriba aqu]
[Escriba aqu]
3) EJERCICIO RESUELTO
Obtener la varianza y desviacin estndar de la siguiente muestra, que nos indica el nmero de cigarros que
son consumidos en promedio al da por un conjunto de 20 encuestados.
[Escriba aqu]
10
10
[Escriba aqu]
x
La media es igual a
77
3.85
20
xi x 2
3.4225
0.0225
37.8225
4.6225
14.8225
0.0225
8.1225
14.8225
0.7225
4.6225
37.8225
3.4225
0.0225
3.4225
0.7225
3.4225
1.3225
1.3225
17.2225
14.8225
Por lo que
171.83
8.5915
20
por lo para determinar la desviacin estndar basta con obtener la raz cuadrada, con lo que finalmente la
desviacin estndar es igual a:
S 0.6554 cigarros.
4) EJERCICIO RESUELTO
A continuacin se le dan los resultados de una evaluacin de Qumica aplicada a un grupo de alumnos
de 9no grado. Encuentre: a) la Media Aritmtica (Promedio) b)la Varianza c) la Desviacin Tpica
9 14 18 20 13 14
11 10 10 15 9 15
12 11 10 19 12 12
15 16 12 7 13 13
17 16 14 15 17 11
PASO 1: Sume todos los valores y divida entre el nmero de sumandos:
X = 400 / 30= 13,333...
PASO A REALIZAR
2) Elabore una
Distribucin Agrupada
de frecuencias con
una amplitud de 3
(por ejemplo) para
[Escriba aqu]
INTERVALO
DE CLASE
18 - 20
15 17
12 - 14
9 - 11
6-8
[Escriba aqu]
cada intervalo.
PASO A REALIZAR
3) Agregue la
columna de la
marca de clase
PASO A REALIZAR
4) Agregue la
columna de las
frecuencias y efecte
la sumatoria
PASO A REALIZAR
5) Calculemos la
Media
Aritmtica. Revisa la
leccin
correspondiente a
Media aritmtica de
datos
agrupados
INTERVALO
DE CLASE
18 - 20
15 17
12 14
9 - 11
6-8
INTERVALO
DE CLASE
18 - 20
15 17
12 14
9 - 11
6-8
Xi
19
16
13
10
7
Xi
fi
19
16
13
10
7
3
8
10
7
2
30
INTERVALO
DE CLASE
18 - 20
Xi
fi
Xi*fi
19
57
15 17
12 14
9 - 11
6-8
16
13
10
7
8
10
7
2
128
130
70
14
30
399
X = 399 / 30= 13,3. Observa que el Resultado obtenido difiere del resultado exacto (13.3333...)
Recuerda: Al menos que sea necesario, nunca agrupes para calcular la media aritmtica:
PASO A REALIZAR
6) Construyamos
la columna fi*(x xi)2
INTERVALO
DE CLASE
18 - 20
15 17
12 14
9 - 11
6-8
Xi
fi
Xi*fi
fi*(x xi)2
19
16
13
10
7
3
8
10
7
2
57
128
130
70
14
97,47
58,32
0,9
76,23
79,38
30
399
312,3
[Escriba aqu]
[Escriba aqu]
Dividamos la sumatoria de esta ltima columna entre la sumatoria de f i: s2 = 312,3/30
La Varianza vale s2 = 10,41; Para la Desviacin Tpica (s), sacamos la raz cuadrada de la varianza: La
Desviacin Tpica vale s = 3,2265
EJERCICIOS MEDIDAS DE DISPERSIN PARA RESOLVER
1) La siguiente tabla presenta el tiempo (en minutos) que se demora un fiscalizador del S.I.I en resolver
inconsistencias en los formularios de la declaracin de la Renta.
Intervalo
40 - 45
45 50
50 - 55
55 - 60
60 - 65
65 - 70
70 - 75
75 - 80
Fi
7
10
15
13
18
21
16
10
Fi
3
6
7
7
3
0
4
[Escriba aqu]
Calcule:
a) Varianza, desviacin estndar y coeficiente de dispersin de las notas
b) Cuantifique la simetra en la distribucin de las notas
8) Los ingresos mensuales en miles de pesos de un grupo de personas son los siguientes:
Ingresos
200-250
250-300
300-350
350-400
400-450
450-500
500-550
Fi
2
Fabac
12
22
29
34
3
2,7
4,3
4,5
3,1
3,4
3,9
4,2
4,5
2,5
4,8
1,9
3,6
4,3
2,1
3,6
4,5
1,1
a) Determine la media y la mediana de las notas del curso (3,45 pts.; 3,6pts)
b) El profesor considera que las notas son demasiado bajas y por ello propone elevarlas mediante
la siguiente funcin:
y i 1,2 xi 0,5
Determine el nuevo promedio de notas: (4,64 pts.)
13) La siguiente tabla muestra el salario de 100 trabajadores en miles de pesos
SALARIO
100 110
110 120
120 130
130 140
140 - 150
Fi
8
22
40
18
12
[Escriba aqu]
[Escriba aqu]
14) La siguiente tabla muestra la distribucin de las edades segn el sexo de los trabajadores de una
empresa
EDAD
21 25
25 35
35 45
45 - 60
HOMBRE
MUJER
2
53
60
25
3
60
37
18
a)
b)
c)
d)
e)
El primer intervalo tiene 6 das como extremo superior, una frecuencia relativa de 0,2 y una
amplitud de 4 das.
En el segundo intervalo se acumulan 60 entregas retrasadas.
Las marcas de clases del segundo y cuarto intervalo son 8 y 50 das, respectivamente.
El tercer intervalo presenta una frecuencia de 30 entregas retrasadas y una amplitud de 30 das.
Construya la tabla de distribucin de frecuencia del tiempo de retraso en las entregas.
Cul es el tiempo medio de demora en las entregas?
Calcular la mediana, moda, varianza, desviacin estndar, el coeficiente de variacin
Entre qu valores se encuentra el 50% central del tiempo de retraso en las entregas?
Si descontamos el 15% del tiempo de retraso menos en las entregas y el 15% del tiempo de
retraso mximo en las entregas. En qu intervalo de puntuaciones se encuentran los
restantes?
[Escriba aqu]