Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MEDIAS DE DISPERSION
VARIANZA
La varianza es una medida de variabilidad que utiliza todos los datos.
Esta basada en la diferencia entre los valores de cada observación (xi) y la media. (x para una
muestra, m para una población).
La varianza es el promedio de las diferencias al cuadrado entre cada valor de dato y la media.
Si el conjunto de DATOS ES UNA MUESTRA, la varianza se denota por s2.
( xi x ) 2 2
s2
n 1
CUANDO LOS DATOS SON AGRUPADOS
Si el conjunto de DATOS ES UNA MUESTRA, la varianza es:
s 22
f (X
ii x ))22
ii
n 1
Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza se denota por 2.
( xi ) 2
2
N
CUANDO LOS DATOS SON AGRUPADOS
Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza es:
22
f (X i i ) 22
N
DESVIACION ESTANDAR
s s 22
Si el conjunto de DATOS ES UNA POBLACIÓN, la desviación estándar se denota por
(sigma).
22
COEFICIENTE DE VARIACION
(100)
Mide la variación relativa de la variable con respecto a su promedio.
Cuando deseamos comparar la dispersión de dos distribuciones, necesitamos medir la magnitud
de la desviación estándar en relación con la magnitud de la media
Expresa a la variación de los datos como porcentaje de su promedio.
Coeficiente de
Sesgo
Asimetría
Curtosis
Mide qué tan “puntiaguda” es una distribución, con respecto a la Normal.
La distribución Normal se considera mesocúrtica, es el término medio.
Las distribuciones mas puntiagudas que la Normal se llaman leptocúrticas
Las distribuciones menos puntiagudas que la Normal se conocen como
platocúrticas
Leptocúrtica
Mesocúrtica
Platocúrtica
=3 Mesocúrtica
>3 Leptocúrtica
<3 Platocúrtica
TEOREMA DE CHEBYSHEV
Al menos (1 - 1/k2) de los elementos en un conjunto de datos estará dentro de las k desviaciones
estándar del promedio donde k es cualquier valor mayor que 1.
• Al menos 75% de los elementos deben estar entre k = 2 desviaciones estándar de la
media.
• Al menos 89% de los elementos deben estar entre
k = 3 desviaciones estándar de la media.
Al menos 94% de los elementos deben estar entre
k = 4 desviaciones estándar de la media.
SOLUCIÓN:
La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se
dispone:
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo.
Si ordenamos los datos de mayor a menor observamos la secuencia:
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se
encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez
60, que es el valor de la mediana.
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media
aritmética de la distribución.
Sx2=
S = √ 427,61 = 20.67
80 - 15 = 65 días
El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética
2) EJEMPLO
El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25,
29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadística, más abajo) diagrama de barras
y el diagrama de caja.
SOLUCIÓN:
3) EJERCICIO RESUELTO
Obtener la varianza y desviación estándar de la siguiente muestra, que nos indica el número de cigarros que
son consumidos en promedio al día por un conjunto de 20 encuestados.
Prof. Antonio Caballero
Estadística.
Colegio Nuestra Señora del Pilar
2 4 10 6 0 4 1 0 3 6
10 2 4 2 3 2 5 5 8 0
x
x i
77
3.85
La media es igual a n 20
3.4225 0.0225 37.8225 4.6225 14.8225 0.0225 8.1225 14.8225 0.7225 4.6225
37.8225 3.4225 0.0225 3.4225 0.7225 3.4225 1.3225 1.3225 17.2225 14.8225
x x
2
171.83
8.5915
2 i
S
Por lo que n 20
por lo para determinar la desviación estándar basta con obtener la raíz cuadrada, con lo que finalmente la
desviación estándar es igual a:
S 0.6554 cigarros.
4) EJERCICIO RESUELTO
A continuación se le dan los resultados de una evaluación de Química aplicada a un grupo de alumnos
de 9no grado. Encuentre: a) la Media Aritmética (Promedio) b)la Varianza c) la Desviación Típica
9 14 18 20 13 14
11 10 10 15 9 15
12 11 10 19 12 12
15 16 12 7 13 13
17 16 14 15 17 11
INTERVALO
PASO A REALIZAR
DE CLASE
2) Elabore una 18 - 20
Distribución Agrupada 15 – 17
de frecuencias con 12 - 14
una amplitud de 3 9 - 11
Prof. Antonio Caballero
Estadística.
Colegio Nuestra Señora del Pilar
(por ejemplo) para 6-8
cada intervalo.
INTERVALO
PASO A REALIZAR Xi
DE CLASE
18 - 20 19
3) Agregue la 15 – 17 16
columna de la 12 – 14 13
marca de clase 9 - 11 10
6-8 7
INTERVALO
PASO A REALIZAR Xi fi
DE CLASE
18 - 20 19 3
4) Agregue la 15 – 17 16 8
columna de las 12 – 14 13 10
frecuencias y efectúe 9 - 11 10 7
la sumatoria 6-8 7 2
∑= 30
INTERVALO
PASO A REALIZAR Xi fi Xi*fi
DE CLASE
5) Calculemos la 18 - 20 19 3 57
Media
15 – 17 16 8 128
Aritmética. Revisa la
lección 12 – 14 13 10 130
correspondiente a 9 - 11 10 7 70
Media aritmética de 6-8 7 2 14
datos
agrupados ∑= 30 399
X = 399 / 30= 13,3. Observa que el Resultado obtenido difiere del resultado exacto (13.3333...)
Recuerda: Al menos que sea necesario, nunca agrupes para calcular la media aritmética:
INTERVALO
PASO A REALIZAR Xi fi Xi*fi fi*(x – xi)2
DE CLASE
18 - 20 19 3 57 97,47
15 – 17 16 8 128 58,32
6) Construyamos 12 – 14 13 10 130 0,9
la columna fi*(x – xi)2 9 - 11 10 7 70 76,23
6-8 7 2 14 79,38
∑= 30 399 312,3
Prof. Antonio Caballero
Estadística.
Colegio Nuestra Señora del Pilar
1) La siguiente tabla presenta el tiempo (en minutos) que se demora un fiscalizador del S.I.I en resolver
inconsistencias en los formularios de la declaración de la Renta.
Intervalo Fi
40 - 45 7
45 – 50 10
50 - 55 15
55 - 60 13
60 - 65 18
65 - 70 21
70 - 75 16
75 - 80 10
3) En una empresa donde los salarios por hora tienen una media de $70 y una desviación estándar de
$15, el sindicato solicita que cada salario xi se transforme en yi mediante la siguiente relación.
yi = 1,3xi + 10
El directorio acoge parcialmente la petición, rebajando los salarios resultantes yi en un 10%, lo que es
aceptado por el sindicato. Se pide calcular la media aritmética y la varianza de la distribución final de
los salarios.
6) La siguiente distribución, corresponde a las notas finales obtenidas por un curso de 30 personas en
un curso de estadística:
Xi Fi
1 3
2 6
3 7
4 7
5 3
Prof. Antonio Caballero
Estadística.
Colegio Nuestra Señora del Pilar
6 0
7 4
Calcule:
a) Varianza, desviación estándar y coeficiente de dispersión de las notas
b) Cuantifique la simetría en la distribución de las notas
8) Los ingresos mensuales en miles de pesos de un grupo de personas son los siguientes:
Ingresos Fi Fabac
200-250 2
250-300
300-350 12 22
350-400 29
400-450 34
450-500 4
500-550
12) La siguiente tabla presenta las notas obtenidas en una prueba por un curso de 20 personas
a) Determine la media y la mediana de las notas del curso (3,45 pts.; 3,6pts)
b) El profesor considera que las notas son demasiado bajas y por ello propone elevarlas mediante
la siguiente función:
yi 1,2 xi 0,5
SALARIO Fi
100 – 110 8
110 – 120 22
120 – 130 40
130 – 140 18
140 - 150 12
HOMBRE MUJER
EDAD
21 – 25 2 3
25 – 35 53 60
35 – 45 60 37
45 - 60 25 18
15) En una clase hay 35 estudiantes varones con una edad media de 17. 5 años y 15 estudiantes
mujeres las que en promedio son 12% más Jóvenes. ¿Cuál es la edad media de la clase?
16) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar que
ambos conjuntos de números tienen la misma desviación típica pero diferentes medias ¿Cómo están
relacionadas las medias?
17) El retraso en la entrega de los últimos 100 pedidos de material informático en una empresa se ha
agrupado en 4 intervalos, recordándose solo los siguientes datos de la distribución:
El primer intervalo tiene 6 días como extremo superior, una frecuencia relativa de 0,2 y una
amplitud de 4 días.
En el segundo intervalo se acumulan 60 entregas retrasadas.
Las marcas de clases del segundo y cuarto intervalo son 8 y 50 días, respectivamente.
El tercer intervalo presenta una frecuencia de 30 entregas retrasadas y una amplitud de 30 días.