Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística I
Ciclo I 2022
𝑥 6 3 8 5 3
𝑥 − 𝑥ҧ 1 2 3 0 2
σ 𝑥−𝑥 8
𝐷𝑀 = = = 1.6 es la distancia promedio que está cada
𝑛 5
dato respecto a la media de 5
Varianza
Es el promedio de los cuadrados de las diferencias entre los
valores de los datos y la media.
Tiene ciertas propiedades matemáticas que la hacen útil en
otras aplicaciones estadísticas. Sin embargo, interpretar la
varianza como el promedio de los cuadrados de las diferencias
no es útil como medida descriptiva. La varianza es difícil de
interpretar debido a las unidades.
La ecuación para la varianza poblacional es
2 σ 𝑥−𝜇 2
𝜎 = donde
𝑁
𝜎 2 es la varianza poblacional
x valores de la población
𝜇 media poblacional
N número de observaciones en la población
Varianza
σ 𝑥−𝑥 2
La ecuación para la varianza muestral es 𝑠2 = donde
𝑛−1
𝑠 2 varianza muestral
𝑠 desviación estándar de la muestra
𝑥 valores de la muestra
𝑥 media muestral
𝑛 numero de observaciones en la muestra
También se usa la ecuación siguiente para la varianza muestral
2 σ𝑥 2
σ𝑥 −
2
𝑠 = 𝑛
𝑛−1
Fórmula de la varianza poblacional
2 σ𝑥 2
σ𝑥 −
𝜎2 = 𝑁
𝑁
Varianza - Ejemplo
Se presenta una población de cinco edades. ¿Qué pasa con la
variabilidad de los datos? 20, 30, 40, 50, 60
Solución
x = 200, (x-)=0 (x-)2=1000
x 𝑥−𝜇 (𝑥 − 𝜇)2 Media = =200/5=40
20 -20 400 Varianza= σ2=1000/5=200
30 -10 100
Desviación estándar=σ= 200 =14.14
40 0 0
Este valor de 14.14 indica que
50 10 100 hay poca dispersión de los datos
60 20 400 respecto a su media, significa
que la cantidad típica en la que
200 0 1000
los valores del arreglo difieren
de su media (40) es de alrededor
de 14.14
Desviación estándar
Mide la cantidad típica en la que los valores del conjunto de
datos difieren de la media. La desviación estándar se usa en
general para describir el grado en el que un conjunto de datos
se dispersa alrededor de su media. Una desviación estándar
pequeña significa que los valores del conjunto tienden a estar
muy cerca de la media. Una desviación estándar grande indica
que los valores del conjunto se encuentran ampliamente
dispersos alrededor de la media.
La desviación estándar está en las mismas unidades que los datos.
La desviación estándar se calcula obteniendo la raíz cuadrada de
la varianza, 𝜎 = 𝜎 2
La ecuación para la desviación estándar poblacional es
σ 𝑥−𝜇 2
𝜎=
𝑁
Desviación estándar
La ecuación para la desviación estándar muestral es
σ 𝑥−𝑥 2
𝑠=
𝑛−1
σ 𝑓𝑥 2
σ 𝑓𝑥 2 −
𝑠= 𝑛
donde s es la desviación estándar muestral
𝑛−1
x f σ 𝑓 𝑥−𝑥ҧ 2
Al usar la fórmula 𝑠 = se tiene que determinar
𝑛−1
0 3 la media y las desviaciones al cuadrado multiplicadas por
la frecuencia
1 2
4 5
6 4
Desviación estándar
Desviación estándar muestral para datos agrupados en una
distribución de clases y frecuencias
σ 𝑓. 𝑃 2
σ 2] − 𝑚
σ 𝑓 𝑃𝑚 − 𝑥ҧ 2 [𝑓. (𝑃𝑚 )
𝑠= = 𝑛
𝑛−1 𝑛−1
Desviación estándar poblacional para datos agrupados en una
distribución de clases y frecuencias
σ 𝑓 𝑃𝑚 − 𝜇 2
𝜎=
𝑁
Ejercicio
Calcular la Desviación estándar muestral para las calificaciones
promedio de 30 estudiantes de primer año de una universidad,
registradas al final del año.
Clases Frecuencia
1.9 a 2.2 5 Usar la fórmula
2.2 a 2.5 4 σ 𝑓.𝑃𝑚 2
σ 𝑓.(𝑃𝑚 2 ]−
2.5 a 2.8 12 S=
𝑛
𝑛−1
2.8 a 3.1 6
3.1 a 3.4 2
3.4 a 3.7 1
Total 30
Cálculo de la varianza y la desviación estándar
utilizando datos agrupados
Interpretación y uso de la desviación estándar
La desviación estándar se emplea como una medida para
comparar la dispersión de dos o más conjuntos de
observaciones.
La desviación estándar nos permite determinar, con un buen
grado de dispersión, donde están localizados los valores de
una distribución de frecuencias con relación a la media.
Comparación de la variación en
diferentes poblaciones
Anteriormente afirmamos que, como las unidades de la desviación estándar
son las mismas que las unidades de los datos originales, es más fácil
comprender la desviación estándar que la varianza. Sin embargo, esta misma
propiedad dificulta comparar la variación de valores tomados de distintas
poblaciones. Como el resultado es un valor libre de unidades de medida
específicas, el coeficiente de variación resuelve esta desventaja.
Dispersión relativa: Coeficiente de variación (CV)
Una comparación de dos o más medidas de dispersión-
digamos la desviación estándar de una distribución de
ingresos anuales y la desviación estándar de una distribución
de ausentismo del mismo grupo de empleados- es imposible.
¿podemos decir que la desviación estándar $1200 de la
distribución de ingresos sea mayor que la desviación
estándar 4.5 días de la distribución del ausentismo?
Obviamente no, porque no podemos comparar directamente
dólares y días de ausencia en el trabajo.
Para hacer una comparación entre la dispersión de los
ingresos y ausentismo, podemos convertir cada una de estas
medidas en un valor relativo-esto es, en un por ciento-. Esa
medida relativa es el coeficiente de variación (CV),
desarrollada por Karl Pearson.
Dispersión relativa: Coeficiente de variación (CV)
El coeficiente de variación para un conjunto de datos expresa la desviación
estándar como un porcentaje de la media.
El coeficiente de variación indica la cantidad relativa de variabilidad en una
distribución.
En la toma de decisiones se usa el coeficiente de variación para:
1. Determinar la fiabilidad de la media como medida de tendencia central
2. Determinar si la desviación estándar es grande, pequeña o regular
3. Comparar la variabilidad de dos o más distribuciones
¿Cuándo se usa el coeficiente de variación?
- Cuando los datos están en unidades diferentes (ej. Dólares y días de
ausencia)
- Cuando los datos están en las mismas unidades, pero las medias son muy
distintas (ej. Ingresos de ejecutivos de alto nivel y los ingresos de los
empleados no calificados)
Coeficiente de variación (CV) - Ejemplo
En un estudio de las puntuaciones en un examen de un curso en la
empresa sobre principios de administración, y de los años de servicio de
los empleados en el curso, se obtuvieron estos estadísticos. La
puntuación media fue 200; la desviación estándar fue 40. El número
medio de años de servicio fue 20 años; la desviación estándar fue 2 años.
Compara la dispersión relativa en las dos distribuciones usando el
coeficiente de variación.
Solución
Las distribuciones tienen unidades diferentes (puntuación de examen y
años de servicio)
Interpretación
Para las puntuaciones de Para los años de servicio
Hay más dispersión relativa a
examen 𝑠
𝑠
𝐶𝑉 = 100 la media en la distribución de
𝑥
𝐶𝑉 = 100 las puntuaciones de exámenes
𝑥
40 2 que en la distribución de los
= 100 = 100
200 20 años de servicio (20% >
= 20% = 10% 10%)
Coeficiente de variación (CV) - Ejemplo
La variación en los ingresos anuales de ejecutivos se va a comparar con la
variación en los ingresos anuales de empleados no calificados. En una muestra
de ejecutivos, 𝑥 = $500000 y 𝑠 = $50000. En una muestra de empleados no
calificados, 𝑥 = $22000 y 𝑠 = $2200. Estamos tentados a decir que hay mayor
dispersión en los ingresos anuales de los ejecutivos porque $500000 > $2200.
Sin embargo, las medias son tan diferentes que necesitamos convertir los
estadísticos en coeficientes de variación para poder hacer una comparación
de las variaciones en los ingresos anuales.
Solución
Para los ejecutivos se Para los empleados no Interpretación
tiene: calificados No hay diferencia en
𝑠 𝑠
𝐶𝑉 = 100 𝐶𝑉 = 100
las dispersiones
𝑥 𝑥 relativas de los dos
50000 2200
= 100 = 100 grupos.
500000 22000
= 10% = 10%