Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(x − x)
i
2
;
n (x − x)
i i
2
S2 = i =1
S2 = i =1 𝑚 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
n −1 n −1
=
2 i =1
2 = i =1
N N
Datos agrupados
Datos no agrupados
La desviación estándar es la raíz cuadrada positiva de la varianza.
Estadística Descriptiva
Varianza y Desviación estándar
Ejemplo 1: retomemos el ejemplo de la calificación del primer parcial de Fundamentos de
Estadística para una muestra de 8 estudiantes resultó ser:
i
( x − x ) 2
(3,5 − 4,025)2 +(3,9 − 4,025)2 +(4,9 − 4,025)2 … + 2,2 − 4,025 2
S2 = i =1
𝑆2 =
n −1 7
i
( x − x ) 2
(2,5 − 6,24)2
+(3,4 − 6,24)2
+(2,8 − 6,24)2
… + 4,1 − 6,24 2
S2 = i =1 2
𝑆 =
n −1 6
i
( x − x ) 2
(2,5 − 3,0166)2 +(3,4 − 3,0166)2 +. . + 4,1 − 3,0166 2
S2 = i =1 𝑆2 =
5
n −1
𝑆 2 = 0,46166 𝑆= 0,46166 = 0,6794
S = 0,51025 = 0,71432
Estadística Descriptiva
Varianza y Desviación estándar
Ejemplo 5: retomando el ejemplo del grosor de los discos, estimar la desviación estándar e
interpretar el indicador según el contexto del problema.
i ( Li −1 − Li ] Xi ni fi Ni Fi
1 (1,05 - 1,09] 1,07 16 0,08 16 0,08
Sabemos que el promedio resultó ser 1,20785.
2 (1,09 - 1,15] 1,12 20 0,10 36 0,18
3 (1,15 - 1,19] 1,17 36 0,18 72 0,36
El grosor de los discos se dispersa con
4 (1,19 - 1,24] 1,215 64 0,32 136 0,68
respecto al promedio en 0,0682 mm.
5 (1,24 - 1,29] 1,265 42 0,21 178 0,89
6 (1,29 - 1,35] 1,32 22 0,11 200 1,0
Total 200
𝑚
2
σ lj 2 16 ∗ (1,07 − 1,20785)2 + 20 ∗ (1,12 − 1,20785)2 + ⋯ + 22 ∗ (1,32 − 1,20785)2
𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥)
𝑆 = =
𝑛−1 200 − 1
𝑆 2 = 0,00465892 𝑆= 0,00465892 = 0,0682
Estadística Descriptiva
Coeficiente de variación
Por la estructura de la varianza, se sabe que cuando aumenta la dispersión, el valor de la varianza
aumenta, al igual que la desviación estándar.
Solo con la desviación estándar no se puede señalar si los datos están muy dispersos o por el
contrario son muy homogéneos. Para resolver estas preguntas, es necesario recurrir a un indicador
que considere el promedio y la desviación estándar.
Ejemplo 6: la Universidad del Valle sede Palmira cuenta con dos grupos de Fundamentos de
Estadística. El grupo 50 y 51 presentó una desviación estándar de la calificación del primer parcial
de 0,55 y 0,64 puntos respectivamente. ¿Se puede concluir que el grupo 51 presentó una mayor
variabilidad, puesto que su desviación estándar es mayor? Respuesta: Falso
Estadística Descriptiva
Coeficiente de variación
Es necesario definir un indicador de dispersión que involucre la magnitud de los datos. El
Coeficiente de Variación (CV) consiste en expresar la desviación estándar como un porcentaje
de la media aritmética, es decir:
𝜎 𝑆
𝐶𝑉 = ∗100 ; 𝐶𝑉 = ∗ 100 ; 𝑑𝑜𝑛𝑑𝑒 𝑥lj , 𝜇 ≠ 0
𝜇 𝑥lj
El CV es muy útil cuando queremos comparar dos o más medidas de dispersión y están en
unidades diferentes o bien están en las mismas unidades pero sus medias son muy distintas. Su
unidad de medición es porcentaje.
El CV indica el grado de homogeneidad del conjunto de datos. No hay un valor definido que
permita valorar el CV como grande o pequeño.
Estadística Descriptiva
Coeficiente de variación
Ejemplo 6: el Banco de la República requiere de un analista de investigaciones económicas. Para
la selección de la vacante, consideró un total de 40 economistas. La media aritmética de las
puntuaciones obtenidas en una prueba de conocimiento por parte de todos los candidatos fue
de 85 puntos, con una desviación estándar de 18 puntos. En la prueba de agilidad mental, la
media y la desviación estándar es 74 y 16 puntos respectivamente.
18
𝐶𝑉1 = ∗ 100 = 21,17%
85 Presentó una mayor dispersión la prueba agilidad mental, puesto
16 que el CV es mayor.
𝐶𝑉2 = ∗ 100 = 21,62%
74
Estadística Descriptiva
Coeficiente de variación
Ejemplo 7: en los juegos Olímpicos del 2012, el promedio y la desviación estándar en que un
atleta recorre la prueba Reina del atletismo resultó ser 10,15 segundos y 0,12 segundos
respectivamente. Por su parte, en los juegos Olímpicos del 2016, el promedio y la desviación
estándar del tiempo recorrido por un atleta en la misma prueba resultó ser 10,28 segundos y
0,14 segundos respectivamente. ¿Cuál de los dos años presentó una mayor homogeneidad?
𝑋1 = Tiempo que demora un atleta en recorrer la prueba Reina de los juegos Olímpicos del 2012
𝑋2 = Tiempo que demora un atleta en recorrer la prueba Reina de los juegos Olímpicos del 2016
𝜇1 = 10,15 ; 𝝈𝟏 = 0,12 𝜎
𝐶𝑉 = ∗ 100
𝜇2 = 10,28 ; 𝝈2 = 0,14 𝜇
0,12
𝐶𝑉1 = ∗ 100 = 1,182%
10,15 La competición del año 2012 presentó una mayor
0,14 homogeneidad, puesto que su CV resultó ser menor.
𝐶𝑉2 = ∗ 100 = 1,362%
10,28
Estadística Descriptiva
Propiedades de la varianza muestral o poblacional
1. La varianza es siempre no negativa. 𝑆 2 ≥ 0 , esto se desprende de que la varianza es una
suma de cuadrados, multiplicada por una constante, que siempre es positiva.
n m
(x − x)i
2
n (x − x)
i i
2
S2 = i =1
S2 = i =1
n −1 n −1
2
2. La varianza de una constante es cero, es decir: si 𝑥𝑖 = 𝑘 para todo i, entonces: S x = 0
Ejemplo 8: supongamos que la calificación del primer parcial de Fundamentos de estadística
para una muestra de cinco estudiantes resultó ser:
Estudiante Calificación 4,1 + 4,1 + 4,1 + 4,1 + 4,1
𝑥lj = = 4,1
1 4,1 5
2 4,1 (4,1 − 4,1)2 +(4,1 − 4,1)2 +. . + 4,1 − 4,1 2
3 4,1 𝑆2 = =0
4
4 4,1
5 4,1
Estadística Descriptiva
Propiedades de la varianza muestral o poblacional
3. Si a cada uno de los valores de la muestra se le suma una misma constante, la desviación
estándar no cambia. Matemáticamente: si 𝑦𝑖 = 𝑥𝑖 + 𝑘 , entonces: 𝑆𝑦2 = 𝑆𝑥2
Ejemplo 10: por la actual situación económica del país, las utilidades de un determinado Banco
se han disminuido en un 50%. Antes de la crisis, las utilidades en promedio eran de $ 900 mil
millones y la desviación estándar de las utilidades era $ 150 mil millones. Dada la crisis, ¿Cuál es
la nueva varianza de las utilidades?
a) 290 Kwh
b) 270 Kwh
c) 310 Kwh
El coeficiente de variación de una determinada característica en la población A y B resultó ser del 15% y
23% respectivamente. Se puede concluir que la población A presenta una mayor homogeneidad respecto
a la población B
a) Verdadero
b) Falso