Documentos de Académico
Documentos de Profesional
Documentos de Cultura
▪ Gráfico de cajas
LOGRO DELTEMA
1 Introducción
2 Medidas de variabilidad
3 Gráfico de cajas
4 Conclusiones
5 Referencias
1. Introducción
2.1. Varianza
2 1 𝑁 2 2 σ𝑁 2
𝑖=1 𝑋𝑖
La varianza para una población: 𝜎 = σ
𝑁 𝑖=1
𝑋𝑖 − 𝜇 𝜎 = − 𝜇2
𝑁
1
La varianza de la muestra se calcula como: 𝑆2 =
1
σ𝑛𝑖=1 𝑋𝑖 − 𝑥ҧ 2
2
𝑆 = σ𝑛𝑖=1 𝑋𝑖2 − 𝑛𝑥ҧ 2
𝑛−1
𝑛−1
2.1. Varianza
Ejemplo 1. Una empresa cuenta en total con 5 trabajadores, a ellos se les pregunta sobre su sueldo (en soles), los resultados se
muestran a continuación:
σ𝑁
𝑖=1 𝑋𝑖 𝜇=
700 + 600 + 850 + 800 + 755 3705
= = 741 soles
𝜇= 5 5
𝑁
1
𝜎 2 = σ𝑁
𝑖=1 𝑋𝑖 − 𝜇
2
𝑁
1 37120
𝜎2 = −41 2 + −141 2 + 109 2 + 59 2 + 14 2 = = 7424
5 5
𝜎 2 =7424 𝑠𝑜𝑙𝑒𝑠2
2.1. Varianza
Ejemplo 1. Una empresa cuenta en total con 5 trabajadores, a ellos se les pregunta sobre su sueldo (en soles), los resultados se
muestran a continuación:
σ𝑁 2
𝑖=1 𝑋𝑖 2782525
𝜎2 = − 𝜇2 𝜎2 = − 7412
𝑁 5
𝜎 2 = 7424 𝑠𝑜𝑙𝑒𝑠2
2.1. Varianza
Ejemplo 2. De una empresa con un gran número de trabajadores se selecciona por sorteo una muestra de 5 trabajadores, a ellos se les
pregunta sobre su sueldo (en soles), los resultados se muestran a continuación:
σ𝑛
𝑖=1 𝑋𝑖
𝑥ҧ = 𝑛
Xത =
700 + 600 + 850 + 800 + 755 3705
= = 741 𝑠𝑜𝑙𝑒𝑠
5 5
1 1
𝑆2 = σ𝑛𝑖=1 𝑋𝑖 − 𝑥ҧ 2 𝑆2 =
4
700 − 741 2 + 600 − 741 2 + 850 − 741 2 + 800 − 741 2 + 755 − 741 2
𝑛−1
1 37120
𝑆2 = −41 2 + −141 2 + 109 2 + 59 2 + 14 2 = = 9280
4 4
𝑆 2 =9280 𝑆𝑜𝑙𝑒𝑠2
2.1. Varianza
Ejemplo 2. De una empresa con un gran número de trabajadores se selecciona por sorteo una muestra de 5 trabajadores, a ellos se les
pregunta sobre su sueldo (en soles), los resultados se muestran a continuación:
1 1
𝑆2 = σ𝑛𝑖=1 𝑋𝑖2 − 𝑛𝑥ҧ 2 𝑆2 =
=
4
{(7002 + 6002 + 8502 + 8002 + 7552) – (5*7412)}
𝑛−1
37120
𝑆2 = = 9280
4
𝑆 2 =9280 𝑆𝑜𝑙𝑒𝑠2
2.2. Desviación estándar
Ejemplo 3. Para evaluar el rendimiento de una máquina que produce repuestos se realizó 30 pruebas en diferentes
condiciones, anotando la cantidad de repuestos que se produce por hora, se encontraron los siguientes resultados:
29 33 34 34 35 36 37 39 40 40
41 45 46 47 49 50 50 51 52 54
58 62 63 64 78 80 83 85 89 92
σ𝑛
𝑖=1 𝑋𝑖 1596 𝑋𝑖 = 1596 𝑋𝑖2 = 94762
𝑥ҧ = 𝑛
=
30
= 53.2
𝑖=1 𝑖=1
1 1 𝑺𝟐
𝑆2 = σ𝑛𝑖=1 𝑋𝑖2 − 𝑛𝑥ҧ 2 = 94762 − 30(53.22) = 339.8207 𝑺=
𝑛−1 29
𝑆= 339.8207 = 18.4342
Es una medida de dispersión relativa que proporciona información sobre la variabilidad de los datos sin considerar sus unidades.
Ejemplo 4. Para evaluar el rendimiento de una máquina que produce repuestos se realizó 30 pruebas en diferentes
condiciones, anotando la cantidad de repuestos que se produce por hora, se encontraron los siguientes resultados:
29 33 34 34 35 36 37 39 40 40
41 45 46 47 49 50 50 51 52 54
58 62 63 64 78 80 83 85 89 92
σ𝒏
𝒊=𝟏 𝑿𝒊 1596 𝑋𝑖 = 1596 𝑋𝑖2 = 94762
ഥ
𝒙= =
30
= 53.2
𝑖=1 𝑖=1
𝒏
𝟏 1 𝑺= 𝑺𝟐
𝟐
𝑺 = σ𝒏𝒊=𝟏 𝑿𝟐𝒊 − 𝒏ഥ
𝒙 𝟐 = 94762 − 30(53.22) = 339.8207
𝒏−𝟏 29
𝑆= 339.8207 = 18.4342
𝑺
𝑪𝑽% = * 100 = 18.4342
ഥ
𝒙 53.2
* 100 = 34.64%
2.3. Coeficiente de variación
Ejemplo 5. Con el fin de analizar la variabilidad de los sueldos de los trabajadores de tres zonas del Perú, se seleccionó
mediante un muestreo estratificado, se escogió información de cada zona encontrando la siguiente información:
87600
𝐶𝑉3 = = 16.44%
1800
2.3. Coeficiente de variación
Ejemplo 5. Con el fin de analizar la variabilidad de los sueldos de los trabajadores de tres zonas del Perú, se seleccionó mediante un
muestreo estratificado, se escogió información de cada zona encontrando la siguiente información:
𝑆
𝑺= 𝑺𝟐 𝐶𝑉% = 𝑥ҧ * 100
87600 454000
649000 𝐶𝑉2 = = 14.34%
𝐶𝑉1 = = 13.65% 𝐶𝑉3 = = 16.44%
5900 1800 4700
Propiedad 1
Ejemplo 6. En una investigación sobre tiempo que se requiere para terminar un trabajo se seleccionó una muestra de 500 datos,
encontrando las siguientes medidas de resumen:
_
𝑋 = 53.2 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑆 2 = 18.1476 𝑚𝑖𝑛𝑢𝑡𝑜𝑠2 𝑦 𝑆 = 4.26
Un ajuste en la lectura de los 500 datos, originó un aumento de 10 minutos en cada dato. ¿Cuáles son las nuevas medidas de
resumen?_
𝑋 = 53.2 + 10
_
𝑋 = 63.2 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑆 2 = 18.1476 𝑚𝑖𝑛𝑢𝑡𝑜𝑠2 𝑦 𝑆 = 4.26
2.3. Coeficiente de variación
Propiedad 2
Si a los datos de la investigación se les multiplica o divide por una constante, se cumple:
Ejemplo 7. En una investigación sobre tiempo que se requiere para terminar un trabajo se seleccionó una muestra de 500 datos,
encontrando las siguientes medidas de resumen:
_
𝑋 = 53.2 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑆 2 = 18.1476 𝑚𝑖𝑛𝑢𝑡𝑜𝑠2 𝑦 𝑆 = 4.26
Un ajuste en la lectura de los 500 datos, origino un aumento del 15% en cada dato ¿Cuáles son las nuevas medidas de resumen?
_
𝑋 = 1.15 53.2 = 61.18 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑆 2 = 1.152 18.1476 = 24.0002 𝑚𝑖𝑛𝑢𝑡𝑜𝑠2 𝑆 = 1.15 (4.26) = 4.899 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
3. Gráfico de cajas
4. Calcular los límites Q1-1.5RI y Q3 +1.5RI, todos los datos que quedan
fuera del intervalo [Q1-1.5RI; Q3 +1.5RI ] los debemos identificar como
valores discordantes.
Ejemplo 8. El gerente de la oficina de Control de Calidad de un Banco, está preocupado por el tiempo de espera de los clientes en sus
agencias, por ello selecciona una muestra aleatoria de clientes de cada agencia y se les pregunta sobre el tiempo de espera desde el
momento que llegó al banco hasta el momento que se le atendió en la ventanilla. Los datos captados fueron graficados a continuación:
70
60
Tiempo de espera (en minutos)
50
a. ¿Qué agencia presenta datos simétricos?
40
b. ¿Qué representan los asteriscos de la agencia 2?
30
c. ¿Qué asimetría presenta el 50% central de los
20
datos de la agencia 3?
10
50
30
c. ¿Qué asimetría presenta el 50% central de los datos
de la agencia 3? 20
10
Como la mediana está más cerca al Q3, se identifica
una distribución asimétrica negativa. 0
Agencia 1 Agencia 2 Agencia 3
Fórmulas
Varianza muestral
Varianza poblacional
1 1
𝜎 2 = 𝑁 σ𝑁
𝑖=1 𝑋𝑖 − 𝜇
2
𝑆 2 = 𝑛−1 σ𝑛𝑖=1 𝑋𝑖 − 𝑥ҧ 2
σ𝑁 2 1
𝜎2 = 𝑖=1 𝑋𝑖
− 𝜇2 𝑆 2 = 𝑛−1 σ𝑛𝑖=1 𝑋𝑖2 − 𝑛𝑥ҧ 2
𝑁
𝜎= 𝜎2 S= 𝑆 2
Coeficiente de variación
𝑆
𝐶𝑉% = 𝑥ҧ * 100 𝑒𝑥𝑝𝑟𝑒𝑠𝑎𝑑𝑜 𝑒𝑛 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒
4. Conclusiones
Montesinos L., Bayona Y., Cerna E., Llanos K. & Pajuelo S (2016). Estadística
Descriptiva y Probabilidad: Enfoque por competencias. (2a. ed.). Universidad San
Ignacio de Loyola. https://www.ebooks7-24.com:443/?il=10149