Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EDI S2 Tema 2
EDI S2 Tema 2
1 Introducción
2 Medidas de variabilidad
3 Gráfico de cajas
4 Conclusiones
5 Referencias
1. Introducción
2.1. Varianza
𝑁
1
2 2
La varianza para una población: 𝜎 = 𝑋𝑖 − 𝜇
𝑁
𝑖=1
𝑁
1 _ 2
La varianza de la muestra se calcula como:
𝑆2 = 𝑋𝑖 − 𝑋
𝑛−1
𝑖=1
2.1. Varianza
Ejemplo 1. Una empresa cuenta en total con 5 trabajadores, a ellos se les pregunta sobre su sueldo (en soles), los resultados se
muestran a continuación:
1 37120
𝜎2 = −41 2
+ −141 2
+ 109 2
+ 59 2
+ 14 2
= = 7424
5 5
𝜎 2 =7424
2.1. Varianza
Ejemplo 1. Una empresa cuenta en total con 5 trabajadores, a ellos se les pregunta sobre su sueldo (en soles), los resultados se
muestran a continuación:
37120
𝜎2 = = 7424𝑠𝑜𝑙𝑒𝑠 2
5
𝜎 2 =7424 𝑠𝑜𝑙𝑒𝑠 2
2.1. Varianza
Ejemplo 2. De una empresa con un gran número de trabajadores se selecciona por sorteo una muestra de 5 trabajadores, a ellos se les
pregunta sobre su sueldo (en soles), los resultados se muestran a continuación:
1 37120
𝑆2 = −41 2 + −141 2 + 109 2 + 59 2 + 14 2 = = 9280
4 4
𝑆 2 =9280 𝑆𝑜𝑙𝑒𝑠 2
2.1. Varianza
Ejemplo 2. De una empresa con un gran número de trabajadores se selecciona por sorteo una muestra de 5 trabajadores, a ellos se les
pregunta sobre su sueldo (en soles), los resultados se muestran a continuación:
37120
𝑆2 = = 9280 𝑠𝑜𝑙𝑒𝑠 2
4
𝑆 2 =9280 𝑆𝑜𝑙𝑒𝑠 2
2.2. Desviación estándar
Ejemplo 3. Para evaluar el rendimiento de una máquina que produce repuestos se realizó 30 pruebas en diferentes
condiciones, anotando la cantidad de repuestos que se produce por hora, se encontraron los siguientes resultados:
29 33 34 34 35 36 37 39 40 40
41 45 46 47 49 50 50 51 52 54
58 62 63 64 78 80 83 85 89 92
Es una medida de dispersión relativa que proporciona información sobre la variabilidad de los datos sin considerar sus unidades.
𝑆
𝐶𝑉 = _ 𝑒𝑥𝑝𝑟𝑒𝑠𝑎𝑑𝑜 𝑒𝑛 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒
𝑋
Forma de interpretar:
Ejemplo 4. Para evaluar el rendimiento de una máquina que produce repuestos, se realizó 30 pruebas en diferentes
condiciones, anotando la cantidad de repuestos que se produce por hora, se encontraron los siguientes resultados:
29 33 34 34 35 36 37 39 40 40
41 45 46 47 49 50 50 51 52 54
58 62 63 64 78 80 83 85 89 92
18.43
CV= = 34.64%
53.2
2.3. Coeficiente de variación
Ejemplo 5. Con el fin de analizar la variabilidad de los sueldos de los trabajadores de tres zonas del Perú, se seleccionó
mediante un muestreo estratificado, se escogió información de cada zona encontrando la siguiente información:
649000 454000
𝐶𝑉1 = = 13.65% 𝐶𝑉2 = = 14.34%
5900 4700
87600
𝐶𝑉3 = = 16.44%
1800
2.3. Coeficiente de variación
Ejemplo 5. Con el fin de analizar la variabilidad de los sueldos de los trabajadores de tres zonas del Perú, se seleccionó mediante un
muestreo estratificado, se escogió información de cada zona encontrando la siguiente información:
Propiedad 1
Ejemplo 6. En una investigación sobre tiempo que se requiere para terminar un trabajo se seleccionó una muestra de 500 datos,
encontrando las siguientes medidas de resumen:
_
𝑋 = 53.2 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑆 2 = 18.1476 𝑚𝑖𝑛𝑢𝑡𝑜𝑠2 𝑦 𝑆 = 4.26
Un ajuste en la lectura de los 500 datos, originó un aumento de 10 minutos en cada dato. ¿Cuáles son las nuevas medidas de
resumen?
_
𝑋 = 63.2 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑆 2 = 18.1476 𝑚𝑖𝑛𝑢𝑡𝑜𝑠2 𝑦 𝑆 = 4.26
2.3. Coeficiente de variación
Propiedad 2
Si a los datos de la investigación se les multiplica o divide por una constante, se cumple:
Ejemplo 7. En una investigación sobre tiempo que se requiere para terminar un trabajo se seleccionó una muestra de 500 datos,
encontrando las siguientes medidas de resumen:
_
𝑋 = 53.2 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑆 2 = 18.1476 𝑚𝑖𝑛𝑢𝑡𝑜𝑠2 𝑦 𝑆 = 4.26
Un ajuste en la lectura de los 500 datos, origino un aumento del 15% en cada dato ¿Cuáles son las nuevas medidas de resumen?
_
𝑋 = 1.15 63.2 = 72.68 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑆 2 = 1.152 18.1476 = 24.0002 𝑚𝑖𝑛𝑢𝑡𝑜𝑠2
4. Calcular los límites Q1-1.5RI y Q3 +1.5RI, todos los datos que quedan
fuera del intervalo [Q1-1.5RI; Q3 +1.5RI ] los debemos identificar como
valores discordantes.
Ejemplo 8. El gerente de la oficina de Control de Calidad de un Banco, está preocupado por el tiempo de espera de los clientes en sus
agencias, por ello selecciona una muestra aleatoria de clientes de cada agencia y se les pregunta sobre el tiempo de espera desde el
momento que llegó al banco hasta el momento que se le atendió en la ventanilla. Los datos captados fueron graficados a
continuación:
60
Tiempo de espera (en minutos)
50
40
30
20
10
0
Agencia 1 Agencia 2 Agencia 3
3. Gráfico de cajas
30
b. ¿Qué asimetría presenta el 50% central de los datos
de la agencia 3? 20
10
Como la mediana está más cerca al Q3, se identifica
0
una distribución asimétrica negativa.
Agencia 1 Agencia 2 Agencia 3
3. Gráfico de cajas
3.1. Fórmulas
𝑁 𝑁
2
1 2 2
1 _ 2
𝜎 = 𝑋𝑖 − 𝜇 𝑆 = 𝑋𝑖 − 𝑋
𝑁 𝑛−1
𝑖=1 𝑖=1
𝜎= 𝜎2 S= 𝑆 2
Coeficiente de variación
𝑆
𝐶𝑉 = _ 𝑒𝑥𝑝𝑟𝑒𝑠𝑎𝑑𝑜 𝑒𝑛 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒
𝑋
4. Conclusiones