Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El análisis de varianza ANOVA es una técnica estadística, cuyo objetivo es comprobar si son iguales
las medias de dos o más poblaciones independientes, mediante el análisis y la comparación varianza
insesgadas de muestras de diversas fuentes, mediante la prueba F de Fisher.
Cada método del análisis la varianza está asociada a un modelo matemático especifico los modelos se
clasifican según el número de variables que han de ser probadas. Si es una variable, el modelo se
denomina de clasificación simple o de un factor, si son dos variables el modelo se denomina de
clasificación doble o de 2 factores.
Sea un “X” una variable aleatoria en “K” poblaciones o tratamientos diferentes, con medias respectivas
𝜇1 , 𝜇2 , … … . 𝜇𝑘 y varianza respectivas 𝜎12 , 𝜎22 , … . 𝜎𝑘2 donde:
a. Los k poblaciones son independientes.
b. Cada población tienen distribución normal , N(𝜇1 , 𝜎12 )
c. Las k varianza son iguales a la varianza común 𝜎 2 (Homocedasticidad)
TRATAMIENTO
1 2 ⋯⋯ i ⋯⋯ k
𝑋11 𝑋21 ⋯⋯ 𝑋𝑖1 ⋯⋯ 𝑋𝑘1
𝑋12 𝑋22 ⋯⋯ 𝑋𝑖2 ⋯⋯ 𝑋𝑘2
⋮ ⋮ ⋮ ⋮
⋮ ⋮ ⋮ ⋮
𝑋1𝑛1 𝑋2𝑛2 ⋯⋯ 𝑋𝑖𝑛𝑖 ⋯⋯ 𝑋𝑘𝑛𝑘
TOTAL 𝑇1 . 𝑇2 . ⋯⋯ 𝑇𝑖 . ⋯⋯ 𝑇𝑘 . 𝑇..
𝑛𝑖 𝑛1 𝑛2 ⋯⋯ 𝑛𝑖 ⋯⋯ 𝑛𝑘 𝑛
MEDIAS 𝑋̅1. 𝑋̅2. ⋯⋯ 𝑋̅𝑖. ⋯⋯ 𝑋̅𝑘. 𝑋̅..
Dónde:
• 𝑋𝑖𝑗 : Es la observación de la muestra
• 𝜇: Media Total
• 𝛼𝑖 : Efecto del i-ésimo tratamiento
• 𝜀𝑖𝑗 : Desviación del dato observado Xij (error o residuo)
𝑆𝐶𝐶
Tratamientos SCC k-1 𝐶𝑀𝑇 =
𝑘−1 𝐶𝑀𝑇
𝑆𝐶𝐸 𝐹𝑐𝑎𝑙 = Regla de decisión:
Error CSE n-k 𝐶𝑀𝐸 = 𝐶𝑀𝐸 𝑝 < 0,05 se rechaza 𝐻0
𝑛−𝑘 𝑝 > 0,05 se acepta 𝐻0
𝐹0 = 𝐹[𝛼, (𝑘 − 1, 𝑛 − 𝑘)𝑔𝑙]
2
𝑛𝑖 𝑇
• 𝑆𝐶𝐶 = ∑𝑘𝑖=1 ∑𝑗=1(𝑋̅𝑖. − 𝑋̅.. )2 = ∑𝑘𝑖=1 𝑖. − 𝐶
𝑛𝑖
4. Región critica
5. Conclusión
Si 𝐹𝑐𝑎𝑙 > 𝐹0 , se rechaza 𝐻0 , caso contrario se acepta la 𝐻0
Práctica 1
El gerente de compras de la empresa MODA desea comparar la velocidad de 4 máquinas de marcas
diferentes con el fin de adquirir la más veloz para su uso en una confección específica. Para esto observó
los tiempos que cada máquina utiliza para producir 6 unidades de la confección en forma aleatoria. Con
un nivel de significancia de 0.05. Es posible concluir que las maquinas utilizan la misma velocidad por
unidad de confección.
M1 M2 M3 M4
55 60 64 42
46 58 62 45
45 68 51 52
73 58 57 44
50 63 65 42
63 52 58 60
Formulación de hipótesis:
Hipótesis nula: Las maquinas utilizan la misma velocidad por unidad de confección (son homogéneas)
Hipótesis alterna: Las maquinas no utilizan la misma velocidad por unidad de confección
M1 M2 M3 M4
55 60 64 42
46 58 62 45
45 68 51 52
73 58 57 44
50 63 65 42
63 52 58 60
𝟑𝟑𝟐𝟐 𝑻𝟐..(𝟏𝟑𝟑𝟑)𝟐
Suma2/n = 𝟏𝟖𝟑𝟕𝟎. 𝟔𝟕 21480.17 21241.50 13537.50 = = 𝟕𝟒𝟎𝟑𝟕. 𝟎𝟒
𝟔 𝒏 𝟐𝟒
𝒌
𝑻𝟐𝒊.
∑ = 𝟕𝟒𝟔𝟐𝟗. 𝟖𝟑
𝒏𝒊
𝒊=𝟏
𝑆𝐶𝐸 𝐶𝑀𝑇
Error 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐶 = 1723.958 − 592.792 = 1131.167 𝑛 − 𝑘 = 20 𝐶𝑀𝐸 = =56.558 𝐹𝑐𝑎𝑙 = =3.494 3.098 0,035 < 0,05
𝑛−𝑘 𝐶𝑀𝐸
𝑘 𝑛𝑖
𝑇..2
Total 𝑆𝐶𝑇 = ∑ ∑ 𝑋𝑖𝑗 2 − = 75761 − 74037.04 = 1723.958 𝑛 − 1 = 23
𝑛
𝑖=1 𝑗=1
0,5
Regla de decisión:
Densidad
Práctica 1
El gerente de compras de la empresa MODA desea comparar la velocidad de 4 máquinas de marcas
diferentes con el fin de adquirir la más veloz para su uso en una confección específica. Para esto observó
los tiempos que cada máquina utiliza para producir 6 unidades de la confección en forma aleatoria. Con
un nivel de significancia de 0.05. Es posible concluir que las maquinas utilizan la misma velocidad por
unidad de confección.
M1 M2 M3 M4
55 60 64 42
46 58 62 45
45 68 51 52
73 58 57 44
50 63 65 42
63 52 58 60
Formulación de hipótesis:
Hipótesis nula: Las maquinas utilizan la misma velocidad por unidad de confección (son homogéneas)
Hipótesis alterna: Las maquinas no utilizan la misma velocidad por unidad de confección
Estadístico de prueba:
Se lleva los datos a una ventana de Excel y en análisis de datos seleccionamos Análisis de varianza de
un factor
ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de Valor crítico
Fcal Probabilidad
variaciones cuadrados libertad los cuadrados para F0
Entre grupos 592,791667 3 197,597222 3,49368892 0,03469183 3,09839121
Región crítica
𝐹0 = 𝐹[𝛼, (𝑘 − 1, 𝑛 − 𝑘)𝑔𝑙] = 𝐹[0,05(3,20)] Cola a la derecha
Gráfica de distribución
F; df1=3; df2=20
0,8
0,7
0,6
0,5
Densidad
0,4
0,3
0,2
0,1
0,05
0,0
0 3,098
X 𝐹𝑐𝑎𝑙 = 3.494
Conclusión:
Como 𝑝 = 0,035 < 0,05 se rechaza la hipótesis nula, es decir Al 95% de confianza se afirma
que, las maquinas no utilizan la misma velocidad por unidad de confección.
Práctica 1
Máquina Velocidad
M1 55
M1 46
M1 45
M1 73
M1 50
M1 63
M2 60
M2 58
M2 68
M2 58
M2 63
SUPUESTOS EN EL ANOVA
NORMALIDAD
Formulación de hipótesis
Hipótesis nula: Los datos tienen el comportamiento de una distribución normal
Hipótesis alterna: Los datos NO tienen el comportamiento de una distribución normal
Regla de decisión
Conclusión
Como p = 0,100 > 0,05 se acepta la hipótesis nula, es decir, los datos tienen el comportamiento de una
distribución normal
Regla de decisión
Si p < 0.05 se rechaza la hipótesis nula
Si p > 0.05 se acepta la hipótesis nula
M1 Valor p 0,325
M2
quina
Má
M3
M4
0 10 20 30 40
Intervalos de confianza de Bonferroni de 95% para Desv.Est.
Conclusión
Como p = 0,325 > 0,05 se acepta la hipótesis nula, es decir, Las varianzas de los tiempos empleados
por maquina son homogéneos
Estadístico de prueba:
Estadísticas → ANOVA → Un solo factor
Región crítica
𝐹0 = 𝐹[𝛼, (𝑘 − 1, 𝑛 − 𝑘)𝑔𝑙] = 𝐹[0,05(3,20)] Cola a la derecha
Gráfica de distribución
F; df1=3; df2=20
0,8
0,7
0,6
0,5
Densidad
0,4
0,3
0,2
0,1
0,05
0,0
0 3,098
X 𝐹𝑐𝑎𝑙 = 3.494
Conclusión:
Como 𝐹𝑐𝑎𝑙 > 𝐹0 se rechaza la hipótesis nula, es decir Al 95% de confianza se afirma que, las
maquinas no utilizan la misma velocidad por unidad de confección.
Como 𝑝 = 0,035 < 0,05 se rechaza la hipótesis nula, es decir Al 95% de confianza se afirma
que, las maquinas no utilizan la misma velocidad por unidad de confección.
Medias
Máquina N Media Desv.Est. IC de 95%
M1 6 55,33 10,89 (48,93; 61,74)
65
60
Velocidad
55
50
45
40
M1 M2 M3 M4
Máquina
La desviación estándar agrupada se utilizó para calcular los intervalos.
Interpretación:
Al 95 % de confianza se afirma que el tiempo promedio que emplea la máquina 1 en producir una unidad
de confección se encuentra entre 48.93 min a 61.74 min, la máquina 2 emplea un tiempo promedio entre
53.43 min a 66.24 min, la máquina 3 emplea un tiempo promedio entre 53.1 min a 65.9 min y la maquina
4 emplea en tiempo promedio entre 41.1 min a 53.9 min.
M3 6 59,50 A B
M1 6 55,33 A B
M4 6 47,50 B
Las medias que no comparten una letra son significativamente diferentes.
Se forman dos grupos homogéneos. Si se desea adquirir la maquina más veloz para el uso de una
confección se recomienda la máquina 4.
Regla de decisión:
𝑝 < 0,05 se rechaza 𝐻0
𝑝 > 0,05 se acepta 𝐻0
Practica 3
Un promotor inmobiliario está considerando invertir en un centro comercial a construirse en Arequipa,
Cusco, Iquitos, Piura, en donde es muy importante el nivel de ingresos mensuales de las familias. Para
resolver este problema se diseñó una prueba de hipótesis de varias medias seleccionando una muestra
aleatoria de ingresos familiares en cada una de las ciudades, obteniéndose los siguientes ingresos en
cientos de dólares.
Ingresos mensuales
Arequipa Cusco Iquitos Piura
61 71 56 50
56 73 61 40
49 66 47 50
55 61 51 50
46 58 50