Está en la página 1de 12

Unidad 2.

Diseño y análisis de experimentos 100


Análisis de varianza de dos factores

Bibliografía
• Montgomery, D. y Runger, G. (2005) Probabilidad y estadística aplicadas a la ingeniería. México, D.F.:
Limusa Wiley. Capítulo 13. Sección 13.1 y 13.4
• Triola, M. (2013). Estadística. 11va. Edición. Pearson Educación, México, D.F. Capítulo 12. Sección 12.3 y
12.4.

El análisis de varianza (ANOVA) de dos factores es una técnica estadística utilizada para analizar la influencia
de dos factores en una variable de interés. Los dos factores pueden ser cualquier cosa que se desee investigar,
como tratamientos diferentes, temperaturas, grupo de edad, ciudad de residencia, etc.

El ANOVA de dos factores permite examinar el efecto de cada factor individualmente, así como el efecto de la
interacción entre los dos factores. La interacción entre los factores se refiere a si el efecto de un factor varía
según el nivel del otro factor.

Hipótesis inicial en un diseño factorial

𝐻0 ≔ No existe interacción entre los niveles de los factores sobre la variable respuesta
𝐻1 ≔ Existe interacción entre los niveles de los factores sobre la variable respuesta

Analizar los efectos de cada


¿Se rechaza H0? No
factor por separado

Si

Prueba de comparación por


pares para la interacción

Para obtener el valor del estadístico de prueba, se debe elaborar la tabla del ANOVA.

Fuente de Grados de Suma de Cuadrado


Fcal
variación libertad cuadrados medio

𝐶𝑀(𝐴)
𝐴 𝑎−1 𝑆𝐶(𝐴) 𝐶𝑀(𝐴)
𝐶𝑀𝐸
𝐶𝑀(𝐵)
𝐵 𝑏−1 𝑆𝐶(𝐵) 𝐶𝑀(𝐵)
𝐶𝑀𝐸
𝐶𝑀(𝐴𝐵)
𝐴𝐵 (𝑎 − 1)(𝑏 − 1) 𝑆𝐶(𝐴𝐵) 𝐶𝑀(𝐴𝐵)
𝐶𝑀𝐸
Error 𝑎𝑏(𝑛– 1) 𝑆𝐶𝐸 𝐶𝑀𝐸

Total 𝑎𝑏𝑛 − 1 𝑆𝐶𝑇


Estadística Aplicada II 202301 101

Fuente de Grados de Cuadrado


Suma de cuadrados Fcalculado Fcrítico
variación libertad medio
𝑎
1 2 𝑦…2 𝑆𝐶(𝐴) 𝐶𝑀(𝐴)
Factor A 𝑎– 1 ∑ 𝑦𝑖.. − 𝐹𝛼;𝑎−1;𝑎𝑏(𝑛−1)
𝑏𝑛 𝑎𝑏𝑛 𝑎−1 𝐶𝑀𝐸
𝑖=1

𝑏
1 2 𝑦…2 𝑆𝐶(𝐵) 𝐶𝑀(𝐵)
Factor B 𝑏– 1 ∑ 𝑦.𝑗. − 𝐹𝛼;𝑏−1;𝑎𝑏(𝑛−1)
𝑎𝑛 𝑎𝑏𝑛 𝑏−1 𝐶𝑀𝐸
𝑗=1

𝑎 𝑏
1 2 𝑦…2
Interacción ∑ ∑ 𝑦𝑖𝑗. − 𝑆𝐶(𝐴𝐵) 𝐶𝑀(𝐴𝐵)
(𝑎– 1)(𝑏– 1) 𝑛 𝑎𝑏𝑛 𝐹𝛼;(𝑎−1)(𝑏−1);𝑎𝑏(𝑛−1)
AxB 𝑖=1 𝑗=1 (𝑎 − 1)(𝑏 − 1) 𝐶𝑀𝐸
𝑆𝐶(𝑆𝑢𝑏𝑡𝑜𝑡𝑎𝑙𝑒𝑠) – 𝑆𝐶𝐴 − 𝑆𝐶𝐵

𝑆𝐶𝐸
Error 𝑎𝑏(𝑛– 1) 𝑆𝐶𝑇 – 𝑆𝐶(𝐴) – 𝑆𝐶(𝐵) – 𝑆𝐶(𝐴𝐵)
𝑎𝑏(𝑛 − 1)
𝑎 𝑏 𝑛
2 𝑦…2
Total 𝑎𝑏𝑛– 1 ∑ ∑ ∑ 𝑦𝑖𝑗𝑘 −
𝑎𝑏𝑛
𝑖=1 𝑗=1 𝑘=1
Unidad 2. Diseño y análisis de experimentos 102

Ejercicios

36. La pregunta de investigación es: ¿Qué factores influyen en la mayor conservación del queso?

a. A partir de revisar el siguiente video sobre la conservación de queso: Trucos para conservar quesos

b. Discuta con sus compañeros e indique al menos dos factores que puede incluirse en la hipótesis de
investigación.

c. Complete los elementos del diseño experimental.

Factor A Método de conservación

Niveles del factor A Envase plástico, Papel aluminio, Papel de horno. |a = 3

Factor B Tipo de queso

Niveles del factor B Fresco, Curado, Tierno. |b = 3

Fresco – Envase plástico, Fresco – Papel aluminio, Fresco – Papel de


horno, Curado – Envase plástico, Curado – Papel aluminio, Curado –
Tratamientos
Papel de horno, Tierno – Envase plástico, Tierno – Papel aluminio,
Tierno – Papel de horno.

Número de tratamientos axb = 9 tratamientos.

Variable respuesta Tiempo de conservación del queso.

Unidad experimental Un trozo de queso.

Modelo matemático
H1: Existe interacción entre los niveles de los factores sobre la
Hipótesis estadística
variable respuesta.
H1: Existe interacción de los métodos de conservación y los tipos de
H1:
queso sobre el tiempo de conservación del queso.
Estadística Aplicada II 202301 103
37. Un ingeniero sospecha que el tipo de pintura tapa poros y el método de
aplicación afectan el tiempo de duración de la pintura de las piezas de las
aeronaves. Él está interesado en determinar si algún tipo de pintura con algún
nivel del método de aplicación influyen en el tiempo de duración de la pintura
de las piezas de las aeronaves. Idea dos experimentos, obteniendo las
siguientes gráficas.

¿En cuál de las gráficas se logra apreciar el interés del ingeniero?

Se puede presentar cualesquiera de las dos situaciones siguientes:

Sin interacción Con interacción

Para cualesquiera de los métodos de aplicación Para el método de aplicación T1 y T2 la pintura


que se use, el tipo de pintura P1 sería la que P2, obtiene la mayor duración; mientras para T3
presenta mayor tiempo de duración. la pintura P1 obtiene la mayor duración.

Hipótesis inicial en un diseño factorial

𝐻0 : No existe interacción entre los niveles de los factores sobre la variable respuesta
𝐻1 : Existe interacción entre los niveles de los factores sobre la variable respuesta

Analizar los efectos de cada


¿Se rechaza H0? No
factor por separado

Si

Prueba de comparación por


pares para la interacción
Unidad 2. Diseño y análisis de experimentos 104
Ejemplo 17
Se lleva a cabo un experimento para estudiar el efecto de la temperatura y tipo de horno sobre la vida de un
componente. En el experimento se utiliza cuatro tipos de horno y tres niveles de temperatura. Se asignaron
de forma aleatoria 36 de estos componentes, tres a cada combinación de tratamiento y se registró los
siguientes resultados.

Temperatura (grados) H1 H2 H3 H4
227 214 225 260
500 221 259 236 229
225 265 230 258
187 181 232 246
550 208 179 198 273
198 195 200 285
174 198 178 206
600 202 194 213 219
201 195 212 210

Analice los datos a un nivel de 5% de significación.

Solución
El modelo aditivo es:

𝑌𝑖𝑗𝑘 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + (𝜏𝛽)𝑖𝑗 + 𝜀𝑖𝑗𝑘

Analizando los supuestos del modelo

Supuesto 1: Normalidad de errores

𝐻0 : Los errores sí provienen de una población normal


𝐻1 : Los errores no provienen de una población normal

𝛼 = 0,05
Estadística Aplicada II 202301 105

Del resultado de Minitab, se tiene que:

Prueba Anderson Darling => AD= 0.448

valor p = 0.264

Criterio de rechazo y no rechazo


Si el valor p ≤ 𝛼; entonces, se rechaza 𝐻0
Si el valor p > 𝛼; entonces, no se rechaza 𝐻0

Decisión
Como el valor p = 0.264 es mayor al nivel de significancia 𝛼 = 0,05; entonces, no se rechaza 𝐻0

Conclusión
Con 5 % de nivel de significación, la evidencia muestral es insuficiente para descartar que los errores provienen
de una población normal. Por lo tanto, se asume que se cumple el supuesto.

Supuesto 2: Homogeneidad de varianzas

𝐻0 : Los errores tienen la misma varianza en cada una de las poblaciones (es sinónimo “tratamientos”)
𝐻1 : Al menos una varianza es diferente

𝛼 = 0,05
Unidad 2. Diseño y análisis de experimentos 106
Pruebas
Estadística
Método de prueba Valor p
Bartlett 16.22 0.133

Del resultado de Minitab, se tiene que:

Prueba de Barlett = 16.22,

Valor p = 0.133

Criterio de rechazo y no rechazo


Si el valor p ≤ 𝛼; entonces, se rechaza 𝐻0
Si el valor p > 𝛼; entonces, no se rechaza 𝐻0

Decisión
Como el valor p = 0.133 es mayor al nivel de significancia 𝛼 = 0,05; entonces, no se rechaza 𝐻0

Conclusión
Con 5 % de nivel de significación, la evidencia muestral es insuficiente para descartar que las varianzas de los
errores en cada población son las mismas. Por lo tanto, se asume que se cumple el supuesto.

Analizando la interacción

𝐻0 : La interacción de los niveles de temperatura en cada tipo de horno no impacta en la vida útil
𝐻1 : La interacción de los niveles de temperatura en cada tipo de horno sí impacta en la vida útil

𝛼 = 0,05

𝐶𝑀𝐴𝐵
𝐹𝑐𝑎𝑙 = ~𝐹(6,24) / 𝐻0  𝑐𝑖𝑒𝑟𝑡𝑜
𝐶𝑀𝐸

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Temperatura 2 8431 4215.3 18.29 0.000
Horno 3 8050 2683.3 11.65 0.000
Temperatura*Horno 6 5984 997.4 4.33 0.004
Error 24 5530 230.4
Total 35 27995

De la tabla de análisis de varianza tenemos que:

𝐹𝑐𝑎𝑙 = 4.33

𝑣𝑎𝑙𝑜𝑟 𝑝 = 0.004

Criterio de rechazo y no rechazo


Si el valor p ≤ 𝛼; entonces, se rechaza 𝐻0
Si el valor p > 𝛼; entonces, no se rechaza 𝐻0
Estadística Aplicada II 202301 107
Decisión
Como el valor p = 0.004 es menor al nivel de significancia 𝛼 = 0,05; entonces, se rechaza 𝐻0

Conclusión
Con 5 % de nivel de significación, la evidencia muestral es suficiente para afirmar que La interacción de los
niveles de temperatura en cada tipo de horno sí impacta en la vida útil de dicho componente.

Comparando los tratamientos en pares

Agrupar información utilizando el método de Tukey y una confianza de 95%


Temperatura*Horno N Media Agrupación
550 H4 3 268.000 A
500 H4 3 249.000 A B
500 H2 3 246.000 A B
500 H3 3 230.333 A B C
500 H1 3 224.333 A B C D
600 H4 3 211.667 B C D
550 H3 3 210.000 B C D
600 H3 3 201.000 C D
550 H1 3 197.667 C D
600 H2 3 195.667 C D
600 H1 3 192.333 C D
550 H2 3 185.000 D

Las medias que no comparten una letra son significativamente diferentes.

La mejor combinación es el tratamiento temperatura 550 grados y horno 4, en cuyo caso, la vida media estos
componentes es superior (268.000) al resto de combinaciones y está sola en la agrupación A.
Unidad 2. Diseño y análisis de experimentos 108

Ejercicios

38. Tecno Gas S.A. es una empresa que fabrica y comercializa termas a gas para uso
doméstico e industrial. La terma a gas es un artefacto calentador de agua que
funciona de forma continua mediante la combustión de gas.

Su planta de producción está ubicada en la ciudad del Callao y sus productos se


comercializan a través de sus locales de venta y centros comerciales ubicados en
Lima y provincias. Constantemente está mejorando su tecnología para producir
termas a gas a un precio competitivo y de primerísima calidad, reduciendo al mínimo
las fallas y reclamos de los clientes.

El jefe del departamento de ingeniería está interesado en determinar si hay influencia del turno de
producción y la capacidad de las termas en el porcentaje de termas con defecto.

Para esto diseñó un experimento factorial con tres niveles del turno de producción y tres niveles de la
capacidad de las termas, obteniendo la siguiente información:

Capacidad
Turno de producción
10 litros 14 litros 18 litros
3.8 5.5 4.5
Mañana 4.0 5.0 4.0
4.2 4.8 4.2
4.5 5.0 3.8
Tarde 4.2 5.3 4.0
4.8 5.8 3.5
5.0 6.0 3.8
Noche 4.5 5.8 4.0
5.2 5.5 4.1

¿Qué capacidad de terma o turno de producción debe elegir jefe de departamento de ingeniería, para
obtener menor porcentaje de termas con defectos? Realice el análisis con un nivel de significación del 5%.

a. Complete los siguientes elementos del experimento.

Variable respuesta Porcentaje de termas con defectos

Factor A Turno de producción

Niveles del Factor A Mañana, Tarde, Noche. |a = 3


Factor B Capacidad de la terma

Niveles del Factor B 10L, 14L, 18L. |b = 3


Mañana – 10L, Mañana – 14L, Mañana – 18L, …, Noche –
Tratamientos
18L.
Unidad experimental Un lote termas.

Número de réplicas por tratamiento n=3


Estadística Aplicada II 202301 109

Modelo 𝑌𝑖𝑗𝑘 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + (𝜏𝛽)𝑖𝑗 + 𝜀𝑖𝑗𝑘


H1: Existe interacción entre los turnos de producción y las
Hipótesis alterna capacidades de las termas sobre el porcentaje de termas
con defectos.

b. Prueba de supuestos.

Prueba Anderson Darling Prueba de Barlett


AD = 0,327 EP = 2,34
Valor – p = 0,505 Valor – p = 0,969

Normalidad de los errores o residuos (AD)


H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente

AD = 0.327 p valor = 0.505 α = 0.05

Decisión: Como p valor > α, no se rechaza H0


Conclusión: Al 5% de nivel de significación, se asume que los errores se distribuyen normalmente.

Homogeneidad de varianzas (Bartlett)


H0: La varianza de los errores es igual en los nueve tratamientos
H1: La varianza de los errores es diferente en al menos un tratamiento

Bartlett = 2.34 p valor = 0.969 α = 0.05

Decisión: Como p valor > α, no se rechaza H0


Conclusión: Al 5% de nivel de significación, se asume que la varianza de los errores es igual en los nueve
tratamientos.

Por lo tanto, se cumplen los supuestos del diseño.

c. Complete la siguiente tabla de análisis de varianza.

Fuente de Grados de Suma de Cuadrado


Fcalculado
variación libertad cuadrados medio
0.9267 0.4634
Turno 2 0,9267 = 0.4634 0.0852
= 5.4390
2
9.4289 4.7145
Capacidad 3–1=2 9,4289 = 4.7145 0.0852
= 55.3345
2
1.2978 0.3245
Turno x capacidad 4 1.2978 = 0.3245 = 3.8087
4 0.0852
1.5333
Error 3x3(3 – 1) = 18 1,5333 = 0.0852
18

Total 26 13,1867
Unidad 2. Diseño y análisis de experimentos 110
d. Complete la siguiente la siguiente gráfica e indique la decisión.

Decisión estadística
Como Fcal > Fcrítico, se rechaza H0.

Conclusión estadística
Al 5% de nivel de significación, la evidencia muestral es suficiente para afirmar que existe interacción
entre los turnos de producción y las capacidades de las termas sobre el porcentaje de termas con
defectos.

Nota: Cuando existe interacción se debe realizar la prueba de Tukey para la interacción

Conclusión
¿Qué capacidad de terma o turno de producción debe elegir jefe de departamento de ingeniería, para
obtener menor porcentaje de termas con defectos?

A un nivel de confianza del 95% se puede afirmar que con los tratamientos: Tarde – 10L, Mañana –
18L, Mañana – 10L, Noche – 18L y Tarde 18L, se obtienen los menores porcentajes promedios de
termas con defectos.

Sin embargo, se podrá minimizar el porcentaje de termas con defectos con los tratamientos: Mañana
– 10L, Noche – 18L y Tarde – 18L, ya que son significativamente menores al resto de tratamientos.

El siguiente reporte proviene del programa Minitab:

Agrupar información utilizando el método de Tukey y una confianza de 95%

Turno*Capacidad N Media Agrupación


Noche 14 L 3 5.76667 A
Tarde 14 L 3 5.36667 A B
Mañana 14 L 3 5.10000 A B C
Noche 10 L 3 4.90000 B C D
Tarde 10 L 3 4.50000 C D E
Mañana 18 L 3 4.23333 D E
Mañana 10 L 3 4.00000 E
Noche 18 L 3 3.96667 E
Tarde 18 L 3 3.76667 E
Las medias que no comparten una letra son significativamente diferentes.
Estadística Aplicada II 202301 111
Si hubiera salido el siguiente reporte como resultado del caso anterior: ¿Qué capacidad de terma o
turno de producción debe elegir jefe de departamento de ingeniería, para obtener menor porcentaje
de termas con defectos?

Agrupar información utilizando el método de Tukey y una confianza de 95%

Turno*Capacidad N Media Agrupación


Noche 14 L 3 5.76667 A
Tarde 14 L 3 5.36667 A B
Mañana 14 L 3 5.10000 A B C
Noche 10 L 3 4.90000 B C D
Tarde 10 L 3 4.50000 C D
Mañana 18 L 3 4.23333 D
Mañana 10 L 3 4.00000 D
Noche 18 L 3 3.76667 E
Tarde 18 L 3 3.56667 E
Las medias que no comparten una letra son significativamente diferentes.

Los tratamientos que minimizan el porcentaje de termas con defectos son: Noche – 18L y Tarde – 18L, ya
que son significativamente menores al resto de tratamientos.

39. Al pesar un reactivo en un laboratorio aparecen diferencias debidas a las balanzas usadas y a la habilidad
del personal que realizan las mediciones. Se elige tres balanzas y tres técnicos de laboratorio, los
resultados de las mediciones, en gramos, se muestran a continuación.

Personal
Balanza 1 2 3
1.81 2.04 2.03
1 1.91 1.97 1.98
1.91 1.99 1.94
1.94 2.08 2.03
2 1.90 2.14 1.98
1.99 2.08 2.00
1.83 1.98 1.91
3 1.92 2.05 2.06
1.96 2.03 2.04

a. ¿Puede asegurarse al nivel de significación 𝛼 = 0,05 que hay habilidad homogénea de todos los
técnicos del laboratorio?
b. ¿Existe interacción entre los factores? Use 𝛼 = 0,05.
c. Analice los supuestos del modelo. Use 𝛼 = 0,05.
d. Encuentre el(los) mejor(es) procedimiento(s).

También podría gustarte