Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Asignatura: Estadística II
Unidad II: Diseño y Análisis de Experimentos
Tema: Diseño Factorial de Dos y Tres Factores.
En cada caso es importante no solo determinar si los dos factores influyen sobre la
respuesta, sino también si existe una interacción significativa entre ellos. Un experimento
factorial de dos factores – por ejemplo – involucra pruebas experimentales (o una sola
prueba) con todas las combinaciones factoriales; interesa saber cómo ambos afectan el
valor de la variable de salida en la muestra y si interactúan o no.
Muchos experimentos se llevan a cabo para estudiar los efectos producidos por dos o más
factores. Los diseños factoriales son los más eficientes para este tipo de experimentos.
Por Diseño Factorial se entiende aquel en el que se investigan todas las posibles
combinaciones de los niveles de los factores en cada ensayo completo o réplica del
experimento. Por ejemplo, si existen a niveles del factor A y b niveles del factor B, entonces
cada réplica del experimento contiene todas las ab combinaciones de los tratamientos.
Tabla1 Factor B
B1 B2
Factor A A1 20 30
A2 40 52
El efecto principal del factor A podría interpretarse como la diferencia entre la respuesta
promedio en el primero y segundo nivel de ese factor. Numéricamente
40 + 52 20 + 30
𝐴= − = 21
2 2
30 + 52 20 + 40
𝐵= − = 11
2 2
1
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
A = 50 – 20 = 30
A = 12 – 40 = - 28
Puede observarse que existe una interacción entre los factores A y B porque el efecto de A
depende del nivel elegido de B.
Estas ideas pueden ilustrarse gráficamente. En el grafico 1, se muestra los datos de la tabla
1, se observa que las rectas B1 y B2 son, aproximadamente paralelas, esto indica que no
hay interacción entre los factores.
Grafico 1:
Grafico 2:
2
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
Con frecuencia, estas gráficas son muy útiles para interpretar interacciones significativas y
presentar resultados a personas con poco conocimiento estadístico. Sin embargo, no debe
ser la única técnica para analizar los datos, porque su interpretación es subjetiva y su
apariencia, a menudo es engañosa.
El efecto principal del factor A es igual a 1 el cual resulta ser muy pequeño, corriéndose el
riesgo de concluir que no existe un efecto debido al factor A. El factor A tiene un efecto,
pero depende del nivel del factor B. En otras palabras, es más útil conocer la interacción
AB que el efecto principal. Una interacción significativa oculta a menudo el significado de
los efectos principales.
𝑖 = 1,2, … , 𝑎
𝑦𝑖𝑗𝑘 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + (𝜏𝛽)𝑖𝑗 + 𝜀𝑖𝑗𝑘 { 𝑗 = 1,2, … , 𝑏
𝑘 = 1,2, … , 𝑛
3
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
en donde:
𝑦𝑖𝑗𝑘 : es la ijk – ésima observación.
𝜇: es un parámetro común a todos los tratamientos denominado “media global”.
𝜏𝑖 : es un parámetro único para el i – ésimo nivel de tratamiento A, llamado “Efecto del
Tratamiento i – ésimo”.
𝛽𝑗 : es un parámetro único para el j – ésimo nivel de tratamiento B, llamado “Efecto del
Bloque j – ésimo”.
(𝜏𝛽)𝑖𝑗 : es el efecto de la interacción entre los tratamientos A y B.
𝜀𝑖𝑗 : es la componente aleatoria de error.
El procedimiento de prueba se reduce a la tabla de Análisis de Varianza (ANOVA) siguiente:
en donde N = abn
𝑎 𝑏 𝑛 𝑎 𝑏
2
𝑦.2. . 𝑦𝑖2. . 𝑦.2. . 𝑦.2𝑗 . 𝑦.2. .
𝑆𝐶𝑇 = ∑ ∑ ∑ 𝑦𝑖𝑗𝑘 − 𝑆𝐶𝐴 = ∑ − 𝑆𝐶𝐵 = ∑ −
𝑁 𝑏𝑛 𝑁 𝑎𝑛 𝑁
𝑖=1 𝑗=1 𝑘=1 𝑖=1 𝑗=1
𝑎
2 𝑏
𝑦𝑖𝑗 . 𝑦.2. .
𝑆𝐶𝑠𝑢𝑏𝑡𝑜𝑡𝑎𝑙𝑒𝑠 = ∑ ∑ − 𝑆𝐶𝐴𝐵 = 𝑆𝐶𝑠𝑢𝑏𝑡𝑜𝑡𝑎𝑙𝑒𝑠 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵
𝑛 𝑁
𝑖=1 𝑗=1
Para probar la igualdad en las medias de los tratamientos A y B, hay que usar el estadístico
F0 que tiene una distribución F – Fisher (F, a – 1, b – 1 y (a – 1)(b – 1)) grados de libertad
en el numerador, respectivamente, y ab(n – 1) grados de libertad en el denominador. Las
regiones críticas corresponden al extremo superior de la distribución F.
EJEMPLO 4:
En un experimento llevado a cabo para determinar cual de tres sistemas de arranque es
preferible, se midió el promedio de consumo de los inyectores para 24 encendidos estáticos
de ciertas máquinas industriales. Se utilizaron cuatro tipos diferentes de inyectores. En el
experimento se obtuvieron dos observaciones de promedios de consumo en cada
combinación de los tratamientos. Los datos después de codificarse se presentan en la tabla
siguiente. Utilice un nivel de significancia de 0.05 para probar, que no existe diferencia en
4
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
las tasas medias de consumo de los inyectores cuando se utilizan diferentes sistemas de
arranque, que no existe diferencia en las tasas medias de consumo de los cuatro tipos de
inyectores y que no existe interacción entre los diferentes sistemas de arranque y los
diferentes tipos de inyectores.
𝐻 0 : 𝜏1 = 𝜏2 = 𝜏3 = 0
𝐻1 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜏𝑗 ≠ 0
𝐻0 : 𝛽 1 = 𝛽 2 = 𝛽 3 = 0
𝐻1 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝛽𝑘 ≠ 0
710.22
𝑆𝐶𝑇 = [34.02 + 32.72 + ⋯ + 29.12 ] − [ ] = 21,107.68 − 21,016.00 = 91.68
24
5
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
Con los resultados obtenidos a partir de la tabla ANOVA y utilizando un nivel de significancia
de 0.05 se tiene que F0.05,2,12 = 3.89; F0.05,3,12 = 3.49; F0.05,6,12 = 3.00, talque se debe rechazar
la hipótesis relacionada con los sistemas de arranque y el tipo de inyector, esto significa
que los diferentes sistemas de arranque implican diferentes tasas de promedio de consumo
del inyector, y que las tasas promedio de consumo del inyector no son las mismas para los
cuatro tipos de sistemas de arranque. Por otro lado, la decisión respecto a la interacción
hay que tomarla con cautela por la diferencia mínima que hay respecto al estadístico de
prueba.
Una mirada rápida a la tabla de totales en dos direcciones sugiere que el efecto del tipo de
inyector depende definitivamente del sistema de arranque que se esté utilizando. Por
ejemplo, para el sistema tres, el efecto del tipo de inyector no parece ser importante. Esto
explica la “posible” interacción entre ambos factores.
6
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
EJEMPLO:
Si seleccionamos dos contrastes ortogonales para dividir la suma de cuadrados para el
sistema de arranque en componentes de un solo grado de libertad para utilizarlos en la
comparación de los sistemas 1 y 2 con el 3 y el 1 con el 2.
SOLUCIÓN:
El contraste para comparar los sistemas 1 y 2 con el 3 está dado por:
Un segundo contraste ortogonal para comparar el sistema 1 con el sistema 2 está dado por:
𝐻0 : 𝜇1 − 𝜇2 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 𝐶2 : 𝑦1 . − 𝑦2 .
[244.0 − 237.4]2
𝑆𝐶𝐶1 = = 2.72
(8)[(1)2 + (−1)2 ]
Notemos que 𝑆𝐶𝐶1 + 𝑆𝐶𝐶2 = 𝑆𝐶𝐴, tal como se esperaba. Los estadísticos de prueba
respectivos son respectivamente:
11.80
𝐹01 = = 9.5
1.24
2.72
𝐹02 = = 2.2
1.24
En comparación con el valor crítico F0.05,1,12 = 4.72, se encuentra que F01 es significativa. De
hecho, el primer contraste indica que se rechaza la hipótesis relacionada, en cuanto al
segundo contraste el estadístico F02 es menor que el valor crítico lo que determina que el
consumo del primero y segundo sistema de arranque no son significativamente diferentes.
7
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
𝑖 = 1,2, … , 𝑎
𝑗 = 1,2, … , 𝑏
𝑦𝑖𝑗𝑘𝑙 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + 𝜏𝑘 + (𝛼𝛽)𝑖𝑗 + (𝛼𝜏)𝑖𝑘 + (𝛽𝜏)𝑗𝑘 + (𝛼𝛽𝜏)𝑖𝑗𝑘 + 𝜀𝑖𝑗𝑘𝑙 {
𝑘 = 1,2, … , 𝑐
𝑙 = 1,2, … , 𝑛
en donde:
𝑦𝑖𝑗𝑘𝑙 : es la ijkl – ésima observación.
𝜇: es un parámetro común a todos los tratamientos denominado “media global”.
𝑖 : es un parámetro único para el i – ésimo nivel de tratamiento A, llamado “Efecto del
Tratamiento i – ésimo”.
𝛽𝑗 : es un parámetro único para el j – ésimo nivel de tratamiento B, llamado “Efecto del
Bloque j – ésimo”.
𝜏𝑖 : es un parámetro único para el k – ésimo nivel de tratamiento C, llamado “Efecto del
Bloque k – ésimo”.
(𝛼𝛽)𝑖𝑗 : es el efecto de la interacción entre los tratamientos A y B.
(𝛼𝜏)𝑖𝑘 : es el efecto de la interacción entre los tratamientos A y C.
(𝛽𝜏)𝑗𝑘 : es el efecto de la interacción entre los tratamientos B y C.
(𝛼𝛽𝜏)𝑖𝑗𝑘 : es el efecto de la interacción entre los tratamientos A, B y C.
𝜀𝑖𝑗 : es la componente aleatoria de error.
La filosofía general del análisis es la misma que la utilizada para los experimentos de uno
y dos factores. La suma de cuadrados se particiona en ocho términos, cada uno representa
una fuente de variación de las cuales se obtienen estimaciones independientes de la
varianza cuando todos los efectos principales y los efectos de interacción son cero. Si los
efectos de cualquier factor o interacción dados no son todos cero, entonces el cuadrado
medio estimará la varianza del error más una componente debida al efecto sistemático en
cuestión.
8
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
Las sumas de los cuadrados se calculan substituyendo los totales apropiados en las
siguientes fórmulas de cálculo:
𝑎 𝑏 𝑐 𝑛
2
𝑦.2. . .
𝑆𝐶𝑇 = ∑ ∑ ∑ ∑ 𝑦𝑖𝑗𝑘𝑙 −
𝑎𝑏𝑐𝑛
𝑖=1 𝑗=1 𝑘=1 𝑙=1
∑𝑎𝑖=1 ∑𝑏𝑗=1 ∑𝑐𝑘=1 𝑦𝑖2𝑗 𝑘 . ∑𝑎𝑖=1 ∑𝑏𝑗=1 𝑦𝑖2𝑗 . ∑𝑎𝑖=1 ∑𝑐𝑘=1 𝑦𝑖2.
. 𝑘 . ∑𝑏𝑗=1 ∑𝑐𝑘=1 𝑦.2𝑗 𝑘 .
𝑆𝐶𝐴𝐵𝐶 = − − −
𝑛 𝑐𝑛 𝑏𝑛 𝑎𝑛
∑𝑎𝑖=1 𝑦𝑖2 . . . ∑𝑏𝑖=1 𝑦.2𝑗 . . ∑ 𝑐
𝑦 2
𝑘=1 . . 𝑘 . 𝑦 2
. . . .
+ + + −
𝑏𝑐𝑛 𝑎𝑐𝑛 𝑎𝑏𝑛 𝑎𝑏𝑐𝑛
Ejemplo 5:
9
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
SOLUCIÓN:
(606.4)2
𝑆𝐶𝑇 = 10.72 + 10.82 + ⋯ + 12.22 − = 6872.84 − 6809.65 = 63.19
54
10
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
𝑆𝐶𝐸 = 63.19 − 13.98 − 10.18 − 1.18 − 4.78 − 2.92 − 3.64 − 4.89 = 21.62
ANOVA
Fuente de variación Suma de Grados de Cuadrados Estadístico F0
cuadrados libertad medios
Operador (A) 13.98 2 6.99 11.65
Catalizador (B) 10.18 2 5.09 8.48
Tiempo Lavado (C) 1.18 1 1.18 1.97
Interacciones
AB 4.78 4 1.20 2.00
AC 2.92 2 1.46 2.73
BC 3.64 2 1.82 3.03
ABC 4.89 4 1.22 2.03
ERROR 21.62 36 0.60
TOTAL 63.19 53
Las posibles interacciones entre los factores, se observa en las siguientes gráficas:
11
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
12
Carrera: Ing. de Sistemas Msc. Manuel Morales Martínez
13