Está en la página 1de 142

INTRODUCCIÓN A LOS

DISEÑOS FACTORIALES
Cap. 4
Definición del efecto de un factor

El cambio en la respuesta promedio cuando el factor es cambiado de nivel bajo a alto

Experimento factorial sin interacción


Experimento factorial de dos factores con la
respuesta (y) indicada en los vértices
Experimento factorial con interacción
Experimento factorial de dos
factores con interacción

Efecto de A depende del nivel


que se elige para el factor B
La interacción también puede ilustrarse en un modelo, por ejemplo (valores cuantitativos:
tiempo, presión, temperatura, etc.), en este caso puede ser un modelo de regresión.

Donde: y= respuesta
𝛽 = parámetros cuyos valores deben
determinarse
𝑦 = 𝛽𝑜 + 𝛽1 𝑥1 + 𝛽2 𝑥2 +𝛽12 𝑥1 𝑥2 + 𝜀
𝑥1 = es una variable que representa al factor A
𝑥2 = Es una variable que representa al factor B
𝜀 = es un término del error aleatorio
Las variables 𝑥1 𝑦 𝑥2 se definen en una escala codificada de -1 a +1 (los niveles más bajo y
alto de A y B), y 𝑥1 𝑥2 representa la iteración entre 𝑥1 𝑦 𝑥2
Ya que la iteración es
𝑦ො = 35,5 + 10,5𝑥1 + 5,5𝑥2 +0,5𝑥1 𝑥2 pequeña puede ignorarse
Una iteración se presenta
𝑦ො = 35,5 + 10,5𝑥1 + 5,5𝑥2 en forma de curva en una
plano
VENTAJA DE LOS DISEÑOS FACTORIALES

Son más eficientes que los experimentos de un factor a la vez.

Un diseño factorial es necesario cuando puede haber iteraciones presentes a fin de evitar
llegar a conclusiones incorrectas.

Los diseños factoriales permiten la estimación de los efectos de un factor con varios niveles
de los factores restantes, produciendo conclusiones que son válidas para un rango de
condiciones experimentales.
DISEÑO FACTORIAL DE DOS FACTORES

Los tipos más simples de diseños factoriales incluyen únicamente dos factores o
conjuntos de tratamientos.

Hay a niveles del factor A y b niveles del factor B, los cuales se disponen en un diseño
factorial; es decir, cada réplica del experimento contiene todas las ab combinaciones de
los tratamientos. En general hay n réplicas.
MODELO DE REGRESIÓN

µ= Efecto promedio global


Ƭi=efecto del nivel i-ésimo del factor A de los renglones
β= efecto del nivel j-ésimo del factor B de columnas
(Ƭ β)ij=efecto de la interacción entre βi y Ƭi
ξ ijk es un componente del error aleatorio

abn observaciones en total


Modelo de medias

El interés se encuentra en probar la hipótesis acerca de la igualdad de los efectos de


los tratamientos de los renglones:
𝐻𝑜 : 𝜏1 = 𝜏2 =𝜏3 =…=𝜏𝑎 = 0 𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝜏𝑖 ≠ 0

De la igualdad de los efectos de los tratamientos de las columnas:


𝐻𝑜 : 𝛽1 = 𝛽2 =…=𝛽𝑏 = 0 𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝛽𝑗 ≠ 0

Determinar si los tratamientos de los renglones y las columnasinteractúan:


𝐻𝑜 : (𝜏𝛽)𝑖𝑗 = 0 𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎(𝜏𝛽)𝑖𝑗 ≠ 0
Análisis de varianza de dos factores
La suma de cuadrados total
corregida puede escribirse
como:
𝑆𝑆𝑇 = 𝑆𝑆𝐴 + 𝑆𝑆𝐵 + 𝑆𝑆𝐴𝐵 + 𝑆𝑆𝐸 Los grados de libertad asociados con cada suma de
cuadrados es:
Efecto Grados de libertad
A a-1
B b-1
Interacción AB (a-1)(b-1)
Error ab(n-1)
Total Abn-1
Cada suma de cuadrados dividida por sus grados de libertad es un cuadrado medio.
Si es verdadera la hipótesis nula de que no hay efectos de los tratamientos de los
renglones, ni de los tratamientos de las columnas, ni interacción, entonces MSA, MSB,MSAB
y MSE son todas estimaciones de 𝜎 2 .

Sin embargo, si hay diferencias entre los efectos de los tratamientos de los renglones, por
ejemplo, entonces MSA será mayor que MSE.

De manera similar, si están presentes efectos de los tratamientos de las columnas o de la


iteración, entonces los cuadrados medios correspondientes serán mayores que MSE.

Para probar la significación Los valores grandes se este


de los dos efectos principales 𝑀𝑆𝐴 𝑀𝑆𝐵 𝑀𝑆𝐴𝐵 cociente implican que los
, ,
y su interacción, simplemente 𝑀𝑆𝐸 , 𝑀𝑆𝐸 𝑀𝑆𝐸 datos no apoyan la hipótesis
se divide: nula.
Si se supone que el
modelo es
adecuado y que los
términos del error Cada uno de
𝜀𝑖𝑗𝑘 tienen: Se distribuyen F con
los cocientes a-1, b-1 y (a-1)(b-1)
de cuadrados grados de libertad en
- Una distribución
medios el numerador y
normal
- Independencia ab(n-1) en el
- Varianza constante denominador

Se resume en una tabla La región crítica sería la


de análisis de varianza cola superior de la
distribución F.
Tabla del análisis de varianza para el diseño factorial de dos factores, modelo con efectos fijos
SSAB, se lo puede obtener en dos pasos:

Primero se calcula la suma de cuadrados entre los totales de las ab celdas, a la


que se denomina la suma de cuadrados debida a los “subtotales”

Segundo, ya que este contienen SSA y SSB, se calcula SSAB como sigue

Y SSE se calcula por sustracción:


EJEMPLO

Un ingeniero está diseñando una batería que se usará en un dispositivo que se someterá a
variaciones de temperatura extremas. El único parámetro del diseño que puede seleccionar en
este punto es el material de la placa o ánodo de la batería, y tiene tres elecciones posibles.
Cuando el dispositivo esté fabricado y se envíe al campo, el ingeniero no tendrá control sobre
las temperaturas extremas en las que operará el dispositivo, pero sabe por experiencia que la
temperatura probablemente afectará la vida efectiva de la batería. Sin embargo, la
temperatura puede controlarse en el laboratorio donde se desarrolla el producto para fines de
prueba. El ingeniero decide probar los tres materiales de la placa con tres niveles de
temperatura -15, 70 y 125ºF ya que estos niveles de temperatura son consistentes con el
medio ambiente donde se usará finalmente el producto.
Se prueban cuatro baterías con cada combinación del material de la placa y la temperatura, y
Las 36 pruebas se corren de manera aleatoria. En la tabla se presentan los datos del
experimento y de la vida observada de la batería.
En este problema, el ingeniero quiere responder las preguntas siguientes:
1 ¿Qué efectos tienen el tipo de material y la temperatura sobre la vida de la batería?
2 ¿Existe alguna elección del material que produzca de manera regular una vida larga de
la batería independientemente de la temperatura?
539 229 230
623 479 198
576 583 342

𝑦𝑗.. = 1738 𝑦𝑗.. = 1291 𝑦𝑗.. = 770 𝑦... = 3799


Sumas de cuadrados
Puesto que F0,05,4,27 =2.73,se concluye que hay una interacción significativa entre
los tipos del material y la temperatura.

Además,F0,05,2,27=3,35 por lo que los efectos principales del tipo de material y la


temperatura también son significativos
Comparaciones múltiples
Cuando el análisis de varianza indica que las medias de los renglones o columnas difieren,
por lo general es de interés hacer comparaciones entre las medias individuales de los
renglones o de las columnas para descubrir diferencias significativas.

Los promedios de 𝑦ത12 = 57,25 Material tipo 1


Tukey los materiales a 𝑦ത22 = 119,75 Material tipo 2
70ºF en forma
ascendente son: 𝑦ത32 = 145,75 Material tipo 3

675,21
𝑀𝑆𝐸 q 0,05 3,27= 3,50 𝑇0,05 = 𝑞0,05 (3,27) = 45,47
𝑇𝛼 = 𝑞𝛼 (𝑎, 𝑓) 4
𝑛
3 vs. 1 =145,75-57,23 = 88,50 > T 0,05= 45,47
3 vs. 2 =145,75-119,75 = 26,00 < T 0,05= 45,47
2 vs. 1 =119,75-57,25 = 62,50 > T 0,05= 45,47

A un nivel de temperatura de 70ºC, la vida media de la batería es la misma para los


materiales 2 y 3, y que la vida media de la batería con el material 1 es significativamente
menor
Interesa el tiempo de coagulación (en minutos) del plasma sanguíneo para 3 tratamientos y
2 concentraciones de adrenalina mezclada con el plasma. Para cada combinación de
tratamiento y concentración de adrenalina, se tomaron 3 observaciones independientes. Se
obtuvieron los siguientes datos:

1 5
A: orden en la 6 29,7 7 32,7 62,4
realización de los 17 13
experimentos 10 18
12 27 8 31,2 58,2
2 4
15 14
11 24,3 9 30 54,3
16 3

81 174,9
93,9
Suma de Grados de Cuadrados
Fo FT 0,05 FT 0,025 FT 0,01
cuadrados libertad medios

SST = 16,205 17 0,953

SSTP = 5,470 2 2,735 37,466 3,89 5,10 6,93

SSCA = 9,245 1 9,245 126,644 4,75 6,55 9,33

0,305 4,178 3,89 5,10 6,93


SSTPCA = 0,610 2

SSE = 0,880 12 0,073


Supongamos que nos interesa estudiar el efecto del porcentaje de grasa corporal (factor A,
3 niveles) y del sexo (factor B) en la tolerancia al ejercicio físico en personas de 25 a 35
años de edad. Esta tolerancia se mide en minutos antes de que ocurra la fatiga en sujetos
realizando bicicleta fija. Dos sujetos fueron sometidos al test de tolerancia para cada
grupo de sexo-grasa. A partir de los datos obtenidos se calculó la siguiente tabla de
análisis de la varianza para el modelo:
Yijk =  + i + j + ij + ijk i=1, 2, 3 j=1, 2, k=1, 2
VERIFICACIÓN DE LA ADECUACIÓN DEL MODELO

Antes de adoptar las conclusiones del ANOVA, se debe verificar la adecuación del modelo
fundamental.
La herramienta primaria de diagnóstico es el análisis residual. Los residuales del modelo
factorial de dos factores son:

𝑒𝑖𝑗𝑘 = 𝑦𝑖𝑗𝑘 − 𝑦ො𝑖𝑗𝑘

Y puesto que 𝑦ො𝑖𝑗𝑘 es igual 𝑦ത𝑖𝑗𝑘

𝑒𝑖𝑗𝑘 = 𝑦𝑖𝑗𝑘 − 𝑦ത𝑖𝑗𝑘


T15 T70 T125
-4,75 -23,25 -37,5
-60,75 -17,25 12,5
20,25 22,75 24,5
M1 45,25 17,75 0,5
-5,75 16,25 -24,5
3,25 2,25 20,5
32,25 -13,75 8,5
M2 -29,75 -4,75 -4,5
-6 28,25 10,5
24 -25,75 18,5
-34 4,25 -3,5
M3 16 -6,75 -25,5
Consideremos un experimento en el que se quiere estudiar el efecto de los factores A:
profundidad de corte sobre el acabado de un metal y B: velocidad de alimentación. Aunque
los factores son de naturaleza continua, en este proceso sólo se puede trabajar en 4 y 3
niveles, respectivamente. Por ello, se decide correr un factorial completo 4 × 3 con tres
réplicas, que permitirá obtener toda la información relevante en relación al efecto de estos
factores sobre el acabado.
Al aleatorizar las 36
pruebas se obtienen los
datos de la tabla
También se puede escribir como:
H0 : Efecto de profundidad (A) = 0 H0 : α1 = α 2 = … = α a = 0
HA : Efecto de profundidad (A) ≠ 0 HA : α i ≠ 0 para algún i

H0 : Efecto de velocidad (B) = 0 H0 : β1 = β 2 = … = β b = 0


HA : Efecto de velocidad (B) ≠ 0 HA : β j ≠ 0 para algún j

H0 : Profundidad × velocidad (AB) = 0 H0 : (α β)ij = 0 para todo ij


HA : Profundidad × velocidad (AB) ≠ 0 HA : (α β)ij ≠ 0 para algún ij
Datos de la
adherencia
En unos laboratorios se está estudiando los factores que influyen en la resistencia de
un tipo particular de fibra. Se eligen al azar cuatro máquinas y tres operarios y se
realiza un experimento factorial usando fibras de un mismo lote de producción. Los
resultados obtenidos se muestran en la tabla adjunta. Analizar los resultados y obtener
las conclusiones apropiadas.
ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO
Los parámetros del modelo de los efectos para el diseño factorial de dos factores
pueden estimarse por mínimos cuadrados.

Puesto que el modelo tiene 1+a+ab, parámetros que deben estimarse, hay 1+a+b+ab
ecuaciones normales.
𝑎 𝑎 𝑎 𝑏
෣ 𝑖𝑗 = 𝑦…
𝜇: 𝑎𝑏𝑛𝜇ො + 𝑏𝑛 ෍ 𝜏Ƹ 𝑖 + 𝑎𝑛 ෍ 𝛽መ𝑗 + 𝑛 ෍ ෍(𝜏𝛽)
𝑖=1 𝑖=1 𝑖=1 𝑗=1

𝑏 𝑏

𝜏𝑖 : 𝑏𝑛𝜇ො + 𝑏𝑛𝜏Ƹ 𝑖 + 𝑛 ෍ 𝛽መ𝑗 + 𝑛 ෍ 𝜏𝛽


෢𝑖𝑗 = 𝑦𝑖..
Para i= 1, 2…, a
𝑗=1 𝑗=1
𝑎 𝑎

𝛽𝑗 : 𝑎𝑛𝜇ො + 𝑎𝑛𝛽መ𝑗 + 𝑛 ෍ 𝜏Ƹ 𝑖 + 𝑛 ෍ 𝜏𝛽
෢𝑖𝑗 = 𝑦.𝑗. Para j= 1, 2…, b
𝑖=1 𝑖=1

(𝜏𝛽)𝑖𝑗 : 𝑛𝜇ො + 𝑛𝛽መ𝑗 + 𝑛𝜏Ƹ 𝑖 + 𝑛𝜏𝛽


෢𝑖𝑗 = 𝑦𝑖𝑗 Para i= 1, 2…, a

j= 1, 2…, b

El modelo de los efectos está sobre parametrizado. Por lo tanto, hay a+b+1 dependencias
lineales en este sistema de ecuaciones y no existirá ninguna solución única.
A fin de obtener una solución, se imponen lo siguiente:

෍ 𝜏Ƹ 𝑖 = 0
𝑖=1 Restricciones
𝑏

෍ 𝛽መ𝑗 = 0
𝑗=1
a+b+1
𝑎 restricciones
෢ 𝑖𝑗 = 0
෍(𝜏𝛽) Para i= 1, 2…, a
𝑖=1
restricciones
𝑏
independientes
෢ 𝑖𝑗 = 0
෍(𝜏𝛽) Para j= 1, 2…, b
𝑗=1
Tomando en cuenta las restricciones, las ecuaciones normales se simplifican a:

𝜇ො = 𝑦…
𝜏Ƹ 𝑖 = 𝑦ത𝑖.. − 𝑦ത... Para i= 1, 2…, a

𝛽መ𝑗 = 𝑦ത.𝑗. − 𝑦ത... Para j= 1, 2…, b

෣ 𝑖𝑗 = 𝑦ത𝑖𝑗. − 𝑦ത𝑖.. − 𝑦ത.𝑗. + 𝑦ത...


(𝜏𝛽) Para i= 1, 2…, a

j= 1, 2…, b

Los efectos de los tratamientos de los renglones se estiman con el promedio del renglón
menos el gran promedio
Los tratamientos de las columnas se estiman con el promedio de la columna menos el
gran promedio y
La interacción ij-ésima se estima con el promedio de la celda ij-ésima menos el gran
promedio, el efecto del renglón i-ésimo y el efectos de la columna j-ésima
Por lo tanto: 𝑦ො𝑖𝑗 = 𝑦ത𝑖𝑗 La observación k-ésima se la celda ij-ésima se
estima con el promedio se las n observaciones
de esa celda

Cualquier función de los parámetros del modelo que sea una combinación lineal del
miembro izquierdo de las ecuaciones normales es estimable
Elección del tamaño de la muestra

Al utilizar las curvas de operación se busca encontrar el valor menor de 𝜑2 que corresponde
a una diferencia especificada entre las medias de dos tratamientos cualesquiera

Factor 𝜑2 Grados de Grados de


libertad del libertad del
numerador denominador
A 𝑏𝑛 σ𝑎𝑖=1 𝜏𝑖2 a-1 ab (n-1)
𝑎𝜎 2
B 𝑎𝑛 σ𝑏𝑗=1 𝛽𝑗2 b-1 ab (n-1)
𝑏𝜎 2
AB 𝑛 σ𝑎𝑖=1 σ𝑏𝑗=1(𝜏𝛽)2𝑖𝑗 (a-1)(b-1) ab (n-1)
𝜎 2 [ 𝑎 − 1 𝑏 − 1 + 1]
𝑛𝑏𝐷 2 D= Diferencia especificada entre medias de
𝜑2 = los tratamientos (filas)
2𝑎𝜎 2

𝑛𝑎𝐷 2 D= Diferencia especificada entre medias de


𝜑2 = los columnas
2𝑏𝜎 2

𝑛𝐷 2
𝜑2 = 2 D= Diferencia especificada entre dos
2𝜎 [ 𝑎 − 1 𝑏 − 1 + 1] efectos de interacción cualesquiera
DISEÑO SIN RÉPLICAS

Se puede considerar un diseño en el que se presentan dos factores y sólo se realiza una
observación por cada tratamiento:
En este caso, el número de parámetros a estimar es igual que en el caso previo:

1+(a-1)+(b-1)+(a-1)(b-1) = ab

Y como el número de observaciones es ab, entonces no hay grados de libertad suficientes


para estimar:

Una posible solución es considerar que la interacción es nula


Para i= 1, 2…, a
(𝜏𝛽)𝑖𝑗 = 0
j= 1, 2…, b
Se observa que al suponer interacción nula, el efecto de la interacción y el error
experimental se juntan.

Otra alternativa es suponer que el


efecto de la interacción es de la forma:

Donde K es una constante desconocida que se determina mediante regresión


Descomposición de la suma de cuadrados total

Una componente para la interacción con 1 grado de libertad, de modo que la suma de
cuadrados correspondiente es:

Una componente para Con (a-1) (b-1)-1


el error grados de libertad
Se determina

Si

La hipótesis nula de no interacción se rechaza


Factores del
experimento
fijos
𝑎 𝑏 𝑐 𝑛
𝑦 2
2 ….
𝑆𝑆𝑇 = ෍ ෍ ෍ ෍ 𝑦𝑖𝑗𝑘𝑙 −
𝑎𝑏𝑐𝑛
𝑖=1 𝑗=1 𝑘=1 𝑙=1
Para esto se necesita los
𝑎
2 totales de las celdas:
1 2 𝑦….
𝑆𝑆𝐴 = ෍ 𝑦𝑖… − A*B
𝑏𝑐𝑛 𝑎𝑏𝑐𝑛
𝑖=1 A*C
𝑏 B*C
1 𝑦 2
….
𝑆𝑆𝐵 = ෍ 𝑦.2𝑗.. −
𝑎𝑐𝑛 𝑎𝑏𝑐𝑛
𝑗=1
Para lo cual es conveniente
𝑐
2
desplegar los datos originales
1 2 𝑦…. en 3 tablas de 2 vías
𝑆𝑆𝑐 = ෍ 𝑦..𝑘. −
𝑎𝑏𝑛 𝑎𝑏𝑐𝑛
𝑘=1
𝑎 𝑏
1 𝑦 2
2 ….
𝑆𝑆𝐴𝐵 = ෍ ෍ 𝑦𝑖𝑗.. − − 𝑆𝑆𝐴 − 𝑆𝑆𝐵 𝑆𝑆𝐴𝐵 = 𝑆𝑆𝑆𝑈𝐵𝑇𝑂𝑇𝐴𝐿𝐸𝑆 𝐴𝐵 − 𝑆𝑆𝐴 − 𝑆𝑆𝐵
𝑐𝑛 𝑎𝑏𝑐𝑛
𝑖=1 𝑗=1

𝑎 𝑐
2
1 2 𝑦….
𝑆𝑆𝐴𝐶 = ෍ ෍ 𝑦𝑖.𝑘. − − 𝑆𝑆𝐴 − 𝑆𝑆𝐶
𝑏𝑛 𝑎𝑏𝑐𝑛 𝑆𝑆𝐴𝐵 = 𝑆𝑆𝑆𝑈𝐵𝑇𝑂𝑇𝐴𝐿𝐸𝑆 𝐴𝐶 − 𝑆𝑆𝐴 − 𝑆𝑆𝐶
𝑖=1 𝑘=1

𝑏 𝑐
1 𝑦 2
2 ….
𝑆𝑆𝐵𝐶 = ෍ ෍ 𝑦.𝑗𝑘. − − 𝑆𝑆𝐵 − 𝑆𝑆𝐶 𝑆𝑆𝐵𝐶 = 𝑆𝑆𝑆𝑈𝐵𝑇𝑂𝑇𝐴𝐿𝐸𝑆 𝐴𝐵 − 𝑆𝑆𝐵 − 𝑆𝑆𝐶
𝑎𝑛 𝑎𝑏𝑐𝑛
𝑗=1 𝑘=1
𝑎 𝑏 𝑐
1 𝑦 2
2 ….
𝑆𝑆𝐴𝐵𝐶 = ෍ ෍ ෍ 𝑦𝑖𝑗𝑘. − − 𝑆𝑆𝐴 − 𝑆𝑆𝐵 − 𝑆𝑆𝐶 − 𝑆𝑆𝐴𝐵 − 𝑆𝑆𝐴𝐶 − 𝑆𝑆𝐵𝐶
𝑛 𝑎𝑏𝑐𝑛
𝑖=1 𝑗=1 𝑘=1

𝑆𝑆𝐴𝐵𝐶 = 𝑆𝑆𝑆𝑈𝐵𝑇𝑂𝑇𝐴𝐿𝐸𝑆 (𝐴𝐵𝐶) − 𝑆𝑆𝐴 − 𝑆𝑆𝐵 − 𝑆𝑆𝐶 − 𝑆𝑆𝐴𝐵 − 𝑆𝑆𝐴𝐶 − 𝑆𝑆𝐵𝐶

𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝑆𝑈𝐵𝑇𝑂𝑇𝐴𝐿𝐸𝑆 (𝐴𝐵𝐶)


DISEÑO FACTORIAL GENERAL

Los resultados del diseño factorial de dos factores pueden ampliarse al caso general en
que hay a niveles del factor A, b niveles del factor B, c niveles del factor C, etc., dispuestos
en un experimento factorial.

En general, habrán abc…n observaciones totales si se hacen n réplicas del experimento


completo.

Cabe resaltar que es necesario que existan por lo menos dos replica para determinar una
suma de cuadrados debida al error si todas las interacciones posibles están incluidas en el
modelo.
ANOVA
Diseño factorial 2k
MODELOS DE EFECTOS ALEATORIOS
DOS FACTORES ALEATORIOS
DEFINICIÓN DE EFECTO
Diseños 22

Nomenclatura de diseños 22
Estimación en
diseños 22
DISEÑOS FACTORIALES 2K
Las cantidades entre corchetes en las ecuaciones anteriores se llaman contrastes. Se
puede utilizar los contrastes para calcular las sumas de cuadrados para A, B y la
intersección AB.

𝑎 𝑏 𝑛
2
2 𝑦…
𝑆𝑆𝑇 = ෍ ෍ ෍ 𝑦𝑖𝑗𝑘 −
4𝑛
𝑖=1 𝑗=1 𝑘=1

𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐴 − 𝑆𝑆𝐵 − 𝑆𝑆𝐴𝐵


EJEMPLO
En el laboratorio de una industria se evalúa el efecto de la concentración del reactivo y de
la cantidad del catalizador sobre la conversión (rendimiento) de un proceso químico. Sea
la concentración de un reactivo el factor A y cuyos valores ascienden a 15 y 25% los nos
niveles de interés. El catalizador es el factor B, con el nivel alto denotando el uso de 2 Lb
del catalizador y el nivel bajo denotando el uso de una lb. Se hacen las réplicas del
experimento obteniéndose lo siguientes datos:

Combinación de Replicas Factor Nom. Total


tratamientos I II III A, B
A bajo - B bajo 28 25 27 -,- (1) 80
A alto - B bajo 36 32 32 +,- a 100
A bajo – B alto 18 19 23 -,+ b 60
A alto – B alto 31 30 29 +,+ ab 90
2 lb.
(18+19+23) (31+30+29)
B= Cantidad de catalizador

=60 =90

=80 = 100

(28,25,27) (36+32+32)
1 lb.
A= Concentración del reactivo
15% 25%
100 + 90 − 60 − 80
= = 8,333
2∗3

60 + 90 − 100 − 80
= = −5,000
2∗3

90 + 80 − 100 − 60
= = 1,667
2∗3
(100 + 90 − 60 − 80)2
= = 208,333
4∗3

(60 + 90 − 100 − 80)2


= = 75,000
4∗3

90 + 80 − 100 − 60 2
= = 8,333
4∗3

𝑎 𝑏 𝑛
𝑦 2
2 …
𝑆𝑆𝑇 = ෍ ෍ ෍ 𝑦𝑖𝑗𝑘 − = 9398,00 − 9075,00 = 323,00
4𝑛
𝑖=1 𝑗=1 𝑘=1

𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐴 − 𝑆𝑆𝐵 − 𝑆𝑆𝐴𝐵 = 323,00 − 208,333 − 75,000 − 8,333 = 31,34
Fuente de Suma de Grados de Cuadrado Fo
Variación cuadrados libertad medio
Tratamiento A 208,333 1 208,333 53,15
Tratamiento B 75,000 1 75,000 19,13
Interacción AB 8,3333 1 8,333 2,13
Error 31,340 8 3,92
Total 323,000 11
Orden estándar u orden de Yates, por el Dr. Frank Yates

I = Total o promedio del experimento completo (multiplicación de los efectos)


Modelo de regresión

𝑦 = 𝛽𝑜 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝜀 𝑥𝑖 = es una variable codificada

𝐶𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑐𝑖ó𝑛 − (15 + 25)/2


𝐶𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑐𝑖ó𝑛 − (𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑐𝑖ó𝑛𝑏𝑎𝑗𝑎 + 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑐𝑖ó𝑛𝑎𝑙𝑡𝑎 )/2 𝑥1 =
𝑥1 = (25 − 15)/2
(𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑐𝑖ó𝑛𝑎𝑙𝑡𝑎 − 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑐𝑖ó𝑛𝑏𝑎𝑗𝑎 )/2

𝐶𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑐𝑖ó𝑛 − 20
𝑥1 =
5

𝑥1 25 = +1 𝑥2 15 = −1

𝐶𝑎𝑡𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑟 − (1 + 2)/2
𝐶𝑎𝑡𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑟 − (𝑐𝑎𝑡𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑟𝑏𝑎𝑗𝑎 + 𝑐𝑎𝑡𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑟𝑎𝑙𝑡𝑎 )/2 𝑥2 =
𝑥2 = (2 − 1)/2
(𝑐𝑎𝑡𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑟𝑎𝑙𝑡𝑎 − 𝑐𝑎𝑡𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑟𝑏𝑎𝑗𝑎 )/2

𝐶𝑎𝑡𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑟 − 1,5
𝑥2 =
0,5
𝑥1 1 = −1 𝑥2 15 = +1
Residuales y adecuación del modelo
Los residuales son las diferencias entre en valor observado y el valor ajustado de y.
𝑒1 = 28 − 25,835 = 2,165
8,333 −5
𝑦 = 27,5 + −1 + −1 = 25,835 𝑒2 = 25 − 25,835 = −0,835
2 2 𝑒3 = 27 − 25,835 = 1,165

𝑒1 = 36 − 34,165 = 1,835
8,333 −5
𝑦 = 27,5 + +1 + −1 = 34,165 𝑒2 = 32 − 34,165 = −2,165
2 2 𝑒3 = 32 − 34,165 = −2,165

𝑒1 = 18 − 20,835 = −2,835
8,333 −5
𝑦 = 27,5 + −1 + +1 = 20,835 𝑒2 = 19 − 20,835 = −1,835
2 2 𝑒3 = 23 − 20,835 = 2,165
𝑒10 = 31 − 29,165 = 1,835
8,333 −5 𝑒11 = 30 − 29,165 = 0,835
𝑦 = 27,5 + +1 + +1 = 29,165
2 2 𝑒12 = 29 − 29,165 = −0,165
Superficie de respuesta Gráfica de contorno
EL DISEÑO 23
Suponga que tres factores A,B,C, cada uno con dos niveles, son de interés.
En este caso la representación geométrica de las ocho combinaciones de tratamientos
puede hacerse con un cubo
Corrida A B C Etiquetas A B C
1 - - - (1) 0 0 0
2 + - - a 1 0 0
3 - + - b 0 1 0
4 + + - ab 1 1 0
5 - - + c 0 0 1
6 + - + ac 1 0 1
7 - + + bc 0 1 1
8 + + + abc 1 1 1
Análisis de diseños 2k
Efecto o contraste
Nomenclatura de diseños 2k
R2
La R2 ordinaria mide la proporción de la variabilidad total
explicada por el modelo. 𝑆𝑆𝑚𝑜𝑑𝑒𝑙𝑜
𝑅2 =
Un problema potencial con este estadístico es que siempre e 𝑆𝑆𝑡𝑜𝑡𝑎𝑙
incrementa cuando se agregan factores al modelo, incluso
cuando estos factores no son significativos.

2
El 𝑅𝐴𝑗𝑢𝑠𝑡𝑎𝑑𝑜 es un estadístico que esta ajustado 𝑆𝑆𝐸 /𝑑𝑓𝑒
2
para el “tamaño” del modelo; es decir, para el 𝑅𝐴𝑗𝑢𝑠𝑡𝑎𝑑𝑜 =1−
𝑆𝑆𝑡𝑜𝑡𝑎𝑙 /𝑑𝑓𝑇𝑜𝑡𝑎𝑙
número de factores. Este puede decrecer si se
agregan términos no significativos al modelo.
El estadístico PRESS (Prediction Error Sum of Squares) es una medida que también
predecirá datos nuevos en el modelo y se calcula a partir de los errores de predicción
obtenidos al predecir el punto i-ésimo de las observaciones, excepto la i-ésima.

Un modelo con un valor pequeño de 𝑃𝑅𝐸𝑆𝑆


2
PRESS indica que es posible que el 𝑅𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖ó𝑛 =1−
𝑆𝑆𝑡𝑜𝑡𝑎𝑙
modelo sea un buen predictor.

Coeficiente de regresión de cada


𝑀𝑆𝐸
término del modelo y el error estándar 𝑠𝑒 𝛽መ =
(se, stand error) de cada coeficiente. 𝑛2𝑘
Intervalos de confianza de 95% para cada coeficiente de regresión se calculan a partir
de:

𝛽መ − 𝑡𝑜,𝑜25,𝑁−𝑝 𝑠𝑒 𝛽መ ≤ 𝛽 ≤ 𝛽መ + 𝑡𝑜,𝑜25,𝑁−𝑝 𝑠𝑒(𝛽)


GL de t=GL del error


P=número de parámetros del modelo

Error puro (pure error)=suma de cuadrados de los residuales o del error que surge de
las réplicas de los efectos principales.
Falta de ajuste (Lack of fit)=suma de cuadrados de las interacciones o factores que se
elimaron del modelo.
Otros métodos para evaluar la significación de los efectos

a) Error estándar de los efectos


𝑛
Si se supone que hay n réplicas en cada una de las 1
2k corridas del diseño, y si yi1, yi2,….,yin son las 𝑆𝑖2 = ෍(𝑦𝑖𝑗 − 𝑦ത𝑖 )2
𝑛−1
observaciones de la corrida i-ésima: 𝑗=1

2𝑘 𝑛
Las estimaciones de la varianza del diseño 2k 1
𝑆𝑖2 = 𝑘 ෍ ෍(𝑦𝑖𝑗 − 𝑦ത𝑖 )2
pueden combinarse para dar una estimación de 2 (𝑛 − 1)
𝑖=1 𝑗=1
la varianza global:

La varianza de la estimación de cada 𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒


𝑉 𝑒𝑓𝑒𝑐𝑡𝑜 = 𝑉( 𝑘−1
)
efecto es: 𝑛2

𝑘 2
2𝜎
𝑉 𝑐𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 = 𝑛2 𝜎 𝑉 𝑒𝑓𝑒𝑐𝑡𝑜 =
𝑛2𝑘
El error estándar estimado se 2𝑆
𝑠𝑒 𝑒𝑓𝑒𝑐𝑡𝑜 =
encontraría sacando la raíz 𝑛2𝑘
cuadrada y sustituyendo σ2con
su estimación S2

Los intervalos de confianza de 100(1-α) por ciento para los efectos se calculan a partir
de efecto ± tα/2, N-p *se(efecto) donde los grados de libertad de t son solo los grados
de libertad de los residuales o del error (N-p= número total de corridas- número de
parámetros del modelo)
b) Efectos de dispersión

Para esto se examina el RANGO de las desviaciones.


EJEMPLO
Presión de operación(B)
25 psi 30 psi
Rapidez de la línea Rapidez de la línea
(C) (C)
Porcentaje de
200 250 200 250
carbonatación(A)
-3 -1 -1 1
10
-1 0 0 1
0 1 2 6
12
1 7 3 5
SSA = 36,00 GLA = 1 MSA = 36,00 FA = 57,6
SSB = 20,25 GLB = 1 MSB = 20,25 FB = 32,4
SSC = 12,25 GLC = 1 MSC = 12,25 FC = 19,6
SSAB = 2,25 GLAB = 1 MSAB = 2,25 FAB = 3,6
SSAC = 0,25 GLAC = 1 MSAC = 0,25 FAC = 0,4
SSBC = 1 GLBC = 1 MSBC = 1 FBC = 1,6
SSABC=1 GLABC= 1 MSABC=1 FABC=1,6
SSE = 5 GLE = 8 MSE = 0,625
SST = 78 GLT= 15
EJEMPLO
Un vendedor de plástico para empaques flexibles está ayudando a uno de sus clientes, el
que reclama que el plástico que este le vende, no sella bien.
La forma de medir el sello es por medio de la fuerza requerida para separarlo, y las
unidades con las que esto se mide son: gramos/centímetro cuadrado
Ho: efecto de temperatura=0 Ho: efecto de Presión=0 ……..
H1: efecto de la temperatura≠ 0 H1: efecto de la Presión ≠ 0

Matriz del
arreglo
factorial
Se realizó el experimento en la plata del cliente y se obtuvieron los siguientes resultados
Si se dispone de solo una réplica del experimento entonces la suma de cuadrados del
error es nula y no es posible utilizar una tabla de análisis de varianza para determinar
cuales efectos son significativos.

Si se supone que no hay ningún efecto significativo y que los errores cometidos en cada
medición siguen una distribución normal con media 0 y varianza s2, entonces para
todos los efectos:
•Considerando que a pesar que el número de factores en un diseño factorial 2k sea
moderado, la cantidad total de combinaciones de tratamientos es grande.

•Como generalmente los recursos son limitados, el número de réplicas que un


experimentador puede realizar puede estar limitado. Es así que con frecuencia los
recursos disponibles permiten ejecutar sólo una vez el experimento a menos que el
investigador esté dispuesto a desechar algunos factores originales.

•Se llama factorial no replicado a la repetición individual de un diseño 2k. Una sola
réplica en el diseño 2k

También podría gustarte