Está en la página 1de 19

1

EXPERIMENTOS FACTORIALES 2
k
Este tipo de diseos experimentales consiste de un plan experimental en donde se estudia el efecto sobre
una respuesta de k factores, cada uno con dos niveles. Generalmente los niveles en cada factor son
denotados como bajo y alto, que en forma codificada representamos por 1 y +1 respectivamente. El diseo
factorial completo requiere que cada nivel de todos los factores ocurra con cada nivel de todos los dems
factores, lo que equivale a un total de 2
k
tratamientos. Obviamente este tipo de diseo es de efectos fijos.
Este tipo de diseo ha sido el de mayor impacto a nivel industrial y en la investigacin, por su eficacia y
versatilidad. Los factoriales 2
k
completos son principalmente tiles cuando el nmero de factores a estudiar
est entre 2 y cinco, es decir 2 s k s 5, rango en el cual el nmero de tratamientos se encuentra entre 2 y
32, cantidad manejable en muchas situaciones experimentales. Si el nmero de factores es mayor que 5 se
recomienda utilizar un factorial fraccionado 2
k-p
, que se estudiar ms adelante. En general, los factoriales
en dos niveles sean completos o fraccionados, constituyen el conjunto de diseos de mayor impacto en las
aplicaciones. Estos permiten atacar todo tipo de problemas y procesos de manera eficiente.

En los clculos relacionados con el ANOVA y las estimaciones de este tipo de experimentos, suele usarse
un sistema de notacin conocido en la literatura como Notacin de Yates con la cual se representa el total
de las sumas de las observaciones en cada tratamiento, para comprenderla, se proceder a continuacin
con el caso de un experimento factorial 2
2
.
EXPERIMENTOS FACTORIALES 2
2
Suponga que se tiene un experimento de dos factores, en donde se han hecho n observaciones
experimentales por tratamientos. Denote por:
(1) Valor total en el primer nivel del factor A y primer nivel del segundo factor B,
a Valor total en el primer nivel del factor B y segundo nivel del factor A.
b Valor Total en el primer nivel del factor A , segundo nivel del factor B
ab Valor Total en el segundo nivel del factor A , segundo nivel del factor B.

Vea la tabla siguiente en la cual se indica el uso de la notacin anterior para el clculo de las medias en
cada nivel para cada factor:

B
-1 +1
Media
-1
(1) b
( )
1
2
( ) b
n
+
A
+1
a ab
( )
2
a ab
n
+
Media
( )
1
2
( ) a
n
+
( )
2
b ab
n
+
( )
2
1
2
( ) a b ab
Y
n

+ + +
=
Tabla 1

2
Representacin geomtrica del factorial 2
2
Figura 1: Representacin del diseo factorial 2
2
Estimacin de contrastes y efectos
Para el clculo de las estimaciones de contrastes de totales de tratamientos en general se usa la siguiente
tabla de signos los cuales deben considerarse como el signo a colocar a los totales de tratamientos, segn
el contraste de que se trate; los signos indican para cada factor en cual de los dos niveles bajo(-) o alto (+)
se encuentra en el tratamiento correspondiente:

Efecto factorial
Combinacin o
tratamiento
A B AB
(1)
- - +
a
+ - -
b
- + -
ab
+ + +
Tabla 2

Note que para la interaccin AB los signos en cada combinacin de niveles corresponde al producto de los
signos de cada factor en la respectiva combinacin o tratamiento. Con base en las tablas 1 y 2, podemos
calcular los efectos de cada factor y el efecto de interaccin, as:

Efecto principal del factor A: Es la respuesta promedio observada en el nivel alto del factor A menos la
respuesta promedio en el nivel bajo del mismo factor, y lo denotaremos por o oo oA entonces:

1
2
( )

A
a ab b
n
o
+
= (ec. 1)
3
El contraste asociado a este efecto segn la tabla 2 y usando la notacin de Yates, es
1

( )
A
a ab b e = + . Geomtricamente, el efecto de A equivale a promediar los datos del lado derecho
del cuadrado en la figura 1 y restarle el promedio de los datos del lado izquierdo.

Efecto principal del factor B: Es la respuesta promedio observada en el nivel alto del factor B menos la
respuesta promedio en el nivel bajo del mismo factor, y lo denotaremos por o oo oB entonces:

1
2
( )

B
b ab a
n
o
+
= (ec. 2)

El contraste asociado segn la tabla 2 es 1

( )
B
b ab a e = + . Geomtricamente corresponde a
promediar los datos del lado superior del cuadrado de la figura 1 y restarle el promedio de los datos del lado
inferior.

Efecto de Interaccin de los factores A y B, o oo oAB: Est dado por la diferencia entre el efecto de A en el
nivel alto de B y el efecto de A en el nivel bajo de B,
1 1
2 2 2
( ) ( )

AB
ab b a ab a b
n n n
o
+
= = (ec. 3)

O bien, es la diferencia entre el efecto de B en el nivel alto de A y el efecto de B en el nivel bajo de A,
1 1
2 2 2
( ) ( )

AB
ab a b ab a b
n n n
o
+
= = (ec. 4)

El contraste de los totales de tratamientos asociado a esto efecto, segn la tabla 2 es
1

( )
AB
ab a b e = + . Geomtricamente, la interaccin est dada por la diferencia entre las medias de los
datos de las diagonales del cuadrado de la figura 1.

ANOVA EN UN FACTORIAL 2
2
Para afirmar que cualquiera de los efectos (principales y de interaccin) contribuyen a explicar el
comportamiento de la variable respuesta se debe hacer el ANOVA. Para el clculo de las sumas de
cuadrados se puede recurrir a la formulacin de contrastes entre los totales de tratamientos, los
cuales son aquellas sumas involucrados en los clculos de los efectos. La suma de cuadrados debida a un
contraste ede los 2
k
totales de tratamientos, est dada por:
2
2
2
1

k
i
i
SS
n c
e
e
=
=

(ec. 5)
donde

e es la estimacin del respectivo contraste de totales de tratamientos, a partir de los datos


observados.

Expresiones para las sumas de Cuadrados: Las sumas de cuadrados pueden obtenerse directamente de
los contrastes de tratamientos sin calcular los efectos, o usando los efectos. Dado que los efectos
4
proporcionan informacin ms interpretable que los contrastes de totales, se recomienda calcularlos
siempre. Por tanto, los pasos para el ANOVA son los siguientes:

1. Obtener los contrastes de totales asociados a cada efecto en el diseo,

A
e ,

B
e , y

AB
e
2. Estimar los efectos

A
o ,

B
o y

AB
o , dividiendo el respectivo contraste por la constante que los
convierte en diferencias de medias. En general para un factorial completo 2
k
con n rplicas esta
constante es
1
2
( ) k
n

, por tanto para el factorial 2
2
dicha constante es 2n.
3. Calcular las sumas de cuadrados usando la ec. 5, que simplificando se llega a:

( )
2
2
2

A
B
AB
SSA n
SSB n
SS AB n
o
o
o
=
=
=
(ec. 6)

Cada una de las sumas de cuadrados anteriores tiene 1 grado de libertad.

4. La suma de cuadrados totales se calcula mediante la expresin:

2 2 2
2
2
1 1 1
2
n
ijl
i j l
Y
SST Y
n

= = =
=

(ec. 7)
y tiene 2
2
n-1 grados de libertad. El SSE se halla por diferencia.

ANOVA
Fuente g.l S.C CM F
A 1 SSA MSA MSA/MSE
B 1 SSB MSB MSB/MSE
AB 1 SS(AB) MS(AB) MS(AB)/MSE
Error 4(n-1) SSE MSE
Total n2
2
-1 SST MST
Las hiptesis asociadas, son:

H0 : Efecto de AB = 0, H0 : Efecto de A = 0, H0 : Efecto de B = 0

Cada una contra la alternativa de que el efecto en cuestin es distinto de cero.

Observacin: Note en la tabla ANOVA que es necesario al menos dos rplicas del experimento en cada
tratamiento. Con una rplica se tendran cero grados de libertad para el error, no se podra entonces
calcular el MSE y por tanto no habra ANOVA. Se recomienda correr un factorial 2
2
con al menos tres
rplicas para poder calcular el MSE de manera confiable.

5
DISEO FACTORIAL GENERAL
Este diseo con k factores cada uno en dos niveles genera 2
k
tratamientos o puntos de diseo. La matriz
para este diseo, considerando una rplica, se puede construir de la siguiente manera:
En la columna 1 de la matriz correspondiente a los niveles del factor A, se alternan los signos + y ,
empezando con -, hasta llegar a los 2
k
renglones;
En la segunda columna que corresponde al factor B, se alternan dos signos con dos signos +;
En la tercera columna que corresponde al factor C, se alternan cuatro signos con cuatro signos +;
As sucesivamente, hasta la k-sima columna compuesta de 2
k-1
signos seguidos de 2
k-1
signos +
Los signos en las columnas correspondientes a los grupos de interacciones resultan de multiplicar las
columnas de los factores que aparecen en cada interaccin. Por ejemplo, para la columna de los
signos que define el contraste del efecto ACD en un factorial 2
5
se multiplican las columnas de los
signos de ACD.
En la figura 2 se presenta diseos factoriales 2
k
y los signos de los efectos principales, para k s 5.

Figura 2: Familia de diseos factoriales 2
k
, ks ss s5
Estimacin de contrastes, efectos y sumas de cuadrados
Cada uno de los efectos se estima a partir de su contraste, el cual a su vez puede obtenerse construyendo
la matriz de signos del diseo. Recordemos que la matriz de signos consiste en determinar los signos que
llevan los totales de tratamientos en la notacin de Yates para formar el contraste de cada efecto. Una vez
construida la matriz de signos, el contraste de cada efecto se obtiene al multiplicar su columna de signos por
la columna de totales expresados en la notacin de Yates. Con los contrastes se procede a calcular los
efectos estimados mediante:

1
2
Contraste
Efecto
k
ABC K
ABC K
n

=

(ec. 8)

La suma de cuadrados con un grado de libertad respectiva est dada por:

6
( )
[ ]
2
2
Contraste
k
ABC K
SS ABC K
n
=

(ec. 9)
donde n es el nmero de rplicas de cada tratamiento.

La suma de cuadrados totales se calcula como:

2 2
2
1
2
k
i k
i
Y
SST Y
n

=
=

(ec. 10)
con 2 1
k
n grados de libertad, donde
i
Y representa el total de observaciones en el tratamiento i segn
numeracin de los tratamientos en la matriz de signos del diseo y Y

es la suma de las observaciones en


todo el diseo. La suma de cuadrados del error y sus grados de libertad se hallan por diferencia.

Si se desea incluir en el ANOVA todos los posibles efectos que se puedan estimar con el factorial completo
2
k
ser necesario realizar al menos dos rplicas por tratamiento para estimar una suma de cuadrados del
error con grados de libertad no nulos. Sin embargo, en la mayora de los casos interesa slo estudiar a los
efectos principales y a las interacciones dobles. Esto hace que cuando el nmero de factores es k > 4 no es
estrictamente necesario realizar rplicas, puesto que se puede construir una suma de cuadrados del error
aproximada, utilizando las sumas de cuadrados de las interacciones triples y de orden superior que
generalmente son pequeas.

Tambin ha de tenerse en cuenta que al usar un diseo factorial 2
k
se supone que la variable respuesta es
aproximadamente lineal en el rango de variacin de cada uno de los k factores estudiados. No es necesario
suponer una linealidad perfecta, pero s que no haya una curvatura muy grande. De esta forma, dado que
cada factor se prueba slo en dos niveles no es posible estudiar efectos de curvatura (efectos del tipo A
2
, B
2
,
etc.) aunque sta exista en el proceso; para estudiar tales efectos se necesitan al menos tres niveles en
cada factor. Esto no implica que de entrada sea recomendable un diseo factorial con al menos tres niveles
en cada factor, sino que en primera instancia se pueden agregar replicaciones (al menos tres) en el centro
del diseo factorial 2
k
, y con ellas se puede detectar la presencia de curvatura. Si se detecta curvatura, las
replicaciones al centro no sern suficientes para estudiarla y ser necesario aumentar el diseo para
investigar mejor dicha curvatura.

DISEO FACTORIAL 2
K
NO REPLICADO
A medida que aumenta el nmero de factores en un diseo factorial 2
k
el nmero de tratamientos crece
considerablemente y por tanto el nmero de corridas experimentales. Las replicaciones aumentan las
corridas experimentales y puede ser altamente costoso en tiempo y recursos realizar la experimentacin.
Adems a veces es suficiente una sola rplica por tratamiento para estudiar los efectos de inters. En la
tabla 3 se presentan el nmero de rplicas y de corridas recomendadas para algunos diseos 2
k
. Ntese
que en ninguno de los diseos listados en esta tabla tiene ms de 32 corridas, sin contar las posibles
repeticiones al centro. Se puede afirmar que la mayora de los experimentos 2
k
o fracciones de ellos que se
utilizan en la prctica requieren a lo ms 32 corridas experimentales y con ellas se puede estudiar hasta una
7
cantidad grande de factores (k > 8). Ms an, un mximo de 16 pruebas son suficientes para la mayora de
los problemas en una primera etapa de experimentacin.

Una sola rplica del factorial 2
k
completo es una estrategia adecuada cuando se tienen cuatro o ms
factores, considerando que a partir de k = 4 se tiene mucha informacin con el diseo factorial completo.
Esta informacin extra se refleja en que los efectos de inters primario, como lo son los efectos principales y
las interacciones dobles, se estiman con gran precisin, pero adems se pueden estimar interacciones de
mayor orden las cuales generalmente no son significativas. Estas interacciones de mayor orden pueden
usarse para estimar un error que permita construir un ANOVA aproximado, en el cual el SSE sera la suma
de las sumas de cuadrados de los efectos utilizados o mandados al error, y sus grados de libertad son
tantos como los efectos que se aglomeren para conformar dicho error. Los pasos para construir el SSE del
ANOVA en un factorial 2
k
con una sola rplica son los siguientes:

1. Suponer de antemano que las interacciones de tres o ms factores no son significativas y enviarlas
directamente al error. Pero antes es recomendable que antes de hacer esto se verifique que las
interacciones triples y dems efectos no son significativos, mediante tcnicas grficas tales como los
diagramas de Pareto de efectos y el grfico de Daniel.
2. Despus de decidir cules de los efectos principales, de interacciones dobles, triples y de orden
superior, pueden enviarse al error, con los efectos excluidos se obtiene una suma de cuadrados del
error con la cual se construye la tabla ANOVA, la cual es una aproximacin puesto que existe el
riesgo de que la magnitud del error as construido no sea correcta dado que no se basa en
replicaciones autnticas.
3. Una manera de saber si el MSE resultante es apropiado es compararlo con la varianza o
2
tpica que
haya observado la respuesta en su comportamiento previo al experimento.
4. Se deben mandar al error al menos 8 efectos pequeos para tener mayores probabilidades de que
est bien estimado.

Decisin sobre cules efectos enviar al error
Existen varias tcnicas para detectar con bastante seguridad y sin necesidad de una ANOVA, cules
efectos enviar al error. Saber usar estas tcnicas permite construir un MSE con buena aproximacin. Si se
enva al error un efecto real, es decir con significancia, esto puede inflar el MSE lo que reducira potencia al
ANOVA para detectar efectos significativos. Por otro lado , si el error resulta muy pequeo, se estara
detectando como significativos efectos que no lo son, lo cual llevara a decisiones incorrectas. Un MSE muy
alejado del o
2
histrico de la respuesta, es un sntoma de que posiblemente se est haciendo una mala
estimacin de ste.

En un experimento pueden existir tres tipos de efectos: Los que claramente son significativos, los que
claramente no afectan y efectos intermedios sobre los cuales no es claro si son significativos o no. Esto
ltimos son los problemticos para nosotros. Las tcnicas para decidir qu efectos enviar al error no
funcionan bien cuando el diseo completo tiene pocos efectos, como el caso de diseos 2
2
y 2
3
, pero estos
por lo general se corren con rplicas. Las tcnicas que se presentan a continuacin son tiles para
factoriales con k > 4 factores.

8
Grfico de efectos en papel normal (Daniels Plot): Considerando que los efectos estimados como
sumas de variables aleatorias, los efectos no significativos deben seguir una distribucin normal con media
igual a cero y varianza constante. Por tanto, si graficamos los efectos sobre papel de probabilidad normal,
aquellos que son no significativos tendern a formar una lnea recta ubicada a la altura del cero, lo que
permite comprobar que tales efectos son insignificantes. Por otro parte, los efectos activos o significativos
aparecern alejados de la lnea de normalidad, lo que indica que no se deben slo al azar, sino a la
existencia de efectos reales que influyen en la respuesta. Entre ms alejado de la lnea ms importante ser
el correspondiente efecto.

Cuando se tienen efectos positivos y negativos puede ser mejor utilizar un grfico de probabilidad medio
normal (half normal plot) para visualizar mejor cules efectos se alinean y cules no. Este grfico utiliza
slo la parte positiva de la distribucin normal estndar aprovechando su simetra y el hecho de que dos
efectos de signo contrario y de la misma magnitud son igualmente importantes.

Diagrama de Pareto de efectos: Este Pareto es una grfica de barras que representa los efectos sin
estandarizar ordenados en forma descendente (de mayor a menor) de acuerdo a con su magnitud absoluta.
Es una forma fcil de ver cules efectos son los ms grandes en cuanto a su magnitud y presentan la
realidad observada de los efectos de modo descriptivo sin considerar supuestos distribucionales.

Muchas veces con el diagrama de Pareto y el grfico de probabilidad normal de los efectos se logra detectar
claramente los efectos significativos. Se dice que el diagrama de Pareto trabaja limpiamente cuando quedan
bien delimitados los diferentes grupos de efectos, de los ms a los menos importantes, como se aprecia en
la figura 3a. En esta figura cada concavidad de la lnea superpuesta a las barras indica las oleadas que
ocurren, y en este caso bsicamente habran dos posibilidades para construir el error en un factorial 2
k
no
replicado o an, en la definicin del mejor ANOVA en general, y hacer el anlisis de varianza: Excluir el
primer grupo de menor importancia o tambin el segundo grupo de menor importancia. Pero si las barras
del diagrama quedan como escalones de igual tamao como en la figura 3b, el principio de Pareto no opera
limpiamente, y en tal caso es necesario usar criterios que ayuden a dilucidar dnde hacer el corte de
exclusin.
Figura 3: Diagramas Pareto que funcionan a) limpiamente y
b) No es obvio dnde hacer el corte

Otros criterios tiles: Cuando hay un grupo de efectos cuya magnitud no es ni muy grande ni muy
pequea, es difcil decidir si deben mandarse al error o no. En ocasiones ni el grfico de Daniel ni el
9
diagrama de Pareto aclaran bien la situacin de tales efectos. Se requiere utilizar otros criterios adicionales.
Se recomienda considerar todos estos criterios y no slo uno de ellos:
1. La magnitud del efecto. Por experiencia en el proceso, la magnitud del efecto puede indicar si ste
se debe slo al azar, en cuyo caso se mandara al error, o si se debe a un efecto real. Se puede
comparar el efecto observado con el error estndar basado en una varianza histrica: en el factorial
2
k
con una rplica se compara el efecto observado contra dos veces el error estndar del efecto es
decir contra
2
2 2 /
k
o

. Si el primero es mayor entonces es un efecto real (significativo).
2. Los efectos que en ANOVAS preliminares tuvieron un valor P cerca de 0.2 o menores no se excluyen
del anlisis necesariamente. Esta decisin es ms confiable cuando dichos ANOVAS preliminares
alcanzaron al menos 8 grados de libertad para el error. Si primero se excluyen los efectos que no
son claramente significativos de acuerdo al grfico de Daniel y al Pareto, se pueden lograr ANOVAS
cuyas significancias dan informacin til para excluir o no los efectos restantes.
3. Los grados de libertad del error deben ser al menos 8 para tener un ANOVA ms confiable.
4. El R
2
adj de los ANOVAS preliminares. Cuando se eliminan efectos no significativos, este estadstico
crece. En el momento en que se elimine un efecto y este estadstico decrece, posiblemente tal efecto
no deba excluirse, aunque tambin debe tenerse en cuenta la magnitud del decrecimiento. Se
requiere que el decrecimiento mencionado sea de cuando menos 3% para que valga la pena incluir
otra vez al efecto.

Colapsin o proyeccin del diseo: Cuando en el mejor ANOVA que se pudo determinar se detecta que
un factor particular no es significativo, ya que su efecto principal y todas las interacciones en las que
interviene no son importantes, entonces en lugar de mandar al error ese factor y sus interacciones, otra
posibilidad es colapsar el diseo, es decir, eliminar completamente del anlisis a tal factor con lo que el
diseo original 2
k
no replicado se convierte en un diseo factorial completo con un factor menos, 2
(k-1)
(no
confundir con el diseo fraccin , 2
k-1
) con dos rplicas en cada punto del diseo resultante. En general si
se eliminan h factores del diseo factorial, los datos se convierten en un diseo factorial 2
(k-h)
completo con
2
h
rplicas en cada punto del diseo. En la figura 4 se representa la accin de colapsar un factorial 2
3
.
Figura 4: Accin de colapsar un factorial 2
3
, eliminando el factor C

ANLISIS DEL EXPERIMENTO
Pareto estandarizado: Los efectos tanto principales como de interaccin pueden graficarse en un
diagrama de Pareto para visualizar cules de estos tienen mayor impacto sobre la variable respuesta. Para
ello los efectos estimados son estandarizados dividiendo cada uno entre su error estndar. Para los diseos
factoriales 2
k
se tiene que tal error estndar est dado por:
10
2
2

Efecto k
MSE
n
o

= (ec. 11)
En el diagrama Pareto se grafica la estimacin de los efectos estandarizados:
2
2
Efecto
Efecto estandarizado
k
MSE
n

= (ec. 12)
Este Pareto es una grfica de barras que representa los efectos estandarizados ordenados en forma
descendente (de mayor a menor) de acuerdo con su magnitud absoluta.

Los efectos estandarizados tambin sirven para probar las hiptesis de significancia del respectivo efecto.
As tales efectos se consideran significativos si:

2 2 1 / , ( )
|Efecto estandarizado|>
k
n
t

Por tanto, una forma sencilla de hacer esta prueba es agregar una lnea en el diagrama de Pareto
estandarizado a la altura del valor crtico, as, los efectos cuyas barras en el diagrama que superen tal lnea
sern los efectos significativos.

El mejor ANOVA: A veces en un experimento resultan efectos que son claramente significativos y otros
cuyo valor P est cercano del nivel de significancia, por lo que la decisin en estos casos es una decisin
con mayores riesgos de error. Con el fin de aclarar cules fuentes de variacin son significativas y obtener
un modelo final en el que slo se incluyan trminos significativos, es usual construir el mejor ANOVA, en el
que en un primer paso se eliminan del anlisis y se mandan al error a los efectos que claramente son no
significativos. Despus de este paso se revalora a los trminos que estaban en una situacin dudosa. En
una segunda ronda se eliminan lo trminos que no resulten significativos despus de la ronda inicial.

De la anterior forma, se llega a un ANOVA que contiene slo trminos significativos, y este es considerado el
mejor ANOVA. Tambin al final de este anlisis se obtiene el coeficiente de determinacin el cual tambin
debe ser valorado.

Coeficientes de determinacin R
2
y R
2
adj: Estos dos estadsticos miden la proporcin o variabilidad en los
datos experimentales que es explicada por el modelo. En general para fines de prediccin se recomienda
un R
2
adj de al menos 70%. Cuando hay muchos factores se prefiere el R
2
adj. En caso de que estos
estadsticos sean pequeos, esto indicara que el efecto o variabilidad atribuible a los factores estudiados es
pequea comparada con el resto de la variacin observada en el experimento, lo cual puede deberse a una
o varias de las siguientes razones:
Los factores estudiados por s solos no tienen la suficiente influencia para explicar las variaciones
observadas en la variable respuesta.
Los niveles de los factores estudiados son demasiado estrechos, por lo que el efecto sobre la
variable respuesta al cambiar de un nivel a otro, es demasiado pequeo.
11
Otros factores no estudiados en el experimento no se mantuvieron suficientemente fijos, por lo cual
las variaciones en estos causaron mucha variacin experimental.
Los errores experimentales y de medicin fueron altos.

Se deben analizar cules de las anteriores razones influyeron para tener coeficientes de determinacin
bajos, y no caer en el error de desechar el experimento y creer que no sirvi. Todo experimento genera
informacin que puede servir para plantear nuevas conclusiones y nuevos estudios experimentales.

Anlisis de los residuales: La desviacin estndar de los residuales en cada tratamiento indica cul
tratamiento tiene menor variabilidad. Una prueba estadstica para la hiptesis de igualdad de varianzas en
dos tratamientos diferentes
2 2
0 ( , ) ( , )
:
i j i j
H o o = con ( , ) ( , ) i j i j = , se basa en el siguiente estadstico de
prueba:
( )
0
2
0 2
0 1
( , )
( , )
log ~ ,
H
i j
i j
S
Z N
S
(
=
(
(

(ec. 13)
se rechaza H0 si
0 2 /
Z Z
o
> .
Verificacin de los supuestos: Deben verificarse antes de tomar por vlidas las conclusiones de los
anlisis estadsticos.

Para chequear: Graficar residuales contra:
Independencia Orden de las observaciones (segn espacio o tiempo)

Varianza igual y outliers Valores predichos, vs. niveles de cada factor de
estudio en el experimento

Normalidad Scores normales
Conclusiones e impacto econmico: A partir de un buen experimento y del anlisis de los resultados se
establecen conclusiones acerca de cmo mejorar el proceso en estudio. Con el modelo ANOVA se hace un
pronstico acerca de cmo puede mejorar el proceso. Despus de un periodo dado de implementacin de
las medidas sugeridas por el experimento es necesario valorar desde el punto de vista econmico si se
lograron los cambios deseados y en la magnitud esperada. Es posible que no se logren resultados en la
medida esperada, por lo que es importante tener en cuenta que para lograr mejoras importantes se requiere
mantener el nfasis en hacer experimentos secuenciales para abordar los problemas hasta eliminarlos por
completo.
12
EJEMPLO
Se lleva a cabo un experimento para aumentar la capacidad de adhesin de productos de caucho. Se
fabrican 8 productos con el nuevo aditivo y otros 8 sin ste. Las capacidades de adhesin se registran a
continuacin:
TEMPERATURA(C)
50 60
Sin Aditivos 2.3 2.9
(11.5)
3.1 3.2
3.4 3.7
(13.9)
3.6 3.2
Con aditivos 4.3 3.9
(16.3)
3.9 4.2
3.8 3.8
(15.0)
3.9 3.5
(* ): Total

Realice un anlisis de Varianza para determinar la significancia de los efectos principales y de la interaccin.

Solucin:
1
GRFICOS DE INTERACCIN
1
proc gplot data=adhesion;
plot adhesion*temperat=aditivos;
plot adhesion*aditivos=temperat;
symbol1 i=hilotj V=star c=red h=.5;
symbol2 i=hilotj V=star c=green h=0.5;
run;quit;

proc glm data=adhesion;
class temperat aditivos;
model adhesion=temperat aditivos temperat|aditivos;
run;

13
BOXPLOTS COMPARATIVOS POR FACTOR
Con el programa SAS se obtuvieron los primeros dos grficos, y con R el anlisis de Varianza:
Los datos del experimento fueron guardados es un archivo .txt con los niveles de los dos factores
codificados con 1 y 1, como se muestra a continuacin:
datos<-read.table(file.choose(),header=T) ##para leer los datos desde el archivo
aditivos<-datos[[1]]
temperatura<-datos[[2]]
adhesion<-datos[[3]]
anova(lm(adhesion~aditivos+temperatura+aditivos*temperatura) ) ##construye el ANOVA sgte.
Analysis of Variance Table
Response: adhesion
Df Sum Sq Mean Sq F value Pr(>F)
aditivos 1 2.17562 2.17562 30.6246 0.0001290 ***
temperatura 1 0.07562 0.07562 1.0645 0.3225344
aditivos:temperatura 1 0.85562 0.85562 12.0440 0.0046272 **
Residuals 12 0.85250 0.07104
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
14
summary(lm(adhesion~aditivos+temperatura+aditivos*temperatura) ) ##Realiza regresin de
##adhesin vs. aditivos,
##temperatura e interaccin
Call:
lm(formula = adhesion ~ aditivos + temperatura + aditivos * temperatura)
Residuals:
Min 1Q Median 3Q Max
-0.5750 -0.1750 0.0500 0.1688 0.3250
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.54375 0.06663 53.182 1.29e-15 ***
aditivos 0.36875 0.06663 5.534 0.000129 ***
temperatura 0.06875 0.06663 1.032 0.322534
aditivos:temperatura -0.23125 0.06663 -3.470 0.004627 **
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
Residual standard error: 0.2665 on 12 degrees of freedom
Multiple R-Squared: 0.7847, Adjusted R-squared: 0.7309
F-statistic: 14.58 on 3 and 12 DF, p-value: 0.0002638
En la anterior salida, el intercepto es igual a la media global de los 16 datos del experimento, en tanto que
los coeficientes estimados para las variables aditivos, temperatura y aditivos:temperatura, corresponden
a un medio (1/2) de los efectos respectivos. Con la anterior salida se pueden hacer predicciones usando las
variables codificadas.

Grficos de superficie de respuesta
La ecuacin ajustada mediante regresin usando los niveles codificados de los factores representa una
superficie de respuesta sobre la regin experimental, que modela el comportamiento de la variable
respuesta. Estos grficos son tiles cuando se tienen dos factores.

Curvas de nivel
Es una figura en dos dimensiones en la cual se pueden establecer los niveles de los factores sobre los
cuales la variable respuesta toma el mismo valor. Cada curva de nivel representa puntos o combinaciones
de niveles de los factores donde la variable respuesta es constante. La representacin de curvas de nivel o
grfico de contornos es mejor que la de la superficie de respuesta porque se pueden ver con ms exactitud
las coordenadas del punto con el valor promedio deseado para la variable respuesta.

Programa en SAS para generar la Superficie de Respuesta:
/* Superficie de respuesta */
goptions ftext=simplex ftitle=simplex htitle=1.2 htext=1.1;
options nocenter ps=800 ls=150 nodate nonumber; run;
data adhesion;
input aditivos temperat adhesion;
-1 -1 2.3
-1 -1 2.9
-1 -1 3.1
-1 -1 3.2
-1 1 3.4
-1 1 3.7
-1 1 3.6
15
-1 1 3.2
1 -1 4.3
1 -1 3.9
1 -1 3.9
1 -1 4.2
1 1 3.8
1 1 3.8
1 1 3.9
1 1 3.5
;
run;
PROC SORT data=adhesion;
by aditivos;
run;

PROC G3GRID data=adhesion out=cuad;
grid aditivos*temperat=adhesion/axis1=0 to 1 by 0.025 axis2=40 to 70 by 0.5 spline;
run;

title h=1.3 f=simplex c=black ' Superficie de respuesta';
PROC G3D data=cuad ;
plot ADITIVOS*TEMPERAT=ADHESION/ yticknum=5 xticknum=6 zmin=0 zmax=5 ctop=BLUE ;
run;
quit;

title h=1.3 f=simplex c=black ' Curvas de Nivel';
/*Las siguientes instrucciones generan las curvas de nivel*/
PROC GCONTOUR data=ADHESION;
plot ADITIVOS*TEMPERAT=ADHESION/levels=3.3 3.4 3.5 3.6 3.7 3.8 clevels='yellow' 'pink' 'green'
'blue' 'RED' 'VIOLET';
run;
quit;

16
FACTORIALES 2
K
CON PUNTO AL CENTRO
Cuando en un diseo factorial 2
k
los k factores admiten un nivel intermedio es recomendable formar un
tratamiento adicional formado por las combinacin del nivel intermedio de todos los factores, que
codificaremos con cero ( 0 ). A tal tratamiento se le conoce como punto central. Es deseable correr tal
tratamiento con rplicas por las siguientes razones:
1. Para obtener grados de libertad adicionales para el error sin perjudicar el balance de la estimacin de
los efectos de inters, en especial cuando por razones econmicas se corre un experimento sin
rplicas suficientes.
2. Cuando los factores son cuantitativos, las repeticiones al centro permiten detectar la presencia de
curvatura en al menos uno de los factores estudiados. Esta curvatura son los efectos cuadrticos A
2
,
B
2
, etc. Una vez se detecta curvatura el experimento se aumenta
2
con ms puntos experimentales
para poder estudiarla en detalle. No es conveniente utilizar de entrada un experimento que estudie la
curvatura, ya que de no existir sta se estara desperdiciando recursos.

Para detectar la presencia de curvatura, despus de llegar al mejor ANOVA, el error de ste se puede partir
en dos componentes:
1. Componente de error puro, SSE(puro): El cual se obtiene de las replicaciones en el centro y en los
puntos factoriales (aquello donde hay replicaciones).
2. Componente de carencia de ajuste: Es igual al SSE del ANOVA menos el SSE(puro).
En particular, considere un diseo factorial 2
k
con 1 rplica en cada punto factorial y
c
n rplicas en el punto
central del diseo . Sean
f
n el nmero de puntos factoriales en el diseo,
f
Y el promedio de las
observaciones en los
f
n puntos factoriales y
c
Y el promedio de las
c
n rplicas en el punto central. Si la
diferencia
f c
Y Y es pequea, entonces los puntos en el centro del diseo yacen sobre o muy cerca al
plano que pasa a travs de los puntos factoriales y no hay curvatura. De lo contrario si tal diferencia es

2
Los detalles de cmo aumentar el experimento se estudiar en la metodologa de optimizacin de procesos con superficies de respuesta,
especficamente en el diseo central compuesto.
17
grande, entonces hay presencia de curvatura cuadrtica. Una suma de cuadrados para curvatura
cuadrtica pura de un solo grado de libertad, est dada por

( )
2
cuadrtico puro
f c f c
f c
n n Y Y
SS
n n

=
+
(ec. 14)

Esta cantidad puede ser comparada al MSE en el ANOVA para probar curvatura cuadrtica.

Si los puntos factoriales no son replicados, uno puede usar los puntos del centro para construir una
estimacin del error con 1
c
n grados de libertad, en ese caso, para probar la significancia de la suma de
cuadrados en (ec. 14) calcularamos,

( )
1 1
2
1
cuadrtico puro
,
puntos del centro
~ ,
c
cuad n
i c
c
SS
F f
MSE
Y Y
MSE
n

FACTORIALES 2
K
EN BLOQUES
Algunas ocasiones no es posible correr todos los tratamientos de un diseo factorial 2
k
bajo las mismas
condiciones experimentales, es decir, es necesario considerar algn factor de bloqueo. Por ejemplo:
No es posible correr el experimento completo en el mismo da y se considera que el da puede afectar
los resultados del estudio.
Si incluso el proceso estudiado es sensible a los cambios de turno dentro del mismo da, los turnos
debieran considerarse como factor de bloque.
Cuando un lote de material no alcanza para todas las corridas experimentales y se sospecha que las
diferencias entre lotes pueden afectar los resultados, entonces es necesario bloquear por lote.
Cuando no es posible contar durante todo el experimento con el mismo operador, o el mismo equipo,
etc y si se sospecha que stos pueden influir en el desempeo del proceso, hay que considerarlos
como factores de bloqueo.

Slo se deben bloquear aquellas fuentes de variacin que puedan impactar de modo importante a la
respuesta de inters.

La reparticin del arreglo factorial en bloques se hace bajo el principio de jerarqua: son ms importantes
los efectos principales, luego las interacciones dobles, despus las interacciones triples, etc., por tanto al
repartir los tratamientos en bloques se debe buscar afectar lo menos posible el estudio de los efectos
principales y de interacciones dobles, prefiriendo perjudicar el estudio de los efectos de interacciones de
orden superior. La afectacin es mayor si se tienen pocos factores (4 o menos) y sin rplicas, as mismo la
afectacin es mayor a mayor cantidad de bloques.

18
Recuerde que: Se asume que no hay interaccin de los factores de inters con el factor de bloqueo.

Cuando los bloques son las rplicas
En ese caso en cada bloque se observa cada tratamiento del experimento factorial. En el ANOVA adems
de las sumas de cuadrados de los efectos principales y de interaccin (doble) aparece la suma de
cuadrados del factor de bloqueo.

Experimentos factoriales en bloques incompletos
En este caso el diseo factorial 2
k
es repartido 2
p
bloques, con p < k. En tal caso, se sacrifican efectos del
factorial, como se mencion en el principio de jerarqua. Ejemplo. Suponga que se desea correr un factorial
2
3
y que los ocho tratamientos se deben correr en dos das, y slo cuatro corridas en cada da. Si estamos
dispuestos a sacrificar la triple interaccin ABC, un arreglo razonable en este experimento sera:

Bloque 1 Bloque 2
(1) a
ab b
ac c
bc abc

Considere h la contribucin al resultado debida a la diferencia entre bloques, en este caso tenemos:

Bloque 1 Bloque 2
(1) a+h
ab b+h
ac c+h
bc abc+h

Si tratamos de estimar el contraste ABC (usando la matriz de signos del diseo 2
3
), tendramos:
( )
( )
1
1 4
Contraste ( ) ( ) ( ) ( ) ( )
Contraste ( )
ABC a h b h c h abc h ab ac bc
ABC abc a b c ab ac bc h
= + + + + + + +
= + + + +
es decir el efecto de la triple interaccin va a quedar confundido con el efecto de bloque. Por el contrario, los
efectos principales y de las interacciones dobles pueden ser estimados, por ejemplo:
( )
( )
1
1
Contraste ( ) ( ) ( ) ( ) ( )
Contraste ( )
A a h ab ac abc h b h c h bc
A abc a ab ac b c bc
= + + + + + + +
= + + +

Para usar dos bloques en un factorial 2
k
se utiliza una interaccin de orden superior como el contraste
de definicin. Los signos del contraste de tal interaccin se usan para dividir los tratamientos entre los dos
bloques. Aquellos tratamientos que definen los signos en el contraste de definicin sern para el bloque 1
y los tratamientos que definen los signos + en el contraste de definicin sern para el bloque 2. de ah que
en el ejemplo previo resulten los dos bloques dados. Las sumas de los efectos de interacciones superiores
se considera igual al efecto de bloque, por tanto el efecto observado se atribuye al bloque porque es ms
19
probable que el bloque sea el que influye, ya que en la mayora de los casos las interacciones de tres o ms
factores no son significativas.

Para usar un diseo 2
k
en 2
p
bloques (p < k), se seleccionan p contrastes de definicin, de modo que su
producto mdulo 2
3
sea una interaccin del ms alto orden posible. Los signos de los contraste de
definicin definen los tratamientos que componen a cada bloque. Como hay (2
p
1) grados de libertad para
los bloques, tenemos (2
p
1 p) efectos adicionales confundidos con los bloques. Los efectos asociados a
los contrastes de definicin as como sus posibles productos mdulo 2 estarn confundidos con los bloques,
es decir, no se podrn estudiar. En la figura 5 se proveen algunos contrastes de definicin apropiados para
construir 2
p
bloques en un factorial completo 2
k
, para algunos valores de k. Algunos software estadsticos
pueden generar los bloques deseados para cualquier factorial completo o fraccionado.

Figura 5: Efectos adecuados para generar bloques incompletos en factorial 2
k
TABLA 3: Rplicas recomendadas en la familia de diseos 2
k
Diseo
Rplicas
recomendadas
# de
corridas
2
2
3 4 12, 16
2
3
2 16,
2
4
1 2 16, 32
2
5
Fraccin 2
5-1
16, 32
2
6
Fraccin 2
6-2
2
6-1
16, 32
2
7
Fraccin 2
7-3
2
7-2
16, 32
3
La multiplicacin mdulo 2 de dos efectos significa que las letras repetidas se eliminan y prevalecen en el resultado las no repetidas, por
ejemplo (AB)(AC)=BC, (ACDE)(BC)=ABDE

También podría gustarte