Está en la página 1de 10

1

EL DISEO FACTORIAL COMPLETO 2


2


Joan Ferr
Grupo de Quimiometra y Cualimetra
Departamento de Qumica Analtica y Qumica Orgnica
Universidad Rovira i Virgili (Tarragona)



INTRODUCCIN

Para optimizar procesos de fabricacin, condiciones de reaccin y mtodos de
anlisis entre otros, es necesario conocer qu variables influyen significativamente
en el sistema y cmo afectan. A menudo esta informacin no est disponible y se
genera experimentando. Primero se recogen en una lista todas las variables que
podran influir en la respuesta
1
. A continuacin, se realizan una serie de
experimentos en los cuales se fijan las variables que no interesa modificar, se anota
el valor de las que no se pueden controlar, y se varan las restantes. Finalmente, se
obtiene la informacin comparando la variacin de la respuesta entre experimentos.

El elevado coste de la experimentacin y las limitaciones de tiempo obligan a
ejecutar slo los experimentos imprescindibles. Y el mtodo tradicional de variar un-
factor-cada-vez no suele ser la mejor opcin. Puede implicar ms experimentos de
los necesarios y, a pesar de ello, proporcionar slo informacin parcial. Por ejemplo,
no mostrar si existe interaccin entre factores. [1] Las interacciones suelen ser muy
corrientes y a veces son los efectos ms importantes, por lo que conocerlas es
imprescindible para comprender el comportamiento de muchos sistemas.

El diseo estadstico de experimentos contempla una amplia variedad de estrategias
experimentales que son ptimas para generar la informacin que se busca. Hoy
introduciremos una de estas estrategias: el diseo factorial completo 2
k
. ste
describe los experimentos ms adecuados para conocer simultneamente qu
efecto tienen k factores sobre una respuesta y descubrir si interaccionan entre ellos.
Estos experimentos estn planeados de forma que se varan simultneamente
varios factores pero se evita que se cambien siempre en la misma direccin. Al no
haber factores correlacionados se evitan experimentos redundantes. Adems, los
experimentos se complementan de tal modo que la informacin buscada se obtiene
combinando las respuestas de todos ellos. Esto permite obtener la informacin con

1
Respuesta es la variable de inters que mediremos como consecuencia de la experimentacin. Por
ejemplo, el rendimiento de una reaccin. Factores son las variables que modificaremos para estudiar
su efecto en la respuesta.
2
el mnimo nmero de experimentos (y por tanto, con el menor coste) y con la menor
incertidumbre posible (porque los errores aleatorios de las respuestas se
promedian).

El diseo de experimentos encuentra numerosas aplicaciones en el campo de las
reacciones qumicas [2] as que utilizaremos una reaccin de sntesis catalizada
para introducir el uso de un diseo factorial completo 2
2
, el clculo de los efectos y el
concepto de interaccin entre factores. En un artculo posterior profundizaremos en
el uso de los diseos factoriales para estudiar k>2 factores, los cuales permiten
apreciar todava mejor los beneficios de estos diseos.



ESTUDIO DEL EFECTO DE DOS FACTORES EN UNA REACCIN QUMICA


1. Planteamiento del problema

Se quiere comprobar el rendimiento de una reaccin con un nuevo catalizador. Un
solo experimento no parece suficiente. Sera una lstima rechazar el catalizador si el
rendimiento no es el deseado slo porque otras variables que influyen en la reaccin
no se han ajustado a sus valores ptimos para ese catalizador. Por tanto, se
pretende determinar en qu grado estas otras variables pueden afectar al
rendimiento y cmo se pueden variar para mejorarlo.


2. Factores y dominio experimental

Basndose en la experiencia previa, bibliografa o las necesidades de la
experimentacin (criterios de rentabilidad, limitaciones experimentales,), el equipo
que lleva a cabo el estudio debe escoger qu factores interesa estudiar y qu
valores pueden tomar (el dominio experimental). La Tabla 1 muestra los dos factores
escogidos. Como ambos factores son continuos, su dominio experimental se
expresa con los valores mximo y mnimo que pueden tomar. En nuestro ejemplo se
consider que el tiempo de reaccin deba ser inferior a 8 horas para que el proceso
fuera rentable, y superior a 6 horas para asegurar que el rendimiento fuera
suficiente. Era preferible trabajar a temperatura baja (40C) pero se estara dispuesto
a alcanzar los 80C si el rendimiento mejorase apreciablemente.




3

Tabla 1. Factores y dominio experimental.

Factores


Dominio Experimental


Nivel () Nivel (+)
x
1
: Tiempo de reaccin (horas)

6 8
x
2
: Temperatura (C)

40 80


La Tabla 1 tambin muestra la notacin codificada ms habitual para factores
continuos: se asigna el valor 1 al extremo inferior del dominio experimental y el
valor +1 al extremo superior
2
. Para simplificar a menudo slo se indican y +. Es
necesario definir la correspondencia entre variables reales y codificadas porque el
diseo de experimentos describe la experimentacin ptima empleando variables
codificadas (x
1
, x
2
,...) sin dimensin. De este modo las herramientas matemticas y
estadsticas son generales y se pueden aplicar a cada problema concreto.



3. Matriz de experimentos: el diseo factorial completo 2
2


La siguiente etapa es escoger la estrategia experimental. La Figura 1 muestra el
domino experimental combinado para los dos factores expresado en unidades
codificadas y particularizado para las variables de la reaccin. Cada punto es un
posible experimento. Qu experimentos son los ptimos para descubrir cmo
influyen los dos factores en el rendimiento y si existe interaccin entre ellos?.


1 +1
+1
1
x
1
x
2
6 8
80
40
T
e
m
p
e
r
a
t
u
r
a

(

C
)
Tiempo (h)
1 +1
+1
1
x
1
x
2
6 8
80
40
T
e
m
p
e
r
a
t
u
r
a

(

C
)
Tiempo (h)

Figura 1. Domino experimental para dos factores continuos expresado en variables
codificadas (izquierda) y variables reales (derecha). Los experimentos de los vrtices
corresponden al diseo factorial completo 2
2
.

2
Esta codificacin tambin es vlida para valores intermedios dentro del dominio experimental
(necesarios en diseos de superficies de respuesta). Por ejemplo, para el tiempo de reaccin, 6.5, 7
y 7.5 h. corresponden a los valores codificados 0.5, 0 y +0.5.
4
La experimentacin ms econmica (mnimo nmero de experimentos) es aquella
en la que cada factor toma slo dos valores (niveles). Y la que proporcionar la
informacin con menor incertidumbre es aquella en la que estos valores son los
extremos del dominio experimental, 1 y +1. La Tabla 2 muestra la matriz de
experimentos que se obtiene combinando los dos niveles de los dos factores. Cada
fila es un experimento y cada columna es un factor estudiado. Este diseo se
denomina factorial completo 2
2
(el 2 de la base indica que cada factor toma slo dos
valores). La posicin de estos 4 ( = 2
2
) experimentos en el dominio experimental se
muestra en la Figura 1.




Tabla 2. Diseo factorial completo 2
2
, plan de experimentacin y respuestas observadas.

Matriz de
experimentos
Plan de
experimentacin
Respuesta
(% rendimiento)
x
1
x
2
Tiempo (h) Temperatura (C) Ejemplo 1 Ejemplo 2
1 6 40 49 (y
1
) 49 (y
1
)
2 + 8 40 54 (y
2
) 80 (y
2
)
3 + 6 80 73 (y
3
) 73 (y
3
)
4 + +

8 80

80 (y
4
) 54 (y
4
)




4. Plan de experimentacin y realizacin de los experimentos

A continuacin, la matriz de experimentos se concreta para nuestro estudio
sustituyendo los valores + y de las variables codificadas por los valores de las
variables reales. As se obtiene el plan de experimentacin (Tabla 2), que
comprende, de forma estructurada y fcilmente comprensible, la lista de experimentos
a realizar. Por ejemplo, el experimento 1 se realizar durante 6 horas a 40 C.

Antes de llevar a cabo los experimentos hay que comprobar que todos parecen
factibles. Si alguno corresponde a una combinacin de factores que no es de inters
econmico o es imposible llevarlo a la prctica, se puede reemplazar por otro que
complete el diseo con la mnima prdida de calidad [3].

A continuacin se realizan los experimentos. La columna Ejemplo 1 de la Tabla 2
muestra los rendimientos encontrados y la Figura 2 muestra su posicin en el
dominio experimental.


5











Figura 2. Ejemplo 1. Rendimientos obtenidos con los experimentos del diseo factorial
completo 2
2
.



5. Interpretacin de los resultados y conclusiones

Las cuatro respuestas se pueden combinar para obtener cuatro informaciones
(tantas como experimentos):

Valor promedio

b
0
= ( + y
1
+ y
2
+ y
3
+ y
4
) / 4 = 64 (1)

Efecto principal del tiempo de reaccin
3


b
t
= ( y
1
+ y
2
y
3
+ y
4
) / 2 = 6 (2)

Efecto principal de la temperatura

b
T
= ( y
1
y
2
+ y
3
+ y
4
) / 2 = 25 (3)

Efecto de interaccin entre tiempo de reaccin y temperatura

b
tT
= ( + y
1
y
2
y
3
+ y
4
) / 2 = 1 (4)



3
Algunos autores definen el efecto principal dividiendo entre 4 y no entre 2. Ambas opciones son
vlidas puesto que la informacin se obtendr al comparar los efectos entre ellos.
73
80
40
80
54 49
7
26
5
24
6 8
Tiempo (h)
T
e
m
p
e
r
a
t
u
r
a

(

C
)
73
R
e
n
d
i
m
i
e
n
t
o
(
%
)
49
80
54
6
8
Tiempo (h)
80
40
Temperatura (C)
73
80
40
80
54 49
7
26
5
24
6 8
Tiempo (h)
T
e
m
p
e
r
a
t
u
r
a

(

C
)
73 73
R
e
n
d
i
m
i
e
n
t
o
(
%
)
49 49
80 80
54 54
6
8
Tiempo (h)
80
40
Temperatura (C)
6
El valor promedio indica alrededor de qu valor estn distribuidas las respuestas.
Si ningn factor tuviera efecto, esta distribucin sera debida a la incertidumbre
experimental. b
0
es tambin el valor predicho en el centro del dominio
experimental (cuando x
1
= 0 y x
2
= 0) si el fenmeno se comporta linealmente.

El efecto principal de cada factor indica la variacin promedio de la respuesta
cuando cambia ese factor. Se calcula como la respuesta media cuando el factor
est en el nivel + menos la respuesta media cuando el factor est en el nivel .
Para el tiempo de reaccin es b
t
= (y
2
+y
4
)/2 (y
1
+y
3
)/2. Y para la temperatura?.

El primer paso para interpretar los efectos principales es comprobar que la
variacin observada en la respuesta es debida a un efecto real de cada factor y
no al error experimental. Se utilizan los tests estadsticos descritos en [4,5] para
comparar b
t
=6 y b
T
=25 con una estimacin del error experimental
4
. Para no
entrar en detalles consideremos que los dos efectos son significativos y que no
parecen fruto de la imprecisin de la experimentacin. En este caso, podemos
interpretar sus valores. En principio, cuanto ms vara la respuesta, mayor es el
efecto principal. b
t
= 6 indica que variar el tiempo de reaccin del nivel inferior al
superior (de 6h a 8h) aumenta el rendimiento un 6% en promedio
5
. La
temperatura tiene un efecto mayor: variarla de 40C a 80C aumenta el
rendimiento en un 25%.

El efecto de interaccin entre tiempo de reaccin y temperatura es la cuarta
informacin que se puede obtener del diseo factorial 2
2
. Existe interaccin
cuando el efecto de un factor depende de qu valor tome el otro factor. Los
experimentos 1 y 2 se realizaron a 40 C. Por tanto, la variacin en el rendimiento

b
t

= y
2
y
1
= 54 49 = 5 (5)

indica qu efecto tiene cambiar el tiempo de reaccin cuando se trabaja a
temperatura baja (indicada con el signo en b
t

). De igual modo, los


experimentos 3 y 4 permiten conocer el efecto de aumentar el tiempo de
reaccin cuando se trabaja a 80 C:

b
t
+
= y
4
y
3
= 80 73 = 7 (6)


4
Aunque hay diversos mtodos [4,5], el error experimental se suele estimar como la desviacin
estndar de las respuestas al repetir un experimento. Estas repeticiones pueden ser las que el
experimentador realiza antes del estudio para comprobar que tiene el sistema bajo control y que los
experimentos son reproducibles dentro del error aceptado. Otra posibilidad es ampliar el diseo
factorial con experimentos que contemplen alguna repeticin.
5
Si el signo fuera negativo (b
t
= 6) indicara que el rendimiento disminuye
7
Tanto b
t

como b
t
+
indican el efecto del tiempo de reaccin, pero a dos
temperaturas distintas. El efecto de interaccin se calcula como su diferencia
promedio:

b
tT
= ( b
t
+
b
t

)/2 = 1 (8)

Si no existe interaccin, b
t

= b
t
+
y b
tT
= 0 y los factores son independientes.
Cuanto ms distintos sean b
t
+
y b
t

mayor ser b
tT
. En nuestro ejemplo, b
t
+
y b
t


son muy parecidos y, en consecuencia, el efecto de interaccin entre los dos
factores es pequeo comparado con los dos efectos principales. Incluso b
tT
= 1
podra ser debido al error experimental. Puesto que efecto del tiempo de
reaccin prcticamente no depende de la temperatura a la que se trabaje, el
efecto principal (ecuacin 2), que es el promedio

b
t
= ( b
t

+ b
t
+
)/2 = 6 (7)

informa adecuadamente del efecto del tiempo de reaccin: aumentarlo de 6h a
8h aumenta el rendimiento en aproximadamente un 6%.

El grado de interaccin se observa fcilmente en los grficos de interaccin
(Figura 3) que muestran el cambio en la respuesta al variar un factor para
distintos valores del otro factor. En la Figura 3 izquierda, una lnea muestra como
vara el rendimiento al modificar el tiempo de reaccin trabajando a 40C. La otra
lnea muestra el cambio cuando se trabaja a 80C. Las lneas son casi paralelas,
lo cual indica que aumentar el tiempo de reaccin tiene el mismo efecto sea cual
sea la temperatura. Por tanto, no existe interaccin. La Figura 3 derecha
muestra el grfico para la temperatura.



45
65
85
6 8 40 80
Temperatura (C) Tiempo (h)
R
e
n
d
i
m
i
e
n
t
o
(
%
)
R
e
n
d
i
m
i
e
n
t
o
(
%
)
45
65
85
80 C
40 C
8 h.
6 h.
45
65
85
6 8 40 80
Temperatura (C) Tiempo (h)
R
e
n
d
i
m
i
e
n
t
o
(
%
)
R
e
n
d
i
m
i
e
n
t
o
(
%
)
45
65
85
80 C
40 C
8 h.
6 h.


Figura 3. Grficos de interaccin. Lneas paralelas indican que no existe interaccin
importante entre los dos factores. Puede ver la relacin con la Figura 2?.

8
Como conclusin, la experimentacin ha permitido descubrir que el rendimiento
aumenta al aumentar tanto la temperatura como el tiempo de reaccin. Puesto que
el mayor efecto lo tiene la temperatura, este factor es el que se debe controlar ms
detenidamente, y es el primero que hay que considerar para optimizar el
rendimiento.


6. Y si existe interaccin?

Si el efecto de interaccin es elevado comparado con el valor de los efectos
principales, stos no se pueden interpretar separadamente y hay que recurrir a la
representacin grfica para interpretarlos.

Considere que se hubieran obtenido los rendimientos indicados en la Tabla 2,
columna Ejemplo 2. Los efectos calculados son: b
0
= 64, b
t
= 6, b
T
= 1 y b
tT
= 25.
El valor de b
T
sugiere que la temperatura casi no tiene efecto. Sin embargo, la Figura
4 muestra lo contrario: variar la temperatura hace aumentar el rendimiento en un
24% si el tiempo de reaccin es 6h, y lo hace disminuir en un 26% cuando el tiempo
es 8 horas. Los dos efectos b
T

y b
T
+
son relevantes. Pero como son contrarios, el
efecto principal, que es un promedio, es pequeo (b
T
= 1).













Figura 4. Ejemplo 2. Rendimientos obtenidos con los experimentos del diseo factorial
completo 2
2
.


El efecto principal del tiempo de reaccin tambin conduce a conclusiones errneas
sobre su efecto real. Este valor es el mismo que en ejemplo anterior. Igual que
antes, sugiere que el rendimiento aumenta aproximadamente un 6% al cambiar de
6h a 8h. Sin embargo, vemos que si se trabaja a 80C el efecto es el contrario:
disminuye el rendimiento en un 19% !.
73
80
40
54
80 49
-19
-26
31
24
6 8
Tiempo (h)
T
e
m
p
e
r
a
t
u
r
a

(

C
)
73
R
e
n
d
i
m
i
e
n
t
o
(
%
)
49
80
6
8
Tiempo (h)
80
40
Temperatura (C)
54
73
80
40
54
80 49
-19
-26
31
24
6 8
Tiempo (h)
T
e
m
p
e
r
a
t
u
r
a

(

C
)
73
R
e
n
d
i
m
i
e
n
t
o
(
%
)
49
80 80
6
8
Tiempo (h)
80
40
Temperatura (C)
54 54
9

8
45
65
85
6
Tiempo (h)
R
e
n
d
i
m
i
e
n
t
o
(
%
)
80 C
40 C
40 80
Temperatura (C)
R
e
n
d
i
m
i
e
n
t
o
(
%
)
45
65
85
8 h.
6 h.
8
45
65
85
6
Tiempo (h)
R
e
n
d
i
m
i
e
n
t
o
(
%
)
80 C
40 C
40 80
Temperatura (C)
R
e
n
d
i
m
i
e
n
t
o
(
%
)
45
65
85
8 h.
6 h.


Figura 5. Grficos de interaccin. Las lneas cruzadas indican que existe interaccin
importante entre los dos factores.


Este ejemplo ensea que hay que considerar el efecto de interaccin antes de
interpretar los efectos principales. Justo en el orden contrario en que, para facilitar la
explicacin, lo hemos hecho aqu. Si la interaccin es pequea, podemos pasar a
interpretar los efectos principales. Si es grande, hay que recurrir a la representacin
grfica. La interaccin se observa fcilmente en la Figura 5. Las lneas cruzadas
indican un elevado grado de interaccin.



COMENTARIO Y CONCLUSIONES

Los diseos factoriales completos son la estrategia experimental ptima para
estudiar simultneamente el efecto de varios factores sobre la respuesta y sus
interacciones. Por su potencia y sencillez, su campo de aplicacin es muy amplio:

- identificar qu variables influyen en una reaccin, para luego poder optimizarlas
hasta alcanzar el rendimiento deseado, o para disminuir el tiempo de reaccin.
- decidir qu se debe ajustar en el nuevo proceso de fabricacin para que no se
produzcan tantos productos fuera de especificaciones.
- estudiar en qu condiciones el proceso es ms robusto a pequeas variaciones
de temperatura, humedad,....
- ...


10
BIBLIOGRAFIA

1. J. Ferr, F. X. Rius Tcnicas de Laboratorio 274 (2002) 648-652.
2. R. Carlson, Design and optimization in organic sntesis. Elsevier. Amsterdam,
1992.
3. P.F. De Aguiar, B. Bourguignon, M.S. Khots, D.L. Massart, R. Phan-Tan-Luu
Chem. Intell. Lab. Syst. 30 (1995) 199-210.
4. D.L. Massart, B.G.M. Vandeginste, L.M.C. Buydens, S. De Jong,. P.J. Lewi, J.
Smeyers-Verbeke. Handbook of Chemometrics and Qualimetrics: Part A.
Elsevier. Amsterdam, 1997.
5. G.E.P. Box, W.G. Hunter, J.S. Hunter. Estadstica para experimentadores. Ed.
Revert. Barcelona, 1989.




El autor agradece todos los comentarios relacionados con los contenidos de este
artculo. Pueden dirigirse, mediante mensaje electrnico, a la direccin:
quimio@quimica.urv.es. Una versin en soporte electrnico de este artculo e
informacin suplementaria pueden encontrarse en: http://www.quimica.urv.es/quimio

También podría gustarte