Está en la página 1de 21

CAPITULO 5 DISEOS FACTORIALES

En los diseos estudiados anteriormente solo se contaba con un factor de inters y, el


objetivo del diseo era determinar si los tratamientos (niveles del factor) conducan a
resultados estadsticamente diferentes. Es decir, si el factor tenia influencia o no sobre
la variable respuesta. En este captulo se estudia el caso ms general en el que se
estudia la forma como influyen varios factores (ms de dos) sobre la variable repuesta.

En general, los diseos factoriales combinan todos los niveles de todos los factores de
inters para determinar si existen diferencias significativas entre los diferentes
tratamientos. Aqu, un tratamiento es un experimento en el cual se fijan los niveles de
los factores en un valor particular y se realiza el experimento. Por ejemplo, si un
ingeniero qumico est interesado en investigar los efectos del tiempo de reaccin y de
la temperatura de reaccin sobre el rendimiento de un proceso, y se consideran
importantes los dos niveles de tiempo (1 y 1.5 horas) y los dos niveles de temperatura
(125 F y 150 F), entonces el experimento factorial consiste en hacer corridas
experimentales para cada una de las cuatro combinaciones posibles de los niveles de
tiempo y temperatura de reaccin.

5.1 Definiciones bsicas


5.1.1 Diseo Factorial
Un diseo factorial es el conjunto de experimentales o tratamientos que se forman
considerando todas las posibles combinaciones de los niveles de los factores. Por
ejemplo si se desean estudiar la forma como influyen dos factores sobre la variable de
inters y se consideran importantes tres niveles para el primer factor y dos para el
segundo, se forma el diseo 3x2, para un total de 6 corridas o tratamientos. El nombre
de diseo factorial establece de manera implcita el nmero de corridas que se deben
realizar de acuerdo a la cantidad de niveles de cada factor que se combinan.
Como un segundo ejemplo suponga que se desea estudiar el efecto de tres factores
sobre la variable respuesta y que se tiene inters en tres niveles para el primer factor,
cuatro para el segundo y cinco para el tercero. Esto da origen a un diseo 3x4x5, es
decir, un total de 60 corridas o tratamientos que resultan de todas las posibles
combinaciones de los niveles de cada factor

5.1.2 Efecto principal y efecto de interaccin


El efecto de un factor se define como el cambio observado en la variable de respuesta
debido a un cambio de nivel de tal factor. En particular los efectos principales son los
cambios en la medida de la variable de respuesta debidos a la accin individual de
cada factor. Matemticamente el efecto principal de un factor es la diferencia entre la
respuesta media observada cuando tal factor estuvo en su nivel alto y la respuesta
media observada cuando el factor estuvo en su nivel bajo.
Vemos esto con un ejemplo sencillo

5.1.2.1

Ejemplo de un diseo sin interaccin entre factores

Suponga que se estudia el efecto de la presin y la temperatura sobre el rendimiento


de un proceso qumico y que resultan importantes dos niveles de cada factor. Los
resultados se muestran en la siguiente tabla

A: Temperatura

B: Presin

Baja

Alta

Baja

50

70

Alta

60

80

Tabla 5.1 Ejemplo de un diseo factorial a dos niveles sin interaccin entre factores

Observe que el cambio en la variable respuesta (el rendimiento) debido a la


temperatura (A) es

A=

70 + 80 50 + 60

= 20
2
2

(5-1)

Es decir que hay un cambio de 20 unidades en el rendimiento promedio al pasar de la


temperatura baja a la temperatura alta. De la misma forma:

B=

60 + 80 50 + 70

= 10
2
2

(5-2)

Que indica que el rendimiento cambia, en promedio, 10 unidades cuando cambia la


presin del nivel bajo al nivel alto.

Note que, en este ejemplo, el efecto de A no depende de B ni el del B depende de A.


Es decir, el rendimiento siempre cambiar 10 unidades al pasar de la presin baja a la
presin alta independientemente de cual sea la presin y que el cambio ser de 20
unidades al pasar de la temperatura baja a la alta independientemente de cual sea la
presin. Siempre que ocurre esto decimos que no existe interaccin entre los dos
factores.
As, el efecto de A en el nivel bajo de B es A = 70 50 = 20 y en el nivel alto

A = 80 60 = 20 que concuerda con el valor promedio obtenido en la ecuacin (5-1)


De igual forma, el efecto de B sobre la variable respuesta en el nivel bajo de A es

B = 60 50 = 10 y en el nivel alto de A B = 80 70 = 10 que concuerda con el valor


medio encontrado en la ecuacin (5-2)
Esto es tpico cuando no existe interaccin entre los factores de inters: su efecto
sobre la variable respuesta es el mismo independientemente del nivel de los otros
factores y por lo tanto es igual al efecto promedio.
En la siguiente figura se muestra esquemticamente el efecto de la temperatura y la
presin sobre el rendimiento.
Efecto de la presin, B sobre el rendimiento

Efecto de la Temperatura, A sobre el rendimiento


85

85

80

80

10 unidades

75

75

20 unidades

70

70

65

T Baja

65

P Baja

60

T Alta

60

P Alta

55

55

50

50

45

45
40

40
P Baja

P Alta

T Baja

T Alta

Figura 5.1 Diseo factorial con dos factores sin interaccin

Las dos figuras dan la misma informacin y en ambas se puede apreciar que no existe
interaccin entre los dos factores de inters. Note que el efecto de la temperatura
sobre el rendimiento siempre es de 20 unidades independientemente de la presin y
que el efecto de la presin siempre es de 10.unidades independientemente de la
temperatura
Una regla que resulta de utilidad a la hora de identificar si existe o no interaccin entre
los factores estudiados en un diseo experimental es observar si en la grfica de los
factores (como la Figura 5.1) las lneas son casi paralelas. Si las lneas se cruzan
entonces es porque existe una interaccin entre los dos factores de inters

5.1.2.2

Ejemplo de un diseo con interaccin entre factores

En algunos experimentos, la diferencia en la respuesta entre los niveles de un factor


no es la misma para todos los niveles de los otros factores. Cuando esto sucede,
existe una interaccin entre los factores. Por ejemplo, considrense los datos del
mismo problema explicado anteriormente en la sesin 5.1.2.1 pero con los siguientes
datos:

A: Temperatura

B: Presin

Baja

Alta

Baja

50

70

Alta

60

40

Tabla 5.2 Ejemplo de un diseo factorial a dos niveles con interaccin entre factores

El efecto de la temperatura se calcula igual que en caso anterior

A=

70 + 40 50 + 60

=0
2
2

(5-3)

Lo que lleva, de manera tentativa, a concluir que el factor A no tiene ningn efecto. Sin
embargo, cuando se examinan los efectos de A para diferentes niveles del factor B, se
observa que ste no es el caso. Observe que el efecto de A en el nivel bajo de B es de

A = 70 50 = 20
y en el nivel alto es de

A = 40 60 = 20
lo que lleva a un valor promedio de cero.

En este ejemplo se aprecia que el efecto del factor A depende de los niveles del factor
B. Por tanto, el conocimiento de la interaccin AB es ms til que el conocimiento del
efecto principal. Una interaccin significativa puede enmascarar la significancia de los
efectos principales. En consecuencia, cuando la interaccin est presente, los efectos
principales de los factores involucrados en ella tal vez no tengan mucho significado.
Es fcil estimar el efecto de interaccin en experimentos factoriales tales como los
ilustrados en los ejemplos anteriores (Tabla 5.1 y Tabla 5.2). En este tipo de
experimento, cuando ambos factores tienen dos niveles, el efecto de la interaccin AB
es la diferencia entre los promedios de las diagonales. Esto representa la mitad de la

diferencia entre los efectos de A para los dos niveles de B. Por ejemplo, en Tabla 5.1
se tiene que el efecto de la interaccin AB es

AB =

50 + 80 60 + 70

=0
2
2

(5-4)

Por tanto, no hay interaccin entre A y B. En la Tabla 5.2, el efecto de la interaccin


AB es

AB =

50 + 40 60 + 70

= 20
2
2

(5-5)

Tal como se mencion, el efecto de interaccin en estos datos es muy grande.

El concepto de interaccin puede ilustrarse de manera grfica en varias formas. La


Figura 5.2 es una grfica de los datos de la Tabla 5.2 contra los niveles de A para los
dos niveles de B.
Efecto de la presin, B sobre el rendimiento

Efecto de la Temperatura, A sobre el rendimiento


75

75

70

70

65

65

60

60

55

55
50

50
T Baja
T Alta

45

45
P Baja
P Alta

40

40
P Baja

P Alta

T Baja

T Alta

Figura 5.2 Diseo factorial con dos factores sin interaccin

Ntese que las rectas Pbajo y Palto (o Tbajo y Talto) no son paralelas, lo que indica que
existe interaccin entre los factores Temperatura (A) y Presin (B). Estas grficas
reciben el nombre de grficas de interaccin de dos factores, y a menudo son tiles
para presentar los resultados de los experimentos. Muchos de los paquetes
estadsticos utilizados para el anlisis de datos construyen estas grficas de manera
automtica.
Los experimentos factoriales son la nica manera de descubrir la interaccin
entre las variables.

5.2 Experimento factorial Vs mover un factor a la vez.


Uno de los errores comunes en la investigacin es evaluar el efecto de los factores de
manera individual cambiando uno a la vez (y manteniendo los dems constantes) y
observar as el efecto sobre la variable respuesta. Consideremos nuevamente el
ejemplo de rendimiento y suponga que se desean encontrar las condiciones ptimas
(de mayor rendimiento)
En la Figura 5.3 se muestran las curvas de nivel para el rendimiento como una funcin
de la temperatura y la presin.
Presin
70

Regin del ptimo

60

95%
50
Direccin del ptimo
90%
40
85%
80%

30
70%
20

10

Condiciones

60%
100

200

300

400

500

Actuales
600

700

Temperatura

Figura 5.3 Optimizacin de un proceso moviendo un factor a la vez

La Figura 5.3 cada punto representa una corrida que se realiza en busca del ptimo.
La figura muestra claramente que la direccin del ptimo no concuerda con la
direccin que se obtiene al mover un factor a la vez y que, en general, mover un factor
a la vez no necesariamente lleva al ptimo del proceso.
El enfoque de mover un factor a la vez ha fallado porque no puede detectar la
interaccin entre los dos factores de inters (la temperatura y la presin). Los
experimentos factoriales son la nica manera de detectar las interacciones. Por
otra parte, el mtodo de un factor a la vez es insuficiente, requiere ms
experimentacin que un experimento factorial, y no existe garanta de que produzca
los resultados correctos.
Si no existiera interaccin entre los factores de inters en el experimento, el diseo
factorial y el enfoque de mover un factor a la vez nos llevaran al mismo valor ptimo.

Sin embargo, como esto no esta garantizado, y lo usual es que exista interaccin entre
los factores considerados (sobretodo en fenmenos complejos) el procedimiento de
mover un factor a la vez no conduce a resultados correctos.

5.3 Diseos factoriales con dos factores.


Dentro de los diseos factoriales, es el diseo ms sencillo y con el que debemos
empezar para entender los diseos factoriales generales que se vern ms adelante.
En este tipo de experimentos se tienen solo dos factores de inters y se desea
comprobar si stos influyen o no sobre la variable respuesta.

5.3.1 Modelo de efectos fijos


Suponga que se tienen los factores A y B. El factor A tiene a niveles, mientras que el
factor B tiene b niveles. La Tabla 5.3 contiene este experimento factorial con dos
factores. El experimento tiene n rplicas, y cada uno contiene ab combinaciones de
tratamientos. La observacin en la ij-sima celda para la k-sima rplica est denotada
por yijk. Al realizar el experimento, las observaciones abn deben obtenerse con un
orden aleatorio. Por tanto, el experimento factorial con dos factores es un diseo
completamente aleatorizado.

1
1
2
Factor A

y111

y211

.
.
.
a

y112
y11n
y212
y21n
.
.
.

ya11

ya12
ya1n

Factor B
2
y121 y122

y12n
y221 y222

y22n
.
.
.
ya21 ya22

ya2n

Totales

y1

y 2

Promedios

y 1

y 2

y1b1

y2b1

.
.
.

y1b2
y1bn
y2b2
y2bn

yab1

yab2
yabn

yb
y b

Totales

Promedios

y1

y1

y 2

y 2

.
.
.

.
.
.

ya

y a

Tabla 5.3 Arreglo de datos para el diseo factorial con dos factores

En la tabla anterior se ha hecho uso de la notacin de subndice punto. Recuerde


que con esta notacin, cuando aparece un punto en lugar de una letra en el subndice
de la variable respuesta se debe realizar la sumatoria a lo largo de esta letra. As, por

ejemplo yij =

y
k =1

ijk

. Adems, la barra en la parte superior indica promedio, como por

ejemplo en, y ij =

y
k =1

ijk

Las observaciones pueden describirse con el modelo estadstico lineal

Yijk = + i + j + ( )ij

i = 1,2,..., a

+ ijk j = 1,2,..., b
k = 1,2,..., n

(5-6)

donde es la media global o la gran media, i es el efecto del i-simo nivel del factor
A, j es el efecto del j-simo nivel del factor B, ()ij es el efecto de la interaccin entre
A y B y ijk es un componente de error aleatorio que tiene una distribucin normal con
media cero y varianza 2.
El objetivo es determinar si no existe efecto de principal de A, B y no hay interaccin
entre ellos.

5.3.2 Hiptesis a evaluar y anlisis de varianza


Cuando existen dos factores de inters las hiptesis estadsticas a probar son las
siguientes:

H 0 : 1 = 2 = ... = a = 0 ( A no influye)
H1 : i 0 al menos para un i

(5-7)

H 0 : 1 = 2 = ... = b = 0 (B no influye)
H 1 : j 0 al menos para un j

(5-8)

H 0 : ( )11 = ( )12 = ...( )ab = 0 (No hay interaccin)


H 1 : ( )ij 0 al menos para algn ij

(5-9)

La primeras dos hiptesis [(5-7) y (5-8)] evalan los efectos principales (A y B) y la


ltima [(5-9)] los efectos de interaccin entre los dos factores.
En este caso, se pretende explicar la variabilidad observada en la variable respuesta
en trminos de 4 fuentes posibles de variabilidad: dos factores principales (A y B), su
interaccin y el error aleatorio. Este hecho tambin se ilustra en identidad (5-10):

(y
a

i =1 j =1 k =1

bn (y .. y...)

ijk

i =1

Medida de

y...

an y. j. y...

j =1

Medida de

Medida de

variabilidad

variabilidad

variabilidad

total

debida al factor A

debida al factor B

n y ij . y i .. y. j. + y...
i =1 j =1

(y
a

i =1 j =1 k =1

Medida de variabilidad

(5-10)

ijk

y ij .

Medida de

debida a la interaccin

variabilidad debida

entre A y B

al error aleatorio

La identidad (5-10) muestra la forma como se puede descomponer la variabilidad total


de la variable respuesta en trminos de los dos factores principales, la interaccin y el
error aleatorio.
El sentido de esta identidad se comprende mejor si se analizan las cantidades

(y .. y...) involucra la suma de los


2

involucrados en cada trmino. Por ejemplo, bn

i =1

cuadrados de las diferencias entre los promedios del primer factor, y i y la gran
media, y ; si esta sumatoria es diferente de cero es precisamente debido al efecto del
primer factor, A. De igual forma, si B no influyera sobre la variable respuesta, entonces
todos los sus promedios serian iguales a la gran media y por lo tanto la cantidad
b

an y. j. y... seria igual a cero.


j =1

En la en la Tabla 5.4 se destacan en color verde y azul las calidades involucradas en


el clculo de la suma de cuadrados debida al factor A y B respectivamente. Si todos
los
a

valores

en

verde

son

aproximadamente

iguales

entonces

la

cantidad

bn y i .. y... es cercana a cero y como consecuencia A no influye sobre la variable


i =1

respuesta; si todos los valores en azul son aproximadamente iguales entonces la

(y. . y...)

cantidad an

j =1

es cercana a cero y por lo tanto B no influye sobre la

variable respuesta.

1
1
2
Factor A

y111

y211

.
.
.
a

y112
y11n
y212
y21n
.
.
.

ya11

ya12
ya1n

Factor B
2
y121 y122

y12n
y221 y222

y22n
.
.
.
ya21 ya22

ya2n

Totales

y1

y 2

Promedios

y 1

y 2

y1b1

y2b1

y1b2
y1bn
y2b2
y2bn
.
.
.

yab1

yab2
yabn

yb

y b

Totales

Promedios

y1

y1

y 2

y 2

.
.
.

.
.
.

ya

y a

Tabla 5.4 Trminos involucrados en la valuacin de los efectos principales en un diseo con dos factores. En
verde el factor A y en azul B

(y . y .. y. . + y...) en la ecuacin
a

Para comprender mejor porqu el termino n

i =1 j =1

ij

(5-10) mide la interaccin entre A y B considere los datos en la celda correspondiente


al nivel i del factor A y el nivel j del factor B en la Tabla 5.3. El resumen de los datos
involucrados en el efecto de interaccin se muestra en la
Tabla 5.5

Factor B

Factor A

y ij

y i

.
.
.

.
.
.

y j

Tabla 5.5 Trminos involucrados en la evaluacin de los efectos de interaccin en un diseo con dos factores.

Observe que la cantidad dentro de parntesis en la suma de los cuadrados debido a la

) (

interaccin se puede escribir en la forma y ij . y i .. y. j. + y... = y ij . y i .. y. j. y...

La cantidad, y ij . y i .. es una medida del efecto de B en el nivel i-simo de A y

y. j. y... es una medida del efecto promedio de B para cualquier nivel de A. Si estas
dos cantidades son diferentes es porque el cambio en la variable respuesta debido a B
depende de nivel escogido de A, lo cual indica que existe interaccin entre A y B.
La identidad de la suma de los cuadrados de la ecuacin (5-10) se puede escribir de
manera simblica de la forma:

SCT

Suma de
Cuadrados

SCA

Suma de
=

totales

Cuadrados

SCB

Suma de
+

Factor A

Cuadrados

SCAB

Suma de
+

Factor B

Cuadrados

SCE
Suma de

interaccin

(5-11)

Cuadrados
Error

Adems, tambin se puede demostrar que existen en total abn 1 grados de libertad.
Los efectos principales A y B tienen a b y b 1 grados de libertad, mientras que el
efecto de interaccin AB tiene (a 1) (b 1) grados de libertad. Dentro de cada una de
las ab celdas de la Tabla 5.3 existen n 1 grados de libertad entre las n rplicas, y las
observaciones en la misma celda slo pueden diferir debido al error aleatorio.

Por lo tanto los grados de libertad tambin quedan divididos de acuerdo a la expresin:

SCT

SCA

SCB

SCAB

SCE
(5-12)

abn-1

(a 1)

(b 1)

(a-1)(b-1)

ab(n-1)

Dividiendo cada suma de cuadrados entre sus respectivos grados de libertad se


obtienen las respectivas medias de cuadrados. Si las hiptesis dadas anteriormente
para los efectos principales as como la hiptesis del efecto de interaccin [Hiptesis
(5-9)] son todas verdaderas, se puede demostrar que todas las medias de cuadrados
estiman la misma varianza comn, 2. Por lo tanto, se puede utilizar la distribucin F
para verificar las hiptesis estadsticas en el diseo factorial con dos factores
[Hiptesis de (5-7) y (5-9)].

Los resultados se suelen escribir en una tabla como la siguiente

Fuente de
Variacin

Grados
Suma de Cuadrados

libertad
a

Factor A

SC A =
i =1
b

Factor B

SC B =

yi2 y 2

bn
abn
y2 j

j =1

Interaccin
AB

de

SC AB =

an
yij2
n

i =1 j =1

y2
abn

y2
SS A SS B
abn

Error

SCE = SCT SC AB SC A SCB

Total

SCT = yijk

i =1 j =1 k =1

y2
abn

Media de

F0

cuadrados

Valor P

a-1

MC A =

SC A
a 1

F0 =

MC A
MC E

Probabilidad

b-1

MC B =

SC B
b 1

F0 =

MC B
MC E

Probabilidad

(a-1)(b-1)

MC AB =

SC AB
(a 1)(b 1)

F0 =

MC AB
MC E

Probabilidad

ab(n-1)

MCE =

SCE
ab(n 1)

abn-1

Tabla 5.6 Tabla ANOVA para un diseo factorial con dos factores

5.3.3 Comparacin de medias


Cuando ambos factores son fijos, las comparaciones entre las medias de cualquier
factor pueden efectuarse mediante el empleo de mtodos de comparacin mltiple,
tales como el mtodo grfico o la prueba de rango mltiple de Duncan. Cuando no hay
interaccin, estas comparaciones pueden realizarse con el empleo de los promedios
por rengln, y i o por columna, y j . Sin embargo, cuando la interaccin es
significativa, las comparaciones entre las medias de un factor (por ejemplo, A) pueden
verse oscurecidas por la interaccin AB. En este caso, puede aplicarse a las medias
del factor A un procedimiento tal como la prueba de rangos mltiples de Duncan, con
el valor del factor B ubicado en un nivel en particular.

5.3.4 Verificacin de la adecuacin del modelo y de los


supuestos hechos.
Al igual que en los experimentos de un solo factor, los residuos de un experimento
factorial juegan un papel importante en la evaluacin de la adecuacin de un modelo.
Los residuos de un experimento factorial de dos factores son
eijk = yijk - y ij

(5-13)

Esto es, los residuos son precisamente la diferencia entre las observaciones y los
promedios de celda correspondientes.

5.3.5 Una observacin por celda


En algunos casos donde se tiene un experimento factorial con dos factores, se tiene
slo una rplica esto es, slo una observacin por celda-. En esta situacin, existen
tantos parmetros en el modelo del anlisis de la varianza como observaciones, y en
los grados de libertad del error son cero. Por tanto, no es posible probar hiptesis con
respecto a los efectos principales y a las interacciones, a menos que se hagan
suposiciones con adicionales. Un a de stas es suponer que el efecto de interaccin
es despreciable y utilizar la media de cuadrados de sta como error cuadrtico medio.
De este modo, el anlisis es equivalente al utilizado en el diseo aleatorizado por
bloques. Esta suposicin de no interaccin puede ser peligrosa, y el experimentador
debe examinar con cuidado los datos y los residuos para determinar si existen o no
indicios de interaccin.

5.4 Diseos factoriales con tres factores.


En este diseo se tienen tres factores de inters denotados como A, B y C. Suponga
que se tienen a niveles del factor A, b niveles del factor B, c niveles del factor C y n
replicas. Esto da un total de abcn observaciones, las cuales resultan de todas las
posibles combinaciones de los niveles de cada factor. Por ejemplo, si se tiene 3
niveles de A, 2 niveles de B y 4 niveles de C se obtienen 324 combinaciones
posibles; y si se decide realizar 3 replicas, el total de observaciones ser de 3243 =
72.

En el diseo factorial con tres factores, la variable respuesta, Y se pretende explicar a


partir del modelo:

Yijkl = + i + j + k + ( )ij + ( )ik + ( ) jk + ( )ijk

i = 1,2,..., a
j = 1,2,..., b

+ ijkl
k = 1,2,..., c
l = 1,2,..., n

(5-14)

Este modelo incluye, en total, 8 fuentes de variabilidad: tres efectos principales, tres
efectos de interaccin entre dos factores, un efecto de interaccin entre tres factores y
el termino de error aleatorio. El trmino de error aleatorio incluye el efecto de aquellas
variables o factores distintos a los tres factores considerados en el diseo, que
tambin pueden influir sobre la variable respuesta, pero que se espera que su efecto
sea pequeo y aleatorio.
La Tabla 5.7 muestra la tabla del Anlisis de Varianza para los diseos factoriales con
tres factores.
Fuente de
Variacin

Grados
Suma de Cuadrados

libertad
a

Factor A

yi2 y2

bcn abcn

AB

F0 =

MC A
MC E

Probabilidad

b-1

SC B
b 1

F0 =

MC B
MC E

Probabilidad

acn

MC B =

j =1

y2
abcn

yk2 y2

abn abcn

c-1

MCC =

SC B
c 1

F0 =

MC C
MC E

Probabilidad

SC B =

SCC =
a

AC

Interaccin
BC

SC AC =
i =1 k =1

SC BC =

ABC

yij2

y 2
SS A SS B (a-1)(b-1)
abn

MC AB =

SC AB
(a 1)(b 1)

F0 =

MC AB
MC E

Probabilidad

y i2k y 2

SS A SS C
(a-1)(c-1)
bn
abn

MC AC =

SCAC
(a 1)(c 1)

F0 =

MC AC
MC E

Probabilidad

MCBC =

SCBC
(b 1)(c 1)

F0 =

MC BC
MC E

Probabilidad

F0 =

MC ABC
MC E

Probabilidad

cn

i =1 j =1

y2jk
an

j =1 k =1

Interaccin

y 2j

SC AB =

Interaccin

Valor P

SC A
a 1

k =1

Interaccin

F0

cuadrados

MC A =

Factor C

Media de

a-1

SC A =
i =1

Factor B

de

SC AB =

2
y ijk

i =1 j =1 k =1

y2
SS B SS C (b-1)(c-1)
abn

y2
SS A
abn

MC ABC =
(a-1)(b-1)(c-1)

SS B SS C SS AB SS AC SS BC

Error

SCE = SCT SC AB SC A SCB

abc(n-1)

Total

y2
SCT = y
abn
i =1 j =1 k =1

abcn-1

2
ijk

SC ABC
(a 1)(b 1)(c 1)

MCE =

SCE
abc( n 1)

Tabla 5.7 Tabla ANOVA para un diseo factorial con tres factores

En la tabla de Anlisis de Varianza (Tabla 5.7) se puede apreciar las 7 hiptesis nulas
en tela de juicio: las que evalan los tres efectos principales, los tres de interaccin
binarias y la interaccin entre tres factores. Cada una de estas hiptesis establece que
el efecto correspondiente no es significativo, y se deben rechazar, a favor de la
hiptesis alternativa correspondiente, si su valor P en la tabla ANOVA (Tabla 5.7) es
menor que el nivel de significancia establecido para la prueba (usualmente del 5%).

5.5 Diseos factoriales generales.


Para estudiar el caso general, considere f factores A, B, C,, K con niveles a, b, c,,
k, respectivamente, donde la letra K denota al f-simo o ltimo factor del conjunto a
estudiar, no necesariamente al decimoprimero, que es el lugar de esta letra en el
alfabeto. Con estos niveles y factores se puede construir el diseo factorial general a x
b x x k, que consiste de a x b x k tratamientos o puntos de prueba. Con este diseo
se pueden estudiar f efectos principales, f (f - 1) /2 interacciones dobles, f (f 1)(f
2)/(3 x 2) interacciones triples, y as sucesivamente hasta la nica interaccin de los f
factores (ABC K). El clculo del nmero de interacciones de cierta cantidad m de
factores se hace mediante la operacin combinaciones de f en m

( ) = m!( ff ! m )!
f
m

que cuenta el nmero de maneras diferentes de seleccionar m factores de los f, donde


f! = f x (f 1) xx 2 x 1.

En resumen, con el diseo factorial general descrito se pueden estudiar los siguientes
2f 1 efectos:

f
= f efectos principales (A, B, K)
1
f f ( f 1)
=
interaccin entre dos factores (AB, AC, )
2
2
M

= f interaccin entre f-1 factores (ABCK-1,)


f 1
f
= 1 interaccin con todos los factores (ABCK)
1

(5-15)

Por ejemplo, el diseo factorial 25 tiene cinco efectos principales, 10 interacciones


dobles, 10 interacciones triples, cinco interacciones cudruples y una interaccin
quntuple, lo que da un total de 5 +10 +10 +5 +1= 31 efectos. Por su parte, el factorial
35 tiene tambin estos 31 efectos, pero al contar con tres niveles en cada factor, cada
efecto principal se puede descomponer en su parte lineal

y cuadrtica, y cada

interaccin doble en cuatro componentes, las triples en ocho componentes, as


sucesivamente, las interacciones se parten segn los grados de libertad que tienen
sus sumas de cuadrados. Cabe hacer notar que mientras el diseo factorial 25 tiene 32
tratamientos, el factorial 35 tiene 243, una cantidad de tratamientos difcil de manejar.
Aun si pudiera correrse, representa una opcin muy ineficaz; adems de que existen
arreglos experimentales ms pequeos y eficientes.

Una fraccin de la tabla de Anlisis de Varianza con la columna de fuente de variacin,


Suma de cuadrados y grados de libertad se muestra en Tabla 5.8

Fuente Variacin

Suma de cuadrados

Grados de liberta

Efecto A

SCA

a-1

Efecto k

SCK

k-1

Interaccin AB

SCAB

(a-1) (b-1)

Interaccin K(k-1)

SC(K-1)K

(l-1) (k-1)

Interaccin ABC

SCABC

(a-1)(b-1)(c-1)

Interaccin (K-2)(K-1)K

SC(K-2)(K-1)K

(m-1)(l-1)(k-1)

Interaccin ABK

SCABK

(a-1)(b-1)(k-1)

Error

SCE

abcj(n-1)

Total

SCT

(abckn)-1

Tabla 5.8 ANOVA para el diseo factorial general

La columna de la media de cuadrados, el valor F y el valor P de la tabla ANOVA, se


obtienen de manera anloga a como se vio en los diseos con dos o tres factores.
De acuerdo a lo antes dicho, en el factorial general a x b xx k, se pueden plantear

2f 1 hiptesis que se prueban mediante el anlisis de varianza. Las primeras tres


columnas de este ANOVA se muestran en la Tabla 5.8.

La suma de cuadrados totales est dada por

SCT = L yij2Lmr
i =1 j =1

m=1 r =1

y2L
,
N

(5-16)

donde N= abc kn es el total de observaciones en el experimento; los subndices k y


m representan al tercero y ltimo factor, respectivamente. Las sumas de cuadrados de
efectos son
a

SC A =
i =1

yi2L
y2
L
bc L lkn
N

y2jL

j =1

ac L lkn

(5-17)

y2L
N

(5-18)

y2 kL
y2
L
ab L lkn
N

(5-19)

y2Lm
y2
L
N
m=1 abc L ln

(5-20)

SC B =
a

SCC =
i =1

M
k

SC K =
a

SC AB =
i =1 j =1

yij2L
c L lkn

y2L
SC A SC B
N

(5-21)

M
SC(k 1)K

y2L pm

y2L
=

SC(k 1) SC K
N
p =1 m=1 abc L n
l

SC ABC =
i =1 j =1 k =1

2
yijk
L

lkn

y2L
SC A SC B L SC AC SC BC
N

(5-22)

(5-23)

M
a

SC ABLK = L
i =1 j =1

p =1 m =1

yij2L pm
n

y2L
SC A L SC AB L SC ABLK 1.
N

SCE = SCT SC A L SCK SC AB L SC(k 1)K SC ABC L SC ABLK .

(5-24)
(5-25)

En el ANOVA de la Tabla 5.8 para el factorial general a x b xx k se observa la


necesidad de contar con al menos dos rplicas del experimento para poder calcular la
suma de cuadrados del error (SCE), y poder completar toda la tabla de ANOVA. Sin
embargo, esta necesidad de rplicas (n2) es para el caso irreal de que interesan los
2f 1 efectos. Pero resulta que, con excepcin del factorial 22, prcticamente nunca en
un factorial completo interesan todos sus posibles efectos, puesto que en general slo
algunos de ellos estn activos. El principio de Pareto, que en este contexto se llama
tambin principio de esparcidad de efectos, dice que la mayora de la variabilidad
observada se debe a unos pocos de los efectos posibles; por lo comn se debe a
algunos efectos principales e interacciones dobles. En general no influyen las
interacciones de tres o ms factores, por lo que es innecesario gastar recursos
experimentales para estudiar estos efectos.

En resumen, slo en el caso irreal de que todos los posibles efectos en el diseo
factorial general estn activos, es necesario realizar al menos dos rplicas del
experimento. En las situaciones reales se replican al menos dos veces (y no siempre)
slo los diseos factoriales consistentes de 16 o menos puntos de prueba.

5.6 Ejercicios propuestos.


1. A continuacin se muestra parte del ANOVA para un diseo factorial 3 x 5 con dos
rplicas, el factor A con tres niveles y el B con cinco.

F. de variacin

Suma de

Grados de

Cuadrado

cuadrados

libertad

medio

800

900

AB

300

Error

400

Razn F

Total

a. Suponga efectos fijos, anote el modelo estadstico apropiado y formule las


hiptesis a probar para este experimento.
b. Agregue en esta tabla los grados de libertad, el cuadrado medio y la razn F
para cada una de las fuentes de variacin.

c. Explique de manera esquemtica cmo calculara el p-value para A, por


ejemplo.
d. Con la informacin disponible se pueden hacer conjeturas sobre cules de las
fuentes de variacin son significativas estadsticamente? Argumente.

2. En una fbrica de aceites vegetales comestibles la calidad se ve afectada por la


cantidad de impurezas dentro del aceite, ya que stas causan oxidacin, y por ello
repercute a su vez en las caractersticas de sabor y color del producto final. El
proceso de blanqueo que consiste bsicamente en elevar la temperatura del
aceite, agregar cierta cantidad de arcilla (arena), y agitar durante cierto tiempo
para que las impurezas se adhieran a la arcilla; de esta manera al bajar la
temperatura del aceite y dejarlo en reposo, la arcilla junto con las impurezas se
depositen en el fondo del tanque de aceite. Una forma de medir la eficacia del
proceso de blanqueo es midiendo el color del aceite. De acuerdo al mtodo de
medicin que se aplica en esta planta, consideran que a un aceite se le elimin las
suficientes impurezas si el color es mayor a 4.8 (a mayores valores ms claro el
aceite). Cuando los lotes del proceso de blanqueo no cumplen con los
requerimientos de blancura, la solucin del problema implica reprocesos, aumento
del tiempo de ciclo, entre otras cosas. Para generar una primera aproximacin a la
solucin del problema se decide estudiar la temperatura y el porcentaje de arcilla a
nivel laboratorio inicialmente. El diseo y los datos de las pruebas experimentales
se muestran a continuacin.

Porcentaje de arcilla
Temperatura

0.8

0.9

1.0

1.1

90

5.8

5.9

5.4

5.5

4.9

5.1

4.5

4.4

100

5.0

4.9

4.8

4.7

4.6

4.4

4.1

4.3

110

4.7

4.6

4.4

4.4

4.1

4.0

3.7

3.6

a. Construya el modelo estadstico y formule las hiptesis pertinentes.


b. Cul es el nombre del diseo utilizado?
c. Normalmente, a condiciones reales se utiliza 1.1% de arcilla y 100 grados de
temperatura. Por qu cree que se han elegido precisamente los niveles de
prueba para el experimento?
d. Realice un anlisis de varianza para probar las hiptesis y obtenga
conclusiones.

e. Apoyndose en las grficas de efectos, cul es la relacin general entre el


color y los factores controlados en su rango de experimentacin?
f.

A partir de la grfica de interacciones, cree que haya un efecto no lineal?


Apoye su respuesta con el anlisis de varianza apropiado.

g. Considerando que el nivel mnimo aceptable de blancura es de 4.8, qu


tratamiento utilizara?
h. Vale la pena ahora plantear el estudio a condiciones reales?
i.

Qu cambio le hara al experimento si lo corre a condiciones reales?

3. En un laboratorio de microbiologa se realiza un experimento para investigar si


influye el tipo de verdura (lechuga-L, cilantro-C, zanahoria-Z) y la temperatura (8 y
20C) de almacenamiento en la sobrevivencia del vidrio colerae. Se hicieron varias
rplicas. El porcentaje de sobrevivencia obtenido despus de 24 horas de
inoculado el alimento se muestra a continuacin.

Temperatura
Alimento

20

13.1 15.0 33.6 35.5 42.0 11.1 12.8

6.2 28.5 41.0 35.9 25.0 23.8 79.0 41.6

19.0 19.0 66.6 66.6 11.0 11.0 49.0 49.0

84.3 68.7 68.7 30.5 30.5 11.0 11.0 20.0

1.2 1.2 0.2 0.1 0.3 0.2 0.1 0.4 0.2 0.3

25.8 21.8 16.0 16-0 20.1 15.4 13.3 25.2

a. Seale el nombre del diseo que se ha empleado y formule las hiptesis que
pueden ser apropiadas.
b. Haga un anlisis de varianza e interprtelo con detalle.
c. Verifique el supuesto de igual varianza entre los tratamientos (varianza
constante). Si se cumplen satisfactoriamente?
d. En caso de que no se cumpla el supuesto anterior, cmo afecta esto a sus
conclusiones?
4. Para el caso del problema anterior:
a. Transforme los datos con logaritmos, haga el anlisis de varianza.
b. Verifique supuestos.
c. Cules son las diferencias ms importantes que encontr en los dos anlisis?
Por qu?
d. Con los datos transformados, y en caso de que haya alguna interaccin
relevante, interprtela con detalle.

5. En una empresa alimenticia se desean evaluar cuatro antioxidantes, a travs de su


efecto en un aceite vegetal. El propsito es seleccionar el producto que retrase
ms la oxidacin. Las pruebas se hacen a condiciones de estrs, midiendo como
variable respuesta el ndice de perxidos. Diferentes unidades experimentales se
evalan a diferentes tiempos. Los datos obtenidos se muestran a continuacin (en
el control no se agrega ningn antioxidante)

Tiempo
Producto

4 horas

8 horas

12 horas

Control

3.84,

3.72

27.63,

27.58

39.95,

39.00

4.00,

3.91

22.00,

21.83

46.20,

45.60

3.61,

3.61

21.94,

21.85

43.58,

42.98

3.57,

3.50

20.50,

20.32

45.14,

44.89

3.64,

3.61

20.30,

20.19

44.36,

44.02

a. Seale los factores controlados y la variable de respuesta.


b. Formule el modelo estadstico apropiado al problema y la hiptesis estadstica
que se pueden probar.
c. Haga un anlisis de varianza y observe los aspectos ms relevantes.
d. Los supuestos del modelo se cumplen?
e. Considerando que a menor ndice de perxidos mejor es el producto, hay
algn producto que sea mejor estadsticamente?

También podría gustarte