Está en la página 1de 52

1

ndice

Diseos factoriales

Jos Gabriel Palomo Snchez


gabriel.palomo@upm.es
E.U.A.T.
U.P.M.

Julio de 2011

ndice

ndice

Diseos factoriales con dos factores


1
2
3
4
5
6
7
8
9
10
11
12
13

Denicin
Organizacin de los datos
Ventajas de los diseos factoriales frente a la experimentacin
clsica
Objetivos
El concepto de interaccin
Hiptesis del modelo
Consecuencias de las hiptesis del modelo
Estimacin de los parmetros del modelo
El Anlisis de la varianza en los diseos factoriales con dos
factores
El test de la F
La tabla ADEVA
Diagnosis y validacin del modelo
Inferencia sobre los parmetros del modelo

ndice

Diseos factoriales con dos factores I

En ocasiones, el experimentador est interesado en estudiar el


efecto sobre la variable respuesta de varios factores.
En estos casos la alternativa a la experimentacin clsica, en la
que se estudia el efecto de cada factor en experimentos
independientes, es el diseo factorial.

Definicin

Un diseo factorial con dos factores consiste en experimentar con


todos los tratamientos que se obtienen al combinar cada nivel de un
factor con los niveles del otro.

ndice

Ejemplo I

Se desea analizar si el rendimiento de un determinado cultivo


depende del tipo de semilla y de fertilizante empleados. Se
dispone de dos semillas (A y B ) y de tres fertilizantes 1, 2 y 3.
El diseo factorial consta de 2 3 = 6 tratamientos, como se
muestra en la tabla:
SEMILLA

F
E
R
T

1
2
3

A
yA
yA
yA

1
2
3

B
yB
yB
yB

1
2
3

ndice

Diseos factoriales con dos factores II

En general, si existen dos factores de inters, el primero con


niveles y el segundo con J niveles distintos, el conjunto de
datos del diseo factorial se resume en una tabla del tipo:
FACTOR
F
A
C
T
O
R

1
2
..
.

y
y

11
12

..
.

y
y

21
22

..
.

J yJ yJ
1

K
yK
yK

1
2

..
.
yKJ

El valor yij representa la observacin realizada de la variable


respuesta, en el nivel i del primer factor, y en el valor j del
segundo.
5

ndice

Diseos factoriales con dos factores III

Las ventajas fundamentales del diseo factorial frente a la


experimentacin clsica son las siguientes:
Eciencia: con menos experimentos se estiman los efectos con
la misma precisin.
Mayor informacin, pues con la experimentacin clsica no se
exploran todas las combinaciones de los niveles de los factores.
Mayor rango de validez de las conclusiones.

ndice

Diseos factoriales con dos factores IV.


Objetivos

Los objetivos de un diseo factorial con dos factores son los


siguientes:

Contrastar si existen diferencias entre las medias de la variable


respuesta en cada uno de los niveles del factor 1.

Contrastar si existen diferencias entre las medias de la variable


respuesta en cada uno de los niveles del factor 2.

Contrastar si los dos factores interaccionan.

ndice

El concepto de interaccin

Empricamente se comprueba que, en ocasiones, el efecto que,


sobre la variable respuesta, se produce por el cambio de nivel
en un determinado factor depende del nivel al que se
encuentre el otro.
Cuando esto sucede se dice que ambos factores interaccionan.

ndice

Ejemplo II

En el grco adjunto se observa


el cambio en la respuesta
producido al pasar del nivel 1 al 2
del factor A, cuando el factor B
se encuentra en su nivel 1.

R | B = 1

ndice

Ejemplo II

En este nuevo grco se observa


el cambio en la respuesta
producido al pasar del nivel 1 al 2
del factor A, cuando el factor B
se encuentra en su nivel 2.

R | B = 2

10

ndice

Ejemplo II

Al comparar ambos grcos, se


observa cmo el cambio
producido en la respuesta al pasar
del nivel 1 al 2 el factor A,
cuando el factor B se encuentra
en su nivel 1, es
signicativamente distinto del
cambio producido cuando el
factor B se encuentra a nivel 2.
En este caso ambos factores
interaccionan.
11

R | B = 1

R | B = 2

ndice

Ejemplo III

En el nuevo grco adjunto se


observa, en otro caso, el cambio
en la respuesta producido al pasar
del nivel 1 al 2 del factor A,
cuando el factor B se encuentra
en su nivel 1.

R | B = 1

12

ndice

Ejemplo III

En este grco se observa el


cambio en la respuesta producido,
en este caso, al pasar del nivel 1
al 2 del factor A, cuando el factor
B se encuentra en su nivel 2.

R | B = 2

13

ndice

Ejemplo III

Al comparar ambos grcos, se


observa, en esta ocasin, cmo el
cambio producido en la respuesta
al pasar del nivel 1 al 2 el factor
A, cuando el factor B se
encuentra en su nivel 1, no es
signicativamente distinto del
cambio producido cuando el
factor B se encuentra a nivel 2.
En este caso ambos factores
no interaccionan.
14

R | B = 1
R | B = 2

ndice

Hiptesis del modelo I

La signicatividad de los factores y de la interaccin entre ellos se


analiza bajo las siguientes hiptesis:
La variable respuesta se puede descomponer en la forma:

yij = + i + j + ()ij + eij , donde:


representa la media general.
es la desviacin de la media general debida a que la
i

observacin se realiza en el nivel i del primer factor.

es la desviacin de la media general debida a que la


j

observacin se realiza en el valor j del segundo factor.

() es la desviacin de la media debida a la conuencia del


nivel i del primer factor con el nivel j del segundo. Este
trmino representa la interaccin entre los dos factores.
ij

e representa el error aleatorio.


ij

15

ndice

Hiptesis del modelo II

Adems, se supone que:


Para todos los valores de i y j , se tiene que:

eij N (0, ).
Todos los eij son independientes entre s.
Por ltimo, para evitar problemas de indeterminacin en la
estimacin del modelo, se impondr que:
K
X
i =1

16

i =

J
X
j =1

j =

K
X
i =1

()ij =

J
X
j =1

()ij = 0.

ndice

Consecuencias de las hiptesis del modelo I

Como consecuencia de las hiptesis se cumple que:


La variable respuesta en los individuos sometidos al nivel i del
primer factor, y al valor j del segundo, sigue una distribucin:
(Y |F 1 = i F 2 = j ) N ( + i + j + ()ij , ).

Todos los yij son independientes entre s.

17

ndice

Consecuencias de las hiptesis del modelo II

Grcamente,
Y

yij b
eij
+ i + j + ()ij

F1 = i
F2 = j

18

19

ndice

Observaciones I

El objetivo fundamental del estudio es analizar si existen


diferencias signicativas entre los valores de los i , de los de
j , y de los de ()ij .

El nmero de parmetros del modelo que hay que estimar es:


1 + (I 1) + (J 1) + (I 1) (J 1) + 1 = I J + 1 = n + 1,
por lo que no hay datos sucientes para la estimacin de todos
los parmetros del modelo.

ndice

Observaciones II

El problema de la falta de un nmero suciente de


observaciones para la estimacin de todos los parmetros del
modelo tiene distintas soluciones en la literatura.
La solucin ms empleada para soslayar este problema, cuando
es econmicamente viable, es replicar el experimento varias
veces.
Una rplica de un experimento consiste en la realizacin
completa, de nuevo, de dicho experimento. Lo que incluye la
aleatorizacin del orden de los nuevos ensayos, etc.

20

ndice

Observaciones III

En lo sucesivo, se considerar que el experimento realizado


consta de un diseo completo replicado R veces:
FACTOR

F
A
C
T
O
R

1
1

y
y

1
1
..
.

1
111
112

..
.

R
..
.
y1J 1
y1J 2
..
.
11

y
y
y

2
211
212

..
.

R
..
.
y2J 1
y2J 2
..
.
21

J
J
J
J y JR y JR
1

..
.

..
.

..
.

yK
yK

11
12

..
.
yK 1 R
..
.

yKJ
yKJ

1
2

..
.
yKJR

22

ndice

Estimacin del modelo I

Para estimar la media global , se utiliza la media de todas las


observaciones:

= y =

PK PJ PR
i =1 j =1 r =1 yijr

El valor de i , desviacin de la media global atribuible a que la


observacin se realiza en el nivel i del factor 1, se estima por:

i = yi y ,

donde:

yi

PJ PR
j =1 r =1 yijr
=
J R

ndice

Estimacin del modelo II. Observacin

Debe observarse que


i se calcula como la diferencia entre la media
de todas las observaciones realizadas en el nivel i del primer factor
y la media global, lo que es coherente con el signicado de i en el
modelo.

23

24

ndice

Estimacin del modelo III

La siguiente tabla resume la estimacin de los efectos del factor 1:


FACTOR

y
1

F
A
C
T

..
.

111

..
.

11

..
.

yJ

O
R

1 1

..
.

y JR
= (
y y )
1

yK

11

yK

yKJ

..
.

..
.

..
.
..
.

..
.

..
.

yKJR
= (
yK y )

25

ndice

Estimacin del modelo IV

El valor de j , desviacin de la media global atribuible a que la


observacin se realiza en el valor j del factor 2, se estima por:
j = yj y ,

donde:
PK PR
y
yj = i =1 r =1 ijr
K R

ndice

Estimacin del modelo V. Observacin

De manera similar a como se hizo en el caso de


i , debe observarse
que j se calcula como la diferencia entre la media de todas las
observaciones realizadas en el nivel j del segundo factor y la media
global, lo que es coherente con el signicado de j en el modelo.

26

ndice

Estimacin del modelo VI

La siguiente tabla resume la estimacin de los efectos del factor 2:

FACTOR

y
F

A
C
T

..
.

O
R

1
111

..
.

R
..
.
y1J 1
..
.
11

211

..
.

R
..
.
y2J 1
..
.
21

y JR y JR
1

27

..
.

..
.

..
.

yK

11

..
.
yK 1R
..
.

yKJ

1 = (
y1 y )

..
.

..
.
yKJR

J = (
yJ y )

28

ndice

Estimacin del modelo VII

La interaccin ()ij , que es la desviacin de la media general


producida por la realizacin del ensayo experimental en los
niveles i del factor 1 y j del factor 2, simultneamente, viene
dada por:

()
ij = yij yi yj + y ,

donde,
PR
y
yij = r =1 ijr .

Es decir, yij representa la media de todas las observaciones


obtenidas en los niveles i del factor 1 y j del factor 2,
simultneamente.

29

ndice

Estimacin del modelo VIII

Por ltimo, la varianza del error experimental, 2 , se estima


por la varianza residual:
sR2 =

eijr
,
K J (R 1)
PPP

donde

eijr

) = yijr yij .
= yijr (
+
i + j + ()
ij

ndice

Anlisis de la varianza I

Como en los casos anteriores, el anlisis de la existencia de


diferencias en la variable respuesta debidas a los niveles de los
factores, o a la interaccin, se puede realizar comparando la
variabilidad explicada por cada uno de estos trminos con la
variabilidad total.
As:
+ eijr .
(yijr y ) =
i + j + ()
ij

30

ndice

Anlisis de la varianza II

Llamando variabilidad total y variabilidad explicada por el factor 1,


respectivamente, a los trminos:

VT

K X
J X
R
X
i =1 j = 1 r =1

(yijr y )2

VE () =

31

K X
J X
R
X
i =1 j = 1 r =1

i = JR
2

K
X
i =1

i2 .

ndice

Anlisis de la varianza III

Y, de forma anloga, llamando variabilidad explicada por el factor


2, variabilidad explicada por la interaccin, y variabilidad no
explicada, respectivamente, a los trminos:

VE () =
VE () =
y

K X
J X
R
X
i =1 j = 1 r =1

J X
R
K X
X
i = 1 j =1 r =1

VNE
32

j2 = KR

2 =R
()
ij

K X
J X
R
X
i =1 j = 1 r =1

J
X
j =1

j2 .

J
K X
X
i =1 j = 1

eijr .
2

2.
()
ij

ndice

Anlisis de la varianza IV

Se puede demostrar que:

VT

= VE () + VE () + VE () + VNE .

El trmino VE () depende slo de la variabilidad entre los


distintos
i .
El trmino VE () depende slo de la variabilidad entre los
distintos j .
El trmino VE () depende slo de la variabilidad entre los
ij .
distintos ()
El trmino
residuos.
33

VNE es una medida de la variabilidad de los

ndice

Anlisis de la varianza V

Observaciones:

En la medida en que VE () sea grande en relacin con VNE ,


habr evidencia de diferencia entre los valores de los efectos
sobre las respuesta de los distintos niveles del factor 1.
En la medida en que VE () sea grande en relacin con VNE ,
habr evidencia de diferencia entre los valores de los efectos
sobre las respuesta de los distintos niveles del factor 2.
En la medida en que VE () sea grande en relacin con VNE ,
habr evidencia de la existencia de interaccin entre los dos
factores.
34

ndice

Anlisis de la varianza VI

Discutir la magnitud de VE (), VE () y de


analizar sus distribuciones de probabilidad.

VE (), requiere

Teorema I
1

Si se verica la hiptesis:
1 = 2 = = K = 0,

la variable
2

VE ()/ se distribuye como una K .


2

Si se verica la hiptesis:
1 = 2 = = J = 0,

la variable
35

VE ()/ se distribuye como una J .


2

ndice

Anlisis de la varianza VII

Teorema II

Si se verica que
()ij = 0, para todos los valores de

la variable

Teorema III

i y j,

VE ()/ se distribuye como una (K )(J ) .


2

La variable VNE / 2 se distribuye, en cualquier caso, como una


2KJ (R 1) y es independiente de las tres distribuciones anteriores.

ndice

Anlisis de la varianza VIII

Consecuencia I

Si se verica la hiptesis:
1 = 2 = = K = 0

la variable
VE ()
2 (K 1)
VNE

2 KJ (R 1)

37

F(K 1;KJ (R 1))

ndice

Anlisis de la varianza IX

Consecuencia II

Si se verica la hiptesis:
1 = 2 = = J = 0

la variable
VE ()
2 (J 1)
VNE

2 KJ (R 1)

38

F(J 1;KJ (R 1))

ndice

Anlisis de la varianza X

Consecuencia III

Si se verica la hiptesis:
()ij = 0, para todos los valores de

i y j,

la variable
VE ()
2 (K 1)(J 1)
VNE

2 KJ (R 1)

39

F((K 1)(J 1);KJ (R 1))

ndice

Anlisis de la varianza XI

Llamando se2 () al valor de


se2 () al valor de

y sR2 al valor de

VE ()/(K-1),

VE ()/(J-1),

VNE /(KJ(R-1)).

Se tiene que cuando 1 = 2 = = K = 0:


se2 ()
F((K 1);KJ (R 1)).
sR2

Y cuando 1 = 2 = = J = 0:
se2 ()
F((J 1);KJ (R 1)).
sR2
40

ndice

Anlisis de la varianza XII

Anlogamente, llamando se2 () al valor de


VE ()/(K-1)(J-1):

Se tiene que cuando ()ij = 0, para todos los valores de


se2 ()
F((K 1)(J 1);KJ (R 1)).
sR2

i y j,

42

ndice

Anlisis de la varianza XIII. El test de la

Empleando los resultados anteriores, para discutir el contraste:

: 1 = 2 = = K = 0,

frente a

H : Existe al menos un i tal que i


1

basta con analizar el valor del estadstico

s 2 ()
= e2
sR

6= 0,

43

ndice

Anlisis de la varianza XIV. El test de la

De manera que, si se denomina

F al valor tal que

P (F(K ;KJ (R )) > F ) = ,


1

cuando

s 2 ()
= e 2 < F
sR

se aceptar la hiptesis nula, (i = 0, para todo i ), que se


rechazar en caso contrario.
Ntese que el test de la F es un contraste unilateral,
en coherencia con la hiptesis que se contrasta.
Observacin:

II

44

ndice

Anlisis de la varianza XV. El test de la

Anlogamente, para discutir el contraste:

: 1 = 2 = = J = 0,

frente a

H : Existe al menos un j tal que j 6= 0,


1

basta con analizar el valor del estadstico

s 2 ()
= e2
sR

III

45

ndice

Anlisis de la varianza XVI. El test de la

De manera que, si se denomina

F al valor tal que

P (F(J ;KJ (R )) > F ) = ,


1

cuando

s 2 ()
= e 2 < F
sR

se aceptar la hiptesis nula, (j = 0, para todo j ), que se


rechazar en caso contrario.
Ntese que el test de la F es un contraste unilateral,
en coherencia con la hiptesis que se contrasta.
Observacin:

IV

46

ndice

Anlisis de la varianza XVII. El test de la

De la misma manera, para discutir el contraste:

: ()ij = 0, para todos los valores de i y j ,

frente a

H : Existe al menos un ()ij tal que ()ij 6= 0,


1

basta con analizar el valor del estadstico

F
comparndolo con el

s 2 ()
= e 2 ,
sR

F apropiado.

ndice

Anlisis de la varianza XVIII. La tabla ADEVA

Los resultados de los tests de la

F se resumen en la

Tabla ADEVA

Varian.

p-v.

K 1

se2 ()

se2 ()

sR2

p()

J 1

se2 ()

se2 ()

sR2

p()

se2 ()

sR2

p()

Fuentes

Suma

Grados

de variac.

de cuadrados

de libertad

Factor 1

JR

(K-1)(J-1)

se2 ()

Residual

i2
P
KR j2
PP 2
R
()ij
PPP
(eijr )2

KJ (R 1)

sR2

Total

nsY

n1

sY2

Factor 2
Interaccin

47

ndice

Anlisis de la varianza XIX. Diagnosis y


validacin del modelo

Como en los casos anteriores, una vez realizado el anlisis de


la varianza, antes de emplear las conclusiones all extradas, es
necesario vericar las hiptesis del modelo.
Esta vericacin se lleva a cabo por medio del anlisis de los
residuos.
La discusin de la normalidad se realiza a travs del papel
probabilstico normal.
La comprobacin de la homocedasticidad requiere grcos de
los residuos frente a los distintos valores de los factores y
frente a los valores previstos por el modelo.
48

49

ndice

Inferencia para los parmetros del modelo I

Una vez realizada la diagnosis del modelo, puede ser necesario


hacer inferencia respecto de los parmetros del mismo.
La inferencia respecto del valor de i se puede hacer teniendo
en cuenta que:

yi i
sR / JR

tKJ (R 1)

La comparacin de dos desviaciones de la media general


provocadas por dos valores distintos del factor 1, i y j , se
puede realizar si se tiene en cuenta que:
(
yi yj q
) (i j )
tKJ (R 1)
2
sR JR

50

ndice

Inferencia para los parmetros del modelo II

Anlogamente,
La inferencia respecto del valor de j se puede hacer teniendo
en cuenta que:

yj j
sR / KR

tKJ (R 1)

La comparacin de dos desviaciones de la media general


provocadas por dos valores distintos del bloque, i y j , se
puede realizar si se tiene en cuenta que:
(
yi yj q
) (i j )
tKJ (R 1)
2
sR KR

51

ndice

Inferencia para los parmetros del modelo III

La inferencia respecto de ()ij se realiza considerando que

yij
()ij
sR / R

tKJ (R 1)

La inferencia respecto de 2 se realiza teniendo en cuenta la


siguiente distribucin:

KJ (R 1)sR
2

2KJ (R 1)

ndice

Inferencia para los parmetros del modelo


IV. Observaciones

La extensin a modelos con ms de dos factores se realiza de


una manera natural.
En el caso en que no se realicen rplicas, una tcnica habitual
es considerar nulas las interacciones de orden superior o igual a
tres, con lo que se disminuye el nmero de parmetros del
modelo a estimar.
El lector interesado en los puntos anteriores puede consultar el
libro de Daniel Pea Regresin y diseo de experimentos.
Alianza editorial. (2002)

52

También podría gustarte