Está en la página 1de 52

ndice

Diseos factoriales

Jos Gabriel Palomo Snchez gabriel.palomo@upm.es


E.U.A.T. U.P.M.

Julio de 2011

ndice

ndice

Diseos factoriales con dos factores


1 2 3 4 5 6 7 8 9 10 11 12 13

Denicin Organizacin de los datos Ventajas de los diseos factoriales frente a la experimentacin clsica Objetivos El concepto de interaccin Hiptesis del modelo Consecuencias de las hiptesis del modelo Estimacin de los parmetros del modelo El Anlisis de la varianza en los diseos factoriales con dos factores El test de la F La tabla ADEVA Diagnosis y validacin del modelo Inferencia sobre los parmetros del modelo

ndice

Diseos factoriales con dos factores I

En ocasiones, el experimentador est interesado en estudiar el efecto sobre la variable respuesta de varios factores. En estos casos la alternativa a la experimentacin clsica, en la que se estudia el efecto de cada factor en experimentos independientes, es el diseo factorial.

Definicin

Un diseo factorial con dos factores consiste en experimentar con todos los tratamientos que se obtienen al combinar cada nivel de un factor con los niveles del otro.

ndice

Ejemplo I

Se desea analizar si el rendimiento de un determinado cultivo depende del tipo de semilla y de fertilizante empleados. Se dispone de dos semillas (A y B ) y de tres fertilizantes 1, 2 y 3. El diseo factorial consta de 2 3 = 6 tratamientos, como se muestra en la tabla:

F E R T

1 2 3

A yA yA yA

SEMILLA

1 2 3

B yB yB yB

1 2 3

ndice

Diseos factoriales con dos factores II

En general, si existen dos factores de inters, el primero con niveles y el segundo con J niveles distintos, el conjunto de datos del diseo factorial se resume en una tabla del tipo:
FACTOR F A C T O R

J yJ yJ
1 2

1 2 . . .

y y

1
11 12

. . .

y y

2
21 22

. . .

K yK yK

1 2

. . . yKJ

El valor yij representa la observacin realizada de la variable respuesta, en el nivel i del primer factor, y en el valor j del segundo.
5

ndice

Diseos factoriales con dos factores III

Las ventajas fundamentales del diseo factorial frente a la experimentacin clsica son las siguientes: Eciencia: con menos experimentos se estiman los efectos con la misma precisin. Mayor informacin, pues con la experimentacin clsica no se exploran todas las combinaciones de los niveles de los factores. Mayor rango de validez de las conclusiones.

ndice

Diseos factoriales con dos factores IV. Objetivos

Los objetivos de un diseo factorial con dos factores son los siguientes:
1

Contrastar si existen diferencias entre las medias de la variable respuesta en cada uno de los niveles del factor 1. Contrastar si existen diferencias entre las medias de la variable respuesta en cada uno de los niveles del factor 2. Contrastar si los dos factores interaccionan.

ndice

El concepto de interaccin

Empricamente se comprueba que, en ocasiones, el efecto que, sobre la variable respuesta, se produce por el cambio de nivel en un determinado factor depende del nivel al que se encuentre el otro. Cuando esto sucede se dice que ambos factores interaccionan.

ndice

Ejemplo II

En el grco adjunto se observa el cambio en la respuesta producido al pasar del nivel 1 al 2 del factor A, cuando el factor B se encuentra en su nivel 1.
1 2

R | B = 1

ndice

Ejemplo II

En este nuevo grco se observa el cambio en la respuesta producido al pasar del nivel 1 al 2 del factor A, cuando el factor B se encuentra en su nivel 2.
1 2

R | B = 2

10

ndice

Ejemplo II

Al comparar ambos grcos, se observa cmo el cambio producido en la respuesta al pasar del nivel 1 al 2 el factor A, cuando el factor B se encuentra en su nivel 1, es signicativamente distinto del cambio producido cuando el factor B se encuentra a nivel 2. En este caso ambos factores interaccionan.
11

R | B = 1

R | B = 2

ndice

Ejemplo III

En el nuevo grco adjunto se observa, en otro caso, el cambio en la respuesta producido al pasar del nivel 1 al 2 del factor A, cuando el factor B se encuentra en su nivel 1.
1 2

R | B = 1

12

ndice

Ejemplo III

En este grco se observa el cambio en la respuesta producido, en este caso, al pasar del nivel 1 al 2 del factor A, cuando el factor B se encuentra en su nivel 2.
1 2

R | B = 2

13

ndice

Ejemplo III

Al comparar ambos grcos, se observa, en esta ocasin, cmo el cambio producido en la respuesta al pasar del nivel 1 al 2 el factor A, cuando el factor B se encuentra en su nivel 1, no es signicativamente distinto del cambio producido cuando el factor B se encuentra a nivel 2. En este caso ambos factores no interaccionan.
14

R | B = 1 R | B = 2

ndice

Hiptesis del modelo I

La signicatividad de los factores y de la interaccin entre ellos se analiza bajo las siguientes hiptesis: La variable respuesta se puede descomponer en la forma:

yij = + i + j + ( )ij + eij , donde:


representa la media general. es la desviacin de la media general debida a que la
i

observacin se realiza en el nivel i del primer factor.


j

es la desviacin de la media general debida a que la

observacin se realiza en el valor j del segundo factor.


ij

( ) es la desviacin de la media debida a la conuencia del nivel i del primer factor con el nivel j del segundo. Este trmino representa la interaccin entre los dos factores.
15

e representa el error aleatorio.


ij

ndice

Hiptesis del modelo II

Adems, se supone que: Para todos los valores de i y j , se tiene que:

eij N (0, ).
Todos los eij son independientes entre s. Por ltimo, para evitar problemas de indeterminacin en la estimacin del modelo, se impondr que:
K i =1
i =

J j =1
j =

K i =1
( )ij =

J j =1

( )ij = 0.

16

ndice

Consecuencias de las hiptesis del modelo I

Como consecuencia de las hiptesis se cumple que: La variable respuesta en los individuos sometidos al nivel i del primer factor, y al valor j del segundo, sigue una distribucin:
(Y |F 1 = i F 2 = j ) N ( + i + j + ( )ij , ).

Todos los yij son independientes entre s.

17

ndice

Consecuencias de las hiptesis del modelo II

Grcamente,
Y

yij eij + i + j + ( )ij

F1 = i F2 = j

18

ndice

Observaciones I

El objetivo fundamental del estudio es analizar si existen diferencias signicativas entre los valores de los i , de los de j , y de los de ( )ij . El nmero de parmetros del modelo que hay que estimar es: 1 + (I 1) + (J 1) + (I 1) (J 1) + 1 = I J + 1 = n + 1, por lo que no hay datos sucientes para la estimacin de todos los parmetros del modelo.

19

ndice

Observaciones II

El problema de la falta de un nmero suciente de observaciones para la estimacin de todos los parmetros del modelo tiene distintas soluciones en la literatura. La solucin ms empleada para soslayar este problema, cuando es econmicamente viable, es replicar el experimento varias veces. Una rplica de un experimento consiste en la realizacin completa, de nuevo, de dicho experimento. Lo que incluye la aleatorizacin del orden de los nuevos ensayos, etc.

20

ndice

Observaciones III

En lo sucesivo, se considerar que el experimento realizado consta de un diseo completo replicado R veces:
FACTOR

1 1
F A C T O R

y y y

1
111 112

J J J J y JR y JR
1 2

1 1 . . .

. . .

y y y

2
211 212

. . .

. . . . . . . . .

R . . . y1J 1 y1J 2 . . .
11

R . . . y2J 1 y2J 2 . . .
21

. . . yK 1 R . . . . . . yKJR

yK yK

K
11 12

yKJ yKJ

1 2

ndice

Estimacin del modelo I

Para estimar la media global , se utiliza la media de todas las observaciones:


= =y

K i =1

J j =1

R y r =1 ijr

El valor de i , desviacin de la media global atribuible a que la observacin se realiza en el nivel i del factor 1, se estima por:
i y , i = y

donde:
i = y
22

J j =1

J R

R y r =1 ijr

ndice

Estimacin del modelo II. Observacin

Debe observarse que i se calcula como la diferencia entre la media de todas las observaciones realizadas en el nivel i del primer factor y la media global, lo que es coherente con el signicado de i en el modelo.

23

ndice

Estimacin del modelo III

La siguiente tabla resume la estimacin de los efectos del factor 1:


FACTOR

y
1
F A C T O R

1
111

. . .

. . .

. . .

yK yK

K
. . .
11

11

yJ
. . .
1

. . .

. . . . . .

1 1

yKJ
. . .

. . .

J
1

y JR ) = ( y y
1

yKJR ) = ( yK y

24

ndice

Estimacin del modelo IV

El valor de j , desviacin de la media global atribuible a que la observacin se realiza en el valor j del factor 2, se estima por:
j = y j y ,

donde:
j = y

K i =1

R y r =1 ijr R

25

ndice

Estimacin del modelo V. Observacin

De manera similar a como se hizo en el caso de i , debe observarse j se calcula como la diferencia entre la media de todas las que observaciones realizadas en el nivel j del segundo factor y la media global, lo que es coherente con el signicado de j en el modelo.

26

ndice

Estimacin del modelo VI

La siguiente tabla resume la estimacin de los efectos del factor 2: 1

FACTOR

y
F A C T O R

1
111

1 . . .

. . .

y y

2
211

. . .

. . . . . . . . .

y JR y JR
1 2

R . . . y1J 1 . . .
11

R . . . y2J 1 . . .
21

. . . yK 1R . . . . . . yKJR

yK

K
11

1 = ( ) y1 y

yKJ

. . .
J = ( ) y J y

27

ndice

Estimacin del modelo VII

La interaccin ( )ij , que es la desviacin de la media general producida por la realizacin del ensayo experimental en los niveles i del factor 1 y j del factor 2, simultneamente, viene dada por:
) =y i y j + y , ( ij ij y

donde,
ij = y

R y r =1 ijr .

ij representa la media de todas las observaciones Es decir, y obtenidas en los niveles i del factor 1 y j del factor 2, simultneamente.
28

ndice

Estimacin del modelo VIII

Por ltimo, la varianza del error experimental, 2 , se estima por la varianza residual:
2 sR =

eijr , K J (R 1)
2

donde

eijr

) ) = yijr y j + ( ij . = yijr ( + i + ij

29

ndice

Anlisis de la varianza I

Como en los casos anteriores, el anlisis de la existencia de diferencias en la variable respuesta debidas a los niveles de los factores, o a la interaccin, se puede realizar comparando la variabilidad explicada por cada uno de estos trminos con la variabilidad total. As:
) + eijr . j + ( ) = (yijr y i + ij

30

ndice

Anlisis de la varianza II

Llamando variabilidad total y variabilidad explicada por el factor 1, respectivamente, a los trminos:
K
=

VT
y

i =1 j = 1 r =1 K J R

)2 (yijr y

VE () =

i =1 j = 1 r =1

i = JR
2

K i =1
i2 .

31

ndice

Anlisis de la varianza III

Y, de forma anloga, llamando variabilidad explicada por el factor 2, variabilidad explicada por la interaccin, y variabilidad no explicada, respectivamente, a los trminos:
K J R J j =1

VE ( ) = VE ( ) =
y
K

i =1 j = 1 r =1 J R

j2 = KR

j2 .

i = 1 j =1 r =1

)2 = R ( ij

i =1 j = 1

)2 . ( ij

VNE
32

K
=

i =1 j = 1 r =1

eijr .
2

ndice

Anlisis de la varianza IV

Se puede demostrar que:

VT

= VE () + VE ( ) + VE ( ) + VNE .

El trmino VE () depende slo de la variabilidad entre los distintos i . El trmino VE ( ) depende slo de la variabilidad entre los j . distintos El trmino VE ( ) depende slo de la variabilidad entre los )ij . distintos ( El trmino residuos.
33

VNE es una medida de la variabilidad de los

ndice

Anlisis de la varianza V

Observaciones:

En la medida en que VE () sea grande en relacin con VNE , habr evidencia de diferencia entre los valores de los efectos sobre las respuesta de los distintos niveles del factor 1. En la medida en que VE ( ) sea grande en relacin con VNE , habr evidencia de diferencia entre los valores de los efectos sobre las respuesta de los distintos niveles del factor 2. En la medida en que VE ( ) sea grande en relacin con VNE , habr evidencia de la existencia de interaccin entre los dos factores.
34

ndice

Anlisis de la varianza VI

Discutir la magnitud de VE (), VE ( ) y de analizar sus distribuciones de probabilidad.

VE ( ), requiere

Teorema I
1

Si se verica la hiptesis:
1 = 2 = = K = 0,

la variable
2

VE ()/ se distribuye como una K .


2 2 1

Si se verica la hiptesis:
1 = 2 = = J = 0,

la variable
35

VE ( )/ se distribuye como una J .


2 2 1

ndice

Anlisis de la varianza VII

Teorema II

Si se verica que
( )ij = 0, para todos los valores de

i y j,
2 1 1

la variable

VE ( )/ se distribuye como una (K )(J ) .


2

La variable VNE / 2 se distribuye, en cualquier caso, como una 2 KJ (R 1) y es independiente de las tres distribuciones anteriores.

Teorema III

ndice

Anlisis de la varianza VIII

Consecuencia I

Si se verica la hiptesis:
1 = 2 = = K = 0

la variable
VE () 2 (K 1)
2 KJ (R 1)

VNE

F(K 1;KJ (R 1))

37

ndice

Anlisis de la varianza IX

Consecuencia II

Si se verica la hiptesis:
1 = 2 = = J = 0

la variable
VE ( ) 2 (J 1)
2 KJ (R 1)

VNE

F(J 1;KJ (R 1))

38

ndice

Anlisis de la varianza X

Consecuencia III

Si se verica la hiptesis:
( )ij = 0, para todos los valores de

i y j,

la variable
VE ( ) 2 (K 1)(J 1)
2 KJ (R 1)

VNE

F((K 1)(J 1);KJ (R 1))

39

ndice

Anlisis de la varianza XI
2 Llamando se () al valor de 2 se ( ) al valor de 2 y sR al valor de

VE ()/(K-1),

VE ( )/(J-1),

VNE /(KJ(R-1)).

Se tiene que cuando 1 = 2 = = K = 0:


2 se () F((K 1);KJ (R 1)). 2 sR

Y cuando 1 = 2 = = J = 0:
2 se ( ) F((J 1);KJ (R 1)). 2 sR

40

ndice

Anlisis de la varianza XII

2 Anlogamente, llamando se ( ) al valor de VE ( )/(K-1)(J-1):

Se tiene que cuando ( )ij = 0, para todos los valores de


2 se ( ) F((K 1)(J 1);KJ (R 1)). 2 sR

i y j,

ndice

Anlisis de la varianza XIII. El test de la

Empleando los resultados anteriores, para discutir el contraste:

H
frente a

: 1 = 2 = = K = 0,

H : Existe al menos un i tal que i


1

= 0,

basta con analizar el valor del estadstico

s 2 () = e2 sR

42

ndice

Anlisis de la varianza XIV. El test de la

II

De manera que, si se denomina


1

F al valor tal que


1

P (F(K ;KJ (R )) > F ) = ,


cuando

s 2 () = e 2 < F sR

se aceptar la hiptesis nula, (i = 0, para todo i ), que se rechazar en caso contrario. Ntese que el test de la F es un contraste unilateral, en coherencia con la hiptesis que se contrasta.
Observacin:

43

ndice

Anlisis de la varianza XV. El test de la

III

Anlogamente, para discutir el contraste:

H
frente a

: 1 = 2 = = J = 0,

H : Existe al menos un j tal que j = 0,


1

basta con analizar el valor del estadstico

s 2 ( ) = e2 sR

44

ndice

Anlisis de la varianza XVI. El test de la

IV

De manera que, si se denomina


1

F al valor tal que


1

P (F(J ;KJ (R )) > F ) = ,


cuando

s 2 ( ) = e 2 < F sR

se aceptar la hiptesis nula, (j = 0, para todo j ), que se rechazar en caso contrario. Ntese que el test de la F es un contraste unilateral, en coherencia con la hiptesis que se contrasta.
Observacin:

45

ndice

Anlisis de la varianza XVII. El test de la

De la misma manera, para discutir el contraste:

H
frente a

: ( )ij = 0, para todos los valores de i y j ,

H : Existe al menos un ( )ij tal que ( )ij = 0,


1

basta con analizar el valor del estadstico

F
comparndolo con el
46

F apropiado.

s 2 ( ) = e 2 , sR

ndice

Anlisis de la varianza XVIII. La tabla ADEVA

Los resultados de los tests de la

F se resumen en la F
2 ( ) se 2 sR 2 ( ) se 2 sR 2 ( ) se 2 sR

Tabla ADEVA

Fuentes de variac.

Suma de cuadrados

Grados de libertad

Varian.

p-v. p() p( ) p( )

Factor 1 Factor 2 Interaccin Residual Total

JR KR R nsY
2

i2 2 j ) ( ij (eijr )2
2

K 1 J 1
(K-1)(J-1)

2 se () 2 se ( ) 2 se ( ) 2 sR 2 sY

KJ (R 1) n1

47

ndice

Anlisis de la varianza XIX. Diagnosis y validacin del modelo

Como en los casos anteriores, una vez realizado el anlisis de la varianza, antes de emplear las conclusiones all extradas, es necesario vericar las hiptesis del modelo. Esta vericacin se lleva a cabo por medio del anlisis de los residuos.
La discusin de la normalidad se realiza a travs del papel probabilstico normal. La comprobacin de la homocedasticidad requiere grcos de los residuos frente a los distintos valores de los factores y frente a los valores previstos por el modelo.
48

ndice

Inferencia para los parmetros del modelo I

Una vez realizada la diagnosis del modelo, puede ser necesario hacer inferencia respecto de los parmetros del mismo. La inferencia respecto del valor de i se puede hacer teniendo en cuenta que:
i i y sR / JR tKJ (R 1)

La comparacin de dos desviaciones de la media general provocadas por dos valores distintos del factor 1, i y j , se puede realizar si se tiene en cuenta que:
j ) (i j ) ( yi y sR
49

JR

tKJ (R 1)

ndice

Inferencia para los parmetros del modelo II

Anlogamente, La inferencia respecto del valor de j se puede hacer teniendo en cuenta que:
j j y sR / KR tKJ (R 1)

La comparacin de dos desviaciones de la media general provocadas por dos valores distintos del bloque, i y j , se puede realizar si se tiene en cuenta que:
j ) (i j ) ( y i y sR
50

KR

tKJ (R 1)

ndice

Inferencia para los parmetros del modelo III

La inferencia respecto de ( )ij se realiza considerando que


ij ( )ij y sR / R tKJ (R 1)

La inferencia respecto de 2 se realiza teniendo en cuenta la siguiente distribucin:

KJ (R 1) sR
2

2 KJ (R 1)

51

ndice

Inferencia para los parmetros del modelo IV. Observaciones

La extensin a modelos con ms de dos factores se realiza de una manera natural. En el caso en que no se realicen rplicas, una tcnica habitual es considerar nulas las interacciones de orden superior o igual a tres, con lo que se disminuye el nmero de parmetros del modelo a estimar. El lector interesado en los puntos anteriores puede consultar el libro de Daniel Pea Regresin y diseo de experimentos. Alianza editorial. (2002)

52

También podría gustarte