Está en la página 1de 40

ndice

Bloques aleatorizados

Jos Gabriel Palomo Snchez gabriel.palomo@upm.es


E.U.A.T. U.P.M.

Julio de 2011

ndice

ndice

Introduccin
1 2

Denicin de variable bloque Organizacin de los datos Hiptesis del modelo Consecuencias de las hiptesis del modelo Estimacin de los parmetros del modelo El Anlisis de la varianza en el modelo de bloques aleatorizados El test de la F La tabla ADEVA Diagnosis y validacin del modelo Inferencia sobre los parmetros del modelo

Inferencia en el modelo de bloques aleatorizados


1 2 3 4 5 6 7 8

ndice

Bloques aleatorizados I

Definicin

Una variable bloque es una variable cuyo efecto sobre la respuesta no interesa especcamente al investigador, pero cuya inclusin en el modelo puede disminuir la variabilidad experimental y, en consecuencia, facilitar el anlisis del efecto de los factores de inters sobre la variable dependiente.

ndice

Ejemplo I

Supngase que se desea analizar la diferencia de la bondad de cuatro tipos de semillas de trigo distintas. Para ello se eligen cuatro parcelas de igual rea y, de forma aleatoria, en cada una de ellas se planta un tipo de semilla. Posteriormente se comparan los rendimentos en cada una de las parcelas, (variable respuesta).

ndice

Ejemplo I

Si pueden existir diferentes fertilidades en las distintas parcelas, y se encuentran en el anlisis diferencias entre los rendimientos de las distintas semillas, cmo se sabe que estas diferencias no estn sobrevaloradas a causa de las diferentes fertilidades de las parcelas?

ndice

Ejemplo I

Una alternativa consiste en incluir, como factor (bloque), el tipo de parcela en el anlisis de los resultados. Con ello se consigue:
1

Distinguir el efecto sobre la respuesta de la fertilidad de la parcela del de la bondad de la semilla. Eliminar la variabilidad producida por las distintas parcelas de la variabilidad experimental, por lo que se consigue mayor sensibilidad para detectar posibles diferencias entre las semillas.

ndice

Ejemplo I

De esta manera, cada parcela se dividira, por ejemplo, en cuatro subparcelas y, de forma aleatoria, se adjudicara cada una de estas subparcelas a un tipo de semilla. Los datos del experimento se podran resumir en una tabla como la siguiente:
SEMILLA P A R C E L A

1 2 3 4

y y y y

1
11 12 13 14

y y y y

2
21 22 23 24

y y y y

3
31 32 33 34

y y y y

4
41 42 43 44

ndice

Bloques aleatorizados II

En general, si existe un factor de inters con K niveles y un factor bloque con J valores distintos, el conjunto de datos de la experimentacin se resume en una tabla del tipo:
FACTOR

B L O Q U E

J yJ yJ
1 2

1 2 . . .

y y

1
11 12

. . .

y y

2
21 22

. . .

K yK yK
. . .

1 2

yKJ

El valor yij representa la observacin realizada de la variable respuesta, en el nivel i del factor, y en el valor j del bloque.
8

ndice

Bloques aleatorizados III

Observacin

Debe observarse que, a diferencia de lo expuesto en el modelo del anlisis de la varianza con un factor, en el modelo de bloques aleatorizados en cada condicin experimental, ij , denida por el nivel i del factor y por el nivel j del bloque, se obtendr un nico dato experimental.

ndice

Hiptesis del modelo I

La signicatividad del factor se analiza bajo las siguientes hiptesis: La variable respuesta se puede descomponer segn el modelo:

yij = + i + j + eij ,
donde:
representa la media general. es la desviacin de la media general debida a que la

observacin se realiza en el nivel i del factor. realiza en el valor j del bloque.


ij j

es la desviacin de la media debida a que la observacin se

e representa el error aleatorio.


10

ndice

Hiptesis del modelo II

Adems se supondr que: Para todos los valores de i y j , se tiene que:

eij N (0, ).
El hecho de que el valor de no dependa de los valores de i ni de j se conoce con el nombre de homocedasticidad Todos los eij son independientes entre s. Por ltimo, para evitar problemas de indeterminacin en la estimacin del modelo se impondr la siguiente condicin:
K i =1
11

i =

j =1

j = 0.

ndice

Consecuencias de las hiptesis del modelo I

Como consecuencia de las hiptesis se cumple que: La variable respuesta en los individuos sometidos al nivel i del factor, y al valor j del bloque, sigue una distribucin:
(Y |F = i B = j ) N ( + i + j , ).

Todos los yij son independientes entre s.

12

ndice

Consecuencias de las hiptesis del modelo II

Grcamente,
Y

yij eij + i + j

+ i + j

F =i B =j

13

ndice

Observaciones

Debe notarse que la diferencia entre dos observaciones obtenidas con distinto nivel del factor, pero dentro del mismo bloque, no depende de la contribucin del bloque. En efecto:

yij ylj = (+i +j +eij )(+l +j +elj ) = (i l )+(eij elj ).


2

El objetivo fundamental del estudio es analizar si existen diferencias signicativas entre los valores de i .

14

ndice

Estimacin de los parmetros del modelo I

Para estimar la media global , se utiliza la media de todas las observaciones:


= y
K i =1

J y j =1 ij

El valor de i , desviacin de la media global atribuible a que la observacin se realiza en el nivel i del factor, se estima por:
i y , i = y

donde:
i = y
15

J y j =1 ij

ndice

Estimacin de los parmetros del modelo II. Observacin

Debe observarse que i se calcula como la diferencia entre la media de todas las observaciones realizadas en el nivel i del factor y la media global, lo que es coherente con el signicado de i en el modelo.

16

ndice

Estimacin de los parmetros del modelo III

El valor de j , desviacin de la media global atribuible a que la observacin se realiza en el valor j del bloque, se estima por:
j = y j y ,

donde:
j = y
K y i =1 ij

La varianza del error experimental, 2 , se estima por la varianza residual:


2 sR =

eij . (K 1)(J 1)
2

17

ndice

Estimacin de los parmetros del modelo IV. Observacin

De manera similar a como se hizo en el caso de i , debe observarse que j se calcula como la diferencia entre la media de todas las observaciones realizadas en el nivel j del bloque y la media global, lo que es coherente con el signicado de j en el modelo.

18

ndice

Estimacin de los parmetros del modelo V


Observaciones:

Solamente es necesario estimar


K i =1

K 1 valores de i , ya que:

i = 0.

j , pues: Por la misma razn, slo hay que estimar J 1 de los


J j =1

j = 0.

El residuo eij representa la diferencia entre el valor observado y el previsto por el modelo:
j ) = yij y i y j + y eij = yij ( + i +
19

ndice

Estimacin de los parmetros del modelo VI

La siguiente tabla resume la estimacin de los efectos del factor:

FACTOR

B L O Q U E

1 2 . . .
1

y y

1
11 12

yJ ) = ( y y
1 1

. . .

y y

2
21 22

yJ ) = ( y y
2 2

. . .

K yK yK
. . .

1 2

yKJ ) = ( yK y

20

ndice

Estimacin de los parmetros del modelo VII

La siguiente tabla resume la estimacin de los efectos del bloque:

FACTOR

B L O Q U E

y 2 y
1 . . .

1
11 12

J yJ yJ
1 2

. . .

y y

2
21 22

. . .

K yK yK
. . .


1 2

1 = ( ) y 1 y 2 = ( ) y 2 y J = ( ) y J y

yKJ

. . .

ndice

Anlisis de la varianza I

Como en el caso del Anlisis de la varianza con un factor, el anlisis de la existencia de diferencias en la variable respuesta debidas al nivel del factor, o al valor del bloque, se puede realizar comparando la variabilidad explicada por cada uno de los factores con la variabilidad total. As:
) + (yij y i y j + y ) . ) + ( ) = ( y j y (yij y yi y
i j

eij

22

ndice

Anlisis de la varianza II

Llamando variabilidad total y variabilidad explicada por el factor, respectivamente, a los trminos:
K J

VT
y

=
i =1 j = 1

)2 (yij y

VE () =

i =1 j = 1

)2 = J ( yi y

K i =1

)2 = J ( yi y

K i =1

i2 .

23

ndice

Anlisis de la varianza III

Y, de forma anloga, llamando variabilidad explicada por el bloque y variabilidad no explicada, respectivamente, a los trminos:

VE ( ) =
y

i =1 j = 1

)2 = K ( y j y

J j =1

)2 = K ( y j y

J j =1

j2 ,

VNE

=
i =1 j = 1

eij .
2

24

ndice

Anlisis de la varianza IV

Se puede demostrar que:

VT
Por otro lado,

= VE () + VE ( ) + VNE .

El trmino VE () depende solo de la variabilidad entre los distintos valores de i . El trmino VE ( ) depende solo de la variabilida entre los j . distintos de El trmino residuos.
25

VNE es una medida de la variabilidad de los

ndice

Anlisis de la varianza V

Observaciones:

En la medida en que VE () sea grande en relacin con VNE , habr evidencia de la existencia de diferencias signicativas en la respuesta producidas por los distintos niveles del factor. En la medida en que VE ( ) sea grande en relacin con VNE , habr evidencia de la existencia de diferencias signicativas en la respuesta producidas por los distintos niveles del bloque.

26

ndice

Anlisis de la varianza VI

Para discutir la magnitud de VE () y VE ( ), respectivamente, es necesario analizar sus distribuciones de probabilidad.

Teorema I
1

Si se verica la hiptesis:
1 = 2 = = K = 0,

la variable
2

VE ()/ se distribuye como una K .


2 2 1

Si se verica la hiptesis:
1 = 2 = = J = 0,

la variable
27

VE ( )/ se distribuye como una J .


2 2 1

ndice

Anlisis de la varianza VII

Teorema II
La variable
2

(K 1)(J 1) y es independiente con las anteriores.

VNE / se distribuye, en cualquier caso, como una


2

28

ndice

Anlisis de la varianza VIII

Consecuencia I

Si se verica la hiptesis:
1 = 2 = = K = 0

la variable
VE () 2 (K 1)
2 (K 1)(J 1)

VNE

F(K 1;(K 1)(J 1))

29

ndice

Anlisis de la varianza IX

Consecuencia II

Si se verica las hiptesis:


1 = 2 = = J = 0

la variable
VE ( ) 2 (J 1)
2 (K 1)(J 1)

VNE

F(J 1;(K 1)(J 1))

30

ndice

Anlisis de la varianza X
2 Llamando se () al valor de 2 se ( ) al valor de 2 y sR al valor de

VE ()/(K-1),

VE ( )/(J-1),

VNE /((K-1)(J-1)).

Se tiene que cuando 1 = 2 = = K = 0:


2 se () F(K 1);((K 1)(J 1)). 2 sR

Y cuando 1 = 2 = = J = 0:
2 se ( ) F(J 1);((K 1)(J 1)). 2 sR

31

ndice

Anlisis de la varianza XI. El test de la

Empleando los resultados anteriores, para discutir el contraste:

H
frente a

: 1 = 2 = = K = 0,

H : Existe al menos un i tal que i = 0,


1

basta con analizar el valor del estadstico

s 2 () = e2 sR

32

ndice

Anlisis de la varianza XII. El test de la

II

De manera que, si se denomina


1 1

F al valor tal que


1

P (F(K ;(K )(J )) > F ) = ,


cuando

s 2 () = e 2 < F sR

se aceptar la hiptesis nula, (i = 0, para todo i ), que se rechazar en caso contrario. Ntese que el test de la F es un contraste unilateral, en coherencia con la hiptesis que se contrasta.
Observacin:

33

ndice

Anlisis de la varianza XIII. El test de la

III

Anlogamente, para discutir el contraste:

H
frente a

: 1 = 2 = = J = 0,

H : Existe al menos un j tal que j = 0,


1

basta con analizar el valor del estadstico

s 2 ( ) = e2 sR

34

ndice

Anlisis de la varianza XIV. El test de la

IV

De manera que, si se denomina


1 1

F al valor tal que


1

P (F(J ;(K )(J )) > F ) = ,


cuando

s 2 ( ) = e 2 < F sR

se aceptar la hiptesis nula, (j = 0, para todo j ), que se rechazar en caso contrario. Ntese que el test de la F es un contraste unilateral, en coherencia con la hiptesis que se contrasta.
Observacin:

35

ndice

Anlisis de la varianza XV. La tabla ADEVA

Los resultados de los tests de la

F se resumen en la F
2 ( ) se 2 sR 2 ( ) se 2 sR

Tabla ADEVA

Fuentes de variacin

Suma de cuadrados

Grados de libertad

Varianzas

p-v. p() p( )

Factor Bloque Residual Total

) J ( yi y

K 1 J 1
(K 1)(J 1)

2 se () 2 se ( ) 2 sR 2 sY

) K ( y j y (eij )2

)2 (yij y

n1

36

ndice

Anlisis de la varianza XVI. Diagnosis y validacin del modelo

Como en el Anlisis de la varianza con un factor, una vez realizado el anlisis de la varianza, antes de emplear las conclusiones all extradas, es necesario vericar las hiptesis del modelo. Esta vericacin se lleva a cabo por medio del anlisis de los residuos.
La discusin de la normalidad se realiza a travs del papel probabilstico normal. La comprobacin de la homocedasticidad requiere grcos de los residuos frente a los distintos valores del factor, del bloque y frente a los valores previstos.
37

ndice

Inferencia sobre los parmetros del modelo I

Una vez realizada la diagnosis del modelo, puede ser necesario hacer inferencia respecto de los parmetros del mismo. La inferencia respecto del valor de i se puede hacer teniendo en cuenta que:
i i y sR / J t(K 1)(J 1)

La comparacin de las desviaciones de la media general, i y j , provocadas por dos valores distintos del factor, se puede realizar si se tiene en cuenta que:
j ) (i j ) ( yi y sR
38

t(K 1)(J 1)

ndice

Inferencia sobre los parmetros del modelo II

Anlogamente, La inferencia respecto del valor de j se puede hacer teniendo en cuenta que:
j j y sR / K t(K 1)(J 1)

La comparacin de las desviaciones de la media general, i y j , provocadas por dos valores distintos del bloque, se puede realizar si se tiene en cuenta que:
j ) (i j ) ( y i y sR
39

t(K 1)(J 1)

ndice

Inferencia sobre los parmetros del modelo III

La inferencia respecto de 2 se realiza teniendo en cuenta la siguiente distribucin:


2 (n K ) sR 2 (K 1)(J 1) 2

40

También podría gustarte