Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bloques aleatorizados
Julio de 2011
ndice
ndice
Introduccin
1 2
Denicin de variable bloque Organizacin de los datos Hiptesis del modelo Consecuencias de las hiptesis del modelo Estimacin de los parmetros del modelo El Anlisis de la varianza en el modelo de bloques aleatorizados El test de la F La tabla ADEVA Diagnosis y validacin del modelo Inferencia sobre los parmetros del modelo
ndice
Bloques aleatorizados I
Definicin
Una variable bloque es una variable cuyo efecto sobre la respuesta no interesa especcamente al investigador, pero cuya inclusin en el modelo puede disminuir la variabilidad experimental y, en consecuencia, facilitar el anlisis del efecto de los factores de inters sobre la variable dependiente.
ndice
Ejemplo I
Supngase que se desea analizar la diferencia de la bondad de cuatro tipos de semillas de trigo distintas. Para ello se eligen cuatro parcelas de igual rea y, de forma aleatoria, en cada una de ellas se planta un tipo de semilla. Posteriormente se comparan los rendimentos en cada una de las parcelas, (variable respuesta).
ndice
Ejemplo I
Si pueden existir diferentes fertilidades en las distintas parcelas, y se encuentran en el anlisis diferencias entre los rendimientos de las distintas semillas, cmo se sabe que estas diferencias no estn sobrevaloradas a causa de las diferentes fertilidades de las parcelas?
ndice
Ejemplo I
Una alternativa consiste en incluir, como factor (bloque), el tipo de parcela en el anlisis de los resultados. Con ello se consigue:
1
Distinguir el efecto sobre la respuesta de la fertilidad de la parcela del de la bondad de la semilla. Eliminar la variabilidad producida por las distintas parcelas de la variabilidad experimental, por lo que se consigue mayor sensibilidad para detectar posibles diferencias entre las semillas.
ndice
Ejemplo I
De esta manera, cada parcela se dividira, por ejemplo, en cuatro subparcelas y, de forma aleatoria, se adjudicara cada una de estas subparcelas a un tipo de semilla. Los datos del experimento se podran resumir en una tabla como la siguiente:
SEMILLA P A R C E L A
1 2 3 4
y y y y
1
11 12 13 14
y y y y
2
21 22 23 24
y y y y
3
31 32 33 34
y y y y
4
41 42 43 44
ndice
Bloques aleatorizados II
En general, si existe un factor de inters con K niveles y un factor bloque con J valores distintos, el conjunto de datos de la experimentacin se resume en una tabla del tipo:
FACTOR
B L O Q U E
J yJ yJ
1 2
1 2 . . .
y y
1
11 12
. . .
y y
2
21 22
. . .
K yK yK
. . .
1 2
yKJ
El valor yij representa la observacin realizada de la variable respuesta, en el nivel i del factor, y en el valor j del bloque.
8
ndice
Observacin
Debe observarse que, a diferencia de lo expuesto en el modelo del anlisis de la varianza con un factor, en el modelo de bloques aleatorizados en cada condicin experimental, ij , denida por el nivel i del factor y por el nivel j del bloque, se obtendr un nico dato experimental.
ndice
La signicatividad del factor se analiza bajo las siguientes hiptesis: La variable respuesta se puede descomponer segn el modelo:
yij = + i + j + eij ,
donde:
representa la media general. es la desviacin de la media general debida a que la
ndice
eij N (0, ).
El hecho de que el valor de no dependa de los valores de i ni de j se conoce con el nombre de homocedasticidad Todos los eij son independientes entre s. Por ltimo, para evitar problemas de indeterminacin en la estimacin del modelo se impondr la siguiente condicin:
K i =1
11
i =
j =1
j = 0.
ndice
Como consecuencia de las hiptesis se cumple que: La variable respuesta en los individuos sometidos al nivel i del factor, y al valor j del bloque, sigue una distribucin:
(Y |F = i B = j ) N ( + i + j , ).
12
ndice
Grcamente,
Y
yij eij + i + j
+ i + j
F =i B =j
13
ndice
Observaciones
Debe notarse que la diferencia entre dos observaciones obtenidas con distinto nivel del factor, pero dentro del mismo bloque, no depende de la contribucin del bloque. En efecto:
El objetivo fundamental del estudio es analizar si existen diferencias signicativas entre los valores de i .
14
ndice
J y j =1 ij
El valor de i , desviacin de la media global atribuible a que la observacin se realiza en el nivel i del factor, se estima por:
i y , i = y
donde:
i = y
15
J y j =1 ij
ndice
Debe observarse que i se calcula como la diferencia entre la media de todas las observaciones realizadas en el nivel i del factor y la media global, lo que es coherente con el signicado de i en el modelo.
16
ndice
El valor de j , desviacin de la media global atribuible a que la observacin se realiza en el valor j del bloque, se estima por:
j = y j y ,
donde:
j = y
K y i =1 ij
eij . (K 1)(J 1)
2
17
ndice
De manera similar a como se hizo en el caso de i , debe observarse que j se calcula como la diferencia entre la media de todas las observaciones realizadas en el nivel j del bloque y la media global, lo que es coherente con el signicado de j en el modelo.
18
ndice
K 1 valores de i , ya que:
i = 0.
j = 0.
El residuo eij representa la diferencia entre el valor observado y el previsto por el modelo:
j ) = yij y i y j + y eij = yij ( + i +
19
ndice
FACTOR
B L O Q U E
1 2 . . .
1
y y
1
11 12
yJ ) = ( y y
1 1
. . .
y y
2
21 22
yJ ) = ( y y
2 2
. . .
K yK yK
. . .
1 2
yKJ ) = ( yK y
20
ndice
FACTOR
B L O Q U E
y 2 y
1 . . .
1
11 12
J yJ yJ
1 2
. . .
y y
2
21 22
. . .
K yK yK
. . .
1 2
1 = ( ) y 1 y 2 = ( ) y 2 y J = ( ) y J y
yKJ
. . .
ndice
Anlisis de la varianza I
Como en el caso del Anlisis de la varianza con un factor, el anlisis de la existencia de diferencias en la variable respuesta debidas al nivel del factor, o al valor del bloque, se puede realizar comparando la variabilidad explicada por cada uno de los factores con la variabilidad total. As:
) + (yij y i y j + y ) . ) + ( ) = ( y j y (yij y yi y
i j
eij
22
ndice
Anlisis de la varianza II
Llamando variabilidad total y variabilidad explicada por el factor, respectivamente, a los trminos:
K J
VT
y
=
i =1 j = 1
)2 (yij y
VE () =
i =1 j = 1
)2 = J ( yi y
K i =1
)2 = J ( yi y
K i =1
i2 .
23
ndice
Y, de forma anloga, llamando variabilidad explicada por el bloque y variabilidad no explicada, respectivamente, a los trminos:
VE ( ) =
y
i =1 j = 1
)2 = K ( y j y
J j =1
)2 = K ( y j y
J j =1
j2 ,
VNE
=
i =1 j = 1
eij .
2
24
ndice
Anlisis de la varianza IV
VT
Por otro lado,
= VE () + VE ( ) + VNE .
El trmino VE () depende solo de la variabilidad entre los distintos valores de i . El trmino VE ( ) depende solo de la variabilida entre los j . distintos de El trmino residuos.
25
ndice
Anlisis de la varianza V
Observaciones:
En la medida en que VE () sea grande en relacin con VNE , habr evidencia de la existencia de diferencias signicativas en la respuesta producidas por los distintos niveles del factor. En la medida en que VE ( ) sea grande en relacin con VNE , habr evidencia de la existencia de diferencias signicativas en la respuesta producidas por los distintos niveles del bloque.
26
ndice
Anlisis de la varianza VI
Teorema I
1
Si se verica la hiptesis:
1 = 2 = = K = 0,
la variable
2
Si se verica la hiptesis:
1 = 2 = = J = 0,
la variable
27
ndice
Teorema II
La variable
2
28
ndice
Consecuencia I
Si se verica la hiptesis:
1 = 2 = = K = 0
la variable
VE () 2 (K 1)
2 (K 1)(J 1)
VNE
29
ndice
Anlisis de la varianza IX
Consecuencia II
la variable
VE ( ) 2 (J 1)
2 (K 1)(J 1)
VNE
30
ndice
Anlisis de la varianza X
2 Llamando se () al valor de 2 se ( ) al valor de 2 y sR al valor de
VE ()/(K-1),
VE ( )/(J-1),
VNE /((K-1)(J-1)).
Y cuando 1 = 2 = = J = 0:
2 se ( ) F(J 1);((K 1)(J 1)). 2 sR
31
ndice
H
frente a
: 1 = 2 = = K = 0,
s 2 () = e2 sR
32
ndice
II
s 2 () = e 2 < F sR
se aceptar la hiptesis nula, (i = 0, para todo i ), que se rechazar en caso contrario. Ntese que el test de la F es un contraste unilateral, en coherencia con la hiptesis que se contrasta.
Observacin:
33
ndice
III
H
frente a
: 1 = 2 = = J = 0,
s 2 ( ) = e2 sR
34
ndice
IV
s 2 ( ) = e 2 < F sR
se aceptar la hiptesis nula, (j = 0, para todo j ), que se rechazar en caso contrario. Ntese que el test de la F es un contraste unilateral, en coherencia con la hiptesis que se contrasta.
Observacin:
35
ndice
F se resumen en la F
2 ( ) se 2 sR 2 ( ) se 2 sR
Tabla ADEVA
Fuentes de variacin
Suma de cuadrados
Grados de libertad
Varianzas
p-v. p() p( )
) J ( yi y
K 1 J 1
(K 1)(J 1)
2 se () 2 se ( ) 2 sR 2 sY
) K ( y j y (eij )2
)2 (yij y
n1
36
ndice
Como en el Anlisis de la varianza con un factor, una vez realizado el anlisis de la varianza, antes de emplear las conclusiones all extradas, es necesario vericar las hiptesis del modelo. Esta vericacin se lleva a cabo por medio del anlisis de los residuos.
La discusin de la normalidad se realiza a travs del papel probabilstico normal. La comprobacin de la homocedasticidad requiere grcos de los residuos frente a los distintos valores del factor, del bloque y frente a los valores previstos.
37
ndice
Una vez realizada la diagnosis del modelo, puede ser necesario hacer inferencia respecto de los parmetros del mismo. La inferencia respecto del valor de i se puede hacer teniendo en cuenta que:
i i y sR / J t(K 1)(J 1)
La comparacin de las desviaciones de la media general, i y j , provocadas por dos valores distintos del factor, se puede realizar si se tiene en cuenta que:
j ) (i j ) ( yi y sR
38
t(K 1)(J 1)
ndice
Anlogamente, La inferencia respecto del valor de j se puede hacer teniendo en cuenta que:
j j y sR / K t(K 1)(J 1)
La comparacin de las desviaciones de la media general, i y j , provocadas por dos valores distintos del bloque, se puede realizar si se tiene en cuenta que:
j ) (i j ) ( y i y sR
39
t(K 1)(J 1)
ndice
40