Está en la página 1de 7

Anlisis de covarianza

Existen muchas situaciones en las que deseamos estudiar una respuesta (Y, variable
dependiente) en funcin de uno o ms tratamientos (factor/es) y de una o ms variables x
(regresores) Es decir, nos interesa combinar en el mismo modelo un !"#$! y una
regresin
En el anlisis de covarian%a tenemos tres ob&ectivos importantes'
( )omparar las medias de Y para cada tratamiento en un valor com*n de x
+ )omparar la reclacin entre la Y y la x en cada tratamiento
, !umentar la precisin (disminuir el )-E)
El modelo para datos provenientes de un .)! con una covariable es
ij i ij ij
Y x = + + +
En este modelo
i

representa el efecto del tratamiento i para un valor dado de x y

es el
incremento promedio de las Y de un tratamiento espec/fico cuando x aumenta en una
unidad #bservar que la interpretacin de los parmetros es anloga a la que hicimos en
regresin m*ltiple 0os supuestos que reali%amos acerca de los
ij

son los mismos que


reali%amos en modelos de !"#$! y regresin' independencia, normalidad y
homogeneidad de varian%as !dems, como en todo modelo de regresin, requerimos que
el modelo sea el correcto En particular necesitamos asumir que la relacin entre las Y y
las x es lineal, que la pendiente

es la misma en todos los tratamientos (es decir, no


existe interaccin entre la covariable y el tratamiento) y que los tratamientos no afectan a
la covariable 1ara las pruebas de hiptesis vamos a usar, como siempre hacemos en
regresin m*ltiple, las pruebas de tipo 222
)onsideremos el siguiente e&emplo 3e estudia el efecto de cuatro dietas sobre el peso
final de cerdos, y se registra el peso inicial de los mismos 3e usaron 4 animales por dieta,
en un .)!
data dietas;
input dieta pesoinic pesofin;
datalines;
1 5.0 17.0
1 7.0 21.0
1 5.0 18.0
1 4.0 11.0
1 3.0 6.0
1 6.0 23.0
2 7.0 24.0
2 7.0 26.0
2 8.0 23.0
2 6.0 23.0
2 5.0 18.0
2 9.0 30.0
3 5.0 20.0
3 4.0 13.0
3 3.0 14.0
3 7.0 22.0
3 6.0 23.0
3 5.0 16.0
4 10.0 30.0
4 9.0 28.0
4 8.0 22.0
4 7.0 20.0
4 11.0 31.0
4 9.0 25.0
proc gplot;
plot pesofin*pesoinic=dieta;
El modelo que estamos usando es el descripto anteriormente, que en este e&emplo es'
!nimales de la dieta (' ( )
( ( ( ( j j j
Y x = + + +
!nimales de la dieta +' ( )
+ + + + j j j
Y x = + + +
!nimales de la dieta ,' ( )
, , , , j j j
Y x = + + +
!nimales de la dieta 5' ( )
5 5 5 5 j j j
Y x = + + +
1odemos ver que en cada caso el modelo corresponde a una l/nea recta con intercepto
diferente ( )
i
+
y la misma pendiente ( )
Es decir, tenemos l/neas paralelas 3i
graficamos estos datos podemos ver que el modelo es ra%onable'
1ara comparar las medias de las distintas dietas vemos que tenemos dos opciones'
comparamos cada media de Y sin tener en cuenta las x, o comparamos las medias de Y
estimadas en cierto valor com*n de x 0a primera opcin es lo que har/amos si usamos un
modelo sin la covariable, y podr/amos tener el problema que la dieta que ten/a los
animales ms pesados nos dar/a mayores pesos finales no porque fuese me&or sino porque
el a%ar hi%o que tuviera los animales de mayor peso inicial (En el e&emplo la dieta 5 ten/a
los animales ms pesados inicialmente, y sus pesos finales tambi6n estuvieron entre los
ms altos)
7na comparacin ms ra%onable es aquella que compara las dietas a un nivel com*n de x
(por e&emplo en x x = ) Esta comparacin la reali%a una prueba 8parcial9 (tipo 222), ya
que compara algunos efectos en el modelo 8a&ustando9 por todos los otros t6rminos del
modelo (en este caso la covariable) :)mo calculamos el valor de media de Y cuando
x x = ; 1ara eso usamos la frmula de regresin, reempla%ando
x
por x '
!nimales de la dieta (' ( )
( (
< <
< < Y x = + +
!nimales de la dieta +' ( )
+ +
< <
< < Y x = + +
!nimales de la dieta ,' ( )
, ,
< <
< < Y x = + +
!nimales de la dieta 5' ( )
5 5
< <
< < Y x = + +
=stas son las 8medias a&ustadas9, que en 3!3 se denominan 8least squares means9 0a
prueba de tipo 222 prueba la igualdad de medias a&ustadas, o lo que es lo mismo, la
igualdad de los
i

.ebemos observar que debido a que las l/neas son paralelas, da lo


mismo comparar en x x = o en cualquier otro valor de x' siempre estaremos comparando
igualdad de
i

(se puede probar que en x x = se logra la prueba ms eficiente)


#tra prueba de inter6s es la relacionada a la regresin lineal'
>
' > H =
(es decir, nos
interesa saber si la covariable explica parte de la variabilidad de la Y en un modelo que
tiene los efectos de tratamiento) 0a prueba para esto tambi6n es la prueba parcial (tipo
222) para la covariable
1ara a&ustar este modelo en 3!3 simplemente escribimos la variable tratamiento en
8class9 y las variables tratamiento y covariable en el 8model9'
proc glm;
class dieta;
model pesofin = dieta pesoinic / solution ss3;
lsmeans dieta;
0a opcin 8solution9 del comando 8model9 nos da los estimadores de los parmetros del
modelo y la opcin 8ss,9 nos muestra slo las pruebas de tipo 222 (parciales)
Class Level Information
Class Levels Values
dieta 4 1 2 3 4

Dependent Variable: pesofin
Source DF Sum of Squares Mean Square F Value Pr > F
Model 4 780.1000000 195.0250000 37.85 <.0001
Error 19 97.9000000 5.1526316
Corrected Total 23 878.0000000
Source DF Type III SS Mean Square F Value Pr > F
dieta 3 51.0056604 17.0018868 3.30 0.0427
pesoinic 1 372.1000000 372.1000000 72.22 <.0001
Parameter Estimate Standard Error t Value Pr > t
Intercept -1.450000000 B 3.36048373 -0.43 0.6710
dieta ! 2.200000000 B 1.94386123 1.13 0.2718
dieta " 4.100000000 B 1.49425802 2.74 0.0129
dieta # 4.200000000 B 1.94386123 2.16 0.0437
dieta $ 0.000000000 B . . .
pesoinic 3.050000000 0.35890917 8.50 <.0001
ote: !"e #$# %atri& "as been fo'nd to be sin('lar) and a (enerali*ed in+erse ,as 'sed to sol+e
t"e nor%al e-'ations. !er%s ,"ose esti%ates are follo,ed b. t"e letter $B$ are not 'ni-'el.
esti%able.
/east 0-'ares 1eans
dieta pesofin LSME%& LSME%& &um'er
! 20.5750000 1
" 22.4750000 2
# 22.5750000 3
$ 18.3750000 4
Least Squares Means for effect dieta
Pr > t for ()* LSMean+i,-LSMean+.,
Dependent Varia'le* pesofin
i/. ! " # $
! 0.2189 0.1435 0.2718
" 0.2189 0.9473 0.0129
# 0.1435 0.9473 0.0437
$ 0.2718 0.0129 0.0437
ote: !o ens're o+erall prote2tion le+el) onl. probabilities asso2iated ,it" pre-planned
2o%parisons s"o'ld be 'sed.
/east 0-'ares 1eans at pesoini236
dieta pesofin LSME%&
! 19.0500000
" 20.9500000
# 21.0500000
$ 16.8500000
0os supuestos que hacemos son los de todo modelo lineal (independencia de errores,
normalidad de errores y homogeneidad de las varian%as de los errores), adems de los
espec/ficos del modelo de regresin usado (valide% del modelo de l/neas rectas paralelas)
1ara verificar los primeros supuestos usamos los residuales como siempre, y para
verificar el supuesto de paralelismo podemos probar la hiptesis de no interaccin entre
los tratamientos y la covariable'
>
'
'
ij i ij ij
a ij i ij i ij ij
H Y x
H Y x x


= + + +
= + + + +
!qu/ vemos que si la hiptesis nula es falsa, entonces tenemos un modelo con l/neas
rectas con pendientes diferentes para cada tratamiento'
!nimales de la dieta (' ( ) ( )
( ( ( ( ( j j j
Y x = + + + +
!nimales de la dieta +' ( ) ( )
+ + + + + j j j
Y x = + + + +
!nimales de la dieta ,' ( ) ( )
, , , , , j j j
Y x = + + + +
!nimales de la dieta 5' ( ) ( )
5 5 5 5 5 j j j
Y x = + + + +
1ara hacer esto en 3!3 simplemente a&ustamos un modelo con interaccin, y probamos la
significancia de 6sta (prueba de tipo 222)'
proc glm;
class dieta;
model pesofin = dieta pesoinic dieta*pesoinic;
run;
Dependent Variable: pesofin
Source DF Sum of Squares Mean Square F Value Pr > F
Model 7 799.6000000 114.2285714 23.31 <.0001
Error 16 78.4000000 4.9000000
Corrected Total 23 878.0000000
01Square Coeff Var 0oot MSE pesofin Mean
0.910706 10.54093 2.213594 21.00000
Source DF Type I SS Mean Square F Value Pr > F
dieta 3 408.0000000 136.0000000 27.76 <.0001
pesoinic 1 372.1000000 372.1000000 75.94 <.0001
pesoinic2dieta 3 19.5000000 6.5000000 1.33 0.3006
Source DF Type III SS Mean Square F Value Pr > F
dieta 3 27.5204410 9.1734803 1.87 0.1750
pesoinic 1 372.1000000 372.1000000 75.94 <.0001
pesoinic2dieta 3 19.5000000 6.5000000 1.33 0.3006
El e&emplo que hemos visto era bastante simple' un factor, una covariable y un dise?o
completamente aleatori%ado 0a extensin a casos ms comple&os es directa' podemos
tener ms de un factor, podemos tener ms de una covariable y podemos tener t6rminos
polinomiales en una covariable !dems podemos tener cualquier dise?o experimental
(bloques, cuadrado latino, parcela dividida, etc)

También podría gustarte