Está en la página 1de 7

Análisis de Covarianza

Introducción

El análisis de covarianza es un procedimiento que combina las técnicas de análisis de


varianza y la de análisis de regresión. En nuestro ámbito se emplea cuando al aplicar un
diseño experimental, se sospecha que una variable respuesta puede estar influenciada por
alguna particularidad de las unidades experimentales, la cual es registrada o medida a través
de otra variable aleatoria que recibe el nombre de covariable.

Es decir, la covariable está asociada a la variable respuesta; no obstante, no es afectada por


los tratamientos aplicados en el experimento. En contraste, la variable respuesta, que es la
de interés para el investigador, está directamente afectada por los efectos de tratamientos; de
hecho, es a través de la variable respuesta que se determinan sus efectos.

En este esquema, se sospecha que los efectos de la covariable, están confundidos con los
efectos de los tratamientos, por lo que se hace necesario separarlos aprovechando la la
técnica de regresión. Con ello, se logra eliminara las variaciones causadas por la covariable
sobre la variable respuesta y permite comparar los efectos de los tratamientos en forma
independiente.

Tanto la variable respuesta como la covariable son registradas en la misma unidad


experimental. La variable respuesta es de interés del investigador, en tanto que la covariable
no. Adicionalmente, la covariable, no presenta niveles preestablecidos por el investigador y
se sospecha que tiene efectos sobre la variable respuesta, por ejemplo:

Covariable Variable Respuesta


No. de plantas por parcela Rendimiento
Diámetro de rama Porcentaje de brotación
Peso inicial de animal Ganancia de peso
Grado de preparación Aprovechamiento
Edad de animal Respuesta a medicamento
Esta técnica permite:
1. Controlar el error y aumentar la precisión de las estimaciones.
2. Ajustar las medias del experimento al eliminar el efecto de covariables.
3. Mejorar la interpretación de datos al eliminar la confusión entre la cvariable y la
variable respuesta.
4. Permite realizar una partición la covarianza total (útil en otro tipo de análisis).
5. Permite estimar datos faltantes, al aprovechar la técnica de regresión.

Se comentará la forma de análisis de caso más simple que corresponde a una asociación de
tipo lineal simple.

Recordando el análisis de regresión lineal simple:

16
y = a + mx
12
Yij =  0 + 1Xi +  ij
8

4
β1 = Pendiente de regresión
β0 = Ordenada al origen
0
-2 0 2 4 6
-4

-8
Con base en lo anterior y al considerar como ejemplo en un experimento en donde se estudia
el rendimiento de variedades, la relación lineal entre número de plantas por unidad
experimental (covariable) y el rendimiento (variable respuesta) puede ser de dos tipos:

- No existe relación entre la variable respuesta y la covariable: =0

- La covariable influye en el comportamiento de la variable respuesta: .

Esta relación puede ser lineal (la más atendida), cuadrática, cúbica, etc., lo cual definirá el
modelo de regresión a utilizar.
Supuestos:

Y es una variable aleatoria tal que Y ~ N  y ,  y2 ( )


Para cada covariable X, existe una variable aleatoria Y, entonces:

 Xi  Yi
 Xi Yi − i
n
i
Cov(X Y)
ˆ 1 = i
=
(  Xi ) X
2 2

X 2

n
i

_
ˆ = Y
o
ˆ − ˆ X
1
ˆ ˆ 0 = Y − ˆ 1X

Modelo estadístico (Diseño de BCA)

Bajo un diseño de Bloques Completos al Azar con una observación por nidad experimental,
el modelo estadístico es:

(
Yij =  + i +  j +  Xij − X.. + ij) i = 1, 2 … t tratamientos

j = 1, 2 … r bloques

Yij = Variable respuesta de interés de la unidad experimental ij

 = Media general del experimento (de la variable respuesta)

 i = Efecto del i-ésimo tratamiento (


 i ~ NI t i ,  t2 )
 j = Efecto del j-ésimo bloque (
 j ~ NI b j ,  b2 )
 = Coeficiente de regresión
X ij = Covarible de la unidad experimental ij

X.. = Media de la covariable

 ij = Error experimental asociado a la unidad experimental ij


Supuestos:

a) La variable X (covariable) es independiente de los tratamientos.


b) La regresión de la variable respuesta Y contra la covariable X es lineal e
independiente de tratamientos y bloques (después de eliminar las diferencias de
tratamientos y bloques).
c)  ij ~ NI ( 0, 2 )

Pruebas de hipótesis:
H O : 1 = 0 vs H A : 1  0

H O :  1 =  2 = ....... =  t vs H A : Al menos un efecto es diferente

ANÁLISIS DE COVARIANZA (PROCEDIMIENTO)

Sumas de Cuadrados y Productos Cruzados


FV Gl Y X XY

Yi.2 Y..2 X i.2 X..2 X i.Yi. X..Y..


Tra t-1  r − tr = SCTy i r − tr = SCTx i r

tr
= PCTxy
i

Y.2j Y..2 X.2j X..2 X.jY.j X..Y..


Blo (r-1)  t

tr
= SCB y  t

tr
= SCBx  t

tr
= PCBxy
j j j

Error (t-1)(r-1)  = SCE y  = SCE x  = PCE xy

Y..2 X..2 X.. Y..


Total tr-1  Yij2 −
ij tr
= SCTot y  Xij2 −
ij tr
= SCTot x X Y
ij
ij ij −
tr
= PCTot xy

Posteriormente se genera la fuente de variación ERROR’, a partir de la suma de las hileras


correpondientes a TRATAMIENTOS y el ERROR.
Sumas de Cuadrados y Productos Cruzados

FV Gl Y X XY

Trat t-1 SCTy SCTx PCTxy

r-1 SCBy SCBx PCBxy


Blo

Error (t-1)(r-1) SCE y SCE x PCE xy

Error’ GL(T)+GL(E) SCE 'y = SCTy + SCE y SCE 'x = SCTx + SCE x PCE 'xy = PCTxy + PCE xy
= GL(E’)
Total tr-1 SCTot y SCTot x PCTot xy

Suma de Cuadrados de la Covariable:


2
 PC E xy 
=
PC E xy
ˆ1 = SC(Cov) = ˆ1 PCE xy
SCE x SCE x

Cálculo del error ajustado

( PCE xy )
2

( )
SC E aj = SCE y − SC(Cov) = SCE y −
SCE x

Suma de Cuadrados de Tratamientos Ajustados



( )
2
 PCE 'xy 
SCTaj = SCE y −
'
 − SCE aj
 SCE 'x 
 


( )
2
 PCE 'xy 
= SCE y −
'
 − SCE y − SC(Cov)
 SCE 'x 
 


( )
2

( )
2
 PCE 'xy   PCE xy
= SCE y −
'
− SCE − 
  y 
 SCE 'x  
SCE x
  
Cuadro de análisis de covarianza
FV Gl SC CM Fo
Covariable 1 SC(Cov) SC(Cov) CM(Cov)
1 CME aj

Bloque r-1 SCBy

Tratamientos t-1 SCTaj SCTaj CMTaj


ajustados GLTaj CME aj

Error ajustado (t-1) (r-1)-1 SCE aj SCE aj


GLE aj

Total tr-1 SCTy

Se presenta finalmente el siguiente cuadro en el que aparece la covariable como fuente de


variación. No te que se asigna 1 grado de libertad a la covariable, el cual es restado del error.

FV GL SC CM F
Tratamiento ajustado t-1
Covariable 1
Bloque r-1
Error ajustado 
Total tr-1

Pruebas de hipótesis:
Covariable: H O : ˆ1 = 0 vs H A : 1  0

Si no se rechaza H O quiere decir que 1 = 0 , y se dice que no hay relación entre la variable

respuesta y la covariable. Entonces se debe realizar el análisis de varianza como diseño de


bloques completos al azar.

Si se rechaza H O significa que 1  0 y existe una relación entre la variable respuesta y la

covariable, por lo que se prosigue con el análisis:

Tratamientos ajustados: H O :  1 =  2 = ... t vs H A : al menos un efecto es diferente.

Si no se rechaza H O quiere decir que los efectos de Tratamientos son iguales

Si se rechaza H O quiere decir que al menos un efecto de Tratamientos es diferente.


Cálculo de Medias Ajustadas

Dado que el efecto de tratamientos está confundido o enmascarado por la covariable, se


procede al ajuste de medias para tratamientos.

PCE xy
A=  X i. − X.. 
Tratamiento Yi. X i. SCE x  Yiaj = Yi. − A

Comparación Múltiple de Medias de Tukey

CME aj  SCTx 
DMSH = q ,n ,glEaj 1 + 
r  (t − 1)SCE x 

TAREA (en SAS y en Excel; o bien, R y Excel)


Ejemplo: Martínez G., A. 1994. Experimentación Agrícola. Métodos Estadísticos.
Universidad Autónoma Chapingo. Chapingo, México. 357 pp.
Pag. 289. Se 6 tratamientos. Y = incremento semanal de peso y X = peso inicial en cada
cerdo expresados en kg. Se consideran cinco bloques a cinco zahúrdas.

PROGRAMACIÓN EN SAS
DATA UNO;
INPUT PAR TRA REP COV VR1 VR2 …;
CARDS;
PROC GLM;
CLASS TRA REP; /* no se incluye la covariable */
MODEL VR1 VR2 … = COV REP TRA/ SOLUTION; /* se incluye covariable */
LSMEANS;
RUN;

Si se desea probar un modelo cuadrático: Y = 1X +  2 X 2 :


DATA UNO;
INPUT PARA TRA REP COV VR1 VR2 …;
COV2 = COV**2; se genera el término cuadrático para obtener  2 (  2 X 2 )
CARDS;
PROC GLM; CLASS TRA REP COV COV2;
MODEL VR1 VR2… = TRA REP/ SOLUTION; RUN;

No olvidar que siempre se debe atender a la Suma de Cuadrados Tipo III, ya que
corresponde a los ajustes de la covariable. No es útil la prueba de bloques.

También podría gustarte