Está en la página 1de 5

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Dpto. de Estadística e Informática Métodos Estadísticos para la Investigación I

Capítulo XI
ANALISIS DE COVARIANZA

Objetivos:

- Identificar la existencia de una variable cuantitativa independiente que afecta a la


variable respuesta en un experimento.
- Incluir la variable cuantitativa independiente en el análisis correspondiente a un
DCA o DBCA.

1. Introducción

En el análisis de un experimento se evalúa el efecto de los tratamientos en una variable


respuesta, cuantificando en el error experimental el efecto de otras variables no incluidas
en el estudio.

En muchos casos, como el mencionado anteriormente, el análisis de varianza es el


método estadístico adecuado para analizar los datos. Sin embargo, hay experimentos
donde la variable respuesta está relacionada con una o más variables independientes.
Kuehl (2001), denomina a estas variables independientes como concomitantes o
covariadas, ya que pueden medirse en cualquier momento durante el experimento y al
realizar el análisis de datos se puede evaluar su influencia sobre la variable respuesta.
Este autor comenta también que el uso de estas variables como información adicional
en el experimento es considerado una práctica de control local, teniendo como objetivo
reducir la estimación del error experimental.

La técnica del análisis de covarianza (ANCOVA) combina la metodología de la regresión


lineal con el análisis de varianza y evalúa la influencia de una covariable sobre la variable
respuesta. Está técnica permite también comparar los tratamientos en base a las medias
de la variable respuesta ajustada por la covariable.

En este capítulo se tratará al análisis de covarianza con una sola variable independiente
y se presentará el análisis para el Diseño completamente al azar y el Diseño de Bloques
Completos al Azar.

2. Ventajas y desventajas del análisis de covarianza

Ventajas

 Disminuye el error experimental, obteniendo el aumento en la precisión del


experimento.
 Es útil cuando la característica adicional que diferencia a las unidades
experimentales es cuantitativa y toma muchos valores. Es decir, cuando no es
práctico considerar a esta variable como un bloque en el experimento.
 Permite ajustar los promedios de los tratamientos, por la diferencia entre los
promedios de la variable independiente.

224
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Dpto. de Estadística e Informática Métodos Estadísticos para la Investigación I

Desventajas
 El cálculo manual (sin el uso de un programa estadístico) para realizar el análisis es
laborioso.
 Si existe interacción entre la covariable con el tratamiento y/o con el bloque, y entre
el tratamiento con el bloque, estas van incluidas en el error experimental.
 Presenta una elevada cantidad de supuestos.

3. Supuestos del análisis de covarianza

Cuando se utiliza el análisis de covarianza es necesario asumir ciertos requisitos que le


den validez al análisis. Estos supuestos son los siguientes:

 La variable X es fija, medida sin error y no es afectada por los tratamientos.


 Las variables X e Y deben tener varianzas homogéneas en los tratamientos.
 Las variables X e Y deben tener distribución normal.
 La regresión de Y explicada por X, debe ser lineal.
 Los errores deben distribuirse independientemente de forma normal con media cero
y con varianza constante σ2.

4. Análisis de covarianza en el diseño completamente al azar

Modelo aditivo lineal

Yij     i    X ij  X     ij i  1,2,..., t j  1,2,..., r

Donde:
Yij : es el valor observado de la variable respuesta obtenido del i- ésimo tratamiento en
la j-ésima repetición.
 : es el efecto de la media general.
 i : es el efecto del i-ésimo tratamiento.
 : es el coeficiente de regresión lineal del Y explicado por X.
X ij : es el valor observado de la variable independiente en el i-ésimo tratamiento y
la j-ésima repetición
X  : es el promedio de la variable independiente.
 ij : es el efecto del error experimental obtenido del i-ésimo tratamiento en la j-ésima
repetición.

Cuadro ANCOVA

F.V G.L S.C. Y S.P. S.C. aj. G.L aj. C.M. aj.
X2 XY Y2 Y2 -(XY)2/X2
Trat t -1 Txx Txy Tyy
SCE = Eyy – (Exy)2 SCEaj
Error n-t Exx Exy Eyy Exx n–t-1
GLEaj
Trat + Error SCT+E = SCyy - (SPxy)2
n – 1 SCxx SPxy SCyy SCxx
(Total)
DIFERENCIA PARA PRUEBAS DE CMTrataj
SCTrataj = SCT+E – SCE t-1
MEDIAS AJUSTADAS DE TRAT GLTrataj
225
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Dpto. de Estadística e Informática Métodos Estadísticos para la Investigación I

A continuación, se muestra el procedimiento para construir el cuadro ANCOVA:

1. Calcule los grados de libertad de las fuentes de variación


2. Calcule las sumas de cuadrados total X e Y, y la suma de productos total
(Trat+Error)

t r t r
SC XX   X ij2  TC X SPXY   X ijYij  TC XY
i 1 j 1 i 1 j 1
t r
SCYY   Yij2  TCY
i 1 j 1

Donde:
 X  
2

TC XY 
 X  Y  Y 
2

TC X  TCY 
n n n

3. Calcule la suma de cuadrados en X e Y, y la suma de productos para cada una


de las fuentes de variación

Para tratamientos:

 X i 
t 2 t
X iYi
TXX    TC X TXY    TC XY
i 1 ni i 1 ni
Yi 
2
t
TYY    TCY
i 1 ni

Para el error (por diferencia):

EXX  SCXX  TXX EYY  SCYY  TYY EXY  SPXY  TXY

4. Calcule las sumas de cuadrados ajustadas

2 2
E XY SPXY
SCE  EYY  SCT  E  SCYY 
E XX SC XX

5. Calcule los cuadrados medios ajustados y sus grados de libertad

Pruebas de Hipótesis

a) Prueba de influencia de la covariable en el experimento

P1) Planteamiento de Hipótesis

Ho: β = 0 (la variable respuesta depende linealmente de la covariable)


H1: β ≠ 0 (la variable respuesta no depende linealmente de la covariable)

P2) Nivel de significación α

226
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Dpto. de Estadística e Informática Métodos Estadísticos para la Investigación I

P3) Estadístico de Prueba

2
E XY
E XX
Fcal  ~ F(1,GLE aj )
CME aj

P4) Criterios de Decisión

Si Fcal>F(1-α,1,GLE aj) entonces se rechaza H0.

P5) Conclusión

b) Prueba de medias ajustadas

Si la variable respuesta depende linealmente de la covariable entonces las medias


simples deben corregirse por intervención de esta, y se denominarán medias
ajustadas.

La siguiente prueba de hipótesis verifica si el efecto de al menos uno de los


tratamientos influye sobre la media ajustada de la variable respuesta.

P1) Planteamiento de Hipótesis

H 0 : 1.aj  2.aj  ...  t .aj i  1,2,..., t


H1 : Al menos un i.aj es distinto a los demás

P2) Nivel de significación α

P3) Estadístico de Prueba

CMTrat aj
Fcal  ~ F(GLTrat aj ,GLE aj )
CME aj

P4) Criterios de Decisión

Si Fcal>F(1-α, GLTrat aj,GLE aj) entonces se rechaza H0.

P5) Conclusión

Las medias de tratamientos ajustadas

Las estimaciones de las medias de tratamientos se ajustan a un valor común de la


covariable, si la inclusión de esta en el modelo reduce significativamente el error
experimental. La siguiente formula se utiliza para obtener la estimación puntual de las
medias de tratamientos ajustadas por la media general de la covariable:

Yiaj  Yi  ˆ ( X i  X  ) i  1,2,..., t

227
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Dpto. de Estadística e Informática Métodos Estadísticos para la Investigación I

Donde ˆ es el coeficiente de regresión estimado y se obtiene con la siguiente expresión:


E
ˆ  XY
E XX

Pruebas de Comparación de Medias de Tratamientos

Para aplicar las pruebas de comparación de medias de tratamientos se debe de utilizar


las medias de los tratamientos ajustadas por la regresión.

Las desviaciones estándar para las pruebas se muestran en el siguiente cuadro:

Prueba de Comparación Desviación estándar

 1 1 ( X i  X j  )2 
t y DLS Sd  CMEaj    
r r EXX
 i j 
CMEaj  1 1 ( X i  X j  )2 
Tukey Sd     
2  ri rj EXX 
 1 1 ( X  X T  )2 
Dunett Sd  CMEaj    i 
 ri rT E XX 

Estas fórmulas se aplican si el diseño es un DCA con ri y rj repeticiones para el par de


tratamientos que se estén comparando (rT es el número de repeticiones para el
tratamiento testigo)

Ejemplo de Aplicación 1

Se utilizó un experimento para determinar si tres tipos de alimentos producen el mismo


peso en el ganado porcino (en kilogramos). Por ello se registró el peso inicial (en
kilogramos) de los cerdos antes del experimento.

Los datos obtenidos fueron:

Peso inicial (X) 3 4 7 8 9 8 10 10 11


Peso final (Y) 12.0 14.0 16.0 20.2 21.3 18.9 19.0 19.2 20.0
Dieta A A A B B B C C C
Estos datos se pueden presentar alternativamente en la siguiente tabla:

A B C
Repetición
X Y X Y X Y
1 3 12 8 20.2 10 19
2 4 14 9 21.3 10 19.2
3 7 16 8 18.9 11 20
Total 14 42 25 60.4 31 58.2

228

También podría gustarte