Está en la página 1de 14

InnOvaciOnes de NegOciOs 5(1): 25 - 38, 2008

2008 UANL, Impreso en Mxico (ISSN 1665-9627)

Uso de Anlisis de Covarianza (ANCOVA) en investigacin


cientfica
(Use of covariance analysis (ANCOVA) in scientific research)

Badii, M.H., J. Castillo & A. Wong


UANL, San Nicols, N.L., Mxico, mhbadii@yahoo.com.mx

Key words: ANCOVA, auxiliary variable, error reduction, statistics

Abstract. The basics of the ANalisis of COVAriance (ANCOVA) are given. The objectives and
the application of ANCOVA are laid out. Techniques for the estimation of contrasts and for the
control and reduction of the degree of error are discussed. The application of a simple ANCOVA
using real data is highlighted. The application of this technique in fixing the auxiliary variable in
experimentation is emphasized.

Palabras clave: ANCOVA, Estadstica, reduccin de error, variable auxiliar

Resumen. Se presentan las bases del ANlisis de COVArianza (ANCOVA). Se manejan los
propsitos y la aplicacin de este mtodo estadstico. Se discuten las tcnicas para la estimacin
de los contrastes, el control y la disminucin del grado de error. Se presentan un ANCOVA
simple mediante un ejemplo de datos reales. Se enfatiza el papel de esta tcnica estadstica en
fijar el efecto de la variable auxiliar en el experimento.

Introduccin

El anlisis de la covarianza (ANCOVA) se trata de dos o ms


variantes medidas y donde cualquier variable independiente mesurable no se
encuentra a niveles predeterminados, como en un experimento factorial
(Badii & Castillo, 2007, Badii et al., 2007a). La ANCOVA hace uso de
conceptos tanto del anlisis de varianza como de la regresin. Este trabajo
trata la covarianza lineal. A menudo, una relacin lineal es una aproximacin
razonablemente buena para una relacin no lineal con tal que los valores de
las variables independientes no cubran un intervalo muy amplio.

ANCOVA
26

Objetivos del anlisis de la covarianza

El anlisis de covarianza es apropiado para lograr dos objetivos


especficos: a) eliminar cualquier error sistemtico fuera del control del
investigador que puede sesgar los resultados, y b) tener en cuenta las
diferencias en las respuestas debidas a las caractersticas propias de los
encuestados. Un sesgo sistemtico puede ser eliminado por medio de la
asignacin aleatoria de los encuestados a varios tratamientos. Sin embargo,
en estudios no experimentales, estos controles no son posibles. Por ejemplo,
al contrastar los anuncios publicitarios, los efectos pueden diferir
dependiendo del momento del da o de la composicin de la audiencia y de
sus reacciones. El objetivo de la covarianza es eliminar cualquiera de los
efectos que a) influyen solamente a una parte de los encuestados, b) varan
entre los encuestados. Por ejemplo, las diferencias personales, tales como
actitud u opiniones, pueden afectar a las respuestas, pero el experimento no
las incluye como un factor de tratamiento. El investigador utiliza una
covarianza para extraer cualquiera de las diferencias debidas a estos
factores antes de que los efectos del experimento sean calculados. Este es el
segundo papel del anlisis de la covarianza.

Usos de anlisis de covarianza

Los usos ms importantes del anlisis de la covarianza son:

1. Para controlar el error y aumentar la precisin.


2. Ajustar medias de tratamientos de la variable dependiente a las
diferencias en conjuntos de valores de variables independientes
correspondientes.
3. Interpretacin de la naturaleza de los efectos de los tratamientos.
4. Dividir una covarianza total o suma de productos cruzados en
componentes.

Control y reduccin del error


La varianza de una media de tratamiento es x = / n . As, para
2 2

disminuir esta varianza, slo tenemos dos enfoques: el aumento del tamao de
la muestra o el control de la varianza en una poblacin muestreada (Badii et al.,
2004, Badii et al., 2006, Badii et al., 2007b).

M.H. Badii et al.


27

El control de varianza se logra mediante el diseo experimental o


mediante el uso de una o ms covariables. Ambos mtodos pueden usarse
simultneamente. Cuando se usa la covarianza como mtodo para reducir el
error, esto es, de controlar 2, se hace reconociendo el hecho de que la
variacin observada de la variable dependiente Y es parcialmente atribuible a
la variacin de la variable independiente X.
El uso de la covarianza para controlar el error es un medio de
aumentar la precisin con la cual los efectos de los tratamientos pueden
medirse eliminando, por regresin, ciertos efectos reconocidos que no
pueden ser o no han sido controlados efectivamente por el diseo
experimental. Por ejemplo, en un experimento de nutricin animal para
comparar el efecto de varas raciones en el momento de peso, los animales
asignados a un bloque varan en peso inicial. Ahora, si el peso inicial est
correlacionado con la ganancia de peso, una porcin del error experimental
en la ganancia puede deberse a diferencias en el peso inicial. Mediante el
anlisis de la covarianza, esta porcin, una contribucin que puede atribuirse
a diferencias en el peso inicial puede calcularse y eliminarse del error
experimental para ganancia.

Ajuste de medias de tratamientos

Con cierta frecuencia, en la investigacin ocurre que,


simultneamente con los valores de la caracterstica en estudio (sobre cada
unidad experimental), los valores de una o ms variables no aleatorias, cuya
medida se realiza sin error y cuyo efecto sobre la caracterstica de inters, es
importante determinar.

Anlisis de covarianza simple

En un experimento de bloques completos al azar (Tabla 1), los


valores caractersticas de inters son yij y xij . El xij es la variable compaera
(covariable), si se desea que xij ejerza alguna influencia sobre yij se aplica el
anlisis de covarianza; el modelo lineal es:

y ij = + i + T j + X ij + eij (1)

ANCOVA
28

Donde, i = 1,...,r; j = 1,..., t; yij = valor observado; = efecto general, =


efecto de bloque; Tj = efecto de tratamiento; Xij = coeficiente de covarianza,
& eij = error aleatorio de manera que:

E(eij) = E(eij2) = 2 ,

El valor de la respuesta observada sobre las unidades


experimentales, mediante estimacin de contrastes entre efectos de
tratamientos, quiere decir probar la significancia de los mismos y de la
covariable.

Estimacin de contrastes

1. Ignorando la covariable en la expresin (1):

Yij = + i + T j + eij (2)

Este ajuste produce el mnimo de la SC de los errores Eyy:

E yy = SCtotal SCtrat . SCbloque

Y..2
SCtotal =y 2

rt
ij
Y..2
ij Fc = donde rt = n
rt

Y. 2j Y..2
SC trat . =
j r rt

Yi .2 Y..2
SCbloques =
i t rt
Y. 2j Yi.2 Y..2
SC de los errores para Yij : E yy = yij2 +
ij j r i t rt

M.H. Badii et al.


29

El mejor estimador lineal no sesgado de un contraste entre efectos de


tratamientos es:

t j Y. j t j Ti
r
=
r
i =1 i =1 (3)

2. Operando de forma anloga, se calculan Exx y Exy:

SC errores para covariante:

X ..2 X . j X ..2 X i2. X ..2


2

E xx = X ij
2
(4)
ij rt j r rt i t rt

SC Error Multiplicado:


E xy = X ij Yij
( X ..)(Y ..) X . j Y. j F X i.Yi. F
c t c
(5)
ij rt j r i

Factor de correccin multiplicado


Fc =
( X ..)(Y ..) (6)
rt

SC de Bloques:
r
X i2. X ..2
SC bloque = B xx = (7)
i =1 t rt
SC de Tratamientos:
t X .2j X ..2
SCtrat . = Txx = (8)
j =1 r rt

SC de Tratamientos para X:
r t
X ..2
SC totalxx = X ij2 (9)
i =1 j =1 rt

ANCOVA
30

SC de Bloques Multiplicado XY:


r
X i.Yi.
SC bloquexy = B xy = Fc (10)
i =1 t

SC Tratamientos Multiplicados:
t X . j Y. j
SC trat . xy = Txy = Fc (11)
j =1 r

SC Total Multiplicado:
r t
SCtotalxy = X ij Yij
( X ..)(Y ..) (12)
i =1 j =1 rt

Tabla 1. Anlisis de varianza de productos cruzados.


FV gl SC y de productos cruzados
X.X X.Y Y.Y
Bloques (repeticiones) r-1 Bxx Bxy Byy
Tratamientos t-1 Txx Txy Tyy
Error (r-1)(t-1) Exx Exy Eyy
Total rt - 1 SCtot.xx SCtot.xy SCtot.yy

3. Clculo de coeficientes de covariante

El Coeficiente de covariantes:
E xy
E xx = E xy = (13)
E xx

E xy2
Donde el calculo de error XY es igual a E xy =
E xx
La Suma de los Cuadrados de Error se calcula como
E xy2
SC error = E yy (14)
E xx

M.H. Badii et al.


31

Al dividir la suma de los cuadrados de error entre el grado de libertad


correspondiente, se obtiene el Cuadrado medio del error o la varianza:

SC E E yy E 2xy / E xx
CM E = S = 2
= (15)
(r 1)(t 1) 1 (r 1)(t 1) 1

Puesto que, en general, estamos interesados en la estimacin de contrastes,


la expresin para estimar a j j con j = no est dada por la
j
ecuacin anterior sino que esta cantidad debe ajustarse por la presencia de
la covariable; El mejor estimador no sesgado para j j :

j Y. j j Y. j
= j ( y j x j )
t t t t

j j =
j =1 j =1 r

j =1 r j =1
(16)

( y$ j $x j ) = medidas de tratamientos corregidos por Xij.


x j = X .j / r E xy
y j = Y. j / r y =
E xx
La varianza de j j
se compone de 2 partes:

a) Una parte debida a la varianza de la j y j .


b) Otra parte debida al efecto de covariable:

2
t 2 t
2 t
Var. j j =
+ 2 j X . j
2
j
(17)
j =1 r j =1 r E xx j =1

4. Significancia de los efectos de los tratamientos.

H 0 :1 = 2 =L = t
H A :1 2 L t

ANCOVA
32

Bajo la H0:
y ij = + i + X ij + eij (18)

a) Ignorando Xij:
y ij = + i + eij (19)

Bajo el diseo de bloques al azar, bloques y tratamientos son


ortogonales entonces, SC de los errores en el (19):

E yy = E yy + yy = E xx + xx
E xx = E x + xy
E xy

b) El coeficiente de covariacin correspondiente a la ecuacin (18):


E xx = E xy E
= xy

E xx

Notaciones introducidas

(E )
2
xy
E xy =
E xx (20)
(E )
2
xy
SCE = E yy
E xx (21)

c) SC debida a tratamientos, ajustados por el efecto de la covariable


SC ( ) = SC E SC E

SC( )
( )2
E xy (E xy )
2

= E yy E yy
E xx E xx
(22)

M.H. Badii et al.


33

CM ( ) =
[E (E ) / E ] [E (E ) / E ]
yy xy
2
xx yy xy
2
xx

t 1
(23)

[E (E ) / E ] [E (E ) / E ]
yy xy
2
xx yy xy
2
xx
CM ( ) t 1
Fc = = (24)
S2 E yy E xy2 / E xx
(r 1)(t 1) 1
El Grado de Libertad para Fc = (t-1), (r-1)(t-1)-1

d) Si se desea probar la hiptesis H0: = vs. HA: :


E xy2 / E xx
Fc = con 1 y (r-1)(t-1)-1 gl.
S2
Una caracterstica fundamental de toda covariable es su independencia de
los efectos de los tratamientos.

2 2 xx
Var (d ) = 1 + Varianza promedio de la diferencia entre dos
r (t 1)E xx
medias ajustadas de tratamientos.
s *2
I= Eficiencia de la covarianza en la reduccin de la
2 xx
s 1 +
(t 1)E xx
varianza del error.

Ejemplo. Un experimento de fertilizantes con el diseo San Cristbal (12


tratamientos en cuatro bloques completos al azar), realizado por el IMPA en
la zona de abastecimiento del ingenio Motzorongo, en el estado de Veracruz,
cosechado en plantilla durante la zafra 1977 1978, produjo los resultados
de la Tabla 2. En esta tabla la Y es el rendimiento de caa en toneladas por
hectrea, y X es el nmero observado de tallos molederos por parcela
experimental. Se propone examinar el efecto de los nutrientes sobre el

ANCOVA
34

rendimiento de caa, eliminando a travs de la tcnica de covarianza, el


efecto del nmero de tallos molederos (Martnez-Garza, 1988).

Tabla 2. Anlisis de covarianza en un experimento caero.


Trata- I II III IV Sumas
mientos Y X Y X Y X Y X Y X
1 107.5 319 103.6 308 84.4 319 115.6 275 412.2 1,221
2 89.2 300 102.8 307 84.5 320 108.1 302 384.5 1,229
3 102.2 280 110.0 280 76.9 299 87.5 268 376.6 1,127
4 88.1 318 105.0 315 104.7 319 120.3 311 418.1 1,263
5 121.4 308 100.3 304 111.7 315 126.1 290 459.5 1,217
6 119.4 306 111.1 310 100.8 334 119.2 296 450.5 1,246
7 110.6 316 113.6 303 114.7 284 122.2 295 461.1 1,198
8 106.4 290 120.0 306 88.9 314 130.0 299 445.3 1,209
9 114.7 315 106.9 299 114.4 310 115.8 297 451.8 1,221
10 116.4 330 129.2 315 106.4 319 136.9 317 488.9 1,281
11 96.1 302 107.8 353 106.5 310 122.8 294 433.3 1,259
12 102.5 321 114.4 307 116.4 316 126.7 302 460.0 1,246
Sumas 1274.5 3705 1324.7 3707 1211.4 3759 1431.2 3546 5241.8 14717

Se realizan los clculos para construir la Tabla 3 de sumas de cuadrados y


productos cruzados.

Tabla 3. Suma de cuadrados y de productos cruzados.


Fuente de variacin Grados de Sumas de cuadrados y de productos
libertad cruzados
X.X X.Y Y.Y
Bloques (B) 3 2,129.1 - 2,043.29 2,157.25
Tratamientos (T) 11 4,323.7 1,904.43 3,042.45
Error (E) 33 4,574.7 - 404.26 2,780.86
Total 47 11,027.5 - 543.12 7,980.56
=T+E 44 8,898.4 1,500.17 5,823.31

Como regla general para decidir sobre el empleo de la covarianza, el


investigador debiera tener la certeza de que sus covariables no estan
influenciadas por los tratamientos estudiados. Es comn que en la prctica,
para probar la significancia del efecto de los tratamientos sobre los valores de
la propia covariable, se realice el anlisis de varianza sobre los valores
observados de la covariable. Esta manera de proceder, de acuerdo con
Anderson y Bancroft (1952), no es muy adecuada, y recomiendan que los
investigadores basen su tcnica de anlisis en un juicio riguroso de su

M.H. Badii et al.


35

experimento, para bien detectar la existencia de dependencia o no de las


covariables para con los tratamientos. Por tanto tendramos los siguientes.

SCTotalxx = 3192 + 3002 + ... + 3022 (14717)2/48 = 11,027.5

3705 2 + ... + 3546 2 14717 2


B XX = = 2129.1
12 48

12212 + ... + 1246 2 14717 2


T XX = = 4323.7
4 48

SCTotalxy = [107.52+ 89.22+ ... + 126.72] (5241.8)2/48 = 7, 980.56

1274.5 2 + ... + 1431.2 2 5241.8 2


BYY = = 2157.25
12 48

412.2 2 + ... + 460.0 2 5241.8 2


TYY = = 3042.45
4 48

SPTotalxy = 107.5 x 319 + + 126.7 x 302 (5241.8 x 14717)/48 = - 543.12

1274.5 x3705 + ... + 1431.2 x3546 5241.8 x14717


Bxy = = -2043.29
12 48

412.2 x1221 + ... + 460.0 x1246 5241.8 x14717


Txy = = 1904.43
4 48

Por tanto,
Exx = SCTotalxx Bxx - Txx
Exx = 11027.5 2129.1 4323.7 = 4574.7

Eyy = SCTotal Byy - Tyy


Eyy = 7980.56 2157.25 3042.45 = 2780.86

ANCOVA
36

Exy = SPTotalxy Bxy - Txy


Exy = -543.12 (-2043.29) 1904.43 = - 404.26

Puesto que E xx = E xy , se obtiene:

E xy 404.26
= = = 0.0883686
E xx 4574.7

SCE = Eyy - E xy
SCE = 2780.86 (-0.00883686) x (-404.26) = 2745.14
Donde:
SCE 2745.14
S2 = = = 85.79
(r 1)(t 1) 1 3 x11 1

De manera similar, ya que E ' xx = E ' xy , haciendo uso de los datos en la


base de la 15.2, se obtiene:

E ' xy 1500.17
= = = 0.168589
E ' xx 8898.4

SCE =Eyy - E' xy

SCE = 5823.31 0.168589 x 1500.17 = 5570.40

Usando los resultados anteriores, la suma de cuadrados debida a


tratamientos ajustados, SC(TA), es:

SC(TA) = SCE SCE


SC(TA) = 5570.40 2745.14
SC(TA) = 2825.26
Donde:
SC (TA) 2825.26
CM(TA) = = = 256.84
t 1 11

M.H. Badii et al.


37

Para probar la hiptesis H0: r1 = r2 = ... rt contra la alternativa H1: por


lo menos ri rj, con i j, la estadstica de prueba, F, est dada por:

CM (TA) 256.84
F= = = 2.99
s2 85.79
la cual, si H0 es cierta, se distribuye como una F con 11 y 32 grados de
libertad. Para una prueba al 1% de significancia, el valor tabulado de esta
distribucin es de 2.87. Puesto que el valor calculado de la F es mayor que la
tabulada, se rechaza la hiptesis nula.

Conclusiones

El mundo es multifactorial, multidimencional y con un enfoque


multiangular. Las cosas en el universo, incluyendo los procesos, fenmenos,
objetos y/o eventos, no ocurren de forma aislada. Hay una interconexin
natural entre todos estos, ya que todas y cada una de las cosas tiene su
lugar propio en el universo y juegan un papel, aunque sea de diferentes
magnitudes, relevante y precisa para mantener el orden dentro del cosmos.
Debido a esta interrelacin duradera entre los diferentes tems, es necesario
tener disponible tcnicas que puedan analizar el efecto y la manifestacin de
cada factor como si fuera sucediendo de forma individual y aislada y por tanto
libre del efecto de cualquier otro factor auxiliar. Antes del nacimiento de
herramientas analticas (por ejemplo estadsticas) en el apoyo a la
investigacin cientfica, exista una prdida enorme en lo que se refiere a la
descripcin, medicin, explicacin e incluso los planes del manejo de las
cosas que ocurran y/o se manifestaban de forma simultnea y conjunta. El
anlisis de covarianza es una de estas tcnicas que puede estimar el efecto
de un factor cuando est en juego de manera simultnea, el efecto de otro
factor auxiliar, en otras palabras, por medio de ANCOVA, el investigador fija
el efecto del factor auxiliar a travs de todos los tratamientos y esto significa
como que si el factor auxiliar no existiera. Adems, esta tcnica tambin es
til para interpretar la naturaleza de los efectos de los tratamientos,
cuantificar los efectos de los mismos, ajustar las medias de los tratamientos y
finalmente, para reducir el grado de error experimental que forma una parte
esencial de la experimentacin, del muestreo y de la inferencia como base de
la lgica inductiva.

ANCOVA
38

Referencias

Badii, M.H., A.R. Pazhakh, J.L. Abreu & R. Foroughbakhch. 2004. Fundamentos del mtodo
cientfico. InnOvaciOnes de NegOciOs 1(1): 89107.
Badii, M.H., J. Castillo & A. Wong. 2006. Diseos de distribucin libre. InnOvaciOnes de
NegOciOs, 3(1): 141-174.
Badii, M.H. & J. Castillo (eds.). 2007. Tcnicas Cuantitativas en la Investigacin. UANL,
Monterrey.
Badii, M.H., R. Ramrez & J. Castillo. 2007a. Papel de estadstica en la investigacin
cientfica. InnOvaciOnes de NegOciOs, 4(1): 107-145.
Badii, M.H., J. Castillo, R. Rositas & G. Ponce. 2007b. Experimental designs. Pp. 335-348. In:
M.H. Badii & J. Castillo (eds.). Tcnicas Cuantitativas en la Investigacin. UANL,
Monterrey.
Cochran, W.G. & G.M. Cox, 1957. Experimental designs. 2nd Ed. John Wiley & Sons, New
York.
Delury, D.B. 1948. The Analysis of Co-variance. Biometrics, 4: 153-170.
Federer, W.T. Y C.S. Schlottfeldt, 1954. The use of covariance to control gradients in
experiments. Biometrics, 10: 282-290.
Finney, D.J. 1946. Standard errors of yields adjusted for regression on an independent
measurement. Biometrics Bull. 2: 53-55.
Martnez-Garza, A. 1988. Diseos experimentales, mtodos y elementos de teora. Ed.
Trillas, 756.
Outhwaite, A.D. & A. Rutherford, 1955. Covariance analysis as alternative to stratification in
the control of gradients. Biometrics, 11:431-440.
Steel, R.G.D. 1954. Which dependent variate? Y or Y-X? Mimeo Series BU-54-M, Biometrics
Unit. Cornell Univ. Ithaca, N.Y.
Wishart, J. 1936. Test of significance in the analysis of covariance. J. Roy. Stat. Soc. Suppl.
3: 79-82.

M.H. Badii et al.

También podría gustarte