Está en la página 1de 10

Modelo de Anlisis de la Covarianza.

Introduccin al modelo de Medidas


Repetidas
Modelo de Anlisis de la Covarianza
Introduccin
El diseo por bloques se considera para eliminar el efecto de los factores de ruido que
no son controlables. El anlisis de la covarianza es otro mtodo que se utiliza para un
problema semejante: supongamos un experimento con una variable respuesta, y, donde
existe otra variable, x, de modo que ambas estn relacionadas linealmente. Supongamos,
adems, que x no es una variable controlable por el experimentador pero que puede ser
observada junto con y. A la variable x se le denomina covariable o variable concomitante.
El anlisis de la covarianza sirve para ajustar la variable respuesta por el efecto de
la covariable. En caso de no hacerlo, la media de cuadrados del error puede aumentar
mucho y hacer que las verdaderas diferencias en la respuesta debido a los tratamientos
sean difciles de detectar. El anlisis de la covarianza resulta ser una combinacin entre
el ANOVA y el anlisis de regresin.

Modelo
Suponemos un modelo con un solo factor y una covariable y asumimos una relacin
lineal entre la variable respuesta y la covariable:
yij = + i + (xij x ) + ij
1

para
i = 1, . . . , a
j = 1, . . . , n
En el modelo,
yij es la j -sima observacin bajo el i-simo nivel del tratamiento.
xij es la medida de la covariable que se hace para yij
x es la media de los valores de xij
es el valor medio global.
i es el efecto del nivel i-simo del tratamiento
coeficiente de regresin que relaciona yij con la covariable xij
ij error aleatorio
Se asume que ij N(0, 2 ) son independientes entre s, 6= 0,
covariable x no est afectada por los tratamientos.

Pa

i=1

Se utiliza la siguiente notacin:

Syy
Sxx
Sxy

n
n
a X
a X
X
X
y2
2
=
(yij y ) =
yij2
an
i=1 j=1
i=1 j=1

n
n
a X
a X
X
X
x2
2
=
(xij x ) =
x2ij
an
i=1 j=1
i=1 j=1

n
n
a X
a X
X
X
(x )(y )
=
(xij x )(yij y ) =
xij yij
an
i=1 j=1
i=1 j=1

Tyy
Txx
Txy

a
a
X
1 X 2 y2
2
= n
(
yi y ) =
y
n i=1 i an
i=1

a
a
X
1 X 2 x2
2
= n
(
xi x ) =
x
n i=1 i an
i=1

a
a
X
1X
x y
= n
(
xi x )(
yi y ) =
xi yi
n i=1
an
i=1

Eyy =
Exx =
Exy =

a X
n
X
(yij yi )2 = Syy Tyy
i=1 j=1
a X
n
X

(xij xi )2 = Sxx Txx

i=1 j=1
n
a X
X
i=1 j=1

(xij xi )(yij yi ) = Sxy Txy


2

i = 0 y la

En general, S = T + E donde los smbolos S, T y E son las sumas de cuadrados y los


dobles productos para el total, los tratamientos y el error respectivamente.
Los estimadores por mnimos cuadrados son

= y
xi x )

i = yi y (
Exy
=
Exx

La suma de cuadrados del error es


SCE = Eyy

2
Exy
,
Exx

con a(n 1) 1 grados de libertad.


La varianza del error experimental es, as,
MCE =

SCE
.
a(n 1) 1

Supongamos que no hay efecto del tratamiento, entonces el modelo queda reducido a
yij = + (xij x ) + ij
Los estimadores por mnimos cuadrados son

= y
Exy
.
=
Exx
La suma de cuadrados del error en el modelo reducido queda como
SCE = Syy

2
Sxy
Sxx

con (an 2) grados de libertad.


La cantidad

2
Sxy
Sxx

es la reduccin de la suma de cuadrados de y, obtenida por la regresin

lineal de y en x. Adems, SCE < SCE porque el modelo completo incluye los parmetros
3

adicionales As, SCE SCE es una reduccin en la suma de cuadrados debida a los
trminos i .
De esta manera, a partir de SCE SCE se tiene una suma de cuadrados con (a 1)
grados de libertad para contrastar la hiptesis de que no hay efectos de los tratamientos.
Para contrastar la hiptesis
H0 i = 0, i
se calcula

SCE SCE
a1
F0 =
SCE
a(n 1) 1

que, si la hiptesis nula es cierta, se distribuye como una F de Snedecor:


Fa1,a(n1)1 ,
de modo que se rechaza H0 al nivel si
F0 > Fa1,a(n1)1;
Se obtiene la siguiente tabla:
Sumas de productos
F. Variacin
g. l.
x
xy
y
Tratamientos
a1
Txx Txy
Tyy
Error
a(n 1) Exx Exy
Eyy
Total
an 1 Sxx Sxy
Syy

F. Variacin
Tratamientos

Ajuste por Regresin


g. l.
Cuadrados medios

2
Exy
Exx
2
Sxy
Syy Sxx

SCE = Eyy

Error
SCE =
Total
Tratamientos Ajustados
SCE SCE

a(n 1) 1
an 2
a1

MCE =

SCE
a(n1)1

SCE SCE
a1

Tambin es importante efectuar un contraste tambin sobre el termino de regresin .


Se calculan las medias ajustadas por la regresin:
xi x )
Ajust_
yi = yi (
para i = 1, 2, . . . , a, donde
Exy
=
.
Exx
Esta media ajustada es el estimador de mnimos cuadrados de + i , donde i = 1, . . . , a.
Por otro lado, el error estndar de la media ajustada de cada tratamiento es
SAjust_yi

1 (
xi x )2 2
= MCE
.
+
n
Exx

Finalmente, con respecto al coeficiente de regresin se puede contrastar la hiptesis


H0 = 0 mediante el estadstico
F0 =

2
Exy
Exx

MCE

que, si la hiptesis nula es cierta, se distribuye como una F de Snedecor, F1,a(n1)1 .


De este modo, se rechaza H0 = 0, a nivel si
F0 > F1,a(n1)1, .
Ejemplo. Se considera un estudio para determinar si existen diferencias en la resistencia
de una fibra producida por tres mquinas diferentes. Se piensa que el grosor de las fibras
(x) influye tambin, obtenindose los siguientes valores
Mquina 1 Mquina 2 Mquina 3
y
x
y
x
y
x
36
20
40
22
35
21
41
25
48
28
37
23
39
24
39
22
42
26
42
25
45
30
34
21
49
32
44
28
32
15
207
126
216
130
180
106
5

Se trata de eliminar el efecto del grosor (x) en la resistencia de las fibras para poder
comparar el efecto de las tres mquinas.

Syy =
Sxx =
Sxy =

n
a X
X
i=1 j=1
n
a X
X
i=1 j=1
n
a X
X
i=1 j=1

yij2

y2
6032
2
2
2
= 36 + 41 + + 32
= 346,4

an
35

x2ij

x2
3622
2
2
2
= 20 + 25 + + 15
= 261,73

an
35

xij yij

362 603
(x )(y )
= 20 36 + + 15 32
= 282,6
an
35

1
1 X 2 y2
6032
= (2072 + 2162 + 1802 )
= 140,4
=
yi
n i=1
an
5
35
a

Tyy

1 X 2 x2
3622
1
2
2
2
=
x
= (126 + 130 + 106 )
= 66,13
n i=1 i an 5
35
a

Txx

1X
x y
1
362 603
=
xi yi
= (207 126 + 216 130 + 180 106)
= 96
n i=1
an
5
35
a

Txy

Eyy = Syy Tyy = 206


Exx = Sxx Txx = 195,6
Exy = Sxy Txy = 186,6
Por otro lado
SCE = Syy

2
Sxy
282,62
= 346,4
= 41,27
Sxx
261,73

con (an 2) = 3 5 2 = 13 grados de libertad, y


2
Exy
186,62
= 206
= 27,99
SCE = Eyy
Exx
195,6

con a(n 1) 1 = 3(5 1) 1 = 11 grados de libertad.


La suma de cuadrados para contrastar H0 i = 0, para i = 1, 2, 3 es
SCE SCE = 41,27 27,99 = 13,28
con a 1 = 3 1 = 2 grados de libertad.
6

As, se calcula
F0 =

SCE SCE
a1
SCE
a(n1)1

13,28
2
27,99
2,54

= 2,61.

Como, para = 0,10,


F0 = 2,61 < Fa1,a(n1)1; = F2,11;00 10 = 2,86
se acepta la hiptesis nula.H0 i = 0, para i = 1, 2, 3.
Se estima el coeficiente de regresin
Exy
186,6
=
= 0,954.
=
Exx
195,6
Para contrastar la hiptesis H0 = 0 se usa el estadstico
F0 =

2
Exy
Exx

MCE

186,62
195,6

2,54

= 70,08

Como F1,a(n1)1 = F1,11;00 10 = 9,65, se rechaza H0 = 0, a nivel 0,10. Con lo cual la


correccin mediante el anlisis de la covarianza es necesario.
Las medias de los tratamientos ajustadas son
xi x ) =
Ajust_
yi = yi (
Ajust_
y1 = 41,4 0,954 (25,2 24,13) = 40,38
Ajust_
y2 = 43,2 0,954 (26. 24,13) = 41,42
Ajust_
y3 = 36 0,954 (21,2. 24,13) = 38,8
Si se comparan las medias de los tratamientos sin ajustar con las ajustadas, se observa
que estas ltimas estn mucho ms prximas entre s, lo cual es otra indicacin de la
necesidad de hacer un anlisis de la covarianza.

Modelo de Medidas Repetidas


En numerosas ocasiones, los sujetos que se estudian son sujetos que pueden presentar
numerosas diferencias entre ellos ante el mismo tratamiento, introducindose, entonces,
una mayor fuente de error experimental. Aumenta, as, la media de cuadrados de los errores
haciendo difcil distinguir las diferencias entre los tratamientos. Una manera de controlar
esta variabilidad entre los sujetos, consiste en aplicar a cada uno de ellos los a tratamientos.
Este diseo se denomina de medidas repetidas. Equivale a un diseo por bloques completos,
donde la variable bloque son los sujetos, siendo sta de efectos aleatorios.
Supongamos un experimento donde aparece un factor con a tratamientos, y que cada
tratamiento se aplica exactamente sobre cada uno de los n individuos:
Sujetos
2
n
y12 y1n
y22 y2n
..
..
...
.
.
ya2 yan
y2 yn

Tratamientos 1
1
y11
2
y21
..
..
.
.
a
ya1
Totales
y1

Totales
y1
y2
..
.
ya
y

La observacin yij es la respuesta del sujeto j al tratamiento i y slo se usan n sujetos.


El modelo se escribe como
yij = + i + j + ij ,
donde i es el efecto del isimo tratamiento y j el efecto del j -simo sujeto.
Se supone que
a
X

i = 0,

i=1

y que los individuos son una muestra aleatoria de una poblacin dada, de modo que los
individuos actan como un efecto aleatorio
j N(0, 2 ).

Dado que j es comn a todos los a tratamientos medidos sobre el mismo sujeto j, la
covarianza entre yij e yi0 j es, en general, diferente de 0, asumindose que es constante
sobre los tratamientos y los sujetos.
La suma total de cuadrados se parte en dos sumatorios:
a X
n
X
i=1 j=1

(yij y ) = a

n
X
j=1

(
yj y ) +

a X
n
X
i=1 j=1

(yij yj )2

El primer trmino de la suma de cuadrados recoge la diferencia entre sujetos y el segundo


trmino la diferencia dentro de sujetos, esto es,
SCT = SCentre + SCdentro
de modo que ambas sumas de cuadrados son independientes entre s con
an 1 = (n 1) + n(a 1)
grados de libertad.
Las diferencias dentro de los sujetos dependen tanto de las diferencias en los efectos
de los tratamientos como del ruido. As, se descompone la suma de cuadrados dentro de
sujetos de la siguiente forma:
a X
n
X
i=1 j=1

(yij yj )2 = n

a
X
i=1

(
yi y )2 +

a X
n
X
i=1 j=1

(yij yi yj + y )2 .

El primer trmino mide la contribucin de las diferencias entre las medias de los tratamientos a la suma de cuadrados dentro de los sujetos, y el segundo trmino es la variacin
residual debido al error. Ambos trminos son independientes. As,
SCdentro = SCT ra + SCE
con
n(a 1) = (a 1) + (a 1)(n 1)
grados de libertad respectivamente.
9

Se contrasta

usndose el cociente

H0 i = 0,

i = 1, . . . , a

H1 i 6= 0,

para algn i

SCT ra
MCT ra
a1
F0 =
=
SCE
MCE
(a 1)(n 1)

que, cuando H0 es cierta, se distribuye como una F de Snedecor Fa1,(a1)(n1) . Se rechaza


H0 a nivel cuando
F0 > Fa1,(a1)(n1) .
La tabla de anlisis de la varianza es
Fuentes Variacin
Entre Sujetos
Dentro Sujetos
Tratamientos
Residual
Total

Suma de Cuadrados
Pn yj2
2
y
j=1 a an
Pn yj2
Pa Pn
2
i=1
j=1 yij
j=1 a
Pa yi2
2
y
SCT ra = i=1 a an
SCE = (2) (3)
Pa Pn
2
y
2
i=1
j=1 yij an

10

grados libertad

n1

n(a 1)
a1
(a 1)(n 1)
an 1

F0 =

SCT ra
a1
SCE
(a1)(n1)

También podría gustarte