Está en la página 1de 10

Modelo de Anlisis de la Covarianza.

Introduccin al modelo de Medidas Repetidas


Modelo de Anlisis de la Covarianza
Introduccin
El diseo por bloques se considera para eliminar el efecto de los factores de ruido que no son controlables. El anlisis de la covarianza es otro mtodo que se utiliza para un problema semejante: supongamos un experimento con una variable respuesta, y, donde existe otra variable, x, de modo que ambas estn relacionadas linealmente. Supongamos, adems, que x no es una variable controlable por el experimentador pero que puede ser observada junto con y. A la variable x se le denomina covariable o variable concomitante. El anlisis de la covarianza sirve para ajustar la variable respuesta por el efecto de la covariable. En caso de no hacerlo, la media de cuadrados del error puede aumentar mucho y hacer que las verdaderas diferencias en la respuesta debido a los tratamientos sean difciles de detectar. El anlisis de la covarianza resulta ser una combinacin entre el ANOVA y el anlisis de regresin.

Modelo
Suponemos un modelo con un solo factor y una covariable y asumimos una relacin lineal entre la variable respuesta y la covariable: yij = + i + (xij x ) + ij 1

para i = 1, . . . , a j = 1, . . . , n En el modelo, yij es la j -sima observacin bajo el i-simo nivel del tratamiento. xij es la medida de la covariable que se hace para yij x es la media de los valores de xij es el valor medio global. i es el efecto del nivel i-simo del tratamiento coeciente de regresin que relaciona yij con la covariable xij ij error aleatorio Se asume que ij N(0, 2 ) son independientes entre s, 6= 0, covariable x no est afectada por los tratamientos. Se utiliza la siguiente notacin: Pa
i=1

i = 0 y la

Syy Sxx Sxy

n n a a XX XX y2 2 2 = (yij y ) = yij an i=1 j=1 i=1 j=1

n n a a XX XX x2 2 = (xij x ) = x2 ij an i=1 j=1 i=1 j=1

n n a a XX XX (x )(y ) = (xij x )(yij y ) = xij yij an i=1 j=1 i=1 j=1

Tyy Txx Txy

a a 2 X 1 X 2 y 2 = n (i y ) = y yi n i=1 an i=1

a a X 1 X 2 x2 2 = n (i x ) = x xi n i=1 an i=1

a a X 1X x y = n (i x )(i y ) = x y xi yi n i=1 an i=1 a n XX (yij yi )2 = Syy Tyy i=1 j=1 a n XX i=1 j=1 n a XX i=1 j=1

Eyy = Exx = Exy =

(xij xi )2 = Sxx Txx (xij xi )(yij yi ) = Sxy Txy 2

En general, S = T + E donde los smbolos S, T y E son las sumas de cuadrados y los dobles productos para el total, los tratamientos y el error respectivamente. Los estimadores por mnimos cuadrados son = y x i = yi y (i x ) Exy = Exx

La suma de cuadrados del error es SCE = Eyy con a(n 1) 1 grados de libertad. La varianza del error experimental es, as, MCE = SCE . a(n 1) 1
2 Exy , Exx

Supongamos que no hay efecto del tratamiento, entonces el modelo queda reducido a yij = + (xij x ) + ij Los estimadores por mnimos cuadrados son = y Exy . = Exx La suma de cuadrados del error en el modelo reducido queda como SCE = Syy con (an 2) grados de libertad. La cantidad
2 Sxy Sxx

2 Sxy Sxx

es la reduccin de la suma de cuadrados de y, obtenida por la regresin

lineal de y en x. Adems, SCE < SCE porque el modelo completo incluye los parmetros 3

adicionales As, SCE SCE es una reduccin en la suma de cuadrados debida a los trminos i . De esta manera, a partir de SCE SCE se tiene una suma de cuadrados con (a 1) grados de libertad para contrastar la hiptesis de que no hay efectos de los tratamientos. Para contrastar la hiptesis H0 i = 0, i se calcula SCE SCE a1 F0 = SCE a(n 1) 1

que, si la hiptesis nula es cierta, se distribuye como una F de Snedecor: Fa1,a(n1)1 , de modo que se rechaza H0 al nivel si F0 > Fa1,a(n1)1; Se obtiene la siguiente tabla: Sumas de productos F. Variacin g. l. x xy y Tratamientos a1 Txx Txy Tyy Error a(n 1) Exx Exy Eyy Total an 1 Sxx Sxy Syy

F. Variacin Tratamientos

y SCE = Eyy

Ajuste por Regresin g. l. Cuadrados medios a(n 1) 1 an 2 a1 MCE =


SCE a(n1)1

Error SCE = Total Tratamientos Ajustados SCE SCE

2 Exy Exx 2 Sxy Syy Sxx

SCE SCE a1

Tambin es importante efectuar un contraste tambin sobre el termino de regresin . Se calculan las medias ajustadas por la regresin: x Ajust_i = yi (i x ) y para i = 1, 2, . . . , a, donde Exy . = Exx Esta media ajustada es el estimador de mnimos cuadrados de + i , donde i = 1, . . . , a. Por otro lado, el error estndar de la media ajustada de cada tratamiento es SAjust_yi 1 1 (i x )2 2 x = MCE . + n Exx

Finalmente, con respecto al coeciente de regresin se puede contrastar la hiptesis H0 = 0 mediante el estadstico F0 =
2 Exy Exx

MCE

que, si la hiptesis nula es cierta, se distribuye como una F de Snedecor, F1,a(n1)1 . De este modo, se rechaza H0 = 0, a nivel si F0 > F1,a(n1)1, . Ejemplo. Se considera un estudio para determinar si existen diferencias en la resistencia de una bra producida por tres mquinas diferentes. Se piensa que el grosor de las bras (x) inuye tambin, obtenindose los siguientes valores Mquina 1 Mquina 2 Mquina 3 y x y x y x 36 20 40 22 35 21 41 25 48 28 37 23 39 24 39 22 42 26 42 25 45 30 34 21 49 32 44 28 32 15 207 126 216 130 180 106 5

Se trata de eliminar el efecto del grosor (x) en la resistencia de las bras para poder comparar el efecto de las tres mquinas.

Syy = Sxx = Sxy =

n a XX i=1 j=1 n a XX i=1 j=1 n a XX i=1 j=1 a

2 yij

2 y 6032 2 2 2 = 36 + 41 + + 32 = 346,4 an 35

x2 ij

x2 3622 2 2 2 = 20 + 25 + + 15 = 261,73 an 35 362 603 (x )(y ) = 20 36 + + 15 32 = 282,6 an 35

xij yij

Tyy Txx Txy

2 1 1 X 2 y 6032 = (2072 + 2162 + 1802 ) = 140,4 = yi n i=1 an 5 35 a

1 X 2 x2 3622 1 2 2 2 = x = (126 + 130 + 106 ) = 66,13 n i=1 i an 5 35


a

1X x y 1 362 603 = xi yi = (207 126 + 216 130 + 180 106) = 96 n i=1 an 5 35 Eyy = Syy Tyy = 206 Exx = Sxx Txx = 195,6 Exy = Sxy Txy = 186,6

Por otro lado SCE = Syy


2 Sxy 282,62 = 346,4 = 41,27 Sxx 261,73

con (an 2) = 3 5 2 = 13 grados de libertad, y


2 Exy 186,62 = 206 = 27,99 SCE = Eyy Exx 195,6

con a(n 1) 1 = 3(5 1) 1 = 11 grados de libertad. La suma de cuadrados para contrastar H0 i = 0, para i = 1, 2, 3 es SCE SCE = 41,27 27,99 = 13,28 con a 1 = 3 1 = 2 grados de libertad. 6

As, se calcula F0 = Como, para = 0,10,

SCE SCE a1 SCE a(n1)1

13,28 2 27,99 2,54

= 2,61.

F0 = 2,61 < Fa1,a(n1)1; = F2,11;00 10 = 2,86 se acepta la hiptesis nula.H0 i = 0, para i = 1, 2, 3. Se estima el coeciente de regresin Exy = 186,6 = 0,954. = Exx 195,6 Para contrastar la hiptesis H0 = 0 se usa el estadstico F0 =
2 Exy Exx

MCE

186,62 195,6

2,54

= 70,08

Como F1,a(n1)1 = F1,11;00 10 = 9,65, se rechaza H0 = 0, a nivel 0,10. Con lo cual la correccin mediante el anlisis de la covarianza es necesario. Las medias de los tratamientos ajustadas son x Ajust_i = yi (i x ) = y Ajust_1 = 41,4 0,954 (25,2 24,13) = 40,38 y Ajust_2 = 43,2 0,954 (26. 24,13) = 41,42 y Ajust_3 = 36 0,954 (21,2. 24,13) = 38,8 y Si se comparan las medias de los tratamientos sin ajustar con las ajustadas, se observa que estas ltimas estn mucho ms prximas entre s, lo cual es otra indicacin de la necesidad de hacer un anlisis de la covarianza.

Modelo de Medidas Repetidas


En numerosas ocasiones, los sujetos que se estudian son sujetos que pueden presentar numerosas diferencias entre ellos ante el mismo tratamiento, introducindose, entonces, una mayor fuente de error experimental. Aumenta, as, la media de cuadrados de los errores haciendo difcil distinguir las diferencias entre los tratamientos. Una manera de controlar esta variabilidad entre los sujetos, consiste en aplicar a cada uno de ellos los a tratamientos. Este diseo se denomina de medidas repetidas. Equivale a un diseo por bloques completos, donde la variable bloque son los sujetos, siendo sta de efectos aleatorios. Supongamos un experimento donde aparece un factor con a tratamientos, y que cada tratamiento se aplica exactamente sobre cada uno de los n individuos: Sujetos 2 n y12 y1n y22 y2n . . ... . . . . ya2 yan y2 yn

Tratamientos 1 1 y11 2 y21 . . . . . . a ya1 Totales y1

Totales y1 y2 . . . ya y

La observacin yij es la respuesta del sujeto j al tratamiento i y slo se usan n sujetos. El modelo se escribe como yij = + i + j + ij , donde i es el efecto del isimo tratamiento y j el efecto del j -simo sujeto. Se supone que
a X i=1

i = 0,

y que los individuos son una muestra aleatoria de una poblacin dada, de modo que los individuos actan como un efecto aleatorio j N(0, 2 ).

Dado que j es comn a todos los a tratamientos medidos sobre el mismo sujeto j, la covarianza entre yij e yi0 j es, en general, diferente de 0, asumindose que es constante sobre los tratamientos y los sujetos. La suma total de cuadrados se parte en dos sumatorios:
a n XX i=1 j=1

(yij y ) = a

n X j=1

(j y ) + y

a n XX i=1 j=1

(yij yj )2

El primer trmino de la suma de cuadrados recoge la diferencia entre sujetos y el segundo trmino la diferencia dentro de sujetos, esto es, SCT = SCentre + SCdentro de modo que ambas sumas de cuadrados son independientes entre s con an 1 = (n 1) + n(a 1) grados de libertad. Las diferencias dentro de los sujetos dependen tanto de las diferencias en los efectos de los tratamientos como del ruido. As, se descompone la suma de cuadrados dentro de sujetos de la siguiente forma:
a n XX i=1 j=1

(yij yj )2 = n

a X i=1

(i y )2 + y

a n XX i=1 j=1

(yij yi yj + y )2 .

El primer trmino mide la contribucin de las diferencias entre las medias de los tratamientos a la suma de cuadrados dentro de los sujetos, y el segundo trmino es la variacin residual debido al error. Ambos trminos son independientes. As, SCdentro = SCT ra + SCE con n(a 1) = (a 1) + (a 1)(n 1) grados de libertad respectivamente. 9

Se contrasta H0 i = 0, H1 i 6= 0, usndose el cociente i = 1, . . . , a para algn i

que, cuando H0 es cierta, se distribuye como una F de Snedecor Fa1,(a1)(n1) . Se rechaza H0 a nivel cuando F0 > Fa1,(a1)(n1) . La tabla de anlisis de la varianza es Fuentes Variacin Entre Sujetos Dentro Sujetos Tratamientos Residual Total Suma de Cuadrados 2 Pn yj y 2 j=1 a an 2 Pn yj Pa Pn 2 i=1 j=1 yij j=1 a 2 P yi y 2 SCT ra = a a an i=1 SCE = (2) (3) Pa Pn 2 y 2 i=1 j=1 yij an grados libertad n1 a1 (a 1)(n 1) an 1 n(a 1) F0 = F

SCT ra MCT ra a1 F0 = = SCE MCE (a 1)(n 1)

SCT ra a1 SCE (a1)(n1)

10

También podría gustarte