Está en la página 1de 19

Modelo II o de efectos aleatorios

En este modelo se asume que las k muestras son muestras aleatorias dek situaciones distintas y aleatorias. De modo que un valor aislado Yij se puede escribir como:

donde Q es la media global, Iij son variables (una para cada muestra) distribuidas normalmente, con media 0 y varianza W2 (como en el modelo I) y Ai es una variable distribuida normalmente, independiente de las Iij, con media 0 y varianza La diferencia con respecto al modelo I es que en lugar de los efectos fijos Ei ahora se consideran efectos aleatorios Ai. Igual que en el modelo I se encuentra que MSE no se modifica en la H1 y que al valor esperado de MSA se le aade el trmino de componente aadida (que aqu es una verdadera varianza ya que Ai es una variable aleatoria):

Para llegar a este resultado se utiliza la asuncin de independencia entreAi y Iij y es, por tanto, muy importante en el modelo y conviene verificar si es correcta en cada caso. En el ejemplo de las cobayas significara que las variaciones de grasa en el hgado de cada cobaya son independientes de las variaciones entre cobayas. Esta asuncin se violara si, por ejemplo, en el animalario existieran 2 cepas genticas tales que en una de ellas la concentracin de grasa en las clulas hepticas fuera mayor y ms variable que en la otra. Por tanto, en H0 tanto MSA como MSE estiman W2, mientras que en H1,MSE sigue estimando W2 y MSA estima . La existencia de esta componente aadida se contrasta con F= MSA/MSE y en caso afirmativo, la varianza de Ai se estima como:

Pruebas a posteriori
En general, en un modelo II el inters del investigador es averiguar si existecomponente aadida y en su caso estimarla. Sin embargo, en un modelo I, lo que tiene inters son las diferencias entre los distintos grupos. En el Ejemplo 1, lo que interesa, una vez visto que la presin arterial media es diferente para los cinco grupos, es, por ejemplo, estimar el efecto de la dieta sin sal,E3 E1, o el aumento del efecto de la segunda dosis del frmaco con respecto a la primera dosis E5 E4. Las pruebas "a posteriori" son un conjunto de pruebas para probar todas las posibles hiptesis del tipo Qi Qj = 0. Existen varias, (Duncan, Newman-Keuls, LSD): todas ellas muy parecidas. Usan el rango (diferencia entre medias) de todos los pares de muestras como estadstico y dicho rango debe superar un cierto valor llamado mnimo rango significativo para considerar la diferencia significativa. La principal diferencia con respecto a la t de Student radica en que usan MSE como estimador de la varianza, es decir un estimador basado en todas las muestras. Una manera semigrfica habitual de representar los resultados es dibujar una lnea que una cada subconjunto de medias adyacentes entre las que no haya diferencias significativas. Para los datos del Ejemplo 1 la salida semigrfica para la prueba LSD de, por ejemplo, el Statgraphics es

que se interpreta como: Los grupos 5 y 4 estn unidos por una lnea vertical de X por tanto sus medias no son diferentes entre s y lo mismo los grupos 4, 3 y 2, mientras que la media del grupo 1 es distinta de la de todos los dems.

Anlisis de la varianza de dos factores


Es un diseo de anova que permite estudiar simultneamente los efectos de dos fuentes de variacin. En el ejemplo 1, en el que se estudiaban diversos tratamientos para la hipertensin arterial, se podra plantear que, quizs, la evolucin de la misma fuera diferente para los hombres y las mujeres, en cuyo caso, y si el nmero de hombres y mujeres en cada muestra no fuera el mismo, podra ocurrir que una parte del efecto atribuido a los tratamientos fuera debido al sexo. En cualquier caso, el investigador puede estar interesado en estudiar si hay, o no, diferencia en la evolucin segn el sexo. En un anova de dos vas se clasifica a los individuos de acuerdo a dos factores (o vas) para estudiar simultneamente sus efectos. En este ejemplo se haran cinco grupos de tratamiento para los hombres y otros cinco para las mujeres, en total diez grupos; en general, si el primer factor tiene aniveles y el segundo tiene b, se tendrn ab muestras o unidades experimentales, cada una con n individuos o repeticiones. Una observacin individual se representa como:

El primer subndice indica el nivel del primer factor, el segundo el nivel del segundo factor y el tercero la observacin dentro de la muestra. Los factores pueden ser ambos de efectos fijos (se habla entonces de modelo I), de efectos aleatorios (modelo II) o uno de efectos fijos y el otro de efectos aleatorios (modelo mixto). El modelo matemtico de este anlisis es: modelo I modelo II modelo mixto donde Q es la media global, Ei o Ai el efecto del nivel i del 1 factor, Fj o Bj el efecto del nivel j del 2 factor y I ijk las desviaciones aleatorias alrededor de las medias, que tambin se asume que estn normalmente distribuidas, son independientes y tienen media 0 y varianza W2. A las condiciones de muestreo aleatorio, normalidad e independencia, este modelo aade la de aditividad de los efectos de los factores. A los trminos ( EF )ij, (AB)ij, (EB)ij, se les denomina interaccin entre ambos factores y representan el hecho de que el efecto de un determinado nivel de un factor sea diferente para cada nivel del otro factor.

Para entender mejor este concepto de interaccin veamos un ejemplo sencillo sobre un anova de dos factores, cada uno con dos niveles: supngase un estudio para analizar el efecto de un somnfero teniendo en cuenta el sexo de los sujetos. Se eligen al azar dos grupos de hombres y otros dos de mujeres. A un grupo de hombres y otro de mujeres se les suministra un placebo y a los otros grupos el somnfero. Se mide el efecto por el tiempo que los sujetos tardan en dormirse desde el suministro de la pldora. Se trata de un anova de dos factores (sexo y frmaco) fijos, cada uno con dos niveles (hombre y mujer para el sexo y somnfero y placebo para el frmaco). Los dos tipos de resultados posibles se esquematizan en la figura

En la figura A se observa que las mujeres tardan ms en dormirse, tanto en el grupo tratado como en el grupo placebo (hay un efecto del sexo) y que los tratados con placebo tardan ms en dormirse que los tratados con somnfero en ambos sexos (hay un efecto del tratamiento). Ambos efectos son fcilmente observables. Sin embargo en la figura B es difcil cuantificar el efecto del somnfero pues es distinto en ambos sexos y, simtricamente, es difcil cuantificar el efecto del sexo pues es distinto en ambos grupos de tratamiento. En este caso, se dice que existe interaccin. Podra, incluso, darse el caso de que se invirtieran los efectos de un factor para los distintos niveles del otro, es decir, que las mujeres se durmieran antes con el somnfero y los hombres antes con el placebo. La interaccin indica, por tanto, que los efectos de ambos factores no son aditivos: cuando se dan juntos, su efecto no es la suma de los efectos que tienen cuando estn por separado, por lo que, si en un determinado estudio se encuentra interaccin entre dos factores, no tiene sentido estimar los efectos de los factores por separado. A la interaccin positiva, es decir, cuando el efecto de los factores actuando juntos es mayor que la suma de efectos actuando por separado, en Biologa se le denomina sinergia o potenciacin y a la interaccin negativa inhibicin. En el ejemplo de la figura B, se dira que el ser mujer inhibe el efecto del somnfero, o que el ser hombre lo potencia (segn el sexo que se tome como referencia).

Identidad de la suma de cuadrados


La suma de cuadrados total en un anova de 2 vas, es:

(donde para representar las medias se ha usado la convencin habitual de poner un punto (.) en el lugar del subndice con respecto al que se ha sumado) que dividida por sus grados de libertad, abn - 1, estima la varianza W2 en el supuesto de que las ab muestras provengan de una nica poblacin. Se puede demostrar que

que es la llamada identidad de la suma de cuadrados en un anova de dos factores. Los sucesivos sumandos reciben respectivamente el nombre de suma de cuadrados del 1 factor (tiene a -1 grados de libertad y recoge la variabilidad de los datos debida exclusivamente al 1 factor), del 2 factor (con b -1 grados de libertad y recoge la variabilidad de los datos debida exclusivamente al 2 factor), de la interaccin (con (a - 1)(b - 1) grados de libertad, recoge la variabilidad debida a la interaccin) y del error (con ab(n - 1) grados de libertad, recoge la variabilidad de los datos alrededor de las medias de cada muestra). Los resultados de un anlisis de la varianza de dos factores se suelen representar en una tabla como la siguiente: Fuente de variacin GL 1 factor a-1 2 factor b-1 Interaccin (a - 1)(b - 1) Error ab(n - 1) Total abn - 1 SS SSA SSB SSAB SSE SST MS SSA/(a - 1) SSB/(b - 1) SSAB/[(a - 1)(b - 1)] SSE/[ab(n - 1)]

Los grados de libertad tambin son aditivos. En ocasiones se aade una primera lnea llamada de tratamiento o de subgrupos cuyos grados de libertad y suma de cuadrados son las sumas de los del primer, segundo factor y la interaccin, que corresponderan a la suma de cuadrados y grados de libertad del tratamiento de un anlisis de una va en que las ab muestras se considerarn como muestras de una clasificacin nica. Para plantear los contrastes de hiptesis hay que calcular los valores esperados de los distintos cuadrados medios.

Contrates de hiptesis en un anlisis de la varianza de dos factores


Del mismo modo que se hizo en el anova de una va, para plantear los contrastes de hiptesis habr que calcular los valores esperados de los distintos cuadrados medios. Los resultados son:

Modelo I
MS MSA MSB MSAB MSE Por lo tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se distribuyen como una F con los grados de libertad correspondientes y permiten contrastar, respectivamente, las hiptesis: i) no existe interaccin ( MSAB/MSE) Valor esperado

ii) no existe efecto del primer factor, es decir, diferencias entre niveles del primer factor (MSA/MSE)

iii) no existe efecto del segundo factor ( MSB/MSE)

Si se rechaza la primera hiptesis de no interaccin, no tiene sentido contrastar las siguientes. En este caso lo que est indicado es realizar un anlisis de una va entre las ab combinaciones de tratamientos para encontrar la mejor combinacin de los mismos.

Contraste de hiptesis en un anova de 2 vas


Modelo II MS MSA MSB MSAB MSE Valor esperado

donde son, respectivamente las componentes aadidas por el primer factor, por el segundo y por la interaccin, que tienen la misma forma que los del modelo I, sin ms que cambiarEi y Fj por Ai y Bj, respectivamente. La interaccin se contrasta, como en el modelo I, con MSAB/MSE, si se rechaza la hiptesis nula se contrastaran cada uno de los factores con MSA/MSAB yMSB/MSAB. En un modelo II, como no se est interesado en estimar los efectos de los factores sino slo la existencia de la componente aadida, s tiene sentido contrastar la existencia de la misma para cada factor incluso aunque exista interaccin. Aqu el problema se plantea cuando no se puede rechazar la hiptesis nula y se concluye que no existe interaccin: entonces tanto MSE como MSAB estiman W2, entonces cul se elige para contrastar la componente aadida de los factores?. En principio, parece razonable escoger su media (la media de varios estimadores centrados es tambin un estimador centrado y ms eficiente), sin embargo si se elige MSAB se independiza el contraste para los factores de un posible error tipo IIen el contraste para la interaccin. Hay autores que por ello opinan que es mejor usar MSAB, pero otros proponen promediar si se puede asegurar baja la probabilidad para el error tipo II. La media de los cuadrados medios se calcula dividiendo la suma de las sumas de cuadrados por la suma de los grados de libertad. Ejemplo A partir de la siguiente tabla de un anova de 2 factores modelo II, realizar los contrastes adecuados. Fuente de variacin 1 factor 2 factor Interaccin Error Total G.L. 4 3 12 100 119 SS 315,8 823,5 328,9 2308,0 3776,2 MS 78,95 274,5 27,41 23,08

Se empezara contrastando la existencia de interaccin: f = 27,41/23,08 = 1,188 como F0,05(12,100) = 1,849 no se puede, al nivel de significacin del 95%, rechazar la hiptesis nula y se concluye que no existe interaccin. Si usamos MSAB para contrastar los factores: 1 factor: f = 78,95/27,41 = 2,880 como F0,05(4,12) = 3,26 no se rechaza la hiptesis nula y se concluye la no existencia de componente aadida por este factor. 2 factor: f = 274,5/27,41 = 10,015 como F 0,05(3,12) = 3,49 se rechaza la hiptesis nula y se acepta la existencia de componente aadida por este factor. El resultado del anlisis es: no existe componente aadida por la interaccin, tampoco por el 1 factor y s existe componente aadida por el 2. La estimacin de esta componente es: como a partir de los grados de libertad de la tabla podemos calcular a = 5, b = 4 y n = 6 resulta que la estimacin de 274,5 - 27,41 = 247,09; por lo tanto de componente aadida por el segundo factor. es

que representa un 35,7%

Si se hubiera optado por promediar, los cuadrados medios promediados son (328,9+2308,0)/(12+100)= 23,54 con 112 grados de libertad y hubiera resultado significativo tambin el 1 factor. La salida de un paquete estadstico, p.e. el Statgraphics, para un anova de 2 factores modelo II

Contrastes de hiptesis en un anova de dos vas


Modelo mixto
Supngase el primer factor de efectos fijos y el segundo de efectos aleatorios, lo que no supone ninguna perdida de generalidad, ya que el orden de los factores es arbitrario. MS MSA MSB MSAB MSE Se contrastan la interaccin y el factor aleatorio con el trmino de error, si la interaccin fuera significativa no tiene sentido contrastar el efecto fijo y si no lo fuera, el efecto fijo se contrasta con el trmino de interaccin o con el promedio de interaccin y error. Valor esperado

Ejemplo
Se quiere probar la eficacia de un somnfero estudiando posibles diferencias de la misma por el sexo de los sujetos. Se eligen al azar dos grupos de insomnes varones y otros dos de mujeres y tanto para los hombres como para las mujeres se suministra a un grupo el somnfero y a otro un placebo y se mide, en minutos, el tiempo que tardan en dormirse. Los resultados son: Placebo 30 50 45 47 38 50 35 46 25 32 Somnfero 35 32 30 25 30 42 30 15 18 23

Hombre

Mujer

Se trata de un anova de dos factores fijos. Llamamos primer factor a la droga que tiene dos niveles: placebo y somnfero. El segundo factor es el sexo tambin con 2 niveles: hombres y mujeres. El tamao de las muestras es n=5. La tabla de anova es: Fuente de variacin Somnfero Sexo Interaccin Error Total GL 1 1 1 16 19 SS 696,2 105,8 0,2 1197,6 1999,8 MS 696,2 105,8 0,2 74,85

Se empieza contrastando la interaccin: f = 0,2/74,85 = 0,0026 que como es menor que F0,05(1,16)=4,49 no se rechaza la hiptesis nula de que no existe interaccin. A continuacin se contrastan los factores: para el somnfero f = 696,2/74,85 = 9,3 que es mayor que 4,49 por lo tanto existe efecto del somnfero y para el sexo f = 105,8/74,85 = 1,41 que como es menor que 4,49 no existe diferencias entre los sexos. La estimacin del efecto del somnfero ser la diferencia entre las medias de los que lo toman y los que tomaron placebo, sin tener en cuenta el sexo, una vez que se ha visto que no tiene efecto. Para analizarlo con un paquete estadstico, p.e. el Statgraphics, se necesita crear un archivo con tres variables

y el resultado, pidiendo la tabla de anova

y la tabla de medias

Por tanto la estimacin del efecto del somnifero es 39,8 - 28,0=11,8 min

Tamaos muestrales desiguales en un anova de dos factores


Aunque los paquetes estadsticos suelen hacer el anova de dos factores, tanto en el caso de tamaos muestrales iguales como desiguales, conviene resaltar que el anlisis es bastante ms complicado en el caso de tamaos desiguales. La complicacin se debe a que con tamaos desiguales hay que ponderar las sumas de cuadrados de los factores con los tamaos muestrales y no resultan ortogonales (su suma no es la suma de cuadrados total) lo que complica no slo los clculos sino tambin los contrastes de hiptesis. Por esto, cuando se disea un anlisis factorial de la varianza se recomienda disearlo con tamaos iguales. Hay ocasiones en que, sin embargo, por la dificultad de obtener los datos o por prdida de alguno de ellos es inevitable recurrir al anlisis con tamaos desiguales. Algunos autores recomiendan, incluso, renunciar a alguno de los datos para conseguir que todas las muestras tengan el mismo tamao. Evidentemente esta solucin es delicada pues podra afectar a la aleatoriedad de las muestras.

Casos particulares: Anova de dos factores sin repeticin


En ciertos estudios en que los datos son difciles de obtener o presentan muy poca variabilidad dentro de cada subgrupo es posible plantearse un anova sin repeticin, es decir, en el que en cada muestra slo hay una observacin (n=1). Hay que tener en cuenta que, como era de esperar con este diseo, no se puede calcular SSE. El trmino de interaccin recibe el nombre de residuo y que, como no se puede calcular MSE, no se puede contrastar la hiptesis de existencia de interaccin. Esto ltimo implica tambin que: a) en un modelo I, para poder contrastar las hiptesis de existencia de efectos de los factores no debe haber interaccin (si hubiera interaccin no tenemos trmino adecuado para realizar el contraste). b) en un modelo mixto existe el mismo problema para el factor fijo. Bloques completos aleatorios Otro diseo muy frecuente de anova es el denominado de bloques completos aleatorios diseado inicialmente para experimentos agrcolas pero actualmente muy extendido en otros campos. Puede considerarse como un caso particular de un anova de dos factores sin repeticin o como una extensin al caso de k muestras de la comparacin de medias de dos muestras emparejadas. Se trata de comparar k muestras emparejadas con respecto a otra variable cuyos efectos se quieren eliminar. Por ejemplo, en un ensayo clnico para comparar los efectos de dos analgsicos y un placebo en el que el efecto se mide por el tiempo que tarda en desaparecer una cefalea. Si se hicieran tres grupos de enfermos y a cada uno de ellos se le suministrara un tratamiento distinto, habra una gran variacin individual en las respuestas, debido a que no todas las cefaleas son de la misma intensidad y no todos los individuos tienen la misma percepcin del dolor, que dificultara el hallazgo de diferencias entre los tratamientos. Esta dificultad desaparece si se aplican los tres tratamientos a los mismos individuos en diferentes episodios de cefalea. Se ha emparejado a cada individuo consigo mismo, con lo que se elimina la variacin individual. En este diseo a los datos de cada individuo se les denomina bloque y los datos se representan en una tabla de doble entrada anloga a la delanova de clasificacin nica en la que las a columnas son los tratamientos y las b filas los bloques, el elemento Yij de la tabla corresponde al tratamiento i y al bloque j. Las hiptesis que se pueden plantear son: (igualdad de medias de tratamientos) y tambin, aunque generalmente tiene menos inters: (igualdad de medias de bloques)

A pesar del parecido con la clasificacin nica, el diseo es diferente: all las columnas eran muestras independientes y aqu no. Realmente es un diseo de dos factores, uno de efectos fijos: los tratamientos, y el otro de efectos aleatorios: los bloques, y sin repeticin: para cada bloque y tratamiento slo hay una muestra. El modelo aqu es: donde Ei es el efecto del tratamiento i y Bj el del bloque j. No hay trmino de interaccin ya que, al no poder contrastar su existencia no tiene inters. Al ser un modelo mixto exige la asuncin de no existencia de interaccin y los contrastes se hacen usando el trmino MSE como divisor.

Ejemplo 3
En el ensayo clnico de los analgsicos descrito anteriormente se encuentran los siguientes resultados: Placebo 35 40 60 50 50 Analgsico A 20 35 50 40 30

<Analgsico B
22 42 30 35 22

La tabla de anova correspondiente: Fuente de variacin Analgsico (tratamiento) Paciente (bloque) Error Total G.L. 2 4 8 14 SS 748,8 767,6 409,2 1925,6 MS 374,4 191,9 51,15

Los contrastes de hiptesis se hacen: para el analgsico f=374,4/51,15=7,32 que como es mayor que F0,05(2,8)=4,46 existe un efecto del tratamiento. para los bloques f=191,9/51,15=3,75 que es menor que F0,05(4,8)=3,84 por tanto no hay componente aadida por los pacientes. El archivo para analizarlo con en un paquete estadstisco

y el resultado

También podría gustarte