Está en la página 1de 7

Ignacio Martn Tamayo

25

Tema: ANLISIS DE VARIANZA CON SPSS 8.0 NDICE --------------------------------------------------------1. Modelos de ANOVA 2. ANOVA unifactorial entregrupos 3. ANOVA multifactorial entregrupos 4. ANOVA con medidas repetidas ---------------------------------------------------------1.- Modelos de ANOVA La tcnica del Anlisis de la Varianza (ANOVA o AVAR) es una de las tcnicas ms utilizadas en los anlisis de los datos de los diseos experimentales. Se utiliza cuando queremos contrastar ms de dos medias, por lo que puede verse como una extensin de la prueba t para diferencias de dos medias. El ANOVA es un mtodo muy flexible que permite construir modelos estadsticos para el anlisis de los datos experimentales cuyo valor ha sido constatado en muy diversas circunstancias. Bsicamente es un procedimiento que permite dividir la varianza de la variable dependiente en dos o ms componentes, cada uno de los cuales puede ser atribuido a una fuente (variable o factor) identificable. Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma: (Valor observado) = (efectos atribuibles) + (efectos no atribuibles o residuales) El valor observado se refiere al que se obtiene en la variable cuantitativa dependiente. Los efectos atribuibles son parmetros o variables aleatorias que son el resultado de cambios en los factores o variables independientes y, por tanto, atribuibles a ellos. Aquellos efectos no atribuibles a ningn factor controlado se denominan efectos residuales o variables aleatorias residuales. El ANOVA est basado en ciertos supuestos, unos ms plausibles que otros, acerca de dichas variables aleatorias. Es evidente que cuantos ms factores introduzcamos menos cantidad de variacin residual (error) quedar por explicar. Pero siempre quedar alguna variacin residual. Los supuestos en los que est basado respecto a la variacin residual se resumen en los siguientes: El valor esperado de cada variable aleatoria residual es cero. Esto significa que toda la variacin de los valores esperados es debida a los parmetros (y/o variables aleatorias) que representan efectos atribuibles. En la mayor parte de las situaciones este supuesto no es incorrecto. 2. Las variables aleatorias residuales son mutuamente independientes. Significa que entre las observaciones no existe nexo alguno que no sea explicado por los factores controlados. El supuesto no es tan claramente correcto como el primero, pero se puede mantener razonablemente si los individuos se eligen al azar y la medicin se hace separadamente para cada uno. 3. Todas las variables aleatorias residuales tienen la misma desviacin tpica. Es el llamado supuesto de homoscedasticidad o de igualdad de varianzas. Es el menos viable, pues los mtodos de medida producen variaciones de diferente magnitud y sabemos que los valores esperados estn relacionados con las desviaciones tpicas. Hay distintos mtodos para conseguir que tal supuesto sea satisfecho: nmero igual de sujetos en los tratamientos, transformacin de las observaciones originales, etc. 4. Toda variable aleatoria residual se distribuye normalmente. Es probablemente, el menos vlido de los cuatro. Sin embargo, se puede tolerar cierto alejamiento de la normalidad con mnimo efecto prctico sobre las propiedades del ANOVA. Los modelos del ANOVA son muchos y no vamos a desarrollarlos todos. Los que veremos son, quiz, los ms representativos, pero no sirven para todas las situaciones. Tres son los criterios que vamos a utilizar para clasificar los modelos: nmero de factores, muestreo de niveles y tipo de aleatorizacin. a) Nmero de factores: Aquellos experimentos que utilizan una sola variable independiente o factor y una variable dependiente se analizan mediante varianza llamado de un factor, de clasificacin simple, unidireccional o de una va (one way). Se trata de comparar grupos o muestras que difieren sistemticamente en un solo factor. 1.

Ignacio Martn Tamayo

26

Si varios grupos o muestras se asignan a diferentes combinaciones de dos factores, el ANOVA correspondiente es llamado de dos factores, de clasificacin doble, bidireccional o de dos vas (two way). Se trata de comparar grupos o muestras que difieren sistemticamente en dos factores. Y as sucesivamente. b) Muestreo de niveles: Como sabemos, el factor es la variable independiente o experimental controlada por el investigador. Puede tomar pocos o muchos valores o niveles, a cada uno de los cuales se asignan los grupos o muestras. Si se toman K niveles del factor, a cada uno se asignan las muestras y las inferencias se refieren exclusivamente a los K niveles y no a otros que podran haber sido incluidos, el ANOVA se llama de efectos fijos, sistemtico o paramtrico. El inters del diseo se centra en saber si esos niveles concretos difieren entre s. Cuando los niveles son muchos y se seleccionan al azar K niveles, pero las inferencias se desean hacer respecto al total de niveles, el anlisis de varianza se denomina de efectos aleatorios. La idea bsica es que el investigador no tiene inters en niveles particulares del factor. Cuando se utilizan dos factores, cada uno con varios niveles, uno de efectos fijos y otro de efectos aleatorios, el anlisis de varianza es mixto. Los dos criterios de clasificacin vistos hasta el momento obviamente se vern reflejados en el modelo general del anlisis de varianza. Cuando los factores sean de efectos fijos aparecern en la frmula como parmetros (con letras griegas), cuando los factores sean de efectos aleatorios, aparecern como variables aleatorias (con letras maysculas latinas). As: a) Yjj = + i + Eij b) Yjj = + Ai + Eij e) Yijk = + i + j + Eij d) Yijk = + i + Bj + Eij, etc. El a) es un ANOVA de un factor, efectos fijos; el b) es un ANOVA de un factor, efectos aleatorios; el c) es un ANOVA de dos factores, efectos fijos; el d) es un ANOVA de dos factores, en el que el factor A es fijo y el factor B aleatorio; es, por tanto, un modelo mixto; es una constante y + Eij es la variable aleatoria residual o error. c) Tipo de aleatorizacin: Sabemos que la aleatorizacin es el procedimiento por el cual las unidades experimentales (en general, los sujetos) se asignan al azar a los niveles del factor o tratamientos, de modo que todas ellas tengan la misma probabilidad de recibir un tratamiento o nivel determinado. Esta aleatorizacin se puede llevar a cabo en el total de las observaciones o por bloques. Ello dar origen a dos tipos distintos de diseo experimental: completamente aleatorizado (CA) o aleatorizado en bloques (BA). Cuando una variable extraa se utiliza para dividir a los sujetos en subgrupos o bloques se denomina variable de bloqueo. El objetivo es eliminar su efecto. Diseos ms complejos pueden utilizar ms de una variable de bloqueo. El bloqueo llevado a sus extremos puede ser aquel en el que un bloque son medidas de un nico sujeto. Es decir, slo un sujeto recibe todos los tratamientos, de modo que se eliminar mayor nmero de variables exgenas o extraas. Este tipo de diseo se suele llamar de medidas repetidas o intrasujetos. 2.- ANOVA unifactorial entregrupos El procedimiento ANOVA de un factor de SPSS genera un Anlisis de la Varianza de un factor para una variable dependiente cuantitativa respecto a una nica variable de factor (la variable independiente) de efectos fijos y completamente aleatorizado. Se utiliza para contrastar la hiptesis de si las medias calculadas en varios grupos son iguales o diferentes. Adems de determinar que existen diferencias entre las medias, es posible que desee saber qu medias difieren. Existen dos tipos de contrastes para comparar medias: los contrastes a priori y las pruebas post hoc. Los contrastes a priori se plantean antes de ejecutar el experimento y las pruebas post hoc se realizan despus de haber llevado a cabo el experimento. Tambin pueden contrastarse las tendencias existentes a travs de las categoras. Para obtener el ANOVA de un factor debe elegir en la barra de mens Estadstica y posteriormente el procedimiento Comparar medias y dentro de este ANOVA de un factor. Cuando seleccione este procedimiento le aparecer en pantalla la siguiente ventana.

Ignacio Martn Tamayo

27

Por ejemplo, si quisiramos saber si tres mtodos de enseanza distintos influyen sobre el rendimiento acadmico de tres grupos distintos de sujetos podramos realizar un ANOVA unifactorial entregrupos o completamente aleatorizado de efectos fijos usando como Variable Dependiente el Rendimiento y como factor el mtodo (nota: hay que incluir el factor mtodo como variable entera y no de cadena al definir las variables). En este caso obtendramos una salida como esta: ANOVA RENDIMIENTO Suma de cuadrados gl Media cuadrtica Inter-grupos 45,805 2 22,902 Intra-grupos 85,350 27 3,161 Total 131,155 29 F 7,245 Sig. ,003

El procedimiento permite establecer contrastes a priori en el botn Contrastes. En esta opcin se pueden dividir las sumas de cuadrados en componentes de tendencia o bien especificar contrastes a priori que estn implcitos en las hiptesis planteadas por el investigador previo a los anlisis. Para realizarlos debe introducir un coeficiente para cada grupo de la variable factor y pulsar Aadir despus de cada entrada. El orden de entrada es importante porque se corresponde con el orden ascendente de los valores de las categoras de la variable factor. Por ejemplo si deseramos contrastar el mtodo 1 frente al 2 y el 3 deberamos introducir los coeficientes en este orden 1, 0.5 y 0.5. Para la mayora de las aplicaciones la suma de los coeficientes deber ser cero. El botn Post hoc permite realizar contrastes a posteriori para determinar que medias difieren si el anlisis ha salido significativo. Se pueden elegir entre distintos estadsticos para realizar los contrastes. El botn Opciones permite seleccionar estadsticos descriptivos, prueba de homogeneidad de varianzas, grfico para las medias y permite controlar el tratamiento de valores perdidos. 3. - ANOVA multifactorial entregrupos Si deseamos realizar una ANOVA unifactorial entregrupos del tipo anterior o otro tipo o ANOVAs de dos o ms factores entregrupos el procedimiento indicado por el programa SPSS es en el men Estadstica la opcin Modelo lineal general y dentro de esta MLG Factorial general. El procedimiento MLG (Modelo Lineal General) Factorial general proporciona un anlisis de regresin y un ANOVA para una variable dependiente mediante uno o ms factores o variables que dividen la poblacin en grupos. Con este procedimiento se pueden contrastar hiptesis nulas sobre los efectos de otras variables en las medias de varias agrupaciones de una nica variable dependiente. Se pueden investigar las interacciones entre los factores as como los efectos de los factores individuales, algunos de los cuales pueden ser de efectos aleatorios. Adems, aunque no es de nuestro inters en este tema, se pueden incluir los efectos de covariables y las interacciones de covariables con los factores. Para el anlisis de regresin, las variables independientes (predictoras) se especifican como covariables. Es posible contrastar modelos equilibrados (si todas las casillas del modelo contienen igual nmero de casos) y no equilibrados. Tambin permite estimar los parmetros del modelo. Adems, se encuentran disponibles contrastes a priori y a posteriori.

Ignacio Martn Tamayo

28

Supongamos que un investigador est interesado en conocer el efecto que tiene la intensidad luminosa de un estmulo y el color sobre el tiempo de reaccin. Para ello, eligi seis grupos de cinco sujetos asignados aleatoriamente a los que present diez estmulos. A cada grupo le present los estmulos con un color diferente (verde y azul) y con un nivel de intensidad distinto (baja, media y alta) y calcul el tiempo de reaccin medio en los diez estmulos presentados a cada sujeto. Tiene efecto el color y la intensidad de presentacin en el tiempo de reaccin? Lo se debera realizar para responder a esta pregunta es un ANOVA con dos factores de efectos fijos y completamente aleatorizado. Si utilizaramos el SPSS la ventana que aparecera tras introducir los datos y elegir en el men Estadstica y la opcin Modelo lineal general y posteriormente MLG Factorial general ser:

Si situamos la variable tiempo de reaccin en la cuadro dependiente y las variables color e intensidad en el cuadro Factores fijos la salida que proporciona el programa es la siguiente: Pruebas de los efectos inter-sujetos Variable dependiente: TR Fuente Suma de cuadrados gl Media tipo III cuadrtica Modelo corregido 2062,167 5 412,433 Interseccin 37949,633 1 37949,633 INTENSID 2054,867 2 1027,433 COLOR 4,033 1 4,033 INTENSID * COLOR 3,267 2 1,633 Error 1001,200 24 41,717 Total 41013,000 30 Total corregido 3063,367 29 R cuadrado = ,673 (R cuadrado corregido = ,605)

F 9,887 909,700 24,629 ,097 ,039

Sig. ,000 ,000 ,000 ,759 ,962

La tabla que proporciona la salida contiene en las filas los componentes del modelo que contribuyen a la variacin de la variable dependiente. La filas denominadas Modelo corregido e interseccin contienen los valores para el modelo de regresin. Las columnas INTENSID y COLOR son los efectos principales del modelo e INTENSID * COLOR es la interaccin entre los dos factores y el Error hace referencia al trmino error del ANOVA. En estas filas debemos observar la suma de cuadrados, los grados de libertad, la media cuadrtica, el valor del estadstico de contraste F y la significacin del contraste (para considerar un contraste significativo la probabilidad debe ser menor de 0.05 o de 0.01). En este caso slo la variable Intensidad ha tenido efecto sobre la variable dependiente Tiempo de reaccin.

Ignacio Martn Tamayo

29

Adems, el procedimiento MLG Factorial general permite trabajar con una serie de opciones que pueden seleccionarse pulsando los botones que aparen en la ventana principal de este procedimiento. Las posibilidades principales son: a) Modelo: permite especificar el modelo de ANOVA. Por defecto se entiende que el modelo es Factorial completo que contiene todos los efectos principales y de interaccin. Si desea puede realizar un modelo personalizado (por ejemplo, si tiene una variable de bloqueo no incluir la interaccin de esta variable con las dems variables de tratamiento). Si selecciona la opcin personalizado debe especificar los efectos principales e interacciones que desee incluir en el modelo. En esta ventana tambin puede seleccionar el tipo de suma de cuadrados (Tipo I, II, III y IV). Esta opcin determina el mtodo para calcular las sumas de cuadrados. Para los modelos equilibrados y no equilibrados, el mtodo ms utilizado es el Tipo III, que es el que se incluye por defecto.

b) Contrastes: se utiliza para contrastar las diferencias entre los niveles de un factor. Puede especificarse un contraste para cada factor del modelo. Los contrastes disponibles son: desviacin (compara la media de cada nivel con la media global de todos los niveles), simple (compara la media de cada nivel con la media de un nivel especificado), diferencia (Compra la media de cada nivel con la media de los niveles anteriores), Helmert (compara la media de cada nivel con los niveles siguientes), Repetido (compara la media de cada nivel con la media del nivel siguiente) y polinmico (compara el efecto lineal, cuadrtico, cbico, etc. c) Grficos: Permite realizar grficos de perfil que sirven para comparar las medias marginales del modelo.

d) Post hoc: Una vez que se ha determinado que hay diferencias entre las medias, las pruebas de rango post hoc y las comparaciones pueden determinar qu medias difieren. Se realizan las comparaciones para aquellos efectos significativos con la opcin de asumir o no igualdad de varianzas. e) Guardar: La opcin guardar permite guardar los valores pronosticados por el modelo, los residuos y las medias relacionadas como variables nuevas en el editor de datos Muchas de estas variables se pueden utilizar para examinar supuestos sobre los datos. Opciones: Este cuadro de dilogo contiene estadsticos opcionales. Los estadsticos se calculan utilizando un modelo de efectos fijos.

f)

4.- ANOVA con medidas repetidas Este procedimiento debe utilizarse cuando tenemos al menos una variable manipulada intrasujetos, es decir, cuando todos los sujetos reciben o pasan por todos los niveles de esa variable independiente. As, se utilizar en aquellos casos que tengamos slo una variable independiente intrasujeto (diseo unifactorial de medidas repetidas), o cuando tengamos dos variables independientes ambas intrasujeto (Diseo bifactorial de medidas repetidas) o una de ellas intrasujeto y la otra entregrupos (diseo bifactorial mixto). En todos estos casos y en sus extensiones lo ms adecuado es seleccionar en el men Estadstica el procedimiento Modelo lineal general y despus MLG Medidas repetidas. Veamos un ejemplo de un diseo bifactorial con las dos variables independientes manipuladas intrasujeto. Un investigador est comprobando si la dosis de cierta droga y el momento del dia en la que se administren tiene efecto sobre los procesos atencionales. Para ello seleccion una muestra de sujetos y les administro dosis de droga en seis ocasiones distintas: tres por la maana y tres por la tarde con tres niveles de droga distintos en cada ocasin y midi el nmero de aciertos de cero a cien en una tarea atencional. Para ello introdujo los datos en el Editor del Spss de la siguiente forma:

Ignacio Martn Tamayo

30

Como habitualmente, se utiliza una fila para cada sujeto y, por tanto, hay seis medidas de la variable dependiente en seis casos distintos, desde dosis de droga baja por la maana (d1m1) hasta dosis de droga alta por la tarde (d3m2). Una vez introducidos los datos debemos seleccionar el procedimiento MLG Medidas repetidas. Cuando realizamos esta accin, la ventana que aparece es la siguiente:

En esta ventana debemos ir definiendo los factores o variables independientes uno a uno. En nuestro caso tenemos dos factores. El factor dosis de droga con tres niveles (baja, media y elevada) y momento del da con dos niveles (maana y tarde). Cada vez debemos indicar el nombre del factor y el nmero de niveles y pulsar despus el botn aadir. En nuestro caso podemos poner en el nombre del factor intrasujetos dosis y en el nmero de niveles 3 y pulsar aadir, para posteriormente nombrar como momento y 2 niveles y volver a pulsar aadir. Cuando hemos finalizado debemos pulsar el botn Definir y automticamente aparecer la siguiente ventana.

Ignacio Martn Tamayo

31

En esa ventana se deben ir seleccionando ordenadamente la combinacin de niveles de la variable intrasujetos. Tambin permite introducir variables manipuladas entregrupos para los diseos mixtos y covariables para los Anlisis de Covarianza. Una vez que se han seleccionado los niveles adecuadamente la salida que proporciona SPSS es similar a la siguiente: Fuente Pruebas de efectos intra-sujetos. Suma de cuad. gl Media F Sig. tipo III cuadrtica DOSIS Esfericidad asumida 10213,233 2 5106,617 133,261 ,000 Greenhouse-Geisser 10213,233 1,595 6404,991 133,261 ,000 Huynh-Feldt 10213,233 1,883 5423,400 133,261 ,000 Lmite-inferior 10213,233 1,000 10213,233 133,261 ,000 Error(DOSIS) Esfericidad asumida 689,767 18 38,320 Greenhouse-Geisser 689,767 14,351 48,063 Huynh-Feldt 689,767 16,949 40,698 Lmite-inferior 689,767 9,000 76,641 MOMEN Esfericidad asumida 1,667 1 1,667 ,281 ,609 Greenhouse-Geisser 1,667 1,000 1,667 ,281 ,609 Huynh-Feldt 1,667 1,000 1,667 ,281 ,609 Lmite-inferior 1,667 1,000 1,667 ,281 ,609 Error(MOMEN) Esfericidad asumida 53,333 9 5,926 Greenhouse-Geisser 53,333 9,000 5,926 Huynh-Feldt 53,333 9,000 5,926 Lmite-inferior 53,333 9,000 5,926 DOSIS * MOMEN Esfericidad asumida 3,433 2 1,717 ,444 ,648 Greenhouse-Geisser 3,433 1,500 2,289 ,444 ,595 Huynh-Feldt 3,433 1,733 1,981 ,444 ,622 Lmite-inferior 3,433 1,000 3,433 ,444 ,522 Error(DOSIS*MO Esfericidad asumida 69,567 18 3,865 MEN) Greenhouse-Geisser 69,567 13,497 5,154 Huynh-Feldt 69,567 15,596 4,461 Lmite-inferior 69,567 9,000 7,730

Como puede comprobarse slo el factor dosis ha tenido efecto significativo sobre la variable atencin en el componente lineal y cuadrtico. Como en el caso del procedimiento MLG Factorial general , en este caso tambin disponemos de diversas opciones similares a las ya indicadas en el apartado anterior. La diferencia ms importante hace referencia al botn Post hoc, ya que en MLG Medidas repetidas estas pruebas no estn disponibles si no hay factores entregrupos.

También podría gustarte