Está en la página 1de 7

Ignacio Martn Tamayo

25

Tema: ANLISIS DE VARIANZA CON SPSS 8.0


NDICE
--------------------------------------------------------1. Modelos de ANOVA
2. ANOVA unifactorial entregrupos
3. ANOVA multifactorial entregrupos
4. ANOVA con medidas repetidas
---------------------------------------------------------1.- Modelos de ANOVA
La tcnica del Anlisis de la Varianza (ANOVA o AVAR) es una de las tcnicas ms utilizadas
en los anlisis de los datos de los diseos experimentales. Se utiliza cuando queremos contrastar ms de
dos medias, por lo que puede verse como una extensin de la prueba t para diferencias de dos medias.
El ANOVA es un mtodo muy flexible que permite construir modelos estadsticos para el anlisis de
los datos experimentales cuyo valor ha sido constatado en muy diversas circunstancias. Bsicamente es
un procedimiento que permite dividir la varianza de la variable dependiente en dos o ms componentes,
cada uno de los cuales puede ser atribuido a una fuente (variable o factor) identificable.
Los modelos que permite construir el ANOVA pueden ser reducidos a la siguiente forma:
(Valor observado) = (efectos atribuibles) + (efectos no atribuibles o residuales)
El valor observado se refiere al que se obtiene en la variable cuantitativa dependiente. Los efectos
atribuibles son parmetros o variables aleatorias que son el resultado de cambios en los factores o
variables independientes y, por tanto, atribuibles a ellos. Aquellos efectos no atribuibles a ningn factor
controlado se denominan efectos residuales o variables aleatorias residuales.
El ANOVA est basado en ciertos supuestos, unos ms plausibles que otros, acerca de dichas
variables aleatorias. Es evidente que cuantos ms factores introduzcamos menos cantidad de variacin
residual (error) quedar por explicar. Pero siempre quedar alguna variacin residual. Los supuestos en
los que est basado respecto a la variacin residual se resumen en los siguientes:
1.

El valor esperado de cada variable aleatoria residual es cero. Esto significa que toda la variacin de
los valores esperados es debida a los parmetros (y/o variables aleatorias) que representan efectos
atribuibles. En la mayor parte de las situaciones este supuesto no es incorrecto.
2. Las variables aleatorias residuales son mutuamente independientes. Significa que entre las
observaciones no existe nexo alguno que no sea explicado por los factores controlados. El supuesto
no es tan claramente correcto como el primero, pero se puede mantener razonablemente si los
individuos se eligen al azar y la medicin se hace separadamente para cada uno.
3. Todas las variables aleatorias residuales tienen la misma desviacin tpica. Es el llamado supuesto
de homoscedasticidad o de igualdad de varianzas. Es el menos viable, pues los mtodos de medida
producen variaciones de diferente magnitud y sabemos que los valores esperados estn relacionados
con las desviaciones tpicas. Hay distintos mtodos para conseguir que tal supuesto sea satisfecho:
nmero igual de sujetos en los tratamientos, transformacin de las observaciones originales, etc.
4. Toda variable aleatoria residual se distribuye normalmente. Es probablemente, el menos vlido de
los cuatro. Sin embargo, se puede tolerar cierto alejamiento de la normalidad con mnimo efecto
prctico sobre las propiedades del ANOVA.
Los modelos del ANOVA son muchos y no vamos a desarrollarlos todos. Los que veremos son, quiz,
los ms representativos, pero no sirven para todas las situaciones. Tres son los criterios que vamos a
utilizar para clasificar los modelos: nmero de factores, muestreo de niveles y tipo de aleatorizacin.
a) Nmero de factores: Aquellos experimentos que utilizan una sola variable independiente o
factor y una variable dependiente se analizan mediante varianza llamado de un factor, de
clasificacin simple, unidireccional o de una va (one way). Se trata de comparar grupos o muestras
que difieren sistemticamente en un solo factor.

Ignacio Martn Tamayo

26

Si varios grupos o muestras se asignan a diferentes combinaciones de dos factores, el ANOVA


correspondiente es llamado de dos factores, de clasificacin doble, bidireccional o de dos vas (two
way). Se trata de comparar grupos o muestras que difieren sistemticamente en dos factores. Y as
sucesivamente.
b) Muestreo de niveles: Como sabemos, el factor es la variable independiente o experimental
controlada por el investigador. Puede tomar pocos o muchos valores o niveles, a cada uno de los
cuales se asignan los grupos o muestras. Si se toman K niveles del factor, a cada uno se asignan las
muestras y las inferencias se refieren exclusivamente a los K niveles y no a otros que podran haber
sido incluidos, el ANOVA se llama de efectos fijos, sistemtico o paramtrico. El inters del diseo
se centra en saber si esos niveles concretos difieren entre s.
Cuando los niveles son muchos y se seleccionan al azar K niveles, pero las inferencias se desean
hacer respecto al total de niveles, el anlisis de varianza se denomina de efectos aleatorios. La idea
bsica es que el investigador no tiene inters en niveles particulares del factor.
Cuando se utilizan dos factores, cada uno con varios niveles, uno de efectos fijos y otro de
efectos aleatorios, el anlisis de varianza es mixto.
Los dos criterios de clasificacin vistos hasta el momento obviamente se vern reflejados en el
modelo general del anlisis de varianza. Cuando los factores sean de efectos fijos aparecern en la
frmula como parmetros (con letras griegas), cuando los factores sean de efectos aleatorios,
aparecern como variables aleatorias (con letras maysculas latinas). As:
a) Yjj = + i + Eij
b) Yjj = + Ai + Eij
e) Yijk = + i + j + Eij
d) Yijk = + i + Bj + Eij, etc.
El a) es un ANOVA de un factor, efectos fijos; el b) es un ANOVA de un factor, efectos
aleatorios; el c) es un ANOVA de dos factores, efectos fijos; el d) es un ANOVA de dos factores, en
el que el factor A es fijo y el factor B aleatorio; es, por tanto, un modelo mixto; es una constante y
+ Eij es la variable aleatoria residual o error.
c) Tipo de aleatorizacin: Sabemos que la aleatorizacin es el procedimiento por el cual las
unidades experimentales (en general, los sujetos) se asignan al azar a los niveles del factor o
tratamientos, de modo que todas ellas tengan la misma probabilidad de recibir un tratamiento o nivel
determinado.
Esta aleatorizacin se puede llevar a cabo en el total de las observaciones o por bloques. Ello
dar origen a dos tipos distintos de diseo experimental: completamente aleatorizado (CA) o
aleatorizado en bloques (BA).
Cuando una variable extraa se utiliza para dividir a los sujetos en subgrupos o bloques se
denomina variable de bloqueo. El objetivo es eliminar su efecto. Diseos ms complejos pueden
utilizar ms de una variable de bloqueo. El bloqueo llevado a sus extremos puede ser aquel en el que
un bloque son medidas de un nico sujeto. Es decir, slo un sujeto recibe todos los tratamientos, de
modo que se eliminar mayor nmero de variables exgenas o extraas. Este tipo de diseo se suele
llamar de medidas repetidas o intrasujetos.
2.- ANOVA unifactorial entregrupos
El procedimiento ANOVA de un factor de SPSS genera un Anlisis de la Varianza de un factor
para una variable dependiente cuantitativa respecto a una nica variable de factor (la variable
independiente) de efectos fijos y completamente aleatorizado. Se utiliza para contrastar la hiptesis de si
las medias calculadas en varios grupos son iguales o diferentes.
Adems de determinar que existen diferencias entre las medias, es posible que desee saber qu
medias difieren. Existen dos tipos de contrastes para comparar medias: los contrastes a priori y las
pruebas post hoc. Los contrastes a priori se plantean antes de ejecutar el experimento y las pruebas post
hoc se realizan despus de haber llevado a cabo el experimento. Tambin pueden contrastarse las
tendencias existentes a travs de las categoras.
Para obtener el ANOVA de un factor debe elegir en la barra de mens Estadstica y
posteriormente el procedimiento Comparar medias y dentro de este ANOVA de un factor. Cuando
seleccione este procedimiento le aparecer en pantalla la siguiente ventana.

Ignacio Martn Tamayo

27

Por ejemplo, si quisiramos saber si tres mtodos de enseanza distintos influyen sobre el
rendimiento acadmico de tres grupos distintos de sujetos podramos realizar un ANOVA unifactorial
entregrupos o completamente aleatorizado de efectos fijos usando como Variable Dependiente el
Rendimiento y como factor el mtodo (nota: hay que incluir el factor mtodo como variable entera y no
de cadena al definir las variables). En este caso obtendramos una salida como esta:
ANOVA RENDIMIENTO
Suma de cuadrados gl Media cuadrtica
Inter-grupos
45,805
2
22,902
Intra-grupos
85,350
27
3,161
Total
131,155
29

F
7,245

Sig.
,003

El procedimiento permite establecer contrastes a priori en el botn Contrastes. En esta opcin


se pueden dividir las sumas de cuadrados en componentes de tendencia o bien especificar contrastes a
priori que estn implcitos en las hiptesis planteadas por el investigador previo a los anlisis. Para
realizarlos debe introducir un coeficiente para cada grupo de la variable factor y pulsar Aadir despus de
cada entrada. El orden de entrada es importante porque se corresponde con el orden ascendente de los
valores de las categoras de la variable factor. Por ejemplo si deseramos contrastar el mtodo 1 frente al
2 y el 3 deberamos introducir los coeficientes en este orden 1, 0.5 y 0.5. Para la mayora de las
aplicaciones la suma de los coeficientes deber ser cero.
El botn Post hoc permite realizar contrastes a posteriori para determinar que medias difieren si
el anlisis ha salido significativo. Se pueden elegir entre distintos estadsticos para realizar los contrastes.
El botn Opciones permite seleccionar estadsticos descriptivos, prueba de homogeneidad de
varianzas, grfico para las medias y permite controlar el tratamiento de valores perdidos.
3. - ANOVA multifactorial entregrupos
Si deseamos realizar una ANOVA unifactorial entregrupos del tipo anterior o otro tipo o
ANOVAs de dos o ms factores entregrupos el procedimiento indicado por el programa SPSS es en el
men Estadstica la opcin Modelo lineal general y dentro de esta MLG Factorial general.
El procedimiento MLG (Modelo Lineal General) Factorial general proporciona un anlisis de
regresin y un ANOVA para una variable dependiente mediante uno o ms factores o variables que
dividen la poblacin en grupos. Con este procedimiento se pueden contrastar hiptesis nulas sobre los
efectos de otras variables en las medias de varias agrupaciones de una nica variable dependiente. Se
pueden investigar las interacciones entre los factores as como los efectos de los factores individuales,
algunos de los cuales pueden ser de efectos aleatorios. Adems, aunque no es de nuestro inters en este
tema, se pueden incluir los efectos de covariables y las interacciones de covariables con los factores. Para
el anlisis de regresin, las variables independientes (predictoras) se especifican como covariables.
Es posible contrastar modelos equilibrados (si todas las casillas del modelo contienen igual
nmero de casos) y no equilibrados. Tambin permite estimar los parmetros del modelo. Adems, se
encuentran disponibles contrastes a priori y a posteriori.

Ignacio Martn Tamayo

28

Supongamos que un investigador est interesado en conocer el efecto que tiene la intensidad
luminosa de un estmulo y el color sobre el tiempo de reaccin. Para ello, eligi seis grupos de cinco
sujetos asignados aleatoriamente a los que present diez estmulos. A cada grupo le present los
estmulos con un color diferente (verde y azul) y con un nivel de intensidad distinto (baja, media y alta) y
calcul el tiempo de reaccin medio en los diez estmulos presentados a cada sujeto. Tiene efecto el
color y la intensidad de presentacin en el tiempo de reaccin? Lo se debera realizar para responder a
esta pregunta es un ANOVA con dos factores de efectos fijos y completamente aleatorizado. Si
utilizaramos el SPSS la ventana que aparecera tras introducir los datos y elegir en el men Estadstica y
la opcin Modelo lineal general y posteriormente MLG Factorial general ser:

Si situamos la variable tiempo de reaccin en la cuadro dependiente y las variables color e


intensidad en el cuadro Factores fijos la salida que proporciona el programa es la siguiente:
Pruebas de los efectos inter-sujetos
Variable dependiente: TR
Fuente
Suma de cuadrados
gl
Media
tipo III
cuadrtica
Modelo corregido
2062,167
5
412,433
Interseccin
37949,633
1
37949,633
INTENSID
2054,867
2
1027,433
COLOR
4,033
1
4,033
INTENSID * COLOR
3,267
2
1,633
Error
1001,200
24
41,717
Total
41013,000
30
Total corregido
3063,367
29
R cuadrado = ,673 (R cuadrado corregido = ,605)

Sig.

9,887
909,700
24,629
,097
,039

,000
,000
,000
,759
,962

La tabla que proporciona la salida contiene en las filas los componentes del modelo que
contribuyen a la variacin de la variable dependiente. La filas denominadas Modelo corregido e
interseccin contienen los valores para el modelo de regresin. Las columnas INTENSID y COLOR son
los efectos principales del modelo e INTENSID * COLOR es la interaccin entre los dos factores y el
Error hace referencia al trmino error del ANOVA. En estas filas debemos observar la suma de
cuadrados, los grados de libertad, la media cuadrtica, el valor del estadstico de contraste F y la
significacin del contraste (para considerar un contraste significativo la probabilidad debe ser menor de
0.05 o de 0.01). En este caso slo la variable Intensidad ha tenido efecto sobre la variable dependiente
Tiempo de reaccin.

Ignacio Martn Tamayo

29

Adems, el procedimiento MLG Factorial general permite trabajar con una serie de opciones que
pueden seleccionarse pulsando los botones que aparen en la ventana principal de este procedimiento. Las
posibilidades principales son:
a)

Modelo: permite especificar el modelo de ANOVA. Por defecto se entiende que el modelo
es Factorial completo que contiene todos los efectos principales y de interaccin. Si desea
puede realizar un modelo personalizado (por ejemplo, si tiene una variable de bloqueo no
incluir la interaccin de esta variable con las dems variables de tratamiento). Si
selecciona la opcin personalizado debe especificar los efectos principales e interacciones
que desee incluir en el modelo. En esta ventana tambin puede seleccionar el tipo de suma
de cuadrados (Tipo I, II, III y IV). Esta opcin determina el mtodo para calcular las sumas
de cuadrados. Para los modelos equilibrados y no equilibrados, el mtodo ms utilizado es
el Tipo III, que es el que se incluye por defecto.

b) Contrastes: se utiliza para contrastar las diferencias entre los niveles de un factor. Puede
especificarse un contraste para cada factor del modelo. Los contrastes disponibles son:
desviacin (compara la media de cada nivel con la media global de todos los niveles),
simple (compara la media de cada nivel con la media de un nivel especificado), diferencia
(Compra la media de cada nivel con la media de los niveles anteriores), Helmert (compara
la media de cada nivel con los niveles siguientes), Repetido (compara la media de cada
nivel con la media del nivel siguiente) y polinmico (compara el efecto lineal, cuadrtico,
cbico, etc.
c)

Grficos: Permite realizar grficos de perfil que sirven para comparar las medias
marginales del modelo.

d) Post hoc: Una vez que se ha determinado que hay diferencias entre las medias, las pruebas
de rango post hoc y las comparaciones pueden determinar qu medias difieren. Se realizan
las comparaciones para aquellos efectos significativos con la opcin de asumir o no
igualdad de varianzas.
e)

Guardar: La opcin guardar permite guardar los valores pronosticados por el modelo, los
residuos y las medias relacionadas como variables nuevas en el editor de datos Muchas de
estas variables se pueden utilizar para examinar supuestos sobre los datos.

f)

Opciones: Este cuadro de dilogo contiene estadsticos opcionales. Los estadsticos se


calculan utilizando un modelo de efectos fijos.

4.- ANOVA con medidas repetidas


Este procedimiento debe utilizarse cuando tenemos al menos una variable manipulada
intrasujetos, es decir, cuando todos los sujetos reciben o pasan por todos los niveles de esa variable
independiente. As, se utilizar en aquellos casos que tengamos slo una variable independiente
intrasujeto (diseo unifactorial de medidas repetidas), o cuando tengamos dos variables independientes
ambas intrasujeto (Diseo bifactorial de medidas repetidas) o una de ellas intrasujeto y la otra entregrupos
(diseo bifactorial mixto). En todos estos casos y en sus extensiones lo ms adecuado es seleccionar en el
men Estadstica el procedimiento Modelo lineal general y despus MLG Medidas repetidas.
Veamos un ejemplo de un diseo bifactorial con las dos variables independientes manipuladas
intrasujeto. Un investigador est comprobando si la dosis de cierta droga y el momento del dia en la que
se administren tiene efecto sobre los procesos atencionales. Para ello seleccion una muestra de sujetos y
les administro dosis de droga en seis ocasiones distintas: tres por la maana y tres por la tarde con tres
niveles de droga distintos en cada ocasin y midi el nmero de aciertos de cero a cien en una tarea
atencional. Para ello introdujo los datos en el Editor del Spss de la siguiente forma:

Ignacio Martn Tamayo

30

Como habitualmente, se utiliza una fila para cada sujeto y, por tanto, hay seis medidas de la
variable dependiente en seis casos distintos, desde dosis de droga baja por la maana (d1m1) hasta dosis
de droga alta por la tarde (d3m2). Una vez introducidos los datos debemos seleccionar el procedimiento
MLG Medidas repetidas. Cuando realizamos esta accin, la ventana que aparece es la siguiente:

En esta ventana debemos ir definiendo los factores o variables independientes uno a uno. En
nuestro caso tenemos dos factores. El factor dosis de droga con tres niveles (baja, media y elevada) y
momento del da con dos niveles (maana y tarde).
Cada vez debemos indicar el nombre del factor y el nmero de niveles y pulsar despus el botn
aadir. En nuestro caso podemos poner en el nombre del factor intrasujetos dosis y en el nmero de
niveles 3 y pulsar aadir, para posteriormente nombrar como momento y 2 niveles y volver a pulsar
aadir. Cuando hemos finalizado debemos pulsar el botn Definir y automticamente aparecer la
siguiente ventana.

Ignacio Martn Tamayo

31

En esa ventana se deben ir seleccionando ordenadamente la combinacin de niveles de la


variable intrasujetos. Tambin permite introducir variables manipuladas entregrupos para los diseos
mixtos y covariables para los Anlisis de Covarianza. Una vez que se han seleccionado los niveles
adecuadamente la salida que proporciona SPSS es similar a la siguiente:
Pruebas de efectos intra-sujetos.
Suma de cuad.
gl
Media
F
Sig.
tipo III
cuadrtica
DOSIS
Esfericidad asumida
10213,233
2
5106,617 133,261 ,000
Greenhouse-Geisser
10213,233
1,595
6404,991 133,261 ,000
Huynh-Feldt
10213,233
1,883
5423,400 133,261 ,000
Lmite-inferior
10213,233
1,000 10213,233 133,261 ,000
Error(DOSIS)
Esfericidad asumida
689,767
18
38,320
Greenhouse-Geisser
689,767
14,351
48,063
Huynh-Feldt
689,767
16,949
40,698
Lmite-inferior
689,767
9,000
76,641
MOMEN
Esfericidad asumida
1,667
1
1,667
,281 ,609
Greenhouse-Geisser
1,667
1,000
1,667
,281 ,609
Huynh-Feldt
1,667
1,000
1,667
,281 ,609
Lmite-inferior
1,667
1,000
1,667
,281 ,609
Error(MOMEN) Esfericidad asumida
53,333
9
5,926
Greenhouse-Geisser
53,333
9,000
5,926
Huynh-Feldt
53,333
9,000
5,926
Lmite-inferior
53,333
9,000
5,926
DOSIS * MOMEN Esfericidad asumida
3,433
2
1,717
,444 ,648
Greenhouse-Geisser
3,433
1,500
2,289
,444 ,595
Huynh-Feldt
3,433
1,733
1,981
,444 ,622
Lmite-inferior
3,433
1,000
3,433
,444 ,522
Error(DOSIS*MO Esfericidad asumida
69,567
18
3,865
MEN)
Greenhouse-Geisser
69,567
13,497
5,154
Huynh-Feldt
69,567
15,596
4,461
Lmite-inferior
69,567
9,000
7,730

Fuente

Como puede comprobarse slo el factor dosis ha tenido efecto significativo sobre la variable
atencin en el componente lineal y cuadrtico.
Como en el caso del procedimiento MLG Factorial general , en este caso tambin disponemos de
diversas opciones similares a las ya indicadas en el apartado anterior. La diferencia ms importante hace
referencia al botn Post hoc, ya que en MLG Medidas repetidas estas pruebas no estn disponibles si no
hay factores entregrupos.

También podría gustarte