Está en la página 1de 11

ANÁLISIS DE LA VARIANZA DE DOS FACTORES

Existen situaciones en que dos factores o variables independientes tienen efecto sobre
una variable dependiente que deseamos investigar. Por ejemplo, si queremos estudiar
los efectos que sobre el rendimiento escolar de los alumnos de E.S.O. tienen el nivel de
ingresos de los padres y el idioma materno. En este caso podríamos analizar los datos
realizando dos análisis de la varianza unidimensionales, uno para cada variable. Sin
embargo tiene grandes ventajas realizar el análisis de forma conjunta mediante un
análisis de la varianza de dos vías. La principal ventaja reside en que este análisis
permite indagar la existencia de una interacción significativa entre ambos factores, cosa
que no puede dilucidarse con el análisis de una vía.

¿Qué es la interacción? Cuando en un experimento, o proceso, el rendimiento medido es


afectado por dos factores, puede ocurrir que el rendimiento no sea solamente la suma de
los efectos de los factores por separado. En este caso se dice que los dos factores
interactuan. Es decir, existen determinadas combinaciones de niveles de los dos factores
que tienen un efecto mayor, o menor, que el cabría esperar de la adicción de los efectos
simples de esos dos niveles. La diferencia entre el rendimiento y la suma de los efectos
de esos dos niveles es la cuantía de la interacción.

De esta forma en un análisis de la varianza de dos vías se contrastan por separado tres
hipótesis nulas independientes:

La hipótesis nula de la falta de efecto del primer factor:

La hipótesis nula de la falta de efecto del segundo factor:

La hipótesis nula de la inexistencia de interacción entre los dos factores:

Interpretación de la interacción

La novedad que nos aporta el ANOVA de dos factores es el contraste de la interacción:


Cuando existe un efecto de interacción entre dos factores, la interpretación de los
efectos principales necesita matizarse. Supongamos que en el ejemplo inicial, el nivel
de ingresos de los padres tiene un efecto significativo sobre el rendimiento de los
alumnos de ESO. De tal forma que a mayor nivel de ingresos se obtiene mayor
rendimiento, pero si este efecto solo aparece, o aparece con mayor intensidad, en
aquellos alumnos cuyo idioma materno es el castellano esto nos indica que existe una
interacción significativa entre el nivel de ingresos y el idioma materno.

Por el contrario si no existiese interacción el efecto del nivel de ingresos se manifestaría


en igual cuantía para todos los grupos, sea cual sea su idioma materno.

En nuestras investigaciones estamos interesados en saber si un factor, por ejemplo el


nivel de ingresos, tiene un efecto sobre la variable dependiente, en nuestro caso el
rendimiento académico, pero también desearemos saber si ese tratamiento es igualmente
efectivo en todos los alumnos o sólo en algunos, siendo menor, o nulo, en otros
alumnos.
José M. Salinas. Tema 5. ANOVA II. 2

Esta posibilidad que nos proporciona el ANOVA de dos factores de detectar si los
tratamientos tienen efectos diferenciales para diferentes tipos de sujetos es
extremadamente importante.

Se dice que existe una interacción entre dos factores si la diferencia entre los efectos de
las categorías o niveles de un factor, medidas por las diferencias entre las medias de
esas categorías, no son constantes a lo largo de todas las categorías del otro factor.
Como vemos en el siguiente ejemplo:

En el siguiente cuadro se presentan las puntuaciones medias en lengua española de un


grupo de alumnos de ESO clasificados según el nivel de ingresos de sus padres y su
idioma materno.

Nivel de ingresos de los padres


Idioma materno Bajo Medio Alto
Castellano 5,25 6 9
Otro 4,75 5 6
Diferencia 0,5 1 3

Como podemos observar existe un efecto del nivel de ingresos, existe un efecto del
idioma materno, pero además existe una interacción porque la diferencia entre los
efectos del idioma materno no permanece constante sino que se incrementa con el nivel
de ingresos. Si representamos gráficamente los datos vemos como la interacción hace
que ambas líneas no sean paralelas

10

0
Bajo Medio Alto

Castellano Otro
José M. Salinas. Tema 5. ANOVA II. 3

Por el contrario, si consideramos las puntuaciones en Matemáticas aunque sigue


existiendo un efecto del nivel de ingresos y un efecto del idioma materno no existe
interacción porque la diferencia entre los efectos del idioma materno permanece
constante para todos los niveles de ingresos.

Nivel de ingresos de los padres


Idioma materno Bajo Medio Alto
Castellano 5,25 6,5 8,5
Otro 4,25 5,5 7,5
Diferencia 1 1 1

Al representar gráficamente estos datos la ausencia de interacción se pone de manifiesto


por el paralelismo de ambas líneas.

10

0
Bajo Medio Alto

Castellano Otro

Modelo de los datos.

En el ANOVA de dos factores cada tratamiento está determinado por el nivel del primer
factor que se aplica que denominaremos i, y por el nivel del segundo factor que
notaremos j. Consideraremos que todas las observaciones del tratamiento ij son una
muestra, independiente de las restantes, que procede de una población Normal de media
 ij y desviación típica  :
xij1 xij 2  xijk  xijn
obviamente se verifica

xijk   ij  ( xijk   ij )

por lo que podemos decir que cada observación es igual a la media de la población de la
que procede, más un residuo
José M. Salinas. Tema 5. ANOVA II. 4

xijk   ij   ijk

Si ahora consideramos la media de todos los tratamientos que tienen el nivel i del
primer factor  i  , la media de todos los tratamientos que tienen el nivel j del segundo
factor   j y la media de todos los tratamientos . Podemos escribir que:

xijk    ( i   )  (  j   )  ( ij   i    j   )   ijk

o de otra forma

xijk     i   j   ij   ijk

donde
i  ( i   ) sería el efecto del nivel i del primer factor

j  (  j   ) sería el efecto del nivel j del segundo factor

 ij  ( ij   i     j   ) sería el efecto de la interacción en el tratamiento ij

Puede comprobarse que el efecto de la interacción es el efecto del tratamiento una vez
que se eliminan los efectos principales de los dos factores

 ij  ( ij   )  ( i   )  (  j   )  ( ij   i    j   )

Si se repasan las condiciones puestas al principio del enunciado de este modelo puede
observarse que implica las tres condiciones clásicas del Análisis de la Varianza:
Independencia, Normalidad y Homogeneidad de la varianza.

Una vez formulado el modelo, podemos establecer las hipótesis nulas que se someten a
prueba en el ANOVA de dos factores.

Para el primer factor la hipótesis nula sería:

H 0 : 1   2     i   

lo cual sería equivalente a contrastar que todos los efectos del primer factor son nulos

H 0 : i  i  ( i   )  0

Para el segundo factor la hipótesis nula sería:

H 0 :  1   2      j   

que es lo mismo que decir que los efectos del segundo factor son cero
José M. Salinas. Tema 5. ANOVA II. 5

H 0 : j  j  (  j   )  0

La hipótesis nula para la interacción sería análogamente que todos los efectos de la
interacción son cero

H 0 : ij  ij  ( ij   i     j   )  0

Estadísticos de contraste

La construcción de los estadísticos de contraste de las hipótesis nulas se hace, al igual


que en el análisis de la varianza de una vía descomponiendo la variabilidad total de los
datos que viene determinada por la suma de los cuadrados de las diferencias a la media,

  x  x
2
SCtotal  i j k ijk

en cuatro componentes que representan la variabilidad atribuible al primer factor, al


segundo factor, a la interacción y a los errores o residuos.

SCtotal  SCA  SCB  SCAB  SCerror

Realizando el cociente entre el cuadrado medio de cada fuente de variación y el


cuadrado medio del error se obtienen los contrastes F de las tres hipótesis nulas
enunciadas anteriormente.

Hoy en día el cálculo de estos estadísticos rara vez se realiza de forma manual. Las
instrucciones para su cálculo por un paquete estadístico se proporcionan en un fichero
separado.

Factores fijos y aleatorios

Se dice que un factor es de efectos fijos cuando los niveles que presenta el factor son
todos los posibles, de tal forma que si se repitiera el estudio volverían a presentarse los
mismos. Por ejemplo, si consideramos, el factor sexo sus niveles serán siempre hombre
y mujer.

En el modelo de los datos los factores de efectos fijos hacen que el efecto del factor

i  ( i   )
sea una constante.

Un factor es de efectos aleatorios si los niveles de ese factor empleados para determinar
los tratamientos son una muestra aleatoria de todos los posibles niveles que puede
presentar el factor. Esto hace que una repetición del experimento sea susceptible de
realizarse con otra muestra distinta de niveles. Ejemplo, si consideramos las
puntuaciones que emiten cinco jueces sobre un conjunto de participantes, es claro que el
factor jueces presenta cinco niveles que no son todos los posibles, sino una muestra. De
igual manera, si construimos tres pruebas de ortografía cada una de ellas con 50
palabras seleccionadas de una base de 30.000 palabras de ortografía dudosa, es obvio
José M. Salinas. Tema 5. ANOVA II. 6

que esas tres pruebas constituyen una muestra del conjunto de todas las pruebas que
podrían formarse.

Los modelos de efectos aleatorios implican que los efectos principales del factor

i  ( i   )

no son constantes, sino una variable aleatoria y que a las suposiciones del Análisis de
Varianza, haya que añadir que los efectos  i se distribuyan, de acuerdo con una
distribución Normal de media cero y desviación típica   N(0,   ), teniendo que ser
independientes los efectos aleatorios  i y los residuos  ijk .

En el modelo de efectos aleatorios la hipótesis nula de los efectos principales difiere de


la del modelo de efectos fijos pasando a ser

H0 :   0

Cuando en un Análisis de Varianza de dos factores uno de ellos sea de efectos fijos y el
otro de efectos aleatorios diremos que tenemos un modelo mixto.

No se hizo referencia a los factores fijos y aleatorios en el Análisis de la Varianza


unifactorial, porque en ese caso el estadístico de contraste es el mismo para ambos
modelos. Por el contrario en el Análisis de la Varianza de dos factores el hecho de que
sean fijos o aleatorios produce pequeños cambios en el cálculo de los estadísticos de
contraste, por lo que la naturaleza de los factores deberá ser tomada en consideración.

ANÁLISIS DE LA VARIANZA MULTIFACTORIAL Y DE MEDIDAS REPETIDAS

Una extensión natural del ANOVA de dos factores son los modelos multifactoriales en
los cuales los tratamientos vienen determinados por tres o más factores. Los principios y
suposiciones son los mismos que en el modelo de dos factores, únicamente hay que
señalar el aumento del número de términos en el modelo de datos y la aparición de
interacciones de orden superior.

Modelo de los datos.

Para reducir las complicaciones de notación describiremos el modelo de los datos para
el caso de tres factores. En esta situación tenemos que los tratamientos están
determinados por las distintas combinaciones de tres factores. Sea i el nivel del primer
factor, j el nivel del segundo y k el del tercero. Entonces consideraremos que todas las
observaciones del tratamiento i j k son una muestra procedente de una población
Normal de media  ijk y desviación típica  que denotaremos

xijk 1 xijk 2  xijkl  xijkn


José M. Salinas. Tema 5. ANOVA II. 7

Para cada observación se verifica

xijkl   ijk  ( xijkl   ijk )

por lo que se considera que cada observación es igual a la media de la población de que
procede, más un residuo que se distribuye Normalmente con media cero y desviación
típica 

xijkl   ijk   ijkl

Teniendo en cuenta las medias  i ,   j  ,   k que son las medias de todos los
tratamientos que tienen el nivel i del primer factor, el j del segundo factor y el k del
tercero, respectivamente y las medias  ij  ,  ik ,   jk que son las medias de todos los
tratamientos con los niveles i j del primer y segundo factor, i k del primero y el tercero
y j k del segundo y tercero. Siendo  la media de todos los tratamientos. Podemos
escribir el modelo como

xijk     i   j   k   ij   ik   jk   ijk   ijk

donde
i  ( i   ) sería el efecto del nivel i del primer factor

j  (  j    ) sería el efecto del nivel j del segundo factor

k  ( k   ) sería el efecto del nivel k del tercer factor


José M. Salinas. Tema 5. ANOVA II. 8

 ij  ( ij    i    j    ) sería el efecto de la interacción entre los niveles i y j.

 ik  ( ik   i   k   ) sería el efecto de la interacción entre los niveles i y k.

 jk  (  jk    j    k   ) sería el efecto de la interacción entre los niveles j y k.

 ijk  ( ijk   ij    ik    jk   i     j    k   ) sería la interacción en el


tratamiento i j k.

Por consiguiente, tendremos siete hipótesis nulas que contrastar. Tres hipótesis nulas de
los efectos principales

H 0 : i  i  ( i   )  0

H 0 : j  j  (  j    )  0

H 0 : k  k  ( k   )  0

Tres hipótesis nulas para las interacciones dobles

H 0 : ij  ij  ( ij    i    j    )  0

H 0 : ik  ik  ( ik   i   k   )  0

H 0 : jk  jk  (  jk    j    k   )  0

Una hipótesis nula para la interacción triple

H 0 : ijk  ijk  ( ijk   ij    ik    jk   i    j    k   )  0

Estadísticos de contraste

La construcción de los estadísticos de contraste de las hipótesis nulas sigue el


procedimiento habitual del análisis de la varianza descomponer la variabilidad total de
los datos que viene determinada por la suma de los cuadrados de las diferencias a la
media,

   x 
2
SC total  i j k l ijkl x

en ocho componentes que representan la variabilidad atribuible a los efectos principales


de los factores, a las interacciones dobles, a la interacción triple y a los errores o
residuos.

SCtotal  SCA  SCB  SCAB  SCAC  SCBC  SCABC  SCerror


José M. Salinas. Tema 5. ANOVA II. 9

Realizando el cociente entre el cuadrado medio de cada fuente de variación y el


cuadrado medio del error se obtienen los contrastes F de las ocho hipótesis nulas
enunciadas anteriormente.

Hoy en día el cálculo de estos estadísticos rara vez se realiza de forma manual. Las
instrucciones para su cálculo por un paquete estadístico se proporcionan en un fichero
separado.

Análisis de la varianza de medidas repetidas

En todos los modelos de Análisis de la Varianza, vistos hasta ahora, cada tratamiento
era aplicado a un grupo diferente de sujetos, de tal forma que las observaciones
recogidas en los distintos tratamientos eran muestras independientes. En este apartado
abordaremos la situación que se produce cuando todos los tratamientos son aplicados al
mismo grupo de personas en diferentes momentos. Es decir, las observaciones serán
medidas realizadas sobre los mismos sujetos que van repitiéndose bajo distintas
condiciones experimentales.

Por ejemplo, supongamos una tarea de reconocimiento de letras que diez alumnos
realizan en condiciones normales, en estado de privación de sueño y tras una ingesta
alcohólica. Tendríamos tres tratamientos que serían las condiciones de realización de la
prueba, y para cada sujeto tendríamos tres medidas. Obviamente en esta situación no
cabe esperar que las observaciones de los distintos tratamientos sean independientes, los
sujetos más hábiles en esta tarea tenderán a obtener mejores puntuaciones en todas las
condiciones que los menos hábiles. Esta situación de trabajar con observaciones
dependientes tiene consecuencias importantes tanto para la eficacia del diseño como
para las suposiciones que subyacen en los tests de significación.

Los diseños de Medidas Repetidas juegan un papel muy importante en los estudios
experimentales de Psicología, ya que ésta trabaja mayoritariamente con personas. Las
diferencias individuales entre los sujetos, anteriores al experimento, se manifiestan en
éste produciendo una elevada variabilidad que puede enmascarar los efectos de los
tratamientos. Si estas diferencias individuales pueden ser separadas del efecto de los
tratamientos y de los errores experimentales la sensibilidad del estudio se incrementará.

El propósito de los estudios de Medidas Repetidas en que el mismo sujeto es observado


bajo todos los tratamientos, es proporcionar un control de las diferencias entre sujetos.
El efecto de un tratamiento en un sujeto se valora por la diferencia entre la medida en
ese tratamiento y la media de ese sujeto en todos los tratamientos. En este sentido cada
individuo sirve como control de él mismo. Como consecuencia de ello la variabilidad
debida a las diferencias entre las medias de los sujetos es valorada como variabilidad
atribuible a las diferencias individuales y eliminada del error experimental.

Modelo de los datos

En el Análisis de la Varianza de Medidas Repetidas consideraremos el siguiente modelo


para cada observación

xij     j   i   ij
José M. Salinas. Tema 5. ANOVA II. 10

donde
 es la media de la población de todas las observaciones

 j  ( j   ) es el efecto del tratamiento j

 i  ( i   ) es el efecto de la persona i

 ij  ( xij   j   i   ) es el residuo

Si el factor es de efectos fijos los efectos de los tratamientos son constantes. Por el
contrario, los efectos de las personas son siempre variables aleatorias que supondremos
que siguen una distribución Normal de media cero y desviación típica   N(0,   ).

Para los residuos que en este caso son el resultado de eliminar del efecto del tratamiento
j sobre la persona i los efectos separados del tratamiento j y la persona i

 ij  ( xij   )  ( j   )  ( i   )  ( xij   j   i   )

Se considera la suposición habitual del Análisis de Varianza de que siguen


distribuciones Normales de media cero y desviación típica común,  , siendo
independientes entre si e independientes de los efectos de las personas  i .

Bajo este modelo de datos, la hipótesis fundamental es la relativa al efecto de los


tratamientos que sería

H 0 : j j  ( j   )  0

Existe una hipótesis nula secundaria que también podemos someter a prueba que hace
referencia a la existencia de diferencias individuales, como este factor es aleatorio la
hipótesis nula sería

H0 :   0

Estadísticos de contraste

Los estadísticos de contraste se determinan descomponiendo la variabilidad total de los


datos que vendría dada por la suma de los cuadrados de las diferencias a la media

  x  x
2
SCtotal ij ij

en dos componentes que son la suma de cuadrados intra personas y la suma de


cuadrados entre personas

SCtotal  SCintra  SCentre


José M. Salinas. Tema 5. ANOVA II. 11

 x  x   x  pi   ij  pi  x 
2 2 2
ij ij ij ij

donde pi es la media de la persona i en los k tratamientos

Ahora bien la variabilidad intra-personas depende de los efectos de los tratamientos y


de los errores, por consiguiente

SCintra  SCtratamientos  SCerror

 x  pi    t  x   ij xij  pi  t j  x 
2 2 2
ij ij ij j

donde t j es la media del tratamiento j en las n personas


Con ,lo que finalmente la descomposición de la variabilidad queda de la forma siguiente

SCtotal  SCtratamientos  SCentre  SCerror

Realizando el cociente entre el cuadrado medio de los tratamientos y el cuadrado medio


del error se obtiene el contraste F para la hipótesis fundamental relativa al efecto de los
tratamientos. El cociente de los cuadrados medios entre personas y error proporciona el
cociente F para la hipótesis secundaria que concierne a las diferencias individuales.

En fichero aparte se dan las instrucciones para realizar los cálculos con el paquete
estadístico SPSS.

También podría gustarte