Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Existen situaciones en que dos factores o variables independientes tienen efecto sobre
una variable dependiente que deseamos investigar. Por ejemplo, si queremos estudiar
los efectos que sobre el rendimiento escolar de los alumnos de E.S.O. tienen el nivel de
ingresos de los padres y el idioma materno. En este caso podríamos analizar los datos
realizando dos análisis de la varianza unidimensionales, uno para cada variable. Sin
embargo tiene grandes ventajas realizar el análisis de forma conjunta mediante un
análisis de la varianza de dos vías. La principal ventaja reside en que este análisis
permite indagar la existencia de una interacción significativa entre ambos factores, cosa
que no puede dilucidarse con el análisis de una vía.
De esta forma en un análisis de la varianza de dos vías se contrastan por separado tres
hipótesis nulas independientes:
Interpretación de la interacción
Esta posibilidad que nos proporciona el ANOVA de dos factores de detectar si los
tratamientos tienen efectos diferenciales para diferentes tipos de sujetos es
extremadamente importante.
Se dice que existe una interacción entre dos factores si la diferencia entre los efectos de
las categorías o niveles de un factor, medidas por las diferencias entre las medias de
esas categorías, no son constantes a lo largo de todas las categorías del otro factor.
Como vemos en el siguiente ejemplo:
Como podemos observar existe un efecto del nivel de ingresos, existe un efecto del
idioma materno, pero además existe una interacción porque la diferencia entre los
efectos del idioma materno no permanece constante sino que se incrementa con el nivel
de ingresos. Si representamos gráficamente los datos vemos como la interacción hace
que ambas líneas no sean paralelas
10
0
Bajo Medio Alto
Castellano Otro
José M. Salinas. Tema 5. ANOVA II. 3
10
0
Bajo Medio Alto
Castellano Otro
En el ANOVA de dos factores cada tratamiento está determinado por el nivel del primer
factor que se aplica que denominaremos i, y por el nivel del segundo factor que
notaremos j. Consideraremos que todas las observaciones del tratamiento ij son una
muestra, independiente de las restantes, que procede de una población Normal de media
ij y desviación típica :
xij1 xij 2 xijk xijn
obviamente se verifica
xijk ij ( xijk ij )
por lo que podemos decir que cada observación es igual a la media de la población de la
que procede, más un residuo
José M. Salinas. Tema 5. ANOVA II. 4
xijk ij ijk
Si ahora consideramos la media de todos los tratamientos que tienen el nivel i del
primer factor i , la media de todos los tratamientos que tienen el nivel j del segundo
factor j y la media de todos los tratamientos . Podemos escribir que:
xijk ( i ) ( j ) ( ij i j ) ijk
o de otra forma
xijk i j ij ijk
donde
i ( i ) sería el efecto del nivel i del primer factor
Puede comprobarse que el efecto de la interacción es el efecto del tratamiento una vez
que se eliminan los efectos principales de los dos factores
ij ( ij ) ( i ) ( j ) ( ij i j )
Si se repasan las condiciones puestas al principio del enunciado de este modelo puede
observarse que implica las tres condiciones clásicas del Análisis de la Varianza:
Independencia, Normalidad y Homogeneidad de la varianza.
Una vez formulado el modelo, podemos establecer las hipótesis nulas que se someten a
prueba en el ANOVA de dos factores.
H 0 : 1 2 i
lo cual sería equivalente a contrastar que todos los efectos del primer factor son nulos
H 0 : i i ( i ) 0
H 0 : 1 2 j
que es lo mismo que decir que los efectos del segundo factor son cero
José M. Salinas. Tema 5. ANOVA II. 5
H 0 : j j ( j ) 0
La hipótesis nula para la interacción sería análogamente que todos los efectos de la
interacción son cero
H 0 : ij ij ( ij i j ) 0
Estadísticos de contraste
x x
2
SCtotal i j k ijk
Hoy en día el cálculo de estos estadísticos rara vez se realiza de forma manual. Las
instrucciones para su cálculo por un paquete estadístico se proporcionan en un fichero
separado.
Se dice que un factor es de efectos fijos cuando los niveles que presenta el factor son
todos los posibles, de tal forma que si se repitiera el estudio volverían a presentarse los
mismos. Por ejemplo, si consideramos, el factor sexo sus niveles serán siempre hombre
y mujer.
En el modelo de los datos los factores de efectos fijos hacen que el efecto del factor
i ( i )
sea una constante.
Un factor es de efectos aleatorios si los niveles de ese factor empleados para determinar
los tratamientos son una muestra aleatoria de todos los posibles niveles que puede
presentar el factor. Esto hace que una repetición del experimento sea susceptible de
realizarse con otra muestra distinta de niveles. Ejemplo, si consideramos las
puntuaciones que emiten cinco jueces sobre un conjunto de participantes, es claro que el
factor jueces presenta cinco niveles que no son todos los posibles, sino una muestra. De
igual manera, si construimos tres pruebas de ortografía cada una de ellas con 50
palabras seleccionadas de una base de 30.000 palabras de ortografía dudosa, es obvio
José M. Salinas. Tema 5. ANOVA II. 6
que esas tres pruebas constituyen una muestra del conjunto de todas las pruebas que
podrían formarse.
Los modelos de efectos aleatorios implican que los efectos principales del factor
i ( i )
no son constantes, sino una variable aleatoria y que a las suposiciones del Análisis de
Varianza, haya que añadir que los efectos i se distribuyan, de acuerdo con una
distribución Normal de media cero y desviación típica N(0, ), teniendo que ser
independientes los efectos aleatorios i y los residuos ijk .
H0 : 0
Cuando en un Análisis de Varianza de dos factores uno de ellos sea de efectos fijos y el
otro de efectos aleatorios diremos que tenemos un modelo mixto.
Una extensión natural del ANOVA de dos factores son los modelos multifactoriales en
los cuales los tratamientos vienen determinados por tres o más factores. Los principios y
suposiciones son los mismos que en el modelo de dos factores, únicamente hay que
señalar el aumento del número de términos en el modelo de datos y la aparición de
interacciones de orden superior.
Para reducir las complicaciones de notación describiremos el modelo de los datos para
el caso de tres factores. En esta situación tenemos que los tratamientos están
determinados por las distintas combinaciones de tres factores. Sea i el nivel del primer
factor, j el nivel del segundo y k el del tercero. Entonces consideraremos que todas las
observaciones del tratamiento i j k son una muestra procedente de una población
Normal de media ijk y desviación típica que denotaremos
por lo que se considera que cada observación es igual a la media de la población de que
procede, más un residuo que se distribuye Normalmente con media cero y desviación
típica
Teniendo en cuenta las medias i , j , k que son las medias de todos los
tratamientos que tienen el nivel i del primer factor, el j del segundo factor y el k del
tercero, respectivamente y las medias ij , ik , jk que son las medias de todos los
tratamientos con los niveles i j del primer y segundo factor, i k del primero y el tercero
y j k del segundo y tercero. Siendo la media de todos los tratamientos. Podemos
escribir el modelo como
donde
i ( i ) sería el efecto del nivel i del primer factor
Por consiguiente, tendremos siete hipótesis nulas que contrastar. Tres hipótesis nulas de
los efectos principales
H 0 : i i ( i ) 0
H 0 : j j ( j ) 0
H 0 : k k ( k ) 0
H 0 : ij ij ( ij i j ) 0
H 0 : jk jk ( jk j k ) 0
Estadísticos de contraste
x
2
SC total i j k l ijkl x
Hoy en día el cálculo de estos estadísticos rara vez se realiza de forma manual. Las
instrucciones para su cálculo por un paquete estadístico se proporcionan en un fichero
separado.
En todos los modelos de Análisis de la Varianza, vistos hasta ahora, cada tratamiento
era aplicado a un grupo diferente de sujetos, de tal forma que las observaciones
recogidas en los distintos tratamientos eran muestras independientes. En este apartado
abordaremos la situación que se produce cuando todos los tratamientos son aplicados al
mismo grupo de personas en diferentes momentos. Es decir, las observaciones serán
medidas realizadas sobre los mismos sujetos que van repitiéndose bajo distintas
condiciones experimentales.
Por ejemplo, supongamos una tarea de reconocimiento de letras que diez alumnos
realizan en condiciones normales, en estado de privación de sueño y tras una ingesta
alcohólica. Tendríamos tres tratamientos que serían las condiciones de realización de la
prueba, y para cada sujeto tendríamos tres medidas. Obviamente en esta situación no
cabe esperar que las observaciones de los distintos tratamientos sean independientes, los
sujetos más hábiles en esta tarea tenderán a obtener mejores puntuaciones en todas las
condiciones que los menos hábiles. Esta situación de trabajar con observaciones
dependientes tiene consecuencias importantes tanto para la eficacia del diseño como
para las suposiciones que subyacen en los tests de significación.
Los diseños de Medidas Repetidas juegan un papel muy importante en los estudios
experimentales de Psicología, ya que ésta trabaja mayoritariamente con personas. Las
diferencias individuales entre los sujetos, anteriores al experimento, se manifiestan en
éste produciendo una elevada variabilidad que puede enmascarar los efectos de los
tratamientos. Si estas diferencias individuales pueden ser separadas del efecto de los
tratamientos y de los errores experimentales la sensibilidad del estudio se incrementará.
xij j i ij
José M. Salinas. Tema 5. ANOVA II. 10
donde
es la media de la población de todas las observaciones
i ( i ) es el efecto de la persona i
ij ( xij j i ) es el residuo
Si el factor es de efectos fijos los efectos de los tratamientos son constantes. Por el
contrario, los efectos de las personas son siempre variables aleatorias que supondremos
que siguen una distribución Normal de media cero y desviación típica N(0, ).
Para los residuos que en este caso son el resultado de eliminar del efecto del tratamiento
j sobre la persona i los efectos separados del tratamiento j y la persona i
ij ( xij ) ( j ) ( i ) ( xij j i )
H 0 : j j ( j ) 0
Existe una hipótesis nula secundaria que también podemos someter a prueba que hace
referencia a la existencia de diferencias individuales, como este factor es aleatorio la
hipótesis nula sería
H0 : 0
Estadísticos de contraste
x x
2
SCtotal ij ij
x x x pi ij pi x
2 2 2
ij ij ij ij
x pi t x ij xij pi t j x
2 2 2
ij ij ij j
En fichero aparte se dan las instrucciones para realizar los cálculos con el paquete
estadístico SPSS.