Está en la página 1de 30

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

Pedro Morales Vallejo Universidad Pontificia Comillas Facultad de Ciencias Humanas y Sociales (ltima revisin: 2 de Diciembre, 2009)

ndice
1. Planteamiento general y conceptos previos......................................................... 1.1. Clasificacin de los sujetos en dos categoras ............................................. 1.2. Qu pretendemos comprobar ........................................................................ 1.3. Importancia de la interaccin....................................................................... 1.4. Caractersticas de la muestra ....................................................................... 1.5. Nmero de sujetos en cada clasificacin ...................................................... 1.5.1. Nmero idntico de sujetos en cada clasificacin.............................. 1.5.2. El nmero de sujetos en trminos absolutos ...................................... 1.6. Importancia del tipo de categoras de clasificacin..................................... 2. Mtodo................................................................................................................. 2.1. Disposicin de los datos ............................................................................... 2.2. Visin global del proceso ............................................................................. 2.3. Clculos previos............................................................................................ 2.4. Clculos propios del anlisis de varianza ..................................................... 2.4.1. Sumas de Cuadrados ........................................................................... 2.4.2. Grados de libertad ............................................................................... 2.4.3. Varianzas o Cuadrados Medios........................................................... 2.4.4. Comparacin o contraste de varianzas (razn F) ................................ 2.4.5. Resultados finales: tabla de resultados................................................ 2.4.6. Interpretacin ...................................................................................... 2.4.7. Resumen del procedimiento ................................................................ 3. Anlisis adicionales ............................................................................................. 3.1. Coeficientes de asociacin............................................................................ 3.1.1. Coeficiente 2 ..................................................................................... 3.1.2. Coeficiente 2 ...................................................................................... 3.2. Contrastes posteriores ................................................................................... 3.2.1. Contraste entre las medias de niveles del mismo factor ...................... 3.2.2. Contraste entre las medias dentro del mismo nivel de un factor (cuando la interaccin es significativa)................................................. 3.3. El tamao del efecto en los diseos factoriales ............................................ 3.3.1. Cuando el factor secundario es una variable manipulada..................... 3.3.2. Cuando el factor secundario es una caracterstica natural de la poblacin .................................................................................... 4. La representacin grfica de los resultados como ayuda a la interpretacin en los diseos factoriales ....................................................... 5. Anlisis de varianza para diseos factoriales en EXCEL y SPSS ....................... 6. Referencias bibliogrficas .................................................................................... Anexo. Anlisis de Varianza (diseos factoriales) en Internet ................................ 3 3 3 4 5 5 6 7 7 8 8 9 10 11 11 12 12 13 14 14 15 15 16 16 17 18 19 22 24 24 24 26 28 29 29

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

1. Planteamiento general y conceptos previos 1. 1. Clasificacin de los sujetos en dos categoras La disposicin de los datos al clasificar a los sujetos es importante, no slo como ilustracin, sino porque contribuye a entender lo que estamos haciendo. Se clasifican los sujetos segn dos variables o categoras de clasificacin (que suelen denominarse factores) en un cuadro de doble entrada. En el ejemplo sugerido en la tabla 1 los factores son a) actividades didcticas y b) la duracin de estas actividades. La variable dependiente (la que medimos a los sujetos) sera en este caso nivel de aprendizaje. Los factores o criterios de clasificacin pueden ser ms de dos, pero en la presentacin del mtodo nos limitamos a dos nada ms1. Cada uno de los dos factores est dividido en dos o ms niveles o subcategoras. Dada la disposicin de los datos, tambin suele hablarse de filas y columnas (en este caso hay tantas filas y columnas cuantos niveles tengan los factores). Un ejemplo tpico podra ser el puesto en la tabla 1; clasificamos a los sujetos segn dos criterios: a) Factor A: segn hayan participado en una determinada actividad. Este factor tiene dos niveles; suponemos que se trata de dos actividades distintas, o dos variantes de la misma actividad. b) Factor B: segn el tiempo que haya durado esta actividad; en este factor de duracin suponemos tres niveles o duraciones distintas. Factor A (actividades) A1 A2 Factor B (duracin) 20 minutos B1 40 minutos B2 una hora B3 Tabla 1 En cada clasificacin tenemos el mismo nmero de sujetos. Con esta misma disposicin de los datos se pueden visualizar muchos posibles diseos experimentales utilizando otros criterios de clasificacin. 1.2. Qu pretendemos comprobar Lo que pretendemos comprobar es en qu grado las diferencias que encontremos en la variable dependiente (la que hemos medido, en este caso puede ser rendimiento escolar) se explican por las diferencias entre las actividades, o por las diferencias entre los tiempos, o por alguna combinacin actividad-duracin. Analizamos por lo tanto tres posibles fuentes de diferencias:

1 Con slo dos criterios de clasificacin, el planteamiento ms frecuente, el mtodo que proponemos es muy sencillo, sin ms ayuda que una calculadora con la media y desviacin tpica programadas; adems en procesos de aprendizaje ayuda a entender lo que estamos haciendo. Con ms de dos criterios de clasificacin se puede adaptar y utilizar el mismo procedimiento pero es preferible acudir directamente a programas de ordenador; los resultados son fciles de interpretar si se ha aprendido antes a resolver e interpretar el planteamiento con dos criterios de clasificacin. El anlisis de varianza factorial se puede tambin hacer con EXCEL, SPSS y programas disponibles en Internet (mencionamos algunos en el Anexo).

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

a) Una actividad puede ser ms eficaz que otra, independientemente de su duracin, b) Una duracin puede ser ms eficaz que otra en cualquier actividad, c) Una actividad puede ser ms eficaz que otra, pero solamente si dura en determinado tiempo. Podemos formular por lo tanto tres Hiptesis Nulas (formuladas en referencia al caso planteado en la tabla 1): 1 Las dos muestras que han seguido actividades distintas proceden de la misma poblacin (no hay diferencia significativa entre las actividades; no se aprende ms con una que con otra). 2 Las tres muestras que han trabajado durante tiempos de distinta duracin proceden de la misma poblacin (no hay diferencia significativa entre las duraciones). 3 Las seis muestras que han trabajado en actividades distintas y con duraciones distintas proceden de la misma poblacin (no hay diferencias significativas entre los diversos subgrupos en los que se combinan actividad-duracin). Tendremos que calcular tres varianzas que corresponden a las tres fuentes de diferencias, y una cuarta varianza que expresa la variabilidad normal o aleatoria, y que nos servir como trmino de comparacin de las otras varianzas (denominador de la razn F). Consecuentemente al final del proceso tendremos tres razones F que nos permitirn aceptar o no aceptar las tres Hiptesis Nulas. Como en el anlisis de varianza en general, lo que verificamos es la relacin que puede haber entre la variable dependiente (la caracterstica de los sujetos que hemos medido) y los criterios que nos han servido para clasificar a los sujetos. Una manera posible de analizar estos datos sera considerar que tenemos 6 grupos de muestras independientes y utilizar un anlisis de varianza de una clasificacin simple para varias muestras independientes. Pero en este caso, si obtuvisemos una F significativa que nos indicara que hay diferencias entre los grupos, no sabramos si atribuirla a que las actividades son distintas, o a que las distintas duraciones producen resultados distintos, o a que determinadas combinaciones actividad-duracin son ms eficaces que otras. Los resultados podran ser ambiguos o difciles de interpretar con precisin. 1.3. Importancia de la interaccin Otra manera de enfocar la solucin es hacer dos anlisis de varianza: uno para comparar las dos actividades (nos bastara en este ejemplo un simple contraste de medias ya que se trata solamente de dos actividades) y otro para comparar las tres duraciones. Pero nos quedaramos sin saber la importancia de la relacin actividad-duracin. Esta relacin es la que denominamos genricamente interaccin. En nuestro ejemplo puede ser que una actividad sea preferible, produzca mejores resultados, pero solamente si tiene una duracin ptima. En general en la investigacin educacional o psicolgica la interaccin puede tener mucha importancia. Con frecuencia lo que tenemos es: 1. Un factor denominado principal que es el objeto principal de nuestro estudio (en nuestro ejemplo distintas actividades); 2. Otro factor cuyos niveles suelen ser circunstancias o condiciones que pueden afectar a los niveles del factor principal; por ejemplo duraciones distintas, con o sin alguna
Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

circunstancia, distintas variantes, tipos de sujetos, dosis; tambin puede tratarse de agrupaciones naturales de lo sujetos (por ejemplo gnero, lugar de procedencia, grupo tnico, etc.). Un mtodo (experiencia, actividad, terapia, etc.) puede ser mejor en unas circunstancias, pero en otras puede ser tan bueno o malo como los dems (circunstancias posibles que pueden modificar los resultados en la evaluacin de unas actividades: medios auxiliares, tiempo dedicado, hora del da o poca del ao, etc.). Podemos pensar que de manera anloga algunas medicinas son mejores para unos pacientes que para otros, o pueden estar contraindicadas en determinadas personas, o pueden ser incompatibles con otros medicamentos se trata tambin de interacciones: los efectos de un tratamiento pueden depender del nivel de una segunda variable. Podemos pensar en semillas de una planta: una variedad puede producir una mayor produccin pero solamente en un determinado tipo de suelo, o con un determinado fertilizante, o una determinada cantidad de riego o de exposicin solar, etc.2 Es fcil ver que este planteamiento tiene una especial utilidad precisamente porque permite analizar las interacciones. Tambin es verdad que cuando la interaccin es significativa la interpretacin puede ser menos simple; hay que matizar ms las conclusiones. 1.4. Caractersticas de la muestra a) En este planteamiento todos los sujetos son distintos Se trata por lo tanto de muestras independientes; no hay sujetos repetidos en ms de un grupo (otras variantes de este mismo modelo, con los sujetos clasificados en dos o ms factores, son vlidas para muestras relacionadas, pero no es ste el caso que presentamos ahora). b) En un diseo experimental en sentido propio los sujetos deben ser asignados aleatoriamente a las distintas condiciones experimentales para poder controlar otras variables. Los sujetos, por ejemplo alumnos, han sido asignados aleatoriamente a cada uno de los subgrupos para poder generalizar los resultados (controlamos de esta manera otras variables extraas que pueden influir en la variable dependiente que hemos medido). Si no hay asignacin aleatoria no se trata de un diseo experimental en sentido propio. La aleatoriedad permitir generalizar las conclusiones (validez externa) a otros sujetos de la misma poblacin (representados por esta muestra) con una mayor seguridad. Si no hay asignacin aleatoria de los sujetos a los grupos, caben otros modos de controlar variables con otros diseos (con sujetos igualados en variables importantes, o utilizando diseos ms complejos). En muchas investigaciones (o simplemente en estudios experimentales) la no aleatoriedad es casi la norma (por su facilidad: se trabaja con grupos hechos o disponibles). Estos anlisis (que no responden a un diseo experimental en sentido propio) son tambin tiles, pero hay que preguntarse siempre qu otras cosas pueden estar influyendo en la variable dependiente, y tener ms cautela en la interpretacin y sobre todo en la extrapolacin de los resultados. 1.5. Nmero de sujetos en cada clasificacin Con respecto al nmero de sujetos hay que distinguir dos cuestiones distintas, a) la conveniencia de disponer de un nmero idntico de sujetos en cada clasificacin, y b) el nmero de sujetos en trminos absolutos en cada clasificacin (en cada celda).
2 Precisamente este tipo de diseos tuvieron su origen en la investigacin en el campo de experimentacin agrcola y de la biologa en general.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

1.5.1. Nmero idntico de sujetos en cada clasificacin En este modelo de anlisis de varianza debe de haber el mismo nmero de sujetos en cada clasificacin; el mtodo es as ms potente aunque no se cumplan los presupuestos de normalidad en la poblacin y de homogeneidad de varianzas. El mtodo resulta adems mucho ms sencillo y tal como lo explicamos aqu suponemos siempre que el nmero de sujetos es el mismo. El distinto nmero de sujetos en cada clasificacin deja de ser problemtico cuando las frecuencias en cada clasificacin son proporcionales. Nmeros proporcionales quiere decir lo mismo que las frecuencias tericas o esperadas en los planteamientos de ji cuadrado (aun as advertimos que el procedimiento que expondremos supone un idntico nmero de sujetos en cada clasificacin; con grupos de idntico tamao el procedimiento es adems ms sencillo). Cuando el nmero de sujetos es desigual, los procedimientos sugeridos para igualar el nmero de sujetos son varios: 1 Descartar sujetos aleatoriamente. Con muestras razonablemente grandes la recomendacin habitual es descartar aleatoriamente datos para obtener frecuencias iguales3 (tambin se pueden descartar observaciones para conseguir frecuencias proporcionales). Esta recomendacin es aplicable en principio a cualquier planteamiento de anlisis de varianza porque, como ya hemos indicado, con un nmero idntico de sujetos en cada grupo pierde importancia la violacin de normalidad y de homogeneidad de varianzas. El desechar sujetos debe hacerse de manera estrictamente aleatoria; la condicin que indican los autores mencionados es que el nmero mnimo de sujetos por celda no sea inferior a 10, ms o menos. 2 Estimar las puntuaciones que faltan. Si en algn caso falta algn sujeto en una celda (es normal la prdida de sujetos en planteamientos experimentales) se pueden estimar las puntuaciones que faltan (missing scores) poniendo en su lugar la media de la celda; esta prctica no afecta apenas a los resultados si los sujetos por celda son al menos 10. Con este procedimiento se pueden estimar entre un 10 y un 25% de los datos.4 3 Utilizar las medias Si utilizamos las medias de cada subgrupo en vez de las puntuaciones individuales, tendremos en cada clasificacin n = 1, y tambin se puede llevar a cabo este anlisis de varianza (diseos factoriales) con un solo sujeto en cada clasificacin. En principio este tipo de solucin no es deseable porque supone mucha prdida de informacin, pero tampoco conviene descartar esta posibilidad porque puede tener su inters en s misma. Al tratar de las variantes de los diseos factoriales trataremos este caso especfico en el que podemos utilizar medias (y consecuentemente, n = 1 en cada celda) en vez de puntuaciones individuales. En este caso el procedimiento viene a ser el mismo que el anlisis de vainas para muestrs relacionadas.

3 Por ejemplo Glass y Stanley (1974:439); Escotet (1980:84-85); Linton, Gallo y Logan (1975:131). 4 Linton, Gallo y Logan (1975:131). Cuando los dos factores tienen idntico nmero de niveles (como en el diseo denominado cuadrado latino que no explicamos aqu) hay una frmula especfica para estimar el valor de las puntuaciones que nos faltan; puede verse en Tejedor (1984:236).

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

1.5.2. Nmero de sujetos en trminos absolutos El nmero de sujetos necesario (o conveniente) en cada clasificacin depende de varias variables. Nos referimos a tablas nxn (dos criterios de clasificacin). En trminos generales necesitaremos ms sujetos a) cuando los niveles de cada factor son menos (necesitamos ms sujetos en tablas 2x2 que en tablas 4x4) y b) la magnitud de las diferencias en la que estamos interesados; si queremos detectar diferencias pequeas nos harn falta muchos ms sujetos que si slo estamos interesados en diferencias grandes. Como criterio orientador, y si se trata de detectar diferencias entre moderadas y grandes (ciertamente no pequeas) podemos pensar en el nmero de sujetos en cada clasificacin que figura en la tabla 2. Magnitud de la tabla 2x2 2x3 2x4 3x3 3x4 4x4 Tabla 2 Para detectar con seguridad diferencias pequeas (y por lo general de menor inters) son necesarios muchos ms sujetos5. 1.6. Importancia del tipo de categoras de clasificacin Tratando de diseos factoriales es importante recordar que las categoras de clasificacin (variables independientes) pueden ser: a) Fijas (escogidas segn criterio del investigador), b) Aleatorias (escogidas aleatoriamente de una poblacin mayor); c) Mixtas (una categora fija y otra aleatoria). Del hecho de que las categoras sean fijas o aleatorias: 1. No depende el mtodo que vamos a seguir, que es el mismo; 2. S depende la generalizacin de las conclusiones, que ser mayor con categoras aleatorias. Con categoras fijas, las conclusiones son aplicables en principio a las categoras empleadas. 3. S va a depender el denominador de la razn F empleado en cada caso, como veremos despus (en la tabla 4). En el caso de categoras fijas (el ms frecuente) el denominador va a ser siempre el mismo que ya hemos visto en el anlisis de varianza para varias muestras independientes (es decir, los cuadrados medios dentro de los grupos), por lo que esta distincin entre tipos de categoras no es en principio especialmente importante. Se trata sin embargo de conceptos que conviene recordar y que a la vez sugieren posibilidades de investigacin. En investigacin educacional (y de otro tipo) podemos tener categoras aleatorias si tenemos, como factor o Nmero de sujetos entre 13 y 32 entre 11 y 26 entre 9 y 22 entre 7 y 18 entre 6 y 15 entre 5 y 12

5 El nmero de sujetos en cada clasificacin lo tratamos en el anexo VI y tambin en el documento Tamao de la muestra: Cuntos sujetos necesitamos? http://www.upco.es/personal/peter/investigacion/Tama%F1oMuestra.pdf. Estos criterios orientadores estn adaptados de las extensas tablas de Kirk (1995:401 y tabla E.15).

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

categora de clasificacin, centros, aulas, profesores, etc., seleccionados aleatoriamente de una poblacin mayor. Es importante caer en la cuenta que son las categoras de clasificacin, y no los sujetos, las que pueden ser o no ser escogidas aleatoriamente. Los sujetos, cuyos resultados (variable dependiente) se van a analizar, deben asignarse aleatoriamente a los diversos subgrupos si se pretende que el diseo se aproxime ms a lo experimental. Con muestras aleatorias es ms legtimo generalizar las conclusiones a la poblacin porque as se controlan otras variables desconocidas que podran contaminar o explicar los resultados. 2. Mtodo 2.1. Disposicin de los datos En el ejemplo que nos va a servir para exponer el mtodo6 tenemos dos factores (tabla 3): 1. Factor A (mtodos) dividido en tres niveles (tres variantes metodolgicas). 2. Factor B (profesores) dividido en cuatro niveles (cuatro profesores). En la tabla 3 aparecen los datos de los sujetos segn pertenezcan a un profesor (B1, B2, B3 y B4) y a un mtodo determinado (A1, A2 y A3). En este hipottico caso consideramos que ambas categoras son fijas: los mtodos han sido escogidos con criterios lgicos y los profesores suponemos que son simplemente los que estaban disponibles para participar en una investigacin; no han sido escogidos aleatoriamente de una poblacin mayor de profesores. Tenemos por lo tanto 12 combinaciones profesor-mtodo. En cada combinacin hay cinco alumnos Es conveniente disponer los datos con claridad, en un cuadro de doble entrada segn los dos criterios de clasificacin, en el que aparezcan las puntuaciones directas de todos los sujetos, tal como aparece en la tabla 3. Incluso haciendo todos los clculos con un programa de ordenador, es til tener in mente, en ste y otros modelos de anlisis de varianza, cmo se disponen los datos.

6 Los datos los tomamos del ejemplo que presentan Guilford y Fruchter (1973) para explicar este modelo de anlisis de varianza (el procedimiento que seguimos aqu es distinto, semejante a los ya vistos); modificamos la designacin de las variables para utilizar trminos que nos resultan ms familiares (mtodos y profesores).

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

profesores (factor B) Profesor B1 Media desviacin

A1 6 4 2 6 2 MA1B1 = 4 1.789 8 3 7 5 2 MA1B2 = 5 2.280 7 6 9 8 5 MA1B3 = 7 1.414 9 6 8 8 9 MA1B4 = 8 1.095 MA1 = 6

Profesor B2 Media desviacin

Profesor B3 Media desviacin

Profesor B4 Media desviacin Medias de los mtodos (A)

mtodos (factor A) A2 4 1 5 2 3 MA2B1 = 3 1.414 6 6 2 3 8 MA2B2 = 5 2.191 9 4 8 4 5 MA2B3 = 6 2.098 7 8 4 7 4 MA2B4 = 6 1.673 MA2 = 5

A3 4 2 2 1 1 MA3B1 = 2 1.095 3 1 1 2 3 MA3B2 = 2 .894 6 4 3 8 4 MA3B3 = 5 1.789 6 5 7 9 8 MA3B4 = 7 1.414 MA3 = 4

Medias de B

MB1 = 3

MB2= 4

MB3 = 6

MB4 = 7

Media y total Mt = 5 t = 2.4966

Tabla 3 2.2. Visin global del proceso Los clculos que vamos a hacer los dividimos en tres tipos: clculos previos, anlisis de varianza en sentido propio y anlisis complementarios. 1 Clculos previos Van a ser los mismos que en otros procedimientos anlogos (medias, desviaciones, varianza de medias) El clculo de las desviaciones tpicas de las medias puede parecer poco usual, pero ya hemos visto que simplifica mucho las operaciones y ahorra tiempo si no se utiliza directamente un programa de ordenador. Ya hemos indicado adems en otra ocasin que propiamente no se trata de calcular desviaciones o varianzas de medias, sino de todos los sujetos, pero asignndoles como puntuacin individual la media de su grupo; como los grupos son de idntico tamao basta calcular la desviacin de las medias. Estos clculos se hacen con rapidez con una calculadora corriente con programacin estadstica o utilizando una hoja de clculo.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

10

2 Clculos especficos del anlisis de varianza. A partir de los clculos precedentes (desviaciones tpicas de medias) se calculan con facilidad las Sumas de Cuadrados, que suele ser lo ms laborioso en el anlisis de varianza, y el resto de las operaciones. 3 Anlisis complementarios. Frecuentemente van a ser coeficientes de asociacin para ver la importancia relativa de las distintas fuentes de varianza; tambin podemos hacer los contrastes posteriores que resulten de inters (con sus correspondientes tamaos del efecto). Desde el comienzo debemos tener a la vista la tabla de resultados (tabla 5), que es semejante a las que encontramos en otros modelos de anlisis de varianza. Ms adelante presentamos un resumen de todo el procedimiento de anlisis (tabla 6), y puede resultar til verlo desde el principio, ya que es semejante a otros procedimientos de anlisis de varianza con los que ya estamos familiarizados. Aunque vamos a explicar el proceso de manera muy pormenorizada, se puede ver de un golpe de vista observando la tabla 4 (datos y clculos previos ya hechos) y la tabla 6 (tabla de resultados con las frmulas incluidas); estas dos tablas pueden ser suficientes, como referencia, para llevar a cabo todo el proceso. El proceso completo, lo que vamos a hacer o podemos hacer, lo sintetizamos de esta manera: 1. Anlisis de varianza propiamente dicho, que nos va decir qu fuentes de variacin son estadsticamente significativas (razones F). 2. Coeficientes del tipo 2 o 2 que nos van a permitir apreciar la relevancia e importancia prctica de los resultados. 3. Representacin grfica de los resultados como ayuda a la interpretacin; ya veremos cmo hacerla. 4. Contrastes posteriores en el caso de que sean necesarios o nos parezcan convenientes, y el tamao del efecto al comparar dos medias entre s.. 5. Interpretacin global de los resultados, incluyendo valoraciones e interpretaciones cualitativas, conclusiones, etc. 2.3. Clculos previos Estos clculos previos facilitan los clculos de las Sumas de Cuadrados. Se trata simplemente del clculo de medias y desviaciones tpicas (suponemos que estos clculos se hacen al menos con calculadora programada. 1 Clculo de medias y desviaciones En la tabla 3 tenemos ya calculadas estas medias y desviaciones: 1) Media y desviacin de cada uno de los subgrupos (de las 12 combinaciones AB) 2) Media de cada columna (tres medias; mtodos, factor A) 3) Media de cada fila (cuatro medias; profesores, factor B) 4) Media y desviacin de los totales (de los 60 datos)

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

11

La desviacin tpica de todos los datos (de N) en realidad no nos es necesaria; es til para calcular la suma de cuadrados total, que es igual a la suma de las otras sumas de cuadrados. Esta suma de cuadrados total nos permite comprobar que las otra sumas de cuadrados estn bien hechas. La media total (de N = 60; media de las medias de A o de B) tampoco nos es necesaria; es til si vamos a calcular la desviacin tpica de los totales siguiendo el procedimiento explicado en el Anexo III. 2 Clculo de varianzas de medias Estas varianzas (calculadas dividiendo por N, no por N-1) nos van a simplificar el clculo de las sumas de cuadrados (en realidad ya sabemos que se trata de varianzas calculadas en toda la muestra, pero asignando a cada sujeto no la puntuacin obtenida sino la media de su grupo; al tratarse de grupos de idntico tamao nos basta calcular las varianzas de las medias).
2 1) Varianza de las medias de los niveles del factor A 2 MA = .816 = (mtodos, tres medias): 2 2) Varianza de las medias de los niveles del factor B 2 MB = 1.581 = (profesores, cuatro medias):

0.8858 2.50

2 3) Varianza de las medias de todas las combinaciones AxB 2 MAxB = 1.871 = 3.50 (doce medias)

Si tenemos desde el principio una visin global del proceso, podemos ir directamente al clculo de las Sumas de Cuadrados, que veremos enseguida. Los resultados se pueden ir poniendo directamente en la tabla de resultados (tabla 5). En casi todos los casos se trata de multiplicar las varianzas de las series de medias por el nmero total (N) de sujetos. 2.4. Clculos propios del anlisis de varianza 2.4.1. Sumas de Cuadrados (SC) A partir de los datos que ya tenemos vamos a hacer todos los clculos del anlisis de varianza que aparecern en la tabla 5 (tabla de resultados), pero que iremos presentando por partes. En la prctica, y segn vamos calculando las varianzas necesarias, podemos ir directamente a la tabla de resultados, pues las operaciones que vamos a hacer son muy sencillas (resumidas en la tabla 6). Para calcular las diversas varianzas (o Cuadrados Medios, CM) necesitamos calcular el numerador (o Suma de Cuadrados) y el denominador (o Grados de Libertad, gl). Las Sumas de Cuadrados las calculamos multiplicando las varianzas (las desviaciones ya calculadas elevadas al cuadrado) por el nmero total de sujetos, ya que todos ellos contribuyen a todas las varianzas (en este caso N = 60): Sumas de Cuadrados (o numerador) correspondiente a la varianza de: 1. El total 2. Factor A (mtodos) 3. Factor B (profesores) SCt = N t
2

= (60)(2.4966)2 = = (60)(.816)2 = = (60)(1.581)2 =

374 40 150

SCA= N 2 A SCB = N 2 B

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

12

4. Interaccin entre los dos factores, o variabilidad (diferencias en los resultados) debida a las diversas combinaciones entre profesores y mtodos y que simbolizamos como AxB, SCAxB = N AxB - (SCA+ SCB)
2

= (60)(1.871)2 - (150 + 40) =

20

5. Dentro de los grupos, o residual; variabilidad dentro de los 12 subgrupos una vez eliminada la variabilidad debida a los mtodos, a los profesores y a la interaccin entre mtodos y profesores. Esta varianza residual es la varianza dentro de los grupos (de todas las combinaciones AB). Podemos calcularla de dos maneras: 1) A partir de la suma de cuadrados del total SCdentro = SCt - (SCA + SCB + SCAxB) = 374 - (150 + 40 + 20) = 164 2) Esta suma de cuadrados dentro de los grupos tambin se puede calcular directamente, y puede servir de comprobacin, a partir de las varianzas dentro de los grupos (12 en este ejemplo) si las hemos calculado previamente7: se suman y se multiplica esta suma por el nmero de sujetos que hay en cada grupo:
2 2 SCdentro= n( 1 + 2 2 + n )

Las frmulas para calcular las Sumas de Cuadrados (o numeradores de las varianzas) estn puestas tambin en la tabla 6. Podemos comprobar que la suma de las sumas de cuadrados parciales es igual a la suma de cuadrados total; simplemente hemos descompuesto el numerador de la varianza total.
2.4.2. Grados de libertad (gl)

Los grados de libertad van a ser el denominador de cada varianza. El determinar los grados de libertad que corresponden a cada varianza es muy sencillo: 1. Del factor A (mtodos) 2. Del factor B (profesores) 3. De la interaccin (AxB) 4. Dentro de los grupos 5. Del total A-1 = B-1 = (A-1)(B-1) = N -k = N-1= (3-1) = (4-1) = (3-1)(4-1) = (60 12) = (60-1) = 2 3 6 48 59

Podemos verificar que los grados de libertad del total es igual a la suma de todos los dems.
2.4.3. Varianzas o Cuadrados Medios (CM)

Dividiendo la Suma de Cuadrados por los Grados de Libertad tenemos las diversas varianzas en las que hemos descompuesto la varianza total, tal como estn ya calculadas en la

7 Recordamos que la suma de las varianzas se calcula con rapidez introduciendo en la calculadora (con programacin estadstica) todas las desviaciones tpicas; la suma de las varianzas la obtenemos en la funcin x2

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

13

tabla 5, y que muestra los resultados finales del anlisis de varianza. Normalmente es la nica tabla que se presenta pues all estn los datos que permitirn interpretar las conclusiones. Como en el caso de varias muestras independientes, si hubiramos calculado en los 12 subgrupos las desviaciones tpicas dividiendo por N-1, los cuadrados medios dentro de los grupos (denominador de la razn F) es simplemente la varianza media de los grupos ( 2 n-1 /k) .
2.4.4. Comparacin o contraste de varianzas (razn F)

Finalmente comparamos las varianzas de inters (las de los factores y su interaccin) con la varianza que podemos considerar como aleatoria, para comprobar qu fuentes de varianza podemos considerar significativas o superiores a lo que se puede esperar por azar. En estos planteamientos tenemos tres fuentes de varianza que nos interesa examinar: 1) La varianza debida al factor A (mtodos) 2) La varianza debida al factor B (profesores) 3) La varianza debida a la interaccin entre los dos factores (A x B). Es decir, deseamos calibrar cul es el influjo de las dos variables que hemos utilizado para clasificar a los sujetos (y que genricamente llamamos aqu factor A y factor B, en este caso mtodos y profesores), y tambin el influjo de la relacin entre las dos variables. En una palabra: entre los sujetos tenemos diferencias (varianza, expresada en la varianza total), y nos preguntamos Cules de estas tres fuentes de diferencias son importantes, por encima de lo puramente casual? Estas tres varianzas van a ser el numerador de otros tantos clculos de la razn F. El denominador ser el trmino de comparacin. Compararemos cada una de las tres varianzas con la varianza que podamos considerar como aleatoria, la que hubiramos encontrado de no existir lo especfico de los mtodos, los profesores y su interaccin que es precisamente lo que estamos investigando. sta es la varianza que hemos denominado antes dentro de los grupos, y que quizs con ms propiedad puede denominarse varianza residual. Sin embargo esto no es siempre as, el trmino apropiado de comparacin va a depender de que las categoras de clasificacin sean fijas, aleatorias o mixtas. En la tabla 4 exponemos cual debe ser el denominador de la razn F8. En nuestro ejemplo se trata de un modelo de categoras fijas, por lo que en todos los casos el denominador o trmino de comparacin ser CMdentro o la varianza (Cuadrados Medios) dentro de los grupos o residual. Si en este ejemplo los profesores hubieran sido escogidos aleatoriamente de un conjunto mayor, el factor B sera una categora aleatoria, pero suponemos que se trata de los profesores que estaban disponibles para hacer esta investigacin.

8 La justificacin puede verse en Guilford y Fruchter (1973:257)

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

14

Numerador, o varianza cuya significacin deseamos comprobar

Denominador (varianza aleatoria), o trmino de comparacin del numerador

Modelo de categoras fijas

CMA............................................................................ CMB ............................................................................ CMdentro en todos los casos CMAxB ....................................................................... CMA ................................................. CMAxB CMB ................................................. CMAxB CMAxB ............................................. CMdentro CM de la categora aleatoria ............ CMdentro CM de la categora fija .................... CMAxB CMAxB .............................................. CMdentro

Modelo de categoras aleatorias

Modelo de categoras mixtas

Tabla 4, denominador de la razn F


2.4.5. Resultados finales: tabla de resultados

Los resultados finales del anlisis de varianza se ponen en una tabla, tal como lo hacemos ahora en la tabla 5.
Origen de la variacin Factor A (mtodos) factor B (profesores) interaccin AxB dentro de los grupos total SC numerador 40 150 20 164 374 gl denominador 2 3 6 48 59 CM = 2 =
40 2
SC gl

F=
20 3.42

2
2

p < .01 < .01 no sign.

= 20 = 50

= 5.85 = 14.50 = .97

150 3 20

50

6 164 48

= 3.32 = 3.42

3.42 3.32

3.42

Tabla 5
2.4.6. Interpretacin

1. La varianza debida a la combinacin profesor-mtodo es prcticamente nula; la variabilidad (diferencias) en los resultados no se debe a determinadas combinaciones profesor-mtodo (no hay profesores que funcionen especialmente mejor o peor que los dems con un determinado mtodo). 2. Las varianzas originadas tanto por los profesores como por los mtodos son ambas significativas; si hay diferencias es porque los profesores son distintos y tambin porque los mtodos son distintos. Hay profesores ms eficaces (con cualquier mtodo) y mtodos ms eficaces (con cualquier profesor). 3. La mayor variabilidad se debe con mucho a los profesores (factor B), independientemente del mtodo que utilicen. Sin embargo si lo que se deseaba probar era que los mtodos son distintos en eficacia, que no da lo mismo uno que otro, esto puede darse por
Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

15

probado, porque la varianza de los mtodos (factor A) es significativamente superior a cero (hemos obtenido una F= 5.85 y el valor necesario que vemos en las tablas de la F es 5.08). Aun as el peso de los profesores, en los resultados finales, parece mayor que el de los mtodos. Para analizar e interpretar mejor los resultados haremos despus algn clculo adicional.
2.4.7. Resumen del procedimiento

El procedimiento puede parecer a primera vista un tanto complejo, pero si se examina paso a paso se advierte enseguida su simplicidad. La tabla 6 puede ser una referencia de uso cmodo para hacer todos los clculos con rapidez, si estamos familiarizados con los smbolos : N= n= 2 MA = 2 MB =
2 MAxB

Nmero total de sujetos Nmero de sujetos en cada grupo Varianza de las medias del factor A (medias de las tres columnas)
Varianza de las medias del factor B (medias de las cuatro filas) Varianza de las medias de todos los subgrupos (medias de los doce subgrupos) Suma de las varianzas de todos los subgrupos Varianza de los totales (de todos los sujetos como si se tratara de un solo grupo)
Grados de libertad Cuadrados Razn F Medios

2 dentro = 2 t =

tabla de resultados:
Origen de la variabilidad Factor A Factor B
Suma de Cuadrados p

SCA = N 2 MA = SCB = N 2 MB =

A-1= B-1= (A-1)(B-1) = N-k= N-1= Tabla 6

AxB SCAxB = N 2 MAB - (SCA + SCB) = (interaccin AxB) error, dentro de los grupos

SCdentro = n 2 dentro =
2

Variabilidad total SCtotal = N t =

3. Anlisis adicionales

Vamos a distinguir dos tipos de anlisis complementarios: 1 Coeficientes de asociacin, 2 Contrastes entre medias, con sus correspondientes tamaos del efecto Veremos adems cmo hacer una representacin grfica de los resultados, que es muy til como ayuda a la interpretacin y para comunicar los resultados. No hay que hacer siempre todo lo que es posible hacer, sino lo que aporte en cada planteamiento informacin til.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

16

3.1. Coeficientes de asociacin

Una razn F significativa nos indica que una determinada fuente de varianza (que corresponde a la variable puesta en el numerador de la razn F) se relaciona con las diferencias en la variable dependiente (la que hemos medido en los sujetos) ms de lo que cabra esperar por azar: la variabilidad observada en la variable dependiente se puede atribuir a las variables del numerador de la razn F. Sin embargo no es fcil comparar entre s dos F significativas; aunque sus valores sean muy distintos tambin lo son los grados de libertad. Con frecuencia es suficiente comprobar la proporcin de varianza atribuible a cada variable (o a su interaccin si resulta significativa). Esto nos lo indica el coeficiente 2 o el coeficiente 2 (sus valores oscilan entre 0 y 1).
3.1.1. Coeficiente 2

Las frmulas del coeficiente 2 estn indicadas en la tabla 7, junto con los resultados correspondientes a este ejemplo (podemos observar que el denominador es siempre el mismo).
Estimacin de la proporcin de varianza atribuible a:

Valor del coeficiente 2


2 = SC A - (A - 1)(CM dentro ) CM dentro + SC total SC B - (B- 1)(CM dentro ) CM dentro + SC total

Resultados (en este ejemplo) [1] [2]


2 = 40 ( 2)(3.42) 3.42 + 374 150 (3)(3.42) 3.42 + 374

Factor A (mtodos) Factor B (profesores) La interaccin (AxB)

= .088 = .370

2 =

2 =

2 =

SC AxB - (A -1)(B -1)(CM dentro ) [3] CM dentro + SC total

20( 2)(3)(3.42) =-.001 2 = 3.42+374

Tabla 7 Si algn valor de 2 es negativo se interpreta como cero. Estas frmulas son apropiadas solamente cuando: 1 El nmero de sujetos es el mismo en cada clasificacin 2 Se trata de muestras independientes 3 En diseos o anlisis de categoras fijas (como suele ser frecuente). En este ejemplo podemos ver que una proporcin apreciable de la varianza del factor B (los profesores) est asociada a la variable dependiente (las puntuaciones analizadas). La proporcin de varianza correspondiente al factor A (mtodos) es muy pequea. Estas proporciones se comparan entre s y se interpretan mejor que si slo disponemos de los valores de la razn F. Si este ejemplo fuera real concluiramos que la fuente importante de varianza (de las diferencias en lo que hayamos medido) est sobre todo en los profesores, no tanto en los diversos mtodos. Ahora podramos simplemente fijarnos en las medias de los distintos profesores (o de los mtodos si fuera se el caso). La proporcin de varianza que se puede atribuir a la interaccin puede considerarse igual a cero, ya que su F correspondiente no llega a 1.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

17

Este coeficiente 2 no es extrapolable; solamente se refiere a los datos analizados, y slo puede utilizarse con las categoras fijas. Si se trata de categoras aleatorias (y si una de ellas es aleatoria tambin lo es la interaccin a estos efectos) las frmulas que se utilizan son las mismas del anlisis de varianza para varias muestras relacionadas.
3.1.2. Coeficiente 2

Tambin puede utilizarse el coeficiente 2

2 = SC x SC total

[4]

SCx simboliza cualquier suma de cuadrados (de los factores y de la interaccin). El valor de 2 tiene un sesgo positivo y suele ser bastante mayor que el de 2 por lo que no son comparables entre s. En nuestro ejemplo tenemos: 2 (A) = 2 (B) = 2 (AxB) =
40 = .106 374 150 = .40 374

20 = .053 374

Una variante de inters de este coeficiente es eta al cuadrado parcial, que nos indica la proporcin de varianza asociada a un factor (o a la interaccin) neutralizando la varianza debida a otras fuentes (otros factores o su interaccin)9: 2 parcial =

SC x SC x + SC dentro

[5]

Si deseamos conocer la proporcin de varianza asociada al factor B (profesores) prescindiendo del influjo del mtodo, tenemos: 2 (B) parcial= 150 = .477 150 + 164

Observamos que ahora 2 correspondiente a B (profesores) es ligeramente mayor si neutralizamos el efecto del mtodo (como si todos fueran igualmente eficaces). Estos coeficientes (2 o 2) se deberan utilizar rutinariamente como complemento al anlisis de varianza. Resultados (valores de F) estadsticamente significativos son compatibles con una relacin muy baja entre la variable independiente y la variable dependiente. Si la variable independiente explica menos del 5% de la varianza de la variable dependiente, se trata de una relacin muy baja aunque sea real (no casual). Para valorar las magnitudes de estos coeficientes ya se dieron algunas indicaciones a propsito del anlisis de varianza para varias muestras independientes; en cualquier caso siempre se pueden comparar entre s los coeficientes dentro de un mismo planteamiento. Resultados significativos pero que explican una proporcin de varianza muy baja, pueden indicar que quizs habra que refinar la metodologa (si se trata de un diseo experimental); o

9 Jaccard (1998:38). En el mismo lugar pueden verse otros coeficientes.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

18

quizs haya que redefinir los conceptos o ajustarlos ms. La proporcin de varianza explicada en un estudio dado est afectada por la variabilidad (varianza) no controlada, debida a variables extraas. Por esta razn ms que buscar valores absolutos altos, es ms til comparar unos coeficientes con otros y comprobar cul es la importancia relativa de estas fuentes de varianza.
3.2. Contrastes posteriores

Es frecuente limitarse a calcular los distintos coeficientes de asociacin (2, 2), pero tambin podemos hacer los contrastes posteriores que sean de inters10. Vamos a distinguir dos situaciones: 1) En tablas 2x2, cuando los criterios de clasificacin son solamente dos y cada uno est dividido en dos niveles; 2) En tablas nxn, cuando al menos uno de los dos factores est dividido en ms de dos categoras. 1 En tablas 2x2, con slo dos niveles en cada categora. En estos casos los contrastes posteriores son innecesarios. Si por ejemplo la razn F del factor A es estadsticamente, habr una diferencia clara entre sus dos niveles A1 y A2. Lo mismo sucede con el otro factor. Si la interaccin es significativa, esto quiere decir que uno de los dos niveles de un factor es mayor que el otro. En todos estos casos slo interesa comparar dos medias entre s, y si la razn F es significativa, ya sabemos que una media es significativamente mayor que la otra sin hacer ms contrastes (s nos puede interesar aadir el tamao del efecto). 2 En tablas nxn, cuando tenemos al menos un criterio de clasificacin (o factor) dividido en ms de dos niveles. En estos casos s pueden hacernos falta los contrastes posteriores apropiados. En algunos casos son estos contrastes los que permiten llegar a conclusiones ms interpretables: cuando tenemos ms de dos niveles en alguno de los factores y la varianza correspondiente a alguno de ellos o la de la interaccin es significativa, tendremos ms de dos medias y ser importante ver dnde est la diferencia. En este cuadro tenemos el planteamiento clsico de un anlisis de varianza, con dos factores principales (A y B); el factor A est dividido en tres niveles y el factor B en dos (tabla 8). A1 A1B1 A1B2 A1 Factor A A2 A2B1 A2B2 A2 Tabla 8 A3 A3B1 A3B2 A3
medias de B B1 B2

Factor B

B1 B2 medias de A

Con este planteamiento obtenemos cuatro varianzas o cuadrados medios (de los dos factores principales, A y B, de la interaccin, AxB, y del trmino del error o varianza dentro

10 Pueden verse en monografas ms especializadas, como Toothaker (1993).

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

19

de los grupos) y tres razones F al dividir las varianzas de A, B y AB por la varianza del trmino del error (dentro de los grupos, aleatoria). Estas razones F nos dirn si son significativas las diferencias debidas a A, a B y a AxB (o a una combinacin entre niveles de factores). Los contrastes posteriores que nos pueden interesar son entre dos tipos de medias: a) Entre distintos niveles del mismo factor b) Entre las medias del mismo nivel de un factor. 1. Diferencias entre los diversos niveles de A o de B; es decir, diferencias entre niveles del mismo factor. En el esquema anterior podramos comparar A1 con A2 , etc. A veces estas comparaciones pueden ser innecesarias cuando slo tenemos dos medias que contrastar. Si en el esquema anterior la razn F correspondiente al factor B es significativa, esto quiere decir, sin necesidad de ms contrastes, que entre las dos medias correspondientes a B, B1 y B2 , existe una diferencia estadsticamente significativa, porque slo tenemos dos medias. En cambio si la razn F correspondiente al factor A es significativa, podemos encontrar diferencias entre A1 y A2 , entre A1 y A 3 , y entre A 2 y A 3 . En este caso s necesitaremos hacer los contrastes posteriores si nos interesa saber entre qu niveles de A hay una diferencia estadsticamente significativa. 2 Si la varianza (cuadrados medios) correspondiente a la interaccin es estadsticamente significativa, nos puede interesar comparar entre s diversas combinaciones de AB. Tenemos 6 combinaciones distintas de AB, de donde nos salen 15 posibles comparaciones [(6 x 5)/2], aunque ya veremos que en este caso nos interesa hacer menos comparaciones de las que es posible hacer.
3.2.1. Contraste entre las medias de niveles del mismo factor

Cuando la razn F correspondiente a uno o a los dos factores es estadsticamente significativa nos puede interesar comparar los diversos niveles de A entre s ( A1 , A2 , etc.). El procedimiento que exponemos es el adecuado para hacer estas comparaciones, pero no lo es para comparar una media de un nivel de A con otra de otro nivel B (y tampoco suele ser de especial inters). Hay que advertir que si la interaccin es estadsticamente significativa, estas comparaciones pueden no interesar. Concluir con un este mtodo es mejor que otro sin aadir pero slo en esta condicin o con este grupo, no es decir mucho, e incluso puede inducir a error. Y es eso lo que quiere decir que la interaccin es significativa: que entre los niveles de un factor hay diferencias (por ejemplo entre A1 y A2), pero no en general, sino en un nivel del otro factor (por ejemplo, A1 y A2 difieren en B2 pero no en B1). Para comparar entre s las medias de los distintos niveles de un factor tenemos los mismos procedimientos ya vistos para varias muestras independientes (Scheff, Tukey, etc.), pues estamos en ese caso. Posiblemente el contraste ms comn es el de Tukey, y es el que recomiendan algunos autores en esta situacin (Toothaker, 1990):

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

20

q=

M1 -M 2 CM dentro n

[6]

Podemos tambin calcular la Diferencia Estadsticamente Significativa (DHS), despejando la diferencia entre las medias en la frmula [6]. a) n es el nmero de datos (o de sujetos) que sumamos para calcular cada media y no el nmero de sujetos que hay en cada clasificacin. Naturalmente en las dos medias que contrastamos el nmero de sujetos es el mismo. En estos planteamientos de anlisis de varianza (diseos factoriales, dos o ms criterios de clasificacin) el nmero de sujetos en cada clasificacin es el mismo. Si en este ejemplo tuviramos cuatro sujetos en cada clasificacin (cuatro en A1B1 y cuatro en A1B2), el n de la frmula [6] sera ocho (si estamos comparando A1 con A 2 ). b) El valor de q resultante lo consultamos en las tablas de q (rango estudentizado) teniendo en cuenta cul es el nmero de medias (k) y cuntos son los grados de libertad aqu. 1 El nmero de medias (k) es el nmero de niveles del factor correspondiente. Si estamos en este ejemplo comparando entre s las medias de A, k = 3, porque tenemos tres medias en el factor A. 2 CMdentro es, como siempre en estos casos, el valor de los cuadrados medios del error o dentro de los grupos; lo que es distinto son los grados de libertad para consultar las tablas de q. Los grados de libertad para consultar las tablas de q son igual a N-ab N: ayb es el nmero total de sujetos. Si en cada clasificacin tenemos cuatro sujetos, como tenemos seis clasificaciones, aqu tendramos N = 4 x 6 = 24 sujetos son el nmero de niveles (o subdivisiones) de los factores A y B. En este caso a = 3 y b = 2. Si tuviramos N = 24, los grados de libertad seran 24 - (2x3) = 18. En las tablas buscaremos 18 grados de libertad (si no figuran en las tablas estos grados de libertad, buscamos el nmero inmediatamente inferior que encontremos). En realidad, y como en otros casos semejantes, los grados de libertad son (n-1) o N - k (k nmero de grupos; ab es el nmero de grupos). Vamos a verlo con un ejemplo. En el ejemplo que nos ha servido para explicar este modelo de anlisis de varianza (tabla 3) hemos visto que la F correspondiente a los mtodos (factor A) es estadsticamente significativa. Tenemos tres medias de A y entre estas tres medias habr diferencias estadsticamente significativas. Vamos a comparar la media de A1 (= 6) con la media de A3 (= 4). q= 64 M A1 - MA2 = = 4.83 CM dentro 3.42 20 n

3.42 son los cuadrados medios dentro (tabla 5) y 20 es el nmero de sujetos utilizados para calcular estas medias.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

21

En las tablas buscaremos el valor que corresponde a k = 3 (porque tenemos tres medias de A) y grados de libertad = 48 [N-ab = 60- (3x4)]. En los tablas no aparecen los 48 grados de libertad; nos quedamos con el nmero inmediatamente inferior, 40. Para k = 3 y 40 grados de libertad vemos estos valores de q: 3.44 (.05) y 4.37 (.01); en nuestro caso con q = 4.83 tenemos que p <.01, por lo que podemos afirmar la diferencia entre estas medias con mucha seguridad; el que la diferencia sea grande es una cuestin distinta (ms adelante tratamos del tamao del efecto). Si comparamos A1 con A2 o A2 con A3 tendremos que q = 2.42 y p > .05.
Una observacin sobre procedimientos alternativos.

En textos y manuales de estadstica aparecen a veces frmulas aparentemente distintas pero que son equivalentes y nos pueden confundir. Por ejemplo, para este mismo contraste de medias podemos encontrar esta frmula (Toothaker, 1993): M1 - M2 t' = [7] CM dentro x2 n

Aqu se calcula un valor de t'; la diferencia con la frmula de q [6] es ese "x 2" que aparece en el denominador de [7]. En este caso tendramos que calcular los valores crticos de t', como en ocasiones semejantes, y que son: q Valores crticos de t' = [8] 2 El valor de q es el que venga en las tablas (para = .05 y gl = N - ab, como antes). 6- 4 = 3.42 Aplicando los datos anteriores tenemos que t' = 3.42 x2 20 Ahora tenemos que hallar los valores crticos de t: para p = .05, t=
3.44 = 2.43 2

para p = .01, t =

4.37 = 3.09 2

Con t= 3.42, nuestra conclusin es la misma (p<.01). Posiblemente es ms cmodo calcular directamente el valor de q y consultar las tablas. Tambin podemos calcular directamente el valor de la diferencia necesaria (diferencia crtica) para rechazar la Hiptesis Nula; la que Tukey denomina diferencia honestamente significativa. Para esto, en la frmula de q, nos basta despejar la diferencia del numerador y sustituir q por el valor que venga en las tablas:
Diferencia crtica = q
CM dentro n

[9]

En este caso, para localizar el valor de q en las tablas, tanto el valor de k (nmero de grupos o de medias) como el de los grados de libertad son los indicados anteriormente.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

22

3.2.2. Contraste entre las medias dentro del mismo nivel de un factor (cuando la interaccin es significativa)

Lo expuesto hasta ahora es el procedimiento para verificar si hay diferencias significativas entre las medias de los distintos niveles (medias de columnas entre s y medias de filas entre s). Pero tambin nos pueden interesar otras comparaciones. El comparar entre s las distintas medias que encontramos en los diversos niveles de cualquier factor nos interesa cuando la interaccin es significativa: un mtodo puede ser superior a otro, pero solamente con una determinada duracin, o un medicamento puede ser superior a otro, pero solamente en una determinada dosis o una determinada etapa de la enfermedad, etc. Vamos a suponer que A1, A2 y A3 son tres grupos de alumnos divididos segn la edad (tres edades o cursos distintos) y B1 y B2 son dos actividades didcticas (tabla 9, idntica a la tabla 8):
1 (A1) A1B1 A1B2
Factor A (cursos) 2 (A2) 3 (A3) A2B1 A3B1 A2B2 A3B2 medias de los mtodos (B)

Factor B mtodo 1 (B1) (mtodos) mtodo 2 (B2) medias de los cursos (A)

mtodo 1 ( B1 ) mtodo 2 ( B2 )

A1

A2 Tabla 9

A3

Supongamos que llegamos a esta conclusin: la razn F correspondiente al factor B (mtodo o actividad) es significativa. Esto puede querer decir que un mtodo, por ejemplo B2, es mejor que el otro, B1. Si la interaccin no es significativa, la interpretacin es que B2 es mejor independientemente del curso (edad) de los alumnos. Suponemos ahora que adems del factor mtodos (B) tambin la interaccin es significativa: en este caso el concluir simplemente que B2 es mejor que B1 no es decir mucho: es mejor pero segn con qu alumnos. En este caso nos interesar contrastar las tres medias de B2 entre s para ver en qu grupo o grupos es mejor el mtodo B2 pues B2 est implicado en los tres niveles de A: A1, A2 y A3.
Qu comparaciones interesa hacer cuando la interaccin es significativa.

Como primer paso podemos inspeccionar la representacin grfica de los resultados (explicada en un apartado posterior) que nos aclarar la interpretacin de manera intuitiva y nos dir dnde pueden estar las comparaciones de inters. Cuando la interaccin es significativa, los textos de nivel bsico o intermedio suelen limitarse a recomendar la inspeccin estas representaciones grficas (Oshima y McCarty, 2000)11. En el esquema que nos sirve de ejemplo (A con tres niveles y B con dos), si queremos comparar entre s todas las posibles combinaciones AB, como tenemos 6 grupos distintos tendremos (6x5)/2 = 15 comparaciones posibles. Con cuatro niveles en un factor y tres en el otro tendramos 12 grupos distintos y (12x11)/2 = 66 contrastes posibles. Es claro que son muchas comparaciones y que posiblemente muchas no tienen especial inters.

11 Oshima y McCarty (2000) reconocen la falta de consenso entre autores sobre cmo hacer estos contrastes cuando la interaccin es significativa y exponen diversos enfoques.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

23

Por lo general no nos interesan todas las comparaciones posibles; lo que s puede tener inters, y es lo que tratamos aqu, es comparar solamente las medias dentro de un mismo nivel: por ejemplo las comparaciones entre las tres B2. Dicho de otra manera, las comparaciones que interesan son entre medias que pertenecen a la misma fila o a la misma columna (filas y columnas son aqu los distintos niveles o subclasificaciones de cada factor). Estas medias se denominan no confundidas (unconfounded) porque las diferencias entre ellas se deben solamente a un factor. Si por ejemplo hay diferencias entre las medias de A1B1, A2B1, y A3B1, estas diferencias se debern solamente a diferencias en A, porque mantenemos constante B1. En el mtodo expuesto aqu para hacer estas comparaciones suponemos que: a) Hay un idntico nmero de sujetos en cada posible clasificacin; b) Slo se van a comparar entre s medias que pertenecen al mismo nivel de un factor. El procedimiento va ser el mismo visto antes, pero van a ser distintos el valor de n que entra en la frmula y el nmero de medias (k) para consultar las tablas (propiamente lo que cambia es el valor de k, que, como veremos, no va ser igual al nmero de medias, aunque nmero de medias suele ser la expresin que viene en las tablas).
Frmulas:

Como antes, podemos hallar el valor de q y consultar las tablas de q, o podemos calcular el valor de t', y ya sabemos que los valores crticos de t' son igual a q/ 2 , donde q es el valor que venga en las tablas segn el nmero de grupos (k) y los grados de libertad correspondientes. Las frmulas para comparar los subgrupos de dos en dos ya las hemos visto: M1 -M 2 los valores crticos de q los consultamos en [6] q= las tablas de la manera indicada ms adelante CM dentro (tabla 10) n t' = M1 - M 2 CM dentro x2 n [7] los valores crticos de t' son =
q 2

Una observacin importante para estas dos frmulas: n es el nmero de sujetos o de observaciones que sumamos para calcular cada media. Si en cada subclasificacin hay cuatro sujetos, entonces n = 4. El principio es el mismo visto antes para contrastar las medias de los niveles entre s (all n era igual al nmero de sujetos que entran en la media de cada nivel). Para consultar las tablas de q, el nmero de medias, como hemos indicado, no es exactamente el nmero de medias; el valor de k va a estar en funcin del tamao de la tabla. En la prctica basta consultar la tabla 10 que hemos confeccionado para estos casos12.

12 La justificacin de esta tabla la incluimos en el anexo V, que nos puede servir para ampliar la tabla si es necesario.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

24

Tamao de la tabla Valor de k para de dos factores consultar las tablas de q 2 x 2 ............................... 3 2 x 3 ............................... 5 2 x 4 ............................... 6 2 x 5 ............................... 8 3 x 3 ............................... 7 3 x 4 ............................... 8 3 x 5 ............................... 10 4 x 4 ............................... 10 4 x 5 ............................... 12 5 x 5 ............................... 15 Tabla 10
3.3. El tamao del efecto en los diseos factoriales

Adems de verificar entre qu medias tenemos una diferencia estadsticamente significativa, podemos calcular el tamao del efecto para apreciar mejor la magnitud de la diferencia, como hacemos en otros planteamientos. Cuando solamente tenemos dos niveles en un factor y ste es significativo, ya sabemos que entre los dos niveles existe una diferencia estadsticamente significativa, y sin hacer ningn contraste adicional podemos pasar directamente al tamao del efecto. Nos vamos a fijar en el tamao del efecto cuando comparamos dos niveles del mismo factor; nos referimos fundamentalmente al factor que consideramos principal o de mayor inters13. La cuestin es qu desviacin tpica podemos poner en el denominador. Podemos distinguir dos situaciones.
3.3.1. Cuando el factor secundario es una variable manipulada

Cuando el factor secundario o no principal es una variable manipulada, introducida, etc. por el investigador (como pueden ser modalidades, duraciones, circunstancias, etc.). En estos casos podemos utilizar en el denominador del tamao del efecto la raz cuadrada de los cuadrados medios dentro de los grupos de la tabla de resultados (tabla 5). Esa desviacin tpica (recordemos que los cuadrados medios son varianzas y su raz cuadrada una desviacin tpica) no contiene la variabilidad producida por ese factor secundario cuya influencia en la variable dependiente mantenemos as constante. Este factor, en s mismo, no suele tener un inters terico especial.
3.3.2. Cuando el factor secundario es una caracterstica natural de la poblacin

Otras veces el factor secundario o no principal es una caracterstica natural de la poblacin a la cual queremos generalizar los resultados; quizs el caso ms frecuente sea el gnero (o grupo tnico, o tipo de muestra, como clase social, etc.). En estos casos la desviacin tpica del denominador del tamao del efecto s debe incluir la variabilidad que se da naturalmente en ese factor. No debemos utilizar los cuadrados medios dentro de los grupos de la tabla de resultados (tabla 5) porque sa es la

13 Un tratamiento ms amplio del tamao del efecto en el contexto del anlisis de varianza puede verse en Cortina y Nouri (2000).

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

25

varianza residual, la que queda una vez eliminado el influjo de los dos factores y de su interaccin y nosotros queremos incluir el influjo del factor secundario. Siempre que no queramos prescindir de la variabilidad producida por el factor secundario debemos utilizar la raz cuadrada de los cuadrados medios dentro de los grupos pero la que hubiremos obtenido haciendo un anlisis de varianza unifactorial solamente con el factor principal. Esta desviacin tpica ser mayor que en el caso anterior y el tamao del efecto no quedar sobrestimado (en cualquier caso este procedimiento es ms conservador y en caso de duda puede ser preferible). Para obtener estos cuadrados medios dentro de los grupos (luego utilizaremos la raz cuadrada) tenemos dos caminos. 1 Hacer un anlisis de varianza unifactorial con slo el factor principal. Como solamente nos interesan los cuadrados medios dentro, realmente no necesitamos hacer el anlisis de varianza completo, podemos calcularlos directamente. Con muestras de idntico tamao la frmula es sta: n 2 Cuadrados Medios dentro = Nk n es el nmero de sujetos en cada nivel del factor es la desviacin tpica de cada nivel del factor k es el nmero de grupos (de niveles)

Lo vamos a ver utilizando los datos de la tabla 3; nos interesa calcular el tamao del efecto al comparar las medias de los tres mtodos. Los datos los tenemos en la tabla 11. n Media A1 A2 20 20 6 5 2.3237 2.236 Tabla 11 A3 20 4 2.5099

Si comparamos estos datos con los de la tabla 3, lo nico que hemos tenido que hacer es calcular las desviaciones tpicas de los tres niveles de A (de las columnas), y adems caer en la cuenta de que n = 20 (nmero de sujetos en cada mtodo). Aplicamos la frmula de los cuadrados medios dentro: CM dentro = 20(2.3237 2 + 2.236 2 + 5.099 2 ) = 5.859, y = 60 3 5.859 = 2.42

sta es la desviacin tpica que utilizaremos en el denominador del tamao del efecto; entre A1 y A3 tendremos d = (6-4)/2.42 = .826 (diferencia que podemos considerar grande). 2 Clculo a partir de la tabla de resultados del anlisis de varianza Los cuadrados medios dentro de un anlisis unifactorial hecho con los niveles del factor principal (que es lo que nos interesa) podemos rescatarlos de la tabla de resultados del diseo factorial que ya tenemos (tabla 5). Nos basta calcular los cuadrados medios sumando todas las sumas de cuadrados y todos los grados de libertad excepto los correspondientes al factor principal (A); la frmula es por lo tanto:

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

26

CM dentro =

SC B + SC AxB + SC dentro 150 + 20 + 164 = = 5.859 gl B + gl AxB + gl dentro 3 + 6 + 48

Llegamos al mismo resultado con los dos procedimientos; ste segundo puede resultar ms cmodo, pero es til verificar que los dos son equivalentes.
4. La representacin grfica de los resultados como ayuda a la interpretacin en los diseos factoriales

En un diseo factorial con dos factores principales tenemos tres posibles fuentes de variacin sistemtica: los dos factores principales, A y B, y su interaccin. Adems de interpretar directamente los valores de F, un sencillo grfico nos puede ayudar en la interpretacin de lo que est sucediendo y a comunicarlo con ms claridad. Vamos verlo con unos ejemplos hipotticos. Suponemos que los dos factores principales son: A1 Factor A: mtodo: trabajo en grupo con dos niveles o variantes: A1 con trabajo individual antes de la discusin en grupo B1 A2 sin tarea individual antes de la tarea grupal Factor B: tiempo, duracin: B1 media hora B2 una hora B2 A1B1 A1B2 A2 A2B1 A2B2

La variable dependiente (la que hemos medido despus de las actividades) puede ser satisfaccin por la tarea (o nivel de participacin o de aprendizaje, etc.). En los grficos puestos a continuacin el eje de las abcisas (X) corresponde a uno de los dos factores principales; en este caso situamos en este eje los dos niveles del factor B (suficientemente distanciados para que el grfico quede ms claro). El eje vertical de las ordenadas (Y) corresponde a la variable dependiente (la que hemos medido). En este eje podemos situar algunos valores representativos (en este ejemplo ficticio ponemos de 1 a 8). En este espacio situamos los valores del otro factor principal, el factor A en este caso: situamos las medias de A1 y A2 correspondientes a B1 y B2 y unimos con una recta las medias de cada nivel (una recta representa a A1 y la otra a A2). Por razones de claridad slo ponemos dos niveles en cada factor; naturalmente podran ser ms. Si hubiera tres valores de A (tres niveles), tendramos tres rectas. Si tuviramos adems tres niveles de B las rectas correspondientes a los niveles de A seran probablemente quebradas. En cualquier caso estos grficos aaden claridad informativa y ayudan a la interpretacin, sobre todo cuando la interaccin es significativa. En cada extremo de las lneas que representan los dos niveles de A podramos poner sus medias exactas, pero suele ser suficiente situar los valores en el eje vertical. Tambin se puede prescindir de los nmeros, que se supone que adems figuran en otro lugar. En estos ejemplos vemos:

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

27

8 7 6 5 4 3 2 1

A1 con tarea individual

A2 sin tarea individual

B1
media hora

B2
una hora

Figura 1
Figura 1. Claramente el mtodo A1 es superior al mtodo A2, cualquiera que sea la duracin (factor B). Cuando las lneas son paralelas (o casi paralelas) es claro que la interaccin no es significativa. Va a ser significativa la razn F correspondiente al factor A (A1 es claramente mayor que A2). En cambio la razn F correspondiente al factor B no es estadsticamente significativo; B1 y B2 no difieren entre s; sus medias van a ser muy parecidas.
8 7 6 5 4 3 2 1

A1 con tarea individual

A2 sin tarea individual

B1
media hora

B2
una hora

Figura 2
Figura 2. En este caso tendramos que apenas hay diferencia entre los mtodos (factor A), pero s las hay en el factor B, duracin de la actividad. B2 es superior a B1 independientemente de la actividad: una hora produce mejores resultados que media hora.

8 7 6 5 4 3 2 1

A1 con tarea individual

A2 sin tarea individual

B1
media hora

B2
una hora

Figura 3
Figura 3. Los dos mtodos son parecidos en B1, pero con una mayor duracin (B2) uno de los mtodos, A1, es claramente superior. Aqu la interaccin es significativa: hay una
Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

28

combinacin AxB (A1B2) claramente superior a las otras (A1 > A2 en B2). Cuando las lneas no son, ms o menos, paralelas, la interaccin est presente (poco o mucho).

8 7 6 5 4 3 2 1

A1 con tarea individual

A2 sin tarea individual

B1
media hora

B2
una hora

Figura 4
Figura 4. Las rectas no solamente no son paralelas, sino que se cruzan: un mtodo es mejor con una duracin (A1 en B2) y el otro con la otra duracin (A2 en B1). La interaccin va ser significativa e importante; la eficacia de los niveles un factor (A, los dos mtodos) est en funcin de los niveles del otro (B). En un ejemplo como el sugerido por esta figura, la interaccin sera la nica fuente de varianza importante.

En general cuando la interaccin es significativa tienen menor inters (o muy poco inters) los factores tomados aisladamente aunque sus valores de F sean significativos. La eficacia de un nivel de un factor (el que un mtodo sea mejor que otro en este caso) est mediatizada por su relacin con el otro factor. Cuando demostramos que la interaccin es significativa (y adems grande) es aqu donde tenemos que centrar la interpretacin. Por ejemplo en la situacin hipottica de la figura 3. Vamos a suponer que la razn F correspondiente a los mtodos (A) es significativa y concluimos que A1 es mejor que A2 esa conclusin no tiene mayor inters y adems puede inducir a error si no tenemos en cuenta y dejamos claro en la interpretacin que A1 es preferible a A2 solamente en la condicin B2 Como ya hemos advertido antes, aunque todo esto podemos interpretarlo a partir de los nmeros (valores de F, de 2, inspeccin de las medias, etc.), estos grficos contribuyen a una mejor comprensin y comunicacin de los resultados obtenidos.
5. Anlisis de varianza para diseos factoriales en EXCEL y SPSS EXCEL. Este modelo de anlisis de varianza lo tenemos en Herramientas - Anlisis de datos Anlisis de Varianza de dos factores con varias muestras por grupo.

Los datos se disponen en EXCEL como en una tabla nxn convencional, poniendo tambin los nombres o rtulos de filas y columnas. Se seala la tabla completa, incluidos los rtulos de filas y columnas. En el cuadro de dilogo en nmero de filas por muestra se pone el nmero de sujetos en cada subgrupo o clasificacin. El resultado son los datos descriptivos de las muestras y la tabla de resultados convencional, sin contrastes posteriores ni otros clculos complementarios.
SPSS. Este modelo de anlisis de varianza lo tenemos en Analizar, Modelo lineal general, Univariante. Hay que indicar al programa qu variable va actuar como dependiente y en factores fijos se integran las dos variables independientes que queremos estudiar.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

29

Este anlisis de varianza es complejo y conviene consultar manuales especficos (puede verse Pardo Merino y Ruz Daz, 2005). No presenta la tabla de resultados convencional por lo que, si interesa presentar esta tabla, se puede hacer fcilmente con EXCEL. El SPSS calcula los contrastes posteriores y los coeficientes eta cuadrado de cada efecto.
6. Referencias bibliogrficas

CORTINA, JOSE M. and NOURI, HOSSSEIN (2000). Effect Size for ANOVA Designs. Quantitative Applications in the Social Sciences. Thousand Oaks: Sage. ESCOTET, MIGUEL A., (1980). Diseo multivariado en psicologa y educacin. Barcelona: Ceac. GLASS, GENE V. y STANLEY, JULIAN C., (1974). Mtodos Estadsticos Aplicados a las Ciencias Sociales. Madrid, Prentice-Hall Internacional. GUILFORD, J. P. y FRUCHTER, B., (1984). Estadstica aplicada a la psicologa y la educacin, Mxico: McGraw-Hill. [En Ingls: Fundamental Statistics in Psychology and Education, 1973. New York: McGraw-Hill]. JACCARD, JAMES (1998). Interaction Effecs in Factorial Analysis of Variance, Sage University Paper Series on Quantitative Applications in the Social Sciences. Thousand Oaks: Sage. KIRK, ROGER E., (1995). Experimental Design, Procedures for the Behavioral Sciences. Boston: Brooks/Cole. LINTON, MARIGOLD, GALLO JR., PHILLIP S. and LOGAN, CHERYL A., (1975). The Practical Statistician, Simplified Handbook of Statistics. Monterey: Brooks/Cole. OSHIMA, T. C. and MCCARTY, FRANCES (2000). How Should We Teach Follow-Up Tests After Significant Interaction in Factorial Analysis of Variance? Paper presented at American Educational Research Association, New Orleans, April 2000 http://www2.gsu.edu/~epstco/aeraMain.pdf (consultado 22, Nov., 2009). TEJEDOR, FRANCISCO JAVIER, (1984). Anlisis de varianza aplicada a la investigacin en pedagoga y psicologa. Madrid: Anaya PARDO MERINO, A. y RUZ DAZ, M.A. (2005). Anlisis de datos con SPSS 13 Base. Madrid: McGraw Hill TOOTHAKER, LARRY E., (1993). Multiple Comparison Procedures, Sage University Paper Series on Quantitative Applications in the Social Sciences. Newbury Park: Sage.
Anexo. Anlisis de Varianza (diseos factoriales) en Internet

Adems de programas de ordenador como el SPSS y hojas de clculo como EXCEL disponemos de programas en Internet. LOWRY, RICHARD, VASSARSTATS: Web Site for Statistical Computation,Vassar College, Poughkeepsie, NY, USA; http://faculty.vassar.edu/lowry/VassarStats.html En el menu de la izquierda en ANOVA: Two-Way Analysis of Variance for Independent Samples. Se trata del anlisis de varianza con dos criterios de clasificacin cada uno dividido entre dos y cuatro niveles. Se pueden introducir los datos o se pueden copiar de una tabla. Tambin calcula el test de Tukey para los contrastes posteriores. En la misma direccin tambin estn programadas algunas variantes de este anlisis factorial, como 2x2x2 ANOVA for Independent Samples (tres criterios de clasificacin con dos niveles cada uno) y otros.

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

30

VADUM RANKIN Statistical Applets 2X2 Analysis of Variance for the statistical tests for a 2x2 factorial design. http://www.assumption.edu/users/avadum/applets/applets.html ; basta introducir la media, desviacin tpica (de la poblacin, dividiendo por n-1) y nmero de sujetos de los cuatro grupos. Estas direcciones se pueden encontrar en JOHN C. PEZZULLO'S HOME PAGE, http://statpages.org/JCPhome.html (en Interactive Statistics Pages).

Anlisis de varianza con dos criterios de clasificacin (diseos factoriales)

También podría gustarte