Está en la página 1de 71

TEMA 3:

MODELOS ANOVA Y ANCOVA CON EFECTOS FIJOS


Contenidos.
I. Conceptos bsicos (2-6)
II. Modelo ANOVA de un factor con efectos fijos (7-16)
III. Diagnstico de modelos ANOVA con efectos fijos (17-20)
IV. Comparaciones entre medias de grupo (21-29)
V. Modelos ANOVA factorial con efectos fijos (30-54)
VI. Introduccin a los modelos ANCOVA (55-61)
VII. El modelo ANCOVA bsico: un factor y una covariante (62-71)
Materiales:
Teora: Captulos 3 y 5 del texto DIP (2015).
Prcticas: Pginas 31-64 del documento de Prcticas Resueltas 2016.
Pginas 23-42 del documento de Prcticas No Resueltas 2016.
Programa informtico: Pginas 39-50 y 58-64 del documento Salidas R del
texto DIP.
First Prev Next Last Go Back Full Screen Close Quit

I. Conceptos bsicos (1)


Los MODELOS ANOVA difieren de los modelos de regresin porque utilizan slo variables explicativas categricas (factores).
Los factores tienen que ser adecuadamente codificados por alguno de
los procedimientos de codificacin (preferentemente, codificacin tipo
ANOVA o codificacin polinmica ortogonal).
Suponen una simplificacin de los modelos de regresin, pero para algunos diseos de investigacin, los modelos ANOVA son ms apropiados
que los modelos de regresin.
Comprender la estructura de los modelos ANOVA requiere la familiarizacin con algunos conceptos bsicos de la investigacin aplicada. En
concreto, es esencial comprender los conceptos de FACTOR, COVARIANTE,
RPLICA y EFECTO DE TRATAMIENTO (DIP, p.103-105).
Un principio fundamental que se aplica con los modelos ANOVA y ANCOVA de dos o ms factores es el PRINCIPIO DE MARGINALIDAD (Nelder,
1977), que asume una jerarqua de efectos de tratamiento, donde no deben interpretarse efectos de orden inferior que sean marginales de efectos de orden superior significativos.
2
First Prev Next Last Go Back Full Screen Close Quit

I. Conceptos bsicos (2)


En un modelo ANOVA, un FACTOR es una variable categrica codificada
medida en escala nominal u ordinal, cuyas categoras se denominan niveles, condiciones o combinaciones de tratamiento (si hay ms de un factor), y de forma ms general, tratamientos.
En los modelos ANOVA se distinguen dos grandes tipos de factor:

FACTOR DE TRATAMIENTO , es una variable categrica cuyos niveles son

tratamientos a los que se asignan las unidades experimentales y su


administracin est controlada por el investigador;

FACTOR DE CLASIFICACIN ,

es una variable categrica cuyos niveles


son clases homogneas de unidades experimentales y su administracin no est controlada por el investigador.

Cualquier variable numrica que se incluya en un modelo ANOVA se denomina COVARIANTE y requiere un grado de libertad (como el predictor
numrico de un modelo de regresin).
3

First Prev Next Last Go Back Full Screen Close Quit

I. Conceptos bsicos (3)


Un experimento puede realizarse si un investigador tiene al menos tantas
unidades experimentales (N ) como tratamientos (a), o sea, tiene al menos una rplica (EXPERIMENTO NO REPLICADO). Sin embargo, la varianza
de error no se puede estimar a menos que cada tratamiento sea administrado a ms de una unidad experimental (EXPERIMENTO REPLICADO).
Se denomina RPLICA a cada una de las observaciones independientes de
un tratamiento, cada una de las cuales requiere una unidad experimental diferente. Por ejemplo, dos medidas sucesivas del peso de una misma
unidad experimental no son rplicas, sino PSEUDORPLICAS, puesto que
no son dos observaciones "independientes"que requieran unidades experimentales diferentes.
El nmero de rplicas del tratamiento j se designa en general por n j . Si
todos los tratamientos tienen el mismo nmero de replicas, se emplea en
su lugar n.
Todo experimento requiere al menos una rplica.
4
First Prev Next Last Go Back Full Screen Close Quit

I: Conceptos bsicos (4)


Un EFECTO DE TRATAMIENTO (E T ) es el cambio que se produce en una variable de respuesta como consecuencia de la administracin del tratamiento.
Se designa por j y se define como la diferencia entre la media de un nivel
de tratamiento y la media global: j = ( j ), donde j es la media de un
j-simo nivel de tratamiento y es la media global.
Se asume la existencia de una poblacin de tratamientos A de un factor
A que el investigador puede utilizar en su investigacin, algunos de cuyos
niveles (a) son objeto de su inters.
Dos tipos de efectos de tratamiento pueden usarse con ANOVA de un factor. En el MODELO DE EFECTOS FIJOS (o MODELO I), la poblacin se fija
arbitrariamente en unos pocos tratamientos de inters, desprecindose
todos los dems; en tal caso, a = A . Por el contrario, en el MODELO DE
EFECTOS ALEATORIOS (o MODELO II), el investigador selecciona los tratamientos que desea utilizar al azar de la poblacin de tratamientos; en tal
caso, a < A .
5

First Prev Next Last Go Back Full Screen Close Quit

I. Conceptos bsicos (5)


Cuando los efectos de tratamiento son arbitrariamente prefijados por el
investigador (MODELO DE EFECTOS FIJOS o MODELO I):
en primer lugar, una repeticin del mismo experimento implica utilizar los mismos a tratamientos inicialmente utilizados por el investigador;
en segundo lugar, la generalizacin de los resultados no puede extenderse ms all de los a tratamientos utilizados.
Cuando los efectos de tratamiento son seleccionados al azar por el investigador (MODELO DE EFECTOS ALEATORIOS o MODELO II)):
en primer lugar, una repeticin del mismo experimento no necesariamente utilizar (excepto si sucede por azar) los mismos a tratamientos inicialmente empleados por el investigador;
en segundo lugar, la generalizacin de los resultados puede extenderse a la poblacin A de niveles de tratamiento.
6

First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (1)


Siendo A un factor fijo con a niveles o tratamientos que se administran
a un total de n rplicas, el modelo ANOVA se representa tambin con la
ECUACIN GENERAL DEL MODELADO :
Yi j =

ei j

Yi j =

+ j

ei j

D AT OS =

MODE LO

+ RE SI DU AL

Yi j es la observacin de la i -sima rplica en el j -simo tratamiento;


es la media global, j es la media marginal del j -simo tratamiento
y j es el efecto del j -simo tratamiento;
e i j = Yi j j es el residuo que corresponde a la rplica i del tratamiento j . Se asume que se distribuyen segn e i j N I D(0, 2e ).
En esta formulacin del modelo ANOVA hay una MEDIA GLOBAL (), que
es constante para todo tratamiento, un EFECTO DE TRATAMIENTO FIJO
( j = j ), especfico para el nivel j del factor, que ha sido prefijado
por el investigador, y un ERROR ALEATORIO (e i j ), compuesto de efectos de
variables desconocidas.
7
First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (2)


Sustituyendo en la ecuacin parmetros por estimadores obtenemos:
Yi j = Y + (Y j Y ) + (Yi j Y j )
lo que eliminando parntesis resulta ser una simple identidad.
Trasladando a la izquierda el primer trmino de la derecha para que todos
los trminos utilicen la misma escala de puntuaciones diferenciales,
(Yi j Y ) = (Y j Y ) + (Yi j Y j )
y elevando al cuadrado y sumando para todo i y j obtenemos
XX
X
XX
2
2
(Yi j Y ) = n j (Y j Y ) +
(Yi j Y j )2
j

SC T OT AL (SC T ) = SC MODE LO (SC M ) + SC RE SI DU AL (SC R )


an 1

a 1

an a

En condiciones de regularidad, la PARTICIN DE LAS SC se corresponde


con una PARTICIN DE LOS GRADOS DE LIBERTAD, donde a el nmero de
niveles del factor y n el nmero de rplicas (DIP, p.105-109).
8
First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (3)


MC A y MC R se obtienen dividiendo las sumas de cuadrados por sus grados de libertad: MC A = SC A /(a 1) y MC R = SC R /(an a), y representan
estimaciones independientes de la varianza de error, siendo sus esperanzas matemticas E (MC ):
P
n j 2j
E (MC A ) = 2e +
= 2e + n 2j
a 1
2
E (MC R ) = e
P
donde 2j = ( j 2j )/(a 1) estima la varianza de los efectos de tratamiento.
La razn entre varianzas F A = MC A/MC R se convierte as en la prueba
fundamental del efecto de tratamiento j de tal forma que:
si 2j = 0, entonces F A = E (MC A)/E (MC R) = 1 y el efecto de tratamiento ser nulo;
en cambio, si 2j > 0, entonces F A = E (MC A)/E (MC R) > 1 y el efecto de tratamiento no ser nulo. La significacin del efecto depender
bsicamente de la magnitud de 2j .
9
First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (4)


Una razn F A significativa no necesariamente implica un efecto de tratamiento relevante. Tiene inters aportar tambin alguna medida de la MAGNI TUD DEL EFECTO de A, como ETA CUADRADO (2A ) u OMEGA CUADRADO (2A ):
SC A
SC A
=
SC A + SC R SC T
SC A (a 1)MC R
(a 1)(F A 1)
=
=
SC T + MC R
(a 1)(F A 1) + N

2A =
2A

que se interpretan como la proporcin de la varianza total explicada por A


(DIP, p.109-111). Si las MC son conocidas, una estimacin ms rigurosa consiste en utilizar los COMPONENTES DE LA VARIANZA, que para este modelo son
2e ) y la (cuasi)varianza de A (2A ), cuya suma aproxima
la varianza de error (
2e = MC R y
la VARIANZA TOTAL. Siendo
(a 1)(MC A MC R )
2A =
N
2T = 2A +
2e y entonces puede estimarse
2A calculando
la varianza total es:
2A =
la razn del componente de varianza de A respecto de la varianza total:
2e ).
2A /(2A +
10
First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (5)


La P OTENCIA DE UNA PRUEBA ESTADSTICA es la sensibilidad para detectar, si existen, efectos debidos al tratamiento (DIP, p.111-113). El A NLISIS DE LA POTENCIA
se utiliza para conjugar varios elementos que pueden afectar el resultado: el nivel de significacin , los grados de libertad de numerador y denominador (g l 1 y
g l 2 , respectivamente), la varianza de error 2e y el efecto de tratamiento j en la
poblacin. Se considera aceptable un valor de potencia por encima de 0.80.
El ANLISIS PROSPECTIVO DE LA POTENCIA se aplica durante la fase de diseo
y se determina consultando la distribucin F no central con grados de libertad
g l 1 y g l 2 y PARMETRO DE NO CENTRALIDAD para un determinado nivel de significacin. En el modelo ANOVA de un factor, la estimacin del parmetro de no
centralidad para el factor A se obtiene mediante:
P
n 2j
SC A
A =
=
= g l AF A
MC R
2e

Aunque muy controvertido, SP SS ofrece como opcin un ANLISIS RETROSPECTI VO DE LA POTENCIA (o simplemente, POTENCIA OBSERVADA ), que se utiliza al concluir la investigacin para analizar la relacin entre potencia, magnitud del efecto
y tamao muestral.
11
First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (6)


Los datos siguientes proceden de una investigacin en la que se pretenda
saber si la informacin acerca del nivel de dificultad de un problema complejo que el investigador proporciona antes de iniciar la solucin del problema tiene alguna repercusin sobre el rendimiento. Se fijaron 3 niveles de
dificultad del problema (baja, media y alta) y se seleccionaron 8 rplicas
de una poblacin de estudiantes que se asignaron al azar a los niveles de dificultad del problema (DIP ejemplo 3.1, p.113).
caso

1
2
3
4
5
6
7
8

rend dific

5
6
7
6
8
7
7
6

baja
baja
baja
baja
baja
baja
baja
baja

caso

rend

dific

caso

9
10
11
12
13
14
15
16

5
4
5
7
6
5
4
4

media
media
media
media
media
media
media
media

17
18
19
20
21
22
23
24

rend dific

7
5
3
6
2
4
5
3

alta
alta
alta
alta
alta
alta
alta
alta
12

First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (7)


Se asume que los niveles del factor dificultad se han elegido de forma arbitraria, que agotan la poblacin que se desea estudiar y por tanto es un factor
de efectos fijos. El objetivo del modelo ANOVA con un factor de efectos fijos
es determinar si las medias de los niveles del factor difieren significativamente y qu proporcin de la varianza de la variable de respuesta rendimiento
resulta explicada por el factor (DIP, p.113-116).
Es til examinar la tabla de estadsticos descriptivos que contiene las medias,
varianzas y tamao muestral de cada nivel del factor junto con un grfico
de las medias. El anlisis descriptivo apunta que el nivel de dificultad que
proporciona el investigador se relaciona inversamente con el rendimiento
obtenido (a menor dificultad, mejor rendimiento).
Anlisis descriptivo
rendimiento

dificultad Media Suma Varianzas


n
baja
6.500
52
0.8571
8
media
5.000
40
1.1429
8
alta
4.375
35
2.8393
8
Total
5.292
127
2.3025 N = 24
13
First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (8)


Los EFECTOS DE TRATAMIENTO j son las diferencias entre la media de cada tratamiento y la media global.
Nivel a1: 1 = 6.5 5.292 = 1.208,
Nivel a2: 2 = 5 5.292 = 0.292 y
Nivel a3: 3 = 4.375 5.292 = 0.917.
Observa que:
1) La suma de los efectos j debe ser cero: 1.208 + (.292) + (.917) = 0.
2) La suma de los cuadrados de los efectos j por el nmero de rplicas (n) es la
S UMA DE C UADRADOS DE A, o sea,
SC A = (8)(1.208)2 + (8)(.292)2 + 8(.917)2 = 19.083
3) La suma de los productos de las varianzas de cada tratamiento por sus grados de
libertad (n 1 = 7) es la S UMA DE C UADRADOS R ESIDUAL:
SC R = (0.8571)(7) + (1.1429)(7) + (2.8393)(7) = 33.875
4) La suma de SC A y SC R es la S UMA DE C UADRADOS T OTAL: SC T = SC A + SC R.
14
First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (9)


Tabla de ANOVA de un factor (modelo de efectos fijos)
Variable dependiente: rendimiento

Fuentes

SC tipo III

gl

MC

P>F

Modelo

19.083

2 9.542 5.915

.009

A (dificultad)

19.083

2 9.542 5.915

.009

Residual

33.875 21 1.613

Total

52.958 23

Aspectos esenciales a considerar en esta salida:


El valor emprico de la razn F A : F A (2, 21) = 5.915; P = .009.
El ajuste del modelo. Es aceptable si 1) el modelo en conjunto es significativo, y 2) el factor A es tambin significativo.
2A = 0.290 (insesgada). Se
La magnitud del efecto: 2A = 0.360 (sesgada) y
consideran aceptables magnitudes del efecto moderadas o altas (> 0.09)
aunque depende tambin de la temtica de investigacin.
La potencia retrospectiva/observada: consultando la Tabla D del Anexo de
tablas estadsticas al 5 %, A = 0.824, con rango: [0.63 0.83].
15
First Prev Next Last Go Back Full Screen Close Quit

II. Modelos ANOVA de un factor con efectos fijos (10)


Las diferentes MEDIDAS DE MAGNITUD DEL EFECTO indican qu proporcin
de la varianza resulta explicada por los efectos de tratamiento:
SC A
19.083
=
= 0.360
(SC A + SC R ) (19.083 + 33.875)
(g l A )(F A 1)
(2)(4.915)
=
=
= 0.291
(g l A )(F A 1) + N (2)(4.915) + 24

2A =
2A

La primera medida, basada en ETA CUADRADO, es sesgada. La segunda es un


valor ajustado, pero inusual. La segunda es la O MEGA CUADRADO DE H AYS,
menos sesgada y ms recomendable. La frmula empleada es til cuando se
conoce la razn F pero no las MC . Si se conocen las MC , es ms riguroso utilizar los COMPONENTES DE LA VARIANZA. Siendo 2A = [(2(9.5421.613)]/24 =
2e = MC R = 1.613, entonces
2A = 0.661/(0.661 + 1.613) = 0.291, un
0.661 y
magnitud del efecto alta.
Siguiendo a Cohen, la escala de interpretacin de la magnitud del efecto es:
1) nula, por debajo de 0.01, 2) baja, de 0.01 hasta 0.09, 3) media o moderada
de 0.091 a 0.249, y 4) alta, mayor de 0.249.
16
First Prev Next Last Go Back Full Screen Close Quit

III. Diagnstico del modelo ANOVA de un factor (1)


Un modelo ANOVA debe satisfacer tres supuestos bsicos (DIP, p.116-119):
N ORMALIDAD de la variable de respuesta para cada tratamiento. Las
pruebas de normalidad ms comunes son:
la prueba de Shapiro-Wilk (para N 50), o bien
la prueba de Kolmogorov-Smirnov (para N > 50).
H OMOGENEIDAD de las varianzas, VARIANZA CONSTANTE de la variable de
respuesta para cada tratamiento, u HOMOCEDASTICIDAD. La prueba emprica ms comn es la prueba de Levene.
I NDEPENDENCIA de las observaciones, que se evala por la lgica derivada del diseo de investigacin utilizado. Cuando se sospecha de dependencia serial de las observaciones puede ser til aplicar la prueba de
Durbin-Watson.
El diagnstico y evaluacin de los supuestos se realiza aplicando el ANLISIS
DE RESIDUALES (vase tambin DIP, p. 79-83).
17
First Prev Next Last Go Back Full Screen Close Quit

III. Diagnstico de modelos ANOVA con efectos fijos (2)


Pruebas de normalidad
Kolmogorov-Smirnov
Shapiro-Wilk
dificultad Estadstico gl
P Estadstico gl
P
rendimiento A
0.205 8 .200
0.931 8 .522
B
0.250 8 .150
0.860 8 .120
C
0.168 8 .200
0.966 8 .862
Se cumple el supuesto de normalidad con estos datos empricos?
En el caso de que la prueba de normalidad resultara significativa, debe tenerse en cuenta que la razn F es robusta ante violaciones moderadas de la
normalidad.
18

First Prev Next Last Go Back Full Screen Close Quit

III. Diagnstico del modelo ANOVA con efectos fijos (3)


Prueba de Levene de homogeneidad de las varianzas
Variable dependiente: rendimiento

F
Basado en la media
2.244
Basado en la mediana 2.215

gl1
2
2

gl2
21
21

P>F
.131
.134

La PRUEBA DE L EVENE somete a prueba la hiptesis de que las varianzas de


error para cada uno de los niveles del factor A son iguales.
La prueba de Levene es bsicamente un ANOVA con los residuales del modelo ajustado.
Para obtener los valores residuales puede emplearse la media o la mediana.
Si las observaciones son muy dispersas, o existen observaciones extremas, es
conveniente emplear la mediana en lugar de la media.
Se cumple el supuesto de homogeneidad con estos datos empricos?
19

First Prev Next Last Go Back Full Screen Close Quit

III. Diagnstico del modelo ANOVA con efectos fijos (4)


En el caso de que se presente heterocedasticidad, el investigador tiene varias
alternativas a considerar.
En primer lugar, puede emplear el ESTADSTICO DE W ELCH o bien el ES TADSTICO DE B ROWN -F ORSYTE , que se adaptan a una gran variedad de
situaciones (vase DIP, p. 119-120).
En segundo lugar, se ha demostrado que siempre existe alguna TRANS FORMACIN DE LA VARIABLE DE RESPUESTA para eludir la presencia de heterocedasticidad. Entre las transformaciones ms comunes en psicologa
se encuentran la transformacin logartmica, la transformacin de la raz
cuadrada, la transformacin recproca y la transformacin arco-seno.
La ms rigurosa alternativa es buscar un valor de la FAMILIA DE TRANS FORMACIONES DE POTENCIA , que puede emplearse para transformar una
variable de respuesta que presente heterocedasticidad en una variable
homocedstica. Con SP SS, tal valor se obtiene utilizando un GRFICO DE
DISPERSIN POR NIVEL . Para consultar un ejemplo, vase DIP, p. 120-121.
20
First Prev Next Last Go Back Full Screen Close Quit

IV. Comparaciones mltiples entre medias de grupo (1)


Cuando en un ANOVA el factor tiene ms de 2 niveles, se requiere un ANLISIS POSTHOC mediante comparaciones mltiples entre medias de grupo (DIP, p.121-124). Hay
3 niveles de dificultad (baja, media y alta), y las diferencias pareadas posibles son
combinaciones de 3 elementos tomados de 2 a 2:
3!
=3
2!(3 2)!
Variable dependiente: rendimiento
(I)
(J)
dificultad dificultad
HSD de Tukey
baja
media
alta
media
baja
alta
alta
baja
media
Scheff
baja
media
alta
media
baja
alta
alta
baja
media

Diferencia de
medias (I-J)
1.500
2.125
1.500
0.625
2.125
0.625
1.500
2.125
1.500
0.625
2.125
0.625

Error
tpico
0.635
0.635
0.635
0.635
0.635
0.635
0.635
0.635
0.635
0.635
0.635
0.635

P
.069
.008
.069
.595
.008
.595
.084
.011
.084
.623
.011
.623

Lmites IC 95 %
Inferior Superior
0.101
3.101
0.524
3.726
3.101
1.075
0.976
2.226
3.726
0.524
2.226
0.976
0.172
3.172
0.453
3.797
3.172
0.172
1.047
2.297
3.797
0.453
2.297
1.047

Cmo se interpreta esta salida?


21
First Prev Next Last Go Back Full Screen Close Quit

IV. Comparaciones mltiples entre medias de grupo (2)


Cuando hay muchos niveles de factor, la presentacin clsica no es manejable. Recientemente se ha popularizado una forma ms sencilla de presentacin, las COMPARACIONES MLTIPLES MEDIANTE PRUEBAS DE RANGO, que
ordenan las medias mostrando subconjuntos de comparaciones que no son
significativas. Un ejemplo con la prueba de Tukey muestra las medias de grupo en dos subconjuntos no significativos, el subconjunto baja-media (con
P = .069) y el subconjunto media-alta (con P = .595).
Variable dependiente: rendimiento

Factor dificultad
alta
media
baja

Probabilidad

n
8
8
8

Subconjuntos con P >.05


Subconjunto 1 Subconjunto 2
4.375
5.000
5.000
6.500
.069
.595

Los resultados suelen reportarse de forma ordinal: baja>media,media>alta, o


bien utilizando dgitos en lugar de categoras: 1>2, 2>3. Observa que la comparacin 1-3 est ausente porque es significativa (se asume P < .05).
22
First Prev Next Last Go Back Full Screen Close Quit

IV. Comparaciones mltiples entre medias de grupo (3)


Cuando un factor de tratamiento es ordinal, o sea, se trata de una variable numrica cuasi-cuantitativa, entonces las comparaciones entre medias de grupo con factores nominales carecen de inters y pueden plantearse hiptesis
ms sofisticadas. Una de las hiptesis ms interesantes consiste en determinar la tendencia que siguen los datos empricos. El resultado es el ANLISIS
DE TENDENCIAS (DIP, p. 124-128).
El ejemplo siguiente procede de una investigacin con 24 nios a los que se
asignaron al azar 4 condiciones en funcin del tiempo invertido en aprender
12 palabras. Se midi el recuerdo obtenido despus de aplicar una tarea de
interferencia.
Por lo dems, obsrvese que en esta investigacin hay un factor de tratamiento de naturaleza ordinal (tiempo de exposicin, con 4 niveles), que se han
utilizado 6 rplicas (porque hay 4x6=24 unidades experimentales), y que en
cada nio se midi el tiempo en minutos invertido en aprender una lista de
12 palabras.
23

First Prev Next Last Go Back Full Screen Close Quit

IV. Comparaciones mltiples entre medias de grupo (4)


Datos empricos y estadsticos descriptivos.

tiempo recuerdo . . . tiempo recuerdo . . . tiempo recuerdo


1
1
1
1
1
1
2
2

2
3
1
2
0
4
6
8

2
2
2
2
3
3
3
3

5
3
7
7
6
8
10
5

3
3
4
4
4
4
4
4

10
9
11
10
7
9
8
9

recuerdo

tiempo Media Suma Varianza N


1
2.00 12.00
2.000 6
2
6.00 36.00
3.200 6
3
8.00 48.00
4.400 6
4
9.00 54.00
2.000 6
Total
6.25 150.00
10.022 24
24
First Prev Next Last Go Back Full Screen Close Quit

IV. Comparaciones mltiples entre medias de grupo (5)

10,00

A]
A]
recuerdo

7,50

A]
5,00

2,50

A]

0,00
1,00

2,00

3,00

4,00

tiempo
Los intervalos muestran un lC de la media al 95,0%
Los puntos/lneas muestran Medias

25
First Prev Next Last Go Back Full Screen Close Quit

IV. Comparaciones mltiples entre medias de grupo (6)


Tabla ANOVA de un factor (efectos fijos)
Variable dependiente: recuerdo

Fuentes
Modelo
tiempo
Residual
Total

SC tipo III

gl

MC

P>F

172.500

3 57.500 19.828

.000

172.500

3 57.700 19.828

.000

58.000 20

2.900

230.500 23

Puesto que tiempo se toma como una variable cuasi-cuantitativa u ordinal


(ya que no interesan valores intermedios de tiempo), las comparaciones entre medias de grupo carecen de inters. La atencin se concentra en su lugar
en la tendencia que siguen las medias de grupo. El ANLISIS DE TENDENCIAS
permite descomponer la tendencia observada en componentes polinmicos
mutuamente ortogonales. La tendencia lineal asume un polinomio de primer
grado. La tendencia cuadrtica asume un polinomio de segundo grado. La
tendencia cbica asume un polinomio de tercer grado.
26

First Prev Next Last Go Back Full Screen Close Quit

IV. Comparaciones mltiples entre medias de grupo (7)

LINEAL

CUADRATICA

CUBICA

27
First Prev Next Last Go Back Full Screen Close Quit

IV. Comparaciones mltiples entre medias de grupo (8)


Puesto que hay a 1 = 3 grados de libertad para el factor A puede descomponerse
la SC A en tres tendencias: lineal, cuadrtica y cbica. Para ello se consultan los
coeficientes en las tablas de polinomios ortogonales en la Tabla F del apndice de
tablas (DIP, p.545) y se realizan los clculos que se resumen en la tabla siguiente
(DIP, Cuadro 3.9, p. 127).
Coeficientes polinmicos y estimadores de los parmetros de la tendencia

tiempo Medias Y j
1
2
3
4

2.000
6.000
8.000
9.000

P
c Y
qPj j
c 2j
=

P
cjY j
qP
c 2j
2

SC = n

Coeficientes c j
Lineal Cuadrtico

3
1
1
3
23

Cbico

1
1
1
1
3

1
3
3
1
1

5.143

1.500

0.224

158.700

13.5

0.300

p
20 = 4.4721

p
p
4=2
20 = 4.4721

28
First Prev Next Last Go Back Full Screen Close Quit

IV. Comparaciones mltiples entre medias de grupo (9)


La tabla ANOVA representa el contraste de cada una de las tendencias (con
un grado de libertad) con su correspondiente suma de cuadrados. Respecto del Modelo, la contribucin ms importante es la del componente lineal,
que representa una proporcin de varianza explicada de 158.7/172.5 = 0.920,
pero tambin es significativo al 5 % el componente cuadrtico, aunque representa una modesta proporcin de 13.5/172.5 = 0.078. Respecto del Total,
la contribucin lineal representa una proporcin de 158.7/230.5=0.689, y la
del componente cuadrtico una proporcin de 13.5/230.6=0.059.
Variable dependiente: recuerdo

Fuentes
SC tipo III gl
MC
F
Modelo
172.500 3 57.500 19.828
tiempo
172.500 3 57.700 19.828
Contraste lineal
158.700 1 158.700 54.724
Contraste cuadrtico
13.500 1 13.500 4.655
Contraste cbico
0.300 1
0.300 0.103
Residual
58.000 20
2.900
Total
230.500 23

P>F
.000
.000
.000
.043
.751

29
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (1)


Los ingredientes de los modelos ANOVA con 2 factores de efectos fijos son los
factores A y B , con a b combinaciones de tratamiento, para cada una de las
cuales se observan un total de n rplicas (asumiendo un diseo equilibrado).
Yi j k =

jk

ei j k

Yi j k = + j + k + () j k +

ei j k

D AT OS =

MODE LO

+ RE SI DU AL

donde Yi j k es el valor observado de la variable de respuesta para la i -sima


rplica de la j k-sima combinacin de tratamiento, es la media de la respuesta esperada global, que es constante para todas las combinaciones de
tratamiento y para todas las rplicas, j k es la respuesta esperada especfica
para la j k-sima combinacin de tratamiento, que es constante dentro de
cada combinacin.
La primera ecuacin corresponde al MODELO DE MEDIAS y la segunda al MO DELO DE EFECTOS . A efectos de computacin estadstica se prefiere la segunda ecuacin (que define efectos de tratamiento) a la primera (que no utiliza
efectos de tratamiento).
30
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (2)


Las fuentes de variacin se definen en el modelo de efectos con los siguientes
trminos (DIP, p. 128-132):
j = j es el EFECTO PRINCIPAL ( O MARGINAL ) del j -simo tratamiento
del factor A, que se supone constante para todas las rplicas dentro de un
tratamiento pero puede diferir para diferentes tratamientos;
k = k es el EFECTO PRINCIPAL ( O MARGINAL ) del k-simo tratamiento del factor B , que se supone constante para todas las rplicas dentro de
un tratamiento pero puede diferir para diferentes tratamientos;
() j k = j k j k + es el EFECTO DE LA INTERACCIN entre el j simo nivel de A y el k-simo nivel de B. Es en realidad lo que queda por
explicar de la respuesta esperada j k que no explican conjuntamente ,
j y k , ya que debe cumplirse la igualdad:
j k ( j ) (k ) = j k j k +
e i j k = Yi j k j k es el RESDUO O ERROR EXPERIMENTAL que corresponde a
la i -sima rplica de la j k-sima combinacin de tratamiento. Se asume
que e i j k N I D(0, 2e ).
31
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (3)


Fuentes de
variacin

Sumas de Grados de
cuadrados libertad

Medias
Cuadrticas
SC A
(a 1)
MC A =
glA
SC B
(b 1)
MC B =
g lB
SC AB
(a 1)(b 1) MC AB =
g l AB
SC R
ab(n 1)
MC R =
g lR
abn 1

SC A

SC B

AB

SC AB

Residual

SC R

Total

SC T

Razones F
MC A
FA =
MC R
MC B
FB =
MC R
MC AB
F AB =
MC R

Como con el modelo de un factor, la inferencia depende de las E (MC ) y las


razones F prueban cada efecto dividiendo su MC por la MC R :
E (MC A ) = 2e + nb2
E (MC B ) = 2e + na2

2
E (MC AB ) = 2e + n

E (MC R ) = 2e
32
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (4)


El ANOVA de dos factores que acabamos de describir incluye todos los
efectos factoriales posibles. Se denomina MODELO INTERACTIVO (o tambin MODELO NO ADITIVO) porque incluye la interaccin (DIP, p.128-132).
Otros modelos ms restringidos de ANOVA de dos factores son:
el modelo que incluye slo los efectos principales de A y B , pero no
la interaccin. Se denomina MODELO ADITIVO y su formulacin es:
Y i j k = + j + k + e i j k .
el modelo que no incluye ninguno de los efectos principales ni el efecto interactivo. Es el MODELO NULO: Yi j k = + e i j k .
Un error bastante comn consiste en ajustar el modelo interactivo de orden superior e interpretar los resultados aunque tal efecto no haya sido
estadsticamente significativo. Con esta actitud se viola el principio de la
parsimonia y puede conducir a graves errores de interpretacin. Si la interaccin no es significativa, no es vlido interpretar el modelo interactivo. En tal caso, el investigador debe considerar el modelo aditivo.
33
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (5)


El concepto de INTERACCIN entre dos variables (A y B ) se refiere al efecto
sinrgico que produce la combinacin de las dos variables y se define
como la parte de la varianza de la variable de respuesta que no pueden
explicar los efectos principales por separado (DIP, p.132-135).
Para analizar e interpretar la interaccin es necesario inspeccionar los
promedios de las combinaciones de tratamiento y/o el GRFICO DE IN TERACCIN . Consideremos tres situaciones empricas posibles:

a1
a2
Yk

a1
a2
Yk

Situacin 1
b1 b2 b3
2 6 7
4 8 9
3 7 8

Situacin 2
b1 b2 b3
8 6 4
4 6 8
6 6 6

Yj
6
6
6

Yj
5
7
6
Situacin 3
b1 b2 b3 Y j
7 7 7
7
3 5 7
5
5 6 7
6
34
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (6)

Situacin 1: Grfico de no interaccin

factor.A

6
5
4
3
2

mean of vr

a2
a1

b1

b2

b3
factor.B

35
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA de 2 factores con efectos fijos (7)

Situacin 2: Grfico de interaccin no ordinal

factor.A

6
5
4

mean of vr

a2
a1

b1

b2

b3
factor.B

36
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (8)

Situacin 3: Grfico de interaccin ordinal

factor.A

5
4
3

mean of vr

a1
a2

b1

b2

b3
factor.B

37
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (9)


La interpretacin de los efectos interactivos debe realizarse con mxima
precaucin y preferentemente despus de un ajuste condicional de modelos. Slo cuando el modelo interactivo o no aditivo se ajuste ser conveniente interpretar los efectos interactivos.
La presencia de interaccin implica que los efectos de un factor
no son consistentes a todos los niveles del otro factor. Por esta razn, en presencia de interaccin significativa (o sea, cuando se ajusta el modelo no aditivo) debe interpretarse slo la interaccin, pero
no los efectos principales, mientras que cuando la interaccin no es significativa (o sea, cuando se ajusta el modelo aditivo, una vez simplificado el modelo), deben interpretarse slo los efectos principales. Esta es una
consecuencia de aplicar el PRINCIPIO DE MARGINALIDAD DE N ELDER.
Para interpretar correctamente los efectos principales en presencia de interaccin, puede ser necesario analizar los EFECTOS SIMPLES, que examinan los efectos de un factor para todos los niveles del otro factor. Para
casos simples, es suficiente el ANLISIS GRFICO DE LA INTERACCIN. Para casos ms complejos puede ser necesaria la ayuda de un experto.
38
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (10)


Experimento realizado para probar el efecto conjunto de la Motivacin
inducida (factor A) y del Tipo de tarea (factor B ) sobre el rendimiento en
una tarea de aprendizaje.
Se emplearon tres tipos de motivacin inducida: a1: alta, a2: media y a3:
baja y tres tipos de tareas de aprendizaje: b1: difcil, b2: moderada y b3:
fcil.
El investigador utiliz n = 5 rplicas por tratamiento.
Se asume que A y B son factores fijos, puesto que el investigador solo se
interesa por los niveles bajo estudio, despreciando todos los dems.
b1
b2
b3
Medias A
a1
7, 6, 7, 7, 8 6, 4, 5, 4, 6 9, 10, 8, 8, 10
Alta
7
5
9
7
a2
6, 5, 7, 5, 7 3, 3, 5, 3, 6 4, 5, 7, 4, 5
Media
6
4
5
5
a3
1, 3, 2, 3, 1 2, 3, 4, 3, 3 3, 6, 3, 4, 4
Baja
2
3
4
3
Medias B
5
4
6
5
39
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (11)


b1 b2 b3 B
a1 7 5 9 7
4 5 5
Tabla de medias a2 6
a3 2 3 4 3
A 5 4 6 5
Los EFECTOS PRINCIPALES son diferencias entre medias de grupo y media global.
As, los efectos de A son las diferencias (75) = 2, (55) = 0 y (35) = 2. La suma
de los efectos es cero. El producto de la suma cuadrtica de las diferencias por sus
multiplicadores (que para A son n y b) es la SC A :
X
SC A = nb 2j = (5)(3)[22 + 0 + (2)2 ] = (5)(3)(8) = 120
SC B = na

2j = (5)(3)[02 + (1)2 + 12 ] = (5)(3)(2) = 30

Los EFECTOS INTERACTIVOS DE PRIMER ORDEN son tambin diferencias entre las
medias de casilla, su media de fila, su media de columna y la media global. La
suma de los efectos es cero. El producto de los multiplicadores (que para A y B es
n) por la suma cuadrtica de las diferencias es la SC AB :
SC AB = n

c 2 = (5)[0 + (1)2 + 12 + 12 + 0 + (1)2 + (1)2 + 12 + 0] = (5)(6) = 30

jk
40
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (12)


b1 b2 b3
a1 0.5 1
1
Tabla de varianzas
a2 1
2 1.5
a3 1 0.5 1.5
Una vez obtenidos los efectos principales de A y B y su efecto interactivo
AB , puede obtenerse el componente residual, SC R , calculando el producto
de n 1 (el nmero de rplicas menos 1) por la suma de todas las varianzas:
SC R = (n 1)[0.5 + 1 + 1 + 1 + 2 + 1.5 + 1 + 0.5 + 1.5] = (4)(10) = 40
Tabla ANOVA del modelo no aditivo
Variable dependiente: rend

Fuentes SC tipo III gl


MC
F
Modelo
180.000 8 22.500 20.250
A
120.000 2 60.000 54.000
B
30.000 2 15.000 13.500
A*B
30.000 4 7.500 6.750
Residual
40.000 36 1.111
Total
220.000 44

P>F
.000
.000
.000
.000

2p

.818 162.000
.750 108.000
.429 27.000
.429 27.000

41
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (13)


Grfico de la interaccin

Objetivos del anlisis grfico: Conseguir lneas paralelas.


Pasos del anlisis grfico: 1) Bajar a1b3 de 9 a 6; 2) Subir a3b1 de 2 a 6 y 3) interpretar los cambios realizados.
42
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (14)


Grfico de la interaccin

La interaccin se produce al combinar una alta motivacin con una tarea


fcil y una baja motivacin con una tarea difcil.

A -Motivacin1 - alta
2 - media
3 - baja
B -Tareas1 - difcil
2 - moderada
3 - fcil

43
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (15)


Puesto que la interaccin AB es significativa, para ayudar a la interpretacin
del efecto es recomendable analizar los EFECTOS SIMPLES DE A PARA CADA
UNO DE LOS NIVELES DE B :
Tabla de los efectos simples de A (motivacin) para cada nivel de B (tarea)
Variable dependiente: rend

Efecto simple de A para


b1 Contraste
Error
b2 Contraste
Error
b3 Contraste
Error

SC gl
MC
F
70.000 2 35.000 31.000
40.000 36 1.111
10.000 2 5.000 4.500
40.000 36 1.111
70.000 2 35.000 31.500
40.000 36 1.111

P (ajust)
.000
.054
.000

Como chequeo analtico, se comprueba que la suma de los efectos simples


de A (70+10+70 = 150) es igual a SC A + SC AB = 120 + 30 = 150. Ntese que
los efectos simples de A (motivacin) para tarea= b1 y tarea= b3 resultan
especialmente relevantes.
44
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (16)


Del mismo modo, tambin pueden analizarse los EFECTOS SIMPLES DE B
CADA UNO DE LOS NIVELES DE A, como muestra la salida siguiente.

PARA

Tabla de los efectos simples de B (tarea) para cada nivel de A (motivacin)


Variable dependiente: rend

Efecto simple de B para


a1 Contraste
Error
a2 Contraste
Error
a3 Contraste
Error

SC gl
MC
F
40.000 2 20.000 18.000
40.000 36 1.111
10.000 2 5.000 4.500
40.000 36 1.111
10.000 2 5.000 4.500
40.000 36 1.111

P >F
.000
.054
.054

Como puede comprobarse, tambin la suma de los efectos simples de B


(40+10+10 = 60) es igual a SC B + SC AB = 30 + 30 = 60. En este caso, resulta
especialmente destacable el efecto de B para motivacin= a1.
El EFECTO DE INTERACCIN puede definirse como el resultado de la desviacin del patrn de paralelismo de b3 (para el nivel a1) y de b1 (para el nivel
a3).
45
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (17)


En un ANOVA factorial las proporciones de varianza explicada basadas en
ETA CUADRADO se interpretan como coeficientes de determinacin:
2A = SC A /SC T = 0.545;

2B = SC B /SC T = 0.136;

2AB = SC AB /SC T = 0.136

y la magnitud del efecto conjunto es su suma: R Y2 .AB = 0.818. SPSS reporta


coeficientes ETA CUADRADO PARCIALES, que son especficos del efecto
2A =

SC A
= 0.750;
SC A + SC R

2B =

SC B
= 0.429;
SC B + SC R

2AB =

SC AB
= 0.429
SC AB + SC R

pero su suma es mayor de 1. Ambos ndices son sesgados. Un ndice menos


sesgado y ms recomendable es la 2 de Hays. Cuando solamente se conoce
la F , casi siempre puede calcularse un efecto j con (DIP, p.140, frmula 3.36):
(g l j )(F j 1)
2j = P

[ J (g l j )(F j 1)] + N ]
2A =

106
= 0.533;
199

2B =

25
= 0.126;
199

2AB =

23
= 0.116
199
46

First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (18)


La frmula anterior para estimar la O MEGA C UADRADO de Hays NO es vlida
para todos los casos. Si se tiene acceso a las medias cuadrticas, una forma
ms segura de obtener el ndice 2 consiste en utilizar la razn de la estimacin de la varianza del efecto dividida por la varianza total. Para ello se
precisa estimar primero los COMPONENTES DE LA VARIANZA (DIP, p.141):
(a 1)(MC A MC R ) (2)(60 1.111)
=
= 2.617
A =
N
45
(b 1)(MC B MC R ) (2)(15 1.111)
B =
=
= 0.617
N
45
(a 1)(b 1)(MC AB MC R ) (4)(7.5 1.111)
=
= 0.568
AB =
N
45
R = MC R = 1.111

T = 2.617 + 0.617 + 0.568 + 1.111 = 4.913, entonces


Y siendo la varianza total
2A = 2.617/4.913 = 0.533

2B = 0.617/4.913 = 0.126

2AB = 0.568/4.913 = 0.116

47
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (19)


Es muy simple generalizar de 2 factores a ms de 2 factores (genricamente se llama ANOVA FACTORIAL al modelo ANOVA resultante).
Factores
2
3

Efectos
Efectos Interactivos
Principales Primer orden Segundo orden Tercer orden
A
AB
B
A
AB,AC
ABC
B
BC
C
A
AB, AC, AD ABC, ABD, ACD
ABCD
B
BC, BD
BCD
C
CD
D

El conjunto de modelos constituye una JERARQUA DE EFECTOS FACTO RIALES complejos. Aplicando el principio de marginalidad con 3 factores,
puede especificarse el modelo de efectos principales (modelo [A,B,C]), el
modelo de efectos interactivos de primer orden (modelo [AB,AC,BC]), o el
modelo de efectos interactivos de segundo orden (modelo [ABC]).
48
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (20)


Adems de los efectos principales e interactivos, hay otros modelos de la
jerarqua de efectos factoriales que aplican el principio de marginalidad
en combinacin con el principio de parsimonia.
Una condicin bsica que debe cumplir cualquier miembro de la jerarqua de efectos factoriales es que cualquier modelo especificado debe
contener todos los factores definidos en el diseo de la investigacin.
En concreto, para el caso de un ANOVA factorial con 3 factores, hay dos
formas posibles para simplificar el modelo interactivo de primer orden:
los modelos de doble asociacin (modelos [AB,AC], [AB,BC] y [AC,BC]),
que utilizan dos de las tres interacciones de primer orden, y
los modelos condicionales (modelos [A,BC], [B,AC] y [C,AB]), que emplean una interaccin de primer orden y un efecto principal complementario.
Al aumentar el nmero de factores aumenta el nmero de efectos interactivos y la dificultad para interpretar las interacciones (DIP, p.141-142).
49
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (21)


El ejemplo siguiente procede de una investigacin donde se pretenda analizar el
efecto conjunto de tres factores: Ansiedad (factor A, con niveles a1: baja y a2:
alta), Tensin muscular (factor B , con niveles b1: alta y b2: baja) y Dificultad
de la tarea (factor C , con niveles c1: alta y c2: baja). Como variable de respuesta
se utiliz el rendimiento en una tarea de aprendizaje.
caso A B C rend
1
1 1 1 14
2
1 1 1 12
3
1 1 1 12
4
1 1 2 18
5
1 1 2 14
6
1 1 2 16
7
1 2 1 12
8
1 2 1 10

caso A B C rend
9
1 2 1
8
10
1 2 2 14
11
1 2 2 10
12
1 2 2 15
13
2 1 1
9
14
2 1 1 12
15
2 1 1
8
16
2 1 2 12

caso A B C red
17
2 1 2 10
18
2 1 2 7
19
2 2 1 6
20
2 2 1 2
21
2 2 1 8
22
2 2 2 10
23
2 2 2 11
24
2 2 2 8

En modelos con tres o ms factores, muchos investigadores obtienen la tabla


ANOVA e interpretan todos los efectos significativos. El MODELADO ESTADSTICO
requiere primero encontrar el modelo que mejor se ajuste y despus interpretar
los efectos significativos del modelo ajustado aplicando el principio de marginalidad y, opcionalmente, el principio de parsimonia.
50
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (22)


Se estima primero el modelo INTERACTIVO DE SEGUNDO ORDEN:
Variable dependiente: rend

Fuentes

SC tipo III

gl

MC

209.167

29.881

6.183

.001

112.667

1 112.667 23.310

.000

37.500

37.500

7.759

.013

42.667

42.667

8.828

.009

AB

.667

.667

0.138

.715

AC

1.500

1.500

0.310

.585

BC

6.000

6.000

1.241

.282

ABC

8.167

8.167

1.690

.212

77.333 16

4.833

Modelo

Residual
Total

P>F

286.500 23

La cuestin es si este modelo se ajusta o no. Para ello se examina la significacin del trmino superior de la jerarqua, la interaccin de segundo orden
(ABC ). El efecto es F (2, 26) = 1.690; P = .212.
Qu se debe hacer a continuacin?
51
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (23)


Una vez eliminado el componente interactivo ABC , se estima el MODELO IN TERACTIVO DE PRIMER ORDEN .
Variable dependiente: rend

Fuentes SC tipo III gl


MC
F
Modelo
201.000 6 33.500 6.661
A
112.667 1 112.667 22.402
B
37.500 1 37.500 7.456
C
42.667 1 42.667 8.483
AB
.667 1
.667 0.133
AC
1.500 1
1.500 0.298
BC
6.000 1
6.000 1.193
Residual
85.500 17
5.029
Total
286.500 23

P>F
.001
.000
.014
.010
.720
.592
.290

Para decidir si el modelo se ajusta, se examina la significacin de las interacciones de primer orden (AB , AC y BC ). Como ninguna de ellas es significativa, el modelo se simplifica eliminando las interacciones AB , AC y BC . Si
alguna de ellas hubiera sido significativa, el investigador podra proceder o
bien aceptando este modelo o simplificndolo eliminando lo superfluo.
52
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (24)


Eliminando todos los componentes interactivos de primer orden por no ser
significativos se obtiene el MODELO DE EFECTOS PRINCIPALES.
Variable dependiente: rend

Fuentes

SC tipo III

gl

192.833

64.278 13.726

.001

112.667

1 112.667 24.057

.000

37.500

37.500

8.007

.010

42.667

42.667

9.110

.007

93.667 20

4.683

Modelo

Residual
Total

MC

P>F

286.500 23

Para decidir si el modelo se ajusta, se examina la significacin de los efectos principales (A, B y C ). Si al menos uno de ellos es significativo, el proceso se detiene y se concluye que se ajusta el modelo de efectos principales interpretando por separado el efecto de A: F (1; 20) = 24.057; P < .05,
el de B : F (1; 20) = 8.007; P < .05 y el de C : F (1; 20) = 9.110; P < .007. Si
ninguno de ellos es significativo, el investigador debe concluir que no se ajusta ningn modelo. El modelo de efectos principales no puede ser simplificado, porque de hacerlo as se alterara la estructura del diseo.
53
First Prev Next Last Go Back Full Screen Close Quit

V. Modelos ANOVA factorial con efectos fijos (25)


Todo el proceso puede hacerse tambin mediante
MODELOS en una presentacin simultnea.

AJUSTE CONDICIONAL DE

Modelo 1: rendim = 1
Modelo 2: rendim = A + B + C
Modelo 3: rendim = A + B + C + A*B + A*C +B*C
Modelo 4: rendim = A + B + C + A*B + A*C +B*C + A*B*C

Modelo
SC R g l R
SC R g l R
F Pr(>F)
1
286.500 23
2
93.667 20 192.833
3 13.725
.000
3
85.500 17
8.167
3 0.541
.661
4
77.333 16
8.167
1 1.690
.212

La lectura se hace de abajo a arriba. As, F (1, 16) = 1.690; P = .212, compara
los modelos 3 y 4 y selecciona temporalmente el modelo 3. A continuacin,
F (3, 17) = 0.541; P = .661, compara los modelos 2 y 3 y selecciona temporalmente el modelo 2. Finalmente, F (3, 20) = 13.725; P < .001, compara los modelos 1 y 2 y permite finalmente concluir que el mejor es el modelo 2.
54
First Prev Next Last Go Back Full Screen Close Quit

VI. Introduccin a los modelos ANCOVA (1)


Uno de los principales problemas de los modelos ANOVA es la ALTA HE TEROGENEIDAD que suelen presentar las unidades experimentales en la
variable de respuesta, particularmente cuando se trata de sujetos humanos (DIP, p.189-190)
Cuando sto sucede, la varianza de las puntuaciones de cada tratamiento
resulta inflada y la estimacin de la MC R excede su valor real. Como consecuencia, cualquier razn F que contenga la MC R en el denominador
resultar negativamente sesgada.
Si se conoce la variable (o variables) responsable de la heterogeneidad,
es posible controlarla (o lo que es lo mismo, separar su efecto del componente de error) incluyendo tal variable como una variable numrica en el
modelo ANOVA.
La combinacin de (al menos) un factor categrico y (al menos) una variable numrica es el MODELO DE ANLISIS DE COVARIANZA (ANCOVA). La
variable numrica se conoce en este contexto con el nombre de VARIABLE
CONCOMITANTE , COVARIABLE o COVARIANTE .
55
First Prev Next Last Go Back Full Screen Close Quit

VI. Introduccin a los modelos ANCOVA (2)


En el caso ms simple, suponiendo un factor de efectos fijos (A) y una covariante (X ), el modelo ANCOVA se formula, utilizando los valores observados
de la covariante, X i j , bien sea mediante el modelo de medias o el modelo de
efectos, respectivamente,
Yi j = X i j + j + e i0 j
Yi j = X i j + + j + e i0 j
cuyos componentes son:
una constante fija,
coeficiente de regresin de la covariante X i j sobre la variable de respuesta Y , que se asume comn a todos los tratamientos,
j efecto factorial fijo definido como j = j , donde j media
de grupo para el j -simo tratamiento, y
e i0 j error residual que se asume N I D(0, 2e ).
56
First Prev Next Last Go Back Full Screen Close Quit

VI. Introduccin a los modelos ANCOVA (3)


Puesto que se supone que existe un grado importante de correlacin entre
la covariante X y la variable de respuesta Y (se requiere una correlacin mnima de X Y > 0.40 para que la covariante sea efectiva), la inclusin de la
covariante en el modelo puede ser utilizada para reducir la varianza de error.
Este es uno de los usos del modelo ANCOVA. De hecho, el error residual e i j
de un modelo ANOVA se considera dividido en un modelo ANCOVA en dos
porciones independientes,
e i j = X i j + e i0 j
(Residual ANOVA)

(Residual ANCOVA)

donde
es el coeficiente de regresin que describe la relacin de la covariante
X i j con la variable de respuesta, y
e i0 j son los errores residuales del modelo ANCOVA que se asumen tambin N I D(0, 2e ).
57
First Prev Next Last Go Back Full Screen Close Quit

VI. Introduccin a los modelos ANCOVA (4)


La conexin entre el modelo ANCOVA y el modelo ANOVA de un factor se
demuestra trasladando al lado izquierdo de la ecuacin bsica el trmino de
regresin X i j ,
Yi j X i j = + j + e i0 j
Ahora la parte derecha es un modelo ANOVA de un factor...
...mientras que en la parte izquierda la variable de respuesta ya no es Yi j ,
sino la diferencia Yi j X i j , o sea, los residuales de un modelo de regresin
donde la covariante es el predictor.
Adems, el error residual e i j del modelo ANOVA se sustituye por el error
e i0 j en el modelo ANCOVA, y ser siempre menor que el error del modelo
ANOVA, excepto si la covariante es irrelevante (en cuyo caso, Y X = 0).
En consecuencia, si la covariante es efectiva, el modelo ANCOVA producir una prueba ms potente de los efectos de tratamiento j que el modelo ANOVA como consecuencia de la reduccin en la varianza de error.
58

First Prev Next Last Go Back Full Screen Close Quit

VI. Introduccin a los modelos ANCOVA (5)


Es posible distinguir en este contexto cinco submodelos en una estructura
jerrquica (DIP, p.191-193) Son los siguientes:
(a) el MODELO NULO (modelo 1): Yi j = + e i j , donde no hay ni efecto de
la covariante ni efecto de tratamiento;
(b) el MODELO DE REGRESIN SIMPLE (modelo 2): Yi j = + 1 X i j + e i j ,
que presupone una misma recta de regresin para todos los tratamientos,
donde no hay efecto de tratamiento, pero s hay efecto de la covariante;
(c) MODELO ANOVA (modelo 3): Yi j = + j + e i j , donde hay efecto de
tratamiento, pero no de la covariante (rectas de regresin con pendiente
cero). Se denomina tambin modelo con pendientes nulas.
(d) MODELO ANCOVA (modelo 4): Yi j = + X i j + j + e i0 j , que supone
rectas de regresin con intersecciones diferentes pero con una pendiente
comn para cada tratamiento. Se denomina tambin modelo con pendientes paralelas u homogneas.
(e-f) MODELO ANCOVA CON PENDIENTES HETEROGNEAS (modelo 5):
Yi j = + j X i j + j +( j j X i j )+e i0 j , que tambin supone lneas de regresin separadas, pero con pendientes diferentes para cada tratamiento.
59
First Prev Next Last Go Back Full Screen Close Quit

VI. Introduccin a los modelos ANCOVA (6)


(c)

(b)

(a)

X
(d)

(e)

(f)

60
First Prev Next Last Go Back Full Screen Close Quit

VI. Introduccin a los modelos ANCOVA (7)


Adems de los supuestos tpicos del modelo ANOVA (normalidad, homoscedasticidad e independencia), el modelo ANCOVA (modelo 4) requiere tres
nuevos supuestos (DIP, p. 193-194):
Supuesto de LINEALIDAD ENTRE VARIABLE DE RESPUESTA Y COVARIANTE;
Supuesto de INDEPENDENCIA ENTRE COVARIANTE Y TRATAMIENTO;
Supuesto de HOMOGENEIDAD O PARALELISMO DE LAS PENDIENTES DE RE GRESIN porque la pendiente (pendiente de regresin de la covariante
sobre la variable de respuesta) se supone comn para todos los niveles
del factor, o sea: 1 = . . . = a = .
Este ltimo supuesto es clave y se prueba ajustando el modelo ANCOVA
con pendientes heterogneas (modelo 5): si se ajusta, el modelo ANCOVA
no es aplicable (aunque existen soluciones alternativas); si no se ajusta,
el modelo ANCOVA es aplicable.
61

First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (1)


El ejemplo que tratamos a continuacin procede de una investigacin que
comparaba tres mtodos de entrenamiento, el factor metodo (A), con niveles
a1 (tradicional), a2 (competitivo) y a3 (cooperativo), para mejorar el
rendimiento en matemticas en nios de primaria. Los nios participantes
se asignaron a los tratamientos en funcin de una serie de necesidades escolares, pero no de forma aleatoria. Antes de iniciar el estudio, el centro dispona de las puntuaciones en una escala de inteligencia (intel, covariante X 1)
y en una escala de autoestima (auto, covariante X 2). Al final del mismo, se
utiliz una escala de conocimiento matemtico para evaluar el rendimiento
obtenido (rend, variable de respuesta Y ).
Caso
1
2
3
4
5
6
7

A
a1
a1
a1
a1
a1
a1
a1

X1
3
7
10
8
14
8
13

X2
6
12
13
15
14
7
12

Y
8
12
16
14
19
12
17

Caso
8
9
10
11
12
13
14

A
a2
a2
a2
a2
a2
a2
a2

X1
13
17
10
9
4
6
4

X2
11
9
10
11
6
6
4

Y
15
20
14
12
8
9
6

Caso
15
16
17
18
19
20
21

A X1 X2 Y
a3 14 14 24
a3 10 13 22
a3 8 15 20
a3 4 13 16
a3 5 12 14
a3 8 15 18
a3 7 10 12
62

First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (2)


Asumimos el modelo ms simple, un factor (mtodo), una covariante (intel)
y una variable de respuesta (rend).
Anlisis descriptivo
mtodo
Media Suma
a1
intel
9.0000 63.00
rend 14.0000 98.00
a2
intel
9.0000 63.00
rend 12.0000 84.00
a3
intel
8.0000 56.00
rend 18.0000 126.00
Total
intel
8.6667 182.00
rend 14.6667 308.00

Varianza N
14.0000 7
13.6667 7
23.3333 7
23.0000 7
11.0000 7
18.6667 7
14.7333 21
23.1333 21

Variable dependiente: rend

Fuentes SC tipo III gl


MC
F
Modelo
130.667 2 65.333 3.542
metodo
130.667 2 65.333 3.542
Residual
332.000 18 18.444
Total
462.667 20

P>F
.050
.050

63
First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (3)

metodo
a1
a2

25,00

a3

W
W

20,00

rend

W
W

15,00

W
W

W W W
10,00

W W

W
4,00

8,00

12,00

16,00

intel
64
First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (4)


Recomendamos estimar un modelo ANCOVA con el procedimiento de estrategias de modelado propuesto por Milliken y Johnson (DIP, p.200-202). En la
primera fase se cuestiona si las pendientes de regresin son nulas. En caso
positivo, es ms conveniente el modelo ANOVA (modelo 3); en caso negativo,
se pasa a la segunda fase, donde se cuestiona si las pendientes son iguales.
En caso positivo, es mejor el modelo ANCOVA (modelo 4); en caso negativo,
es mejor el modelo ANCOVA con pendientes no paralelas (modelo 5).
Pendientes
cero?

no

si
Modelo
ANOVA

Pendientes
iguales?

no

si
Modelo
ANCOVA
Modelo
ANCOVA con
pendientes
no paralelas

65
First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (5)


Son nulas las pendientes de regresin de intel para cada nivel de mtodo?
Variable dependiente: rend

Fuentes
SC tipo III gl
MC
F
Modelo
4934.414 6 822.402 270.609
metodo
121.087 3 40.362 13.281
metodointel
286.014 3 95.471 31.415
Residual
45.586 15
3.039
Total
4980.000 21

P>F
.000
.000
.000

Observa que esta salida es anmala, porque se emplea el factor y su interaccin con la covariante, PERO NO LA COVARIANTE. Para poder estimar las tres
pendientes de regresin (y no solo dos), el modelo tiene que ser especificado sin la intercepcin, lo que cambia sensiblemente los resultados originales. Afortunadamente, la interpretacin debe centrarse en la significacin del
componente de interaccin mtodo intel.
Puesto que la interaccin es estadsticamente significativa, rechazamos la hiptesis (nula) de que las pendientes de regresin sean nulas.
66
First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (6)


Nivel metodo=a1
Variable respuesta: rend

Error
IC 95 %
Parmetro
B tpico
t P>|t| Inferior Superior
Interseccin 5.321 0.928 5.732 .002 2.935
7.708
intel
0.964 0.096 10.016 .000 0.717
1.212
Nivel metodo=a2
Variable respuesta: rend

Error
IC 95 %
Parmetro
B tpico
t P>|t| Inferior Superior
Interseccin 3.193 0.754 4.237 .008 1.256
5.130
intel
0.979 0.075 13.051 .000 0.786
1.171
Nivel metodo=a3
Variable respuesta: rend

Error
IC 95 %
Parmetro
B tpico
t P>|t| Inferior Superior
Interseccin 9.515 2.899 3.283 .022 2.064
16.966
intel
1.061 0.338 3.136 .026 0.191
1.930
67
First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (7)


Son iguales las pendientes de regresin de intel para cada nivel de mtodo?
Variable dependiente: rend

Fuentes
SC tipo III gl
MC
F
Modelo
4927.081 5 83.416 27.448
metodo
21.878 2 10.939 3.599
intel
263.773 1 263.773 86.794
metodointel
0.400 2
0.200 0.066
Residual
45.586 15
3.039
Total
462.667 20

P>F
.000
.053
.000
.937

Puesto que la interaccin no es estadsticamente significativa, aceptamos la


hiptesis (nula) de que las pendientes de regresin de intel para cada nivel
de mtodo sean iguales.
En consecuencia, el modelo que se ajusta mejor es el modelo ANCOVA con
pendientes paralelas. Si el modelo cumple con los supuestos estadsticos puede ser objeto de interpretacin.
68
First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (8)


Parmetro
Interseccin

B
18.662

[metodo=1.00] 4.993
[metodo=2.00] 6.993
[metodo=3.00]
.
intel

0.993

Error
IC 95 %
tpico
t P>| t | Inferior Superior
0.992 10.140 .000
7.963
12.147
0.884 5.646 .000 6.859 3.127
0.884 7.907 .000 8.859 5.127
.
.
.
.
.
0.097 10.283 .000
0.789
1.197

Variable dependiente: rend

Fuentes SC tipo III gl


MC
F
Modelo
416.680 3 138.893 51.346
metodo
178.959 2 89.480 33.079
intel
286.014 1 286.014 105.732
Residual
45.986 17
2.705
Total
462.667 20

P>F
.000
.000
.000

Cmo se interpreta la salida de un modelo ANCOVA?


El coeficiente beta residual es la pendiente de regresin comn del modelo
ANCOVA: b R = 0.993. Los efectos de mtodo y de intel son estadsticamente
significativos: F A (2, 17) = 33.079; P < .001 y F X (1, 17) = 105.732; P < .001.
69
First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (9)


Las comparaciones mltiples del factor en el modelo ANCOVA requiere cal0
cular los PROMEDIOS DE GRUPO AJUSTADOS Y mediante:
0

Y j = Y j b R (X j X )
donde b R es el coeficiente beta residual, con los resultados siguientes:
0

Y 1 = 14 (0.993)(9 8.667) 13.669


0

Y 2 = 12 (0.993)(9 8.667) 11.669


0

Y 3 = 18 (0.993)(8 8.667) 18.662


El clculo de los promedios de grupo ajustados no se realiza para todo el rango de valores de la covariante, sino slo para su valor medio (X = 8.667).
Variable dependiente: rend

Error
IC 95 %
metodo Media tpico inferior superior
1
13.669a 0.622 12.356
14.982
a
2
11.669
0.622 10.356
12.982
a
3
18.662
0.625 17.344
19.981
70
First Prev Next Last Go Back Full Screen Close Quit

VII. El modelo ANCOVA bsico: un factor y una covariante (10)


Una vez calculados los promedios de grupo ajustados, en un modelo ANCOVA tiene inters evaluar las comparaciones mltiples entre medias de grupo
ajustadas (DIP, p.203-204)). Utilizando comparaciones mediante pruebas de
rango, la salida siguiente ordena las medias reportando una secuencia con
los dos subconjuntos encontrados: a1=a2, a1=a3, lo cual deja fuera del rango
las diferencias entre las medias a2 y a3, que no aparecen en ninguno de los
subconjuntos.
Variable dependiente: rend

Medias no
Medias ajustadas para P >.05
metodo ajustadas N Subconjunto 1 Subconjunto 2
a2
12.000 7
11.669
a1
14.000 7
13.669
13.669
a3
18.000 7
18.662
Probabilidad
.321
.634
Como se interpreta esta salida?
71
First Prev Next Last Go Back Full Screen Close Quit