Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En los ANOVA distinguimos lo que es la variable dependiente (VD) que es una variable
cuantitativa y el/los factor/es . Un factor es una variable categórica (nominal u ordinal).
Modelos ANOVA
Estos son los modelos ANOVA de medidas repetidas donde los sujetos
son los mismos o están emparejados por alguna variable extraña.
Modelos ANOVA
Factores de efectos aleatorios: los niveles del factor son una muestra
aleatoria de entre todos los posibles niveles que el factor puede
tener.
¿Podría haberse planeado este ANOVA para que fuese de medidas repetidas?
Ejercicio
En un estudio publicitario queremos averiguar la valoración que los sujetos
hacen en una escala de 0 a 10 sobre cuatro modelos de coches diferentes
(valorar la estética del vehículo). Para ello seleccionamos al azar a 20
sujetos y les presentamos las fotografías de los cuatro modelos de coches.
En esta muestra hay efecto del método de enseñanza. Tenemos variabilidad ENTRE métodos, pero no variabilidad
INTRA métodos, donde α es el efecto del método de enseñanza, es decir, lo que se desvía de la media total.
Yij Y j j Yj Y
Lógica del análisis de varianza
MÉTODO DE ENSEÑANZA (FACTOR)
Convencional Competitivo Participativo
5,2 2,0 6,6
4,4 3,0 5,3
5,0 4,0 6,7
5,6 3,5 5,4
4,8 2,5 6,0
En la muestra, hay efecto del método de enseñanza y del error. Tenemos variabilidad ENTRE métodos y también variabilidad
INTRA métodos (a esto lo llamamos error en el análisis de varianza, a esta fuente de variabilidad intramétodo).
Lógica del análisis de varianza
Variabilidad intergrupos
Lógica del análisis de varianza
MC E S 2
S 2
j
(0,2 0,625 0,425)
0,417
j
J 3
Donde J es el número de grupos
Lógica del análisis de varianza
1. Hipótesis
H 0 : M _ Convencional M _ Competitivo M _ Participativo
H1 : j j '
5. Zona crítica: F ≥ FJ – 1, N – J, 1 – α
FJ – 1, N – J, 1 – α
7. Nivel crítico (valor p): p = P(F ≥ Fh), siendo Fh el valor concreto que
toma nuestro estadístico. En nuestro caso, la probabilidad de
obtener un valor mayor o igual a 28 en la distribución F con 2 y 12
grados de libertad es 0,00003 (sacado con el SPSS).
Ejercicio
Ejercicio. Se quiere estudiar el rendimiento en una prueba de lógica (medida
de 0 a 20 puntos) dependiendo del nivel de ansiedad del sujeto (se
inducen tres niveles de ansiedad: bajo, medio y alto). Los resultados son
los de la tabla. El objetivo es averiguar si los grupos de ansiedad difieren
en rendimiento, es decir, si el nivel de ansiedad está relacionado con el
rendimiento (α = 0,05).
Nivel de 1 2 3 4 5 6 7 8 9 10
ansiedad T Yj S 2j
YBAJO 4 11 7 10 4 9 11 8 14 12 90 9 10,89
YMEDIO 19 14 13 16 15 18 12 7 10 16 140 14 13,33
YALTO 3 11 5 10 14 5 7 9 4 2 70 7 15,11
Promedios 10 13,11
Ejercicio
El factor es nivel de ansiedad con tres niveles: bajo, medio y alto. La variable
dependiente (la variable cuantitativa) es el rendimiento en la prueba de
lógica. El diseño debe analizarse con un modelo ANOVA de un factor CA
(completamente aleatorizado) puesto que los sujetos son distintos.
1. Hipótesis:
H 0 : Bajo Medio Alto
H1 : j j '
7. Nivel crítico (valor p): es la P(F ≥ 9,92), es decir, la probabilidad que queda a
la derecha de nuestro estadístico del contraste que es < 0,01.
Ejercicio
Ejercicio: Un equipo de psicólogos de la personalidad quiere averiguar si el
rasgo búsqueda de sensaciones nuevas difiere entre cuatro profesiones
distintas: políticos, periodistas, cirujanos e inversores. Para ello selecciona
una muestra aleatoria de cada profesión y les administra una prueba
estandarizada de búsqueda de sensaciones nuevas.
Supongamos que obtenemos un estadístico F = 2,78 tal que P(F ≥ 2,78) = 0,35.
Con α = 0,05, ¿qué decisión tomamos sobre H0?, ¿Cuál es la conclusión del
contraste?
ANOVA de un factor completamente aleatorizado
Fuente de variación SC gl MC F p
Fuente de variación SC gl MC F p
Intragrupos o error
( ) ( ) ( ) - -
(E)
Total ( ) 29 - - -
( J 1)( MC A MC E )
ˆ 2
( J 1) MC A ( N J 1) MC E
Valores de ω2 de 0,01, 0,06 y 0,14 se consideran tamaños del efecto
bajos, medio y altos respectivamente.
ANOVA de un factor completamente aleatorizado
Variabilidad
total
= Variabilidad
entre grupos
+ Variabilidad
intragrupos
Variabilidad
Variabilidad
total
= entre grupos + Variabilidad
intragrupos
ANOVA de un factor completamente aleatorizado
¡Lo que comparamos por lo tanto son dos cosas! Un grupo de medias
con otro grupo de medias, aunque estén involucradas muchas
medias.
Comparaciones múltiples entre medias
Algunas reglas básicas en las comparaciones múltiples
¿Son dos comparaciones ortogonales o independientes?
c
j
c (1)(1) (1)(0) (0)( 1) 1
j1 j 2
c
j
c (1)(1) (2)( 0) (1)(1) 0
j3 j 4
Tse
DBdistribuye
t k , gl _ error
Ejercicio
Ejercicio. Dunn-Bonferroni. Queremos ahora hacer dos comparaciones con
αF = 0,05: (1) El rendimiento del grupo de ansiedad medio frente a los
otros dos tomados juntos y (2) el grupo de menor ansiedad (grupo 1)
con el de mayor ansiedad (grupo 3): (recordemos que MCE = 13,11)
Nivel de
ansiedad
Yj 1 (?)1 (?) 2 (?)3
YBAJO 9 2 (?)1 (?) 2 (?)3
YMEDIO 14
YALTO 7
Ejercicio
Ejercicio. Dunn-Bonferroni. Queremos ahora hacer dos comparaciones con
αF = 0,05: (1) El rendimiento del grupo de ansiedad medio frente a los
otros dos tomados juntos y (2) el grupo de menor ansiedad (grupo 1)
con el de mayor ansiedad (grupo 3): (recordemos que MCE = 13,11)
Nivel de
ansiedad
Yj 1 (1) 1 (2) 2 (1) 3
YBAJO 9 2 (1) 1 (0) 2 (1) 3
YMEDIO 14
YALTO 7
Lo que nos da esta tabla es el punto crítico (percentil 95) a partir del cual
rechazamos o mantenemos H0.
Zona crítica:
En este caso tk comparaciones; gl error; 1 – α será t2; 27 ; 0,95 = 2,37
Por lo tanto, la zona de rechazo queda delimitada por 2,37.
La zona crítica es lo que queda a la derecha de 2,37, es decir,
TDB ≥ t27; 2 ; 0,95 = 2,37
Ejercicio
Decisión: El valor TDB(1) = 4,29 es mayor que el punto crítico 2,37. El valor TDB(2)
= 1,23 es menor que el punto crítico 2,37. Por lo tanto solo podemos
rechazar H0(1) que plantea medias poblacionales iguales para el grupo de
ansiedad medio frente a los grupos de ansiedad bajo y alto (el grupo 1 y
el grupo 3). Por lo tanto, las medias difieren. Concretamente,
atendiendo a los resultados muestrales lo que tenemos es que el grupo
de ansiedad medio alcanza una media poblacional en rendimiento
mayor que los grupos con ansiedad baja y alta.
Relaciones lineales
Comparaciones planeadas o a priori
Comparaciones de tendencia
Relaciones lineales
Relaciones cuadráticas
Comparaciones planeadas o a priori
Comparaciones de tendencia
Tipos de relaciones: Con J = 4 grupos hay tres tipos de relación posible,
la lineal, la cuadrática y la cúbica. Y etc.
Relaciones lineales
Relaciones cuadráticas
Relaciones cúbicas
Comparaciones planeadas o a priori
Comparaciones de tendencia
Tenemos un factor que es la región española con cinco niveles (norte, sur,
este, oeste y centro). La VD es el nivel de colesterol.
Hay que asignar unos coeficientes que vienen en la tabla H del apéndice
del libro.
Lineal (1) 1 (0) 2 (1) 3
Cuadrática (1) 1 (2) 2 (1) 3
Comparaciones planeadas o a priori
Comparaciones de tendencia
Lo que nos da esta tabla es el punto crítico (percentil 95) a partir del cual
rechazamos o mantenemos H0.
Zona crítica:
En este caso tk comparaciones; gl error; 1 – α será t2; 27 ; 0,95 = 2,37
Por lo tanto, la zona de rechazo queda delimitada por 2,37.
La zona crítica es lo que queda a la derecha de 2,37, es decir,
TDB ≥ t27; 2 ; 0,95 = 2,37
Ejercicio
Decisión: El valor TDB(cuadrática) = 4,29 es mayor que el punto crítico 2,37. En
cambio, el valor TDB(Lineal) = 1,23 es menor que el punto crítico 2,37. Por lo
tanto solo podemos rechazar H0(cuadrática) que plantea que la relación
cuadrática es nula. Rechazamos esto y concluimos que hay una relación
de tipo cuadrático entre el rendimiento y la ansiedad.
Respecto a H0(Lineal) no podemos afirmar H1 que dice que hay una relación
lineal de tipo significativa (significativamente distinta de 0). No hemos
encontrado por lo tanto relación de tipo lineal.
14
12
VD = RENDIMEINTO
10
0
BAJO MEDIO ALTO
Comparaciones planeadas o a priori
Fuente de variación SC gl MC F p
Intergrupos ( ) ( ) 30 6 0,010
Lineal ( ) ( ) ( ) ( ) 0,005
Cuadrático ( ) ( ) 10 ( ) 0,100
Cúbico ( ) ( ) ( ) ( )
Intragrupos o error ( ) ( ) ( ) - -
Total ( ) 17 - - -
Prueba de Dunnett
Esta es la última comparación planeada que vamos a ver. Se trata de un
método que controla la tasa de error cuando efectuamos J – 1
¡NO
comparaciones entre un grupo control y los grupos experimentales.
ENTRA!
Significativa (DMS) que es el valor más pequeño a partir de la cual la
diferencia es significativa.
YControl Y j
La expresión para encontrar la DMS de Dunnett es:
Prueba de Dunnett
Tenemos que ir a la tabla K del libro para obtener el punto crítico: (1)
¡NO
primero teniendo en cuenta si αF = 0,05 o αF = 0,01 y (2) teniendo en
cuenta si el contraste es unilateral o bilateral.
ENTRA!
Ejercicio
Seguimos con el ejemplo de los tres niveles de ansiedad inducidos (bajo,
medio y alto) y la VD = rendimiento. Vamos a suponer que el grupo de
ansiedad bajo es el grupo control para explicar el funcionamiento de
Dunnett. Llevaremos a cabo dos comparaciones. La del grupo control
¡NO
con el grupo de ansiedad medio y la del grupo control con el grupo de
ansiedad alto (ambos bilaterales y tomando αF = 0,05).
1 Control ans _ medio
ENTRA!
2 Control ans _ alto
1. Hipótesis:
H 0(1) : 1 Control ans _ medio 0 H1( 2 ) : 1 Control ans _ medio 0
H 0 ( 2 ) : 2 Control ans _ alto 0 H1( 2 ) : 2 Control ans _ alto 0
¡NO
DMS Dunnett t J , N J ,1 F MC E (1 / ncontrol 1 / nans _ medio )
ENTRA!
N – J = 27 y con αF = 0,05 (por lo que 1 – αF = 0,95). Como no tenemos 27
grados de libertad redondeamos a 30. Ese valor es 2,32.
¡NO
ˆ 2 | YControl Yans _ alto | 2 DMS Dunnett 3,76
ENTRA!
grupo de ansiedad medio. Atendiendo a los resultados muestrales,
además, podemos concluir que es el grupo de ansiedad medio el que
rinde más en la población.
El segundo contraste no alcanza la DMS de modo que no hay evidencias para
afirmar que la media poblacional del grupo control difiere de la media
poblacional del grupo de ansiedad alto.
Comparaciones post hoc o a posteriori
Hemos dicho que hay dos tipos de comparaciones: las comparaciones
planeadas y las comparaciones post hoc. Dunn-Bonferroni, las
comparaciones de tendencia y Dunnet son los tres tipos de
comparaciones planeadas que hemos estudiado. Ahora nos vamos a
centrar en las otras comparaciones.
Prueba de Tukey
Esta prueba está diseñada cuando queremos realizar todas las
comparaciones por pares: dicho número k se calcula con la fórmula
J(J – 1) / 2.
Prueba de Tukey
Este procedimiento tiene la ventaja que no es en exceso conservador (es
decir, no controla la tasa de error más de lo debido) y preserva que la
potencia de los contrastes sea adecuada.
La prueba de Tukey se parece mucho a la ya estudiada de Dunnet, ya que
consiste en encontrar la Diferencia Mínima Significativa (DMS) que es el
valor más pequeño a partir de la cual la diferencia entre dos
medias es significativa.
1. Hipótesis:
H 0(1) : 1 bajo medio 0 H1(1) : 1 bajo medio 0
H 0 ( 2 ) : 2 bajo alto 0 H1( 2 ) : 2 bajo alto 0
H 0 (3) : 3 medio alto 0 H1( 3) : 3 medio alto 0
2. Supuestos: Tres muestras aleatorias normales y con la misma varianza
3. Estadístico del contraste: Buscamos el punto crítico en la tabla L para
calcular la DMSTukey
Para ello tenemos que tener en cuenta que (1) αF = 0,05, (2) J = 3 y (3) N – J =
27 (que redondeamos a 30).
Según esos datos el punto crítico q3,30, 0,95 = 3,49
Ejercicio
Luego tenemos que:
DMSTukey 3,49 13,11 / 10 4,00
Así que para rechazar las H0 tenemos que encontrar una diferencia de
medias muestral igual o mayor que 4,00. Veamos qué ocurre con las tres
comparaciones:
ˆ1 Ybajo Ymedio 9 14 5
ˆ 2 Ybajo Yalto 9 7 2
ˆ 3 Ymedio Yalto 14 7 7
4. Decisión: como la primera comparación y la tercera superan la diferencia
mínima significativa (DMS) rechazamos H0(1) y H0(3) . La media poblacional
de rendimiento del grupo de ansiedad bajo difiere de la del grupo de
ansiedad medio. Asimismo, la media poblacional de rendimiento del
grupo de ansiedad alto difiere con la del grupo de ansiedad medio.
Ejercicios propuestos
6.18. En un diseño con tres grupos, ¿cuál de las siguientes hipótesis nulas
hay que contrastar para averiguar si la relación entre la VI y la VD es lineal?
a. H 0 : (1) 1 2 (1) 3 0
b. H 0 : (2) 1 (1) 2 (1) 3 0
c. H 0 : 1 (1) 2 (1) 3 0
d. H 0 : 1 3 0
e. H 0 : (1) 1 (1) 2 (2) 3 0
Plantear la H0 y la H1 __________________________________
¿Cuáles son los supuestos del contraste?
ANOVA A-CA. Ejercicio
Ejercicio ANOVA A-CA. Rellena la siguiente tabla
Fuente de variación SC gl MC F p
Intergrupos ( ) ( ) 38 35,625 0,000
Lineal ( ) ( ) ( ) ( ) 0,000
Cuadrático ( ) ( ) 1 ( ) 0,348
Cúbico ( ) ( ) ( ) ( )
Intragrupos o error ( ) ( ) ( ) - -
Total ( ) 17 - - -
Cantidad de recompensa 1 2 3 4 5 6 Yj
5cc 9 8 7 8 7 9 8
10cc 6 6 3 4 5 6 5
15cc 4 2 3 4 3 2 3
Y5cc Y10cc 8 5 3
Y5cc Y15cc 8 3 5
Y10 cc Y15cc 5 3 2
Decisión y conclusiones:
Al extraer la DMS de Tukey, ese valor es 1,55, todas las diferencias de medias entre pares que
superen esa diferencia nos llevará a rechazar H0. Como eso ocurre en todas las diferencias de
medias analizadas, podemos concluir que todas las medias poblacionales difieren entre sí.