Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ANOVA Multifactorial
ANOVA Multifactorial
ANOVA Multifactorial
4/d/yyyy
ANOVA Multifactorial
Resumen
El procedimiento ANOVA Multifactorial est diseado para construir un modelo estadstico
describiendo el impacto de dos o ms factores categricos Xj de una variable dependiente Y. Se
realizan pruebas para determinar si hay o no diferencias significativas entre las medias a
diferentes niveles de los factores y si hay o no interacciones entre los factores. Adems, los datos
pueden desplegarse grficamente de varias maneras, incluyendo un grfico mltiple de
dispersin, una grfica de medias y una grfica de interacciones.
Este procedimiento est diseado para experimentos relativamente simples, tales como
experimentos factoriales con efectos fijos. El procedimiento Modelos Lineales Generales debe
ser usado para situaciones ms complicadas.
Body fat
(Grasa corporal)
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
alta
alta
Gender
(Sexo)
masculino
masculino
masculino
masculino
masculino
masculino
masculino
masculino
masculino
femenino
femenino
femenino
femenino
femenino
femenino
femenino
femenino
femenino
masculino
masculino
Smoking
(Fumador)
ninguno
ninguno
ninguno
ligero
ligero
ligero
pesado
pesado
pesado
ninguno
ninguno
ninguno
ligero
ligero
ligero
pesado
pesado
pesado
ninguno
ninguno
Minutes
(Minutos)
34
32
31
27
24
23
20
21
24
25
35
26
22
22
20
15
10
13
21
20
ANOVA Multifactorial - 1
Entrada de Datos
Los datos consisten en una sola columna que contiene mediciones y mltiples columnas
indicando los niveles de los factores experimentales.
ANOVA Multifactorial - 2
Grfico de Dispersin
El panel Grfico de Dispersin grafica por niveles los datos de un nivel seleccionado.
Dispersin por Cdigo de Nivel
40
minutes
30
20
10
0
high
low
body fat
Si hay muchas variables comunes, tal vez dese agregar a la grfica una pequea cantidad de
jitter horizontal presionando el botn Jitter en la barra de herramientas anlisis:
Esto compensa cada punto aleatoriamente en direccin horizontal de tal forma que valores
idnticos no se grafican uno encima del otro.
ANOVA Multifactorial - 3
minutes
30
20
10
0
high
low
body fat
La grfica anterior sugiere que hay tres diferencias entre individuos con alta grasa corporal e
individuos con baja grasa corporal.
Panel de Opciones
Tabla ANOVA
Para determinar si los factores tienen o no un efecto significativo en la variable dependiente, se
realiza un anlisis de varianza. Los resultados son desplegados en la Tabla ANOVA:
Anlisis de Varianza para minutos - Suma de Cuadrados Tipo III
Fuente
Suma de Cuadrados
Gl Cuadrado Medio
EFECTOS PRINCIPALES
A:grasa corporal
702.25
1
702.25
B:sexo
210.25
1
210.25
C:fumador
343.056
2
171.528
INTERACCIONES
AB
2.25
1
2.25
AC
204.167
2
102.083
BC
21.5
2
10.75
RESIDUOS
230.833
26 8.87821
TOTAL (CORREGIDO)
1714.31
35
Razn-F
Valor-P
79.10
23.68
19.32
0.0000
0.0000
0.0000
0.25
11.50
1.21
0.6189
0.0003
0.3142
ANOVA Multifactorial - 4
Suma de Cuadrados: el tipo de descomposicin usada para calcular las sumas de cuadrados
en la tabla ANOVA. La seleccin por defecto es Tipo III, que cuantifica el incremento del
ANOVA Multifactorial - 5
Opciones de Anlisis
El cuadro de dilogo Opciones de Anlisis especifica las interacciones a incluirse en el anlisis.
Mximo Orden de Interaccin: nmero mximo de factores para los que se estimar una
interaccin.
Excluir: Presione este botn para quitar del anlisis una o ms interacciones.
ANOVA Multifactorial - 6
Haciendo doble clic en cualquier interaccin, esta puede moverse de derecha a izquierda o
viceversa. Cualquier interaccin especificada en el campo Excluir no ser estimada.
Luego de remover los dos efectos insignificantes de los datos de las pruebas de estrs, la tabla
de arriba muestra los efectos remanentes:
Anlisis de Varianza para minutos - Suma de Cuadrados Tipo III
Fuente
Suma de Cuadrados
Gl Cuadrado Medio
EFECTOS PRINCIPALES
A:grasa corporal
702.25
1
702.25
B:sexo
210.25
1
210.25
C:fumador
343.056
2
171.528
INTERACCIONES
AC
204.167
2
102.083
RESIDUOS
254.583
29 8.77874
TOTAL (CORREGIDO)
1714.31
35
Razn-F
Valor-P
79.99
23.95
19.54
0.0000
0.0000
0.0000
11.63
0.0002
Grfica ANOVA
La Grfica ANOVA, desarrollada por Hunter (2005), es una tcnica para desplegar grficamente
la importancia de cada factor en el anlisis. Es una grfica de efectos escalados de cada factor,
donde el efecto de un factor es igual a la diferencia entre la media de mnimos cuadrados para
2006 por StatPoint, Inc.
ANOVA Multifactorial - 7
R ni
T n
(1)
donde R es los grados de libertad residuales, T es los grados de libertad del efecto principal del
factor, ni es igual al nmero de observaciones en el i-simo nivel del factor, y n es el nmero
promedio de observaciones a todos los niveles del factor. Esto escala los efectos de tal forma que
la varianza natural de los puntos en el diagrama es comparable a la de los residuales, los cuales
son desplegados debajo de la grfica.
La grfica para los datos de muestra se ve a continuacin:
ANOVA Grfico para minutes
heavy
smoking
none
female
gender
body fat
light
P = 0.0000
male
P = 0.0000
low
high
P = 0.0000
Residuos
-24
-14
-4
16
26
En la parte derecha del display estn los P-Valores de los efectos principales, tomados de la tabla
ANOVA.
Comparando la variabilidad entre los efectos del tratamiento en la grfica anterior y los
residuales, es fcil ver que todos los factores muestran diferencias de una magnitud mayor que la
que podra atribuirse solamente a error experimental. Dependiendo de la localizacin relativa de
los efectos, podra ser posible en algunos casos identificar visualmente qu niveles son diferentes
significativamente de qu otros, lo cual se hace formalmente con las Pruebas de Rangos
Mltiples descrita a continuacin.
ANOVA Multifactorial - 8
Contraste
femenino masculino
Media LS
16.7222
21.5556
Sig.
*
Diferencia
-4.83333
Sigma LS
0.698361
0.698361
Grupos Homogneos
X
X
+/- Lmites
2.01994
* indica una
diferencia significativa.
La mitad de arriba de la tabla despliega cada uno de los estimadores medios de mnimos
cuadrados en orden creciente de magnitud. Muestra:
ANOVA Multifactorial - 9
La segunda mitad de la tabla despliega una comparacin entre cada par de medias de nivel.
Panel de Opciones
LSD - forma un intervalo de confianza para cada par de medias al nivel de confianza
seleccionado, usando la distribucin t de Student. Este procedimiento se le atribuye a
2006 por StatPoint, Inc.
ANOVA Multifactorial - 10
Tukey HSD ensancha los intervalos para permitir comparaciones mltiples entre todos
los pares de medias usando la t de Tukey. Tukey llam a su procedimiento el de
Diferencia Honestamente Significativa ya que controla la tasa de error experimental a .
Si todas las medias son iguales, la probabilidad de declarar a cualquiera de los pares
como significativamente diferentes en todo el experimento es igual a . El procedimiento
de Tukey es ms conservador que el procedimiento LSD de Fisher, pues hace ms difcil
declarar cualquier par particular de medias como significativamente diferentes.
Scheffe diseado para permitir la estimacin de todos los posibles contrastes entre las
medias muestrales (no solo en comparaciones por pares). Usa una mltiple relacionada
con la distribucin F. En esta instancia, es probable que el procedimiento sea muy
conservador, pues slo se estn estimando pares.
Esto slo debe usarse cuando la F-prueba en la tabla ANOVA indique diferencias significativas
entre las medias muestrales. La probabilidad de hacer un error Tipo I aplica a cada par de
medias de manera separada. Si se hace ms de una comparacin, la probabilidad total de llamar
al menos a un par de medias significativamente diferentes cuando no lo son puede ser
considerablemente mayor que .
La eleccin entre un procedimiento LCD y uno de mltiples comparaciones como el HSD de
Tukey debe depender del costo relativo de hacer un error Tipo I (llamar diferentes a un par de
medias que realmente no lo son) contra el costo de hacer un error Tipo II (no llamar diferentes a
un par de medias que s lo sean). En las primeras etapas de una investigacin, tal vez uno no
quiera ser tan conservador como cuando ya se han hecho las verificaciones finales
ANOVA Multifactorial - 11
Tabla de Medias
Esta tabla despliega las medias de mnimos cuadrados para cada nivel de los factores y para
pares de niveles de cualquier interaccin bifactorial incluida. Cada media se muestra junto a su
error estimado estndar y un intervalo de confianza:
Tabla de Medias por Mnimos Cuadrados para minutos con intervalos de confianza del 95.0 %
Error
Lmite
Lmite
Nivel
Casos Media
Est.
Inferior
Superior
MEDIA GLOBAL
36
19.1389
grasa corporal
alta
18
14.7222
0.698361
13.2939
16.1505
baja
18
23.5556
0.698361
22.1272
24.9839
sexo
femenino
18
16.7222
0.698361
15.2939
18.1505
masculino
18
21.5556
0.698361
20.1272
22.9839
fumador
pesado
12
15.6667
0.855314
13.9174
17.416
ligero
12
18.5833
0.855314
16.834
20.3326
ninguno
12
23.1667
0.855314
21.4174
24.916
grasa corporal por
fumador
alta,pesado
6
14.1667
1.2096
11.6928
16.6406
alta,ligero
6
14.1667
1.2096
11.6928
16.6406
alta,ninguno
6
15.8333
1.2096
13.3594
18.3072
baja,pesado
6
17.1667
1.2096
14.6928
19.6406
baja,ligero
6
23.0
1.2096
20.5261
25.4739
baja,ninguno
6
30.5
1.2096
28.0261
32.9739
Panel de Opciones
ANOVA Multifactorial - 12
Grfica de Medias
Las medias de nivel pueden graficarse junto a intervalos de incertidumbreMedias y 95.0% de Fisher LSD
25
23
minutes
21
19
17
15
13
high
low
body fat
Panel de Opciones
ANOVA Multifactorial - 13
Intervalos LSD diseados para comparar cualquier par de medias con el nivel de
confianza establecido.
Intervalos HSD Tukey diseados para comparar todos los pares de medias. El nivel de
confianza establecido aplica para toda la familia de comparaciones par a par.
Intervalos Scheffe diseados para comparar todos los contrastes. No son muy
relevantes aqu.
Grfica de Interaccin
Cuando existan una o ms interacciones significativas, deben examinarse juntas usando la
Grfica de Interaccin.
Grfico de Interacciones
32
body fat
high
low
29
minutes
26
23
20
17
14
heavy
light
smoking
none
La grfica de interaccin despliega las medias por mnimos cuadrados en todas las
combinaciones de dos factores. Si los factores no interactan, las lneas en la grfica deben ser
aproximadamente paralelas. Si no, entonces el efecto de un factor depende del nivel de otro, que
es la definicin de interaccin.
2006 por StatPoint, Inc.
ANOVA Multifactorial - 14
Panel de Opciones
Graficar en Ejes el factor de la interaccin seleccionada que ser utilizada para definir el
eje horizontal. Lneas separadas se retirarn de cada nivel del otro factor.
ANOVA Multifactorial - 15
smoking
heavy
light
none
31
minutes
27
23
19
15
11
high
low
body fat
Grupo 2: individuos ligero-fumador, baja grasa corporal, cuyos tiempos en la prueba son
menores que los del Grupo 1, pero significativamente mayores que los de otros.
Grupo 3: los dems. Note que todos sus intervalos se traslapan, indicando que no hay
diferencias estadsticamente significativas entre los individuos restantes.
Grficas de Residuales
Como en todo modelo estadstico, es una buena costumbre examinar los residuales. Los
residuales son iguales a los datos observados menos los valores predichos por el modelo
estadstico subyacente.
El procedimiento ANOVA Multifactorial crea 3 grficas de residuales:
1. contra nivel de factor.
2. contra valor predicho.
3. contra nmero de observacin.
Residuales contra Nivel de Factor
Esta grfica es de ayuda para visualizar cualquier diferencia en la variabilidad de varios niveles
de un factor.
ANOVA Multifactorial - 16
residuos
5
2
-1
-4
-7
heavy
light
none
smoking
Panel de Opciones
residuos
5
2
-1
-4
-7
0
10
20
predichos
30
40
ANOVA Multifactorial - 17
residuos
5
2
-1
-4
-7
0
10
20
nmero de fila
30
40
Si los datos se arreglan en orden cronolgico, cualquier patrn de los datos puede indicar una
influencia exterior. No es evidente ningn patrn as en la grfica de arriba.
ANOVA Multifactorial - 18
Guardar Resultados
Los siguientes resultados pueden guardarse en la hoja de datos:
1. Recuentos por Nivel el nmero de observaciones a cada nivel de los factores y a cada
par de factores.
2. Medias por Nivel la respuesta media a cada nivel de factores y a cada par de factores.
3. Errores Estndar por Nivel el error estndar a cada nivel de factores.
4. Medias de Mnimos Cuadrados la media por mnimos cuadrados a cada nivel de
factores.
5. Residuos los n residuales.
Clculos
Modelo Estadstico
Para ajustar un modelo a los datos, STATGRAPHICS construye una matriz de n por p de
variables X independientes. La matriz incluye:
Variables indicatrices para cada factor. Para un factor con k niveles, k 1 variables
indicatrices se construyen. La j-sima variable indicadora para un factor contiene el valor 1
para cada observacin igual al j-simo nivel del factor, -1 para cada observacin igual al ksimo nivel y 0 para cualquier otro caso.
Productos cruz de las variables indicadoras y las columnas covariadas para representar
cualquier interaccin.
= ( X X ) 1 X Y
(2)
Yp = X p ( X X ) 1 X Y
(3)
ANOVA Multifactorial - 19
s.e. p =
X p MSE ( X X ) 1 X p
(4)
ANOVA Multifactorial - 20