ANOVA Multifactorial

También podría gustarte

Está en la página 1de 20

STATGRAPHICS Rev.

4/d/yyyy

ANOVA Multifactorial
Resumen
El procedimiento ANOVA Multifactorial est diseado para construir un modelo estadstico
describiendo el impacto de dos o ms factores categricos Xj de una variable dependiente Y. Se
realizan pruebas para determinar si hay o no diferencias significativas entre las medias a
diferentes niveles de los factores y si hay o no interacciones entre los factores. Adems, los datos
pueden desplegarse grficamente de varias maneras, incluyendo un grfico mltiple de
dispersin, una grfica de medias y una grfica de interacciones.
Este procedimiento est diseado para experimentos relativamente simples, tales como
experimentos factoriales con efectos fijos. El procedimiento Modelos Lineales Generales debe
ser usado para situaciones ms complicadas.

StatFolio Muestra: anova.sgp


Datos de Muestra:
El archivo stresstest.sf6 contiene datos de una prueba de estrs de n = 36 individuos, reportado
por Kutner et al. (1996). En el estudio, cada uno realiz sus ejercicios diarios y se registr el
nmero de minutos requeridos para alcanzar un nivel predefinido de estrs. La tabla de abajo
muestra una lista parcial de datos en ese archivo:
Subject
(Sujeto)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Body fat
(Grasa corporal)
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
baja
alta
alta

Gender
(Sexo)
masculino
masculino
masculino
masculino
masculino
masculino
masculino
masculino
masculino
femenino
femenino
femenino
femenino
femenino
femenino
femenino
femenino
femenino
masculino
masculino

Smoking
(Fumador)
ninguno
ninguno
ninguno
ligero
ligero
ligero
pesado
pesado
pesado
ninguno
ninguno
ninguno
ligero
ligero
ligero
pesado
pesado
pesado
ninguno
ninguno

Minutes
(Minutos)
34
32
31
27
24
23
20
21
24
25
35
26
22
22
20
15
10
13
21
20

3 individuos fueron seleccionados de 12 combinaciones de los siguientes factores:


2006 por StatPoint, Inc.

ANOVA Multifactorial - 1

STATGRAPHICS Rev. 4/d/yyyy


Cantidad de grasa corporal: baja o alta
Sexo: masculino o femenino
Historial de fumador: ligero, pesado o ninguno.
El estudio es un diseo factorial replicado de 2 por 2 por 3.

Entrada de Datos
Los datos consisten en una sola columna que contiene mediciones y mltiples columnas
indicando los niveles de los factores experimentales.

Variable dependiente: columna numrica que contiene las observaciones.

Factores: columnas numricas o no numricas que contienen niveles identificando cada


factor.

Covariacin: columnas numricas opcionales que contienen valores de variables


cuantitativas que varan junto con la respuesta y cuyos efectos deben ajustarse antes de
comparar niveles de factores categricos.

Seleccionar: subconjunto a seleccionar.

2006 por StatPoint, Inc.

ANOVA Multifactorial - 2

STATGRAPHICS Rev. 4/d/yyyy

Resumen del Anlisis


El Resumen del Anlisis muestra el nmero de factores y el nmero total de observaciones n.
ANOVA Multifactorial - minutos
Variable dependiente: minutos
Factores:
grasa corporal
sexo
fumador
Nmero de casos completos: 36

Grfico de Dispersin
El panel Grfico de Dispersin grafica por niveles los datos de un nivel seleccionado.
Dispersin por Cdigo de Nivel
40

minutes

30

20

10

0
high

low
body fat

Si hay muchas variables comunes, tal vez dese agregar a la grfica una pequea cantidad de
jitter horizontal presionando el botn Jitter en la barra de herramientas anlisis:

Esto compensa cada punto aleatoriamente en direccin horizontal de tal forma que valores
idnticos no se grafican uno encima del otro.

2006 por StatPoint, Inc.

ANOVA Multifactorial - 3

STATGRAPHICS Rev. 4/d/yyyy


Dispersin por Cdigo de Nivel
40

minutes

30

20

10

0
high

low
body fat

La grfica anterior sugiere que hay tres diferencias entre individuos con alta grasa corporal e
individuos con baja grasa corporal.
Panel de Opciones

Factor: factor a graficar en el eje horizontal.

Tabla ANOVA
Para determinar si los factores tienen o no un efecto significativo en la variable dependiente, se
realiza un anlisis de varianza. Los resultados son desplegados en la Tabla ANOVA:
Anlisis de Varianza para minutos - Suma de Cuadrados Tipo III
Fuente
Suma de Cuadrados
Gl Cuadrado Medio
EFECTOS PRINCIPALES
A:grasa corporal
702.25
1
702.25
B:sexo
210.25
1
210.25
C:fumador
343.056
2
171.528
INTERACCIONES
AB
2.25
1
2.25
AC
204.167
2
102.083
BC
21.5
2
10.75
RESIDUOS
230.833
26 8.87821
TOTAL (CORREGIDO)
1714.31
35

Razn-F

Valor-P

79.10
23.68
19.32

0.0000
0.0000
0.0000

0.25
11.50
1.21

0.6189
0.0003
0.3142

Todas las razones-F se basan en el cuadrado medio del error

2006 por StatPoint, Inc.

ANOVA Multifactorial - 4

STATGRAPHICS Rev. 4/d/yyyy


residual

La tabla divide la variabilidad total entre las n mediciones en varios componentes:


1. Un componente atribuible al Efecto Principal de cada factor, que mide la variabilidad
entre las respuestas medias a cada nivel del factor.
2. Un componente atribuible a la Interaccin entre diferentes factores. Ocurre una
interaccin si el efecto de un factor depende del nivel de otro factor.
3. Si hay Covariacin presenta un componente atribuible a cada covariacin.
4. Un componente Residual, que mide la variabilidad entre sujetos a niveles idnticos de
los factores.
Los F-radios son de particular importancia as como sus P-Valores asociados. P-Valores
pequeos (menores que 0.05 si se opera a un nivel de significancia del 5%) corresponden a
efectos significativos.
En este ejemplo, todos los efectos principales son estadsticamente significativos como los es
tambin la interaccin entre factores A y C (grasa corporal y fumador).
Panel de Opciones
El cuadro de dilogo Panel de Opciones controla cmo se calculan las F-pruebas:

Suma de Cuadrados: el tipo de descomposicin usada para calcular las sumas de cuadrados
en la tabla ANOVA. La seleccin por defecto es Tipo III, que cuantifica el incremento del

2006 por StatPoint, Inc.

ANOVA Multifactorial - 5

STATGRAPHICS Rev. 4/d/yyyy


error en la suma de cuadrados que ocurrira si cada efecto se removiese del anlisis, dado que
todos los otros efectos permanecen. En contraste, la suma de cuadrados Tipo I representa la
reduccin en el error de suma de cuadrados que ocurre cuando cada variable es aadida al
modelo, en el orden mostrado en la tabla ANOVA. En un experimento balanceado (un
experimento con igual nmero de observaciones de todas las combinaciones de factores) tal
como en este ejemplo, ambos tipos de sumas de cuadrados arrojan resultados idnticos. En
casos no balanceados, habr diferencia. Tipo III es por defecto pues cuantifica la
contribucin marginal de cada efecto dado que todos los dems efectos han sido computados.

Trmino de Error: la media cuadrtica a usarse como denominador de la F-prueba al probar


la importancia de cada efecto. En un diseo en el que todos los factores se cruzan y no son
aleatorios, la seleccin de Residual es correcta. Para tipos de diseos ms complicados, el
analista tal vez dese especificar otro denominador para ciertos efectos. Nota: el
procedimiento Modelos Lineales Generales determina automticamente del denominador
propio de muchos tipos de modelos involucrando factores aleatorios y anidados y
normalmente deben usarse para analizar esos tipos de diseos experimentales.

Opciones de Anlisis
El cuadro de dilogo Opciones de Anlisis especifica las interacciones a incluirse en el anlisis.

Mximo Orden de Interaccin: nmero mximo de factores para los que se estimar una
interaccin.

Excluir: Presione este botn para quitar del anlisis una o ms interacciones.

Ejemplo Removiendo Interacciones Insignificantes


Para remover del anlisis una o ms interacciones, presione el botn Excluir en el cuadro de
dilogo Opciones de Anlisis. Esto despliega un segundo cuadro de dilogo:

2006 por StatPoint, Inc.

ANOVA Multifactorial - 6

STATGRAPHICS Rev. 4/d/yyyy

Haciendo doble clic en cualquier interaccin, esta puede moverse de derecha a izquierda o
viceversa. Cualquier interaccin especificada en el campo Excluir no ser estimada.
Luego de remover los dos efectos insignificantes de los datos de las pruebas de estrs, la tabla
de arriba muestra los efectos remanentes:
Anlisis de Varianza para minutos - Suma de Cuadrados Tipo III
Fuente
Suma de Cuadrados
Gl Cuadrado Medio
EFECTOS PRINCIPALES
A:grasa corporal
702.25
1
702.25
B:sexo
210.25
1
210.25
C:fumador
343.056
2
171.528
INTERACCIONES
AC
204.167
2
102.083
RESIDUOS
254.583
29 8.77874
TOTAL (CORREGIDO)
1714.31
35

Razn-F

Valor-P

79.99
23.95
19.54

0.0000
0.0000
0.0000

11.63

0.0002

Todas las razones-F se basan en el cuadrado medio del error


residual

Grfica ANOVA
La Grfica ANOVA, desarrollada por Hunter (2005), es una tcnica para desplegar grficamente
la importancia de cada factor en el anlisis. Es una grfica de efectos escalados de cada factor,
donde el efecto de un factor es igual a la diferencia entre la media de mnimos cuadrados para
2006 por StatPoint, Inc.

ANOVA Multifactorial - 7

STATGRAPHICS Rev. 4/d/yyyy


el nivel del factor y la media total estimada. Cada uno de los efectos es multiplicado por un
factor escalador.

R ni
T n

(1)

donde R es los grados de libertad residuales, T es los grados de libertad del efecto principal del
factor, ni es igual al nmero de observaciones en el i-simo nivel del factor, y n es el nmero
promedio de observaciones a todos los niveles del factor. Esto escala los efectos de tal forma que
la varianza natural de los puntos en el diagrama es comparable a la de los residuales, los cuales
son desplegados debajo de la grfica.
La grfica para los datos de muestra se ve a continuacin:
ANOVA Grfico para minutes

heavy

smoking

none

female

gender
body fat

light

P = 0.0000

male

P = 0.0000
low

high

P = 0.0000

Residuos
-24

-14

-4

16

26

En la parte derecha del display estn los P-Valores de los efectos principales, tomados de la tabla
ANOVA.
Comparando la variabilidad entre los efectos del tratamiento en la grfica anterior y los
residuales, es fcil ver que todos los factores muestran diferencias de una magnitud mayor que la
que podra atribuirse solamente a error experimental. Dependiendo de la localizacin relativa de
los efectos, podra ser posible en algunos casos identificar visualmente qu niveles son diferentes
significativamente de qu otros, lo cual se hace formalmente con las Pruebas de Rangos
Mltiples descrita a continuacin.

Pruebas de Rangos Mltiples


Para factores que muestran P-Valores significativos en la tabla ANOVA y que no interactan con
otros factores, se puede realizar un anlisis posterior seleccionando las Pruebas de Rangos
Mltiples.
Contraste Mltiple de Rangos para minutos por sexo
Mtodo: 95.0 porcentaje LSD

2006 por StatPoint, Inc.

ANOVA Multifactorial - 8

STATGRAPHICS Rev. 4/d/yyyy


sexo
Casos
femenino 18
masculino 18

Contraste
femenino masculino

Media LS
16.7222
21.5556

Sig.
*

Diferencia
-4.83333

Sigma LS
0.698361
0.698361

Grupos Homogneos
X
X

+/- Lmites
2.01994

* indica una
diferencia significativa.

La mitad de arriba de la tabla despliega cada uno de los estimadores medios de mnimos
cuadrados en orden creciente de magnitud. Muestra:

Conteo el nmero de observaciones al nivel especificado del factor.

LS Media la media estimada por mnimos cuadrados. En el caso de un diseo


balanceado, la media de mnimos cuadrados es equivalente al promedio de todas las
observaciones al nivel indicado. En diseos no balanceados, la media de mnimos
cuadrados es el valor predicho de la variable dependiente cuando el factor especificado se
fija a un nivel particular mientras los dems factores se fijan a sus niveles medios. Las
medias de mnimos cuadrados ajusta cualquier desbalanceo en los datos, haciendo
predicciones a un nivel comn para todos los factores.

LS Sigma el error estndar estimado de la media de mnimos cuadrados.

2006 por StatPoint, Inc.

ANOVA Multifactorial - 9

STATGRAPHICS Rev. 4/d/yyyy


Grupos homogneos una ilustracin grfica de cules medias son significativamente
diferentes de cules, basada en los contrastes desplegados en la segunda mitad de la tabla.
Cada columna de Xs indica un grupo de medias entre las que no hay diferencias
estadsticamente significativas. En el ejemplo hay 2 columnas, cada una conteniendo una
sola X, indicando que los dos sexos caen en grupos significativamente diferentes.

La segunda mitad de la tabla despliega una comparacin entre cada par de medias de nivel.

Diferencia la diferencia entre las dos medias de mnimos cuadrados.

Lmites un estimador de intervalo de esa diferencia, usando el procedimiento


seleccionado de mltiples comparaciones.

Sig. Se pone un asterisco junto a cualquier diferencia que sea estadsticamente


significativamente diferente de 0 al nivel de significancia seleccionado, i.e., cualquier
intervalo que no contenga al 0.

Panel de Opciones

Mtodo: el mtodo usado para hacer las comparaciones mltiples.

Factor: el factor a desplegarse.

Nivel de Confianza: el nivel de confianza usado por el procedimiento seleccionado de


comparaciones mltiples.

Los mtodos disponibles son:

LSD - forma un intervalo de confianza para cada par de medias al nivel de confianza
seleccionado, usando la distribucin t de Student. Este procedimiento se le atribuye a
2006 por StatPoint, Inc.
ANOVA Multifactorial - 10

STATGRAPHICS Rev. 4/d/yyyy


Fisher y se conoce como el procedimiento Diferencia Menos Significativa, pues la
magnitud de los lmites indica la menor diferencia entre dos medias cualesquiera que
puedan representar una diferencia estadsticamente significativa. Slo debe usarse cuando
la F-prueba de la tabla ANOVA indique diferencias significativas entre las medias
muestrales

Tukey HSD ensancha los intervalos para permitir comparaciones mltiples entre todos
los pares de medias usando la t de Tukey. Tukey llam a su procedimiento el de
Diferencia Honestamente Significativa ya que controla la tasa de error experimental a .
Si todas las medias son iguales, la probabilidad de declarar a cualquiera de los pares
como significativamente diferentes en todo el experimento es igual a . El procedimiento
de Tukey es ms conservador que el procedimiento LSD de Fisher, pues hace ms difcil
declarar cualquier par particular de medias como significativamente diferentes.

Scheffe diseado para permitir la estimacin de todos los posibles contrastes entre las
medias muestrales (no solo en comparaciones por pares). Usa una mltiple relacionada
con la distribucin F. En esta instancia, es probable que el procedimiento sea muy
conservador, pues slo se estn estimando pares.

Bonferroni diseado para permitir la estimacin de cualquier nmero preseleccionado


de contrastes. Estos lmites son usualmente ms anchos que los de Tukey cuando se
hacen todas las comparaciones por pares.

Student-Newman-Keuls A diferencia de los mtodos previos, ste no crea intervalos


para las diferencias por pares. En vez de eso, ordena las medias en orden creciente y
luego comienza a separarlas en grupos de acuerdo a valores del rango distribucin
Studentizada. Eventualmente, las medias se separan en grupos homogneos en los que no
hay diferencias significativas.

Duncan similar al procedimiento Student-Newman-Keuls, excepto que usa un valor


crtico distinto al rango de la distribucin Studentizada al definir los grupos homogneos.
Una discusin detallada de los procedimientos de Duncan y de Student-Newman-Keuls la
dan Milliken y Johnson (1992)

Esto slo debe usarse cuando la F-prueba en la tabla ANOVA indique diferencias significativas
entre las medias muestrales. La probabilidad de hacer un error Tipo I aplica a cada par de
medias de manera separada. Si se hace ms de una comparacin, la probabilidad total de llamar
al menos a un par de medias significativamente diferentes cuando no lo son puede ser
considerablemente mayor que .
La eleccin entre un procedimiento LCD y uno de mltiples comparaciones como el HSD de
Tukey debe depender del costo relativo de hacer un error Tipo I (llamar diferentes a un par de
medias que realmente no lo son) contra el costo de hacer un error Tipo II (no llamar diferentes a
un par de medias que s lo sean). En las primeras etapas de una investigacin, tal vez uno no
quiera ser tan conservador como cuando ya se han hecho las verificaciones finales

2006 por StatPoint, Inc.

ANOVA Multifactorial - 11

STATGRAPHICS Rev. 4/d/yyyy

Tabla de Medias
Esta tabla despliega las medias de mnimos cuadrados para cada nivel de los factores y para
pares de niveles de cualquier interaccin bifactorial incluida. Cada media se muestra junto a su
error estimado estndar y un intervalo de confianza:
Tabla de Medias por Mnimos Cuadrados para minutos con intervalos de confianza del 95.0 %
Error
Lmite
Lmite
Nivel
Casos Media
Est.
Inferior
Superior
MEDIA GLOBAL
36
19.1389
grasa corporal
alta
18
14.7222
0.698361
13.2939
16.1505
baja
18
23.5556
0.698361
22.1272
24.9839
sexo
femenino
18
16.7222
0.698361
15.2939
18.1505
masculino
18
21.5556
0.698361
20.1272
22.9839
fumador
pesado
12
15.6667
0.855314
13.9174
17.416
ligero
12
18.5833
0.855314
16.834
20.3326
ninguno
12
23.1667
0.855314
21.4174
24.916
grasa corporal por
fumador
alta,pesado
6
14.1667
1.2096
11.6928
16.6406
alta,ligero
6
14.1667
1.2096
11.6928
16.6406
alta,ninguno
6
15.8333
1.2096
13.3594
18.3072
baja,pesado
6
17.1667
1.2096
14.6928
19.6406
baja,ligero
6
23.0
1.2096
20.5261
25.4739
baja,ninguno
6
30.5
1.2096
28.0261
32.9739

Panel de Opciones

Nivel de Confianza: el nivel de confianza asociado a cada intervalo.

2006 por StatPoint, Inc.

ANOVA Multifactorial - 12

STATGRAPHICS Rev. 4/d/yyyy

Grfica de Medias
Las medias de nivel pueden graficarse junto a intervalos de incertidumbreMedias y 95.0% de Fisher LSD
25
23

minutes

21
19
17
15
13
high

low
body fat

El tipo de intervalo desplegado depende de las configuraciones del Panel de Opciones.


Si todos los tamaos de muestra son los mismos (o cercanos), el analista puede determinar cules
medias son significativamente diferentes de cules otras usando los procedimientos LSD, Tukey,
Scheffe o Bonferroni simplemente viendo si un par de intervalos se traslapan en direccin
vertical o no. Un par de intervalos que no se traslapan indica una diferencia estadsticamente
significativa entre las medias al nivel de confianza seleccionado.
En este caso, note que el intervalo para alta grasa corporal no se traslapa con el intervalo de baja
grasa corporal, indicando una diferencia estadsticamente significativa entre las medias a esos
dos niveles.

Panel de Opciones

2006 por StatPoint, Inc.

ANOVA Multifactorial - 13

STATGRAPHICS Rev. 4/d/yyyy

Intervalos: el mtodo usado para construir los intervalos.

Factor: el factor a graficarse.

Nivel de Confianza: el nivel de confianza asociado a cada intervalo.

Los tipos de intervalos que pueden ser seleccionados.

Intervalos de Confianza despliega intervalos de confianza para las medias de nivel


usando el error cuadrtico medio de la tabla ANOVA.

Intervalos LSD diseados para comparar cualquier par de medias con el nivel de
confianza establecido.

Intervalos HSD Tukey diseados para comparar todos los pares de medias. El nivel de
confianza establecido aplica para toda la familia de comparaciones par a par.

Intervalos Scheffe diseados para comparar todos los contrastes. No son muy
relevantes aqu.

Intervalos Bonferroni diseados para comparar un nmero seleccionado de contrastes.


Los intervalos de Tukey son usualmente ms ajustados.

Grfica de Interaccin
Cuando existan una o ms interacciones significativas, deben examinarse juntas usando la
Grfica de Interaccin.

Grfico de Interacciones
32

body fat
high
low

29

minutes

26
23
20
17
14
heavy

light
smoking

none

La grfica de interaccin despliega las medias por mnimos cuadrados en todas las
combinaciones de dos factores. Si los factores no interactan, las lneas en la grfica deben ser
aproximadamente paralelas. Si no, entonces el efecto de un factor depende del nivel de otro, que
es la definicin de interaccin.
2006 por StatPoint, Inc.

ANOVA Multifactorial - 14

STATGRAPHICS Rev. 4/d/yyyy


Note que el efecto de fumador es mucho mayor en individuos con baja grasa corporal que en
aquellos con alta grasa corporal.

Panel de Opciones

Intervalo el tipo de intervalo (si hay) a ponerse alrededor de cada media.

Nivel de Confianza el nivel de confianza del intervalo.

Interaccin la interaccin a graficarse. Se desplegar un punto mostrando el valor medio


predicho para cada combinacin de factores en la interaccin seleccionada.

Graficar en Ejes el factor de la interaccin seleccionada que ser utilizada para definir el
eje horizontal. Lneas separadas se retirarn de cada nivel del otro factor.

Ejemplo Grfica de Interaccin con Intervalos Tukey


Aadir intervalos Tukey HSD permite una comparacin por pares entre las seis combinaciones
de fumador y grasa corporal:

2006 por StatPoint, Inc.

ANOVA Multifactorial - 15

STATGRAPHICS Rev. 4/d/yyyy

Interacciones y 95.0% de Tukey HSD


35

smoking
heavy
light
none

31

minutes

27
23
19
15
11
high

low
body fat

Examinando el traslape de los intervalos, tres grupos homogneos son identificables:


Grupo 1: individuos no-fumador, baja grasa corporal, cuyos tiempos en la prueba son
significativamente ms largos que los de los dems individuos.

Grupo 2: individuos ligero-fumador, baja grasa corporal, cuyos tiempos en la prueba son
menores que los del Grupo 1, pero significativamente mayores que los de otros.
Grupo 3: los dems. Note que todos sus intervalos se traslapan, indicando que no hay
diferencias estadsticamente significativas entre los individuos restantes.

Grficas de Residuales
Como en todo modelo estadstico, es una buena costumbre examinar los residuales. Los
residuales son iguales a los datos observados menos los valores predichos por el modelo
estadstico subyacente.
El procedimiento ANOVA Multifactorial crea 3 grficas de residuales:
1. contra nivel de factor.
2. contra valor predicho.
3. contra nmero de observacin.
Residuales contra Nivel de Factor
Esta grfica es de ayuda para visualizar cualquier diferencia en la variabilidad de varios niveles
de un factor.

2006 por StatPoint, Inc.

ANOVA Multifactorial - 16

STATGRAPHICS Rev. 4/d/yyyy


Grfico de Residuos para minutes
8

residuos

5
2
-1
-4
-7
heavy

light

none

smoking

El residual promedio de cada nivel es igual a 0.

Panel de Opciones

Factor: factor a desplegarse en el eje horizontal.

Residuales contra Predicho


Esta grfica es de ayuda para detectar cualquier heteroescedasticidad en los datos.
Grfico de Residuos para minutes
8

residuos

5
2
-1
-4
-7
0

2006 por StatPoint, Inc.

10

20
predichos

30

40

ANOVA Multifactorial - 17

STATGRAPHICS Rev. 4/d/yyyy


La heteroescedasticidad ocurre cuando la variabilidad de los datos cambia como lo hace la
media, y puede necesitarse transformar los datos antes de realizar el ANOVA. Usualmente es
evidenciado por un patrn de forma de embudo en la grfica de residuales.
Residuales contra Observacin
Esta grfica muestra los residuales contra el nmero de fila en la hoja de datos:
Grfico de Residuos para minutes
8

residuos

5
2
-1
-4
-7
0

10

20
nmero de fila

30

40

Si los datos se arreglan en orden cronolgico, cualquier patrn de los datos puede indicar una
influencia exterior. No es evidente ningn patrn as en la grfica de arriba.

2006 por StatPoint, Inc.

ANOVA Multifactorial - 18

STATGRAPHICS Rev. 4/d/yyyy

Guardar Resultados
Los siguientes resultados pueden guardarse en la hoja de datos:
1. Recuentos por Nivel el nmero de observaciones a cada nivel de los factores y a cada
par de factores.
2. Medias por Nivel la respuesta media a cada nivel de factores y a cada par de factores.
3. Errores Estndar por Nivel el error estndar a cada nivel de factores.
4. Medias de Mnimos Cuadrados la media por mnimos cuadrados a cada nivel de
factores.
5. Residuos los n residuales.

Clculos
Modelo Estadstico
Para ajustar un modelo a los datos, STATGRAPHICS construye una matriz de n por p de
variables X independientes. La matriz incluye:

Una columna de 1s para representar una constante.

Variables indicatrices para cada factor. Para un factor con k niveles, k 1 variables
indicatrices se construyen. La j-sima variable indicadora para un factor contiene el valor 1
para cada observacin igual al j-simo nivel del factor, -1 para cada observacin igual al ksimo nivel y 0 para cualquier otro caso.

Una columna conteniendo los valores de cada covariacin, si hay.

Productos cruz de las variables indicadoras y las columnas covariadas para representar
cualquier interaccin.

Entonces se ajusta un modelo usando estimacin lineal de mnimos cuadrados:

= ( X X ) 1 X Y

(2)

Medias por Mnimos Cuadrados


Las medias por mnimos cuadrados son la respuesta predicha

Yp = X p ( X X ) 1 X Y

(3)

donde X p es el vector de variables independientes en las que cada variable indicadora


correspondiente a factores no incluidos en el efecto especificado se fija a 0 y cada covariacin se
fija a su nivel medio observado.

2006 por StatPoint, Inc.

ANOVA Multifactorial - 19

STATGRAPHICS Rev. 4/d/yyyy


Errores Estndar
Estimados a partir de

s.e. p =

X p MSE ( X X ) 1 X p

(4)

donde MSE es igual al error cuadrtico medio en la tabla ANOVA.

Procedimientos de Comparaciones Mltiples


Vea la documentacin ANOVA de una va.

2006 por StatPoint, Inc.

ANOVA Multifactorial - 20

También podría gustarte