Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Anova 2011
Anova 2011
ANOVA
(Analysis of Variation)
ANOVA – Asunto básico
• Dos Variables:
– Categórica (los grupos)
– Cuantitativa (lo medido)
• ¿Los promedios de la variable cuantitativa
varían entre los grupos (categorías)?
• Nota: si se trata solamente de dos grupos se hace test – t no pareado. Anova,
para más de dos grupos.
ANOVA
1. Muestras provienen de población con
distribución normal y con similares DS
(para hablar de similitud de DS siga la regla 2:1).
xa xb xc ...
• Calcular valor de F (de Fisher).
• Distribución de F tiene sesgo
cuando se acepta hipótesis nula.
Que hace el ANOVA?
En su forma más simple ANOVA:
H0: Los promedios de todos los grupos son iguales.
.
Ejemplos de utilización de ANOVA en odontología
Analysis of Variance
Source Type III SS df Mean F-ratio p-value
Squares
POSTGRADO 0.234 2 0.117 0.726 0.492
Error 5.145 32 0.161
f = 6, k = 5, N = 30
5 trat para infección herpética (valores indican días de
duración de las lesiones)
X 45 30 26 31 37
5 trat para infección herpética (valores indican días de
duración de las lesiones)
2
X
(P) (2) (3) (4) (5)
25 16 36 49 81
64 36 16 16 9
49 36 16 36 25
49 9 25 36 49
100 25 16 9 49
X 64 36 9 25 36
X
2
351 158 118 171 249
Suma total de cuadrados
TSS X 2 X
Factor
de corrección
2
(CF): (x)2/n
n
TSS = (351+158+118+171+249) – (45+3026+31+37)2 /30
= 1047 – 28561/30
= 1047 – 952,03 Factor de corrección
TSS = 94,97
Suma total de los cuadrados
• Está basada en la suma de los cuadrados de las
diferencias de cada una de las observaciones del
promedio general. Se divide en:
– Suma de Cuadrados Entre los grupos basado en la
suma de los cuadrados de la diferencia entre el
promedio de cada grupo y el promedio general (SSB)
X
2
SSW X
2 k
n
f
SSW = 1047 – ( 452/6 +302/6 +262/6 +312/6 + 372/6 )
= 1047 – 988,51
SSW = 58,49
SUMA DE CUADRADOS ENTRE LOS GRUPOS
Between sum of squares
Xk 2
SS B CF
n
f
SSB = ( 452/6 +302/6 +262/6 +312/6 + 372/6 ) – 952,03
SSB = 988,51 – 952,03
SSB = 36,48
Cuadrados medios
• Cada suma de cuadrados se convierte en una
varianza estimada (Cuadrados Medios)
dividiendo por sus grados de libertad.
• GL entre los grupos: k – 1
• Dentro de los grupos: (n1 – 1 + n2 – 1 + n3 – 1)
De la hipótesis nula:
Fuente de SC gl MS F
Variación
Total 94,97 29
0,05>P>0,01
Valores de F críticos según tabla
Valor de F obtenido = 3,897
4; 25
F
0 , 05 = 2,75
4; 25
F 0 , 025 = 3,35
4; 25
F 0 , 01
= 4,18
Total = n – 1; 30 - 1 = 29
VALOR DE F
Si F es un número grande,
2
S between la variabilidad entre las
F 2 medias de las muestras
S within es mayor que la
esperada a la
variabilidad dentro de las
muestras, y rechaza la
hipótesis nula de que
todas las muestras son
de la misma población.
Least Squares Means
Factor Level LS Mean Standard N
Error
Medicamento Placebo 7.500 0.624 6.000
Analysis of Variance
Source Type III df Mean F-ratio p-value
SS Squares
Medicame 36.467 4 9.117 3.896 0.014
nto
Error 58.500 25 2.340
Gráficos para ANOVA
• Promedios y DS de cada grupo.
• Cajas.
• Puntos.
Tests para comparar medias
• Scheffé
– Si tamaño de los grupos es diferente
– Interesa además contrastes (Ej: grupo 1 y 2 vs 3)
• Tukey
– Si tamaño de los grupos es igual
– Interés prinicipal es comparar solo promedios de
grupos
• Bonferroni
– No se había previsto comparar grupos
6 6
(3,316)(0,8829) 2,928
Analysis of Variance
Source Type III SS df Mean F-ratio p-value
Squares
Medicamento 36.467 4 9.117 3.896 0.014
Error 58.500 25 2.340
Tukey o Scheffé
• Tukey. Uses the Studentized range statistic to
make all pairwise comparisons. This is the
default.
• Scheffé. The significance level of Scheffé’s test
is designed to allow all possible linear
combinations of group means to be tested, not
just pairwise comparisons available in this
feature. The result is that Scheffé’s test is more
conservative than other tests.
Tipos de Anova
• Con un factor
• Con dos factores:
– tres grupos (A, B, C)
– género (M, F)
– Interacción
• Con más de dos factores (NSE, género,
religión)
• De medidas repetidas (activ EMG)
Anova de dos vías
Categorical values encountered during processing are:
GRUPO$ (3 levels)
A, B, C
METODO$ (2 levels)
I, II
Analysis of Variance
-------------------------------------------------------------------------------
Desventajas de utilizar computador en estadística (Altman,
1999)
• Precisión y rapidez
• Versatilidad (gran cantidad de tests disponibles)
• Gráficos
• Flexibilidad
• Nuevas variables
• Volumen de datos
• Transferencia de datos
Estrategia para análisis de datos
– http://members.aol.com/johnp71/javasta2.html#Demos