Está en la página 1de 48

Anlisis de Varianza

ANOVA
(Analysis of Variation)

ANOVA Asunto bsico


Dos Variables:
Categrica (los grupos)
Cuantitativa (lo medido)
Los promedios de la variable cuantitativa
varan entre los grupos (categoras)?

Nota: si se trata solamente de dos grupos se hace test t no pareado. Anova,


para ms de dos grupos.

ANOVA
1. Muestras provienen de poblacin con
distribucin normal y con similares DS
(para hablar de similitud de DS siga la regla 2:1).

2. La varianza de cada grupo es un


estimativo de la varianza de la poblacin.
3. La varianza mezclada (pooled) de los
grupos puede utilizarse para calcular IC
de la diferencia de pares de promedios.

Anova
Cuando tenemos ms de dos
grupos.
Hiptesis nula:

xa xb xc ...
Calcular valor de F (de Fisher).
Distribucin de F tiene sesgo
cuando se acepta hiptesis nula.

Que hace el ANOVA?


En su forma ms simple ANOVA:
H0: Los promedios de todos los grupos son iguales.
Ha: No todos los promedios son iguales
No dice cmo o cules son diferentes.
Puede continuar con mltiples comparaciones

Ejemplos de utilizacin de ANOVA en odontologa

1. Cinco tratamientos diferentes para


pacientes con herpes recurrente
2. Variacin de ngulo gonaco en
pctes con ADM clase I, II, III
3. Resistencia al desgaste de tres
resinas diferentes
4. Grosor de la capa hbrida utilizando
tres adhesivos diferentes

Least Squares Means


Factor

Level

LS Mean

Standard Error

POSTGRADO

Endo

6.100

0.127

10.000

POSTGRADO

Orto

6.143

0.121

11.000

POSTGRADO

Perio

6.286

0.107

14.000

Analysis of Variance
Source

Type III SS

df

Mean
Squares

F-ratio

p-value

POSTGRADO

0.234

0.117

0.726

0.492

Error

5.145

32

0.161

Case

11 is an Outlier

(Studentized
Residual

:-3.466)

Test de ANOVA, se asume


que:
Cada muestra debe ser
independiente de las otras.
Cada muestra debe haber sido
seleccionada al azar de la pob de
donde proviene.

Las pob de donde provienen las muestras


debe tener dist normal.
Las varianzas de cada pob deben ser
iguales, aunque los promedios sean
diferentes, es decir cuando los tratamientos
tengan efecto.

Nota: si esto no se cumple, deber ocupar otro


test, generalmente test de Kruskal-Wallis.

Cmo seleccionar muestra al


azar?
Asignando con la moneda (cara /
sello) (fcil solamente para dos
grupos).
Tablas de nmeros aleatorios (ver
libros de bioestadstica)
Generar nmeros aleatorios
(funcin random o aleatorio.entre
en excel), u otro software.

Anotacin en ANOVA
N: nmero de individuos en total

ANOVA ANALISIS DE VARIANZA DE UNA VIA


Datos: 5 tratamientos con antivirales en 6 pctes (replicas)
(P)

(2)

(3)

(4)

(5)

10

f = 6, k = 5, N = 30

5 trat para infeccin herptica (valores indican das de


duracin de las lesiones)
(P)

(2)

(3)

(4)

(5)

10

5 trat para infeccin herptica (valores indican das de


duracin de las lesiones)

(P)

(2)

(3)

(4)

(5)

10

45

30

26

31

37

5 trat para infeccin herptica (valores indican das de


duracin de las lesiones)

X
X

(P)

(2)

(3)

(4)

(5)

25

16

36

49

81

64

36

16

16

49

36

16

36

25

49

25

36

49

100

25

16

49

64

36

25

36

351

158

118

171

249

Suma total de cuadrados


Suma total de los cuadrados (SSC):

2
Factor
de correccin
(CF):
2

TSS X

(x)2/n

TSS = (351+158+118+171+249) (45+3026+31+37) 2 /30


= 1047 28561/30
= 1047 952,03
Factor de correccin
TSS = 94,97

Suma total de los cuadrados


Est basada en la suma de los cuadrados de las
diferencias de cada una de las observaciones del
promedio general. Se divide en:
Suma de Cuadrados Entre los grupos basado en la
suma de los cuadrados de la diferencia entre el
promedio de cada grupo y el promedio general (SS B)
Suma de Cuadrados Dentro de los grupos: calculado
como la suma de los cuadrados para la diferencia entre
cada observacin y el promedio de su grupo (SS w)

SSB
Variabilidad entre los grupos:
Variabilidad de los promedios de los
diferentes grupos alrededor del gran
promedio (calculado sin tomar en
cuenta la estructura del grupo)

SSw
Variabilidad dentro del grupo: Tambin
llamada variacin NO explicada o
residual y se refiere a la variacin al
azar entre los individuos dentro de cada
grupo.

Cuadrados dentro de los grupos


(Error)
Suma de cuadrados dentro de los grupos (Within Sum of Squareds)
(Donde k: nmero de grupos; f: nmero de individuos en cada grupo)

X
2
k

SSW X
n
f

SSW = 1047 ( 45 /6 +30 /6 +26 /6 +31 /6 + 37 /6 )


2

= 1047 988,51
SSW = 58,49

SUMA DE CUADRADOS ENTRE LOS GRUPOS


Between sum of squares
Suma de cuadrados entre los grupos (between)

Xk
SS B
n
f

CF

SSB = ( 452/6 +302/6 +262/6 +312/6 + 372/6 ) 952,03


SSB = 988,51 952,03
SSB = 36,48

Cuadrados medios
Cada suma de cuadrados se convierte en una
varianza estimada (Cuadrados Medios)
dividiendo por sus grados de libertad.
GL entre los grupos: k 1
Dentro de los grupos: (n1 1 + n2 1 + n3 1)

De la hiptesis nula:
GAUSS
Todos los grupos tienen el mismo
promedio y la misma varianza, por lo
tanto la relacin de las varianzas sera 1.
Mediante el valor de F comparamos las
varianzas y obtenemos la relacin de
ellas

Tabla de ANOVA
Construccin de la tabla de Anlisis de Varianza:
Fuente de
Variacin

SC

gl

MS

Between
36,48 4
9,12
Within 58,49 25
2,339
Total
= 2,75

4; 25
0 , 05

94,97

3,897

29

Por lo tanto existen dif. signif. (P<0,05)

Fcrtico
depende de
los gl de
CMentre y
CM dentro, y
elegir el
valor de

Por lo tanto
P<0,05
P>0,01
0,05>P>0,01

Valores de F crticos segn tabla


Valor de F obtenido = 3,897
4; 25
0 , 05

= 2,75

4; 25
0 , 025

= 3,35

4; 25
0 , 01

= 4,18

Por lo tanto:

0,05> P > 0,01

Valor de F
varianza de la poblacin estimada
de la medias de las muestras
F
varianza de la poblacin estimada como
promedio de varianzas de las muestras

GRADOS DE LIBERTAD EN TABLA DE ANOVA

Entre los grupos (between) (k-1):


n(mero de grupos) 1: (5 - 1) = 4
Dentro de los grupos (within)
k(n-1): 5(6-1) = 25
Total = n 1; 30 - 1 = 29

VALOR DE F

S between
F 2
S within

Si F es un nmero grande,
la variabilidad entre las
medias de las muestras
es mayor que la
esperada a la
variabilidad dentro de las
muestras, y rechaza la
hiptesis nula de que
todas las muestras son
de la misma poblacin.

Least Squares Means


Factor

Level

LS Mean

Standard
Error

Medicamento Placebo

7.500

0.624

6.000

Medicamento a

5.000

0.624

6.000

Medicamento b

4.333

0.624

6.000

Medicamento c

5.167

0.624

6.000

Medicamento d

6.167

0.624

6.000

Analysis of Variance
Source

Type III
SS

df

Mean
Squares

F-ratio

p-value

Medicame 36.467
nto

9.117

3.896

0.014

Error

25

2.340

58.500

Grficos para ANOVA


Promedios y DS de cada grupo.
Cajas.
Puntos.

Tests para comparar medias


Scheff
Si tamao de los grupos es diferente
Interesa adems contrastes (Ej: grupo 1 y 2 vs 3)

Tukey
Si tamao de los grupos es igual
Inters prinicipal es comparar solo promedios de
grupos

Bonferroni
No se haba previsto comparar grupos
Utilizar solamente si resultado en ANOVA es p<0,05

Test de Scheff
Dos promedios presentan diferencias
significativas si su diferencia excede el
valor calculado por:
1 1
(k 1) F0.05 *
* MSE
n1 n2

k = nmero de promedios.
F3,8;0.05 = 4,0662
MSE = 0,917 (de cuadrado medio, within)

Test de Scheff
Dos promedios presentan diferencias
significativas si su diferencia excede el
valor calculado por:
[(k-1)F0,05]1/2 [(1/n1 + 1/n2)*MSE]1/2
k = nmero de promedios.
F3,8;0,05 = 4,0662
MSE = 0,917 (de cuadrado medio, within)

Clculo de Scheff

k 1 ( F

4 , 25 1 / 2
0 , 05

1
* MSE

n1 n2

1 1

4 * 2,75 * 2,339
6 6

(3,316)(0,8829) 2,928

1/ 2

1/ 2

1/ 2

Existe diferencia entre dos grupos, si la diferencia de


sus promedios supera a 2,928

5 trat para infeccin herptica (valores indican das de


duracin de las lesiones), ltima fila sus promedios

(P)

(2)

(3)

(4)

(5)

10

7,50

5,00

4,33

5,17

6,17

Promedios de cada grupo y sus diferencias


1. Entre Placebo y grupo (3) = 7,50 4,33 = 3,17
Valor supera al valor del test de Scheff (2,928), por lo tanto
existen diferencias significativas entre esos dos grupos
2. Entre placebo y grupo (2) = 7,50 5,0 = 2,50
Valor del test de Scheff es superior, por lo tanto NO existen
diferencias significatvas entre Placebo y grupo 2.
NO DEBE HACER MS COMPARACIONESYA QUE TODAS
LAS OTRAS DIFERENCIAS SON MENORES A VALOR DE
SCHEFF.
Promedios ordenados de mayor a menor (lnea marca entre
qu grupos NO existe diferencias significativas):
(P)

(5)

(4)

(2)

(3)

7,50

6,17

5,17

5,00

4,33

Realizacin de Anova con software estadstico

Dependiente: variable que desea examinar,


debe ser continua (por ejemplo: edad,
recuento de linfocitos, hematcrito, etc. D
N !)
Factor: una o ms variables categricas que
tienen agrupados datos en ms de dos
grupos (variables de agrupar, ej.: NSE, Clase
esq (I, II y III), etc.)
Identificar si desea comparacin entre
grupos(Tukey, Scheff, etc.)

Least Squares Means


Factor

Level

LS Mean

Standard
Error

Medicamento Placebo

7.500

0.624

6.000

Medicamento a

5.000

0.624

6.000

Medicamento b

4.333

0.624

6.000

Medicamento c

5.167

0.624

6.000

Medicamento d

6.167

0.624

6.000

Analysis of Variance
Source

Type III SS

df

Mean
Squares

F-ratio

p-value

Medicamento

36.467

9.117

3.896

0.014

Error

58.500

25

2.340

Tukey o Scheff
Tukey. Uses the Studentized range statistic to
make all pairwise comparisons. This is the
default.
Scheff. The significance level of Scheffs test
is designed to allow all possible linear
combinations of group means to be tested, not
just pairwise comparisons available in this
feature. The result is that Scheffs test is more
conservative than other tests.

Tipos de Anova
Con un factor
Con dos factores:
tres grupos (A, B, C)
gnero (M, F)
Interaccin

Con ms de dos factores (NSE, gnero,


religin)
De medidas repetidas (activ EMG)

Anova de dos vas


Categorical values encountered during processing are:
GRUPO$ (3 levels)
A, B, C
METODO$ (2 levels)
I, II
Dep Var: LIPIDOS

N: 18

Multiple R: 0.998

Squared multiple R: 0.996

Analysis of Variance
Source
GRUPO$
METODO$
GRUPO$*METODO$
Error

Sum-of-Squares

df

Mean-Square

F-ratio

109.644
0.027
0.047

2
1
2

54.822
0.027
0.024

1372.854
0.670
0.591

0.479

12

0.040

P
0.000
0.429
0.569

-------------------------------------------------------------------------------

Desventajas de utilizar computador en


estadstica (Altman, 1999)

Errores en los softwares


Versatilidad (dada la disponibilidad de
tantos softwares y tests: tentacin a usar
el q no corresponde)
La caja negra le aleja de sus datos
La basura se va con la basura (si ingresa
datos en forma equivocada los resultados
sern equivocados, ingreso de 0, 9, 99,
999)

Ventajas de utilizar computador en estadstica


(Altman, 1999)

Precisin y rapidez
Versatilidad (gran cantidad de tests
disponibles)
Grficos
Flexibilidad
Nuevas variables
Volumen de datos
Transferencia de datos

Estrategia para anlisis de


datos
Recoleccin de datos (form codificados)
Entrada de datos (Excel)
Chequear datos (min, max, x, ds)
Graficar antes de analizar
Anlisis de datos
Chequear resultados
Interpretar

Web Pages that Perform Statistical Calculations:

http://members.aol.com/johnp71/javasta2.html#Demos

También podría gustarte