Está en la página 1de 30

Anlisis de Varianza (ANOVA)

9.

Comparando ms de dos medias. Anlisis de Varianza.

Objetivos:
9.1 9.2 9.3 9.4 9.5 9.6 Al finalizar esta unidad el estudiante ser capaz de: Describir los elementos estadsticos de un diseo experimental. Definir el objetivo de un anlisis de varianza. Formular hiptesis adecuadas para las diferentes situaciones. Describir la distribucin de F. Construir la tabla de anlisis de varianza. Calcular F e interpretar los resultados de la prueba de hiptesis.

Contenidos:
9.1 9.2 9.3 9.4 Elementos del diseo de experimentos. Supuestos para la aplicacin del anlisis. Anlisis de varianza simple. Anlisis de varianza de dos vas.

SITUACION BASICA

z Un factor ( tratamientos) Categrica z Una variable de respuesta: Cuantitativa z Pregunta principal: Las medias de cada grupo difieren o estn afectadas por el tratamiento? z Nmero de grupos: El caso particular de dos grupos , utilizamos test de t z Nmero de grupos: Cuando son ms de 2 grupos: Problema de las comparaciones multiples

COMPARACION DE MAS DE DOS MEDIAS


Cuando se comparan dos medias a nivel de significacin E, la probabilidad de cometer un error de tipo I es E

Cuando se comparan de a dos a medias tenemos comparaciones posibles. P(x=0)=(1-p)^n P(x>0)=1-[(1-p)^n]


a C2 ] )

a C2

Probabilidad de cometer un erro tipo I = 1-[(1-

Para 5 grupos tenemos 10 comparaciones posibles Para un E= 0,05 : P(x>0)=1-[(1-0,05)^10]= 0,40

Una solucin para este problema es la CORRECCION DE BONFERRONI : Suele ser excesivamente severa En el ejemplo:

E E '! a C2

0.05 E'! ! 0,005 10

HAY OTRAS ALTERNATIVAS: UNA DE ELLAS ES EL ANALISIS DE LA VARIANZA

sentre Fc ! 2 sdentro

ANOVA (ANalysis Of Variance) Finalidad


Comparar simultneamente varias medias

Modelo I efectos fijos

xij
IBj

! Q  E i  I ij

x Q QA

xBj QB
Variacin total

EB QC

B
bioestadistica

grupos

xij

 Q ! Qi  Q 
Ei

xij  Qi
2

En la poblacin

Iij

xij

 x ! xi  x  xij  xi
2 2

En la muestra

Elevando al cuadrado:

xij  x ! xi  x  xij  xi  2 xi  x xij  xi


Sumando:

x ij  x ij
SC TOTAL

! xi  x  xij  xi
2 2 2 ij ij
SC ENTRE
grupos

SC DENTRO de
grupos (residual)

x ij  x ij
SC TOTAL

! xi  x  xij  xi
2 2 2 ij ij
SC ENTRE
grupos

SC DENTRO de
grupos (residual)

sentre

SCentre ! ! glentre

( xij  x )
ij

Recordar

a 1

sdentro

o residual

SCdentro ! ! gldentro

( xij  xi )
ij

na

HIPOTESIS Modelo I

En general

H 0 : i : i ! 0

H 0 : i : Q i ! Q
ESTIMA

MEDIAS DE CUADRADOS

MC entre = SC entre/(a-1)
a = no de grupos Mod I

W 2  ni

E i2

a 1

ni !

tamao medio del grupo

MC dentro = SC dentro/(n-a ) n = tamao de la muestra total

Si Ho es verdadera : MC entre = MC dentro en la poblacin

TEST DE HIPOTESIS

Fcalc = MC entre/ MC dentro


se compara con Ftab (a-1) y (n-a) grados de libertad Supuestos para la validez del test Normalidad de los residuos (Iij) Homocedasticidad de los residuos

Independencia de las observaciones

SC entre !

ni i

Ti2

T2 n

SC total !

2 x ij ij

T

SC dentro ! SC total  SC entre


Donde:

Ti ! x ij
j

En el i-simo grupo

ni ! Tamao del i-simo grupo

T ! x ij
ij

Gran total

n!

n
i

Tamao total de la muestra

FUENTE DE VARIACION ENTRE GRUPOS DENTRO DE GRUPOS TOTAL

SUMA DE CUADRADOS SC entre SC dentro SC total

GL a-1 n-a n-1


0.4

MEDIA DE CUADRADOS

Fcalc

e tre (a  1) dentro (n  a)

M entre M dentro

f (x )

El Fcalculado se compara con el Ftabulado con (a-1) y (n-a) GL


0.2

17
0.0

CALCULO DE LAS SUMAS DE CUADRADOS A 4.4 5.9 6.2 6.3 Ti ni 22.8 4 B 8.6 4.5 8.4 8.7 30.2 4 C 3.4 7.3 8.8 0.2 0.1 19.8 5 10.6 3 T =83.4 n = 16 D 8.9 0.0 1.7

0 : i : Q i ! Q
2 x ij ! 597.2 ij

n ! ni ! 16
a!4

total ! 597.2  83.4

16 ! 162.4775

22.8 2 30.2 2 19.8 2 10.6 2 83.4 2 SC entre !     ! 39.1088 4 4 5 3 16 SC dentro ! SC total  SC entre ! 162.4775  39.1088 ! 123.3687

gl denominador (n-trat)

gl numerador (trat-1)

FUENTE DE VARIACION ENTRE GRUPOS DENTRO DE GRUPOS TOTAL

SUMA DE CUADRADOS

GL

MEDIA DE CUADRADOS

Fcalc

39.1088 123.3687 162.4775

3 12 15

13.036 10.281

1.27

F0.95(3, 12)= 3.49 Fcalc menor que Ftab No Se rechaza Ho

las medias no difieren entre s

A 2.6 2.4 2.9 2.6 2.7 2.9 2.5 2.8 2.5 3

B 3.2 3 2.8 2.9 3.3 3.1 3 3.4 3.2 3.2

C 2.4 2.8 2.5 2.7 2.5 2.9 2.4 2.6 2.2 2.6

-> trat = A | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------| 10 2.69 .2024846 2.4 3 -> trat = B | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------| 10 3.11 .1852926 2.8 3.4 -> trat = C | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------| 10 2.56 .2065591 2.2 2.9

. oneway x y,b Analysis of Variance Source SS df MS F Prob > F -----------------------------------------------------------------------Between groups 1.65266668 2 .826333338 21.01 0.0000 Within groups 1.06200005 27 .039333335 -----------------------------------------------------------------------Total 2.71466672 29 .093609197 Bartlett's test for equal variances: chi2(2) = 0.1124 Prob>chi2 = 0.945

Ganancia de Peso por Tratamiento Comparison of x by y (Bonferroni) Row Mean-| Col Mean | A B ---------+---------------------B | .42 | 0.000 C | -.13 -.55 | 0.463 0.000
(30 Preoperative Patients)
3.5 2 ganancia de peso (kg) 2.5 3

Supuestos del ANOVA


Observaciones Independientes. Distribucin Normal. Varianzas Homogneas.

Independencia de las Observaciones


Con el fin de obtener inferencias vlidas, resulta importante determinar si los errores se encuentran correlacionados. El supuesto ms importante es la independencia de las observaciones, pues si no hubo asignacin aleatoria de tratamientos a unidades experimentales, entonces los resultados pueden incluir un efecto persistente de factores no considerados en el anlisis. Esto invalida el experimento

Normalidad
No es tan importante como la Independencia de las Observaciones, pues el ANOVA es robusto. Esto quiere decir que, aunque las observaciones no sean normales, las medias de los tratamientos son aproximadamente normales debido al Teorema Central del Limite. Ante la falta de normalidad se puede optar por el uso de transformaciones o, como ltimo recurso, el uso de mtodos no paramtricos.

Homogeneidad de varianzas
Esta prueba resulta fundamental, pues cualquier situacin de heterogeneidad de las varianzas invalida las inferencias realizadas. Pueden existir grupos muy homogneos y, en el caso de existir un grupo muy heterogneo, sera posible no detectar diferencias entre los grupos con varianzas homogneas por el efecto de la contribucin a la varianza de ese grupo heterogneo. Cuando existe el problema de heterogeneidad de varianzas, lo apropiado es emplear transformaciones o mtodos no paramtricos.

Anlisis de residuos
Homogeneidad de Varianzas
Bartlett

Normalidad
Kolmogorov-Smirnov

Autocorrelacin
Durbin-Watson

Es importante mencionar que el empleo de estadstica no paramtrica o el uso de transformaciones no elimina el problema de la falta de aleatoriedad (falta de independencia), es decir, la ejecucin incorrecta de un experimento no tiene un remedio en la etapa del anlisis.

También podría gustarte