Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Anova Un Factor
Anova Un Factor
Diseo Experimental
21 de marzo de 2011
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
1 / 37
Introduccin
Denicin (ANOVA de un Factor)
El mtodo de ANOVA de un Factor, es un mtodo de comparacin de medias que consiste en la comparacin de varios grupos (tratamientos) de una variable cuantitativa (variable dependiente).
H1 : i = j .
H 0 : 1 = 2 = . . . t .
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 2 / 37
Modelo Estadstico
(Modelo completo de medias)
El modelo est dado por
yij
= + j + ij ,
i = 1, , r
donde:
j = 1, , t
r es el nmero de replicas y t el nmero de tratamientos. yij : i -sima observacin del j -simo tratamiento, j : media del j -simo tratamiento, j = j : Efecto sobre la respuesta del j -simo tratamiento, ij : i -simo error experimental del j -simo tratamiento.
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 3 / 37
Modelo Estadstico
y11 y21
. . .
y12 y22
. . .
. . .
y1t y2t
. . .
yr 1
yr 2
yrt
Considere:
yj
r i =1
yij
n =r t
yij
j =1 i =1
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
4 / 37
Recuerde el problema de crecimiento bacterial. A cada conjunto de condiciones de empaque, se le asignaron, al azar, 5 cortes de carne. Se asume que los cortes forman un grupo homogneo. Se mide el nmero de bacterias por centmetro cuadrado.
Condiciones de empaque Al vacio (T1 ) 620 640 680 630 670 Mezcla de gases (T2 ) 730 720 690 680 670 100% CO2 (T3 ) 550 500 440 510 550
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
5 / 37
Empaques Al vaco (1) Al vaco (1) Al vaco (1) Al vaco (1) Al vaco (1) Mezcla de gases (2) Mezcla de gases (2) Mezcla de gases (2) Mezcla de gases (2) Mezcla de gases (2) 100% CO2 (3) 100% CO2 (3) 100% CO2 (3) 100% CO2 (3) 100% CO2 (3)
y
618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67 618,67
yj
648 648 648 648 648 698 698 698 698 698 510 510 510 510 510 Suma
(yij y )2
1,78 455,11 3761,78 128,44 2635,11 12395,11 10268,44 5088,44 3761,78 2635,11 4715,11 14081,78 31921,78 11808,44 4715,11
108373,333
(y j y )2
860,44 860,44 860,44 860,44 860,44 6293,78 6293,78 6293,78 6293,78 6293,78 11808,44 11808,44 11808,44 11808,44 11808,44
94813,333
(yj y j )2
784,00 64,00 1024,00 324,00 484,00 1024,00 484,00 64,00 324,00 784,00 1600,00 100,00 4900,00 0,00 1600,00
13560,000
El modelo completo es
yij
= j + ij
donde
i = 1, 2, 3, 4, 5 y j = 1, 2, 3.
La variacin total sera 108373,333, este valor ser llamado SCT. El objetivo es descomponer esta variacin total es dos variaciones, una atribuible a los tratamientos y otra al error. La variacin atribuible a los tratamientos (entre grupos) sera 94813,333, este valor ser llamado SCTR. Si los al hay diferencias entre los tratamientos.
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 6 / 37
y j , son muy similares y , entonces SCTR sera un valor pequeo, lo cual indicara que no
= yij j ).
Para que exista un efecto atribuible a los tratamientos (promedio por tratamiento diferentes), la SCTR debera ser un valor grande en comparacin a SCT (la SCE debera ser pequea). El porcentaje que representa la SCTR de la SCT es SCTR SCT
Como la SCTR representa el 87,5% de la variacin total (la SCE representa slo el 12,5% de la variacin total), entonces, al parecer, los promedios de los tratamientos son diferentes (efecto atribuible a los tratamientos).
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 7 / 37
=
j =1 i =1
(yij y )2
=
j =1 i =1
(y j y )2
=
j =1 i =1
(yij y j )2
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
8 / 37
Grados de libertad
= SCTR + SCE
nt Los grados de libertad para la SCT seran n 1 Los grados de libertad para la SCTR seran t 1
Los grados de libertad para la SCE seran
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
9 / 37
Media cuadrtica
Denicin (Media de cuadrtica)
Se dene como la suma de cuadrados promedio, con respecto al n grados de libertad.
o de
MCTR
t 1
MCE
mrodriguez@ucm.cl (UCM)
nt
21/03/2011 10 / 37
ANOVA un Factor
Prueba de hiptesis
(Tabla de ANOVA)
Modelo Suma de cuadrados Tratamiento (Inter-grupos) Error (Intra-grupos) Total SCTR SCE SCT Grados de libertad Media cuadrtica MCTR MCE MCTR MCE
Fc
t 1 nt n1
(Hiptesis)
H0 : 1 = 2 = = t
v/s
H1 : i = j ,
para algn
i, j
y Rechace
H0
si
Fc
> F1 (t 1, n t )
donde valor-p=
Rechace
H0
si valor-p
< 0, 05,
P (F
> Fc ).
21/03/2011 11 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
diferente de UE's asignadas ( j ). Tanto la prueba de hiptesis como la tabla ANOVA se mantiene, considerando los siguientes cambios:
rj
=
j =1 i =1 t rj
(y j y )2
SCT
=
j =1 i =1 t j =1
(yij y )2
donde;
yj
rj
rj i =1
yij
n=
rj
rj
yij
21/03/2011 12 / 37
j =1 i =1
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
= 0, 05,
H0 : 1 = 2 = 3 = 4
H1 : i = j ,
para algn
i, j
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
13 / 37
http://bit.ly/carne_anova_1factor
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
14 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
15 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
16 / 37
<ninguno> <ninguno>
Con
Sintaxis Recursos
= 0, 05,
perdidos para cualquier variablede en pruebe la hiptesis que existe efecto atribuible a las el anlisis. ONEWAY bacterias BY empaques
H0 : 1 = 2 = 3 = 4
Tiempo de procesador Tiempo transcurrido Descriptivos Nmero de bacterias
v/s 00:00:00,008
00:00:00,000
H1 : i = j ,
750
para algn
i, j
[Conjunto_de_datos1] C:\Users\13865271\Desktop\carne.sav
Intervalo de confianza para la media al 95% N Al vacio Mezcla de gases 100% CO2 Total 5 5 5 15 Media 648,00 698,00 510,00 618,67 ANOVA Nmero de bacterias Suma de cuadrados Inter-grupos Intra-grupos Total 94813,333 13560,000 108373,333 gl 2 12 14 Media cuadrtica 47406,667 1130,000 Lmite inferior 615,86 665,86 453,78 569,94
95% IC Nmero de bacterias
700
650
600
550
500
F 41,953
Sig. ,000
450
Al vacio
100% CO2
Como
valor
Fc = 41, 953 > F0,95 (2, 12) = 3, 89 (o equivalentemente el p = 0, 000 < 0, 05) entonces, rechace H0 , en favor de H1 .
Pgina 13
Vericacin de Supuestos
Normalidad
Denicin (Kolmogorov-Smirnov)
Pruebas de signicacin permiten contrastar la hiptesis de que las muestras obtenidas proceden de poblaciones normales (simtricas conforma de campana). Se debe vericar que para cada tratamiento, los datos provienen de una poblacin con distribucin normal.
(Regla)
Se rechaza la hiptesis de normalidad si el valor p (sig.) es menor que 0,05.
En SPSS: Analizar -> Estadsticos Descriptivos -> Explorar -> Grcos -> Grcos con prueba de normalidad.
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
18 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
19 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
20 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
21 / 37
gl 5 5 5
Nmero de bacterias SPSS tambin entrega la prueba de Shapiro-Wilk, la cual se utiliza Grficos Q-Q normales cuando 50, en caso contrario se utiliza la prueba de
Kolmogorov-Smirnov. Ambos mtodos son para vericar el supuesto de normalidad. Utilizando la prueba de Kolmogorov-Smirnov, como en cada condicin de empaque el valor
p (sig.)
rechazar la hiptesis de normalidad. Si utilizamos la prueba de Shapiro-Wilk, la conclusin sera la misma, con la nica diferencia de que los valores
mrodriguez@ucm.cl (UCM) ANOVA un Factor
22 / 37
Vericacin de Supuestos
Homogeneidad de varianzas
Denicin (Prueba de Levene)
La prueba de Levene (1960) contrasta la hiptesis de que los grupos denidos por la variable factor proceden de poblaciones con la misma varianza (supuesto de homogeneidad de varianzas). Consiste en llevar a cabo una ANOVA de un factor utilizando como variable dependiente la diferencia en valor absoluto entre cada puntuacin individual y la media (o la mediana, o la media recortada) de su grupo.
(Regla)
Se Rechaza la hiptesis de homogeneidad, si el valor p (Sig.) es menor que 0, 05.
En SPSS: Analizar -> Estadsticos Descriptivos -> Explorar -> Grcos -> Dispersin por nivel con prueba de Levene -> No transformados.
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 23 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
24 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
25 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
26 / 37
Prueba de homogeneidad de la varianza gl1 2 2 2 2 gl2 12 12 8,987 12 Sig. ,578 ,582 ,586 ,550
400
Nmero de bacterias
Basndose en la media Basndose en la mediana. Basndose en la mediana y con gl corregido Basndose en la media recortada
Nmero de bacterias
Estadstico de Levene
700
600
500
Al vacio
100% CO2
2 = 2 = 2. H0 : 1 3 2
distintas condiciones de empaque) Si consideramos la prueba de homogeneidad basado en la media, no podramos rechazar
H0 ,
pues el valor
Pgina 1
En el diagrama de caja, se nota esta armacin, por lo menos en el empaque al vaco y mezcla de gases.
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
27 / 37
diferencia mnima) o el
testigo.
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
28 / 37
Mtodo de Tukey
Tukey (1949a) desarroll un procedimiento, para las comparaciones en pares de todas la medias de tratamiento, que se usa para obtener intervalos de conanza simultneos de 100(1
)%.
como diferencia honestamente signicativa. Todas las comparaciones son referidas a una misma diferencia mnima.
DHS (t , ) = q (, t , n t )
absoluto de todas las diferencias por pares,
MCE r
para toda
i j .
i <j
son:
y i y j DHS (t , ).
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 29 / 37
Mtodo de Tukey
DHS (t , ) = q (, t , n t )
absoluto de todas las diferencias por pares,
MCE
2
ri
rj
i j .
para toda
i <j
son:
y i y j DHS (t , ).
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
30 / 37
Mtodo de Dunnett
(Mtodo de Dunnett para comparar todos los tratamientos con un control)
Para un grupo de tiene:
D (t 1, ) = d (, t 1, n t )
MCE
Las estimaciones de los intervalos de conanza simultneos bilaterales (dos colas) para las diferencias entre las medias de los tratamientos individuales y la media del tratamiento testigo
i c ,
son:
y i y c D (t 1, ).
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
31 / 37
Mtodo de Dunnett
D (t 1, ) = d (, t 1, n t ) MCE
ri
rc
Las estimaciones de los intervalos de conanza simultneos bilaterales (dos colas) para las diferencias entre las medias de los tratamientos individuales y la media del control
i c ,
son:
y i y c D (t 1, ).
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
32 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
33 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
34 / 37
mrodriguez@ucm.cl
(UCM)
ANOVA un Factor
21/03/2011
35 / 37
Error tpico 21,260 21,260 21,260 21,260 21,260 21,260 21,260 21,260
Lmite inferior -106,72 81,28 -6,72 131,28 -194,72 -244,72 -3,20 -191,20
Lmite superior 6,72 194,72 106,72 244,72 -81,28 -131,28 103,20 -84,80
HSD de Tukey
Al vacio
Mezcla de gases
100% CO2
a
t de Dunnett (bilateral)
Al vacio Al vacio
50,000 -138,000
*
*. La diferencia de medias es significativa al nivel 0.05. a. Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los dems grupos.
Subconjuntos homogneos
p. Cuando los
Condiciones de Subconjunto para alfa = 0.05 signos de los intervalos son diferentes, no se podra armar que existen empaques
Mezcla de gases 5 698,00 Por ejemplo, si consideramos el mtodo de Tukey y queremos Sig. 1,000 ,086 Se muestran las medias para los grupos en los subconjuntos homogneos. comparar el empaque al vaco con el de mezcla de gases, a. Usa el tamao muestral de la media armnica = 5,000.
-188,000
-244,72 -3,20
-138,000
-191,20
a. Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los dems grupos.
Subconjuntos homogneos
Nmero de bacterias Condiciones de empaques HSD de Tukey
a
Se muestran las medias para los grupos en los subconjuntos homogneos. a. Usa el tamao muestral de la media armnica = 5,000.
p H0 : 1 = 2 v/s H1 : 1 = 2 . No podramos rechazar la hiptesis nula (H0 ), pues el valorp = 0, 068 > 0, 05. Por otro lado, IC0,95 (1 3 ) = (81, 28; 194, 72), indicara que existen diferencias signicativas entre el empaque al vaco y de 100% de CO2 . (1 > 3 , pues el signo del intervalo es positivo). Equivalentemente, Deberamos rechazar la hiptesis nula (H0 : 1 = 3 ), pues el valorp = 0, 000 < 0, 05.
valor . Por ejemplo, si planteamos los hiptesis Tambin se presenta una tabla resumen, de sub-grupos homogneos (estadsticamente iguales).
mrodriguez@ucm.cl (UCM) ANOVA un Factor 21/03/2011 37 / 37