Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ANOVARes
ANOVARes
2004
H 0 1 2 3 .... k
Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras independientes
son:
Como el ANOVA de un criterio es una generalizacin de la prueba de t para dos muestras, los
supuestos para el ANOVA de un criterio son:
El mtodo de ANOVA con un criterio requiere del clculo de dos estimaciones independientes para
2 2 2
2 , la varianza poblacional comn. Estas dos estimaciones se denotan por s b y s w . s b se
2
denomina estimacin de la varianza entre muestras y s w se denomina estimacin de la varianza al
interior de las muestras. El estadstico tiene una distribucin muestral resultando:
s b2
F
s w2
F ( k 1, k ( n 1))
Donde el nmero de grados de libertad para el numerador es k-1 y para el denominador es k(n-1),
siendo el nivel de significancia.
k = nmero de muestras.
El Procedimiento es el siguiente1:
Pgina 1
ANOVA P. Reyes / Nov. 2004
2
4. Encontrar la estimacin de la varianza al interior de las muestras s w y sus grados de libertad
asociados glw.
5. Calcular la gran media para la muestra de las medias mustrales.
2
6. Determinar la estimacin de la varianza entre muestras s b y sus grados de libertad asociados.
7. Hallar el valor del estadstico de la prueba F.
8. Calcular el valor crtico para F basado en glb y glw.
9. Decidir si se rechaza H0.
Calculo Manual
r c 2
( Xij X )
i 1 j 1
SCT
r
SCTR rj ( X j X ) 2
j 1
Media
X3
*
5
4 *
* Media X2
Media X1
Pgina 2
ANOVA P. Reyes / Nov. 2004
** *
Xi Xi
* ** * ** *
*** * Xmedia 3
X media 1 ** *
* Xmedia 2 Xi *
Grados de libertad:
Gl. Totales = n 1
Gl. Tratamientos = c -1
Gl. Error = n c
Fc = CMTr / CME
Si P es menor a alfa o Fc es mayor a Ft se rechaza Ho indicando que los efectos de los diferentes
niveles del factor tienen efecto significativo en la respuesta.
Distr. F
Pgina 3
ANOVA P. Reyes / Nov. 2004
TABLA DE ANOVA
GRADOS
FUENTE DE VARIACIN SUMA DE DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO
Dentro de muestras
(err.) SCE n-c CME
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
PRUEBA DE TUKEY
Se utiliza el estadstico
T
CME
Se compara T vs la diferencia en valorT absoluto
q ,c ,n c de
r
cada par de medias, si esta dif. Excede a T, las medias son diferentes
o iguales en caso contrario. n = 16 r=4
c= 4 Alfa=0.05
Por ejemplo: 3.6 CME = 19.6875 T
Medias q.05,4,12= 4.2 9.31
X1 = 145 !X1 - X2!= 0.25 X1=X2
X2= 145.25 !X1-X3! = 12.75 X1<>X3
X3= 132.25 !X1-X4!= 15.75 X1<>X4
X4= 129.25 !X2-X3!= 13 X2<>X3
!X2-X4!= 16 X2<>X4
!X3-X4!= 3 X3=X4
DMS
X4 X3 X1 X2 =3.41
129.25 132.25 145 145.2
Pgina 4
ANOVA P. Reyes / Nov. 2004
DMS
MEDIAS MEDIAS
IGUALES DIFERENTES
9.45
CME = 19.6875
r= 4
F.05,1,12 4.75
1 1
DMS j , k (CME ) F ,c 1, n c
r j rk
Pgina 5
ANOVA P. Reyes / Nov. 2004
Ejemplo 1:
Tres tipos distintos de motores de gasolina fueron probados para determinar cunto tiempo son
tiles antes de necesitar una reparacin; si los tiempos de vida de los motores de cada tipo se
distribuyen normalmente y tienen la misma varianza, haga una prueba usando 0.05 para
determinar si difieren las medias de vida til antes de requerir una reparacin. En la tabla aparecen
los tiempos de vida til, en decenas de miles de millas para cada tipo de motor.
A B C
6 8 3
2 7 2
4 7 5
1 2 4
7 6 1
Probability Plot of A
Normal
99
Mean 4
StDev 2.550
95 N 5
RJ 0.982
90
P-Value >0.100
80
70
Percent
60
50
40
30
20
10
1
-2 0 2 4 6 8 10
A
Pgina 6
ANOVA P. Reyes / Nov. 2004
Probability Plot of B
Normal
99
Mean 6
StDev 2.345
95 N 5
RJ 0.909
90
P-Value >0.100
80
70
Percent
60
50
40
30
20
10
1
0 2 4 6 8 10 12
B
Probability Plot of C
Normal
99
Mean 3
StDev 1.581
95 N 5
RJ 0.998
90
P-Value >0.100
80
70
Percent
60
50
40
30
20
10
1
-1 0 1 2 3 4 5 6 7
C
Analizando las grficas nos damos cuenta de que las muestras provienen de poblaciones
normales.
Si denotamos por 1, 2 y 3 las medias poblacionales de los tiempos de vida til para los tipos A,
B y C, respectivamente, entonces podemos escribir las hiptesis estadsticas como:
H 0 : 1 2 3
Pgina 7
ANOVA P. Reyes / Nov. 2004
Procedimiento en Excel:
Alfa = 0.05
En Rango de salida indicar la celda donde se inciar la presentacin de resultados.
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 20 4 6.5
Columna 2 5 30 6 5.5
Columna 3 5 15 3 2.5
ANLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crtico para F
Entre grupos 23.33333333 2 11.66666667 2.413793103 0.13150932 3.885290312
Dentro de los grupos 58 12 4.833333333
Total 81.33333333 14
Pgina 8
ANOVA P. Reyes / Nov. 2004
ANOVA en Minitab.
Seleccionar:
Graphs
Seleccionar Normal plot of residuals
Comparisons
Seleccionar Tukeys Family error rate OK
Resultados:
La grfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el
modelo:
95
90
80
70
Percent
60
50
40
30
20
10
1
-5.0 -2.5 0.0 2.5 5.0
Residual
One-way ANOVA: A, B, C
Source DF SS MS F P
Factor 2 23.33 11.67 2.41 0.132
Error 12 58.00 4.83
Total 14 81.33
Pgina 9
ANOVA P. Reyes / Nov. 2004
A subtracted from:
B subtracted from:
A continuacin se muestran los residuos y los valores estimados para la respuesta Y por el modelo:
Ejemplo 2: La tabla adjunta contiene el nmero de palabras escritas por minuto por cuatro
secretarias de la universidad en cinco ocasiones diferentes usando la misma mquina.
Pgina 10
ANOVA P. Reyes / Nov. 2004
A B C D
82 55 69 87
79 67 72 61
75 84 78 82
68 77 83 61
65 71 74 72
95
90
80
70
Percent
60
50
40
30
20
10
1
-20 -10 0 10 20
Residual
One-way ANOVA: A, B, C, D
Source DF SS MS F P
Factor 3 52.2 17.4 0.20 0.892
Error 16 1367.6 85.5
Total 19 1419.8
Como el valor P de 0.892 es mayor a alfa de 0.05 no hay efecto en la respuesta cambiando los
niveles del factor A, B, C y D.
S = 9.245 R-Sq = 3.68% R-Sq(adj) = 0.00%
Se pueden traslapar los intervalos de confianza de los niveles del factor, por tanto no hay diferencia
significativa en sus efectos.
Pgina 11
ANOVA P. Reyes / Nov. 2004
A subtracted from:
B subtracted from:
C subtracted from:
En la prueba de Tukey como el cero pertenece a los intervalos de confianza de todas las
diferencias entre niveles A, B, C y D, no hay diferencia entre sus efectos en la respuesta.
Pgina 12
ANOVA P. Reyes / Nov. 2004
En este caso las frmulas son parecidas a la del ANOVA de una va pero ahora agregando el
clculo por renglones adicional al de columnas donde se incluye la variable de bloqueo.
Ejemplo con Minitab o Excel del Texto de Montgomery, Anlisis y diseo de experimentos.
Problema 4.1
Un qumico quiere probar el efecto de 4 agentes qumicos sobre la resistencia de un tipo particular
de tela. Debido a que podra haber variabilidad de un rollo de tela a otro, el qumico decide usar un
diseo de bloques aleatorizados, con los rollos de tela considerados como bloques. Selecciona 5
rollos y aplica los 4 agentes qumicos de manera aleatoria a cada rollo. A continuacin se
presentan las resistencias a la tencin resultantes. Analizar los datos de este experimento (utilizar
=0.05) y sacar las conclusiones apropiadas.
Rollo
Agente
Qumico 1 2 3 4 5
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69
Solucin
Rollo Y (gran
Yi.
Agente promedio)
Qumico 1 2 3 4 5
1 73 68 74 71 67 70.6 71.75
2 73 67 75 72 70 71.4
3 75 68 78 73 68 72.4
4 73 71 75 75 69 72.6
Y.j 73.5 68.5 75.5 72.75 68.5
Yijestimada (FITS)
72.35 67.35 74.35 71.6 67.35
73.15 68.15 75.15 72.4 68.15
74.15 69.15 76.15 73.4 69.15
74.35 69.35 76.35 73.6 69.35
Residuos (Eij)
0.65 0.65 -0.35 -0.6 -0.35
-0.15 -1.15 -0.15 -0.4 1.85
0.85 -1.15 1.85 -0.4 -1.15
-1.35 1.65 -1.35 1.4 -0.35
Pgina 13
ANOVA P. Reyes / Nov. 2004
La Ho. No se rechaza debido a que el valor de tablas de f esta en 3.49 y el valor Fc calculado es de
2.37 por lo tanto no cae en la zona de rechazo.
Por otro lado el valor P = 0.1211 es mayor a 0.05 de alfa por lo tanto confirma el no rechazo.
La Ho. se rechaza debido a que el valor de tablas de f esta en 3.25 y el valor Fc calculado es 21.60
por lo tanto cae en la zona de rechazo.
Por otro lado el valor P = 0.00003 es menor a 0.05 de alfa por lo tanto confirma el rechazo.
Pgina 14
ANOVA P. Reyes / Nov. 2004
Procedimiento en Excel:
Anlisis de varianza de dos factores con una sola muestra por grupo
RESUME Varianz
N Cuenta Suma Promedio a
Fila 1 5 353 70.6 9.3
Fila 2 5 357 71.4 9.3
Fila 3 5 362 72.4 19.3
Fila 4 5 363 72.6 6.8
ANLISIS DE VARIANZA
Grados Cuadrado Probabilida F
Fuente de Suma de de s Fc d tablas
Cuadrado
variacin s libertad medios Valor P
Filas 12.95 3 4.32 2.38 0.12 3.49
Columnas 157 4 39.25 21.61 2.06E-05 3.26
Error 21.8 12 1.82
Total 191.75 19
Total 231 24
Sin embargo observamos que el rollo si tiene influenza significativa en la respuesta (P<0.05).
Pgina 15
ANOVA P. Reyes / Nov. 2004
ANOVA en Minitab.
Utilice 0.05 para calcular si hay diferencias entre los efectos de las columnas y los
renglones.
Introducir los datos arreglados con las respuestas en una sola columna e indicando a que rengln y
columna pertenece cada uno de estos, como sigue:
Instrucciones:
Graphs
Seleccionar Normal plot of residuals
OK
Resultados:
La grfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el
modelo:
Pgina 16
ANOVA P. Reyes / Nov. 2004
95
90
80
70
Percent
60
50
40
30
20
10
1
-3 -2 -1 0 1 2 3
Residual
Source DF SS MS F P
Agente Qumico 3 12.95 4.3167 2.38 0.121
Rollo 4 157.00 39.2500 21.61 0.000
Error 12 21.80 1.8167
Total 19 191.75
Pgina 17
ANOVA P. Reyes / Nov. 2004
Pgina 18