Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ANALISIS DE VARIANZA DE UNA VIA o DIRECC PDF
ANALISIS DE VARIANZA DE UNA VIA o DIRECC PDF
2004
H 0 1 2 3 .... k
Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras independientes
son:
Como el ANOVA de un criterio es una generalización de la prueba de t para dos muestras, los
supuestos para el ANOVA de un criterio son:
El método de ANOVA con un criterio requiere del cálculo de dos estimaciones independientes para
2, la varianza poblacional común. Estas dos estimaciones se denotan por sb2 y s w2 . s b2 se
denomina estimación de la varianza entre muestras y s w2 se denomina estimación de la varianza al
interior de las muestras. El estadístico tiene una distribución muestral resultando:
sb2
F
s w2
F (k 1, k (n 1))
Donde el número de grados de libertad para el numerador es k-1 y para el denominador es k(n-1),
siendo el nivel de significancia.
k = número de muestras.
1
El Procedimiento es el siguiente :
1
Estadística. Richard C.Weimer. CECSA. Segunda Edición.2000
Página 1
ANOVA P. Reyes / Nov. 2004
Calculo Manual
r c 2
( Xij X )
i 1 j 1
SCT
r
SCTR rj ( X j X ) 2
j 1
Media
X3
*
5
4 *
* Media X2
Media X1
Página 2
ANOVA P. Reyes / Nov. 2004
** *
Xi Xi
* ** * ** *
*** * Xmedia 3
X media 1 ** *
* Xmedia 2 Xi *
Grados de libertad:
Gl. Totales = n – 1
Gl. Tratamientos = c -1
Gl. Error = n – c
Fc = CMTr / CME
Si P es menor a alfa o Fc es mayor a Ft se rechaza Ho indicando que los efectos de los diferentes
niveles del factor tienen efecto significativo en la respuesta.
Distr. F
Página 3
ANOVA P. Reyes / Nov. 2004
TABLA DE ANOVA
GRADOS
FUENTE DE VARIACIÓN SUMA DE DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO
Dentro de muestras
(err.) SCE n-c CME
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
PRUEBA DE TUKEY
Se utiliza el estadístico
T CME
T q ,c ,nc
r
DMS
X4 X3 X1 X2 =3.41
129.25 132.25 145 145.2
Página 4
ANOVA P. Reyes / Nov. 2004
DMS
MEDIAS MEDIAS
IGUALES DIFERENTES
9.45
r=4
2(CME ) F ,1,nc
DMS F = DISTR.F.INV(alfa, gl. =1, gl. CME
r =12)
CME = 19.6875
r= 4
F.05,1,12 4.75
1 1
DMS j ,k (CME ) F ,c1,nc
rj rk
Página 5
ANOVA P. Reyes / Nov. 2004
Ejemplo 1:
Tres tipos distintos de motores de gasolina fueron probados para determinar cuánto tiempo son
útiles antes de necesitar una reparación; si los tiempos de vida de los motores de cada tipo se
distribuyen normalmente y tienen la misma varianza, haga una prueba usando 0.05 para
determinar si difieren las medias de vida útil antes de requerir una reparación. En la tabla aparecen
los tiempos de vida útil, en decenas de miles de millas para cada tipo de motor.
A B C
6 8 3
2 7 2
4 7 5
1 2 4
7 6 1
Probability Plot of A
Normal
99
Mean 4
StDev 2.550
95 N 5
RJ 0.982
90
P-Value >0.100
80
70
Percent
60
50
40
30
20
10
1
-2 0 2 4 6 8 10
A
Página 6
ANOVA P. Reyes / Nov. 2004
Probability Plot of B
Normal
99
Mean 6
StDev 2.345
95 N 5
RJ 0.909
90
P-Value >0.100
80
70
Percent
60
50
40
30
20
10
1
0 2 4 6 8 10 12
B
Probability Plot of C
Normal
99
Mean 3
StDev 1.581
95 N 5
RJ 0.998
90
P-Value >0.100
80
70
Percent
60
50
40
30
20
10
1
-1 0 1 2 3 4 5 6 7
C
Analizando las gráficas nos damos cuenta de que las muestras provienen de poblaciones
normales.
Si denotamos por 1, 2 y 3 las medias poblacionales de los tiempos de vida útil para los tipos A,
B y C, respectivamente, entonces podemos escribir las hipótesis estadísticas como:
H 0 : 1 2 3
Página 7
ANOVA P. Reyes / Nov. 2004
Procedimiento en Excel:
Alfa = 0.05
En Rango de salida indicar la celda donde se inciará la presentación de resultados.
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 20 4 6.5
Columna 2 5 30 6 5.5
Columna 3 5 15 3 2.5
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Entre grupos 23.33333333 2 11.66666667 2.413793103 0.13150932 3.885290312
Dentro de los grupos 58 12 4.833333333
Total 81.33333333 14
Página 8
ANOVA P. Reyes / Nov. 2004
ANOVA en Minitab.
Seleccionar:
Graphs
Seleccionar Normal plot of residuals
Comparisons
Seleccionar Tukey’s Family error rate OK
Resultados:
La gráfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el
modelo:
95
90
80
70
Percent
60
50
40
30
20
10
1
-5.0 -2.5 0.0 2.5 5.0
Residual
One-way ANOVA: A, B, C
Source DF SS MS F P
Factor 2 23.33 11.67 2.41 0.132
Error 12 58.00 4.83
Total 14 81.33
Página 9
ANOVA P. Reyes / Nov. 2004
A subtracted from:
B subtracted from:
A continuación se muestran los residuos y los valores estimados para la respuesta Y por el modelo:
Ejemplo 2: La tabla adjunta contiene el número de palabras escritas por minuto por cuatro
secretarias de la universidad en cinco ocasiones diferentes usando la misma máquina.
Página 10
ANOVA P. Reyes / Nov. 2004
A B C D
82 55 69 87
79 67 72 61
75 84 78 82
68 77 83 61
65 71 74 72
95
90
80
70
Percent
60
50
40
30
20
10
1
-20 -10 0 10 20
Residual
One-way ANOVA: A, B, C, D
Source DF SS MS F P
Factor 3 52.2 17.4 0.20 0.892
Error 16 1367.6 85.5
Total 19 1419.8
Como el valor P de 0.892 es mayor a alfa de 0.05 no hay efecto en la respuesta cambiando los
niveles del factor A, B, C y D.
Se pueden traslapar los intervalos de confianza de los niveles del factor, por tanto no hay
diferencia significativa en sus efectos.
Página 11
ANOVA P. Reyes / Nov. 2004
A subtracted from:
B subtracted from:
C subtracted from:
En la prueba de Tukey como el cero pertenece a los intervalos de confianza de todas las
diferencias entre niveles A, B, C y D, no hay diferencia entre sus efectos en la respuesta.
Página 12
ANOVA P. Reyes / Nov. 2004
En este caso las fórmulas son parecidas a la del ANOVA de una vía pero ahora agregando el
cálculo por renglones adicional al de columnas donde se incluye la variable de bloqueo.
Ejemplo con Minitab o Excel del Texto de Montgomery, Análisis y diseño de experimentos.
Problema 4.1
Un químico quiere probar el efecto de 4 agentes químicos sobre la resistencia de un tipo particular
de tela. Debido a que podría haber variabilidad de un rollo de tela a otro, el químico decide usar un
diseño de bloques aleatorizados, con los rollos de tela considerados como bloques. Selecciona 5
rollos y aplica los 4 agentes químicos de manera aleatoria a cada rollo. A continuación se
presentan las resistencias a la tención resultantes. Analizar los datos de este experimento (utilizar
α=0.05) y sacar las conclusiones apropiadas.
Rollo
Agente
Químico 1 2 3 4 5
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69
Solución
Rollo Y (gran
Yi.
Agente promedio)
Químico 1 2 3 4 5
1 73 68 74 71 67 70.6 71.75
2 73 67 75 72 70 71.4
3 75 68 78 73 68 72.4
4 73 71 75 75 69 72.6
Y.j 73.5 68.5 75.5 72.75 68.5
Yijestimada (FITS)
72.35 67.35 74.35 71.6 67.35
73.15 68.15 75.15 72.4 68.15
74.15 69.15 76.15 73.4 69.15
74.35 69.35 76.35 73.6 69.35
Residuos (Eij)
0.65 0.65 -0.35 -0.6 -0.35
-0.15 -1.15 -0.15 -0.4 1.85
0.85 -1.15 1.85 -0.4 -1.15
-1.35 1.65 -1.35 1.4 -0.35
Página 13
ANOVA P. Reyes / Nov. 2004
La Ho. No se rechaza debido a que el valor de tablas de f esta en 3.49 y el valor Fc calculado es
de 2.37 por lo tanto no cae en la zona de rechazo.
Por otro lado el valor P = 0.1211 es mayor a 0.05 de alfa por lo tanto confirma el no rechazo.
La Ho. se rechaza debido a que el valor de tablas de f esta en 3.25 y el valor Fc calculado es 21.60
por lo tanto cae en la zona de rechazo.
Por otro lado el valor P = 0.00003 es menor a 0.05 de alfa por lo tanto confirma el rechazo.
Página 14
ANOVA P. Reyes / Nov. 2004
Procedimiento en Excel:
Análisis de varianza de dos factores con una sola muestra por grupo
ANÁLISIS DE VARIANZA
Grados F
Fuente de Suma de de Cuadrados Fc Probabilidad tablas
variación Cuadrados libertad medios Valor P
Filas 12.95 3 4.32 2.38 0.12 3.49
Columnas 157 4 39.25 21.61 2.06E-05 3.26
Error 21.8 12 1.82
Total 191.75 19
Total 231 24
Sin embargo observamos que el rollo si tiene influenza significativa en la respuesta (P<0.05).
Página 15
ANOVA P. Reyes / Nov. 2004
ANOVA en Minitab.
Utilice 0.05 para calcular si hay diferencias entre los efectos de las columnas y los renglones.
Introducir los datos arreglados con las respuestas en una sola columna e indicando a que renglón y
columna pertenece cada uno de estos, como sigue:
Instrucciones:
Graphs
Seleccionar Normal plot of residuals
OK
Resultados:
La gráfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el
modelo:
Página 16
ANOVA P. Reyes / Nov. 2004
95
90
80
70
Percent
60
50
40
30
20
10
1
-3 -2 -1 0 1 2 3
Residual
Source DF SS MS F P
Agente Químico 3 12.95 4.3167 2.38 0.121
Rollo 4 157.00 39.2500 21.61 0.000
Error 12 21.80 1.8167
Total 19 191.75
Página 17
ANOVA P. Reyes / Nov. 2004
Página 18