Está en la página 1de 32

ANLISIS DE VARIANZA ANOVA DE UNA VA

P. Reyes / Sept. 2007


ANLISIS DE VARIANZA
ANOVA DE UNA VA
Elabor: Dr. Primitivo Reyes Aguilar
Septiembre de 2007
Mail: primitivo_reyes@yahoo.com
Tel. 58 83 41 67 / Cel. 044 55 52 17 49 12
Pgina 1 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
Pgina 2 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007

CONTENIDO
1. ANOVA
2. Ejercicios
3. Teora de experimentos de un solo factor
Pgina 3 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
ANALISIS DE VARIANZA DE UN FACTOR
(ANOVA 1 VIA)
El anlisis de la varianza de un factor (ANOVA) es una metodologa
para analizar la variacin entre muestras y la variacin al interior de
las mismas mediante la determinacin de varianzas. Es llamado de
una va porque analiza un variable independiente o Factor ej:
Velocidad. Como tal, es un mtodo estadstico til para comparar dos
o ms medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hiptesis tales como:
k
H ....
3 2 1 0
. :
1
diferentes son les poblaciona medias dos menos Al H
Los supuestos en que se basa la prueba t de dos muestras que
utiliza muestras independientes son:
1. Ambas poblaciones son normales.
2. Las varianzas poblacionales son iguales, esto es, .
2
2
2
1

El estadstico tiene una distribucin muestral resultando:
2
2
w
b
s
s
Fc
El valor crtico para la prueba F es:
)) 1 ( , 1 ( n k k F

Donde el nmero de grados de libertad para el numerador es k-1 y


para el denominador es k(n-1), siendo

el nivel de significancia.
k = nmero de muestras.
Pgina 4 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
Por ejemplo:
Ejemplo: Se tienen 14 empleados seleccionados al azar que se
someten a
3 diferentes cursos de entrenamiento: Programa 1, Programa 2
y Programa 3.
Como los empleados se seleccionan aleatoriamente para cada
programa
el diseo se denomina DISEO COMPLETAMENTE
ALEATORIZADO
Se observa el aprovechamiento de los empleados en los
programas:
TRATAMIENTOS
I c=1 c=2 c=3 J
Programa 1
Programa
2 Programa 3
r=1 85 80 82
r=2 72 84 80
r=3 83 81 85
r=4 80 78 90
r=5 ** 82 88
Medias 80.00 81.00 85.00 Xj
Media de medias o media
total 82.14
TIPOS DE VARIACIN Y SUMAS DE CUADRADOS
1. Variacin total entre los 14 empleados, su puntuacin no fue
igual con todos
VARIACIN TOTAL RESPECTO A LA MEDIA GENERAL
Pgina 5 de 32
2
1 1
) (



c
j
r
i
X Xij SCT
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
SCT = (85-82.14)2 + (72-82.14)2+(83-82.14)2+.....+(88-82.14)2
SCT = 251.7
2. Variacin entre los diferentes tratamientos o Variacin entre
muestras o variacin entre programa 1, programa 2 y programa 3
EFECTO DE LA MEDIA DE CADA TRATAMIENTO RESPECTO A LA MEDIA
GENERAL
SCTR = 4(79.5 - 81.3333)2 + 5(81 - 81.3333)2 + 5(85 - 81.333)2
SCTR = 65.71
3. Variacin dentro de un tratamiento o muestra o programa
dado que no todos los empleados dentro de un mismo programa
obtuvieron los mismos puntajes. Se denomina Variacin dentro de los
tratamientos.
VARIACIN DENTRO DEL TRATAMIENTO O VARIACIN DEL ERROR
CADA VALOR RESPECTO A LA MEDIA DE SU TRATAMIENTO
SCE = SCT - SCTR = 186
4. GRADOS DE LIBERTAD
Pgina 6 de 32
2
1
) ( X X r SCTR j
r
j
j

2
1 1
) ( j
c
j
ij
r
i
X X SCE


ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
Grados de libertad totales = n - 1 = 14-1 = 13
Grados de libertad de los tratamientos = c - 1 = 3 - 1 = 2
Grados de libertad del error = gl. Totales - gl. Tratamientos = 13 - 2 =
11
gl SCT = gl SCTR + gl SCE
gl SCE = gl SCT - gl SCTR = (n -1) - (c - 1) = n -c
5. CUADRADOS MEDIOS (Suma Cuadrados/ Grados libertad)
CMT = Cuadrado medio total = SCT / (n-1) = 19.4
CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) = 32.9
CME = Cuadrado medio del error = SCE/ gle.= 16.9
6. ESTADSTICO DE PRUEBA Fc Y ESTADSTICO F CRTICO DE
ALFA
Fc = CMTR / CME= 1.946745562
Clculo de F con Excel
=DISTR.F.INV(ALFA, GL. TR, GL. ERR) =DISTR.F.INV(0.05, 2, 11) =
3.982297957
NO RECHAZAR
ZONA DE
RECHAZO
Distr. F
Como Fc es menor a Falfa no se rechaza Ho y las medias son iguales.
Pgina 7 de 32
c n c ador deno gl numerador gl alfa
F F

, 1 , min . , . ,
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
7. VALOR P DE Fc
P = distr.f(Fc, gl. SCTr, gl. SCE) = distr.f(1.946, 2, 11) = 0.18898099
Como P es mayor a alfa no se rechaza Ho
CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO,
LAS MEDIAS DE LOS TRATAMIENTOS SON IGUALES
Pgina 8 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
TABLA DE ANOVA
FUENTE DE VARIACIN SUMA DE GRADOS DE
CUADRADO
CUADRADOS LIBERTAD MEDIO
VALOR F
Entre muestras (tratam.) SCTR c-1 CMTR
CMTR/CME
Dentro de muestras (err.) SCE n-c CME
Variacin total SCT n-1 CMT
Regla: No rechazar si la F de la muestra es menor que la F de Excel
para una cierta alfa
USO DE EXCEL:
En el men herramientas seleccione la opcin Anlisis de
datos, en funciones para anlisis seleccione Anlisis de
varianza de un factor.
En Rango de entrada seleccionar la matriz de datos (todas las
columnas a la vez).
Alfa = 0.05
En Rango de salida indicar la celda donde se iniciar la
presentacin de resultados.
RESUMEN Anlisis de varianza de un factor
Grupos Cuenta Suma Promedio Varianza
Programa 1 4 320 80 32.666667
Programa 2 5 405 81 5
Programa 3 5 425 85 17
ANLISIS DE VARIANZA
Grados
de Promedio de
Variaciones
Suma
cuadrados libertad Cuadrados Fc
Probabilida
d F crtica
Entre grupos 65.71428571 2 32.85714286 1.9431644 0.18937731 3.98229796
Dentro de 186 11 16.90909091
Pgina 9 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
grupos
Total 251.7142857 13
USO DE MINITAB
Stat > ANOVA > One Way (Unstacked)
en Responses in separate columns Indicar las columnas de
datos
En Confidence Level 95%
Seleccionar Comparisons Tukey 5%
OK
One-way ANOVA: Programa 1, Programa 2, Programa 3
Source DF SS MS F P
Factor 2 65.7 32.9 1.94 0.189
Error 11 186.0 16.9
Total 13 251.7
S = 4.112 R-Sq = 26.11% R-Sq(adj) = 12.67%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ----+---------+---------+---------+-----
Programa 1 4 80.000 5.715 (------------*------------)
Programa 2 5 81.000 2.236 (----------*-----------)
Programa 3 5 85.000 4.123 (-----------*----------)
----+---------+---------+---------+-----
77.0 80.5 84.0 87.5
Pooled StDev = 4.112
NOTA: Si los Intervalos de confianza se traslapan, las medias son
iguales estadsticamente
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons
Individual confidence level = 97.94%
Programa 1 subtracted from:
Lower Center Upper --------+---------+---------+---------+-
Programa 2 -6.451 1.000 8.451 (------------*-----------)
Programa 3 -2.451 5.000 12.451 (-----------*------------)
--------+---------+---------+---------+-
-6.0 0.0 6.0 12.0
Programa 2 subtracted from:
Lower Center Upper --------+---------+---------+---------+-
Pgina 10 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
Programa 3 -3.025 4.000 11.025 (-----------*----------)
--------+---------+---------+---------+-
-6.0 0.0 6.0 12.0
NOTA: Si el cero se encuentra en el intervalo de confianza de la
diferencia entre medias, este par de medias no son diferentes.
Pgina 11 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
2. EJERCICIOS:
1. Cuatro catalizadores que pueden afectar la concentracin de un
componente en una mezcla lquida de tres componentes estn siendo
investigado.
Se obtienen las siguientes concentraciones:
Cataliz
ador
A B C D
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57 55.4 50
55.8 55.3 51.7
54.9
2. Para determinar si existe diferencia significativa en el nivel de
Matemticas de 4 grupos de estudiantes de Ingeniera se realiz un
examen aleatorio a 6 individuos por grupo. Determine cuales son los
grupos en los cuales existen diferencias a un 95% de nivel de
confianza.

A B C D
75 78 55 64
93 91 66 72
78 97 49 68
71 82 64 77
63 85 70 56
76 77 68 95
3. Las calificaciones en el examen a 18 empleados de tres unidades
de negocio
Se muestran a continuacin:
Probar si no hay diferencia entre las unidades a un 5% de nivel de
significancia.
A B C
85 71 59
75 75 64
Pgina 12 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
82 73 62
76 74 69
71 69 75
85 82 67
4. Probar si hay diferencia en los tiempos de servicio de 4 unidades
de negocio para el mismo servicio a un nivel de significancia del 5%.
A B C D
5.4 8.7
11.
1 9.9
7.8 7.4
10.
3 12.8
5.3 9.4 9.7 12.1
7.4 10.1
10.
3 10.8
8.4 9.2 9.2 11.3
7.3 9.8 8.8 11.5
Pgina 13 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
3. TEORA DE EXPERIMENTOS DE UN SOLO
FACTOR
n esta parte se analiza el caso en que se desea conocer el efecto
de un solo factor o variable independiente sobre la caracterstica
de calidad que s esta analizando. Esto implica que a fin de poder
detectar su efecto, este factor se debe de variar manteniendo el resto
de los factores en un valor fijo.
E
Experimentos sin restricciones en la aleatoriedad.
uando se desea analizar el efecto de un factor sobre una variable
dependiente o caracterstica de calidad es necesario el variar el
"nivel valor de ese factor. A cada diferente nivel al cual se realiza el
experimento se le conoce como tratamiento. Por ejemplo si el factor
es el proveedor los diferentes niveles o serian proveedor A, proveedor
B, proveedor C, etc. , si el factor es el tipo de proceso los
tratamientos serian proceso 1, proceso 2. Si el factor es temperatura
los diferentes niveles serian por ejemplo 10, 20, 30 y 40 C,etc.
C
Por otro lado en cada nivel del factor se efectan una serie de
pruebas, a cada una de estas pruebas se les conoce como
replicaciones. EL factor se considera fijo.
Ejemplo 1: Suponga que se desea saber si los ejes que surten cuatro
proveedores tienen diferente resistencia a la traccin. Para ello se
decide llevar a cabo un experimento de un solo factor donde la
variable dependiente es la resistencia a la traccin del eje medida en
Kgs/cm
2
y el factor es el proveedor. El factor tiene cuatro niveles o
tratamientos diferentes. Uno para cada proveedor (llmelos I, II, III,
IV) se decide probar 5 ejes de cada proveedor haciendo un total de 20
pruebas ejecutadas en la misma maquina de prueba y con l mismo
Pgina 14 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
operario (recuerde que el resto de los factores se deben de mantener
a un nivel fijo).
Para que el experimento sea aleatorio se numeran los ejes del 1 al 20
y se selecciona al azar un nmero entre 1 y 20. Segn l numero
seleccionado es el siguiente eje que se prueba. De esta manera, el
siguiente eje a probar es seleccionado sin ninguna restriccin.
Suponga. que los resultados de experimento se muestran en la tabla
siguiente:
Proveedo
r
I II II
I
I
V
5
6
6
4
4
5
4
2
5
5
6
1
4
6
3
9
6
2
5
0
4
5
4
5
5
9
5
5
3
9
4
3
6
0
5
6
4
3
4
1
El proveedor = factor
Tratamiento = I, II, III, IV
Con cinco replicaciones en cada tratamiento.
Observando la tabla se "ve" que existen evidentemente diferencias
entre la resistencia de los ejes de un proveedor a otro. Pero tambin
existen entre los ejes de un mismo proveedor, entonces, la
diferencia detectada entre, los ejes de un proveedor y otro existe
realmente? O la diferencia es debida al azar?, La herramienta
estadstica conocida como anlisis de varianza (ANOVA) puede
ayudar a despejar esta duda.
Pgina 15 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
Para esto suponga un caso general como sigue: Si define Yij como
el valor correspondiente de la variable dependiente o caracterstica
de calidad de la i-sima observacin o replicacin bajo el
tratamiento j, los resultados de un experimento de un solo factor
con k tratamientos y n replicas u observaciones por tratamiento
seria:
Tratami
ento
(nivel)
Observaciones Total
es
Prome
dios
1 Y
1
1
Y
1
2
..
.
Y
1
n
Y1.
.. Y
2 Y
2
1
Y
2
2
..
.
Y
2
n
Y2.
. Y2
3 Y
3
1
Y
3
2
..
.
Y
3
n
Y3.
. Y3
... ... ... ..
.
... ... ...
K Y
k
1
Y
k
2
..
.
Y
k
n
Y
k.
. Yk
Este caso se puede representar mediante el modelo estadstico lineal:

ij j ij Y + +
Donde representa la media general, j representa el efecto del
tratamiento j, y
ij
es el error aleatorio al hacer la observacin ij.
Esto es, se supone que todos los datos en general pertenecen a
una misma poblacin con media excepto que existan
desviaciones para diferentes tratamientos del mismo factor. Por su
Pgina 16 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
parte ij representa el error aleatorio o medida de la variabilidad
natural dentro de cada tratamiento.
Generalmente se supone que:
; 0
n
1 j
j


Y que el error aleatorio sigue una distribucin normal con media cero
y varianza
2
, esto denota:
) , 0 ( N ij
2

Sean Yi. El total de las observaciones bajo el i-esimo tratamiento, y . i Y


el promedio de las observaciones bajo el i-esimo tratamiento.
Similarmente sean Y.. La suma de todas las observaciones y
.. Y
la
media general de todas las observaciones.
Expresado matemticamente esto es:
Y../n .. Y
Y Y..
n 1,2,..., i con ./n Y . Y
Y . Y
n
1 i
k
1 j
ij
i i
n
1 i
ij i

N = kn es l numero total de observaciones


Las hiptesis en este caso son:
H
o
:
j
= 0; para todo valor de j.
H
1
:
j
0; para al menos un valor de j.
Pgina 17 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
Ho significa que el factor (los niveles bajo estudio) no tiene efecto
sobre la variable dependiente y H
1
que si lo tiene, esto es que existe
diferencia, estadstica. Recuerde tambin que la hiptesis nula se
asume como cierta a menos que los datos indiquen lo contrario.
Descomposicin de la suma total de cuadrados
a denominacin de anlisis de varianza resulta de descomponer
la variabilidad total de los datos en sus partes componentes. La
suma total de cuadrados corregida es:
L
( ) ( )
E T
k
1 j
n
1 i
2 k
1 j
2
k
1 j
n
1 i
2
SS SStr SS
. i Y Yij .. Y i. Y n .. Y Yij
+

,
`

.
|
+


Donde:
La ecuacin anterior muestra la variabilidad total de los datos,
medida por la suma total corregida de los cuadrados. SS
tr
se
denomina suma de cuadrados debida a los tratamientos (es decir,
entre tratamientos), SS
E
es la suma de cuadrados debido al error (es
decir, dentro de los tratamientos)
SS
T
= Suma de cuadrados total: con N -1 grados de libertad
SS
tr
= Suma de cuadrados debido a los tratamientos, con k - 1 grados
de libertad.
SS
E
= Suma de cuadrados debido al error aleatorio k grados de
libertad.
Para simplificar los clculos:
Pgina 18 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
SStr SS SS
N
Y..
n
Yi.
SStr
) Y..
n
Y..
(Y SS
T E
k
1 j
2 2
2
2 k
1 j
n
1 i
2
ij T

,
`

.
|



El anlisis de varianza ser:
Fuente
De error SS
G.L
. MS F
0
Variacin
entre
tratamientos
SS
tr
k
1
MS
tr
MStr/M
SE
Variacin
dentro de
Tratamientos
o error
SS
E
N
k
MS
E
Total
SS
T
N
1
Si F0 > F,k-1,N-k, H0 debe ser rechazada. Donde F, k-1,N-k es el
valor de la variable F con un nivel de significancia (error tipo I), k-1
grados de libertad en el numerador y N-k grados de libertad en el
denominador. Bajo la hiptesis nula la relacin MS
tr
/MS
E
sigue una
funcin de densidad F, por lo tanto si F0 es mayor que F
, k-1,N-k
existir
una diferencia significativa y el factor afecta la respuesta de la
caracterstica de calidad en los niveles bajo estudio.
Si Ho no puede ser rechazada la conclusin es por lo tanto que el
factor bajo estudio no afecta la respuesta. Sin embargo, si Ho es
rechazada y existe diferencia significativa entre los diferentes
tratamientos de un solo factor el siguiente paso es el analizar en
detalle cual de los tratamientos es el mejor y cuales son iguales.
Aplicando el ANOVA a los datos del ejemplo 2.2 se tiene:
Pgina 19 de 32
Totales Promedios
Yi
I 56 55 62 59 60 292 58.4
II 64 61 50 55 56 286 57.2
III 45 46 45 39 43 218 43.6
IV 42 39 45 43 41 210 42
Y..= 1006 40.24
.. Y
. i Y
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007


+ + +
4
1 j
5
1 i
2 2 2 2
51940 41 ... 55 56 Yij
Entonces, calculando las sumas de cuadrados tenemos que:
SS
T
= 51,940 (1006
2
)/20 = 1338.2
SS
tr
= 292
2
/5 + 286
2
/5 + 218
2
/5 + 210
2
/5 1006
2
/20 = 1,135.0
SS
E
= SST SS
tr
= 1338.2 1135.0 = 203.2
MS
tr
= SS
tr
/(k-1) = 1135.0/(3 - 1) = 378.2
MS
E
= SS
E
/(n-k) = 203.2/(20-4) = 12.70
Esto se resume en la siguiente tabla:
Fuente
De error SS G.L. MS F
0
Factor o
tratamientos
SS
tr
=11
35
k 1 =
3
MS
tr
=378.3
MS
tr
/M
S
E
=
29.79
Error
SS
E
=203
.2
N k =
16
MS
E
=12.
7
Pgina 20 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
Total
SS
T
=133
8.2
N 1 =
19
Donde F0= MS
tr
/MS
E
= 378.3/12.70=29.79 con 3 grados de libertad
en el numerador y 16 grados de libertad en el denominador.
Si el nivel de aceptacin (error tipo I) lo fijamos en 5%, esto es, =
0.05, de la tabla de la funcin F se tiene que:
F
,3,16
= 3.24
Dado que F0 = 29.79 > 3.24= F
0.05,3,16
Se concluye que Ho se rechaza y el factor proveedor afecta la
variable resistencia a la traccin.
Experimentos con un solo factor y diferente nmero de
lecturas por tratamiento (o caso desbalanceado)
uando por alguna razn l numero de lecturas que se tienen bajo
cada tratamiento es diferente, digamos Zi observaciones en el
tratamiento j, el anlisis se puede llevar a cabo de una manera
similar con las siguientes formulas para k tratamientos:
C
libertad de grados k - N con SStr; - SST SS
libertad de grados 1 - k con ; SS
libertad de grados 1 - N con ;
N
Y..
Y SS
E
k
1 j
tr
k
1 j
n
1 i
2
-
2
ij T


N
Y
n
Y
i
i
2 2
.. .

Es, sin embargo, deseable que l numero de muestras sea igual bajo
cada tratamiento, puesto que el poder de la prueba se maximiza
cuando l numero de muestras es igual.
Pgina 21 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
Ejemplo 2: El tiempo de respuesta en milisegundos fue determinado
para tres tipos diferentes de circuitos y los resultados son:
Con un nivel de significacin de = 0.05. Tiene los circuitos
diferente tiempo de respuesta?
k = 3; n1 = 6; n2 = 3; n3 = 4; N = 6 + 3 + 4 = 13
162.29 474.98 - 637.24 SS - SS SS
474.98
13
175
4
35
3
73
6
67
/N) Y.. /n . (Y SS
637.24 2355.76 2993
13
175
16 8 ... 12 9
/N) Y.. (Yij SS
tr T E
2 2 2 2
k
1 j
2
i
2
i tr
2
2 2 2 2
k
1 j
n
1 i
2 2
T

+ +


+ + + +


La tabla ANOVA es:
Fuente
De error
SS G.L. MS
F0
Factor o
tratamientos
SS
tr
=47
4.98
k 1 =
2
MS
tr
=237.49
MS
tr
/M
S
E
=
Pgina 22 de 32
T o t a l e s P r o m e d i o s
t r Y i
I 9 1 2 1 0 8 1 5 1 3 6 7 1 1 . 1 7
I I 2 0 2 3 3 0 7 3 2 4 . 3 3
I I I 6 5 8 1 6 3 5 8 . 7 5
Y . . 1 7 5 1 4 . 7 5
O b s e r v a c i o n e s
. Yi
.. Y
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
14.64
Error
SS
E
=162
.29
N k =
10
MS
E
=16.
22
Total
SS
T
=637
.24
N 1 =
12
Dado que F.05,2,10 = 4.10, se concluye que los circuitos muestran
diferentes tiempos de respuesta.
Estimacin de parmetros del modelo

continuacin, se desarrollan estimadores para los parmetros
del modelo de clasificacin en un sentido: A
ij i ij Y + +
Usando el mtodo de los mnimos cuadrados, las soluciones de las
ecuaciones normales son:
k 1,2,3,..., i con
.. Y . Y
.. Y
i i

Y es posible determinar fcilmente un intervalo de confianza para


estimar la media del i-simo tratamiento. Dicha i-simo media es:
i = + i
Un estimador puntual para i podra ser . Y i i i + ahora si se supone
que los errores estn distribuidos normalmente, las
. Yi
son NID(0,
2
/n),
Pgina 23 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
entonces podra usarse la distribucin normal para definir el intervalo
de confianza buscado si se conoce . Al usar MSE como estimacin
de,
2
, el intervalo de confianza se debe basar en la distribucin t.,
por tanto, un intervalo de confianza de (1-)100% para la media del i-
simo tratamiento, es:
]
]
]

t
n
MS
t . Y
E
k N , 2 / i
un intervalo de confianza del (1-)100% para la diferencia de las
medias de dos tratamientos cualesquiera, por ejemplo i-j, ser:
.
n
MS 2
t . Y . Y
E
k N , 2 / j i
]
]
]

t
Ejemplo 3: Al usar los datos del ejemplo 2.3, las estimaciones de la
media general y de los efectos de los tratamientos son
y ; 04 . 15 25 376
24 . 4 04 . 15 80 . 10 .. Y . Y
56 . 6 04 . 15 60 . 21 .. Y . Y
56 . 2 04 . 15 60 . 17 .. Y . Y
36 . 0 04 . 15 40 . 15 .. Y . Y
24 . 5 04 . 15 80 . 9 .. Y . Y
5 5
4 4
3 3
2 2
1 1

+

+

usando la formula para calcular el intervalo de confianza del 95%
para la media del tratamiento 4 es:
Pgina 24 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
( )
[ ] 65 . 2 60 . 21
. ,
5
06 . 8
086 . 2 60 . 21 . , 2 /
t
t
]
]
]

t
bien o
n
MS
t Y
E
k N i
por tanto, el intervalo deseado es 18.95 24.25
Estimacin de la variable de respuesta
a descomposicin de la variabilidad en las observaciones por
medio del anlisis de variancia, es una relacin puramente
algebraica.
L
ij i ij Y + +
El residuo de la observacin i del tratamiento j se define mediante:
ij ij ij Y

Y e


en donde
ij Y

es una estimacin de la observacin Y


ij
correspondiente
calculada por:
. Y Y

..) Y . Y ( .. Y Y

i ij
i ij
i i ij

+
+

La ecuacin anterior muestra un resultado que se intuye fcilmente,
ya que la estimacin de cualquier observacin del i-simo tratamiento
es igual al promedio del tratamiento correspondiente. El examen de
Pgina 25 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
los residuos debe ser automtico en el anlisis de variancia. Si el
modelo es adecuado, los residuos no deben tener estructura.
Comparacin de medias de tratamientos individuales

upongamos que al efectuar un anlisis de variancia para un
modelo de efectos fijos la: hiptesis nula es rechazada. Se
concluye que existe diferencia entre las medias, aunque no se
especifique exactamente cual de ellas es diferente . En esta situacin
puede ser til realizar comparaciones adicionales entre grupos de
medias de los tratamientos. La media del i-simo tratamiento se
define mediante
i
= +
i
y su estimacin es
. Yi
. Las comparaciones
entre medias de tratamientos se realizan en trminos de los totales
de tratamientos Yi. O de los promedios de tratamientos
. Yi
. Los
procedimientos para efectuar estas comparaciones se conocen como
mtodos de comparacin mltiple.
S
Mtodo de la Mnima Diferencia Significativa (LSD, del ingls
least significant difference)
upongamos que despus de haber rechazado la hiptesis nula,
con base en una prueba F de anlisis de variancia, se desea
probar Ho: i = j para toda i j. Esto puede hacerse empleando la
estadstica t:
S

,
`

.
|
+

j i
E
j i
o
n
1
n
1
MS
. Y . Y
t
Pgina 26 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
Suponiendo una hiptesis alterna bilateral, la pareja de medias i, j
se consideran diferentes
S
j i E k N , 2 / j i n / 1 n / 1 ( MS t . Y . Y + >
La cantidad:

,
`

.
|
+
j i
E k N /2,
n
1
n
1
MS t LSD
Se denomina mnima diferencia significativa. Si el diseo es
balanceado, entonces n
1
= n
2
= n
k
= n.
Para usar el procedimiento de la LSD, simplemente se comparan las
diferencias observadas entre cada par de promedios con el valor
correspondiente de la LSD. Si, se concluye que las medias
poblacionales
i
=
j
son diferentes.
Ejemplo 4: Para ilustrar este procedimiento, si se usan los datos del
Ejemplo 2.3 el valor de la LSD con = .05 es:
3.75
5
2(8.06)
2.086
n
1
n
1
MS t LSD
j i
E k N /2,


,
`

.
|
+
Por tanto, una pareja de medias difieren significativamente si el
valor absoluto de la diferencia de promedios en los tratamientos
correspondientes es mayor que 3.75. Los cinco promedios de
tratamiento son:
Pgina 27 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
10.8 . Y 21.6 . Y
16.6 . Y 15.4 . Y 9.8 . Y
5 4
3 2 1



Y las diferencias de los promedios son:
* 8 . 10 8 . 10 6 . 21 . Y . Y
* 8 . 6 8 . 10 6 . 17 . Y . Y
* 0 . 4 6 . 21 6 . 17 . Y . Y
* 6 . 4 8 . 10 4 . 15 . Y . Y
* 2 . 6 6 . 21 4 . 15 . Y . Y
2 . 2 6 . 17 4 . 15 . Y . Y
0 . 1 8 . 10 8 . 9 . Y . Y
* 8 . 11 6 . 21 8 . 9 . Y . Y
* 8 . 7 60 . 17 8 . 9 . Y . Y
* 6 . 5 4 . 15 8 . 9 . Y . Y
5 4
5 3
4 3
5 2
4 2
3 2
5 1
4 1
3 1
2 1










Los valores marcados con asterisco indican parejas de medias que
son significativamente diferentes. Resulta til graficar los datos como
se muestra en la Fig. 4, subrayando las parejas de medias que no
difieren en forma significativa. Claramente los nicos pares que no
difieren significativamente son 1 y 5, y 2 y 3. El tratamiento 4
produce una resistencia a la tensin de manera significativamente
mayor que los otros tratamientos.
Comparacin de Tratamientos con un Control
Pgina 28 de 32
21.6 17.6 15.4 10.8 8 . 9
. Y . Y . Y . Y . Y 4 3 2 5 1
Figura 4. Resul tados del procedi mineto LSD
21.6 17.6 15.4 10.8 8 . 9
. Y . Y . Y . Y . Y 4 3 2 5 1
Figura 4. Resul tados del procedi mineto LSD
Fig. 4
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
En muchos experimentos, uno de los tratamientos es un control, y al
analista puede interesarle su comparacin con las k -1 medias de
tratamiento con el control. Por tanto, slo deben realizarse k -1
comparaciones. Un procedimiento para hacerlas fue desarrollado por
Dunnett (1964). Supongamos que el tratamiento k es el control. Se
desean probar las hiptesis:
k i 1
k i
: H
: Ho

Para i = 1, 2,..., k -1. El procedimiento de Dunnett es una modificacin


de la prueba t. Para cada hiptesis se calculan las diferencias que se
observan en las medias mustrales:
1 - k 1,2,..., i con k. Y i. Y
La hiptesis nula Ho: i = k es rechazada con un nivel de error tipo I
segn alfa s:

,
`

.
|
+ >
k i
E
n
1
n
1
MS f) 1, (k d k. Y i. Y
En donde la constante d (k -1, f) se encuentra en la Tabla IX del
Apndice del texto de Diseo y Anlisis de Experimentos de Douglas
C. Montgomery (son posibles tanto pruebas unilaterales como
bilaterales). Hay que notar que alfa constituye el nivel de significacin
conjunto asociado a las k -1 pruebas.
Ejemplo 5: Para ilustrar la prueba de Dunnett, considrense los
datos del Ejemplo 3, y su pngase que el tratamiento 5 es el control.
En este ejemplo, k = 5, k -1 = 4, f = 20, ni = n = 5, y con un nivel del
Pgina 29 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
5% se encuentra en la Tabla IX del Apndice que d
0.05
(4,20) = 2.65.
Por tanto, la diferencia crtica es:
4.76
5
2(8.06)
2.65
n
2MSE
d.05(4,20)
(Hay que notar que esta es una simplificacin de la Ecuacin anterior
y que resulta de un diseo balanceado.) En consecuencia, un
tratamiento debe considerarse significativamente diferente del
control si la diferencia es mayor que 4.76. Las diferencias observadas
son:
10.8 10.8 21.6 . Y . Y 5; vs 4
6.8 10.8 17.6 . Y . Y 5; vs 3
4.6 10.8 15.4 . Y . Y 5; vs 2
1.0 10.8 9.8 . Y . Y 5; vs 1
5 4
5 3
5 2
5 1




Slo las diferencias
. Y . Y .; Y . Y 5 4 5 3
indican una diferencia
significativa al ser comparadas con el control; por tanto, se concluye
que
3
=
5
y
4
=
5
. Es conveniente usar ms observaciones para el
tratamiento de control (es decir, n
k
) que para los otros tratamientos (o
sea, n, suponiendo el mismo nmero de observaciones en los otros k
-1 tratamientos) cuando se comparan tratamientos con un control.
Debe elegirse la razn nk / n aproximadamente igual a la raz
cuadrada del nmero total de tratamientos. En otras palabras, se
elige n
k
/n =
k

Suposiciones del anlisis de varianza
l aplicar un anlisis de varianza se hacen las siguientes
suposiciones siguientes: A
Pgina 30 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
1. El proceso esta en control estadstico (estable). Esto es, se
pueden repetir y las causas de variacin se han eliminado.
2. La distribucin de la poblacin que se muestra es normal.
3. La varianza de los errores dentro de los k niveles del factor es la
misma: esto es, la variabilidad natural dentro de cada
tratamiento es la misma de un tratamiento a otro.
Grafica de residuos contra el valor ajustado de
ij y
i el modelo es correcto y las suposiciones se satisfacen, los
residuos no deben tener algn patrn, ni deben estar
relacionados con alguna variable, incluyendo la respuesta Y
ij
. Una
comprobacin sencilla consiste en graficar los residuos contra los
valores ajustados
ij y
(debe recordarse que para el modelo en un
sentido i. - ij y y , el promedio del tratamiento i-simo). En esta grafica no
debe revelarse ningn patrn obvio en la siguiente figura se grafican
los residuos contra los valores ajustados de los datos de la resistencia
a la tensin del ejemplo 2.3 Ningn patrn inusual es evidente.
S
Grafica de residuos contra valores ajustados
Un efecto que en ocasiones revela la grafica es el de una varianza
variable. Algunas veces la varianza de las observaciones lo hace. Esto
resulta cuando el error es proporcional a la magnitud de la
observacin (comnmente esto sucede en instrumentos de medicin
el error es proporcional a la escala de la lectura). Si este es el caso,
Pgina 31 de 32
ANLISIS DE VARIANZA ANOVA DE UNA VA
P. Reyes / Sept. 2007
los residuos aumenta a medida que Yij lo hace, y la grafica de los
residuos contra
ij Y
parecer un embudo que se ensancha o un
altavoz. La varianza variable tambin ocurre en casos cuyos datos no
tienen distribucin normal y estn sesgados, porque en las
distribuciones sesgadas la varianza tiende a ser funcin de la media.
Pgina 32 de 32

También podría gustarte