Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de la varianza
U.P.M.
Julio de 2011
1
Índice
Índice I
1 Introducción
1 Comparación de medias
2 El pricipio de aleatorización
2 El problema de un factor con dos niveles
1 Obtención de los datos
2 Hipótesis para la resolución del problema
3 Consecuencias de las hipótesis
4 Estimación de los parámetros del modelo
5 Comparación de dos niveles. Contraste de hipótesis
3 El Análisis de la varianza con un factor
1 Introducción
2 Obtención de los datos
3 Análisis de la varianza con un factor. Hipótesis del modelo
4 Análisis de la varianza con un factor. Consecuencias de las
hipótesis
2
Índice
Índice II
3
Índice
Comparación de medias I
Problema
En ocasiones el investigador desea analizar si el comportamiento
medio de una variable respuesta depende del valor, nivel, al que se
encuentre otra, denominada factor.
4
Índice
5
Índice
aleatorización
6
Índice
aleatorización. Ejemplo
7
Índice
aleatorización. Ejemplo
8
Índice
9
Índice
Nivel 1 Nivel 2
y 11 y 21
y 12 y 22
.. ..
. .
y n1
1 y n2
2
10
Índice
factor. b
b
b
b
b
b b
los comportamientos de la
b
b
b
11
Índice
13
Índice
de las hipótesis
14
Índice
de las hipótesis
Grácamente,
yij b
eij
µi
µi
i F
15
Índice
16
Índice
n1 + n2 − 2
Observación: ŜR es una aproximación de σ obtenida con los
2 2
aproximaciones de σ . 2
17
Índice
hipótesis
Se trata de contrastar la
hipótesis, H , de que tanto las
0
N (µ, σ). b
b
b
b
b
b
b
µ
b
Grácamente:
b
b
b
b
b
b
b
1 2 F
18
Índice
hipótesis
N (µ , σ). Con
µ2 bb
2 b b
b b
b b
b b
b
µ1 bb
µ1 6= µ2 . b
b
b
b
Grácamente: 1 2 F
19
Índice
hipótesis
20
Índice
hipótesis
ȳq• − ȳ •
−→ tn1 +n1 − ,
1 2
2
ŜR n1 + n2
1 1
21
Índice
hipótesis
En el caso en que
ȳ1• − ȳ2•
> tn +n −2;α/2 ,
1 1
q
ŜR n1 + n1
1 2
22
Índice
hipótesis
H0 : σ12 = σ22 ,
se verica que
ŝ
2
1
−→ Fn1 −1,n2 −1 .
ŝ
2
1
23
Índice
24
Índice
i =1
25
Índice
y 12 y 22 ··· yK
.. .. ..
2
. . .
y n1
1 y n2
2 ··· yKnK
26
Índice
b
b
b
b b
b b
b b
b b
b b b
b b b
b b b
b b b
b b
b b
b b
b
b
b
b
1 2 b b b K F
27
Índice
30
Índice
Grácamente,
yij b
eij
µi
µi
i F
31
Índice
32
Índice
PK Pni
i =1 j =1 (yij − ȳi • )
2
ŜR =
2
n−K
Observación: ŜR se denomina varianza residual, y es una
2
33
Índice
Contraste de hipótesis
b
b
b
b b
b b
b b
b b
b b b
b b b
b b b µ
b b b
b b
b b
b b
b
b
b
b
b b b
1 2 K F
34
Índice
Contraste de hipótesis
b
b
b
b b
b b
µi b b
b b
b b b
b b b
b b µK b
b b b
b b
µ1 b b
b b b
b b
b b
b b
b b
µj b
b
b
b
b
b
1 b b b
i b b b
j b b b K F
35
Índice
36
Índice
Y Y
b
b b
b
b b
b ȳ2• b b ȳ2• b
b b
b b ȳ3•
b b
b b b ȳ3•
ȳ1• b ȳ1• b b
b
b
1 2 3 F 1 2 3 F
Índice
Y Y
b
b b
b b b
b
b b
b b b b
b b ȳ2• b b b ȳ2• b
b b b
b b b ȳ3•
b b b b
b b b b b ȳ3•
b b
b b
b b ȳ1• b b ȳ1•
b b b b b
b
b b
b b
b b
b
b b
1 2 3 F 1 2 3 F
Índice
Y Y
b
b b
b b b
b
b b
b b b b
b b b b b b
b b b
b b b
b b b b
b b b b b
b b
b b
b b b b
b b b b b
b
b b
b b
b b
b
b b
1 2 3 F 1 2 3 F
39
Índice
b
yij b b
b
b b
b b
yij − ȳ•• b b
b b
b b b
ȳ•• b b b b
b b b
b b b
b b
b b
b b
b
b
b
b
1 b b b
i b b b K F
40
Índice
b
b
b
b b
b b
ȳi• b b b
b b
b b ȳi• − ȳ•• b
ȳ•• b b b b
b b b
b b b
b b
b b
b b
b
b
b
b
1 b b b
i b b b K
41
Índice
b
yij b b
b
b yij − ȳi• b
b b
ȳi• b b
b
b
b
b b b
b b b
b b b
b b b
b b
b b
b b
b
b
b
b
1 b b b
i b b b K
42
Índice
Ahora bien,
(yij − ȳ•• ) = (ȳi • − ȳ•• ) + (yij − ȳi • )
b
yij b b
b
b yij − ȳi• b
b b
yij − ȳ•• b b
ȳi• b b
b b ȳi• − ȳ•• b
ȳ•• b b b b
b b b
b b b
b b
b b
b b
b
b
b
b
1 b b b
i b b b K
43
Índice
ni
K X ni
K X ni
K X
VT (yij −ȳi • )2 +2 (ȳi • −ȳ•• )(yij −ȳi • ).
X X X
2
= (ȳi • −ȳ•• ) +
i =1 j =1 i =1 j = 1 i = 1 j =1
44
Índice
i =1 j = 1
Y resulta que:
ni
K X K
(ȳi • − ȳ•• ) ni (ȳi • − ȳ•• )
X X
2 2
= .
i =1 j =1 i =1
45
Índice
Por lo que:
K ni
K X
VT ni (ȳi • − ȳ•• ) (yij − ȳi • )2
X X
2
= +
i =1 i =1 j = 1
46
Índice
47
Índice
Teorema
1 Si se verica la hipótesis:
µ1 = µ2 = · · · = µK = µ,
48
Índice
Consecuencia
Si se verica la hipótesis:
µ1 = µ2 = · · · = µK = µ,
la variable
VE
σ 2 (K −1)
VNE −→ F(K −1;n−K )
σ 2 (n − K )
49
Índice
ŝe
2
−→ F(K −1;n−K )
ŝR
2
Índice
Observaciones:
1 ŝe es una medida de la variabilidad de las medias de las
2
51
Índice
El test de la F
F = e2
ŝR
52
Índice
test de la F
cuando
ŝ2
F = e2 < Fα
ŝR
se aceptará la hipótesis nula, que se rechazará en caso
contrario.
La tabla ADEVA
54
Índice
El coeficiente de determinación
VE
R 2
=
VT
55
Índice
56
Índice
Observación
En el caso en que el análisis de los residuos no permita validar
el modelo, será necesario estudiar transformaciones de los
datos que ofrezcan un comportamiento razonable del error
experimental.
57
Índice
58
Índice
(n − K )ŝR2
−→ χ2n−K
σ2
59
Índice
Observación
La expresión Análisis de la varianza contempla dos acepciones
distintas, como se ha descrito en estas notas:
El problema de comparación de K medias, analizado en este
capítulo, se conoce como el Análisis de la varianza con un
factor.
Por otra parte, la metodología desarrollada para la discusión
del problema anterior, por medio de la comparación de la
variabilidad explicada con la no explicada, se conoce por el
nombre de la metodología del Análisis de la varianza.
Esta metodología es muy general, y se emplea en todos los
modelos del diseño experimental, así como en los de regresión.
60