Está en la página 1de 40

INTRODUCCIN AL

ANLISIS DE LA VARIANZA

Resumen

Diseo de un factor
Entrada de datos
Modelo estadstico
Anlisis bsico e interpretacin
Contrastes
Estimacin del efecto

ANOVA DE UNA FACTOR CON k NIVELES


G1

G2

Gk

H 0 : 1 2 k

y11

y21

yk1

H1 : 1 2 k

y12

y22

yk 2

y1n1

y 2 n2

y1

y2

yij i ij

yknk

yk

Si Ho es cierta, entonces se cumple:

ij N (0, 2 )
i 0 i 1,.., k

ANOVA DE UNA FACTOR CON k NIVELES


( yij y ) ( yij yi ) ( yi y )

A ( yij yi ) Variabilid ad dentro del grupo

B ( yi y ) Variabilid ad entre grupos


B

En este caso, la variabilidad


entre grupos es grande
respecto a la variabilidad
intra grupos.

yi

ANOVA DE UNA FACTOR CON k NIVELES


( yij y ) ( yij yi ) ( yi y )

A ( yij yi ) Variabilid ad dentro del grupo

B ( yi y ) Variabilid ad entre grupos


y

yi

En este caso, la variabilidad


entre grupos es similar a la
variabilidad intra grupos.

DESCOMPOSICIN DE LA SUMA DE
CUADRADOS
( yij y ) ( yij yi ) ( yi y )

( yij y ) 2 ( yij yi ) ( yi y ) ( yij yi ) 2 ( yi y ) 2 2 ( yij yi )( yi y )


k

ni

ni

ni

2
(
y

y
)

(
y

y
)

(
y

y
)
ij
ij i i
2

i 1 j 1

i 1 j 1

ni

SCTotal : ( yij y )

i 1 j 1

SCDentro: yij yi
ni

i 1 j 1

i 1 j 1

ni

SCEntre: ( yi y ) 2
i 1 j 1

ANOVA DE UNA FACTOR CON k NIVELES


G1

G2

Gk

y11

y21

yk1

y12

y22

yk 2

y1n1

y 2 n2

y1

y2

Estimacin de la varianza 2
Si Ho es cierta, podemos obtener una
estimacin de la varianza 2 haciendo
una promedio ponderado de las
varianzas de cada grupo:

yknk

yk

y
k

2
Dentro

(n1 1) s12 (nk 1) sk2

n1 n2 nk k

ni

i 1 j 1

ij yi

nk
2

SCDentro: yij yi
k

ni

i 1 j 1

ANOVA DE UNA FACTOR CON k NIVELES


G1

G2

Gk

y11

y21

yk1

y12

y22

yk 2

y1n1

y 2 n2

y1

y2

Estimacin de la variancia 2 entre grupos


Podemos estimar la varianza entre los
grupos como

yknk

yk

Si Ho es cierta, la varianza entre


grupos debera ser similar a la
varianza dentro del grupo.

y
2
Entre

ni

yi y

i 1 j 1

k 1

ni

ni yi y

i 1

k 1

SCEntre: ( yi y ) 2
i 1 j 1

ANOVA DE UNA FACTOR CON k NIVELES


G1

G2

Gk

y11

y21

yk1

y12

y22

yk 2

y1n1

y 2 n2

y1

y2

SCEntre: ( yi y ) 2
i 1 j 1

SCDentro: yij yi
k

ni

i 1 j 1

yknk

ni

yk

ni

SCTotal : ( yij y ) 2
i 1 j 1

SC Entre: variabilidad entre las medias de los grupos. Si los


grupos tienen un efecto, esta variabilidad debera ser
importante respecto de la variabilidad dentro de los grupos.
SC Dentro (SC Residual): variabilidad respecto a la media del
grupo.
SCTotal=SCEntre+SCDentro

TABLA DE ANOVA
ni

SCEntre: ( yi y ) 2
i 1 j 1

SCDentro: yij yi
ni

i 1 j 1

ni

SCTotal : ( yij y ) 2
i 1 j 1

Fuente

SC

g.d.l.

CM

Entre

SCEntre

k-1

SCEntre/(k-1)

CMEntre/CMDentro

Residual

SCDentro

n-k

SCDentro/(n-k)

Total

SCTotal

n-1

Ejemplo 1

Queremos evaluar si la dosis de alcohol tiene un


efecto apreciable en el tiempo (segundos) que se
tarda en hacer operaciones matemticas sencillas.
Se escogen 20 voluntarios que cumplen ciertos
criterios de admisin en el estudio.
Se dividen aleatoriamente en cuatro grupos,
recibiendo cada grupo distintas dosis de alcohol.

Datos

Definir una variable para


los grupo

El tratamiento es el factor de
inters
Hay cuarto niveles (cada una
de las dosis)
Es un modelo de efectos fijos.

Modelo
yij ij i ij

ij N (0, )

Descriptiva

Hiptesis y mtodo de anlisis

La dosis de alcohol incrementa de manera


significativa el tiempo de respuesta.
Utilizaremos un ANOVA de un factor, el tratamiento,
que tiene cuatro niveles, las distintas dosis.

ANOVA en R
k

ni

SCEntre: ( yi y ) 2 1067.8
i 1 j 1
k ni

SCDentro: yij yi 224.4


i 1 j 1

Fuente
Entre

Residual
Total

SC

g.d.l.

CM

F
25.378

1067.8

4-1=3

355.93

224.4

20-4=16

14.03

1292.2

20-1=19

Interpretacin

Si es cierta la hiptesis nula, la variancia estimada a partir de la SC entre


grupos y la estimada a partir de la SC dentro de grupos deberan ser
similares.
En ambos casos, estamos estimando la varianza comn a todos los grupos
(trmino en el modelo lineal).
La media cuadrtica (SC/g.l.) es un estimador de dicha varianza en cada
caso.
El cociente sigue una F de Fisher con (k-1) y (n-k) g.d.l. si Ho es cierta.
En este caso, p<0.001. Por lo tanto, existen diferencias entre las medias de
cada nivel del factor considerado.

Estimacin de las medias de los grupos


IC 95%

Los IC de las medias


sugieren que se produce un
aumento del tiempo de
respuesta a partir de una
dosis media de alcohol.

Evaluacin de las
diferencias entre grupos

Podemos considerar dos grupos. Los que no han tomado alcohol o bien reciben
dosis bajas tienen una respuesta media ms rpida que el resto.
Es decir, el resultado del ANOVA es debido a la diferencia de respuesta entre las
dosis media y alta, que tienen un comportamiento similar entre ellos, y el grupo
de dosis bajas y el que no ha tomado alcohol.

Anlisis va lm

Anlisis va lm

Anlisis va lm (sin interseccin)

3.745

Anlisis va lm (sin interseccin)


Estimacin de los IC 95% de los efectos de cada tratamiento

Ejemplo 2

Se quiere evaluar el efecto de cuatro fertilizantes


en un determinato tipo de cultivo.
Se dispone de 10 parcelas, aplicando cada tipo de
fertilizante en cada parcela en aos consecutivos.
Se pide:
Evaluar

si los cuatro fertilizantes tienen el mismo efecto.


Evaluar si las hiptesis del modelo (homogenidad de
varianzas y normalidad) se cumplen.
Realizar comparaciones mltiples para determinar qu
fertilizante es el ms apropiado.

Datos
A
47
42
43
46
44
42
45
43
44
44

Fertilizante
B
C
51
37
56
39
54
41
49
38
53
39
51
37
50
42
49
36
50
40
53
40

D
42
43
42
45
47
50
48
45
44
45

ANOVA

El efecto del fertilizante es significativo.


Estimacin de los efectos

A 44
B 44 7.6 51.6
C 44 5.1 38.9
D 44 1.1 45.1

ANOVA
Estimacin de los efectos

El anlisis va lm permite estimar


directamente las medias de los
grupos si restamos el trmino
constante.
En este caso, los IC que se
consiguen con confint sn los que
corresponden a las medias de
cada grupo.

Grficos de las medias estimadas

Podemos observar que el


fertilizante B es el que produce
ms, mientras que C es el que
produce menos.
A y D produce, de media, lo mismo
y se sitan entre B y C.
Podemos utilizar el procedimiento
TukeyHSD para estimar las
diferencias entre tratamientos.

Comparaciones mltiples

Podemos comprobar que los


tratamientos A y D son equivalentes (en
produccin media), mientras que B es
superior y C inferior.
El procedimiento TukeyHSD solo puede
aplicarse a un objeto aov.

Contrastes ortogonales

Por defecto, se compara cada


tratamiento (nivel del factor) con
el primer tratamiento.

Podemos establecer otras


comparaciones indicando una
matriz de contraste.

Contrastes ortogonales

Assignamos un contraste entre


tratamientos y obtenemos el
mismo resultado que el anterior
(resultado por defecto).
En la matriz de contraste se
indica por un 1 el nivel que se
compara con el nivel de
referencia.
Podemos cambiar estas
definiciones.

Contrastes ortogonales

Ahora las estimaciones se refieren


al grupo B como referencia.
Si vemos los resultados anteriores,
al grupo B le corresponde una
media de 51.6=44+7.6

Contrastes ortogonales: Comparacin de grupos

El primer contraste prueba la


hiptesis de que los tratamientos A
y D son equivalentes (p>0.05)
El segundo, prueba si podemos
admitir que A es equivalente al
promedio de B y C (p>0.05)
El tercero compara B y C (p<0.05)

Podemos indicar solo (k-1) contrastes ortogonales.


Los coeficientes deben sumar cero.

Problema

Se dispone de 6 abonos, valorndose la productividad en 78


parcelas de similares caractersticas (Abonos.sav)
Describir el experimento, indicando el factor o factores implicados y
sus niveles. Decidir si se trata de un problema de efectos fijos.
Contrastar si los seis abonos afectan de manera similar a la
produccin de las cosechas.
Determinar las diferencias de produccin entre pares de abonos.
Comprobar las hiptesis del modelo
Resolver los siguientes contrastes:

El promedio de las cosechas obtenidas por los abonos 3 y 4 no difiere


del promedio de las cosechas 5 y 6.
La media de los abonos 1 y 2 coincide con el promedio de las cosechas
del resto de abonos.

Resultados por abono

ANOVA

Los distintos abonos tienen una produccin media diferente


(p<0.05).

Medias por grupo

IC1 ( ) y.. t1 / 2, N k
IC1 ( i ) yi. t1 / 2, N k

SCT
N k

2
N

2
ni

Comparaciones
mltiples

Los abonos 2, 4, 6 no presentan diferencias


significativas.

Comparaciones
mltiples

Los abonos 2, 4, 6 no presentan diferencias


significativas.

Contrastes
ANOVA un factor

H0 :
H0 :

3 4
2
1 2
2

5 6

3 4 5 6 0

2
3 4 5 6
2

21 22 3 4 5 6 0

Resumen

El diseo de un factor fijo con k niveles es muy


habitual. Formalmente, se concreta en valorar la
hiptesis de igualdad de la medias poblacionales
de cada nivel del factor.
Las

observaciones deben proceder de una distribucin


normal y la varianza debe ser igual en cada nivel del
factor.
El anlisis en R puede hacerse con las funciones aov o
lm.

También podría gustarte