Está en la página 1de 18

Esquema

ANOVA de 1 factor con efectos fijos

ANOVA y Diseño de Experimentos

Profesor: Dr. Jorge Figueroa Zúñiga

Universidad de Concepción - Chile

2◦ Semestre del 2011

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema
ANOVA de 1 factor con efectos fijos

Esquema de Tópicos

ANOVA de 1 factor con efectos fijos


Combinaciones lineales de las medias
Test para Inferencia Simultánea

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Datos del ejemplo anterior

Recordemos la información del ejemplo, la cual fué resumida en la


siguiente tabla:
S U J E T O
Tratamiento 1 2 3 4 5 6 7 8 ȳi+ Si2
A1 1 8 9 9 7 7 4 9 6.75 8.2
A2 12 6 10 13 13 13 6 10 10.375 8.8
A3 12 4 11 7 8 10 12 5 8.625 9.7
A4 13 14 14 17 11 14 13 14 13.75 2.8
ȳ++ = 9.9

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Hipótesis para combinaciones lineales de las medias


Supongamos que estamos interesados en contestar tres preguntas:
I Tienen las drogas, en promedio, un efecto en el aprendizaje?
I Cometen más errores los sujetos a los que se les administra
ambas drogas que aquellos a quienes sólo se les administra
una?
I Difieren las drogas 1 y 2 en el número de errores que
producen?
Estas preguntas se traducen en las hipótesis sobre las medias:

1
H01 : µ1 = (µ2 + µ3 + µ4 )
3
1
H02 : µ4 = (µ2 + µ3 )
2
H03 : µ2 = µ3

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Hipótesis para combinaciones lineales de las medias

Las tres hipótesis pueden re-escribirse como:


1 1 1
H01 : µ1 − µ2 − µ3 − µ4 = 0
3 3 3
1 1
H02 : µ4 − µ2 − µ3 = 0
2 2
H03 : µ2 − µ3 = 0

Es decir,
P son hipótesis sobre combinaciones lineales de las medias:
H0q : ki ciq µi = 0, q = 1, 2, 3.
En el ejemplo, c11 = 1, c21 = −1/3, c31 = −1/3, c41 = −1/3,
c12 = 0, c22 = −1/2, c32 = −1/2, c42 = 1,
c13 = 0, c23 = 1, c33 = −1, c43 = 0

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Hipótesis para combinaciones lineales de las medias

Pk
En general para testear la hipótesis: H0q : i ciq µi = 0.
Necesitamos calcular el estadı́stico:
r
SCq
T =
MCE
C2
Donde SCq = Pk q 2 , Cq = ki=1 ciq ȳi+ .
P
c /n
q i=1 iq i
SCq SCq
Nota: T = MCE ∼ tN−k es equivalente a F = MCE ∼ F1,N−k

Luego se rechaza H0 bajo un 95% de confianza si T > tN−k,1−α/2

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Hipótesis para combinaciones lineales de las medias

En el ejemplo: MCE = 7.38, g.l.= N − k = 28


Pk 2
Cq i=1 ciq /ni SCq T
H01 -4.16 0.17 104.17 3.76
H02 4.25 0.19 96.33 3.61
H03 1.75 0.25 12.25 1.29
con t28,0.975 = 2.048

Luego concluimos que las hipótesis H01 y H02 son rechazadas bajo
un 95% de confianza, sin embargo, bajo el mismo nivel de
confianza la hipótesis H03 es aceptada.
Nota: En el ejercicio, se puede evaluar por ejemplo
H01 : 3µ1 − µ2 − µ3 − µ4 = 0 y los resultados obtenidos no varı́an.

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Tukey: Caso balanceado

Interesa testear la familia de hipótesis


H0 : µi = µi 0 v /s H1 : µi 6= µi 0
para todas las posibles combinaciones (i, i 0 ).
i = 1, . . . , k ; i 0 = 1, . . . , k con i 6= i 0 .
Nota: El test de Tukey requiere igualdad de tamaños de muestra
en cada nivel del factor (caso balanceado).
 
k k!
El número de test a realizar es igual a = 2×(k−2)! , luego si
2
k = 3 existen 3 hipótesis a testear.

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Tukey: Caso balanceado

Para testear las hipótesis planteadas se usa el siguiente estadı́stico,


el cual se compara con la distribución del rango studentizado q(k,ν)
donde k es el número de niveles del factor y ν son los grados de
libertad.
√ |ȳi+ − ȳi 0 + |
Q= n √
MCE
Luego se rechaza H0 si Q > q(k,N−k),1−α en cada caso.

Donde cada ni = n con i = 1, . . . , k

Tarea: Aplicar el test utilizando el ejemplo visto anteriormente


(use una confianza del 95%).

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Tukey: Caso balanceado

Intervalos de Confianza para el conjunto de diferencias de


medias
Un intervalo de confianza para µi − µi 0 con un nivel del
100(1 − α)% de confianza está dado por:

r
MCE
(ȳi+ − ȳi 0 + ) ± q(k,N−k),1−α
n

Tarea: Realizar los intervalos de confianza utilizando el ejemplo


visto anteriormente (use una confianza del 95%).

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Tukey: Caso balanceado

Intervalos de Confianza para cada media µi - Método gráfico


Una alternativa en el método de tukey es graficar en un sólo
gráfico cada intervalo de confianza para µi donde

r
1 MCE
IC (µi ) = ȳi+ ± × q(k,N−k),1−α
2 n
Luego si los intervalos se cortan al trazar una lı́nea horizontal,
entonces se concluye que existe igualdad de medias entre esos
tratamientos (niveles del factor).

Tarea: Confeccionar el gráfico utilizando el ejemplo visto


anteriormente (use una confianza del 95%).

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Tukey: Caso NO balanceado

Para el caso NO balanceado se rechazará H0 bajo un 100(1 − α)%


de confianza en cada caso si
√ |ȳi+ − ȳi 0 + |
Q∗ = 2√ q > q(k,N−k),1−α
MCE n1i + n10
i

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Procedimiento de Scheffé

La familia de hipótesis de interés es el conjunto de todos los


contrastes posibles entre las medias:
k
X k
X
H0 : L = ci µi = 0 , con ci = 0
i=1 i=1
Xk
v /s H1 : L = ci µi 6= 0
i=1

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Procedimiento de Scheffé

Para testear la hipótesis H0 se necesita comparar el siguiente


estadı́stico con un valor de tabla de la distribución de Fisher
P 2
k
i=1 ci ȳi+
F∗ =
c2
(k − 1)MCE ki=1 nii
P

Luego si F ∗ > Fk−1,N−k,1−α , entonces concluimos que existe


evidencia para rechazar H0 bajo un 100(1 − α)% de confianza

Tarea: Compare este procedimiento con el de Tukey, en el ejemplo


dado, usando un nivel de confianza del 95%.

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Homocedasticidad: Test de Hartley


Test de Hartley:
Consideremos k poblaciones normales de varianza σ12 , σ22 , . . . , σk2
y sus estimadores S12 , S22 , . . . , Sk2 con (n − 1) grados de libertad
cada uno (caso balanceado)
Se quiere testear
H0 : σ12 = σ22 = . . . = σk2 v/s
H1 : Alguna de las varianzas es distinta.
Luego, se rechaza H0 bajo un 100(1 − α)% de confianza si
maxi {Si2 }
H= > Hk,n−1,1−α
mini {Si2 }
1 Pn
Nota: Si2 = n−1 j=1 (yij − ȳi+ )2 con i = 1, . . . , k
Tarea: Testee en el ejemplo si se cumple con el supuesto de
igualdad de varianzas (use un 95% de confianza)
Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II
Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Test de Normalidad
Otro supuesto que se debe cumplir es el de tener Normalidad en cada nivel del
factor, lo que puede ser corroborado mediante test como el de
Kolmogorov-Smirnov o Shapiro-Wilk. O bien, gráficamente mediante el gráfico
qqplot como el que se expone a continuación:

En el gráfico qqplot los puntos se ajustan a la linea, luego se cumple el


supuesto de Normalidad.
Nota: Si la respuesta no distribuyen Normal, se puede intentar una
transformación de ésta.
Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II
Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Análisis de residuos
Si las hipótesis del modelo son ciertas entonces los RESIDUOS son
APROXIMADAMENTE:
1.- Normales; 2.- Con media cero (E (eij ) = 0); 3.- Varianza
constante (V (eij ) = σ 2 ); 4.- Independientes; 5.- No hay residuos
atı́picos. Luego, los puntos 2, 3 y 5 los podemos evaluar
gráficamente como:

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II


Esquema Combinaciones lineales de las medias
ANOVA de 1 factor con efectos fijos Test para Inferencia Simultánea

Coeficiente de determinación

Es la proporción de la variabilidad observada en los datos que es


explicada por el modelo, se define como:
SCE
R2 =
SCT
Tarea: Detemine el coeficiente de determinación en el ejemplo
dado.

Profesor: Jorge Figueroa Zúñiga Bioestadı́stica II

También podría gustarte