Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Anlisis de la varianza y
modelos de regresin
10.3 Correlacin
2
5
1
10.1. Anlisis de la Varianza
Anlisis de la varianza
Paramtrico No Paramtrico
De un factor
De ms de un
factor
2
5
2
Ejemplos:
2
5
4
Hiptesis del ANOVA paramtrico
2
5
5
MODELO
x ij = i eij
X i N i ; , i 1, 2,..., n
Siendo:
i Media del tratamiento i
H 0 : 1 2 k
H 1 : i j , para algn i j
2
5
6
Clculos para el ANOVA:
k ni k ni k ni
xij x
2
xij xi 2
xi x 2
i 1 j 1 i 1 j 1 i 1 j 1
VT = VNE + VE
Distribuciones de las varianzas bajo la hiptesis
nula de igualdad de medias:
n k VE F
VNE
2
nk k 1VNE k 1,nk
2
VE
2
k 1
2
2
5
8
Tabla ANOVA de una va
Entre VE k-1 VE
grupos Se2
k 1
2
Dentro de VNE n-k VNE Se
S R2
grupos
nk S d2
Total 2 VT
VT n-1 St
n 1
Criterio de rechazo
Se2
2 Fk 1,nk
SR
Rechazamos si
2
Se
F ;k 1,nk
2
SR
2
5
9
Ejemplo:
Una compaa farmacutica investiga los efectos de 5
compuestos; el experimento consiste en inyectar los
compuestos a 12 ratas de caractersticas similares y anotar
los tiempos de reaccin. Los animales se clasifican en 5
grupos, administrndole a cada uno de ellos un compuesto
diferente. Se obtuvieron los siguientes resultados:
H 0 : 1 2 3 4 5
H1 : 1 j , para algn i j
Clculos:
Compuesto Tiempos ni Ti xi
1 8.3, 7.6, 8.4, 4 32.6 8.15
8.3
2 7.4, 7.1 2 14.5 7.25
3 8.1, 6.4 2 14.5 7.25
4 7.9, 8.5, 10.0 3 27.4 9.13
5 7.1 1 7.1 7.1
Total 12 96.1 8.01
k ni
VNE xij xi 2 4.30
i 1 j 1
k
VE ni xi x 2 7.01
i 1 2
6
1
Tabla ANOVA:
Grados
Fuentes
Suma de de
de Varianzas Estadstico
Cuadrados liberta
variacin
d
Entre
VE = 7.01 k-1=4 SE2 = 1.75
grupos
Dentro de
VNE =4.30 n-k=7 SR2 = 0.61 2.8
grupos
Se2
En nuestro caso:
2 F4,7
SR
A partir de las tablas se obtiene que
2
6
2
Comprobacin de las hiptesis
previas al ANOVA
Aleatoriedad de las
muestras Test de rachas
Test de Bondad de
Normalidad de las ajuste
distribuciones
Teorema Central del
Lmite
2
6
3
10.2. Regresin lineal simple
y i =a x i b i
Donde:
Los valores xi son conocidos
Los i Errores de regresin
Los valores a y b son constantes a estimar
Hiptesis
i N (0, )
y son independientes.
Los valores de x no son todos iguales
Como consecuencia
E[y i ] =a x i b
Var[y i ] = 2
Cov[y i ,y j ] =0
y su distribucin es normal
2
6
4
Estimacin por mxima verosimilitud
1 n 2
2
L x1,, x n (a, b, ) = 2 2 n /2
exp
2
2
i 1
yi axi b
El logaritmo de funcin de verosimilitud ser
n
n n 1
log(L(a, b, )) = log 2 log
2 2
2 i
y axi b 2
2 2 2 i 1
Las derivadas respecto de los parmetros son
log(L) 1 n
a
=
2 yi axi b xi
i 1
log(L) 1 n
b
=
2 yi axi b
i 1
n
log(L) n 1
yi axi b
2
=
2
2 2 2 2 2 i 1
2
6
5
Estimacin por mxima verosimilitud
n
yi xi n x y
Cov( x, y )
a = i 1
n 2 Var ( x)
xi 2 n x
i 1
b = y a x
2 1 n 2
=
n i 1
yi axi b
n n n n n
E a = E wi yi wi E yi wi (axi b) a wi xi b wi a
i 1 i 1 i 1 i 1 i 1
E b = E y a x E y x E a a x b a x b
2 n
2
1
E = i i
E
n i 1
y a x b n2 2
n
Los estimadores de los coeficientes de regresin
se distribuyen normalmente.
2
2
a N a, N a,
n 2 nS 2
x
xi 2 n x
i 1
1 2
b N b,
x
2
n nS 2
x
Adems
n 2
2 Independiente
2 n2 de los estimadores
2
anteriores 6
7
Sea ei el error del modelo ajustado
ei =y i a x i b y i y i
Entonces
n n
ei =0, ei xi =0.
i 1 i 1
As se puede descomponer
n 2 n 2 n 2 n
yi y = yi yi y i y
2 y i yi y i y
i 1 i 1 i 1 i 1
Siendo la ltima sumatoria igual a cero
VT = VNE + VE
Las siguientes funciones se distribuyen de forma
Independiente:
VNE 2
2 n2 VE
F1,n2
VNE
VE 2 n2
2 1
2
6
8
Inferencia
2
2
N a, S a
a N a, N a,
n 2 nS x
2
xi 2 n x
i 1
2
b N b, 2
1 x
N b, Sb
n nS
2
x
n 2 Independiente
2
n2 de los estimadores
2
anteriores
Entonces, por ejemplo
a a
Sa
tn 2
n 2
n2
2
6
9
Tabla ANOVA
2
7
0
10.3. Correlacin
VE (n 2) R 2
F1,n2
VNE
n2 1 R2
2
7
1
10.2. Regresin lineal multiple
Donde:
Los valores x ji son conocidos
Los i Errores de regresin
Los valores ai son constantes a estimar
Hiptesis
i N (0, )
y son independientes.
La matriz de valores de x es no singular