Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Facultad de Matemáticas
Departamento de Estadı́stica
Pontificia Universidad Católica de Chile
CASO PARTICULAR XY N Tx Y SI
Mx Y
EL Y IX X
Mx
My Syfy
S
My A SE
X
Po Pi
Val Y X Ey 1 5
de
Introducción
Y i = µ + "i i = 1, . . . , n
Yi = µ (Xi ) + "i i = 1, . . . , n
Se llama a
yi = E (Yi | xi ) = µ (xi )
a la curva de regresión de Y sobre x.
Si la relación funcional es lineal en los parámetros, es decir,
µ (Xi ) = 0 + 1 Xi ,
Yi = 0 + 1 Xi + "i i = 1, . . . , n
Supuestos:
1. Linealidad: La media condicional de Y sobre x es lineal
y = E(Y | x) = 0 + 1x
F I
Regresión Lineal Simple
Máxima Verosimilitud
Bajo los supuestos (1) (2) (3) (4) se tiene que Yi | xi tiene
distribución Normal con media E (Yi | xi ) = 0 + 1 xi y varianza 2
y además son independientes, entonces la función de verosimilitud
de la muestra está dada por
n
Y n
indepY
O
1 1 2
L= fY |xi (yi ) = p e 2 2 (yi 0 1 xi )
i=1 i=1
2⇡
( n
)
1 X
= (2 ⇡ 2 ) n/2 exp 2
(yi 0 1 xi )
2
2
i=1
Regresión Lineal Simple
Estimación del Modelo
Ipoh
O
ijp.lt jaleo 2
Los estimadores máximos verosı́miles de los parámetros 0, 1 y
están dados por
n
X
xi yi ny x
ˆ1 = i=1 ˆ0 = ȳ ˆ1 x̄
n ,
X
xi2 n (x)2
i=1
1 X⇣ n ⌘2
ˆ2 = yi ˆ0 ˆ1 xi
n
i=1
Regresión Lineal Simple
Estimación del Modelo
Mı́nimos Cuadrados
Bajo los supuestos (1) (2) (3), El método de mı́nimos cuadrados
estimará los parámetros tales que minimicen la suma la distancia al
cuadrado entre los valores observados de yi y los asumidos por el
ajuste de regresión, es decir, minimizar la función 2 dada por
n
X
2 2
= (yi 0 1 xi )
i=1
El Syfy LINEA
Regresión Lineal Simple
Estimación del Modelo
Propiedades
Por supuestos (1) (2) (3) los EMV y EMCO de 0 y 1 se tienen
las siguientes propiedades:
I Insesgamiento
⇣ ⌘ ⇣ ⌘
E ˆ0 = 0 y E ˆ1 = 1
I Varianza
⇣ ⌘ 2
Pn 2 ⇣ ⌘ 2
x
Var ˆ0 = Pn i=1 i
2
y Var ˆ1 = Pn
n i=1 (xi x̄) i=1 (xi x̄)2
(x x̄)
z PoÍo
i
T
i=1
⇣ 2
⌘
ˆ1 ⇠ Normal 1 , Pn (x x̄)2
i=1 i Z R B
Y además, V
I ˆ1 , Ȳ , ˆ 2 son muatuamente independientes.
n
!2 2
X yi ˆ0 ˆ1 xi nˆ 2 (n 2) s Y |x
I = 2 = ⇠ 2
(n 2).
2
i=1
Regresión Lineal Simple
O
Inferencia
HAY REGRESIÓN β
A partir de lo anterior se puede hacer inferencia sobre los parámetros
del modelo, y poder construir IC o realizar test de hipótesis acerca
de ellos.
Sea E(Y | x) = 0 + 1 x el modelo de regresión lineal simple, y
ˆ0 , ˆ1 los EMV de 0 y 1 .
Entonces el estadı́stico,
ˆ1 1
T sY | x
qP
n
x̄)2
⇠ t-Student(n 2)
i=1 (xi
n ⇣
X ⌘2
con sY2 | x = 1
Yi ˆ0 ˆ1 xi , estimador insesgado de 2.
n 2
i=1
HAY REGRESIÓN
Ho β
o vs Ha β
O
SI HO ES CORRECTO ENTONCES
Lem
To
Ha Ho Ha
ii
ITol
VALOR p 2 PC T Tol 2 1
pti Tol dt m a
ˆ0
T pPn 0 ⇠ t-Student(n 2) MUY
2
sY | x
p Pn
i=1 xi POCA
n i=1 (xi x̄)2 IMPORTANCIA
y
(n 2)sY2 | x
2
2
⇠ (n 2)
SUPONGAMOS QUE SI HAY REGRESIOI
y y
PIPI
x̅ x̅
Io I Xe
X X2
MODELO 1 x̅ si_EEEEE
2
MODELO 2
PIX 54K
1
SYKI DE VARIABILIDAD QUE
JEFIECIETEDE
DETERMINACION
AJUSTADO
Regresión Lineal Simple
Análisis de la Varianza
II Fin trim
Y
F F m 2
xm.iq
SCR
SCD FCI m a
SCE ya
M 2
SCE y
Ho
H
O
BEN
IR
VALOR p 1
pt F df 1 df M 2
EN REGRESION SIMPLE
i F
Tp
VALOR
ii VALOR
Ptp PE
I
Regresión Lineal Simple
Análisis de la Varianza
ahora modelo
Tabla ANOVA
Fuente gl SC CM F VALOR P
SCR MCR
Regresión 1 SCR 1 MCE
SCE
Error n 2 SCE n 2
Total n 1 SCT
MCR
Con F = MCE ⇠ F (1, n 2)
Regresión Lineal Simple
Coeficiente de Determinación
Coeficiente de determinación R 2 :
Pn
SCR (y 0 ȳ )2 SCE
R2 = = Pi=1 n
i
2
=1
SCT i=1 (yi ȳ ) SCT
sY2 | x (n 1) SCE 2
2
r =1 =1 =R
sY2 (n 2) SCT
VAMOS A R
###############################
## EYP1113 - Script Clase 30 ##
###############################
## Regresión Lineal ##
## beta1 = -1.5897 --> valor-p < 2e-16 --> Se rachaza H0 --> Hay regresión
## Se podrá mejorar?
## Incorporemos al mismo tiempo las variables Hmean y pm25
## Valor F a mano:
SCE1 <- anova(modelo1)[2,2]
SCE2 <- anova(modelo2)[4,2]
r = 2
k = 1
n = dim(Data)[1]
Fanova <- ((SCE1-SCE2)/r)/(SCE2/(n-k-r-1))
Fanova
## Seleccion de modelo
## Backward: Parte del modelo completo y empieza a eliminar las variables
## que menos aportan.
modelo3 = step(lm(total_death ~ ., data = Data[,c(3,4,5,6,7,8)]))
summary(modelo3)