Está en la página 1de 28

Estadística Aplicada II

Caso de Polución
Regresión Múltiple
Integrantes:
Espinoza Calienes, Angie
Gamarra Venegas, Piero
Nuñez Cavalier, Leyla
Las autoridades de la región "Z", quieren evaluar
las políticas sanitarias y ambientales en favor de
su población, estudiando la mortalidad estimada
el año "1980" en 59 ciudades de la región. Las
variables se definen como sigue:
Y: Tasa de mortalidad por ciudad
X1: Cantidad de viviendas precarias por ciudad
X2: Temperatura de Enero (Invierno - ºF)
X3: Temperatura de Julio (Verano - ºF)
X4: Población mayor a 65 años
X5: Tamaño de vivienda
X6: Medida de escolaridad
X7: Viviendas con titularidad y/o institucionalizada
Las autoridades de la región "Z", quieren evaluar
las políticas sanitarias y ambientales en favor de
su población, estudiando la mortalidad estimada
el año "1980" en 59 ciudades de la región. Las
variables se definen como sigue:
X8: Densidad poblacional
X9: Población afrodescendiente
X10: Población con servicios de saneamiento
X11: Población con ingresos menores a 3000
X12: Polución de Hidrocarburados(HC)
X13: Polución de Óxidos de Nitrogeno(NOx)
X14: Polución de Óxidos de Asufre(SO)
X15: Humedad ambiental
head(datos)
pairs(Mortalidad~.,data =datos)
cor(datos[,-16])
Modelo 1
M
o
d
e
l
o
2
Y = 901.31 +1.56*Prec - 2.29*TEne + 4.96*PobColor
Comprobamos supuestos

Linealidad
Normalidad
Homocedasticidad
Independencia
Aleatoriedad
Linealidad
Normalidad
H0 : Los residuales siguen una distribución normal
H1 : Los residuales no siguen una distribución normal
α = 0,05

p-valor > α
Homocedasticidad
H0 : La varianza de los residuales es homocedástica
H1 : La varianza de los residuales no es homocedástica
α = 0,05

p-valor > α
Independencia
H0 : Los residuales no están autocorrelacionados
H1 : Los residuales están autocorrelacionados
α = 0,05

p-valor > α
Multicolinealidad

library(car)
vif(modelo2)
summary(modelo2)
SELECCIÓN DE
VARIABLES
Selección hacia adelante
(Forward )
Las variables se introducen secuencialmente en
el modelo. La primera variable que se introduce es
la de mayor correlación y el procedimiento acaba
cuando ya no quedan variables que cumplan el
criterio de entrada
Forward
forward<-step(
object=lm(Mortalidad ~ 1 , data=datos),
direction = "forward",
trace=1,
scope=~Prec+TEne+PobColor
)
summary(forward)
Eliminación hacia atrás
(backward)
Se introducen todas las variables en la ecuación y
después se van excluyendo una tras otra.
En cada etapa se elimina la variable menos
influyente.
Backward
fbackward <- step(
object=lm(Mortalidad~Prec+TEne+PobCol
or,data=datos),
direction = "backward",
trace=1
)
summary(backward)
Método stepwise

En cada paso se introduce la variable


independiente que no se encuentre en la
ecuación, ademas que las variables ya
introducidas en la ecuación de regresión también
pueden ser eliminadas del modelo
El método termina cuando ya no hay más
variables candidatas a ser incluidas o eliminadas
Stepwise fboth<-step(
object=lm(Mortalidad ~ 1,data=datos),
direction = "both",
trace=1,
scope=~Prec+TEne+PobColor
)
summary(both)
Predicción
nuevos_val<-data.frame(Prec=c(34,45),TEne=c(25,59),PobColor=c(10,15))
nuevos_val
Thank You
For Your Attention

También podría gustarte