Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Caso de Polución
Regresión Múltiple
Integrantes:
Espinoza Calienes, Angie
Gamarra Venegas, Piero
Nuñez Cavalier, Leyla
Las autoridades de la región "Z", quieren evaluar
las políticas sanitarias y ambientales en favor de
su población, estudiando la mortalidad estimada
el año "1980" en 59 ciudades de la región. Las
variables se definen como sigue:
Y: Tasa de mortalidad por ciudad
X1: Cantidad de viviendas precarias por ciudad
X2: Temperatura de Enero (Invierno - ºF)
X3: Temperatura de Julio (Verano - ºF)
X4: Población mayor a 65 años
X5: Tamaño de vivienda
X6: Medida de escolaridad
X7: Viviendas con titularidad y/o institucionalizada
Las autoridades de la región "Z", quieren evaluar
las políticas sanitarias y ambientales en favor de
su población, estudiando la mortalidad estimada
el año "1980" en 59 ciudades de la región. Las
variables se definen como sigue:
X8: Densidad poblacional
X9: Población afrodescendiente
X10: Población con servicios de saneamiento
X11: Población con ingresos menores a 3000
X12: Polución de Hidrocarburados(HC)
X13: Polución de Óxidos de Nitrogeno(NOx)
X14: Polución de Óxidos de Asufre(SO)
X15: Humedad ambiental
head(datos)
pairs(Mortalidad~.,data =datos)
cor(datos[,-16])
Modelo 1
M
o
d
e
l
o
2
Y = 901.31 +1.56*Prec - 2.29*TEne + 4.96*PobColor
Comprobamos supuestos
Linealidad
Normalidad
Homocedasticidad
Independencia
Aleatoriedad
Linealidad
Normalidad
H0 : Los residuales siguen una distribución normal
H1 : Los residuales no siguen una distribución normal
α = 0,05
p-valor > α
Homocedasticidad
H0 : La varianza de los residuales es homocedástica
H1 : La varianza de los residuales no es homocedástica
α = 0,05
p-valor > α
Independencia
H0 : Los residuales no están autocorrelacionados
H1 : Los residuales están autocorrelacionados
α = 0,05
p-valor > α
Multicolinealidad
library(car)
vif(modelo2)
summary(modelo2)
SELECCIÓN DE
VARIABLES
Selección hacia adelante
(Forward )
Las variables se introducen secuencialmente en
el modelo. La primera variable que se introduce es
la de mayor correlación y el procedimiento acaba
cuando ya no quedan variables que cumplan el
criterio de entrada
Forward
forward<-step(
object=lm(Mortalidad ~ 1 , data=datos),
direction = "forward",
trace=1,
scope=~Prec+TEne+PobColor
)
summary(forward)
Eliminación hacia atrás
(backward)
Se introducen todas las variables en la ecuación y
después se van excluyendo una tras otra.
En cada etapa se elimina la variable menos
influyente.
Backward
fbackward <- step(
object=lm(Mortalidad~Prec+TEne+PobCol
or,data=datos),
direction = "backward",
trace=1
)
summary(backward)
Método stepwise