Está en la página 1de 3

3. En el archivo HealthData.csv se encuentra la información de salubridad por Estados.

Entre los datos tenemos el total de población, porcentaje de mujeres, porcentaje de


diabetes, promedio de ingreso por hogar, entre otros. Con la información brindada
deberá realizar los siguientes requerimientos:

3.1 Arregle el nombre de las columnas a un nombre más adecuado:

> HealthData <- read.csv("/cloud/project/Archivos de excel/3-M3-


Taller_HealthData-6.csv")
> View(HealthData)
> colnames(HealthData)
[1] "Estado"
[2] "Poplacion"
[3] "X..18"
[4] "X.65"
[5] "Decendencia.Africana"
[6] "X.Mujeres"
[7] "Rural"
[8] "X.Diabetes"
[9] "Rata.de.HIV"
[10] "Inactividdad.F.sica"
[11] "Rata.de.proveedores.de.salud.mental"
[12] "Promedio.de.ingreso.por.hogar"
[13] "X..De.costos.de.hogares"
[14] "X.Comida.gratis"
[15] "X.Analfabetismo.Infantil"
[16] "X.Conduccion.individual"
> colnames(HealthData)[colnames(HealthData) %in% c("Poplacion", "X..18",
"X.65", "X.Mujeres", "X.Diabetes", "X..De.costos.de.hogares",
"X.Comida.gratis", "X.Analfabetismo.Infantil", "X.Conduccion.individual")]
<- c ("Poblacion", "Menores.de.18", "Mayores.de.65",
"Porcentaje.de.Mujeres", "Porcentaje.de.Diabetes",
"Porcentaje.de.costos.de.Hogares", "Porcentaje.de.Comida.Gratis",
"Porcentaje.de.Analfabetismo.Infantil",
"Porcentaje.de.Conduccion.Individual")

3.2 Realice una regresión lineal entre Porcentaje de Diabetes e Inactividad Física:
> DatosSalud <- HealthData [,c("X.Diabetes","Inactividdad.F.sica")]
Error in `[.data.frame`(HealthData, , c("X.Diabetes",
"Inactividdad.F.sica")) :
undefined columns selected
> DatosSalud <- HealthData
[,c("Porcentaje.de.Diabetes","Inactividdad.F.sica")]
> pairs(DatosSalud)
> cor(DatosSalud)
Porcentaje.de.Diabetes Inactividdad.F.sica
Porcentaje.de.Diabetes 1.0000000 0.8363703
Inactividdad.F.sica 0.8363703 1.0000000
> regresionSalud <- lm(DatosSalud$Porcentaje.de.Diabetes ~
DatosSalud$Inactividdad.F.sica, data = DatosSalud)
> plot(DatosSalud$Porcentaje.de.Diabetes, DatosSalud$Inactividdad.F.sica,
xlab='Diabetes', ylab='Inactividad Física')
> abline(regresionSalud)

3.3 Use el modelo de regresión lineal para predecir un valor futuro:


> nueva.salud <- data.frame(Inactividdad.F.sica=31)
> predict(regresionSalud, nueva.salud)

También podría gustarte