Está en la página 1de 13

LABORATORIO N°4

FUNDAMENTOS DE GESTIÓN DE
DATOS

Introducción al análisis de
Regresión y Correlación

INFORME

Integrantes del grupo:

1-Asto Mondragon Irwin Rufo


2-Cáceres Porta Erick Alessandro
3- Condori Ordoñez Luis
4- Farfan Alvizuri Yudit Anais
5- García Pinaud Diego Andres
6- Juan de Dios Yupanqui Luis
Fernando

Docente:
Sección:
C28 - A -1
Grupo-02

DESARROLLO DE LA PREGUNTA 8:
Código en R

#Instalando el paquete
install.packages("tidyverse")
install.packages("gapminder")

library(gapminder)
library(tidyverse)
data("gapminder")
str(gapminder)

#Análisis del año 1972

#Hacemos el filtrado del año elegido


df_paises_1972 <- subset(gapminder, year == 1972)

#Escogemos las variables lifeExp(expectativa de años de vida) y gdpPercap


(renta per cápita), y hacemos la regresión lineal.
plot( x = df_paises_1972$lifeExp, y = df_paises_1972$gdpPercap)

#Medimos la correlación.
cor(df_paises_1972$lifeExp, df_paises_1972$gdpPercap)

#Estimamos el modelo lineal.


mod_1972 <- lm( lifeExp ~ gdpPercap, data = df_paises_1972)

#Calculamos el modelo lineal en una ecuación paramétrica.


coef(mod_1972)

#Medimos la Significancia de los Betas, la bondad de ajuste


# y la significación global del modelo.
summary(mod_1972)
#Análisis del año 1977

#Hacemos el filtrado del año elegido


df_paises_1977 <- subset(gapminder, year == 1977)

#Escogemos las variables lifeExp(expectativa de años de vida) y gdpPercap


(renta per cápita), y hacemos la regresión lineal.
plot( x = df_paises_1977$lifeExp, y = df_paises_1977$gdpPercap)

#Medimos la correlación.
cor(df_paises_1977$lifeExp, df_paises_1977$gdpPercap)

#Estimamos el modelo lineal.


mod_1977 <- lm( lifeExp ~ gdpPercap, data = df_paises_1977)

#Calculamos el modelo lineal en una ecuación paramétrica.


coef(mod_1977)

#Medimos la Significancia de los Betas, la bonda de ajuste


# y la significación global del modelo.
summary(mod_1977)

#Análisis de los años 70s

#Hacemos el filtrado de los años elegidos.


df_paises_70 <- subset(gapminder, year < 1980 & year > 1970)

#Escogemos las variables lifeExp(expectativa de años de vida) y gdpPercap


(renta per cápita), y hacemos la regresión lineal.
plot( x = df_paises_70$lifeExp, y = df_paises_70$gdpPercap)

#Medimos la correlación.
cor(df_paises_70$lifeExp, df_paises_70$gdpPercap)

#Estimamos el modelo lineal.


mod_70 <- lm( lifeExp ~ gdpPercap, data = df_paises_70)
#Calculamos el modelo lineal en una ecuación paramétrica.
coef(mod_70)

#Medimos la Significancia de los Betas, la bondad de ajuste


# y la significación global del modelo.
summary(mod_70)

#Análisis del año 2007

#Hacemos el filtrado del año elegido


df_paises_2007 <- subset(gapminder, year == 2007)

#Escogemos las variables lifeExp(expectativa de años de vida) y gdpPercap


(renta per cápita), y hacemos la regresión lineal.
plot( x = df_paises_2007$lifeExp, y = df_paises_2007$gdpPercap)

#Medimos la correlación.
cor(df_paises_2007$lifeExp, df_paises_2007$gdpPercap)

#Estimamos el modelo lineal.


mod_2007 <- lm( lifeExp ~ gdpPercap, data = df_paises_2007)

#Calculamos el modelo lineal en una ecuación paramétrica.


coef(mod_2007)

#Medimos la Significancia de los Betas, la bondad de ajuste


# y la significación global del modelo.
summary(mod_2007)
RESULTADOS
Resultados del año 1972

plot( x = df_paises_1972$lifeExp, y = df_paises_1972$gdpPercap)

cor(df_paises_1972$lifeExp, df_paises_1972$gdpPercap)

0.4597014

La correlación entre la expectativa de vida en años y la renta per capita en el año


1972 de todos los países del mundo es de tendencia baja.

mod_1972 <- lm( lifeExp ~ gdpPercap, data = df_paises_1972)

Call:
lm(formula = lifeExp ~ gdpPercap, data = df_paises_1972)

Coefficients:
(Intercept) gdpPercap
5.431e+01 4.929e-04
coef(mod_1972)

(Intercept) gdpPercap
5.431011e+01 4.929443e-04

lifeExp = 5.431011e+01 + (gdpPercap)* 4.929443e-04

summary(mod_1972)

Call:
lm(formula = lifeExp ~ gdpPercap, data = df_paises_1972)

Residuals:
Min 1Q Median 3Q Max
-40.501 -8.026 0.638 9.463 13.798

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.431e+01 1.011e+00 53.734 < 2e-16 *
gdpPercap 4.929e-04 8.048e-05 6.125 8.66e-09 *
---
Signif. codes: 0 ‘*’ 0.001 ‘*’ 0.01 ‘’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 10.14 on 140 degrees of freedom


Multiple R-squared: 0.2113, Adjusted R-squared: 0.2057
F-statistic: 37.51 on 1 and 140 DF, p-value: 8.664e-09
Resultados del año 1977

plot( x = df_paises_1977$lifeExp, y = df_paises_1977$gdpPercap)

cor(df_paises_1977$lifeExp, df_paises_1977$gdpPercap)

0.6198638

La correlación entre la expectativa de vida en años y la renta per cápita del año
1977 tiende a ser baja, aunque con más tendencia a ser positiva comparado con el
año 1972.

mod_1977 <- lm( lifeExp ~ gdpPercap, data = df_paises_1977)

Call:
lm(formula = lifeExp ~ gdpPercap, data = df_paises_1977)

Coefficients:
(Intercept) gdpPercap
5.348e+01 8.322e-04

coef(mod_1977)

(Intercept) gdpPercap
5.348406e+01 8.322108e-04
lifeExp = (5.348406e+01) + (gdpPercap )*8.322108e-04

summary(mod_1977)

Call:
lm(formula = lifeExp ~ gdpPercap, data = df_paises_1977)

Residuals:
Min 1Q Median 3Q Max
-33.462 -5.848 1.815 7.071 13.855

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.348e+01 9.872e-01 54.179 <2e-16 *
gdpPercap 8.322e-04 8.904e-05 9.347 <2e-16 *
---
Signif. codes: 0 ‘*’ 0.001 ‘*’ 0.01 ‘’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 8.842 on 140 degrees of freedom


Multiple R-squared: 0.3842, Adjusted R-squared: 0.3798
F-statistic: 87.36 on 1 and 140 DF, p-value: < 2.2e-16
Resultados de los años 70s

plot( x = df_paises_70$lifeExp, y = df_paises_70$gdpPercap)

cor(df_paises_70$lifeExp, df_paises_70$gdpPercap)

0.5267681

La correlación entre la expectativa de años de vida y la renta per cápita en la


década de 1970 era baja en general.

mod_70 <- lm( lifeExp ~ gdpPercap, data = df_paises_70)

Call:
lm(formula = lifeExp ~ gdpPercap, data = df_paises_70)

Coefficients:
(Intercept) gdpPercap
5.421e+01 6.252e-04

coef(mod_70)

(Intercept) gdpPercap
5.420601e+01 6.252486e-04
lifeExp = (5.420601e+01) + (6.252486e-04)*gdpPercap

summary(mod_70)

Call:
lm(formula = lifeExp ~ gdpPercap, data = df_paises_70)

Residuals:
Min 1Q Median 3Q Max
-54.864 -7.169 1.134 7.974 14.454

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.421e+01 7.117e-01 76.17 <2e-16 *
gdpPercap 6.253e-04 6.008e-05 10.41 <2e-16 *
---
Signif. codes: 0 ‘*’ 0.001 ‘*’ 0.01 ‘’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 9.644 on 282 degrees of freedom


Multiple R-squared: 0.2775, Adjusted R-squared: 0.2749
F-statistic: 108.3 on 1 and 282 DF, p-value: < 2.2e-16
Resultados del año 2007

plot( x = df_paises_2007$lifeExp, y = df_paises_2007$gdpPercap)

cor(df_paises_2007$lifeExp, df_paises_2007$gdpPercap)

0.6786624

La correlación entre la expectativa de años de vida y la renta per cápita en el año


2007 es mediana con tendencia a ser positiva.

mod_2007 <- lm( lifeExp ~ gdpPercap, data = df_paises_2007)

Call:
lm(formula = lifeExp ~ gdpPercap, data = df_paises_2007)

Coefficients:
(Intercept) gdpPercap
5.957e+01 6.371e-04

coef(mod_2007)

(Intercept) gdpPercap
5.956565e+01 6.371341e-04
lifeExp = (5.956565e+01) + (6.371341e-04)*gdpPercap

summary(mod_2007)

Call:
lm(formula = lifeExp ~ gdpPercap, data = df_paises_2007)

Residuals:
Min 1Q Median 3Q Max
-22.828 -6.316 1.922 6.898 13.128

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.957e+01 1.010e+00 58.95 <2e-16 *
gdpPercap 6.371e-04 5.827e-05 10.93 <2e-16 *
---
Signif. codes: 0 ‘*’ 0.001 ‘*’ 0.01 ‘’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 8.899 on 140 degrees of freedom


Multiple R-squared: 0.4606, Adjusted R-squared: 0.4567
F-statistic: 119.5 on 1 and 140 DF, p-value: < 2.2e-16

CONCLUSIONES
-Se analizó la correlación y la regresión lineal entre dos variables: la expectativa de
años de vida (lifeExp ) y la renta per cápita (gdp Per cap ) de todos los países del
mundo de los años 1972, 1977 y 2007. También se hizo un análisis de toda la
década de 1970. Cabe aclarar que se realizó un análisis para cada año por
separado.

-En el análisis del año 1972 se observa que la correlación es 0.4597014, es decir, la
correlación entre expectativa de años de vida y renta per cápita es baja. Dando a
entender que el alto nivel de vida no necesariamente implica que hay un alto nivel
de ingresos o viceversa.

-En el año 1977 la correlación es 0.6198638. Se observa que la correlación aumentó


significativamente. Esto significa que la correlación entre la expectativa de vida y la
renta per cápita se hizo más fuerte y con tendencia a ser positiva.
-En el análisis del año 2007 la correlación es 0.6786624, observamos que la
correlación es más fuerte que la del año 1977, aunque el valor de aumento es
menos pronunciado.

-Podemos concluir que en la década de 1970 la expectativa de años de vida y la


renta per cápita no estaban fuertemente correlacionados, aunque con el pasar de
los años la correlación se hizo más fuerte. Sin embargo, el aumento de correlación
con el pasar de los años se produce de una manera lenta y poco pronunciada. La
paridad entre calidad de vida e ingresos altos en los países alrededor del mundo se
hace de manera lenta pero continua.

También podría gustarte