Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Guia 4
Guia 4
Guía de Ejercicios 4
Análisis exploratorio de datos
En esta guía usaremos los datos de “World Development Indicators” (WDI) obtenidos en la Guía de Ejercicios
3.
library(readr)
library(dplyr)
library(janitor)
library(kableExtra)
library(skimr) # estadística descriptiva
Pregunta 1
Nombre a las variables SP.P OP.T OT L, N Y.GDP.P CAP.P P.CD, F D.AST.P RV T.GD.ZS y F B.AT M.T OT L.P 5
como population, gdppc, credit y atm respectivamente.
Pregunta 2
Ordene los datos en orden ascendente primero por country y luego por year
1
wbData2 <- wbData2 %>% arrange(country, year)
Pregunta 3
Cambie los nombres de las regiones a español. Por ejemplo, cambie la región “Middle East & North Africa”
a “Medio Oriente y Norte de Africa”.
Pregunta 4
¿Cuántos países tiene la base de datos?, ¿Cuántos países por región tiene la base de datos?
Pregunta 5
Identifique los 5 países con mayor población el año 2019
2
Pregunta 6
Identifique los 10 países con mayor crecimiento de su población entre los años 2018 y 2019.
wbData3 %>%
mutate(crecim_poblacional = round(((population -lag(population))/lag(population))*100, 1)) %>%
filter(year == 2019) %>%
select(country, crecim_poblacional) %>%
slice_max(crecim_poblacional, n = 10) %>%
kbl(booktabs = T,
col.names = c("País", "Crecimiento población ( %)"),
linesep = '') %>%
kable_styling(latex_options = c("striped", "hold_position"))
Pregunta 7
Identifique los 10 países con menor PIB per cápita el año 2019
Pregunta 8
Para cada una de las regiones del mundo, determine los valores mínimos y máximos del PIB per cápita el
año 2019. Además, identifique los países con los mínimos y máximos del PIB per cápita en cada una de las
regiones.
3
linesep = '',
digits = 0) %>%
kable_styling(latex_options = c("striped", "hold_position"))
Pregunta 9
Para cada una de las regiones del mundo, presente una tabla con estadística descriptiva para las variables PIB
per cápita, crédito bancario al sector privado y número de ATMs para el año 2018. Nota: Se recomiendan
revisar las funciones del paquete skimr en https:// cran.r-project.org/ web/ packages/ skimr/ index.html.
# Forma 1
wbData3 %>%
filter(year == 2018) %>%
select(gdppc, credit, atm) %>%
skim() %>%
yank("numeric") %>%
select(-c("complete_rate", "hist"))
# Forma 2
wbData3 %>%
filter(year == 2018) %>%
select(gdppc, credit, atm) %>%
skim() %>%
yank("numeric") %>%
select(-c("complete_rate", "hist")) %>%
kbl(booktabs = T,
col.names = c("Variable", "NA's", "Media", "Desv. Est.",
"Mínimo", "p25", "p50", "p75", "Máximo"),
digits = 1) %>%
kable_styling(latex_options = c("striped", "hold_position"))