Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El Primer parcial consistirá en hacer un análisis de las características de los países a nivel
global en R, para lo que se recomienda instalar R Studio, en caso de no tener R Studio se
puede hacer en Google colab u otro servicio de la nube.
Lo que aparezca en el siguiente recuadro, es el código que deberás introducir en tu script o
archivo de markdown. La Primer parte del examen parcial es un breve tutorial que debes
escribir y guardar en un script, La segunda parte es el primer parcial que deberás realizar
en R markdown que incluirá de los problemas dos en adelante.
1.-Al abrir R-studio abriremos un script que es donde crearemos nuestro código de R. Esto
lo hacemos seleccionando File>>New file>>R Script
## instalamos librerías
install.packages("gapminder")
install.packages("tidyverse")
install.packages("readr")
ahora vamos a importar la siguiente base de datos, desde un archivo CSV, que
automáticamente R reconocerá como un data frame y lo guardaremos como datos_paises
Si damos clic sobre datos países se abrirá el dataframe para que podamos ver su contenido,
como sigue
class(datos_paises)
Y resulta lo siguiente:
Vamos a seleccionar la columna población_2019 que contiene la población de los países en
2019, con el comando select( )
Vamos a seleccionar una fila o renglón con el comando filter( ), en este caso la fila de Mexico
Vamos a seleccionar una fila y una columna combinando filter( ) y select( ), en este caso la
fila de México y la columna de población
Tambien podríamos filtrar por los países con más de un millón de habitantes (1,000,000)
Note que el total mundial (world) aparece como país vamos a filtrar datos_paises diciendo
a R que seleccione todos los datos menos world
Ahora vamos a obtener los 10 países más poblados del mundo y guardarlos en un data
frame llamado top10
Si abres el dataframe tiene varias variables vamos a quedarnos solo con población y país de
top10 y guardar en el dataframe top10
Si abres el datafreme notaras que esta desordenado, vamos a ordenarlo de mayor a menor
A partir de ahora comienza el Primer parcial, el cual se debe generar como un archivo de R
markdown y debe llevar el siguiente nombre 1erParcial_contexto_nov2022_matricula por
ejemplo si mi matricula es 12446576 se llamara 1erparcial_contexto_nov2022_12446576.R
Regiones del mundo: East Asia & Pacific, Europe & Central Asia, Middle East & North Africa,
Latin America & Caribbean, North America, South Asia, Sub-Saharan Africa.
3. Realiza una gráfica de barras para los siguientes indicadores, la cual debe tener el formato
adecuado (color, nombre de los ejes, nombres sin empalmar, título,etc; recuerda si eres
mujer para el año 2020, si eres hombre para el año 2018)
a) PIB percapita en dólares de 2017 de PPA
b) 15 países más poblados del mundo
c) 15 países con el mayor PIB PPA
d) 15 países con la mayor tasa de homicidios
e) 15 países con la mayor tasa de pobreza
5. Si naciste en los meses de enero-junio crea un data frame con los países de las siguientes
dos regiones “Latin America & Caribbean” y “North America”, si naciste en julio-diciembre
crea un data frame con las regiones que tengan Asia en su nombre. A tu nuevo data frame
llámalo my_data_enero si naciste enero-junio o my_data_julio si naciste en julio diciembre.
Obtén los 5 países mas y los 5 países menos de tu región en los siguientes indicadores para
el año 2020: