Está en la página 1de 3

Universidad de Chile Tópicos en Economía y Negocios Utilizando R

ENMEC357
Tópicos en Economía y Negocios Utilizando R
Tarea 4
Profesor: Victor Macias E.
Ayudante: Gabriel Cabrera G.1
22 octubre 2018

Instrucciones
1. Esta tarea debe ser entregada en grupos de máximo 3 personas.
2. Se debe enviar una carpeta comprimida que contenga: un archivo .Rproj (proyecto en R), un
script y un breve informe en R Markdown con sus resultados, incluyendo tablas, gráficos, etc.,
según corresponda. El formato del infome puede ser word, pdf y/o html.
3. El nombre del archivo comprimido debe ser “Tarea 4-R-Uchile Apellido 1-Apellido 2-Apellido
3”.
4. El asunto del email con su tarea debe ser “Tarea 4-R-Uchile Apellido 1-Apellido 2-Apellido 3”.
5. La fecha de entrega es el Miercoles 31 de Octubre del 2018 hasta las 23:59 hrs al correo del
curso: r2018uchile@gmail.com.

“It is a capital mistake to theorize before one has data. Insensibly one begins to twist
facts to suit theories, instead of theories to suit facts.”
Sir Arthur Conan Doyle, Sherlock Holmes

1 Pregunta 1 (80 puntos)

Utilizando las siguientes bases de datos:


a. IMDb dataset: Contiene información de películas obtenida desde IMDb hasta 2017. Es la
misma utilizada en la Tarea 1 y Tarea 3. Se encuentra adjunta en la carpeta IMDb dataset.

Table 1: Breve descripción de IMDb dataset

Base de datos Descripción


genres.csv Géneros de cada película.
keywords.csv Palabras claves de cada película.
production_companies.csv Compañía a cargo de la producción.
production_countries.csv Países donde se realizá la producción.
movie_dataset.csv Base de datos principal.
1
>: gcabrerag@fen.uchile.cl

1
Universidad de Chile Tópicos en Economía y Negocios Utilizando R

b. R Ladies dataset: R Ladies es una organización mundial que busca promover la diversidad
de género en la comunidad R. Su objetivo es generar un espacio colaborativo amigable para
intercambiar ideas, experiencias y conocimientos, y así hacer R más popular y accesible. La base a
utilizar se en encuentra en: https://raw.githubusercontent.com/d4tagirl/R-Ladies-growth-maps/
master/rladies.csv y sus variables son:

Table 2: Breve descripción de R Ladies dataset

Variables Descripción
screen_name ID de la organización (e.g RLadiesBoston).
location Locación de la organización.
created_at Fecha que fue creada la organización.
followers Número de seguidores.
age_days Días de antiguedad.
lon Longitud.
lat Latitud.

Deberá construir un Dashboard2 con las siguientes características:

1.1 Dashboard: Películas

1.1.1 Parte 1

a. Asumiendo que la variable vote_average es el voto final que tuvo la película, presente en un
mapa el voto promedio por estado. El mapa debe tener:
• El nombre de cada estado, puede ser el zip code o el nombre.
• Agregar los estados restantes, Alaska y Hawaii.
b. Presente en un mapa la cantidad de películas por estado. El mapa debe tener:
• El nombre de cada estado, puede ser el zip code o el nombre.
• Agregar los estados restantes, Alaska y Hawaii.
c. Utilizando un gráfico de su elección identifique y muestre la cantidad de películas por género
pero separándolos por país de producción.
d. Usando un gráfico de barra , identifique las 10 películas con mayor popularidad.

1.1.2 Parte 2

a. Genere un gráfico de barra que presente la cantidad de películas estrenada por año.
b. Genere un gráfico de barra que presente las ganancias (revenue - budget) sobre USD$ 1000
millones de las compañias de producción.
c. Usando un pie chart, muestre las películas estrenadas por década.
2
Cada gráfico y/o tabla debe ser interactivo. Librerías utiles: leaflet, plotly, ggplotly y/o highchart.

2
Universidad de Chile Tópicos en Economía y Negocios Utilizando R

d. Usando un pie chart, identifique los 10 idiomas más utilizados en las películas.

1.2 Dashboard: R Ladies

a. Usando la geolocalización de cada organización, muestre los followers usando una mapa. Tener
en cuenta que los valores no son a nivel de país.
b. Construya un gráfico o tabla de su interés.

También podría gustarte