Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Objetivos de la clase
Repasar las librerias tidyverse y
ggplot2 .
Repasar como cargar dataframe internos de R.
Conocer diferentes gráficas incorporadas en la librería
ggplot2 .
Conocer mejoras a las estéticas gráficas incorporadas en la librería
ggplot2 .
Actividad 1
Escriba cuales fueros las librerias mas utilizadas en el curso RCD I.
De ser necesario, instale los paquetes que
permiten trabajar con cada
libreria.
library(skimr)
Actividad 2
Determine para que se utiliza el operador %>% (pipes
o cañerías)
Actividad 3
Suponiendo que df corresponde a una data, determine en
palabras que realiza el siguiente código:
Actividad 4
A continuación, trabajaremos con dos datas disponibles en R:
heigth y murders . Para acceder a estos datos
tenemos que instalar el paquete donde se encuentra la librería que
contienen estas bases de datos. Para esto,
instale el paquete
dslabs y llame a su librería.
install.packages("dslabs")
library(dslabs)
Actividad 5
Cargue la data heigth , la cual corresponde a un listado
de atributos de alumnos de una universidad, en donde
se indica en la
columna height la estatura de cada persona en pulgadas.
Luego, muestre los datos.
data(heights)
heights
sex height
<fct> <dbl>
Male 75.00000
Male 70.00000
Male 68.00000
Male 74.00000
Male 61.00000
Female 65.00000
Female 66.00000
Female 62.00000
Female 66.00000
Male 67.00000
Actividad 6
Agregue una nueva variable de nombre estatura donde
transformaremos a metros la estatura de la data original
(recordemos que
un metro tiene 39.37 pulgadas). El resultado almacenémoslo dentro de una
nueva data.
mutate(estatura = height/39.37)
estaturas %>%
head()
1 Male 75 1.905004
2 Male 70 1.778004
3 Male 68 1.727203
4 Male 74 1.879604
5 Male 61 1.549403
6 Female 65 1.651003
6 rows
Actividad 7
Realice una tabla que muestre el promedio y la desviación estandar de
la estatura (en metros) de hombres y
mujeres.
estaturas %>%
group_by(sex) %>%
2 rows
Actividad 8
Existe otro dataframe disponible en R, el cual contiene
observaciones de asesinados con armas de fuego en
EEUU durante el año
2010 y que tomaremos como referencia para resolver el siguiente
caso/problemática. Dicha
data la encontraremos con el nombre
murders (asesinato en inglés), la cual es parte de la
librería dslabs
previamente mencionada.
data(murders)
murders
O bien,
Actividad 9
Describa las variables de la data murders . Recuerde que
puede conocer más detalles sobre las datas internas de
R mediante, en
este caso, la instrucción ?murders
Actividad 10
Realice un gráfico de puntos donde se muestre en el eje X la data de
population y en el eje Y la data del total .
Hint: para esto puede utilizar la estética gráfica
geom_point()
murders %>%
ggplot() +
geom_point() +
x = "Población",
Actividad 11
Realice un grafico de linea donde se muestre en el eje X la data de
population y en el eje Y la data del total .
Hint: para esto puede utilizar la estética gráfica
geom_line()
murders %>%
ggplot() +
geom_line() +
x = "Población",
Actividad 12
Realice un grafico de puntos donde se muestre en el eje X la data de
population y en el eje Y la data del total ,
donde además se muestre la etiqueta de la abreviación del estado en cada
punto. Hint: para esto puede utilizar la
estética gráfica
geom_point() y geom_text() . Para las etiquetas
puedes utilizar el argumento label en la
función
aes()
murders %>%
ggplot() +
geom_point() +
geom_text() +
x = "Población",
Dado que las etiquetas se superponen con los puntos, podemos realizar
la misma gráfica pero indicando
únicamente las etiquetas, con tal que se
entienda con mayor claridad nuestra gráfica.
murders %>%
ggplot() +
geom_text() +
x = "Población",
murders %>%
ggplot() +
geom_text() +
x = "Población",
color = "Región")
murders %>%
ggplot() +
geom_point() +
x = "Población",
color = "Región")
Actividad 14
En algunas gráficas anteriores no podemos ver bien el texto de las
abreviaciones de los estados dado que se
superponen con los puntos. Para
solucionar esto, podemos empujar (nudge en inglés) el texto en
el eje X o en el
eje Y. Dado que hablamos de varios millones de
personas, realice el gráfico de la pregunta anterior donde empuje
las
etiquetas de textos 1.5 millón de personas a la derecha. Hint: para
esto puedes utilizar el argumento nudge_x
en la función
geom_text()
murders %>%
ggplot() +
geom_point(size=1) +
color = "Región")