Está en la página 1de 6

getwd()

setwd("C:/.../Día 5")

movies <- read.csv("Movie-Ratings.csv")

colnames(movies) <- c("Film", "Genre", "CriticRating", "AudienceRating", "BudgetMillions", "Year")

str(movies)

levels(movies$Genre)

summary(movies)

# La función "factor()" permite agrupar caracteres que se repiten en la columna

factor(movies$Year)

movies$Year <- factor(movies$Year)

summary(movies)

str(movies)

#----------------- Aspecto

library(ggplot2)

# aes() = como quieres que la información se despliegue

ggplot(data=movies, aes(x=CriticRating, y=AudienceRating))

# Agregar la geometría

ggplot(data=movies, aes(x=CriticRating, y=AudienceRating)) +

geom_point()

# Agregar parámetros estadísticos a la grafica (ajuste de línea recta)


ggplot(data=movies, aes(x=CriticRating, y=AudienceRating)) +

geom_point() + geom_smooth(method='lm')

lm_fit <- lm(CriticRating ~ AudienceRating, data=movies)

summary(lm_fit)

# Agrega color

ggplot(data=movies, aes(x=CriticRating, y=AudienceRating,

colour=Genre)) + geom_point()

# Agregar tamaño

ggplot(data=movies, aes(x=CriticRating, y=AudienceRating,

colour=Genre, size=Genre)) + geom_point()

# Al definir el color y el tamaño de las gráficas con diferentes valores, la forma en que se

# presenta la información puede ser más digerible

ggplot(data=movies, aes(x=CriticRating, y=AudienceRating,

colour=Genre, size=Year)) + geom_point()

ggplot(data=movies, aes(x=CriticRating, y=AudienceRating,

colour=Genre, size=BudgetMillions)) + geom_point()

ggplot(data=movies, aes(x=CriticRating, y=AudienceRating,

colour=BudgetMillions, size=Genre)) + geom_point()

#----------------- Grafica por capas

p <- ggplot(data=movies, aes(x=CriticRating, y=AudienceRating,

colour=Genre, size=BudgetMillions))
# Agrega una grafica de puntos a la variable p

p + geom_point()

# o de lineas

p + geom_line()

# Agrega Multiples capas

p + geom_point() + geom_line()

p + geom_line() + geom_point()

#----------------- Sobrescribe los estéticos de la grafica

q <- ggplot(data = movies, aes(x=CriticRating, y=AudienceRating,

colour=Genre, size=BudgetMillions))

#agrega capas a geom

q + geom_point()

#Sobrescribe aes

#ej1

q + geom_point(aes(size=Genre))

#ej2

q + geom_point(aes(size=Year)) + labs(size = "Year")

#q sige integro

q + geom_point()

#ej3

#la función "xlab" te permite modificar el texto del eje x


q + geom_point(aes(x=BudgetMillions)) +

xlab("Budget Millions $$$")

#ej4

q + geom_line() + geom_point()

#reduce l tamaño de la linea

q + geom_line(size=1) + geom_point()

#----------------- Mapeo vs Ajuste

r <- ggplot(data = movies, aes(x=CriticRating, y=AudienceRating))

r + geom_point()

#Agregando color

#1. Mapeo

r + geom_point(aes(colour=Genre)) #Estamos tomando el valor de los "levels" de la columna como


referencia

#2. Ajuste

r + geom_point(colour="Green")

#ERROR, la función si se define "colour="Green"" en la función "aes()" básicamente estamos utilizando a

#"DarkGreen" como variable en la grafica

#r + geom_point(aes(colour="Green"))

#Agregando tamaño

#1. Mapeo

r + geom_point(aes(size=BudgetMillions))
# Ajuste

r + geom_point(size=10)

#ERROR

#r + geom_point(aes(size=10))

#----------------- Histogramas and Gráficos de densidad

#Al definir solo el valor de x para graficar, automáticamente "ggplot()" genera un Histograma

s <- ggplot(data = movies, aes(x=BudgetMillions))

s + geom_histogram(binwidth=10) #"binwidth" es un valor que debemos siempre definir para obtener


una cobertura

#adecuada de nuestra grafica

#Agregar color

s + geom_histogram(binwidth=10, fill="Green") # Ajuste vs Mapeo

s + geom_histogram(binwidth=10, aes(fill=Genre))

#Agregar un borde

s + geom_histogram(binwidth=10, aes(fill=Genre), colour="Black") #"colour" en "geom_histogram()"


determina los bordes

s + geom_histogram(binwidth=5, aes(fill=Genre), colour="Green")

s + geom_histogram(binwidth=20, aes(fill=Genre), colour="Black")

#En algunos casos será más útil el emplear gráficos de densidad:

s + geom_density(aes(fill=Genre))

s + geom_density(aes(fill=Genre), position="stack") #position="stack" te permite traslapar de menor a


mayor

#Cada tipo de grafica tiene un sin fin de opciones que se pueden definir para personalizar el resultado.

?geom_density()

También podría gustarte