Está en la página 1de 10

Maestría en Ciencia de datos y Procesamiento de

Datos Masivos
Análisis de datos con R

Jose Del Carmen Mercado Betancourt


000-00-5397

3.1 Gráficos con R


Unidad 3

Dr. Alberto Ochoa Ortiz-Zezzatti


31/01/2022

1
Introducción

En esta unidad se estudia en R las múltiples funciones diseñadas para la


representación gráfica de datos estadísticos, estas funciones son de gran utilidad en la
elaboración de graficas a partir de la elaboración del código en R y su visualización en
Rstudio. El paquete graphics es el que se carga en memoria cada vez que arrancamos
R este contiene un gran número de funciones de alto nivel que presentan un tipo de
grafico mejorado en presentación y de bajo nivel para generar gráficos con baja
definición, numerosos paquetes como plotrix, scatterplot3D, rgl, maps, shapes, …, y
sobre todo ggplot2- contienen muchísimas más funciones gráficas que mejoran y
complementan las que vienen por defecto con R y Rstudio.

Desarrollo

1. Usando el archivo de datos Ventas.csv realice lo siguiente:

a) Usando los comandos plot y qplot grafique en el plano XY las variables

Edad vs NumeroTienda.

> Excel = read_xlsx(file.choose(),sheet=1)


> View(Excel)
> dato = data.frame(excel$NumeroTienda,excel$Edad)
> Venta3<- data.frame(Excel$NumeroTienda,Excel$Edad)
> plot(Excel$Edad,Excel$NumeroTienda, main = "grafico numero de
tienda vs edad", xlab="Edad", ylab="NumerTienda", pch=1)

2
b) Grafique usando el comando scatterplot3d en 3 dimensiones las variables

Edad, NumeroTienda e Importe de venta.

> Venta3<-
data.frame(Excel$NumeroTienda,Excel$Edad,Excel$ImporteVenta)
> x<-Excel$Edad
> y<-Excel$NumeroTienda
> z<-Excel$ImporteVenta
> x
[1] 57 29 41 63 44 34 50 45 21 43 53 35 43 44 30 38 34 27 37
30 22 47
[23] 22 22 25 42 33 39 43 38 55 23 31 42 38 46 40 44 26 39 40
42 54 49
[45] 26 21 63 44 56 26 28 21 40 23 41 39 46 54 44 26 29 25 28
41 46 40
[67] 45 42 34 38 46 65 32 36 35 30 29 33 53 25 50 30 58 45 50
39 48 25
[89] 50 45 42 38 28 45 28 65 47 42 32 23 34 37
> y
[1] 2 5 4 6 2 2 7 5 3 7 4 7 8 5 5 5 9 6 3 3 4 3 3 1 3 6 8 4 2
5 1 5 2 3
[35] 5 6 6 4 8 9 4 9 6 7 9 7 9 6 3 1 2 8 6 7 3 5 7 5 7 3 9 6 2
6 2 7 9 7
[69] 5 6 3 9 8 7 5 5 4 8 8 6 5 6 3 3 2 1 1 9 5 1 1 1 8 8 5 7 7
9 6 9 3 6
> z
[1] 51575 54947 54478 52236 53233 52487 52842 53377 55085
54891 52051
[12] 52266 53603 54267 53022 52886 52177 51114 55045 5158

3
54532 54295
[23] 54943 5415 54142 51587 53561 50685 50152 55065 52347
55585 51468
[34] 54241 54512 51566 51503 5214 51058 51378 51398 53076
51491 50689
[45] 51961 54794 50951 50059 53114 51439 50112 52321 53226
50116 50346
[56] 54321 52439 51991 50229 51014 50123 50554 52894 52307
51843 54253
[67] 51509 50091 53425 5291 50068 53928 50656 54187 51958
54021 52238
[78] 50311 53456 53919 53184 51114 54481 54831 52459 54346
51653 545
[89] 54761 50429 52255 50912 54983 51468 55073 5048 52913
53178 50855
[100] 50945 50784 52203

> scatterplot3d
> library(scatterplot3d)
> G3D<-scatterplot3d(x,y,z)
> G3D<-scatterplot3d(x,y,z, main="Grafica 3D
Ventas",sub="Subtitulo",xlab="X",ylab="Y",zlab="Z")

2. Usando el archivo de datos EvaluaProducto.csv con los comandos cor y

corrplot calcule la matriz de correlaciones de la tabla para cada comando.

> install.packages("PerformanceAnalytics")

4
> install.packages("readxl")
> library(readxl)
> EvaluaProducto <- read_excel("EvaluaProducto.xlsx")
> View(EvaluaProducto)
> Excel = read_xlsx(file.choose(),sheet=1)
> DatoEP<-
data.frame(Excel$Encuesta,Excel$Variedad,Excel$Ingredientes,Exc
el$Precio,Excel$Sabor,Excel$Informacion,Excel$Limpieza,Excel$Ac
ceso,Excel$Presentacion,Excel$Forma)
> library(PerformanceAnalytics)
>library(xts)
> library(zoo)
> MC<-Com2[,1:10]
> cor(MC)

>install.packages("corrplot")

> library(corrplot)

># mostramos la matriz de correlaciòn por mètodo de pearson

> MC.cor<-cor(Com2, method = "pearson")


> MC.cor
># Se muestra la grafica de la correlaciòn

> corrplot(MC.cor)

5
3. Usando el comando Boxplot encuentre los datos atípicos de la tabla de

datos EvaluaProducto.csv.

> boxplot(MC.cor,horizontal=T)

4. Para tabla de Datos del archivo Productos.csv el cual contiene, los

registros de las ventas por producto y por trimestre del año 2016 de un

supermercado. Usando el comando plot de R, grafique (en un mismo gráfico) las

series de valores de las ventas de los 4 trimestres.

6
> library(readxl)
> Poducto <- read_excel("C:/Users/JOSE
MERCADO/Desktop/Poducto.xlsx")
> View(Poducto)
> library(ggplot2)
Excel = read_xlsx(file.choose(),sheet=1)
> DatoP<-
data.frame(Excel$Producto,Excel$Trim1,Excel$Trim2,Excel$Trim3,E
xcel$Trim4)
> head(DatoP)

> plot(Excel$Trim1,Excel$Trim2, type = "l")


> plot(Excel$Trim1,Excel$Trim3, type = "l")
> plot(Excel$Trim1,Excel$Trim4, type = "l")
> plot(Excel$Trim1,Excel$Trim2, main = "Comparacion de
trimestres",xlab = "Trim1", ylab="Excel", type = "l")
> lines(Excel$Trim1,Excel$Trim3,lty="dashed")
> lines(Excel$Trim1,Excel$Trim4,lty="dotted")
> labels<-c("Trim2","Trim3","Trim4")
> legend("topright",legend = labels, cex=0.6,
inset=0.01,pch=NULL,lty = c(1,2,3))

7
5. Para tabla de Datos del archivo Temperaturas.csv el cual contiene las

temperaturas máximas y mínimas registradas en España durante los años 2014 y

2015. Usando el comando plot de R, grafique (en un mismo gráfico) las series de

valores de las 4 columnas.

> temperaturas<-
read.csv("Temperaturas.csv",header=T,sep=",",dec=".")
> view(temperaturas)
>
plot(temperaturas$Max2015,type="b",col="black",lwd=2,xlab="x",y
lim=c(50,320),ylab="Cantidad",main="Ejercicio 4")
> lines(temperaturas$Max2016,col="orange",type="b",lwd=2)
> lines(temperaturas$Min2015,col="blue",type="b",lwd=2)
> lines(temperaturas$Min2016,col="green",type="b",lwd=2)
>
legend("topright",legend=c("Max2015","Max2016","Min2015","Min20
16"),lty=1,lwd=2,pch=21,col=c("black","orange","blue","purple")
,ncol=2,bty="n",cex=0.8,text.col=c("black","orange","blue","pur
ple"),inset=0.01)

8
6. Utilice la tabla de datos de Compras.csv, realice 2 gráficos con ggplot2,

explique la interpretación del gráfico y los parámetros de la función ggplot.

Excel = read_xlsx(file.choose(),sheet=1)
> Datoc<-
data.frame(Excel$Cliente,Excel$Tienda,Excel$Genero,Excel$Juguet
es,Excel$Hogar)
> library(ggplot2)
ggplot(data=Datoc,mapping=aes(x=Excel$Cliente,y=Excel$Juguetes)
)+geom_point()+labs(title = "Juguetes vs Cliente")

Excel = read_xlsx(file.choose(),sheet=1)
> Datoc<-
data.frame(Excel$Cliente,Excel$Tienda,Excel$Genero,Excel$Juguetes
,Excel$Hogar)
> library(ggplot2)

>ggplot(data=Datoc,mapping=aes(x=Excel$Cliente,y=Excel$Hogar))

+geom_point()+labs(title = "Hogar vs Cliente")

9
Parámetros de la función ggplot: ggplot(data = 'nombre del fichero de datos') +
geom_nombre1(aes(aesthetics1=var1, aesthetics2=var2, ...)) + geom_nombre2(...) El
comando ggplot se usa para generar el sistema de coordenadas rectangulares y
posteriormente vamos añadiendo los geoms con sus correspondientes aesthetics .

Al analizar los gráficos se puede inferir que presentan una estructura de asociación
entre la variable cliente vs hogar y poca asociación entre las variables cliente vs
juguetes ya que presentan más dispersión y datos atípicos.

Conclusiones

En esta unidad de estudio se aprendió a utilizar las herramientas básicas del software
R como un lenguaje de programación de código abierto, desde los conceptos
básicos, hasta la definición y aplicaciones de funciones de alto y bajo nivel para
desarrollar gráficos estadísticos. En la aplicación de los conceptos fundamentales y la
elaboración de código de R y Rstudio se van robusteciendo en cada aplicación y
resolución de problemas la aplicación y elaboración de gráficas, como gráficos de
dispersión, boxplot, gráficos multilíneas y gráficos en 3d entre otros para un mejor
entendimiento en la manipulación y comprensión de datos estadísticos que se
obtienen en forma masiva en el mundo actual.

Fuentes:

Gouveia, R. G. (2021). Cómo graficar en R con RStudio . Obtenido de


https://www.youtube.com/watch?v=bYxjgO2dkXI

Juan Carlos Correa, N. G. (2002). Gráficos Estadísticos con R. Obtenido de


https://cran.r-project.org/doc/contrib/grafi3.pdf

R., C. (2022). Grafico en R. Obtenido de https://r-coder.com/directorio-trabajo-r/

Paradis., E. (2003). R para principiante. Paris: Universidad de Mompellier.

10

También podría gustarte