Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5
¿Por qué utilizar R y Rstudio?
▸ Puede leer prácticamente cualquier tipo de datos y
dispone de una gran colección de herramientas
para análisis.
▸ Es gratuito.
6
▸ Manejo y almacenamiento efectivo de los datos.
Utilidades gráficas para la visualización de datos.
7
¿Por qué R es tan usado en
Big Data?
▸ Crea dashboards para visualizar y analizar datos.
1. Editor de código
3. visualizador de carpetas,
librerías y gráficos
2. Consola de R
Modificar el ambiente de Rstudio
Modificar la apariencia del
ambiente de Rstudio, cambiar el
diseño del paneles y la codificación
del Script.
Para hacer uso de la funciones de una librería, esta debe activarse siempre que
se inicie sesión de R.
o install.packages("nombreLibreria") #Instalar librerías
o library (nombreLibreria) #Cargar librería
o detach("package:nombreLibreria", unload =TRUE)#Desactivar
o remove.packages("nombreLibreria") #Desinstalar
17
Librerias q u e utilizaremos
▸ Otras librerías
▹ forcats #Transformar y trabajar con variables categóricas
▹ openxlsx #Importar y exportar archivos ‘.xlsx’
▹ plyr #dividir-aplicar-combinar tablas de datos
▹ data.table #Ofrece rápida y eficiente memoria: lectura y escritura de
archivos
▹ Foreign #Importar y exportar archivos ‘.sav’, ‘.dta’.
18
Mi primer Script en Rstudio
#Establecer un directorio de trabajo
setwd("C:/Users/Administrator/Documents")
getwd() #ver el directorio actual choose.dir() #Elegir una carpeta
#Renombrar la carpeta
file.rename("Introducción a R_prueba", "Introducción a R")
#Renombrar archivos
file.rename( file.path("Introducción a R", "Clase 1", "script.R"),
file.path("Introducción a R", "Clase 1", "Mi primer script.R") )
#Copiar archivos
file.copy( file.path("Introducción a R", "Clase 1", "Mi primer script.R"),
file.path("Introducción a R", "Clase 2", "Mi primer script.R") ) 21
Mi primer Script en Rstudio
#Remover archivos
file.remove( file.path("Introducción a R", "Clase 2", "Mi primer script.R") )
#Remover carpetas
unlink("Introducción a R", recursive =TRUE)
22
Tipos de datos
str(3)
str("tres")
str(TRUE)
mode(3)
mode("tres")
*Un dato es una representación simbólica de un atributo o variable cuantitativa o cualitativa
24
Operadores
Los operadores son los símbolos que le indican a R que debe realizar una
tarea. Combinando datos y operadores es que logramos que R haga su trabajo.
Aritméticos
25
Operadores
Relacionales
Al usar los operadores >, >=,<y <=con cadenas de texto, estos tienen un comportamiento especial.
Por ejemplo,"casa"!="barco“nos devuelve TRUE
26
Operadores
lóg icos
|devuelve TRUEsi alguno de los datos es TRUE |solo devuelve FALSE si ambos datos son FALSE
& solo devuelve TRUE si ambos datos es TRUE &devuelve FALSE si alguno de los datos es FALSE
27
Operadores
De asignación
Esta operación nos permite “guardar” el resultado de operaciones, de modo que
podemos recuperarlos sin necesidad de realizar las operaciones otra vez.
Aunque podemos usar el signo igual para una asignación, a lo largo de este curso
utilizaremos <-, por ser característico de R y fácil de reconocer visualmente.
28
E s tructura de datos
Las estructuras de datos son objetos que contienen datos. Cuando
trabajamos con R, lo que estamos haciendo es manipular estas
estructuras.
29
Vectores
Un vector es la estructura de datos más sencilla en R. Un vector es una colección
de uno o más datos del mismo tipo y solo tiene una dimensión (largo).
31
Matriz
Para crear matrices se utiliza como información la cantidad de películas realizadas
por Warner, Disney y Fox durante el periodo 2010-2018.
matriz(data, contenido
nrow=1 número de filas
#Crearmatriz a partir de vectores
ncol=1) número de columnas
matriz_peliculas <-
matrix(c(warner,disney, fox),
#Crear vectores para las columnas dela matriz nrow =9,
warner <-c(20, 20, 16, 17, 17,22, 17, 18, 19) ncol =3)
disney <- c(11, 13, 11, 8, 12, 11, 12, 8, 10)
fox <- c(18, 15, 15, 15, 16, 17, 15, 13, 11)
32
Matrices
#Cambiar los nombres a la matriz
colnames(matriz_peliculas)<- c("warner","disney","fox")
rownames(matriz_peliculas)<-c(2010:2018)
seq(from=2010,to=2018,by=1)
33
Data frame
Los data frames (DT) son estructuras de datos de dos dimensiones (rectangulares)
que pueden contener datos de diferentes tipos, por lo tanto, son heterogéneas.
• En un DT podemos encontraruna
columna con caracteres, otra con
números y otras con variables lógicas.
34
Data frame
Para crear un DT se utiliza datos de películas de Shrek. Como primer paso se
guarda en vectores la información del nombre, puntuación y si la película fue
posterior al año 2005.
Una de las opciones para crear data frames es unir vectores con la función data.frame().
peliculas_df <-
Los vectores si o si deben contener
data.frame(nombre, columna1 lamisma cantidad de datos
puntuacion, columna2
posterior_2005) columna3
35
Data frame
#Cambiar los nombres a la matriz
names(peliculas_df )<- c("TITULO_PELICULA","PUNTUACION","POSTERIOR2005")
#Seleccionarelementosde un DT
Al igual que en matrices, se seleccionar un elemento, filas o columnas. La diferencia es que
para la selección también puede utilizar el símbolo $.
peliculas_df[1,2]
peliculas_df[1,"PUNTUACION"]
peliculas_df[c(1,2),c("TITULO_PELICULA","PUNTUACION")]
peliculas_df[1,]
peliculas_df[,2]
peliculas_df[,"PUNTUACION"]
peliculas_df$PUNTUACION 36
Listas
Las listas permiten agrupar o contener dataframes, matrices y vectores en una
misma variable.
37
Listas
Para crear una lista utilizamos la función list() y pasamos como argumentos los
elementos que queremos incluir. Podemos cambiar los nombres utilizando la
función names()
lista_curso <-list(peliculas_df,matriz_peliculas)
names(lista_curso) <-c("DT","matriz")
#SeleccionarDT de la lista
lista_curso[["DT"]] #Se recomienda utilizar esta opción
lista_curso$DT #No recomiendo usar esta opción porque confunde con DT
38
Funcionesbásicas
#Determinarmínimoy máximo
min(ingresos) max(ingresos)
#Calcularel promedio
suma/numero_hogares
Son iguales
mean(ingresos)
Operaciones aritméticas
#La función summaryproporciona los principalesestadísticos
summary(ingresos)
Si contrastamos estas cifras con el ingreso familiar mensual publicado en el enero de 2021
por el Instituto Nacional de Estadística y Censos del Ecuador (USD 746,67), encontramos
diferencias significativas. Esto se debe a que en nuestros datos encontramos un hogar con
un ingreso atípico o extremo para un barrio medio.
Operaciones aritméticas
#Ante valores extremosse recomiendausar lamediaacotada
mean(ingresos,trim =0.05)
El 5%de los datos son
eliminados de los extremos
ingresos <- c(490, 560, 600, 620, 650, 655, 660, 670, 700, 710, 717, 720, 742, 750, 750, 775,
800, 810, 820, 6000)
Operaciones aritméticas
#Comotrabajar operaciones conundata frame
df_ingresos <- data.frame(VAR_INGRESO=ingresos)
range(df_ingresos$VAR_INGRESO)
median(df_ingresos$VAR_INGRESO)
mean(df_ingresos$VAR_INGRESO,trim=0.06,na.rm=T)
summary(df_ingresos$VAR_INGRESO)
RECUERDA: conlafunciónsummary
nose puede acotarla media
44
Atajos de teclado para Rstudio
Alt activar la barra de menú.
Alt +primer carácter que compone la barra de menú activar submenú
Esc desactivar barra de menú.
Ctrl +3 acceder a la ayuda.
Ctrl +4 acceder al historial de los comandos ejecutados.
Ctrl +5 visualizar los archivos y carpetas que componen el sistema.
Ctrl +6 nos lleva a la pestaña plot.
Ctrl +7 nos lleva a la pestaña packages.
Ctrl +8 nos lleva a la pestaña environment.
Ctrl +L limpiar la consola
45
Atajos de teclado para Rstudio
Ctrl +Shift +N crear un nuevo script.
Ctrl +Shift +Tab navegar (der. a izq.) entre los script o archivos (pestaña).
Ctrl +Tab navegar (izq. a der.)entre los script o archivos.
Ctrl +Enter ejecutar una función.
Ctrl +A seleccionar todas las funciones dentro de un script.
Ctrl +W cerrar una pestaña en especifico.
Ctrl +Shift +W cerrar todas las pestañas.
Ctrl +O buscar un archivo de R (script o dataset) en especifico.
Ctrl +S guardar un script.
Ctrl +Q cerrar sesión de R.
46
Importar – exportar archivos
#Dependiendodelformato existenvarias librerías para importar y exportar archivos
Librerías
Archivos openxlsx readxls data.table readr utils haven foreign
read.xlsx() read_excel()
Excel (.xlsx) write.xlsx()
fread() read_csv() read.csv()
Plano (.csv) fwrite() write_csv() write.csv()
fread() read_delim() read.delim()
Plano (.txt) fwrite() write_delim() write.csv()
read_stata() read.dta()
Stata (.dta) write_stata() write.dta()
read_sav() read.spss()
SPSS (.sav) write_sav()
read_sas()
SAS (.sas) write_sas()
Ya sea para importar o exportar, todas las funciones como mínimo exigirán el nombre del
archivo y la extensión del mismo. 47
Unir data frames
Función rbind()
Función cbind()
48
Unir data frames
Necesitan un id para unir las tablas. En el
ejemplo el id es la variable “x1”. No obstante, en
la práctica el Idpoder ser una o mas variables.
49