Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEMAS A TRATAR
1. Presentación de R 9. Abrir y exportar bases de datos
2. Instalación 10. Base de datos especial
3. Manejo de interfase 11. Exploración inicial de los datos
4. Espacio de trabajo 12. Modificación de bases de datos
1. Working directory • Crear, filtrar, agrupar, extraer
2. Packages 13. Análisis univariado
5. R como calculadora 14. Análisis bivariado
6. Creación y tipos de objetos 15. ggplot2
7. Gráficos de base
8. Funciones básicas
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
TEMAS DE LA SESIÓN 1
1. Presentación de R
2. Instalación
3. Manejo de interfase
4. Espacio de trabajo
1. Working directory
2. Packages
5. R como calculadora
6. Creación y tipos de objetos
7. Gráficos de base y distribución
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
Matlof N. The art of R programming. A tour of statistical software design. San Francisco: No Starch Press; 2011.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
FLUJO DE DATOS
Matlof N. The art of R programming. A tour of statistical software design. San Francisco: No Starch Press; 2011.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
INSTALACIÓN DE R
4
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
INSTALACIÓN DE RSTUDIO
3
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
Editor
INTERFACE DE RSTUDIO Ambiente
Consola Salida
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
EDITOR
# para escribir
Favorece el seguimiento de
los datos
CTRL + Shift + N
CTRL + ENTER
AMBIENTE
CONSOLA
SALIDA
WORKING DIRECTORY
• Es la ubicación en donde R va a buscar todos los archivos externos
solicitados en el script
• > getwd()
• Opciones:
• Salida: ubicar la carpeta -> configuración -> Set As Working Directory
• Barra de opciones -> Session -> Set As Working Directory
• > setwd()
• Recomendaciones:
• Establecer la ruta de acceso en el script
• Usar rutas de acceso parciales al buscar archivos en las carpetas
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
PAQUETES
PAQUETES RECOMENDADOS
tidyverse
Para instalar paquetes: ggplot2, tibble, tidyr, readr
• > install.packages() purrr, dplyr, stringr, forcats
• Otras opciones: summarytools
• Salida: Packages -> Install swirl
• Barra de opciones -> Tools -> Install Packages foreign
openxlsx
epitools
Para activar paquetes: epiR
• > library()
• Otra opción: install.packages("remotes")
• Salida -> Packages -> □ install_github("GuangchuangYu/nCov2019")
library(nCov2019)
x <- get_nCov2019(lang='en')
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
COMANDOS EN R
• R es un lenguaje de expresión con una sintaxis muy simple:
• Diferencia mayúsculas y minúsculas
• Los símbolos aceptados dependen del encoding (UTF-8)
• Idealmente lo más sencillo possible
• Acepta ‘.’ y ‘_’
• los nombres inician con ‘.’ o letras
• Si inicia con ‘.’ debe seguirse de letras
• Comandos elementales: expresiones (print-and-lost) o asignaciones
• Separados por ‘;’ o líneas de texto
• Pueden agruparse en una expression con ‘{‘ y ‘}’
• Comentarios iniciando con ‘#’
• Comando incomplete: ‘+’
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
VECTORES Y ASIGNACIONES
• Operador de asignación: (‘<-’ o ‘->’)
• Atajo: ALT+’-’
• En muchos casos ‘=‘ es una alternativa, pero idealmente se debe evitarlo y dejarlo para
sus funciones específicas y evitar futuras confusiones
EXPRESIONES ARITMÉTICAS
• > v <- 2*y + y + 1 #vector de longitud 11
• Suma cada elemento incluido entre ellos mismos
• 2*x repetida 2.2 veces
• y sin repetición
• 1 repetido 11 veces
• Operadores aritméticos frecuentes:
• + - * / ^
• log, exp, sin, cos, tan, sqrt, min, max,
• range(x) = vector de 2 elementos c(min(x), max(x))
• length(x) = número de elementos incluídos en x
• sum(x) = total de los elementos en x
• prod(x) = producto de los elementos en x
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
sum(x)/length(x) = mean(x)
sum((x-mean(x))^2)/(length(x)-1) = var(x)
order() o sort.list()
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
‘d’ = densidad ‘p’ = CDF ‘q’ = cuantil ‘r’ = simulación (random deviates) INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
Distribuciones
estadísticas
u <- runif(100,100,1000)
n <- rnorm(100,100,1000)
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
?par
hist(B1,col=___,xlim=c(450,5050))
hist(B2,col=“___",xlim=c(450,5050))
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
Algunos comandos que reciben un vector de números y genera una
estadística…
• min = mínimo; • sd = desv.estándar;
• max = máximo; • var = varianza;
• quantile = cuartiles;
• range = mínimo y máximo;
• summary = varios estadísticos
• mean = media;
• median = mediana;
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
• Operadores lógicos
• < <= > >= == !=
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
VALORES FALTANTES
• NA = valores faltantes en el vector
• NaN = valores ilógicos dados numéricamente (0/0)
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
AIUDAAAA
• Para funciones específicas: • Para buscar ayuda en varias formas:
• > help(nombre) • > help.search(nombre)
• > ?nombre • > ??nombre
• Para caracteres especiales • Para buscar ejemplos en un tema
usar comillas: específico:
• > help(‘[[‘) • > example(tema)
• Para abrir buscador web con • Otros sistemas de ayuda disponibles
hipervínculos de conceptos en Windows:
principales: • > ?help
• > help.start()
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
VECTOR DE CARACTERES
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
• > attributes(nombre)
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
FACTORES
• Objetos utilizados para especificar una clasificación discreta de los
componentes de otros vectores de igual longitud.
• > levels(factor)
• > tapply(obj, fact, func) #aplica funciones a cada grupo (de uno o más
tipos) del primer elemento separado por niveles
• > table() #tabla de frecuencias para factores de igual longitud
• > cut() #agrupa variables numéricas
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
¿¿¿Diferencias???
LISTAS
• Lista: conjunto ordenado de objetos conocidos como componentes
• Lst <- list(name="Fred", wife="Mary", no.children=3, child.ages=c(4,7,9))
• Lst <- list(name_1=object_1, ..., name_m=object_m)
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO
FÓRMULAS
• respuesta ~ op_1 term_1 op_2 term_2 op_3 term_3 ...
Venables WN, Smith DM. An Introduction to R. Notes on R: A Programming Environment for Data Analysis and Graphics versión 3.6.1. 2019.
INTRODUCCIÓN A R
DANIEL VASQUEZ BOTERO