Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Instalación
Este manual asume que tiene R y RStudio instalados en su computadora.
Fundamentos de RStudio
RStudio tiene cuatro paneles:
Arriba a la izquierda: el editor. Este panel se cerrará cuando inicie RStudio. Aquí
puede editar y ejecutar scripts. El editor tiene un botón para ejecutar la línea o
selección actual, y un botón para ejecutar todo el script.
Abajo a la izquierda: la consola. Aquí puede ingresar comandos o depurar su código.
Arriba a la derecha: entorno e historia.
Abajo a la derecha: archivos, tramas y ayuda.
Para obtener ayuda sobre una función, escriba el nombre de la función con un signo de
interrogación al frente:
?data.frame
Si no encuentra documentación, puede intentar:
??data.frame
R paquetes
Los paquetes R son bibliotecas de código reutilizables. Para instalar y cargar paquetes desde
la consola (por ejemplo, el paquete ggplot2 R), haga lo siguiente:
install.packages("ggplot2")
library(ggplot2)
Esto solo funciona para paquetes que se publican en CRAN . Hoy en día los paquetes se
publican a menudo en GitHub. Para instalar esos paquetes, podemos usar
la install_githubfunción en el devtoolspaquete. Aquí usamos la sintaxis de dos puntos para
cargar automáticamente el devtoolspaquete.
install.packages("devtools")
devtools::install_github("ropensci/rgbif")
Tenga en cuenta que varios paquetes incluyen una viñeta, que le brinda una introducción al
estilo del tutorial del paquete R. Para ver las viñetas de, por ejemplo, ggplot2, haz:
browseVignettes(package="ggplot2")
Tipos de datos
Generalmente, al hacer la programación en cualquier lenguaje de programación, necesita usar
varias variables para almacenar información diversa. Los tipos de datos utilizados
frecuentemente para almacenar variables son:
Vectores
Matrices
Marcos de datos
Liza
Factores
Vectores
Los vectores son la estructura de datos más básica en R. Estas son listas ordenadas de
valores de una determinada clase, como numérica, de caracteres o lógica. Los valores únicos
son vectores de longitud 1:
> a <- 1
> a
[1] 1
> class(a)
[1] "numeric"
> length(a)
[1] 1
> b <- "banana"
> b
[1] "banana"
> class(b)
[1] "character"
> d <- FALSE
> d
[1] FALSE
> class(d)
[1] "logical"
> a <- c(1, 2)
> a
[1] 1 2
> b <- seq(1, 10)
> b
[1] 1 2 3 4 5 6 7 8 9 10
> length(b)
[1] 10
Un vector vacío se conoce como NULLo c().
Matrices
Las matrices son estructuras de datos bidimensionales. De nuevo, todos los elementos son de
la misma clase.
Marcos de datos
En marcos de datos, las columnas pueden ser de diferentes clases.
$b
[1] 1
Tres formas diferentes de acceder al segundo elemento "b"
> l$b
[1] 1
> l[[2]]
[1] 1
> l[["b"]]
[1] 1
Archivos de Excel
Los archivos de Excel se pueden leer y escribir usando los paquetes xlsx y
openxlsx. Dependiendo de la configuración de su sistema, puede experimentar problemas al
instalar cualquiera de estos paquetes (por ejemplo, xlsx tiene una dependencia de Java). Los
paquetes de openxlsx requieren una versión R reciente.
install.packages("openxlsx")
library(openxlsx)
read.xlsx()toma dos parámetros: el nombre del archivo de Excel y la hoja que desea leer. La
hoja puede ser un nombre o un índice, en este caso 1para leer la primera hoja.
library(openxlsx)
data <- data.frame(x = 10:15, y = 40:45) # generate some data
write.xlsx(data, "data.xlsx", sheetName = "intro", row.names = FALSE) # write to
Excel
data2 <- read.xlsx("data.xlsx", 1)
data2 <- read.xlsx("data.xlsx", sheet = "intro")
Archivos ZIP
Este ejemplo muestra cómo descargar un archivo ZIP y leer uno de los archivos que contiene:
Shapefiles
Shapefiles se pueden leer usando el rgdalpaquete. El siguiente ejemplo también transforma
los datos, por lo que se puede visualizar fácilmente usando ggplot2:
library(maptools)
library(rgdal)
library(ggplot2)
download.file("http://iobis.org/geoserver/OBIS/ows?service=WFS&version=1.0.0&req
uest=GetFeature&typeName=OBIS:summaries&outputFormat=SHAPE-ZIP", destfile="summa
ries.zip")
unzip("summaries.zip")
# for this example, convert back from data frame tbl (dplyr) to standard data fr
ame
data <- as.data.frame(data)
data
head(data)
print(data, n = 100)
Manipulando datos
Filtración
library(robis)
library(dplyr)
Reordenando
data %>% arrange(datasetName, desc(eventDate))
Agregación
data %>% summarise(lat_mean = mean(decimalLatitude), lat_sd = sd(decimalLatitude
))
data %>% group_by(scientificName) %>% summarise(records=n(), datasets=n_distinct
(datasetName))
install.packages("vegan")
install.packages("reshape2")
library(vegan)
library(reshape2)
El conjunto de datos que usaremos es el conjunto de datos BCI, estos son conteos de árboles
en parcelas en la isla Barro Colorado. Cargue los datos con data():
data("BCI")
Cada fila en esta matriz representa un diagrama. Esta matriz no tiene una columna para
nombres de sitios / parcelas, así que agreguemos que:
> head(long)
plot scientificName count
1 1 Abarema.macradenia 0
2 2 Abarema.macradenia 0
3 3 Abarema.macradenia 0
4 4 Abarema.macradenia 0
5 5 Abarema.macradenia 0
6 6 Abarema.macradenia 0
library(robis)
library(reshape2)
Trazando
En este ejemplo, los datos para una especie se extraen de un conjunto de datos OBIS. La
densidad y la profundidad se visualizan utilizando el ggplot2paquete:
library(robis)
library(dplyr)
library(reshape2)
library(ggplot2)
Cartografía
El leafletpuede usarse para crear mapas interactivos basados en la web. El siguiente
ejemplo muestra los resultados de un análisis atípico de ocurrencias
de estrognemia de Verruca :
library(leaflet)
m <- leaflet()
m <- addProviderTiles(m, "CartoDB.Positron")
m <- addCircleMarkers(m, data=data.frame(lat=data$decimalLatitude, lng=data$deci
malLongitude), radius=3, weight=0, fillColor=colors, fillOpacity=0.5)
m