Está en la página 1de 8

Manual de Usuario para el Lenguaje R

El objetivo Principal de este pequeño manual es proporcionar un material comprensible y estructurado a


todos aquellos que deseen introducirse en la estadística a través de la herramienta R. Pretendemos que
sirva de ayuda para entender, tanto el lenguaje de programación como los contenidos de la materia y que
los diferentes ejemplos propuestos contribuyan a hacer más amena la lectura y comprensión.

SESION 1: El software R y primeros pasos

El programa permite interactuar con el computador, pasos a paso, según los resultados que son mostrados
en la consola, es decir que puede uno monitorear los procesos.

Una lista de ordenes pueden ser escritos en el editor RStudio con un archivo en ASCII con extensión “.R”
y ser ejecutado mediante el botón especifico “run”.

EL Programa R opera bajo diferentes plataformas: Windows, Linux, Unix y Mac. Las órdenes de
ejecución de los procedimientos son las mismas en cada plataforma, la diferencia está en la instalación y
en algunas funciones de menú que presenta cada versión.

Como entorno de programación básicamente se trata de una consola (ventana de trabajo) sobre la que se
van introduciendo scripts (instrucciones más o menos complejas) que se ejecutan sobre los datos
previamente cargados (conjuntos o ventanas de datos).

En la consola de R se pueden iniciar distintas sesiones de trabajo (denominadas áreas de trabajo), que
podemos grabar para retomar con posterioridad en el punto que lo dejamos, y sobre las que se van
cargando y guardando no sólo los scripts que requerimos a R, sino todos aquellos paquetes de datos que
previamente hemos cargado o leído, por lo que se convierte en un entorno de trabajo muy funcional y
práctico.

Además, no sólo se pueden guardar las áreas de trabajo que vayamos abriendo con R, sino que también
podemos guardar las ventanas de datos como archivos R o los propios scripts que hayamos programado
como objetos de R, o incluso las gráficas que vayamos generando en formatos gráficos totalmente
compatibles. Esto aporta una gran versatilidad al programa.

• Instalación de R:

Ingresar a la dirección de Internet: HYPERLINK


"http://cran.r-project.org/bin/windows/base/"https://cran.r-project.org/bin/windows/base/R-4.3.2-
win.exe HYPERLINK "http://cran.r-project.org/bin/windows/base/"/ seguidamente iniciara el
proceso de descarga de la versión “R HYPERLINK
"http://cran.r-project.org/bin/windows/base/R-3.1.2-win.exe"4 HYPERLINK "http://cran.r-
project.org/bin/windows/base/R-3.1.2-win.exe". HYPERLINK
"http://cran.r-project.org/bin/windows/base/R-3.1.2-win.exe"3 HYPERLINK "http://cran.r-
project.org/bin/windows/base/R-3.1.2-win.exe".2 HYPERLINK
"http://cran.r-project.org/bin/windows/base/R-3.1.2-win.exe"for HYPERLINK "http://cran.r-
project.org/bin/windows/base/R-3.1.2-win.exe" Windows”, entonces ejecute el archivo para
comenzar a instalar; si en caso usted no es administrador de la máquina instálelo en el disco
“D:/” de lo contrario instálelo en cualquiera de los discos (todo por defecto).
• Instalación de RStudio:

Ingresar a la dirección de Internet: HYPERLINK


"http://www.rstudio.com/products/rstudio/download/"https://download1.rstudio.org/electron/
windows/RStudio-2023.12.1-402.exe HYPERLINK
"http://www.rstudio.com/products/rstudio/download/"/ seguidamente iniciara el proceso de
descarga de la versión “RStudio 2023.12.1-402- Windows XP/Vista/7/8,10,11”, entonces ejecute
el archivo para comenzar a instalar; si en caso usted no es administrador de la máquina instálelo
en el disco “D:/” de lo contrario instálelo en cualquiera de los discos (todo por defecto). El
programa detectará la configuración de la instalación de R para poder hacer el emparejamiento,
por lo que es importante 1ro instalar R y después el editor RStudio.

Se debe tomar en cuenta que estos enlaces pueden cambiar a medida que aparezcan nuevas
versiones o actualizaciones, por lo que lo recomendable es instalar siempre las versiones más
recientes de R y RStudio para evitar algún conflicto.

• Manejo del editor Rstudio.

Ejecutar el programa RStudio y concentrarse en el área de trabajo “Editor de comandos”, el cual


se puede apreciar a continuación:
En la parte superior del programa se puede apreciar un símbolo circular de color verde que al
hacer clic ofrece distintos formatos a editar, pero nosotros escogeremos “R Script”, el cual abrirá
una hoja en blanco, y es ahí donde escribiremos todos nuestros comandos o scripts.

Una vez dentro del editor, comenzaremos a escribir nuestros comandos y para ejecutarlos se
puede pulsar a la vez “CTRL + ENTER” o hacer clic en el botón “Run” (se encuentra en la parte
superior derecha del editor de comandos)

Para la instalación de paquetes se usa la sub-ventana inferior derecha haciendo clic en la solapa
“packages”, y después en el enlace “Install packages”, seguidamente escribiremos en el campo de
texto el nombre del paquete solicitado, por ejemplo “RODBC”.

• Comandos básicos.

Los objetos en R están formados por vectores, matrices, textos, tablas y todo elemento que puede
ser manipulado por R. Un conjunto de objetos puede ser integrado en una lista como objeto de R.

El nombre de los objetos es muy sensible a mayúsculas y minúsculas, así como cualquier orden
en R. Por ejemplo “print” existe, pero “PRINT” no existe. Por lo general son minúsculas, en
pocos casos se utiliza mayúsculas, para esto es necesario conocer la sintaxis apropiadamente.
Para comentar cualquier script solo se antepone el símbolo “#”, el cual es muy útil para
documentar lo que se está haciendo.

En la consola (donde aparecen los resultados de los códigos ejecutados) aparece el siguiente
símbolo: “>” el cual indica que existo una línea de código ejecutada, mientras que el símbolo “+”
indica que hay varias líneas ejecutadas, pero que por el espacio aparece en la siguiente línea más
abajo.

Si aparece este símbolo en rojo “stop”, indica que alguna ejecución de código se mantiene
ejecutando (ejem: cargando un archivo muy pesado), por lo que se debe esperar que finalice antes
de proseguir con otra ejecución de código, o también se puede finalizar si en caso el programa no
responda.

• objetos y operaciones muy sencillas.

a<-2
a*a
a^2
sqrt(a)
exp(a)
a1<-a^a
Los objetos cada vez pueden ser más complejos según sea la composición y necesidad a procesar,
es el caso de los vectores:

## vector con valores numéricos


b<-c(1,2,4,6,5,3)
#b<-1:6 equivalente pero en orden
b*b
b^2
sqrt(b) # función de la raíz cuadrada
exp(b) # exponente
b^b
b1<-sort(b)
sd(b)

# creado el objeto, se puede hacer algunas estadísticas:


min(b)
max(b)
mean(b)
mean(b, na.rm = TRUE)
sd(b)
summary(b)

## vector con valores categóricos

b3<-c("a","b","c","a","b","b","b")
table(b3)

Se ha notado que muchas de estos comandos usan la siguiente composición


“nombre(argumento1, argumento2,..)” lo que indica que se está utilizando una función, las cuales
ya están definidas en la programación base de R, pero hay muchas otras que depende de un
paquete específico, y también se pueden crear funciones según el objetivo del procesamiento, lo
cual se verá más adelante.

Cuando es necesario manejar otro nivel de información a procesar se puede considerar crear
matrices:

##

c<-matrix(0,2,3)
fix(c)
c

c<-matrix(b,2,3)
c+c
c1<-c%*%t(c) # multiplicación clásica de matrices
det(c1)
c1/2
c1/a
mean(c)
summary(c)
c[1,2] # fila 1 y columna 2, se indica la posición
c[1,2]<-1

Para manipular muchos objetos dentro de un solo objeto se denomina inserción en una lista,
donde tales sub objetos insertados pueden tener distintas formas, pero se debe tener cuidado de
manipular este tipo de objeto especial ya que puede generar problemas con la velocidad del
procesamiento en un análisis más complejo.

L1<-list(1) # se crea una lista con un solo valor


L1[[1]]<-a
L1[[2]]<-b
L1[[3]]<-c

Cuando se generan objetos estos aparecen en la sub ventana superior derecha “workspace”, donde
te indica la composición y tipo de objeto.

Cada vez que ingrese a una nueva sesión de trabajo, localizar el lugar (fólder) para el manejo de
su información

setwd("D:/micarpeta") # define el #directorio a trabajar


getwd() # indica que directorio se está utilizando actualmente

• Extracción y manipulación de datos.

Según el tipo de formato que se necesita trabajar, R se adapta mediante paquetes especiales la
carga de datos en su consola, tal es el caso de Excel.

##
setwd("D:/Curso de R")
datos<-read.table("datos.txt",header=TRUE)
datos<-read.csv("datos.csv",header = TRUE,sep=",")
head(datos)

• Manipulación total de datos.

# caso cuantitativo
print(b)
b[3]
b[3] <- 3 # solo cambia en el índice

b[b<=3]
b[b<=3] <- 9 # cambia en todos los valores de la condición

# caso cualitativo
A[A=="a1"]

datos[1:10,]
datos[,1]
datos[,2:9]
datos1=datos[,-1]
# Aplicación de los datos cargados
A <- as.factor(datos[,1])
vars <-datos[,2:9]
n1=ncol(vars)
nombres=colnames(vars)

## operaciones por columna o fila (manejo de argumentos)


apply(datos1,1,mean)
apply(datos1,2,mean)

# Sub conjunto con 2 condicionales


subset(datos, Bact.== "a8" & LONG.RAD > 1)
subset(datos, Bact.!= "a8" & LONG.RAD > 1)
subset(datos, PF.PLTA < 20 & LONG.RAD > 1)
S1<-subset(datos, PF.PLTA < 20 | LONG.RAD > 1) ## asignando al objeto

## pivot table
aggregate(datos[,2],list(Factor=datos[,1]),mean)

Trabajo 1: ¿Cuál será la varianza de cada tratamiento (bacteria) si no se consideran las 2 primeras
bacterias y además se deben eliminar las plantas con alturas mayores a 2.2cm?

• Obteniendo ayuda en RStudio.

Para la búsqueda de ayuda se usa la sub ventana inferior derecha haciendo clic en la solapa
“Help”, seguidamente escribiremos en el campo de texto el nombre de la palabra solicitada, por
ejemplo “mean”.

• Programando en R.

Para poder programar es necesario conocer procedimientos de lógica y manipulación de objetos,


los cuales no varían mucho sea el lenguaje de programación que se utilice, pero para el caso de R
muchos de tales procedimientos están flexibilizados, en otras palabras es muy sencillo de
programar en R usando RStudio.

a
a1
if(a<a1){print("a es menor que a1")}else{"b es menor que a1"}
# tener cuidado cuando no se cumple la condición

# caso 1
for(i in 1:10)
{
K=i*1
print(K)
}
# caso 2
for(i in 1:10)
{
if(i==4)
{
next # pasa al siguiente sub indice
}

K=i*1
print(K)
}

# caso 3
for(i in 1:length(b1))
{
if(b1[i]<mean(b1))
{
print(b1[i])
}else
{
print("valor mayor que la media")
}
}

for(i in 1:length(b1))
{
if(b1[i]<mean(b1))
{
print(b1[i])
}else
{
print("valor mayor que la media")
break # corta el bucle
}
}

i=1
while(i <= length(b1))
{
if(b1[i]<mean(b1)){print(b1[i])}
i=i+1
}

# caso 1 argumento
f1=function(vec)
{
d=vec[length(vec)]-vec[1]
return(d)
}
f1(b1)

# caso 2 o mas argumentos


f1=function(vec,M)
{
d<-vec[length(vec)]-vec[1]
d<-d*M
return(d)
}
f1(b1,100)

Trabajo 1: Hacer un código con el uso del comando “for(..)” que calcule el promedio de cada
tratamiento de los datos evaluados arriba, usando cada una de las variables

También podría gustarte