Está en la página 1de 9

Vol. 23, Núm.

4, julio-agosto 2022

El programa R: una estrategia inicial para su


entendimiento y aprendizaje
R program: an initial strategy for understanding and learning it
Francisco Joel Jahuey Martínez, Jessica Beatriz Herrera Ojeda y
Francisco Alejandro Paredes Sánchez

Resumen Abstract

R es un lenguaje de programación estadístico R is a free statistical programming language and is


libre y es la plataforma más utilizada en el área the most widely used platform in the area of data
del análisis de datos. Debido a las diversas analysis. Due to its various benefits, this program
bondades que ofrece este programa, es utilizado it is used in many sciences and is the source of
en muchas ciencias y es la fuente de análisis analysis of other software. The R program can
de otros softwares. El programa R puede ser be explored through various platforms such as:
explorado mediante diversas plataformas como: R, RStudio, RStudio Cloud and Microsoft R Open.
R, RStudio, RStudio Cloud y Microsoft R Open. Installation is quick, easy and free. Learning to use
Su instalación es rápida, sencilla y gratuita. R requires the understanding of basic concepts
Aprender a utilizar R requiere del entendimiento such as functions and objects, so knowing its
de conceptos básicos como son las funciones y structure, use and development will help the
objetos, por lo que conocer su estructura, uso y reader to explore all the benefits and advantages
desarrollo ayudarán al lector a explorar todas las that this software offers. This article explains
bondades y ventajas que este software ofrece. En the basic concepts over the R environment and
este artículo se explican los conceptos básicos provides different options, so that any user, with
en el entorno de R y se proporcionan diferentes or without experience in programming languages,
opciones para que cualquier usuario, con o sin can use this wonderful statistical program.
experiencia en lenguajes de programación, logre
Keywords: R, statistical software, basic functions,
utilizar este maravilloso programa estadístico.
objects, databases.
Palabras clave: R, software estadístico, funciones
básicas, objetos, bases de datos.

Cómo citar este texto


Jahuey Martínez, Francisco Joel, Herrera Ojeda, Jessica Beatriz y Paredes Sánchez, Francisco Alejandro. (2022, julio-agosto).
El programa R: una estrategia inicial para su entendimiento y aprendizaje. Revista Digital Universitaria (rdu), 23(4). http://doi.
org/10.22201/cuaieed.16076079e.2022.23.4.4

Universidad Nacional Autónoma de México, Coordinación de Universidad Abierta, Innovación Educativa y Educación a Distancia (CUAIEED)
Este es un artículo de acceso abierto bajo la licencia de Creative Commons 4.0
Vol. 23, Núm. 4, julio-agosto 2022

Francisco Joel Jahuey Martinez

Facultad de Zootecnia y Ecología, Universidad Autónoma de Chihuahua (fzye-uach)

Licenciado en Biología por el Instituto Tecnológico de Ciudad Victoria (itcv). Cursó la Maestría
y Doctorado en el Centro de Biotecnología Genómica del Instituto Politécnico Nacional (cbg-
ipn). Realizó estancias académicas en la Iowa State University (isu) de Estados Unidos y en la
University of New England (une) de Australia. Actualmente es miembro del Sistema Nacional
de Investigadores y profesor con perfil prodep en la fzye-uach. Su principal línea de investigación
se enfoca en el análisis bioinformático de datos biológicos, predicción genómica y mapeo
genético mediante GWAS en especies de importancia doméstica.
fjahuey@uach.mx
orcid.org/0000-0002-6562-5875
Francisco-Jahuey

Jessica Beatriz Herrera Ojeda

Instituto Tecnológico del Valle de Morelia (itvm)

Médico Veterinario Zootecnista por la Universidad Autónoma de Yucatán (uady) y Doctora


en Ciencias Biológicas por la Universidad Michoacana de San Nicolás de Hidalgo. Realizó
una estancia posdoctoral en el Centro de Biotecnología Genómica del Instituto Politécnico
Nacional. Actualmente es miembro del Sistema Nacional de Investigadores y profesora
investigadora en el itvm.
jessica.ho@vmorelia.tecnm.mx
orcid.org/0000-0001-5293-1550
Jb_Herrera-Ojeda

Francisco Alejandro Paredes Sánchez

Unidad Académica Multidisciplinaria Mante, Universidad Autónoma de Tamaulipas (uamm-uat)

Ingeniero en Biotecnología por la Universidad Politécnica de Zacatecas y Maestro en Ciencias en


Biotecnología Genómica y Doctor en ciencias en Biotecnología por el Centro de Biotecnología
Genómica del Instituto Politécnico Nacional. Ha desarrollado líneas de investigación sobre
el análisis genético molecular de bovinos para la identificación de marcadores moleculares
asociados a características productivas e identificación de marcadores moleculares asociados
a resistencia a insecticidas en plagas de interés agrícola. Perfil prodep 2020-2023. Docente-
Investigador en la uamm-uat.
faparedes@docentes.uat.edu.mx
orcid.org/0000-0003-2661-6607
Francisco-Paredes-Sanchez
Universidad Nacional Autónoma de México, Coordinación de Universidad Abierta, Innovación Educativa y Educación a Distancia (CUAIEED)
Este es un artículo de acceso abierto bajo la licencia de Creative Commons 4.0
“El programa R: una estrategia inicial para su entendimiento y aprendizaje”
Francisco Joel Jahuey Martínez, Jessica Beatriz Herrera Ojeda y
Francisco Alejandro Paredes Sánchez
Vol. 23, Núm. 4, julio-agosto 2022
Revista Digital Universitaria

¿Qué es R? repositorios que se explicarán más

R
adelante (ver figura 1). La consola
natural puede ser descargada desde
es un lenguaje de el sitio web oficial de R. El proceso
programación utilizado de instalación es muy fácil (ver video
como software estadístico en 1), basta únicamente con seleccionar
muchas disciplinas. Al ser gratuito y la versión adecuada para el sistema
fácil de utilizar se ha convertido en la operativo de nuestra computadora
plataforma estadística más utilizada y seguir los pasos de instalación que
para el análisis de datos y big data; vienen definidos por defecto. La
está a la altura de otros lenguajes y plataforma de R está disponible para
programas estadísticos como Python, los sistemas operativos Windows,
Julia, SPSS y SAS. MacOS y Linux, y no requiere de
grandes cantidades de memoria ram
Al ocupar la estadística un lugar
para su uso básico, por lo que puede
importante en la investigación científica,
ser utilizada incluso en minilaptops.
aprender R representa una excelente
competencia académica y laboral en Por otro lado, RStudio es una
el entorno actual del big data. Por lo plataforma más llamativa y amigable
tanto, este artículo pretende instruir para el usuario ya que contiene
al lector en el entendimiento y manejo múltiples menús y opciones para el
básico del programa R, a través de una manejo de datos. RStudio Cloud por
serie de pasos y recomendaciones otra parte resulta interesante para los
que lo guiarán en el proceso de usuarios que no desean tener instalado
aprendizaje, a partir de una mínima o R en su ordenador. Para utilizar RStudio
nula experiencia en programación. Cloud solo se necesita crear una cuenta
aquí y luego el sistema proporciona una
¿Cómo descargo el versión en línea de RStudio bajo ciertas
restricciones de uso (1 Gb de ram, 1
programa? cpu y 15 proyectos como límite). Como
cuarta opción se encuentra Microsoft
Para empezar, es importante saber R Open que es una plataforma de R
que R cuenta con varias plataformas desarrollada por Microsoft que incluye
de uso como: RStudio, RStudio Cloud capacidades adicionales para mejorar
y Microsoft R Open, además de una el rendimiento y la reproducibilidad del
serie de herramientas accesorias y programa.

Figura 1. Diferentes plataformas


para el uso del programa R
y principales repositorios de
librerías de R.

Video 1. Cómo descargar


e instalar R (Ministerio TIC
Colombia, 2020).

3 3
“El programa R: una estrategia inicial para su entendimiento y aprendizaje”
Francisco Joel Jahuey Martínez, Jessica Beatriz Herrera Ojeda y
Francisco Alejandro Paredes Sánchez
Vol. 23, Núm. 4, julio-agosto 2022
Revista Digital Universitaria

¿Cómo me comunico con


el programa? Aprendiendo
funciones en R
Es importante entender que para
aprender a utilizar R el usuario debe
aprender a “hablar” ese lenguaje, lo
que significa pasar comandos a una
computadora o lo que es lo mismo
especificar las instrucciones que el
programa debe ejecutar; esto se hace
por medio de funciones. En segundo
lugar, las funciones se aplican a
objetos que contienen datos.
Las funciones son códigos
creados por desarrolladores y sirven
para realizar tareas específicas en
R (ver figura 2). Por lo general son
empaquetados en lo que se denomina
librerías o paquetes. Afortunadamente,
los usuarios principiantes no
necesitarán crear funciones, sino
que empezarán por utilizar las
funciones preexistentes en diversas
librerías. Actualmente, R cuenta con
más de 17,000 librerías (ver figura 3)
disponibles en el repositorio llamado
cran (por sus siglas en inglés the
Comprehensive R Archive Network).
Figura 3. Ejemplos de librerías de CRAN agrupadas
por disciplina.

Existe una infinidad de


funciones por lo que sería imposible
memorizarlas todas. Tan sólo la
librería “base” contiene más de
1200 funciones básicas. Algunas
de ellas se utilizan de manera
frecuente (ver cuadro 1). A pesar de
Figura 2. Nube de palabras la gran variabilidad y disponibilidad de
que muestra algunas funciones
básicas de R presentes en un
funciones, siempre surgirá la siguiente
script común. duda: ¿qué función debo utilizar?

4 4
“El programa R: una estrategia inicial para su entendimiento y aprendizaje”
Francisco Joel Jahuey Martínez, Jessica Beatriz Herrera Ojeda y
Francisco Alejandro Paredes Sánchez
Vol. 23, Núm. 4, julio-agosto 2022
Revista Digital Universitaria

Función Grupo ¿Qué hace?


getwd Exploración de entorno Obtiene la carpeta o directorio de trabajo actual
setwd Exploración de entorno Cambia el directorio de trabajo
list.files Exploración de archivos Conocer el contenido de tu directorio de trabajo
read.table Exploración de archivos Lee cualquier tipo de archivo que contenga una tabla
rbind y cbind Exploración de datos Unir tablas por filas o por columnas
head y tail Exploración de datos Visualizar partes de un archivo, tabla, matriz
sum Análisis de datos Sumar
Cuadro 1. Algunas funciones
básicas que puedes emplear t, solve, det Análisis de datos Realizar cálculos con matrices
con R
de pegar y resumir, respectivamente.
Buscar funciones de R En otros casos el usuario notará
que el nombre de la función es una
Para saber cuál función debe emplear abreviación de la tarea que realiza;
el usuario, primero requiere definir por ejemplo, para obtener o definir
la tarea que desea ejecutar; por el directorio de trabajo: getwd (get
ejemplo, sumar por filas, filtrar con working directory) y setwd (set
base en varias columnas, resumir working directory).
múltiples variables, generar gráficas,
etcétera. Un primer intento para Cuando ya nos encontremos
encontrar la función adecuada es más cómodos con R, podríamos tratar
realizar una búsqueda en Google de realizar tareas más complejas, que
utilizando la famosa frase ¿how to … involucren múltiples procedimientos
in R?. Por ejemplo: ¿how to read a file y el uso de más de una función. Para
in R? y ¿how to filter a dataframe in R?, ello se recomienda aplicar la misma
que se refieren a ¿cómo leer un archivo estrategia de búsqueda y apoyarse
en R? y ¿cómo filtrar una tabla en R?, en sitios web como stackoverflow
respectivamente. Esta búsqueda y biostars, que son foros donde se
arrojará respuestas en sitios como discuten preguntas entorno al uso del
rdocumentation y statmethods. programa R. Aquí se podrán encontrar
Bastará con leer la descripción de diferentes soluciones al problema
la función proporcionada en el sitio en cuestión. Sólo se deberán copiar
web y si esta función cumple las los scripts1 y posiblemente analizar
necesidades del usuario, simplemente detenidamente cada paso del código.
se debe seguir el ejemplo de ejecución,
cumpliendo siempre con la estructura
de datos solicitada por la función. Ya encontré la función, y
ahora ¿cómo la utilizo?
Otro as bajo la manga que tiene
R para identificar una función es Recordemos que utilizar R implica
definir la orden que se desea ejecutar “hablar idioma computadora”, por
en forma de verbo y traducirlo lo que un paso crucial al aprender R
al inglés, ya que los nombres de es saber que las funciones se deben
algunas funciones de R son simples escribir bajo un orden específico o
1
Secuencia de comandos para
expresiones comunes como paste sintaxis, para que puedan trabajar
resolver una o más tareas y summary, que realizan las tareas correctamente. La mayoría de las

5 5
“El programa R: una estrategia inicial para su entendimiento y aprendizaje”
Francisco Joel Jahuey Martínez, Jessica Beatriz Herrera Ojeda y
Francisco Alejandro Paredes Sánchez
Vol. 23, Núm. 4, julio-agosto 2022
Revista Digital Universitaria

funciones se ejecutan escribiendo continua, es decir, el resultado de


el nombre de la función seguido de una función se puede utilizar como
paréntesis que contiene el nombre dato de entrada de otra función. Por
del objeto al que se desea aplicar ejemplo, cuando se aplica la función
la función. Por ejemplo, para que table para describir una variable
podamos sumar los datos ponemos la cualitativa, el resultado o salida es un
siguiente función: sum(datos). En caso conteo de frecuencias, que puede
de no utilizar una sintaxis correcta pasarse directamente a la función
o de no escribir bien el nombre de pie, que generará un gráfico de pastel
la función o del objeto, surgirá el sin la necesidad de crear un objeto
mensaje más molesto para todo que contenga las frecuencias.
usuario de R, el famoso “Error”.
A medida que el usuario
Además, en ocasiones, adquiera experiencia y dominio sobre
será necesario darle algunas las funciones de R podrá escribir
instrucciones extra a R para que la instrucciones cada vez más complejas.
función haga exactamente lo que Por supuesto, al principio tenderá a
nosotros queremos que haga. Para escribir códigos demasiado extensos,
esto se deben definir una serie de aunque funcionales y entendibles,
argumentos, que determinan el pero conforme aumente su dominio
comportamiento de las funciones. sobre el lenguaje, comenzará a
Por ejemplo, en la función order utilizar funciones y procedimientos
(ordenar), debemos aumentarle el más eficientes y cortos. Como
argumento decreasing (para definir recomendación, antes de empezar
en qué sentido), si queremos que a escribir códigos en R, vale la pena
nos ordene los datos de manera trazar un mapa detallado de todos los
descendente. procedimientos que se desean realizar
sobre la base de datos, e ir resolviendo
Algunas funciones pueden paso a paso cada una de las tareas.
tener uno o más argumentos. De este modo el usuario podrá notar
Afortunadamente, muchos de ellos un avance en sus análisis y evitará
están definidos por defecto, por lo caer en la confusión o frustración.
que el usuario solo deberá indicarlos Con el paso del tiempo, el usuario
o modificarlos si se quiere ajustar notará que sus procedimientos serán
algún parámetro. Para saber qué cada vez más metódicos y ordenados.
argumentos están definidos en una Aquí, el uso de editores de texto o de
función se puede aplicar el comando herramientas como Tinn-R sirven de
args a la función de interés, o bien, apoyo en la escritura de códigos.
revisar la descripción de la función,
para esto R cuenta con el comando
“?”, que al escribirlo seguido del ¿Cómo genero los objetos?
nombre de la función despliega una
ventana con los datos descriptivos de En R, los objetos son las estructuras
la función intente args(mean) o ?mean. que sirven para almacenar datos y
deben ser creados por el usuario.
En R, la escritura y ejecución de Existen cinco tipos de estructuras
códigos se puede hacer de manera básicas que son: vectores, tablas o

6 6
“El programa R: una estrategia inicial para su entendimiento y aprendizaje”
Francisco Joel Jahuey Martínez, Jessica Beatriz Herrera Ojeda y
Francisco Alejandro Paredes Sánchez
Vol. 23, Núm. 4, julio-agosto 2022
Revista Digital Universitaria

dataframes, matrices, listas y arreglos, todos deben tener un nombre que


cada uno con atributos específicos. los identifique. Aunque se pueden
Estos objetos pueden ser creados nombrar de muchas maneras, se
mediante las funciones vector, data. recomienda que el nombre de los
frame, matrix, list y array. objetos sea corto y alusivo a su
contenido, para que el usuario pueda
El tipo de objeto más utilizado es identificarlos fácilmente. Esto es
el dataframe, que es una estructura muy importante ya que durante del
de datos en forma de tabla, donde las proceso de aprendizaje, se estarán
filas representan a las observaciones y creando muchos objetos. Aquí la
las columnas a las variables. De hecho, función ls es de gran utilidad ya que
la mayoría de las funciones básicas de ayuda a conocer todos los objetos
R que sirven para leer y cargar archivos, presentes en una sesión de R.
como read.table o read.csv, generan
un objeto tipo dataframe. También
su creación es muy simple, basta ¿Cómo puedo practicar R si
con indicar el nombre y el contenido no tengo una base de datos?
de cada columna, por ejemplo, para
guardar información dentro del objeto Por lo general, el primer procedimiento
denominado “grupos” se utiliza: grupos en el análisis de datos será leer o
<- data.frame (individuo= c(1:5), grupo= cargar archivos propios a una sesión
c(“A”,”B”,”B”,”C”,”A”) y como resultado se de R. Sin embargo, muchas veces los
obtiene una tabla de 5 filas (1 por cada aprendices de R no cuentan con datos
individuo) y 2 columnas (la de individuo o archivos para practicar. Por fortuna,
y la de grupos). Note que para guardar R cuenta con la librería “datasets”, que
información dentro de un objeto se contiene datos de diferente índole
debe utilizar el operador de asignación para su uso y exploración. Además, la
“<-“, que es una especie de flecha que mayoría de las librerías especializadas
indica en dónde se depositarán los de R incluyen bases de datos, por lo
datos de interés (ver figura 4). que si el usuario ha elegido alguna
deberá seguir, en primer lugar, el
Independientemente de la tutorial de uso de la librería y, luego,
manera en que se generen los objetos, estructurar sus datos siguiendo el

Figura 4. Creación de un objeto


tipo dataframe.

7 7
“El programa R: una estrategia inicial para su entendimiento y aprendizaje”
Francisco Joel Jahuey Martínez, Jessica Beatriz Herrera Ojeda y
Francisco Alejandro Paredes Sánchez
Vol. 23, Núm. 4, julio-agosto 2022
Revista Digital Universitaria

mismo formato del ejemplo. R también A pesar de su gran utilidad,


cuenta con funciones para simular los loops también representan uno
variables aleatorias con diferente tipo de los principales dolores de cabeza
de distribución, por ejemplo, uniforme para todos los principiantes en R, ya
(runif), normal (rnorm) y binomial que su entendimiento y utilización
(rbinom), aunque recomendamos requieren de mucha práctica. Algunas
que éstas sean usadas por usuarios recomendaciones para aprender a
con conocimientos más avanzados ejecutar loops son: iniciar practicando
tanto en R como en estadística. con la función for; utilizar pocas
instrucciones dentro del cuerpo
¿Cómo puedo agilizar del loop, e imprimir o guardar el
resultado de cada iteración. También
y automatizar se recomienda que antes de todo se
procedimientos? Loops en R ejecuten por separado las instrucciones
del cuerpo del loop, para asegurarse
En ocasiones el usuario necesitará de que trabajan correctamente y que
repetir muchas veces un mismo realicen la tarea deseada.
procedimiento y posiblemente incluir
condicionales dentro de ellos, es decir, Aunque los principiantes en
buscará automatizar sus análisis. R tratarán de evitar los loops, la
En R, esto se puede hacer mediante mayoría terminarán aprendiéndolos
procedimientos denominados loops de manera forzada, ya que en algún
y a través de las funciones for, while momento del análisis de datos se
y repeat2. Aunque parecen simples, enfrentarán a un problema real
estas funciones son de gran utilidad en donde deberán aplicarlos. Por
el análisis de datos, ya que permiten experiencia, los usuarios que logran
realizar múltiples procedimientos en escribir y ejecutar loops pronto se
una sola instrucción. vuelven independientes en el uso del
programa R, son capaces de seguir
Por ejemplo, para crear loops tutoriales sin ningún problema, con
mediante la función for, el usuario lo que comienzan el proceso del
debe indicar el iterador (generalmente autoaprendizaje, y desarrollan sus
la letra “i”) seguido de un vector sobre propias funciones en R.
el cual se realizarán las iteraciones.
Luego, entre llaves “{}” deberá indicar
el conjunto de procedimientos que Otras maneras de aprender R
2
El comando for se utiliza para
repetir cualquier instrucción desea ejecutar y que representarán
tantas veces como el usuario el cuerpo del loop, por ejemplo: for(i Otra manera de aprender R es
lo desee. El comando while in 1:5) {print (i^2)}. En el ejemplo, mediante la librería Rcmdr, que a
realiza la misma operación,
pero la instrucción se ejecutará cada valor del 1 al 5 será elevado través de una interfaz gráfica facilita
siempre y cuando se cumpla al cuadrado. La ventaja de hacerlo la ejecución de operaciones en R sin
una condición predefinida. De mediante un loop es que no tenemos la necesidad de introducir código. La
manera similar, el comando
que escribir la operación 5 veces, sino ventaja de utilizar esta Rcmdr es que el
repeat también repetirá los
procedimientos indicados por que se le da la indicación al programa usuario puede observar los comandos
el usuario, pero en este caso la en una sola instrucción. ejecutados por la librería cada vez
instrucción se detendrá hasta
que se realiza algún procedimiento
que se cumpla cierta condición.

8 8
“El programa R: una estrategia inicial para su entendimiento y aprendizaje”
Francisco Joel Jahuey Martínez, Jessica Beatriz Herrera Ojeda y
Francisco Alejandro Paredes Sánchez
Vol. 23, Núm. 4, julio-agosto 2022
Revista Digital Universitaria

gráfico o estadístico, desde la ventana surgirán errores de código que


de interfaz gráfica. Otra opción es provocarán frustración en la mayoría
mediante la librería swirl, que a de los usuarios, pero entre más
través de ejercicios y preguntas de se practique este nuevo lenguaje
opción múltiple enseña de manera mejor será el desempeño, confianza
interactiva los conceptos básicos para y agilidad en el uso del programa,
el análisis de datos. La librería swirl y como resultado se desarrollarán
contiene cursos de aprendizaje de R nuevas habilidades para el análisis
para nivel principiante, intermedio de datos. Una vez que se logre tener
y avanzado. También existen los un dominio básico del programa, el
denominados bookdowns, que son usuario de R será capaz de instalar el
libros electrónicos, muy explicativos, programa y sus diferentes librerías, de
que incluyen códigos para practicar identificar y utilizar funciones básicas,
R. La figura 5 muestra algunos y de construir secuencias lógicas de
disponibles en la web y una lista procedimientos para su ejecución.
completa se encuentra disponible
aquí. Por supuesto, videos tutoriales Te invitamos a seguir utilizando
también pueden ser de gran ayuda en este software y que logres llegar al
el aprendizaje de R. La última opción, siguiente paso: ¡el nivel intermedio!
pero no menos importante, es el Te recomendamos practicar los
seguimiento de cursos ofertados por conceptos básicos de estadística,
universidades o mediante plataformas e iniciar con el uso de funciones
educativas como datacamp, udemy, descriptivas, funciones gráficas,
coursera, etcétera. hasta pasar por los conceptos de
estadística inferencial.

Reflexiones
Figura 5. Bookdowns para el
Referencias
aprendizaje de R disponibles en Aprender el lenguaje R será como
la web. aprender un nuevo idioma. Al principio, v Ministerio TIC Colombia. (2020,
febrero 3). Instalación Lenguaje R
[Video]. YouTube. https://youtu.
be/bI_rwoDw4f4

Sitios de interés
v Bookdown: R para principiantes
de Juan Bosco Mendoza Vega

v Funciones básicas de R (Video)

v ¿Qué puede hacer el software


R para resolver tus problemas?,
Rodríguez Silva, Revista Digital
Universitaria

v El Proyecto R para estadística


computacional
Recepción: 09/08/2021. Aprobación: 18/05/2022.

9 9

También podría gustarte