Está en la página 1de 3

Introducción a R

Natalia Hernández Vargas, Dipl.-Math.


Segundo Semestre 2019

R es un software gratis para la computación estadística y la visualización de datos. https://www.r-project.org/


Su uso se basa en comandos de programación, los cuales siguen un lenguaje específico que se debe seguir
para que sea entendido por la consola. A continuación se presentan reglas del lenguaje que se deben tener en
cuenta:
# Todas las líneas de código que comiencen con el símbolo # representan un "comentario"
# y no es ejecutado por el programa.

El símbolo <- le asigna un valor a una variable.


# Por ejemplo, si se quiere asignar un valor 5 a una variable "y"
y <- 5
# Si se ejecuta la "y" sola, ya presenta el 5 guardado en ella
y

## [1] 5
# La variable y puede ser utilizada. Para multiplicar la variable "y" por el valor 2:
y*2

## [1] 10
# Sin embargo, si este procedimiento no es asignado a una variable, la variable "y" se
# mantendrá con su valor asignado inicial:
y

## [1] 5
# Ahora, si se quiere guardar el resultado en una variable "x":
x <- y*2
# Si se revisa la variable "x":
x

## [1] 10

Vectores
Una lista de datos es un conjunto de datos de una sola variable. A esta lista de datos se le llama formalmente
vector.
# Se puede crear un vector usando el comando c()
z <- c(1.1, 9, pi, 5 , 6, 7, 8)

Los decimales se escriben con punto (‘1.1’ por ejemplo) y existen números especiales que ya están en la
colección base de R como ‘pi’.
# Si se revisa la variable "z":
z

## [1] 1.100000 9.000000 3.141593 5.000000 6.000000 7.000000 8.000000


Este vector puede ser usado para crear vectores más grandes.

1
# Por ejemplo, si se quiere crear un vector con todos los valores de "z", pero también
# con los varlores de "x" y "y":
c(x,y,z)

## [1] 10.000000 5.000000 1.100000 9.000000 3.141593 5.000000 6.000000


## [8] 7.000000 8.000000
Un vector puede ser multiplicado por números constantes con el fin de afectar todos los elementos del mismo.
# Por ejemplo, para multiplicar todos los elementos del vector "z" por 2.
z * 2

## [1] 2.200000 18.000000 6.283185 10.000000 12.000000 14.000000 16.000000


Otras operaciones se pueden realizar como la suma ‘+’, la resta ‘-’, la división ‘/’ y la potencia ‘ˆ’.
# Por ejemplo, x^2 significa elevar "x" a la 2.
x^2

## [1] 100
Para calcular raiz cuadrada, se requiere el comando sqrt().
# Por ejemplo, para calcular la raiz cuadrada de la variable "x".
sqrt(x)

## [1] 3.162278
Cada vez que se quiera comprender el uso de un comando en R, se puede acceder a información detallada
usando ?.
Se pueden crear listas de números seguidos.
#Por ejemplo, una lista de números del 1 al 20:
1:20

## [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
# Esta lista se podría guardar en una variable llamada "mi_vector"
mi_vector <- 1:20

Base de datos
Las bases de datos están conformadas por más de una variable. En término de vectores, las bases de datos
son llamadas matrices. El comando matrix() permite armar una matriz de datos con una cantidad dada de
columnas y de filas.
# Por ejemplo, si se quiere armar una matriz con 5 columnas y 4 filas
# con los números del 1 al 20
matrix(1:20,nrow=4, ncol=5)

## [,1] [,2] [,3] [,4] [,5]


## [1,] 1 5 9 13 17
## [2,] 2 6 10 14 18
## [3,] 3 7 11 15 19
## [4,] 4 8 12 16 20
# Para el ejemplo, se va a asumir que cada fila corresponde a un estudiante del que se
# conoce 5 características: edad, estatura, semestre, promedio acumulado y peso.

# Para agregar el nombre de los estudiantes en una columna adicional:


mi_matrix <- matrix(1:20,nrow=4, ncol=5)

2
estudiante <- c("Carlos","Andrea","Alex","Maria")
mi_data <- cbind(estudiante, mi_matrix)

El comando matrix() solo permite datos numéricos en sus elementos, por eso aparecen todos los elementos
entre comillas cuando hay elementos distintos a números.
mi_data

## estudiante
## [1,] "Carlos" "1" "5" "9" "13" "17"
## [2,] "Andrea" "2" "6" "10" "14" "18"
## [3,] "Alex" "3" "7" "11" "15" "19"
## [4,] "Maria" "4" "8" "12" "16" "20"
Para mantener los tipos de variables, se utiliza el comando data.frame().
mi_data <- data.frame(estudiante, mi_matrix)
mi_data

## estudiante X1 X2 X3 X4 X5
## 1 Carlos 1 5 9 13 17
## 2 Andrea 2 6 10 14 18
## 3 Alex 3 7 11 15 19
## 4 Maria 4 8 12 16 20
Para cambiar los nombres de las variables, se utiliza el comando colnames()
colnames(mi_data)<- c("Nombre", "Edad", "Estatura", "Semestre", "Promedio", "Peso")

mi_data

## Nombre Edad Estatura Semestre Promedio Peso


## 1 Carlos 1 5 9 13 17
## 2 Andrea 2 6 10 14 18
## 3 Alex 3 7 11 15 19
## 4 Maria 4 8 12 16 20
De una base de datos, se puede analizar una sola de sus variables con ayuda del símbolo $.
# Por ejemplo, para ver la variable "Edad"
mi_data$Edad

## [1] 1 2 3 4

También podría gustarte