Está en la página 1de 18

Introducción a la programación con R

Juan M. Aristizábal1 Juan C. Vásquez2

1 Facultad de Ciencias Contables, Económicas y Administrativas


Universidad de Manizales
2 Facultad de Ciencias Económicas, Administrativas y Contables
Universidad del Quindı́o

Sesión I
Preparación

Aristizábal & Vásquez (2021) Introducción a R 1 / 18


Contenido

1 ¿Qué es RStudio?

2 Introdución a RStudio

3 Cargar datos a RStudio

4 Matrices

5 Estadı́sticas descriptivas

Aristizábal & Vásquez (2021) Introducción a R 2 / 18


¿Qué es RStudio?

RStudio es un software estadı́stico que usa lenguaje S, desarrollado por John Chambers
durante los 70s
Se popularizó en los 70s, se reescribió en los 80s y en la de cada de 1990 sale la versión 4
de R que es una interfaz muy similar a la que actualmente se utiliza.
En 1993 Ross Ihaka y Robert Gentleman lo ofrecen al público en general y en 1995
liberan el código debido a su éxito.

Aristizábal & Vásquez (2021) Introducción a R 3 / 18


¿Qué es RStudio?

Figura: Interfaz RStudio

Aristizábal & Vásquez (2021) Introducción a R 4 / 18


Ventajas y Desventajas

Ventajas
Se ejecuta en la mayorı́a de los escritorios o en un servidor y se accede a través de la web.
Integra las herramientas que usa con R en un solo entorno.
Incluye potentes herramientas de codificación diseñadas para mejorar su productividad.
permite una navegación rápida a archivos y funciones.
El lenguaje R es muy pequeño y todas las funcionalidades de él se van agregando con
paquetes.
R tiene una comunidad muy grande, estimulante y muy activa (listas de R-help y
R-devel y sitio web Stack Overflow).
Es un software libre

Aristizábal & Vásquez (2021) Introducción a R 5 / 18


Ventajas y Desventajas

Desventajas
Es un software relativamente viejo.
No tiene una buena interacción del sistema de graficación 3D.
La funcionalidad está basada en sus usuarios.
Todos los objetos usados en el trabajo se cargan en la memoria RAM.

Aristizábal & Vásquez (2021) Introducción a R 6 / 18


Nociones básicas

Objetos
Objetos del lenguaje: Llamadas funciones, expresiones o nombres.
Expresiones: Conjunto de expresiones o comandos que no han sido evaluados.
Funciones: Comandos que constan de una lista de argumentos, código y el entorno.

Clases de objetos
Character
Numeric
Logical

El comando ls(”nombre del objeto”) nos regresa el contenido del objeto que le indicamos, y el
comando attach() vuelve a cargar objetos en la memoria que están cargados en la carpeta de
trabajo.

Aristizábal & Vásquez (2021) Introducción a R 7 / 18


Ejecutando R

El signo # indica la introducción de un comentario.


3+7 # suma

R es un lenguaje a través de funciones


Las instrucciones básicas son expresiones o asignaciones.
Para realizar una asignación se pueden utilizar los signos. < −, − > ó =
x < −3 + 7

Para visualizar el contenido de un objeto sólo es necesario escribir su nombre.


x

Los comandos objects() y ls() visualizan el listado de objetos presentes en el actual espacio o
área de trabajo (workspace).
objects()
ls()

Aristizábal & Vásquez (2021) Introducción a R 8 / 18


Tipos de ayuda

help(): La ayuda se despliega en la ventana de ayuda.


example(): Ejemplos sobre los comandos que solicitemos.
help.search()
library(help=): genera documentación en una ventana aparte.
vignette(): Documento para obtener ayuda.

Aristizábal & Vásquez (2021) Introducción a R 9 / 18


Vectores

R está diseñado de forma que la mayorı́a de operaciones y de funciones estén definidas con
carácter vectorial

La función principal para definir un vector es a través de sus componentes, con la


función c(). Para referirnos a la componente enésima del vector v escribiremos v[n].
v < −c(2, 1, 3, 4)
v
v[4]

Otra posibilidad es que sean de tipo cadena (string).


munic < −c(”ElRetiro”, ”M edelln”, ”Leticia”, ”Bello”, ”Cali”)
munic

Aristizábal & Vásquez (2021) Introducción a R 10 / 18


Operaciones entre vectores

Existen distintas formas de crear un vector.

Opción 1. (:)
Una forma es utilizar el sı́mbolo de dos puntos situado entre dos números, lo cual genera
un vector en orden ascendente o descendente según indiquemos.
a < −1 : 10
b < −10 : 1

Opción 2. (Función seq)


from: Indica el valor inicial de la sucesión.
to: Indica el valor final de la sucesión.
by: Indica el espaciado entre los valores.
length: Indica la longitud del vector resultante.
along: Un objeto cuya longitud se usará para el objeto a construir.
a < −seq(f rom = 1, to = 10, by = 2)
b < −seq(f rom = 1, to = 11, length = 6)

Aristizábal & Vásquez (2021) Introducción a R 11 / 18


Operaciones entre vectores

Ejercicio 1.
Crear un vector llamado ”d”de números del 1 al 20 y otro vector, llamado .e, con números del 1
al 100 que vayan de 5 en 5. Realizar las operaciones básicas con los dos vectores.
Adición
Substracción
Multiplicación
División

Aristizábal & Vásquez (2021) Introducción a R 12 / 18


Cargar datos a RStudio

Para importar datos desde un fichero EXCEL se recomienda guardar los datos (dentro de
EXCEL) en formato csv y posteriormente aplicar la función read.csv en R.

Primero cargamos el directorio donde están todos los archivos.


setwd(Ç:/Users/Clases 2020-2/UGCA/Econometrı́a II/Semana I”)

Cargando el archivo .csv.


data < −read.csv(”Lista3.csv”, header = T RU E, sep = ”; ”, dec = ”.”)

Aristizábal & Vásquez (2021) Introducción a R 13 / 18


Cargar datos a RStudio

Carga de datos desde Stata


Primero se instala el paquete Hmisc.
install.packages(’Hmisc’)
A continuación se carga el paquete.
library(Hmisc)

Ver los datos.


newdata < −stata.get(”Lista.dta”, lowernames = T )
newdata

Aristizábal & Vásquez (2021) Introducción a R 14 / 18


Matrices

El siguiente tipo de objeto que se puede utilizar es la matriz, considerada como una variable
indexada mediante dos ı́ndices. Para crearlas se puede utilizar la función matrix. Los
parámetros de esta función son:
data: Vector que contiene los valores que formarán la matriz.
nrow: Número de filas de la matriz.
ncol: Número de columnas de la maatriz.
brow: Variable lógica que indica si la matriz debe construirse por filas o por columnas.
dimnames: Lista de longitud 2 con los nombres de las filas y las columnas.

m− > matrix(data = 1 : 5, nrow = 4, ncol = 5)


m− > matrix(data = 1 : 5, 4, 5)

Aristizábal & Vásquez (2021) Introducción a R 15 / 18


Más sobre matrices

Otra forma de crear matrices: Se emplea la función array.

v < −array(1 : 9, dim = c(3, 4, 2))


v
z < −array(c(10 : 17), dim = c(4, 3))
z

Transposición
vt < −t(v)
vt
zt < −t(z)
zt

Aristizábal & Vásquez (2021) Introducción a R 16 / 18


Estadı́sticas descriptivas

Cargar datos.
data < −read.csv(”Lista3.csv”, header = T RU E, sep = ”; ”, dec = ”.”)

Ver base de datos.


colnames(data)
nrow(data)
ncol(data)

Ver descriptivos.
summary(data)
summary(data$edad)
summary(data[, 7])
summary(data[,0 edad0 ])
summary(data[3 : 7])

Aristizábal & Vásquez (2021) Introducción a R 17 / 18


Estadı́sticas descriptivas

Otros descriptivos.
quantile(data$edad, 0.25)
quantile(data$edad, c(0.1, 0.25, 0.5, 0.75, 0.9))
by(data[, 1 : 7], data$hometown, summary)

Plot.
plot(edad educ, data = data, xlab = ”Educacin”, ylab = ”Edad”, pch = 16, col =
”red”)text(data[,0 educ0 ], data[,0 edad0 ], labels = data[,0 nombre0 ], adj =
c(.5, −.7), cex = .55)

Histograma.
help(hist)
hist(data$edad, xlab = ”Edad”, f req = F ALSE, col = ”steelblue”, main =
paste(”Histograma”))

Aristizábal & Vásquez (2021) Introducción a R 18 / 18

También podría gustarte