Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sesión I
Preparación
1 ¿Qué es RStudio?
2 Introdución a RStudio
4 Matrices
5 Estadı́sticas descriptivas
RStudio es un software estadı́stico que usa lenguaje S, desarrollado por John Chambers
durante los 70s
Se popularizó en los 70s, se reescribió en los 80s y en la de cada de 1990 sale la versión 4
de R que es una interfaz muy similar a la que actualmente se utiliza.
En 1993 Ross Ihaka y Robert Gentleman lo ofrecen al público en general y en 1995
liberan el código debido a su éxito.
Ventajas
Se ejecuta en la mayorı́a de los escritorios o en un servidor y se accede a través de la web.
Integra las herramientas que usa con R en un solo entorno.
Incluye potentes herramientas de codificación diseñadas para mejorar su productividad.
permite una navegación rápida a archivos y funciones.
El lenguaje R es muy pequeño y todas las funcionalidades de él se van agregando con
paquetes.
R tiene una comunidad muy grande, estimulante y muy activa (listas de R-help y
R-devel y sitio web Stack Overflow).
Es un software libre
Desventajas
Es un software relativamente viejo.
No tiene una buena interacción del sistema de graficación 3D.
La funcionalidad está basada en sus usuarios.
Todos los objetos usados en el trabajo se cargan en la memoria RAM.
Objetos
Objetos del lenguaje: Llamadas funciones, expresiones o nombres.
Expresiones: Conjunto de expresiones o comandos que no han sido evaluados.
Funciones: Comandos que constan de una lista de argumentos, código y el entorno.
Clases de objetos
Character
Numeric
Logical
El comando ls(”nombre del objeto”) nos regresa el contenido del objeto que le indicamos, y el
comando attach() vuelve a cargar objetos en la memoria que están cargados en la carpeta de
trabajo.
Los comandos objects() y ls() visualizan el listado de objetos presentes en el actual espacio o
área de trabajo (workspace).
objects()
ls()
R está diseñado de forma que la mayorı́a de operaciones y de funciones estén definidas con
carácter vectorial
Opción 1. (:)
Una forma es utilizar el sı́mbolo de dos puntos situado entre dos números, lo cual genera
un vector en orden ascendente o descendente según indiquemos.
a < −1 : 10
b < −10 : 1
Ejercicio 1.
Crear un vector llamado ”d”de números del 1 al 20 y otro vector, llamado .e, con números del 1
al 100 que vayan de 5 en 5. Realizar las operaciones básicas con los dos vectores.
Adición
Substracción
Multiplicación
División
Para importar datos desde un fichero EXCEL se recomienda guardar los datos (dentro de
EXCEL) en formato csv y posteriormente aplicar la función read.csv en R.
El siguiente tipo de objeto que se puede utilizar es la matriz, considerada como una variable
indexada mediante dos ı́ndices. Para crearlas se puede utilizar la función matrix. Los
parámetros de esta función son:
data: Vector que contiene los valores que formarán la matriz.
nrow: Número de filas de la matriz.
ncol: Número de columnas de la maatriz.
brow: Variable lógica que indica si la matriz debe construirse por filas o por columnas.
dimnames: Lista de longitud 2 con los nombres de las filas y las columnas.
Transposición
vt < −t(v)
vt
zt < −t(z)
zt
Cargar datos.
data < −read.csv(”Lista3.csv”, header = T RU E, sep = ”; ”, dec = ”.”)
Ver descriptivos.
summary(data)
summary(data$edad)
summary(data[, 7])
summary(data[,0 edad0 ])
summary(data[3 : 7])
Otros descriptivos.
quantile(data$edad, 0.25)
quantile(data$edad, c(0.1, 0.25, 0.5, 0.75, 0.9))
by(data[, 1 : 7], data$hometown, summary)
Plot.
plot(edad educ, data = data, xlab = ”Educacin”, ylab = ”Edad”, pch = 16, col =
”red”)text(data[,0 educ0 ], data[,0 edad0 ], labels = data[,0 nombre0 ], adj =
c(.5, −.7), cex = .55)
Histograma.
help(hist)
hist(data$edad, xlab = ”Edad”, f req = F ALSE, col = ”steelblue”, main =
paste(”Histograma”))