Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística
fundamental
aplicando RStudio
Introducción al lenguaje de
programación en RStudio
María Fernanda Acero Baena
R - Project
• R es un entorno y lenguaje de programación con un
enfoque al análisis estadístico.
• R es una implementación de software libre del lenguaje
S.
• Fue desarrollado inicialmente por Robert
Gentleman y Ross Ihaka del Departamento de
Estadística de la Universidad de Auckland en 1993. Sin
embargo, si se remonta a sus bases iniciales, puede
decirse que inició en los Bell Laboratories de AT&T y
ahora Alcatel-Lucent en Nueva Jersey con el lenguaje S.
Script, Variables
tablas
Archivos,
paquetes,
gráficos
Consola
Sintaxis funciones en R y
variables
función(x, y,
Funciones de los
paquetes de R o
….) Características
funciones creadas. función
Objeto u
Ej. mean() objetos
X: Nombre
de variable
x >- 5 x= 5: Valor que se
le desea dar a
5 ->x 5 la variable
> help() Muestra una ventana de ayuda
general sobre R.
> help.start() Arranca un manual de ayuda completo
en formato html, utilizando el
Ayuda en RStudio
> help(mean)
navegador del sistema.
• Complejos
• Complejo
• Valores especiales
• Valores faltantes NA
• Caracteres • Infinito Inf ó –Inf
• Se denotan con comillas • Not a number NaN
Ej. “Hamburguesa” • Nulo, el valor no es NULL
verdadero o falso
Atributos de los Objetos Información
Matrices Estructura bidimensional donde todos los datos deben ser del mismo tipo.
Factores Este tipo de objeto es fundamental para el análisis estadístico pues es la forma como
se tratan las variables categóricas.
Series
temporales Una serie temporal es una secuencia de datos, observaciones o valores, medidos en
determinados momentos y ordenados cronológicamente
Tipos de objetos:
recursivos
Objetos Información
Listas Las listas son objetos genéricos que corresponden a colecciones de distintos objetos
que pueden ser de tipos distintos.
Data Frames Como una matriz pero pudiendo contener distintos tipos de datos. Es lo que
clásicamente se ha llamado base de datos o hoja de datos.
Ejemplos
Vector vector("class", length = n) <-> c(1, 2, 3, 4, 5)
Factores factor(género)
c(x, y) Tipo
vector Un
cbind(x, y) solo
Tipo matriz tipo
rbind(x, y)
list, data.frame
Secuencias
seq(from = a, to = b, by =c)
rep(x, times=5)