Está en la página 1de 20

Probabilidad y

Estadística
fundamental
aplicando RStudio
Introducción al lenguaje de
programación en RStudio
María Fernanda Acero Baena
R - Project
• R es un entorno y lenguaje de programación con un
enfoque al análisis estadístico.
• R es una implementación de software libre del lenguaje
S.
• Fue desarrollado inicialmente por Robert
Gentleman y Ross Ihaka del Departamento de
Estadística de la Universidad de Auckland en 1993. ​Sin
embargo, si se remonta a sus bases iniciales, puede
decirse que inició en los Bell Laboratories de AT&T y
ahora Alcatel-Lucent en Nueva Jersey con el lenguaje S.
Script, Variables
tablas

Archivos,
paquetes,
gráficos
Consola
Sintaxis funciones en R y
variables

función(x, y,
Funciones de los
paquetes de R o
….) Características
funciones creadas. función
Objeto u
Ej. mean() objetos

X: Nombre
de variable
x >- 5 x= 5: Valor que se
le desea dar a
5 ->x 5 la variable
> help() Muestra una ventana de ayuda
general sobre R.
> help.start() Arranca un manual de ayuda completo
en formato html, utilizando el

Ayuda en RStudio
> help(mean)
navegador del sistema.

Muestra una ventana de ayuda sobre


la función "media aritmética".

> ?mean Lo mismo que el ejemplo anterior.


> help("[") Muestra una ayuda sobre el carácter
[ , que es un carácter especial: forma
parte del lenguaje R.

> apropos(mean) Muestra las funciones relacionadas


con la función mean.
> Busca ayuda sobre objetos o funciones
help.search("mean" que tengan nombre o título que
) contenga la cadena "mean“

> ??mean Lo mismo que el ejemplo anterior


Tipos de datos en R
•• Numéricos
  • Lógicos
• Integer • Representan valores lógicos
• Double como TRUE/FALSE

•  Complejos
• Complejo
• Valores especiales
• Valores faltantes NA
• Caracteres • Infinito Inf ó –Inf
• Se denotan con comillas • Not a number NaN
Ej. “Hamburguesa” • Nulo, el valor no es NULL
verdadero o falso
Atributos de los Objetos Información

Cualquier tipo de entidad que maneja R.


Modo Se usa la función: mode(objeto).

Tipo Tipo de datos de los objetos: entero, carácter, double, etc.


Se usa la función: typeof(objeto).

Nombres Etiquetas de los elementos individuales de un vector o lista.


Se usa la función: names(objeto).

Dimensiones Dimensiones de las matrices y arrays (alguna puede ser cero).


Se usa la función: dim(objeto).
Dimnames Nombres de las dimensiones de los arrays y las matrices.
Se usa la función: dimnames(objeto).
Clase Vector alfanumérico con la lista de las clases del objeto.
Se usa la función: class(objeto).

Otros atributos Atributos de una serie temporal.


Clasificación de los
objetos en R
• Los objetos se pueden clasificar en dos
grandes grupos:
• atómicos: todos los elementos que los
componen son del mismo tipo (o modo),
como por ejemplo los vectores, matrices,
series temporales.
• recursivos: pueden combinar una colección
de otros objetos de diferente tipo (o modo),
como son los data.frame, listas.
Clasificación de los
objetos en R
• Existen otras estructuras recursivas, por
ejemplo:
• El modo function está formado por las
funciones que constituyen R, unidas a las
funciones escritas por cada usuario. Las
trataremos en un tema posterior.
• El modo expression corresponde a una parte
avanzada de R.
Tipos de objetos:
atómicos
Objetos Información

Vector Cadenas unidimensionales (es decir una sola columna o fila) de un tipo único de


valores (numéricos, caracteres, etc.)

Matrices Estructura bidimensional donde todos los datos deben ser del mismo tipo.

Factores Este tipo de objeto es fundamental para el análisis estadístico pues es la forma como
se tratan las variables categóricas.
Series
temporales Una serie temporal  es una secuencia de datos, observaciones o valores, medidos en
determinados momentos y ordenados cronológicamente
Tipos de objetos:
recursivos
Objetos Información

Listas Las listas son objetos genéricos que corresponden a colecciones de distintos objetos
que pueden ser de tipos distintos.

Data Frames Como una matriz pero pudiendo contener distintos tipos de datos. Es lo que
clásicamente se ha llamado base de datos o hoja de datos.
Ejemplos
Vector vector("class", length = n) <-> c(1, 2, 3, 4, 5)

Matrices matrix ( data= n , nrow = numero de filas , ncol =


numero de columnas )

Factores factor(género)

Listas list( Numérico, "Carácter", Lógico)

Data frames data.frame(edad, tiempo, sexo)


Coerciones de tipos
• La mayoría de las funciones producen un error
cuando el tipo de datos que esperan no coincide
con los que ponemos en los argumentos.
• Tenemos dos posibilidades:
• comprobar el tipo de datos utilizando funciones
is.algo(), que nos responde con un valor lógico,
• o forzar al tipo de datos deseados coercionando, para lo
cual podemos utilizar funciones del tipo as.algo(),
que fuerzan el tipo de datos.
Algunas coerciones
is.numeric()
is. ----()
Concatenar (“Unir”)

c(x, y) Tipo
vector Un
cbind(x, y) solo
Tipo matriz tipo
rbind(x, y)

list, data.frame
Secuencias
seq(from = a, to = b, by =c)

Posición inicial Posición final Amplitud


a:b

Posición inicial Posición final

rep(x, times=5)

Vector a Las veces que


repetir se repetirá
Variables lógicas
• Las variables lógicas constituyen un
tipo particular de factor en R, que
se caracteriza por tomar sólo dos
valores: TRUE o FALSE codificados,
respectivamente, como 1 y 0. Es
posible construir condiciones
lógicas utilizando los operadores
‘y’ (&), ‘o’ (|) y ‘no’ (!). La
comparación de valores se lleva a
cabo mediante == (‘es igual a’) y !=
(‘es distinto de’).
Operadores lógicos
Trabajar con objetos
• Acceso a algún(os) componentes
específicos
Posición k del vector x
x[k]

En data frames y listas se puede


acceder a los elementos si tienen
un nombre de esta forma
x$nombre

También podría gustarte