Está en la página 1de 12

Contenido

R ............................................................................................... Error! Bookmark not defined.

Introduccin ............................................................................................................................... 3

Como funciona R ....................................................................................................................... 4

Como introducir datos en R ....................................................................................................... 5

Manejando Datos con R ............................................................................................................. 8

Objetos ................................................................................................................................... 8

Ejemplos: ................................................................................................................................. 10

Bibliografa .............................................................................................................................. 12

1
Qu es R?

Es un entorno y lenguaje de programacin con un enfoque al anlisis estadstico.

R es una implementacin de software libre del lenguaje S pero con soporte de alcance esttico.
Se trata de uno de los lenguajes ms utilizados en investigacin por la comunidad estadstica,
siendo adems muy popular en el campo de la minera de datos, la investigacin biomdica,
la bioinformtica y las matemticas financieras. A esto contribuye la posibilidad de cargar
diferentes bibliotecas o paquetes con funcionalidades de clculo y grficas.

R es parte del sistema GNU y se distribuye bajo la licencia GNU GPL. Est disponible para
los sistemas operativos Windows, Macintosh, Unix y GNU/Linux.

R proporciona un amplio abanico de herramientas estadsticas (modelos lineales y no


lineales, textos estadsticos, anlisis de series temporales, algoritmos
de clasificacin y agrupamiento, etc.) y grficas.

Al igual que S, se trata de un lenguaje de programacin, lo que permite que los usuarios lo
extiendan definiendo sus propias funciones. De hecho, gran parte de las funciones de R estn
escritas en el mismo R, aunque para algoritmos computacionalmente exigentes es posible
desarrollar bibliotecas en C, C++ o Fortran que se cargan dinmicamente. Los usuarios ms
avanzados pueden tambin manipular los objetos de R directamente desde cdigo desarrollado
en C. R tambin puede extenderse a travs de paquetes desarrollados por su comunidad de
usuarios.

R hereda de S su orientacin a objetos. La tarea de extender R se ve facilitada por su permisiva


poltica de lexical scoping.5

Adems, R puede integrarse con distintas bases de datos y existen bibliotecas que facilitan su
utilizacin desde lenguajes de programacin interpretados como Perl y Python.

Otra de las caractersticas de R es su capacidad grfica, que permite generar grficos con alta
calidad. R posee su propio formato para la documentacin basado en LaTeX.

(Bloomfield., 2014)

2
Introduccin

En R hay 5 tipos de datos bsicos o atmicos:

Carcter

Reales

Enteros

Complejos

Booleanos

R es orientado a objetos, el tipo de dato en que se basa R es el objeto vector, el objeto vector ()
solo contiene objetos de un mismo tipo si se necesita almacenar ms de un mismo tipo de dato
se utiliza el objeto list (). En la consola es donde se introducen todas las funciones que se
quieren hacer, el smbolo <- es el operador de asignacin. El smbolo # indica un comentario.

(Leemis., 2016)

3
Como funciona R

R es un lenguaje Orientado a Objetos: bajo este complejo termino se esconde la simplicidad y


flexibilidad de R. El hecho que R es un lenguaje de programacin puede desaminar a muchos
usuarios que piensan que no tienen alma de programadores. Esto no es necesariamente cierto
por dos razones. Primero R es un lenguaje interpretado (como Java) y no compilado (como C,
C++, Fortran, Pascal,), lo cual significa que los comandos escritos en el teclado son ejecutados
directamente sin necesidad de construir ejecutables. Como segunda medida, la sintaxis de R es
muy simple e intuitiva. Por ejemplo, una regresin lineal se puede ejecutar con el comando lm
(y x). Para que una funcin sea ejecutada en R debe estar siempre acompaada de parntesis,
inclusive en el caso que no haya nada dentro de los mismos (por ej., ls ()). Si se escribe el
nombre de la funcin sin los parntesis, R mostrar a el contenido (cdigo) mismo de la funcin.

(Rahlf., 2017)

Orientado a Objetos significa que las variables, datos, funciones, resultados, etc., se guardan
en la memoria activa del computador en forma de objetos con un nombre especfico. El usuario
puede modificar o manipular estos objetos con operadores (aritmticos, lgicos, y
comparativos) y funciones (que a su vez son objetos). Una funcin en R se puede delinear de
la siguiente manera:

Los argumentos pueden ser objetos (datos, formulas, expresiones, . . .), algunos de los cuales
pueden ser definidos por defecto en la funcin; sin embargo, estos argumentos pueden ser
modificados por el usuario con opciones. Una funcin en R puede carecer totalmente de
argumentos, ya sea porque todos estn definidos por defecto (y sus valores modificados con
opciones), o porque la funcin realmente no tiene argumentos.

Todas las acciones en R se realizan con objetos que son guardados en la memoria activa del
ordenador, sin usar archivos temporales (Fig. 1). La lectura y escritura de archivos solo se
realiza para la entrada y salida de datos y resultados (graficas). El usuario ejecuta las funciones

4
con la ayuda de comandos definidos. Los resultados se pueden visualizar directamente en la
pantalla, guardar en un objeto o escribir directamente en el disco (particularmente para
grficos). Debido a que los resultados mismos son objetos, pueden ser considerados como datos
y analizados como tal. Archivos que contengan datos pueden ser ledos directamente desde el
disco local o en un servido remoto a travs de la red.

(Murray, 2017)

Las funciones disponibles estn guardadas en una librera localizada en el directorio R


HOME/library (R HOME es el directorio donde R est instalado). Este directorio contiene
paquetes de funciones, las cuales a su vez estn estructuradas en directorios. El paquete
denominado base constituye el ncleo de R y contiene las funciones bsicas del lenguaje para
leer y manipular datos, algunas funciones grficas y algunas funciones estadsticas (regresin
lineal y anlisis de varianza). Cada paquete contiene un directorio denominado R con un
archivo con el mismo nombre del paquete (por ejemplo, para el paquete base, existe el archivo
R HOME/library/base/R/base). Este archivo esta en formato ASCII y contiene todas las
funciones del paquete. El comando ms simple es escribir el nombre de un objeto para
visualizar su contenido. Por ejemplo, si un objeto n contiene el valor 10:

> n [1] 10

El dgito 1 indica que la visualizacin del objeto comienza con el primer elemento de n. Este
comando constituye un uso implcito de la funcin print, y el ejemplo anterior es similar a
print(n) (en algunas situaciones la funcin print debe ser usada explcitamente, como por
ejemplo dentro de una funcin o un bucle).

El nombre de un objeto debe comenzar con una letra (A-Z and a-z) y puede incluir letras,
dgitos (0-9), y puntos (.). R discrimina entre letras maysculas y minsculas para el nombre
de un objeto, de tal manera que x y X se refiere a objetos diferentes (inclusive bajo Windows).

(Dayal., 2015)

Como introducir datos en R

Existen varias formas de introducir datos en R

-Usando la instruccin scan. evita el uso de las comas

> glucose = scan ()

5
1: 81 85 93 93 99 76 75 84 78 84 81 82 89 81

15: 96 82 74 70 84 86 80 70 131 75 88 102

27: 115 89 82 79 106

32:

Read 31 items

-Usando la instruccin concatenar


> glucose = c (81, 85, 93, 93, 99, 76, 75, 84, 78, 84, 81, 82, 89,

+ 81, 96, 82, 74, 70, 84, 86, 80, 70, 131, 75, 88, 102, 115,

+ 89, 82, 79, 106)

El signo ms`+' symbols, indica que R espera que se termine el comando

-Leer a partir de un archivo texto


Crear un archivo de datos en Excel, en el bloc notas en formato ASCII, o en Open Office o en
cualquier procesador de texto. Por ejemplo, se pueden introducir los datos de una variable en
una sola columna, en la primera lnea indicar el nombre de los valores (por ejemplo glucosa) y
guardar en un archivo llamado `glucose.txt'. Tambin se pueden agregar otras variables como
temperatura, etc.

glucosa temperatura Enfermera


81 36.3 1
85 35.8 2
93 36.4 3
93 37.5 2
99 35.6 1
76 35 2
75 37.3 3
84 36 2
78 37.3 1
84 38 2
81 37.5 1
82 36 1

6
89 36.2 1
81 37 2
96 35.4 2
82 36.3 3
74 35.8 3
70 36.4 2
84 37.5 1
86 35.6 3
89 37 2
82 36.3 3
79 35.8 3
106 36.2 2

> x = read.table ("glucose.txt", header = T)

Seguro va a tener problemas para leer los datos, pues debe indicar a R en que directorio se
encuentran los datos. Para eso ir al men File y despus a la instruccin current directory,
buscar el directorio donde guardo sus datos y sealarlo.

Tambin puede indicar la direccin completa donde guardo sus datos, por ejemplo

> x = read.table ("c:/datos/glucose.txt", header = T)

No olvidar que el archivo puede tener una o varias columnas, cada una con un titulo

Si escribe

>x

Vera aparecer las tres columnas de datos

Puede usar $ para acceder a las variables

> x$glucose

[1] 81 85 93 93 99 76 75 84 78 84 81 82 89 81 96 82 74 70 84

[20] 86 80 70 131 75 88 102 115 89 82 79 106

O usar

7
> attach (x)

para acceder a las columnas con los ttulos

> glucose

[1] 81 85 93 93 99 76 75 84 78 84 81 82 89 81 96 82 74 70 84

[20] 86 80 70 131 75 88 102 115 89 82 79 106

En realidad, los datos ingresan a una estructura de datos llamada Data Frame formada por el
nombre de la columna y sus valores.

Se puede checar la estructura con

Str (x)

`data. Frame': 31 obs. of 1 variable:

$ glucose: int 81 85 93 93 99 76 75 84 78 84 ...

-Leer a partir de un archivo formato csv (Comma separated values)


> x = read.table ("glucosa.csv", header = T, sep = ",")

-Otros mtodos para leer datos de un archivo que usted pueda elegir
> x = read.table (file. Choose (), header=T)

Si ya est cansado de guardar archivos en otro formato, hacer el archivo en excel, copiar las
columnas de datos que interesan y luego en R

> mydata <- read.delim ("clipboard")

(Sol., 2015)

Manejando Datos con R

Objetos
Hemos visto que R trabaja con objetos los cuales tienen nombre y contenido, pero tambin
atributos que especifican el tipo de datos representados por el objeto. Para entender la utilidad
de estos atributos, consideremos una variable que toma los valores 1, 2, o 3: tal variable podra
ser un numero entero (por ejemplo, el nmero de huevos en un nido), o el cdigo de una
variable categrica (por ejemplo, el sexo de los individuos en una poblacin de crustceos:
macho, hembra, o hermafrodita). Es claro que los resultados de un anlisis estadstico de esta

8
variable no ser el mismo en ambos casos: con R, los atributos del objeto proporcionan la
informacin necesaria. En general, y hablando un poco ms tcnicamente, la accin de una
funcin sobre un objeto depende de los atributos de este ltimo.

La siguiente tabla resume los tipos de objetos y los datos que representan.

Un vector es una variable en el significado comnmente asumido. Un factor es una variable


categrica. Un arreglo es una tabla de dimensin k, y una matriz es un caso particular de un
arreglo donde k = 2. Note que los elementos en un arreglo o una matriz son del mismo tipo. Un
data.Frame (marco o base de datos) es una tabla compuesta de uno o ms vectores y/o factores
de la misma longitud pero que pueden ser de diferentes tipos. Un ts es una serie temporal y
como tal contiene atributos adicionales tales como frecuencia y fechas. Finalmente, una lista
puede contener cualquier tipo de objeto incluyendo otras listas!

Para un vector, su tipo y longitud son suficientes para describirlo. Para otros objetos es
necesario usar informacin adicional que es proporcionada por atributos no-intrnsecos. Dentro
de estos atributos se encuentran por ejemplo dim, que corresponde a las dimensiones del objeto.
Por ejemplo, una matriz con 2 filas y 2 columnas tiene como dim la pareja de valores [2, 2],
pero su longitud es 4.

(Kohl., 2015)

9
Ejemplos:
1.-

2.-

3.-

10
4.-

5.-

11
Bibliografa

Bloomfield., V. A. (2014). Uso de R para el anlisis numrico en Ciencia e Ingeniera.


Chapman & Hall / CRC.

Dayal., V. (2015). Una Introduccin a R para la Economa Cuantitativa: Representacin


Grfica, Simulacin y Computacin. . Springer.

Kohl., M. (2015). Einfhrung in die statistische Datenanalyse con R. . Londres: bookboon.

Leemis., L. (2016). Base de Aprendizaje R. . Lightning Source.

Murray, S. (2017). Apprendre R en un Jour. .

Rahlf., T. (2017). Visualizacin de Datos con R. Nueva York: Springer International


Publishing.

Sol., C. (2015). Investigacin Emprica en Economa: Creciendo con R. Mississippi: Pine


Square.

12

También podría gustarte