Está en la página 1de 9

Carrera de Ingeniería Eléctrica

Facultad de Ingeniería
Universidad Laica Eloy Alfaro de Manabí
Manta – Manabí - Ecuador

CONSULTA:
Análisis y Simulación de Correlación de datos en R

Asignatura: Programación III

Docente: Ing. Washington García

Semestre: Cuarto

Estudiante:
Rengifo Chernez Maida Leonela

Fecha de entrega: 13de Julio de 2017


Contenido

1. ¿Qué es R? ....................................................................................................................................... 3
1.1. Introducción a R ...................................................................................................................... 3
1.2. El entorno R ............................................................................................................................. 3
2. Manejando Datos con R .................................................................................................................. 4
2.1. Objetos .................................................................................................................................... 4
2.2. Leyendo datos desde un archivo ............................................................................................. 5
2.3. Lectura y escritura de datos en R ............................................................................................ 6
Ejemplo 1 ................................................................................................................................................. 7
Ejemplo 2 ................................................................................................................................................. 7
Ejemplo 3 ................................................................................................................................................. 8
Ejemplo 4 ................................................................................................................................................. 8
Ejemplo 5 ................................................................................................................................................ 8
Bibliografía............................................................................................................................................... 9
1. ¿Qué es R?
1.1.Introducción a R

R es un lenguaje y un entorno para la informática estadística y los gráficos. Es un proyecto


GNU que es similar al lenguaje S y el ambiente que fue desarrollado en Bell Laboratories (antes
AT & T, ahora Lucent Technologies) por John Chambers y colegas. R puede considerarse como
una implementación diferente de S. Hay algunas diferencias importantes, pero mucho código
escrito para S se ejecuta sin alteración bajo R.

R proporciona una amplia variedad de modelos estadísticos (modelos lineales y no lineales,


pruebas estadísticas clásicas, análisis de series de tiempo, clasificación, agrupamiento) y
técnicas gráficas, y es muy extensible. El lenguaje S es a menudo el vehículo de elección para
la investigación en metodología estadística, y R proporciona una ruta Open Source para
participar en esa actividad.

Una de las fortalezas de R es la facilidad con la que se pueden producir parcelas de calidad
de publicación bien diseñadas, incluyendo símbolos matemáticos y fórmulas donde sea
necesario. Se ha tenido mucho cuidado con los valores predeterminados para las opciones de
diseño menores en gráficos, pero el usuario mantiene el control total.

R está disponible como software libre bajo los términos de la Free Software
Foundation ‘s Licencia Pública General de GNU en forma de código fuente. Compila y ejecuta
en una amplia variedad de plataformas UNIX y sistemas similares (incluyendo FreeBSD y
Linux), Windows y MacOS. (Gandrud, C.2013)

1.2.El entorno R

R es un conjunto integrado de instalaciones de software para la manipulación de datos, cálculo


y visualización gráfica. Incluye

 Una facilidad eficaz de manejo y almacenamiento de datos,

 Una serie de operadores para cálculos sobre matrices, en particular matrices,

 Una gran colección coherente e integrada de herramientas intermedias para el análisis


de datos,

 Instalaciones gráficas para el análisis de datos y visualización en pantalla o en papel, y


 Un lenguaje de programación bien desarrollado, sencillo y efectivo que incluye
condicionales, bucles, funciones recursivas definidas por el usuario y facilidades de
entrada y salida.

El término "medio ambiente" pretende caracterizarlo como un sistema completamente


planeado y coherente, en lugar de una acumulación incremental de herramientas muy
específicas e inflexibles, como es frecuentemente el caso con otro software de análisis de datos.

R, al igual que S, está diseñado en torno a un verdadero lenguaje informático, y permite a


los usuarios añadir funciones adicionales mediante la definición de nuevas funciones. Gran
parte del sistema está escrito en el dialecto R de S, lo que facilita que los usuarios sigan las
opciones algorítmicas hechas. Para las tareas de computación intensiva, código C, C ++ y
Fortran se pueden vincular y llamar en tiempo de ejecución. Los usuarios avanzados pueden
escribir código C para manipular objetos R directamente.

Muchos usuarios piensan en R como un sistema de estadísticas. Preferimos pensar en un


entorno en el que se implementan las técnicas estadísticas. R se puede extender (fácilmente) vía
los paquetes. Hay alrededor de ocho paquetes suministrados con la distribución R y muchos
más están disponibles a través de la familia CRAN de sitios de Internet que cubren una amplia
gama de estadísticas modernas. R tiene su propio formato de documentación LaTeX-like, que
se utiliza para suministrar documentación completa, tanto en línea en un número de formatos y
en papel.

(Rahlf, 2017)

2. Manejando Datos con R


2.1.Objetos

Hemos visto que R trabaja con objetos los cuales tienen nombre y contenido, pero también
atributos que especifican el tipo de datos representados por el objeto. Para entender la utilidad
de estos atributos, consideremos una variable que toma los valores 1, 2, o 3: tal variable podría
ser un numero entero por ejemplo, el número de huevos en un nido), o el código de una variable
categórica por ejemplo, el sexo de los individuos en una población de crustáceos: macho,
hembra, o hermafrodita. (Gilbert, 2005)

Es claro que los resultados de un análisis estadístico de esta variable no será el mismo en ´
ambos casos: con R, los atributos del objeto proporcionan la información necesaria. En general,
y hablando un poco más técnicamente, la acción de una función sobre un objeto depende de los
atributos de este último. Todo objeto tiene dos atributos intrınsecos: tipo y longitud. El tipo se
refiere a la clase basica de los elementos en el objeto; existen cuatro tipos principales:
numérico, carácter, complejo 7, y lógico (FALSE [Falso] or TRUE [Verdadero]). Existen otros
tipos, pero no representan datos como tal (por ejemplo funciones o expresiones). La longitud
es simplemente el número de elementos en ´ el objeto. Para ver el tipo y la longitud de un objeto
se pueden usar las funciones mode y length, respectivamente:

> x <- 1
> mode(x)
[1] "numeric"
> length(x)
[1] 1
> A <- "Gomphotherium"; compar <- TRUE; z <- 1i
> mode(A); mode(compar); mode(z)
[1] "character"
[1] "logical"
[1] "complex"

La siguiente tabla resume los tipos de objetos y los datos que representan

Figura 1. Tipos de objetos y los datos que representan

2.2.Leyendo datos desde un archivo

R utiliza el directorio de trabajo para leer y escribir archivos. Para saber cual es este
directorio puede utilizar el comando getwd () (get working directory) Para cambiar el directorio
de trabajo, se utiliza la función´ setwd (); por ejemplo, setwd (“C:/data”) o setwd
(“/home/paradis/R”). Es necesario proporcionar la dirección (’path’) completa del archivo si
este no se encuentra en el directorio de trabajo.
R puede leer datos guardados como archivos de texto (ASCII) con las siguientes funciones:
read.table (con sus variantes, ver abajo), scan y read.fwf. R también puede leer archivos ´ en
otros formatos (Excel, SAS, SPSS), y acceder a bases de datos tipo SQL, pero las funciones
necesarias no están incluidas en el paquete ´ base. Aunque esta funcionalidad es muy útil para
el ´ usuario avanzado, nos restringiremos a describir las funciones para leer archivos en formato
ASCII únicamente. (Brazma 2001)

Figura 2. Opciones con valores por defecto.

2.3.Lectura y escritura de datos en R

Para introducir datos desde la propia ventana de comandos se utiliza la función scan():
> scan()
1: 1
2: 2
3: 3
4:
Read 3 items
[1] 1 2 3
Como vemos, cuando queremos dejar de introducir datos, pulsamos un ENTER de más.
Si queremos guardar el resultado en una variable, escribiríamos algo como:
> Datos = scan()
La funcion scan toma la siguiente forma:
Scan(file=" ", what = numeric(), n, sep, ...)
(García, A. M. 2008)

Ejemplo 1

Ejemplo 2

R como calculadora
> 2+2
> sqrt(10)
> 2*3*4*5
> # Intereses sobre 1000 euros
> 1000*(1+0.075)^5 - 1000
> # R conoce pi
> pi
> # Circunferencia de la Tierra en el Ecuador en km
> 2*pi*6378
> # Convertimos ´angulos a radianes y luego calculamos el seno
> sin(c(0,30,45,60,90)*pi/180)
Ejemplo 3

> my.f2 <- function(x, y) {


+ z <- rnorm(10) + y2 <- z * y + y3 <- z * y * x + return(y3 + 25)
+}
> my.f2(runif(3), 1:4)
> debug(my.f2)
> my.f2(runif(3), 1:4)
> undebug(my.f2)
> # insertar un browser() y correr de nuevo

(Carmona, 2007)

Ejemplo 4

Ejemplo 5

(Carmona, F. 2007)
Bibliografía

García, A. M. (25/02/2008). Lectura y escritura de datos en R. Obtenido el 13/07/2017, desde


el sitio Web de OCW - UC3M:
http://ocw.uc3m.es/estadistica/aprendizaje-del-software-estadistico-r-un-entorno-para-
simulacion-y-computacion-estadistica/lectura-y-escritura-de-datos-en-r.
[Brazma et al., 2001] Brazma, A., Hingamp, P., Quackenbush, J., Sherlock, G., Spellman,
P., Stoeckert, C., Aach, J., Ansorge, W., Ball, C. A., Causton, H. C., et al. (2001).
Minimum information about a microarray experiment (miame)toward standards for
microarray data. Nature genetics, 29(4):365371

[Gilbert, 2005] Gilbert, D. (2005). Biomolecular interaction network database. Briengs in


bioinformatics, 6(2):194198.

Carmona, F. (15 de febrero de 2007). ub.edu. Obtenido de


http://www.ub.edu/stat/docencia/EADB/Curso%20basico%20de%20R-bn.pdf

Rahlf, T. (2017). Data Visualisation with R. Nueva York: Springer International Publishing.

Carmona, F. (2007). Curso básico de R. Retrieved March 5, 2013, from


http://www.ub.edu/stat/docencia/EADB/Curso%20basico%20de%20R.pdf

Gandrud, C. (2013). Reproducible Research with R and RStudio. Chapman & Hall/CRC
Press. Retrieved from
http://www.crcpress.com/product/isbn/9781466572843