Está en la página 1de 2

UNIVERSIDAD MARIANO GÁLVEZ DE GUATEMALA DIRECCIÓN

DE INVESTIGACIÓN E INFORMÁTICA
APLICADA MAESTRÍA EN INFORMÁTICA
Curso: Contabilidad Bancaria (Orientada a Procesos Auto. De Reg)
Código: 501
Inga. Sheyla Yadira Esquivel
Estudiante: Allan Ricardo Hernández Sazo
Carnet: 092-10-1510

Capítulo 1 del libro R for Data Science

R para ciencia de datos" es un libro popular escrito por Hadley Wickham y Garrett Grolemund. A
menudo se le conoce como el libro "tidyverse" porque se centra en el uso del conjunto de paquetes
tidyverse en el lenguaje de programación R para el análisis y visualización de datos. tidyverse es una
colección de paquetes R que trabajan juntos para hacer que la manipulación y visualización de datos
sea más fácil e intuitiva.

El libro cubre varios temas relacionados con la ciencia de datos usando R, que incluyen:

Visualización de datos: presenta el paquete ggplot2 para crear visualizaciones de datos de alta calidad.

La ciencia de datos es un campo enorme y no hay forma de dominarlo leyendo un solo libro. El
objetivo de este libro es brindarle una base sólida en las herramientas más importantes. Nuestro modelo
de las herramientas necesarias en un proyecto típico de ciencia de datos se parece a esto:

La descripción anterior de las herramientas de la ciencia de datos está organizada aproximadamente


según el orden en que las usa en un análisis (aunque, por supuesto, las repetirá varias veces). Sin
embargo, según nuestra experiencia, esta no es la mejor manera de aprenderlos:
 Comenzar con la ingesta y la ordenación de datos no es óptimo porque el 80% de las veces es
rutinario y aburrido, y el otro 20% de las veces es extraño y frustrante.
 Algunos temas se explican mejor con otras herramientas. Por ejemplo, creemos que es más fácil
entender cómo funcionan los modelos si ya sabes sobre visualización, datos ordenados y
programación.

 Las herramientas de programación no son necesariamente interesantes por sí mismas, pero


permiten abordar problemas considerablemente más desafiantes

Hay algunos temas importantes que este libro no cubre. Creemos que es importante concentrarse
implacablemente en lo esencial para que pueda comenzar a funcionar lo más rápido posible. Eso
significa que este libro no puede cubrir todos los temas importantes.
Este libro se centra con orgullo en pequeños conjuntos de datos en memoria. Este es el lugar correcto
para comenzar porque no se puede abordar big data a menos que se tenga experiencia con big data. Las
herramientas que aprenderá en este libro manejarán fácilmente cientos de megabytes de datos y, con un
poco de cuidado, normalmente podrá utilizarlas para trabajar con 1 o 2 Gb de datos.

Python, Julia ni ningún otro lenguaje de programación útil para la ciencia de datos. Esto no se debe a
que pensemos que estas herramientas sean malas. ¡Ellos no están! Y en la práctica, la mayoría de los
equipos de ciencia de datos utilizan una combinación de lenguajes, a menudo al menos R y Python.
Sin embargo, creemos firmemente que es mejor dominar una herramienta a la vez. Mejorará más rápido
si profundiza, en lugar de extenderse sobre muchos temas.

Para descargar R, vaya a CRAN, la red integral de archivos de R a rchive . CRAN se compone de un
conjunto de servidores espejo distribuidos en todo el mundo y se utiliza para distribuir paquetes R y
R. No intentes elegir un espejo que esté cerca de ti: en su lugar, usa el espejo en la nube, https://cloud.r-
project.org , que lo resuelve automáticamente.

Una nueva versión principal de R sale una vez al año y hay 2 o 3 versiones menores cada año. Es una
buena idea actualizar periódicamente. Actualizar puede ser un poco complicado, especialmente para las
versiones principales, que requieren reinstalar todos los paquetes, pero posponerlo sólo lo empeora.

Studio
RStudio es un entorno de desarrollo integrado, o IDE, para programación en R. Descárguelo e instálelo
desde http://www.rstudio.com/download .

Ejecutar código R

La sección anterior le mostró un par de ejemplos de ejecución de código R. El código en el libro se ve


así:
1+2
#> [1] 3
Si ejecuta el mismo código en su consola local, se verá así:
>1+2
[1] 3

No existe un recurso único que le permita dominar R. A medida que comience a aplicar las técnicas
descritas en este libro a sus propios datos, pronto encontrará preguntas que no respondemos. Esta
sección describe algunos consejos sobre cómo obtener ayuda y cómo ayudarle a seguir aprendiendo.

Hay tres cosas que debe incluir para que su ejemplo sea reproducible: paquetes, datos y código
requeridos.
1. Los paquetes
2. La forma más sencilla de incluir datos
3. edique un poco de tiempo a asegurarse de que su código

También podría gustarte