Está en la página 1de 14

LOS 5 MEJORES LIBROS PARA

APRENDER DATA SCIENCE


INTRODUCCIÓN

Hola,

Antes que nada, y sólo por si no me conoces, permíteme que me presente.

Me llamo Isaac González. Llevo más de 15 años dedicándome profesionalmente a la


aplicación de Advanced Analytics y Data Science al ámbito de marketing y comercial.

Durante todos estos años he ido recopilando y leyendo multitud de libros sobre
Advanced Analytics / Big Data / Data Science.

He invertido bastante tiempo y dinero en ello, pero no te voy a engañar, lo hago


porque además de ser mi profesión es mi afición, y me gusta.

Y como todo en la vida, tengo unos favoritos, aquellos que considero que son de
mayor calidad o que me han aportado más.

En algunas ocasiones la gente me pregunta ¿qué libro me recomendarías sobre tu


temática?, y es por ello que he decidido crear este pequeño recurso.

Disfrútalos!
#5 - DATA SMART

DATOS:
Título: Data Smart: Using Data Science
to Transform Information into Insight

Autor/-es: John W. Foreman

Año: 2013

Páginas: 432

Precio: 33€

Recomendado para: Business


Analyst

Nivel de dificultad (1-10): 6

¿CUÁL ES EL CONTENIDO?
Lo primero es decir que no he pegado mal la imagen. La portada es al revés.
Básicamente es un libro sobre cómo hacer Data Science con Excel.
Tras un rápido repaso de las principales funciones de Excel que vas a necesitar
el libro se centra en describir cómo hacer con Excel: segmentaciones con
Kmedias, predicción con Naive Bayes y regresión, optimización, y forecasting
básico.
Además trae un capítulo para hacer Social Network Analytics con Gephi (es otro
programa visual y gratuito) y un capítulo especial sobre análisis de outliers.
#5 - DATA SMART

LO QUE ME GUSTA Y LO QUE NO


Es una puerta de entrada al mundo de Data Science para un usuario estilo
analista de negocio. Permite ir aprendiendo los algoritmos y su utilidad usando
solamente Excel.
Lo malo es que no hay casi nada sobre conceptos ni sobre metodología (eso
podrás aprenderlo en otros libros de esta lista). Por lo que este libro te dará
unos conocimientos muy procedimentales (sabrás cómo hacer las cosas pero
no muy bien el por qué).
#4 - DATA SCIENCE FOR BUSINESS

DATOS:
Título: Data Science for Business: What
you need to know about data mining and
data-analytic thinking

Autor/-es: Foster Provost, Tom Fawcett

Año: 2013

Páginas: 414

Precio: 33€

Recomendado para: Jefe de Proyecto

Nivel de dificultad (1-10): 7

¿CUÁL ES EL CONTENIDO?
Este libro es totalmente lo contrario del anterior. Se centra principalmente en los
conceptos y metodologías principales de Data Science y en explicar la lógica de
cómo funcionan los algoritmos.
Comienza describiendo la metodología clásica de un proyecto de Data Science.
Después te explica los conceptos básicos de Machine Learning: función de
ajuste, generalización, sobreajuste, validación cruzada, regularización, etc.
Luego dedica 2 capítulos a cómo evaluar correctamente los modelos predictivos.
Tiene un buen capítulo sobre Text Mining.
Durante todo el texto va describiendo los distintos algoritmos más usados.
#4 - DATA SCIENCE FOR BUSINESS

LO QUE ME GUSTA Y LO QUE NO


Para mí este libro es un tratado conceptual sobre Machine Learning, que enseña
sin complejidades técnicas todo lo que tienes que saber desde un punto de vista
más funcional.
Creo que es perfecto para usuarios estilo “jefe de proyecto”. Es decir, que tienen
que dominar el suficiente detalle como para saber qué hace cada técnica, si está
funcionando bien o no, y cómo cuando aplicarla al negocio. Pero que no van a
ser ellos quien la desarrollen directamente si no que cuentan con un equipo para
ello.
#3 - AN INTRODUCTION TO STATISTICAL LEARNING

DATOS:
Título: An Introduction to Statistical
Learning: with Applications in R

Autor/-es: Trevor Hastie, Gareth


James

Año: 2013 - 2017

Páginas: 426

Precio: 50€

Recomendado para: Data Scientist

Nivel de dificultad (1-10): 8

¿CUÁL ES EL CONTENIDO?
Es la versión “light” de The Elements of Statistical Learning, el cual para muchos
es la biblia del análisis avanzado de datos, pero muy duro desde el punto de
vista matemático.
Este sin embargo, dentro de ser un libro duro, se centra mucho más en los
conceptos, con un montón de ejemplos en R.
Comienza repasando los conceptos clave de Machine Learning como
supervisado/no supervisado, el problema sesgo/varianza y una pequeña
introducción a R.
A partir de ahí se mete a fondo con los algoritmos: de regresión, de clasificación,
de remuestreo, no lineales, basados en árboles, SVM, PCA, y Kmeans
#3 - AN INTRODUCTION TO STATISTICAL LEARNING

LO QUE ME GUSTA Y LO QUE NO


En esta versión “light” han intentado centra la explicación en los conceptos y en
pequeños ejemplos en R, prescindiendo de las formulaciones matemáticas.
No obstante no te dejes engañar, el hecho de que haya menos fórmulas no
significa que el libro no sea duro, ya que el nivel al que llega es realmente
potente.
Aunque este libro intenta centrase en los conceptos yo no lo recomendaría para
un Business Analyst ni un Jefe de proyecto como los anteriores, si no para el
Data Scientist que, teniendo ya una buena base, quiera ir al siguiente nivel.
#2 - PROGRAMMING COLLECTIVE INTELLIGENCE

DATOS:
Título: Programin Collective
Intelligence

Autor/-es: Toby Segaran

Año: 2007

Páginas: 333

Precio: 34€

Recomendado para: Data Scientist

Nivel de dificultad (1-10): 7

¿CUÁL ES EL CONTENIDO?
Este libro está muy centrado en la aplicación de Data Science al mundo de
internet.
Incluso cuando repasa los algoritmos más clásicos, por ej los árboles de
decisión, lo hace en use cases de internet, en este ejemplo para predecir
registros en páginas web.
Cubre temas como : filtrado colaborativo, text mining, algorítmos de búsqueda,
optimización, SVMs, factorización de matrices o algoritmos genéticos.
Y casos de uso como: sistemas de recomendación, clasificación de spam, opt-
ins de usuarios, precios en Ebay o análisis de datos bursátiles.
#2 - PROGRAMMING COLLECTIVE INTELLIGENCE

LO QUE ME GUSTA Y LO QUE NO


Hay que tener en cuenta que este libro tiene ya más de 10 años, por lo que
ealgunos enfoques ya están superados.
Aún así, el 90% de las empresas todavía no están haciendo lo que enseña este
libro por lo que, con las actualizaciones necesarias, para mi este libro es un
imprescindible.
Además fue de los primeros libros que empezó a aplicar un enfoque
eminentemente práctico y aplicado.
Definitivamente hay que tenerlo.
#1 - ANÁLISIS MULTIVARIANTE

DATOS:
Título: Análisis multivariante

Autor/-es: Joseph Hair

Año: 1999

Páginas: 832

Precio: 82€

Recomendado para: Business


Analyst

Nivel de dificultad (1-10): 6

¿CUÁL ES EL CONTENIDO?
La biblia del análisis multivariante, aunque dada su antigüedad (1999) está muy
centrado en un enfoque estadístico, cubriendo algunas técnicas que
prácticamente casi no se usan en la actualidad en la empresa como el análisis
discriminante, correlación canónica, etc
Sin embargo, la manera paso a paso y con ejemplos con la que va
desarrollando el contenido me parece de lo mejor que he visto.
#1 - ANÁLISIS MULTIVARIANTE

LO QUE ME GUSTA Y LO QUE NO


Tengo que reconocer que poner este libro en la primera posición es
posiblemente un sesgo emocional, ya que fue el libro con que aprendí análisis de
datos.
Y creo que esa es su gran fortaleza, más allá de que las técnicas estén
desactualizadas este libro es perfecto para aprender a ANALIZAR DATOS, en su
sentido más amplio.
La explicación a nivel conceptual, de la metodología y del por qué de cada
análisis hacen que merezca la pena al menos pensarse el tema del precio.
Sólo con este libro actualmente no irás a ningún lado, pero me atrevería a
decirte que, si quieres iniciarte en el análisis de datos es una buena idea dedícale
un tiempo a este libro para entender los por qué y luego ya pasa a alguno de los
anteriores de esta lista para aprender técnicas más actuales.
#BONUS 1 - BIG DATA PARA CEOS Y DIRECTORES
DE MARKETING

DATOS:
Título: Big Data para CEOs y Directores
de Marketing

Autor/-es: Isaac González

Año: 2017

Páginas: 207

Precio: 24€

Recomendado para: CEOs y


Directores de Marketing

Nivel de dificultad (1-10): 6

¿CUÁL ES EL CONTENIDO?
Bueno, este es mi libro. Así que lógicamente no podía meterlo en el
ranking.

Te prometí un ranking objetivo de los 5 mejores libros y 5 te he dado.

Pero por otro lado tampoco puedo dejarlo fuera, ya que sinceramente considero que es muy
buen libro.

Así que lo pongo como bonus :-).

Y no voy a darte ninguna valoración personal.

Prefiero que, si te parece de interés, te pases por Amazon y consultes lo que dicen los
lectores.

Es la mejor forma de poder hacerte una idea.


#BONUS 2 - ACCESO GRATUITO AL 7 DAYS MACHINE
LEARNING CHALLENGE

¿QUÉ ES ESTO?
Te he dado en este documento una recopilación de los mejores libros para aprender
Data Science según mi opinión.

Pero los libros no son la única manera. Y desde luego no son la más rápida.

Recientemente he liberado un curso gratuito para aprender Data Science aplicado al


negocio.

En menos de 7 días habrás construido tu primer modelo de machine learning, incluso


aunque nunca hubieras programado antes!

Y además usando la herramienta preferida por los Data Scientist profesionales: R y


Rstudio.

¿¿Te atreves a aceptar el desafío y ver si Data Science es para tí??

PUEDES APUNTARTE GRATIS AQUÍ

También podría gustarte