Está en la página 1de 2

Introduccin a Data Science

Articulo de introduccin: http://www.iebschool.com/blog/cientifico-datos-big-data/

Cursos Online

Fundamentos del anlisis de datos para la toma de decisiones


https://www.coursera.org/learn/analisis-de-datos/home/welcome
Intro to Data Science Learn What It Takes to Become a Data Scientist
https://www.udacity.com/course/intro-to-data-science--ud359

Libros de Consultas
https://books.google.com.co/books?id=X2wvDgAAQBAJ&printsec=frontcover&dq=da
ta+science+for+dummies+book&hl=es-
419&sa=X&ved=0ahUKEwi88OK4vcHVAhUF4SYKHa7eA_8Q6wEIHjAA#v=onepag
e&q=data%20science%20for%20dummies%20book&f=false

Principales competencias relacionadas con un cientfico de datos:

Temas para estudiar:

lgebra, especialmente en conocimientos de clculo de matrices, geometra de


difusin y temas similares en matemticas aplicadas.
Estadstica, incluyendo temas como por ejemplo la regresin lineal, regresin
multivariable y correlacin entre variables.
Programacin, Es necesario dominar los conceptos tericos de programacin
estructurada i orientada al objeto, as como los conceptos relacionados de
complejidad computacional. Los lenguajes ms empleados, actualmente, son Python
y R. Tambin es importante conocer el lenguaje de scripting (bash) de los sistemas
Unix/Linux.
Conocimientos de diseo y uso de bases de datos relacionales. Incluye temas de
diseo, como por ejemplo indexacin, normalizacin, constraints o diseo fsico; y
tambin conceptos de querying y optimizacin de consultas. Recientemente tambin
se deben incorporar conocimientos de diseo y uso de bases de datos NoSQL y
NewSQL. Conocimientos de sistemas distribuidos (distributed computing y High
Performance Computing, HPC), que abarcan conceptos relacionados con los
modelos y problemas de la computacin distribuida y el almacenamiento de datos
distribuidos.
Conocimientos profundo de los modelos y algoritmos de minera de datos (data
mining) y aprendizaje automtico (machine learning). En este campo se incluyen
algoritmos supervisados (com por ejemplo, rboles de desicin, Redes neuronales,
mtodos probabilsticos, SVM, etc) y no supervisados (agrupamiento jerrquico o k-
means) para problemas de clasificacin, regresin o clustering. Conocer las distintas
tipologas y el ciclo de vida de los datos es, tambin, una competencia muy relevante
en este tipo de profesionales. Aqu se incluyen competencias relacionadas con la
captura de datos (IoT, web semntica, open y linked data, entre muchos otros),
etiquetado mediante meta-datos o procesos de extraccin, transformacin y carga
(ETL, Extraction, Transform and Load). En conjunto, se conoce como modelado de
datos o data modeling.
Tcnicas y herramientas de visualization de datos, que permiten identificar patrones
de forma visual o presentar los resultados de una forma clara y concisa. Algunos de
las herramientas ms relevantes son Tableau, D3.js o Processing. La experincia i
conocimiento del dominio (domain expertise) es, sin duda, una parte clave en el
proceso de anlisis de datos. Este conocimiento permite entender los datos en toda
su profundidad y realizarse las preguntas adecuadas y relevantes.
La gestin del proyecto (project management), como en cualquier otro proyecto,
ocupa tambin una parte destacada de los conocimientos y competencias que debe
tener un data scientist. Finalmente, pero no por ello menos importante, un cientfico
de datos debe tener los conocimientos ticos y de privacidad necesarios para poder
trabajar de forma adecuada con todos los datos que manipula durante la ejecucin
de un proyecto.
http://dataanalysis.blogs.uoc.edu/2017/05/12/competencias-de-un-data-scientist/

También podría gustarte