Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniería de Datos?
https://es.wikipedia.org/wiki/Ciencia_de_datos
¿Qué es la Ciencia e
Ingeniería de Datos?
Técnicas de Visualización
Estadistica
Explora los datos sin ninguna tipo hipótesis previa a fin de lograr la comprensión de los
mismos, también ayuda a comprender el procesos que genero los datos.
Generan Resumen Estadísticos, limpieza a fondo de los datos, así mismo determinar si los
datos son aptos para el modelo y se realizan comparaciones utilizando técnicas de
Visualización.
Análisis Confirmatorio
Se establece una hipótesis antes de recopilar los datos para la comprobación. En el Big Data y en
la Ciencia de Datos, la hipótesis es generada a partir de los datos que ya fueron recopilados.
En La Ciencia De Datos por lo general no se establecen hipótesis hasta que se lleve acabo el EDA
Técnicas de Visualización
Visualización de Datos : Es una técnica a través de la cual los resultados de analítica son comunicados
gráficamente utilizando gráficos, mapas, Histogramas, entre otros.
POWER BI - Contexto
Power BI es un servicio de análisis de negocios basado en la nube, Que permite un acceso rápido y fácil a los datos,
descubrimiento de datos y exploración de ideas de Cualquier dispositivo en toda la organización
Rápido Desarrollo.
POWER BI
¿Cuándo debo usar Python vs R?
PYTHON
https://www.python.org/downloads/
• ¿Qué es?
• Python es un lenguaje de programación creado por Guido
Van Rossum, con una sintaxis muy limpia, ideado para
enseñar a la gente a programar bien.
Ventajas
Legible: La codificación y depuración es fácil debido a la
sintaxis simple
Productivo: ahorra mucho código.
Portable: para todo sistema operativo.
Recargado: viene con muchas librerías por defecto.
¿Cuándo debo usar Python vs R?
RSTUDIO
https://rstudio.com/products/rstudio/download/
• ¿Qué es?
Rstudio es un lenguaje de programación creado por R fue creado en
1992 en Nueva Zelanda por Ross Ihaka y Robert Gentleman, es un
conjunto de programas integrados para el manejo de datos,
simulaciones, cálculos y realización de gráficos.
Ventajas
Legible: Es un lenguaje bastante adecuado para la estadística.
Productivo: Si no tiene experiencia en codificación, entonces R
puede ser más fácil de aprender
Portable: Se ejecuta en muchas plataformas..
Recargado: viene con muchas librerías por defecto.
VENTAJAS
Ampliamente considerada la mejor herramienta para hacer Los lenguajes de programación de uso general son
hermosos gráficos y visualizaciones. útiles más allá del simple análisis de datos.
Tiene muchas funcionalidades para el análisis de datos. Ha ganado popularidad por su legibilidad de código,
velocidad y muchas funcionalidades.
Posee un editor de datos, con soporte de depuración y Tiene alta facilidad de implementación y
una ventana para visualizar gráficos también. reproducibilidad.
DESVENTAJAS
Las visualizaciones son más complicadas y los R puede considerarse lento si el código está mal
resultados no son tan agradables o escrito.
informativos.
Data
Scientist
Machine Learning
Engineer
Data
Analyst
Software
Engineer ML
Machine Learning
Researcher
Software
Engineer
Career Path
¿Dónde aplican los roles?
Donde puedo aplicar
análisis de Datos
Problema
Objetivo
Información
Impacto
Semillas = Algoritmos
Nutrientes = Datos
Jardinero = Tú
Plantas = Modelo/Programa