Está en la página 1de 8

Ruta de formación en

ANÁLISIS DE DATOS
PYTHON

300 horas
COMPETENCIA PARA
DESARROLLAR:

Manipula una gran cantidad de datos a través de diversos


lenguajes, librerías y modelos de regresión para para crear
estrategias de negocio, revelar tendencias y tomar
decisiones.

OBJETIVOS:

Generar un conjunto de datos a partir de la manipulación de bases de


datos relacionales y no relacionales para su posterior análisis, con el fin
de seguir buenas prácticas para diseñar y ejecutar poderosas y
eficientes consultas SQL y NoSQL.
Realizar tareas de limpieza, manipulación y análisis de bases de datos
utilizando el lenguaje de programación R, para después poder crear
visualizaciones, predicciones y modelaje matemático, que permitirán
transformar datos en información para mejorar la toma decisiones en
las organizaciones.

Utilizar Python para crear rutinas y scripts que permitan automatizar la


obtención, limpieza, procesamiento y transformación datos
provenientes de diferentes fuentes y formatos como: archivos locales,
APIs y bases de datos externas con el fin de tener data en condiciones
óptimas para su futuro análisis y visualización.

Utilizar Python y sus librerías para realizar análisis robustos de datos,


aplicando modelos estadísticos y matemáticos que permitan encontrar
patrones y elaciones en los datos con el fin de generar visualizaciones
de análisis univariados, bivariados y multivariados con Seaborn y
Matplotlib y aplicar modelo de regresión, clasificación y predicción.
BENEFICIOS:
En este certificado el aprendedor contará con habilidades necesarias
para manejar, gestionar y crear bases de datos relacionales y no
relacionales con NoSQL y SQL. Utilizará en un nivel
intermedio-avanzado R y Python, dos de los lenguajes de programación
más importantes en el mundo del análisis de datos. Por último, sabrá
utilizar los conceptos básicos de machine learning y de cálculo
diferencial para entrenar e implementar algoritmos y modelos de
regresión, clasificación y predicción, así como realizar procesamiento
de imágenes.

DIRIGIDO A:
Profesionistas del área de TI o afín, público general intersado en utilizar
datos de manera efectiva e inteligente para la toma de decisiones y
resolución de problemas mediante la generación de productos de datos
o sistemas inteligentes.

DURACIÓN Y 300 horas


MODALIDAD: Virtual
TEMARIO:
Temas
1 Introducción a las bases de datos
Fundamentos de SQL.
Agrupaciones y subconsultas.
Joins y vistas.
Configuración de bases de datos locales.
Fundamentos de MongoDB.
Consultas en MongoDB.
Agregaciones.
Query competition.

2 Programación y estadística con R


Introducción a la programación y estadística con R.
Programación con Objetos, Funciones, Condiciones y Loops.
Utilización de Scripts en R con aplicaciones para el análisis
de datos.
Integración de R con Bases de datos SQL, MongoDB y datos
de dominio público (URL)
Estadística I. Análisis Exploratorio de datos:
Análisis univariado y multivariado.
Estadística II. Distribuciones muestrales y paramétricas.
Modelado Matemático: Regresión y Predicción.
Gráficos Avanzados.
TEMARIO:
Temas
3 Procesamiento de datos con Python
Fundamentos de Python.
Estructuras de datos y funciones.
Programación funcional.
Pandas y análisis exploratorio de datos.
Funciones vectorizadas y limpieza de datos.
APIs, automatización y concatenación de DataFrames.
Transformación, filtración y ordenamiento de datos.
Bases de datos, merge y agrupaciones.

Análisis de datos con Python


4 Estimados de locación y variabilidad.
Introducción a la visualización de datos: distribuciones.
Exploración de variables categóricas y análisis multivariable.
Correlaciones y regresión lineal simple.
Distribuciones muestrales y técnicas de evaluación
de modelos.
Visualización de datos avanzada.
Pruebas A/B y procesamiento de lenguaje natural.
Introducción a Machine Learning: Clasificación no
supervisada y supervisada.
TEMARIO:
Temas
5 Machine Learning
Introducción a Machine Learning.
Separación, validación y evaluación para algoritmos de ML.
Algoritmos no supervisados.
Problemas de regresión.
Árboles de decisión.
Clasificación y Redes Neuronales Artificiales.
Arena de Clasificadores.
Fundamentos de Procesamiento de Imágenes.
Ingresa a
CDC.TECMILENIO.MX

También podría gustarte