Está en la página 1de 16

Programa de Especialización

ANÁLISIS DE DATOS
CON PYTHON
¿ POR QUÉ SER UN ANALISTA DE DATOS ?
DATA ANALYST

En un mundo donde el Big Data tiene cada vez


más influencia en las compañías, aprender
HORARIO Python se torna una prioridad para aquellos que
Lunes, Miércoles y Viernes buscan especializarse en el mundo del data
de 20h a 22h (LIM,BOG) analytics; con el fin de encontrar conocimiento
útil que permita explotar datos y tomar las
mejores decisiones incrementando la
productividad, y rentabilidad en las
organizaciones.

MODALIDAD Si bien, otros lenguajes de programación


Sesiones online síncronas también se han hecho un lugar en el sector
con metodología analítico, lo cierto es que son muchos los
Learning by Doing
argumentos por los que Python se ha
acabado por imponer en la industria del
análisis de datos, principalmente por lo
sencillo que resulta su aprendizaje y la
facilidad que posee para desarrollar
DURACIÓN diversas técnicas en minería de datos que
pueden ser aplicadas en distintas áreas y
192 horas múltiples plataformas.
académicas
DIRIGIDO A

.
Profesionales que busquen incursionar y
desarrollar análisis de grandes cantidades de datos.

Profesionales interesados en ampliar sus


.
conocimientos en herramientas de análisis de datos y
que se desempeñen como investigadores, analistas de
datos, procesamiento de datos, entre otros.

Todo profesional que desee incursionar en el mundo del


Machine Learning y Data Analytics como oportunidad en
. la línea de carrera.

Crea un
PRE-REQUISITOS plan estratégico
- Nociones básicas en programación.
- Cálculo diferencial e integral.
aplicando análisis
estadístico
- Tener ganas de aprender y tener claro el alcance del curso.
OBJETIVO GENERAL
Conocer,dominar y aplicar técnicas
de Data Analytics generando valor
con los datos y obteniendo mayor
rentabilidad para las empresas,
mediante el desarrollo de
algoritmos desarrollados en
Python.

Aplicar los conocimientos básicos de Machine


4 Learning para proyectos analíticos y sus
aplicaciones.

3
Comprender los conceptos esenciales de la estadística que te permitirán
entender y tomar decisiones correctas basadas en los datos.

OBJETIVOS
ESPECÍFICOS
2 Implementar cualquiera de los cinco principales modelos estadísticos sobre conjuntos
multivariados de datos.

1 Conocer las metodologías y adquirir los conocimientos necesarios sobre las herramientas existentes para implementar a
futuro proyectos de analítica de datos en su entorno laboral o académico.
TU EXPERIENCIA CON NOSOTROS

Clases en vivo Learning by Doing


El 100% de las clases que se Aprende Haciendo - Aprendizaje
desarrollan son en vivo orientado a proyectos

Recursos Adicionales Aprendizaje flexible


Acceso ilimitado a las sesiones Basado en diferentes casos de
negocio junto a expertos en BI
grabadas , videos y lecturas
con un mentor a tu disposición

Método B-Learning Evaluación


Método de enseñanza Pruebas de autoevaluación
Síncrono y Asíncrono y repaso contínuo
MALLA CURRICULAR

INTRODUCCIÓN AL INTRODUCCIÓN AL EL FLUJO DE LOS ANALÍTICA INTRODUCCIÓN A INTRODUCCIÓN A LIMPIEZA Y


VISUALIZACIÓN
DESCRIPTIVA Y PREPARACIÓN DE
ANÁLISIS DE DATOS ÁLGEBRA LINEAL DATOS NUMPY PANDAS EN PYTHON
PREDICTIVA DATOS

FUNDAMENTOS PARA EL ANÁLISIS DE DATOS PYTHON PARA EL ANÁLISIS DE DATOS

SERIES DE TIEMPO ANÁLISIS REGRESIÓN REGRESIÓN PRUEBAS DE ESTIMACIÓN MEDIDAS DE RESUMEN PROBABILIDAD Y
LINEAL Y REPRESENTACIÓN VARIABLES
MULTIVARIANTE LOGÍSTICA HIPÓTESIS DE DATOS ALEATORIAS

MODELOS ESTADÍSTICOS ESTADÍSTICA DESCRIPTIVA E INFERENCIAL

PROYECTO FINAL

INTRODUCCIÓN A FASES EN MACHINE APRENDIZAJE APRENDIZAJE NO


SUPERVISADO
MACHINE LEARNING LEARNING SUPERVISADO

MACHINE LEARNING CERTIFICACIÓN


1
FUNDAMENTOS PARA EL ANÁLISIS DE DATOS


INTRODUCCIÓN AL
ANÁLISIS DE DATOS

Evolución del valor de los datos.


Big Data: Conceptos y
INTRODUCCIÓN AL
ÁLGEBRA LINEAL

• Vectores, matrices, arreglos,


independencia lineal, sistemas
EL FLUJO DE LOS
DATOS

• Datos versus Información.


• Tipología de los datos.
ANALÍTICA
DESCRIPTIVA Y
PREDICTIVA
• Analítica descriptiva vs predictiva.
• Visualización de datos.
herramientas. de ecuaciones lineales. • Visualización de datos. • La estadística y el aprendizaje de
• Internet de las cosas: Conceptos y • Rango, traza, traspuesta, inversa • Análisis de datos. máquina.
herramientas. de una matriz. • Productos basados en datos: • Aprendizaje supervisado y no
• Inteligencia artificial: Conceptos y • Determinante. Definición de producto basado en supervisado.
herramientas. • Matriz identidad, simétrica, datos. • Identificación de problemas de
• Ciencia de datos: Conceptos y triangular. • Flujo de trabajo (workflow). clasificación, regresión y
herramientas. • Autovalores, autovectores. • Personas, procesos y productos segmentación.
• Perspectiva laboral. basados en datos. • Enfoque del proyecto individual.
• Metodología CRISP-DM (Cross • Metodología de proyectos de
Industry Standard Process for datos.
Data Mining). • Herramientas para la construcción
• Cultura de datos en las del producto.
organizaciones: Cómo • Aportes económicos de un
implementarla. proyecto de análisis de datos.
• Conceptos clave para el trabajo • Metodología del proyecto
con datos: Tidy data, ETL (Extract, individual.
Transform, Load).
• Selección de un proyecto
individual.

PROYECTO INTEGRADOR: PRIMER ENTREGABLE


El alumno debe definir un tema para ser desarrollado durante el programa completo. Para ello se utilizará el formato de artículos IEEE. Como primer entregable del
curso de fundamentos, debe presentar la introducción, indicando la problemática a abordar, justificación y alcance de su propuesta. También, debe indicar el dataset
que usará (propio o de algún repositório público).
LIMPIEZA Y
PREPARACIÓN DE
DATOS
• Búsqueda y eliminación de datos
duplicados por filas y columnas.
VISUALIZACIÓN
EN PYTHON
(MATPLOTLIB)
• Elementos de un gráfico.
• Visualización de datos univariados
INTRODUCCIÓN A
PANDAS

• Series y dataf rames.


• Indexado y manejo de archivos
INTRODUCCIÓN A
NUMPY

• Creación y tratamiento de arrays


en Numpy.
2
• Transformación de Datos. y multivariados. separados por comas (CSV). • Operadores aritméticos en Numpy.

PYTHON PARA EL ANÁLISIS DE DATOS


• Preprocesamiento de datos con • Gráficos para visualizar relaciones • Formato de lectura para cargar y • Funciones universales en Numpy.
Python. entre categorías. guardar dataf rames. • Indexing, Slicing e Iterating.
• Formato y normalización de datos. • Gráficos para visualizar • Manipulación de dataf rames. • Funciones y métodos de Numpy.
• Casos de uso. comparaciones. • Seleccionar columnas. • Trucos de indexación en Numpy.
• Gráficos para visualizar • Seleccionar filas por valor e índice. • Operadores de Álgebra Lineal.
composiciones. • Cambiar tipos de columnas. • Generación de números aleatorios
• Gráficos para visualizar • Concatenar dataf rames. en Numpy.
distribuciones. • Agregar, eliminar, editar filas y
• Gráficos compuestos columnas.
• Funciones matemáticas en Pandas.
• Operadores en Pandas.
• Group by.

Caso práctico: Casos prácticos: Casos prácticos:


Casos prácticos: Visualización de datos con Matplotlib Beneficios de Numpy
Series y Dataframes con Pandas
Banco de Brasil - Limpieza y Matrices con Numpy
Inspección de Series y Dataframe
preparación de datos de los clientes. Laboratorio:
Banco de Brasil - Tratamiento de datos Miniproyecto - Exploración de datos Laboratorio:
Laboratorio:
de los clientes. confirmados de coronavirus en Perú. Manipulación de datos con Numpy
Exploracion de ventas de una supertienda

PROYECTO INTEGRADOR: SEGUNDO ENTREGABLE

Como segundo entregable , el alumno debe seleccionar la metodología para el análisis exploratorio univariable y multivariable del dataset; con el fin de presentar e
interpretar gráficos para comprender la naturaleza del set de datos . También debe indicar el preprocesamiento que se ha realizado.

matplotlib
3
ESTADÍSTICA DESCRIPTIVA E INFERENCIAL PROBABILIDAD Y
VARIABLES
ALEATORIAS

• Probabilidades, espacio muestral,


MEDIDAS DE RESUMEN
Y REPRESENTACIÓN
DE DATOS

• Medidas de tendencia central,


ESTIMACIÓN

• Universo, población y muestra.


PRUEBAS DE
HIPÓTESIS

• Sistema de hipótesis.
eventos, operaciones de media, moda, mediana y cuantiles. • Distribución conjunta, marginal, • Tipos de error, nivel de
conjuntos. • Medidas de dispersión, rango, condicional. significación.
• Diagramas de Venn. varianza, desviación estándar. • Vector de esperanzas, matriz de • Estadístico de prueba, regla de
• Teorema de Bayes y demás • Tabla de datos. covarianzas, correlaciones. decisión.
teoremas sencillos de • Tabla de f recuencias. • Muestreo aleatorio. • Relación entre la prueba de
probabilidad. • Gráficos de barras, proporciones y • Función de verosimilitud. hipótesis y el intervalo de
• Variables aleatorias. líneas. • Teorema del límite central. confianza.
• Esperanza y varianza. • Histograma. • Distribuciones derivadas de la • Pruebas sobre la media.
• Distribuciones de probabilidad • Gráfico de dispersión y de cajas. normal. • Prueba sobre la varianza.
discretas. • Estimación de parámetros. • Prueba de la diferencia de medias.
• Distribuciones de probabilidad • Intervalos de confianza. • Prueba de independencia
continuas. • Chi-cuadrado.

Laboratorios
Laboratorio: Laboratorio:
Distribuciones de probabilidades Laboratorio:
Medidas de tendencia central y de Intervalos de confianza
discretas Pruebas de hipótesis
dispersión
Distribuciones de probabilidades
contínuas

matplotlib
SERIES DE TIEMPO

• Notación.
• Media móvil.


ANÁLISIS
MULTIVARIANTE

Análisis Discriminante.
Pruebas de hipótesis.


REGRESIÓN
LOGÍSTICA

Formulación a partir del Modelo.


Lineal Generalizado.
REGRESIÓN
LINEAL

• Repaso del álgebra lineal


• Formas lineales, cuadráticas y
4
• Estacionariedad:autocovarianza, • Interpretación. • Estimación de parámetros. bilineales.
autocorrelación. • Selección de variables. • Pruebas de hipótesis. • Formulación del modelo.
• Variograma. • Clasificación. • Diagnóstico. • Principales supuestos.
• Transformación de Box-Cox. • Comparación con la regresión • Curvas ROC. • Estimación de los parámetros.
• Tendencia y Estacionalidad. logística. • Regresión logística en Python. • Pruebas de hipótesis sobre los
• Regresión para retirarlas. • Análisis de Componentes. parámetros

MODELOS ESTADÍSTICOS
• Metodología para el modelado. • Principales (PCA). • Interpretación, pruebas de bondad
• Métodos de suavización • Aproximación geométrica. del ajuste, diagnóstico.
exponencial. • Aproximación algebraica. • Regresión lineal en Python.
• Modelo autorregresivo de media • Componentes principales.
móvil integrado (ARIMA). • Decisión sobre cuáles retener.
• Series de tiempo en Python. • Interpretación.
• Selección de variables.
• PCA y Discriminante en Python

Laboratorio:
Laboratorios Análisis discriminante lineal (LDA) Laboratorio: Laboratorio:
Series de Tiempo Regresión lineal multiple Regresión Logística Manejo de matrices
Análisis de Componentes
Principales (PCA)

PROYECTO INTEGRADOR: TERCER ENTREGABLE

Aplicar alguno(s) de los modelos estadísticos estudiados a un problema definido, de interés del alumno. Dicho problema puede estar incluido en su proyecto transversal
(durante el programa) o provenir de algún nuevo problema a definir.

matplotlib
5 •

INTRODUCCIÓN A
MACHINE LEARNING
Definición.
Historia.


FASES EN MACHINE
LEARNING
Fases en Aprendizaje de Máquina.
Recolección de datos.


APRENDIZAJE
SUPERVISADO
Introducción.
Técnicas para Regresión.
APRENDIZAJE NO
SUPERVISADO
• Introducción.
• Técnicas de Agrupamiento.
• Aplicaciones. • Preparación de datos. • Técnicas para Clasificación. • Algoritmos de particionamiento
• Tipos de aprendizaje. • Extracción de características. • Evaluación de Desempeño. (K-means, K-means++, K-medoides).
• Argot de Aprendizaje de Máquina. • Selección de un modelo. • Overfitting y underfitting. • CLARA (Agrupación de aplicaciones
• Áreas Relacionadas. • Entrenamiento y Evaluación. • Métricas de evaluación. grandes).
• Limitaciones. • Ajuste de hiperparámetros. • Teoría de Decisión. • Algoritmos de jerarquía
• Bibliotecas. • Predicción. (Aglomerativo y Divisivo).
• Principales Conferencias. • Basado en densidad (DBScan).
• Evaluación de Desempeño.
• Métricas de evaluación.
MACHINE LEARNING

Caso práctico: Casos prácticos: Casos prácticos:


Casos prácticos: Agrupamiento con Reducción de
Operaciones Avanzadas con Pandas Algoritmos de clasificación
Operaciones con pandas
Algoritmos de Regresión Dimensionalidades
Lectura con Pandas
Laboratorio: Análisis de Componentes Principales
Operaciones y lecturas con Pandas Laboratorio: DBScan Clustering
Práctica KmeansClustering Hierarchical_Clustering

PROYECTO FINAL

Como último entregable el alumno debe aplicar alguno(s) de los modelos de Machine Learning estudiados a un problema definido, de interés del alumno. Dicho
problema puede estar incluido en su proyecto transversal (durante el programa) o provenir de algún nuevo problema a definir.

matplotlib
CERTIFICACIÓN COMO ANALISTA DE DATOS

Certificación Parcial
5 certificados parciales por competencias adquiridas:
- Fundamentos para el análisis de datos
- Python para el análisis de datos
- Estadística descriptiva e inferencial
- Modelos estadísticos
- Machine Learning

Certificación Total

Certificado a nombre de Data Science Research Perú :


Especialista en Análisis de Datos con Python
NUESTROS DOCENTES

EDWIN ESCOBEDO ERNESTO PONSOT JORGE GUEVARA AUREA SORIANO


CÁRDENAS DIAZ VARGAS

Consultor en Data Science y Científico de Datos e Investigador


Consultor en Data Science, docente universitario. en Inteligencia Artificial y docente Investigador y docente universitario.
investigador y docente universitario. universitario.
Experiencia: Experiencia:
Experiencia: Experiencia:
+30 años de experiencia como +13 años en Computer Science
+8 años en Data Science +15 años en Computer Science
consultor en Data Science Carrera:
Carrera: Carrera:
Carrera: PhD. in Computer Science
PhD. in Computer Science PhD. in Computer Science
PhD. in Statistics Systems Engineering
Systems Engineering
NUESTROS DOCENTES

RUBÉN TUPAYACHI JULISSA VILLANUEVA OSCAR CUADROS


LATORRE LLERENA LINARES

Investigador y docente universitario. Consultor en Data Science, Investigador postdoctoral en la


investigador y docente universitario. Universidad de São Paulo.
Experiencia: Experiencia: Experiencia:
+5 años en Análisis de Datos +8 años en Computer Science + 14 años en Computer Science
Carrera: Carrera: Carrera:
Msc. in Physics PhD(c). in Computer Science PhD. in Computer Science
Systems Engineering Informatics Engineering
NUESTROS DIFERENCIALES

Alianzas con
grandes empresas
corporativas

Plana Docente Servicios con


nacional e precios acorde
internacional al mercado

Experiencia
Capacitaciones
capacitando a
especializadas
diversas empresas
con aplicación
de distintos
de Práctica
sectores
Inmediata
económicos

Generador de
impacto social
con la Ciencia
de Datos y la
Inteligencia
Artificial
¿Tienes dudas?

Escríbenos para saber si tenemos un


descuento adicional para ti.

¡Hablemos por WhatsApp!

Síguenos:

También podría gustarte