Está en la página 1de 18

Programa de Especialización en

Análisis de Datos con Python


¿Quiénes somos?

Somos una organización educativa que nace


para difundir, descentralizar y democratizar la
educación en ciencia de datos e inteligencia ar-
tificial en el país. Hoy el mundo ha cambiado y
la transformación digital juega un rol importan-
te en las organizaciones, los datos son la nueva
mina de oro y la ciencia de datos es la profesión
del futuro.

¿Cómo lo hacemos?

Difundir Democratizar Descentralizar

Los conocimientos de Ciencias de Datos e Inteligencia Artificial en


favor de las personas, para desarrollar sus talentos y maximizar sus
oportunidades, contribuyendo con la construcción de sociedades
más justas.
Programa de Especialización
en Análisis de Datos con Python

Aprenda a implementar un proyecto de análisis de datos con técnicas es-


tadísticas y de Machine Learning utilizando Python.

El presente programa de especialización en análisis de datos con Python


busca introducir a profesionales de distintos perfiles al mundo de la ana-
lítica de datos desde cero. Al final del programa adquirirá habilidades que
podrán verse reflejadas en un proyecto final que sumará a su portafolio
personal.

En cada curso realizado, se tendrá un incremental mínimo viable del pro-


yecto personal que desees proponer, además de la asesoría constante de
los docentes. Se explora desde los fundamentos y propuestas de proyectos
de análisis de datos, el aprendizaje básico a intermedio de un lenguaje de
programación demandado en puestos de analítica como es Python, apren-
dizaje del análisis estadístico de los datos hasta los modelos estadísticos
más utilizados y por último las técnicas más fundamentales de Machine
Learning para potenciar tu solución.

Modalidad Duración
6 meses
Online en vivo 144 horas lectivas
192 horas académicas

Pre-requisitos Aprendizaje Flexible


Nociones elementales en Las clases serán grabadas
programación, Cálculo en nuestra plataforma
diferencial e integral y SQL. con disponibilidad 24/7.
Fundamentos para el
Análisis de Datos

El presente curso, de naturaleza teórico-práctica, tiene como


propósito brindar las metodologías y conocimientos sobre
las herramientas existentes para que los estudiantes puedan
implementar a futuro proyectos de analítica de datos en su
entorno laboral o académico. Comprende temas como: meto-
dología de proyectos de análisis de datos y ciencia de datos,
tecnologías y herramientas existentes para el análisis de datos
y nociones de vectores y matrices.

Modalidad Duración
24 horas lectivas
Online en vivo 32 horas académicas

Pre-requisitos Aprendizaje Flexible


Las clases serán grabadas
Ninguno en nuestra plataforma
con disponibilidad 24/7.
Módulos

1.- Introducción al análisis de datos 2.- Introducción al álgebra lineal


(6h) (6h)

Evolución del valor de los datos. Big Vectores, matrices, arreglos, indepen-
Data: conceptos y herramientas. Inter- dencia lineal, sistemas de ecuaciones
net de las cosas: conceptos y herramien- lineales. Rango, traza, traspuesta, inver-
tas. Inteligencia artificial: conceptos y sa de una matriz. Determinante. Matriz
herramientas. Ciencia de datos: concep- identidad, simétrica, triangular. Autova-
tos y herramientas. Perspectiva laboral. lores, autovectores.
Metodología CRISP-DM (Cross Indus-
try Standard Process for Data Mining).
Cultura de datos en las organizaciones:
como implementarla. Conceptos clave
para el trabajo con datos: Tidy data, ETL
(Extract, Transform, Load). Selección de
un proyecto individual.

3.- El flujo de los datos (4h) 4.- Analítica descriptiva y predictiva


(8h)

Datos versus Información. Tipología de Analítica descriptiva vs. predictiva. Vi-


los datos. Visualización de datos. Análi- sualización de datos. La estadística y el
sis de datos. Productos basados en da- aprendizaje de máquina. Aprendizaje
tos: Definición de producto basado en supervisado y no supervisado. Identifi-
datos. Flujo de trabajo (workflow). Per- cación de problemas de clasificación,
sonas, procesos y productos basados en regresión y segmentación. Enfoque del
datos. Metodología de proyectos de da- proyecto individual.
tos. Herramientas para la construcción
del producto. Aportes económicos de
un proyecto de análisis de datos. Meto-
dología del proyecto individual.
Python para el Análisis
de Datos

El presente curso, de naturaleza teórico-práctica, tiene como


propósito brindar los conocimientos esenciales de las librerías
utilizadas para el lenguaje de programación Python. Se estu-
dian las librerías Numpy y Pandas a profundidad, junto con las
librerías de visualización. Finalmente, se presentan casos de
uso donde el alumno aprenderá las estrategias para la limpie-
za y transformación de sus datos.

Modalidad Duración
24 horas lectivas
Online en vivo 32 horas académicas

Pre-requisitos Aprendizaje Flexible


Nociones elementales de Las clases serán grabadas
programación y Álgebra en nuestra plataforma
Lineal con disponibilidad 24/7.
Módulos

1.- Introducción a Numpy (6h) 2.- Introducción a Pandas (8h)

Creación y tratamiento de arrays en Numpy. Series y dataframes. Indexado y manejo de


Operadores aritméticos en Numpy. Funcio- archivos separados por comas (Comma Se-
nes universales en Numpy. Indexing, Slicing parated Values - CSV). Formato de lectura
e Iterating. Funciones y métodos de Numpy. para cargar y guardar dataframes. Manipu-
Trucos de indexación en Numpy. Operado- lación de dataframes. Seleccionar columnas.
res de Álgebra Lineal. Generación de núme- Seleccionar filas por valor. Seleccionar filas
ros aleatorios en Numpy. por índice. Cambiar tipos de columnas. Con-
catenar dataframes. Agregar, eliminar, edi-
tar filas y columnas. Funciones matemáticas
en Pandas. Operadores en Pandas. Group by.

3.- Visualización en Python (4h) 4.- Limpieza y preparación de datos


(6h)
Elementos de un gráfico. Visualización Búsqueda y eliminación de datos du-
de datos univariados y multivariados. plicados por filas y columnas. Transfor-
Gráficos para visualizar relaciones en- mación de Datos. Preprocesamiento de
tre categorías. Gráficos para visualizar datos con Python. Formato y normaliza-
comparaciones. Gráficos para visualizar ción de datos. Casos de uso.
composiciones. Gráficos para visualizar
distribuciones. Gráficos compuestos.
Estadística Descriptiva
e Inferencial

Este curso está diseñado para el aprendizaje de los principales


conceptos de la Estadística desde la noción de probabilidad
hasta el desarrollo de pruebas de hipótesis.

Tiene una naturaleza teórico-práctica con énfasis en la


implementación de las soluciones en Python.

Modalidad Duración
24 horas lectivas
Online en vivo 32 horas académicas

Pre-requisitos Aprendizaje Flexible


Análisis de datos con Las clases serán grabadas
Python y nociones básicas en nuestra plataforma
de cálculo diferencial e
integral con disponibilidad 24/7.
Módulos

1.- Probabilidad y variables aleato- 2.- Medidas de resumen y represen-


rias (8h) tación de datos (4h)

Probabilidades, espacio muestral, even- Medidas de tendencia central, media,


tos, operaciones de conjuntos, diagra- moda, mediana y cuantiles. Medidas de
mas de Venn. Teorema de Bayes y de- dispersión, rango, varianza, desviación
más teoremas sencillos de probabilidad. estándar. Tabla de datos. Tabla de fre-
Variables aleatorias. Esperanza y varian- cuencias. Gráficos de barras, proporcio-
za. Distribuciones de probabilidad dis- nes y líneas. Histograma. Gráfico de dis-
cretas. Distribuciones de probabilidad persión y de cajas.
continuas.

3.- Estimación (6h) 4.- Pruebas de hipótesis (6h)

Universo, población y muestra. Distri- Sistema de hipótesis. Tipos de error,


bución conjunta, marginal, condicional. nivel de significación. Estadístico de
Vector de esperanzas, matriz de cova- prueba, regla de decisión. Relación en-
rianzas, correlaciones. Muestreo aleato- tre la prueba de hipótesis y el intervalo
rio. Función de verosimilitud. Teorema de confianza. Pruebas sobre la media.
del límite central. Distribuciones deri- Prueba sobre la varianza. Prueba de la
vadas de la normal. Estimación de pará- diferencia de medias. Prueba de inde-
metros. Intervalos de confianza. pendencia Chi-cuadrado.
Modelos
Estadísticos

Este curso está diseñado para el aprendizaje de cinco de


las principales técnicas estadísticas de aplicación práctica
sobre conjuntos multivariados de datos, a saber: el modelo
de regresión lineal múltiple, el modelo de regresión logís-
tica, el análisis discriminante, el análisis de componentes
principales y el análisis de series temporales.

Tiene una naturaleza teórico-práctica con énfasis en la


implementación de las soluciones en Python.

Modalidad Duración
36 horas lectivas
Online en vivo 48 horas académicas

Pre-requisitos Aprendizaje Flexible


Nociones de estadística des- Las clases serán grabadas
criptiva e inferencial. Análisis en nuestra plataforma
de datos con Python. con disponibilidad 24/7.
Módulos

1.- Regresión Lineal (12h) 2.- Regresión Logística (8h)

Repaso del álgebra lineal. Formas linea- Formulación a partir del Modelo Lineal
les, cuadráticas y bilineales. Formulación Generalizado. Estimación de paráme-
del modelo, principales supuestos, esti- tros. Pruebas de hipótesis. Diagnósti-
mación de los parámetros, pruebas de co. Curvas ROC. Regresión logística en
hipótesis sobre los parámetros, interpre- Python.
tación, pruebas de bondad del ajuste,
diagnóstico. Regresión lineal en Python.

3.- Análisis Multivariante (10h) 4.- Series de Tiempo (6h)

Análisis Discriminante. Pruebas de hipó- Notación. Media móvil. Estacionarie-


tesis. Interpretación. Selección de varia- dad: autocovarianza, autocorrelación.
bles. Clasificación. Comparación con la Variograma. Transformación de Box-
regresión logística. Análisis de Compo- Cox. Tendencia y Estacionalidad. Regre-
nentes Principales (PCA). Aproximación sión para retirarlas. Metodología para
geométrica. Aproximación algebraica. el modelado. Métodos de suavización
Componentes principales. Decisión so- exponencial. Modelo autorregresivo de
bre cuáles retener. Interpretación. Se- media móvil integrado (ARIMA). Series
lección de variables. PCA y Discriminan- de tiempo en Python.
te en Python.
Machine Learning

El presente curso, de naturaleza teórico-práctica, tiene como


propósito brindar los conocimientos básicos de Machine
Learning para proyectos analíticos.

Contempla las técnicas de Machine Learning, métricas para


evaluar la performance de modelos analíticos, aprendizaje
supervisado y no supervisado.

Modalidad Duración
36 horas lectivas
Online en vivo 48 horas académicas

Pre-requisitos Aprendizaje Flexible


Las clases serán grabadas
Análisis de datos con
Python y modelos estadísti- en nuestra plataforma
cos básicos. con disponibilidad 24/7.
Módulos

1.- Introducción a Machine Learning 2.- Fases en Machine Learning (8h)


(3h)

Definición. Historia. Aplicaciones. Tipos Fases en Aprendizaje de Máquina. Reco-


de aprendizaje. Argot de Aprendizaje de lección de datos. Preparación de datos.
Máquina. Áreas Relacionadas. Limitacio- Extracción de características. Selección
nes. Bibliotecas. Principales Conferen- de un modelo. Entrenamiento y Evalua-
cias. ción. Ajuste de hiperparámetros. Predic-
ción.

3.- Aprendizaje Supervisado (12h) 4.- Aprendizaje no Supervisado (13h)

Introducción. Técnicas para Regresión. Introducción. Técnicas de Agrupamien-


Técnicas para Clasificación. Evaluación to: Algoritmos de particionamiento
de Desempeño. Overfitting y underfit- (K-means, K-means++, K-medoides),
ting. Métricas de evaluación. Teoría de CLARA (Agrupación de aplicaciones
Decisión. grandes), Algoritmos de jerarquía (Aglo-
merativo y Divisivo), Basado en densi-
dad (DBScan). Evaluación de Desempe-
ño. Métricas de evaluación.
Evaluación
El sistema de evaluación del curso está dirigido a valorar el nivel de competencias
alcanzado para cumplir los objetivos educativos mediante la evaluación de:

1. Evaluación continua: 40%


2. Proyecto final: 60%

La evaluación continua se puede componer de


laboratorios, controles de lectura, prácticas
calificadas, casos de estudio, problemas guiados,
controles orales y evaluaciones durante el curso
según disponga el docente.

El proyecto final debe reflejar todo lo aprendido


en el curso, este se puede componer de un código
ejecutable, presentación frente a clase, informe,
diapositivas, póster, artículo de difusión y artículo
de investigación según disponga el docente.

Certificación
Al finalizar el programa, el alumno recibirá certificado por cada curso y un diploma
por el Programa de Especialización de Análisis de Datos con Python que será emitido
como “Especialista en Análisis de Datos con Python” (192 horas académicas).
Estrategias didácticas
El curso tiene la intención de generar espacios de discusión donde puedan
compartirse los beneficios de la experiencia y conocimiento individual. Las
estrategias didácticas que se desarrollarán durante el curso son:

1. Casos de estudio
2. Aprendizaje orientado a proyectos
3. Aprendizaje colaborativo
4. Enseñanza problemática

Nuestras Herramientas

Plataforma de desarrollo
Plataforma en donde
con Python
se coordina e informa
sobre la capacitación al
alumno

Plataforma interactiva
para el aprendizaje

Plataforma en donde se
gestiona el aprendizaje

Plataforma interactiva
para el aprendizaje

Plataforma en donde se
Plataforma interactiva realiza las clases Online
para el aprendizaje en vivo

Plataforma web en donde


todos los vídeos son Plataforma que sirve
grabados y guardados como repositorio
Horarios

Inicio: Lunes 20 de Setiembre

Días: Lunes, Miércoles y Viernes


Hora:
19:00 - 21:00
20:00 - 22:00
21:00 - 23:00
22:00 - 24:00

Inicio: Sábado 25 de Setiembre

Días: Sábado y Domingo


Hora:
09:00 - 12:00
10:00 - 13:00
11:00 - 14:00
12:00 - 15:00

Costo regular del Programa

Público en general 2 800 Soles


830 USD

Descuento por referido: 50 soles o 15 dólares.


Contáctanos para ventas corporativas o
conocer nuestras ofertas (Whatsapp +51 977
468 023).
Métodos de pago

Puedes pagar con Tarjeta de crédito, Transferencia


bancaria o Paypal.

Cuenta de Ahorros Soles : 2003131111482


Cuenta Interbancario : 00320001313111148234

BBVA Cuenta sueldo : 0011-0057-0239209883


BBVA Cuenta interbancario : 011-057-000239209883-72

BCP Ahorros soles : 19101387048057


BCP Cuenta interbancario : 00219110138704805753
En caso de encontrarse en provincia adicionar S/ 7.50 por comisión del BCP.

https://www.paypal.me/DataScienceResearch
En caso de pagar en dólares con Paypal adicionar el 10% de valor de la cuota.

DNI: 47487919
Propietario: Javier Cuicapuza (CEO DSRP)

Contacto: informes@datascience.pe
informes@datascience.pe

También podría gustarte