Documentos de Académico
Documentos de Profesional
Documentos de Cultura
RESEARCH PERÚ
Centro de capacitación en tecnologías 4.0
Programa de especialización
en análisis de datos con
Python ( 100% online )
Visión General
Aprenda a implementar un proyecto de análisis de datos con técnicas estadísticas y de
machine learning utilizando Python.
En cada curso realizado, se tendrá un incremental mínimo viable del proyecto personal
que desees proponer, además de la asesoría constante de los docentes. Se explora
desde los fundamentos y propuestas de proyectos de análisis de datos, el aprendizaje
básico a intermedio de un lenguaje de programación
demandado en puestos de analítica como es python, aprendizaje del análisis
estadístico de los datos hasta los modelos estadísticos más utilizados y por último las
técnicas más fundamentales de machine learning para potenciar
tu solución.
www.datascience.pe
DATA SCIENCE RESEARCH PERÚ
Misión:
Descentralizar, democratizar y difundir el conocimiento en Ciencia de Datos e
Inteligencia Artificial en el Perú resolvien- do problemas de impacto social.
Visión:
Estamos meticulosamente enfocados en llevar la ciencia de datos en todas sus formas
a quienes comparten nuestra visión de un planeta sostenible en el que todos tengamos
acceso a nuestras necesidades humanas básicas. Visualiza- mos un mundo en el que
las organizaciones que aborden esos problemas tengan el mismo acceso a los recursos
de Ciencia de Datos que tienen grandes empresas en países más desarrollados
tecnológicamente.
Reunir a organizaciones de alto impacto con Científicos de Datos líderes para utilizar la
ciencia de datos al servicio de la humanidad. Desde eventos de una hora hasta
compromisos de un año de duración, estamos diseñando programas que permiten a
los científicos de datos y los creadores de cambios sociales abordar juntos los difíciles
desafíos humanitarios. Nuestro trabajo ayuda a las organizaciones a desarrollar una
toma de decisiones basada en la evidencia, aumentar la efi- ciencia y mejorar su
conocimiento de los datos.
www.datascience.pe
PROGRAMA DE ESPECIALIZACIÓN
EN ANÁLISIS DE DATOS CON PYTHON
DATOS GENERALES
-Introdu cc i ón a Py th on
-Introdu cc i ón a e s ta dí s tica
www.datascience.pe
Católica del Perú (2019)
Jefe de Prácticas en el departamen
UNSAAC
DOCENTES
Doctora en ciencias de la
manufactura por la Universidad de Campinas, Brasil (2020)
Universidad de Campinas
(UNICAMP),
Juan Abel Landeo Brasil. Jacinto
Perú /abel-landeo
Candidato a Magister en Ingeniería de software por la
Perú
Universidad Nacional Mayor de San Marcos (2018)
Java Developer Senior en Globant
Candidato a Doctor po
Preto en Brasil (2020)
Mentor de investigaci
Fiorella Carolin
Walter Gianca
Perú
Abraham Fiorella Carolina
Zamudio Henriquez Cruz
Oscar Alonso C
www.datascience.pe Brasil
Walter Giancarlo
de Física de Perú
Candidato a Magister en
Universidad Ricardo Palm
/w
Geanfranco Jaz
DOCENTES Plana docente
Perú /g
a
Magíster de Economía co
Universidad Nacional May
Data Scientist en SURA P
DOCENTES
Oscar Alonso Cu
Aurea
Brasil Rossy So
/o
Brasilen ciencias de la c
Doctor
Plana docente
nga-07473394 JEFES DE PRÁCTICA
de Sao Paulo
Doctora en Brasilde
en ciencias
Investigador
(20
de Sao PauloPost-doctor
en Brasil(2
complex networks y com
Investigadora Post-doc
Ruben Alfredo Tupayachi Latorre
Universidad de Campina
Vargas
Perú /ruben-alfredo-tupayachi-latorre-b3185210b
ingeniería de
Católica del Perú (2019)
Cuadros Linares
Edwin Jonathan
Palomino Apolinario Jefe de Prácticas en el departamento de Física de
ano UNSAAC
sidad Federal de Ouro Universidad Nacional Mayor de San Marcos (2018) Candidata a Magister en
Java Developer Senior en Globant
Georgia Institute of Tec
X AI Gerente Senior de BI en
es
05 Perú
in Analytics por el Candidato a Magister en
2020) Universidad Ricardo Pal
Oral-B Latinoamerica Data Scientist en Everis
quispe-pinares
edob
de datos por la
0)
Perú /aldo-ray-chávez Perú
Magíster de Economía c
Universidad
/wal terpinedob Nacional M
Risk Specialist- IFRS9 at BBVA Candidato a Magister en Data Scientist en SURA
Ciencia
Continental l Big Data l Machine de datos por la Universidad
amino
computación
Apolinario
por
Learning l Data Science.
Universidad Nacional Mayor
de San Marcos
Ricardo Palma (2020)
Data Scientist en Everis Perú
Oscar Alonso C
Brasil
0)
co-palomino-555738a8
ión en finanzas por la
an Marcos (2018)
Doctor en ciencias de la
de Sao Paulo en Brasil (2
Investigador Post-docto
complex networks y com
s Linares
dros-linares-5a8b8a47 www.datascience.pe
Plana docente
JEFES DE PRÁCTICA
Plana Docente
Plana docente Ruben Alfredo Tupa
Jefes de Practica Perú /ruben
Magister en Física por la Pontific
JEFES DE PRÁCTICA
Católica del Perú (2019)
Jefe de Prácticas en el departam
UNSAAC
Plana docente
Magister en Física por la Pontificia Universidad
Católica del Perú (2019) Plana docente
Candidata a Magister en Producc
manufactura por la Universidad d
Jefe de Prácticas en el departamento de Física de
JEFES DE PRÁCTICA
UNSAAC
JEFES DE PRÁCTICA Ruben Alfredo Tupayachi Latorre
Ruben Alf redo Alejandra Inga Quezada
Perú
Alejandra Inga Jefferson Quispe Pin
/ruben-alfredo-tupayachi-latorre-b3185210b
Magister en Física por la Pontificia Universidad
UNSAAC Perú
Candidato a Magister en Ciencias de la computación por
/Jefferson-quispe-pinares
la Universidad Católica San Pablo (2020) Perú /abel-l
Alejandra Inga Quezada Candidato a Magister en Ingenie
Candidato a Magister en Ciencias deJuanla computación
Abel Landeo Jacinto
por
Universidad Nacional Mayor de S
Brasil
la Universidad Católica San Pablo (2020)
Perú /abel-landeo /alejandra-inga-07473394
Candidato a Magister en Ingeniería de software por laJava Developer Senior en Globan
Candidata
Universidad a Magister
Nacional Mayor de Sanen Producción
Marcos (2018) e ingeniería de
Java Developer Senior en Globant
manufactura por la Universidad de Campinas, Brasil (2020)
Juan Abel Landeo Jacinto
Perú /abel-landeo
Jefferson
Candidato a Magister en Ingeniería de software Quispe
por la Pinares
Universidad Nacional Mayor de San Marcos (2018)
Perú /Jefferson-quispe-pinares
Java Developer Senior en Globant
Candidato a Magister en Ciencias de la computación por
la Universidad Católica San Pablo (2020)
www.datascience.pe
Plana Docente
Jefes de Practica
Juan Abel
Fernando Pazos Landeo Jacinto
Candidato a Magister en
Bachiller de Economía de la Ingeniería de software por la Uni-
Pontifica Universidad Católica versidad Nacional Mayor de San
del Perú Marcos (2018) Java Developer
Senior en Globant
www.datascience.pe
Fundamentos de análisis de datos
185210b
Códi g o A DP01 20
Secc i ón 101
C ará c ter Obli g ato ri o
Dura ci ón 21 h o ras c ro n o ló g i c as
Sumilla
El presente curso es de naturaleza
teórico-práctico tiene como propósito
brindar las metodologías y conoci-
mientos sobre las herramientas exis-
tentes para que los estudiantes
puedan implementar a futuro proyec-
tos de analítica de datos en su entorno
laboral o académico. Comprende temas
como: met- odología de proyectos de
análisis de datos y ciencia de datos,
tecnologías y herramientas existentes
para análisis de datos y aplicación del
enfoque data driven decisions.
www.datascience.pe
MÓDULO 1: MÓDULO 2:
LA REVOLUCIÓN Y LOS DATOS (4h) TECNOLOGÍAS Y HERRAMIENTAS (5h)
Los datos en el último siglo. Evolución del Herramientas informáticas. Las primeras
valor de los datos. La era industrial y la era herramientas de análisis de datos. Cuadrante
de los datos. Inteligencia de negocios, min- mágico de Garner. Lenguajes de
Módulos
ería de datos y analítica de datos. Ingeniería programación. Sistemas de inteligencia de
de datos y ciencia de datos. Roles y negocios. Sistemas de minería de datos. Big
funciones en el mundo de datos. data. Computación en nube. Herramientas de
análisis avanzado de datos y big data en nube.
Internet de las cosas.
MÓDULO 1: La última revolución industrial. La era de los datos. Evolución del valor de
los datos. Análisis de datos y Analítica. Data analytics thinking. Cultura
LA REVOLUCIÓN
Y LOS DATOS (6h)
de datos. Inteligencia artificial. Ética e inteligencia artificial.
MÓDULO 3:
PROYECTO DE ANÁLISIS DE DATOS (6h)
Minería de datos: Conceptos y herramientas. Ciencia de datos: Conceptos
MÓDULO
Aprendizaje de2máquina.
: y herramientas. Big Data: Conceptos y herramientas. Internet de las
Métodos super-
TECNOLOGÍAS
visados Y cosas:
y no supervisados. Conceptosde
Identificación y herramientas. Cuadrante mágico de Gartner. Nuevos
HERRAMIENTAS (6h) roles y funciones. Perspectivas laborales: responsabilidades, requisitos y
problemas de clasificación,
rangosregresión
salarial. y
segmentación. Metodologías de proyectos.
Metodología CRISP-DM. Enfoque data
driven decisions. Casos de uso para
Técnicas analíti- y de aprendizaje de máquina. Aprendizaje supervi-
estadísticas
ca MÓDULO sadoen
3: de éxito
de datos. Casos y no
la supervisado.
industria Identificación de problemas de clasificación,
regresión y segmentación. Metodologías de proyectos. Metodología
mundial,
PROYECTOlatinoamericana
DE y peruana. Charla
CRISP-DM. Casos de uso para analítica de datos. Casos de éxito en la
ANÁLISIS DE
magistral. Asesoría especializada en loslatinoamericana y peruana. Charla magistral. Asesoría
industria mundial,
DATOS(9h)
proyectos. especializada en los proyectos.
www.datascience.pe
Introducción a Python
Códi g o ADP02 20
Secc i ón 101
C ará c ter Obl i g ato ri o
Dura ci ón 27 h o ras c ro n o ló g i c as
Sumilla
El presente curso es naturaleza
teórico-práctico tiene como propósito
brindar los conocimientos básicos
sobre el lenguaje de programación
Python utilizando como interfaz de
desarrollo la plataforma de Google
Colaboratory. Comprende temas
como: pensamiento computacional,
estructura de datos y algoritmos,
manejo de fuentes de datos,
utilización de librerías y manipulación
y visualización de datos.
www.datascience.pe
PerúMÓDULO 1: MÓDULO 2:
/abel-lan
LA REVOLUCIÓN Y LOS DATOS (4h) TECNOLOGÍAS Y HERRAMIENTAS (5h)
Candidato a Magister en Ingeniería
Los datos en el último siglo. Evolución del Herramientas informáticas. Las primeras
valor de los datos. La era industrial y la era herramientas de análisis de datos. Cuadrante
Universidad
Módulos
Nacional Mayor de San
de los datos. Inteligencia de negocios, min-
ería de datos y analítica de datos. Ingeniería
mágico de Garner. Lenguajes
programación. Sistemas de inteligencia de
de
MÓDULO 3:
PROYECTO DE ANÁLISIS DE DATOS (6h)
Condicionales e iteradores en Python. Resolviendo problemas en Python.
MÓDULO
Aprendizaje de2máquina.
: Conceptos
Métodosdesuper-
programación funcional en Python. Pseudocodigo.
visados Módulos
y no supervisados.
PROGRAMACIÓN
en Python.
Identificación de Lectura y escritura de archivos de distinto formato
CON PYTHON (8h) con Python. Manejo e identificación de errores. Introducción a Numpy
problemas de clasificación, regresión y
y Pandas.
segmentación. Metodologías de proyectos.
Metodología CRISP-DM. Enfoque data
driven decisions. Casos de uso para analíti-
Estructuras de datos en Pandas y Numpy. Tipos de datos en Pandas y
ca MÓDULO 3: de éxito
de datos. Casos en la industria
Numpy. Manipulación de filas y columnas. Limpieza y reemplazo de
mundial, latinoamericana
MANIPULACIÓN DE y peruana.
datos. Charla
Métodos y funciones en Pandas y Numpy. Exploración de otras
DATOS CON PYTHON
magistral. librerías útiles
Asesoría especializada enenlos
la exploración de datos.
(7h)
proyectos.
www.datascience.pe
o
software por la
arcos (2018)
Introducción a la estadística
Códi g o ADP0320
Secc i ón 101
C ará c ter O bli g ato ri o
Dura ci ón 33 h o ras c ro n o l ó g i c as
Sumilla
El presente curso es de naturaleza
teórico-práctico tiene como propósito
brindar los conocimientos básicos en
estadística para aplicarlos en
proyectos de análisis de datos. Los
conocimientos que contempla el
curso son: Estadística descriptiva.
Distribución de probabilidad y
estadística inferencial. Test
estadístico. Modelamiento lineal y
métodos de estimación. Regresión
logística.
www.datascience.pe
MÓDULO 1: MÓDULO 2:
LA REVOLUCIÓN Y LOS DATOS (4h) TECNOLOGÍAS Y HERRAMIENTAS (5h)
Los datos en el último siglo. Evolución del Herramientas informáticas. Las primeras
valor de los datos. La era industrial y la era herramientas de análisis de datos. Cuadrante
de los datos. Inteligencia de negocios, min- mágico de Garner. Lenguajes de
Módulos
ería de datos y analítica de datos. Ingeniería programación. Sistemas de inteligencia de
de datos y ciencia de datos. Roles y negocios. Sistemas de minería de datos. Big
funciones en el mundo de datos. data. Computación en nube. Herramientas de
análisis avanzado de datos y big data en nube.
Internet
Origen de la estadística. Variables de las
discretas cosas.
y continuas. Medidas de
MÓDULO 1: tendencia central. Medidas de variación de datos. Percentiles. Tablas de
ESTADÍSTICA frecuencia y estructuradas. Matriz de correlación. Gráficos de barras y
DESCRIPTIVA (6h) distribución de datos. Estimación de densidad.
MÓDULO 3:
PROYECTO DE ANÁLISIS DE DATOS (6h)
Introducción a estadística inferencial. Distribu- ciones de probabilidad.
MÓDULO
Aprendizaje de2máquina.
: Distribuciones discre- tas. Distribuciones continuas. Distribución de cola
Métodos super-
visados larga.
y no supervisados.
ESTADÍSTICA
Distribución
Identificación deChi cuadrado. Grados de libertad. Teorema del límite
INFERENCIAL (6h) central. Inter- valos de confianza. Pruebas de hipótesis P-val- ue. A/B
problemas de clasificación, regresión
Testing. y
Test de correlación, normalidad y varianza. Exploración de campo.
segmentación. Metodologías de proyectos.
Metodología CRISP-DM. Enfoque data
driven decisions. Casos de uso para analíti-
Álgebra lineal. Regresión lineal simple. Supuestos y limitaciones.
ca MÓDULO 3: de éxito
de datos. Casos en la industria
Calculo e interpretación de coeficientes. Análisis de residuales. Métricas.
mundial, latinoamericanaMulticolinealidad.
MODELAMIENTO y peruana. CharlaHeterocedasticidad. Test estadísticos. Introducción a
LINEAL (11h)
magistral. modelos lineales
Asesoría especializada generalizados.
en los
proyectos.
www.datascience.pe
Introducción a Machine Learning
Códi g o A DP0420
S ecc i ón 101
Cará c ter Obli g ato ri o
Dura ci ón 33 h o ras c ro n o l ó g i c as
Sumilla
El presente curso es de naturaleza
teórico-práctico tiene como propósito
brindar los conocimientos básicos en
machine learning para proyectos
analíticos. Los conocimientos que
contempla el curso son: Técnicas de
machine learning, métricas para
evaluar performance de modelos
analíticos. Aprendizaje supervisado y
no supervisado. Árboles de decisión.
Clustering.
www.datascience.pe
MÓDULO 1: MÓDULO 2:
LA REVOLUCIÓN Y LOS DATOS (4h) TECNOLOGÍAS Y HERRAMIENTAS (5h)
Los datos en el último siglo. Evolución del Herramientas informáticas. Las primeras
valor de los datos. La era industrial y la era herramientas de análisis de datos. Cuadrante
de los datos. Inteligencia de negocios, min- mágico de Garner. Lenguajes de
Módulos
ería de datos y analítica de datos. Ingeniería programación. Sistemas de inteligencia de
de datos y ciencia de datos. Roles y negocios. Sistemas de minería de datos. Big
funciones en el mundo de datos. data. Computación en nube. Herramientas de
análisis avanzado de datos y big data en nube.
Definición. Historia. Aplicaciones. Internet
Tipos de Aprendizaje (Aprendizaje supervisado,
de las cosas.
MÓDULO 1: no supervisado, por refuerzo). Argot de Aprendizaje de Máquina. Áreas
INTRODUCCIÓN Relacionadas (Minería de Datos vs. Aprendizaje Automático, Aprendizaje
A MACHINE Profundo vs. Aprendizaje de Máquina vs. Inteligencia Artificial). Limitaciones.
LEARNING (6h) Bibliotecas. Principales Conferencias.
MÓDULO 3:
PROYECTO DE ANÁLISIS DE DATOS (6h)
Metodología CRISP-DM. Proceso KDD. Fases en Aprendizaje de Máquina:
MÓDULO
Aprendizaje de2máquina.
: Métodos de
Recolección super-
datos, Preparación de datos, Extracción de
visados
FASES yEN
no características,
supervisados.
MACHINE Identificación Selección
de de un modelo, Entrenamiento y Evaluación,
LEARNING (9h) Ajuste de hiperparámetros, Predicción.
problemas de clasificación, regresión y
segmentación. Metodologías de proyectos.
Metodología CRISP-DM. Enfoque data
driven decisions. Casos de uso para
Aprendizaje analíti- Regresión y Clasificación. Técnicas para Regresión (Regresión Lineal,
supervisado.
ca MÓDULO 3: de éxito
de datos. Casos Regresión
en laLogística, Regresión Polinomial, Regresión usando Soporte Vectorial (Support Vector
industria
Regression), Regresión usando Árboles de decisión (Decision Tree Regression)). Técnicas para
mundial, latinoamericanaClasificación
APRENDIZAJE y peruana. Charla por vecinos próximos (k-nearest neighbor), Árboles de decisión,
(Clasificación
Clasificadores Lineales, Máquinas de soporte vectorial (SVM), Bosques aleatorios, Redes
SUPERVISADO (9h)
magistral. Asesoría especializada en losde Desempeño. Overfitting y Underfitting. Métricas de evaluación.
neuronales). Evaluación
Teoría de Decisión.
proyectos.
www.datascience.pe
Evaluación
El sistema de evaluación del curso está dirigido a valorar el nivel de
competencias alcanzado para cumplir los objetivos educativos
mediante la evaluación de:
Estrategias
didácticas
El curso tiene la intención de generar
espacios de dis- cusión donde puedan
compartirse los beneficios de la
experiencia y conocimiento individual.
Las estrategias didácticas que se
desarrollarán durante el curso son:
1. Casos de estudio
2. Aprendizaje orientado a proyectos
3. Aprendizaje colaborativo
4. Enseñanza problémica
www.datascience.pe
Información Adicional
Horarios:
Información
Lunes, Adicional
Miércoles y Viernes de 20:00 a 22:00
Horarios
Inicio: Lunes
: 13 de Julio | Fin: Lunes 26 de octubre
Lunes, Miércoles y Viernes de 20:00 a 22:00
Inicio: Lunes
Martes 2 de Noviembre
y Jueves de 19:00 a 22:00
Inicio:
Martes yMartes 14 19:00
Jueves de de Julio | Fin: Jueves 29 de octubre
a 22:00
Inicio: Martes 3 de Noviembre
Sábado y yDomingo
Sábado Domingode de
10:00 a 13:00
9:00 a 12:00
Inicio: Sábado 7 de Noviembre
Inicio: Sábado 18 de Julio | Fin: Sábado 31 de octubre
Costo: 1,420.00 soles o $400.00 dólares. Cuotas:
Costo: 1,189.00 soles
Cuotas Soles Dolares
Contacto:
RUC: 20605932411
informes@datascience.pe
Razón social: DATA SCIENCE RESEARCH PERU
Contacto: informes@datascience.pe
www.datascience.pe