Está en la página 1de 18

DATA SCIENCE

RESEARCH PERÚ
Centro de capacitación en tecnologías 4.0

Programa de especialización
en análisis de datos con
Python ( 100% online )
Visión General
Aprenda a implementar un proyecto de análisis de datos con técnicas estadísticas y de
machine learning utilizando Python.

El presente programa de especialización en análisis de datos con python busca intro-


ducir a profesionales de distintos perfiles al mundo de la analítica de datos desde cero.
Al final del programa adquirirá habilidades que podrán verse reflejadas en un proyecto
final que sumará a su portafolio personal.

En cada curso realizado, se tendrá un incremental mínimo viable del proyecto personal
que desees proponer, además de la asesoría constante de los docentes. Se explora
desde los fundamentos y propuestas de proyectos de análisis de datos, el aprendizaje
básico a intermedio de un lenguaje de programación
demandado en puestos de analítica como es python, aprendizaje del análisis
estadístico de los datos hasta los modelos estadísticos más utilizados y por último las
técnicas más fundamentales de machine learning para potenciar
tu solución.

Tiempo estimado PRE-Requisitos


5 Meses Conocimientos
152 horas académicas básicos en programación
(114 horas cronológicas) Excel Intermedio

Aprendizaje Flexible Requisitos Técnicos


Ten la oportunidad de Conexión a internet
revisar las clases durante Cuenta Gmail
todo el programa Cuenta Zoom
Conexión a internet

www.datascience.pe
DATA SCIENCE RESEARCH PERÚ
Misión:
Descentralizar, democratizar y difundir el conocimiento en Ciencia de Datos e
Inteligencia Artificial en el Perú resolvien- do problemas de impacto social.

Visión:
Estamos meticulosamente enfocados en llevar la ciencia de datos en todas sus formas
a quienes comparten nuestra visión de un planeta sostenible en el que todos tengamos
acceso a nuestras necesidades humanas básicas. Visualiza- mos un mundo en el que
las organizaciones que aborden esos problemas tengan el mismo acceso a los recursos
de Ciencia de Datos que tienen grandes empresas en países más desarrollados
tecnológicamente.

Reunir a organizaciones de alto impacto con Científicos de Datos líderes para utilizar la
ciencia de datos al servicio de la humanidad. Desde eventos de una hora hasta
compromisos de un año de duración, estamos diseñando programas que permiten a
los científicos de datos y los creadores de cambios sociales abordar juntos los difíciles
desafíos humanitarios. Nuestro trabajo ayuda a las organizaciones a desarrollar una
toma de decisiones basada en la evidencia, aumentar la efi- ciencia y mejorar su
conocimiento de los datos.

www.datascience.pe
PROGRAMA DE ESPECIALIZACIÓN
EN ANÁLISIS DE DATOS CON PYTHON

DATOS GENERALES

Cu rs o s : -Fu n da m e ntos de a ná l i sis de datos

-Introdu cc i ón a Py th on

-Introdu cc i ón a e s ta dí s tica

-Introdu cc i ón a M a chi n e Learnin g

www.datascience.pe
Católica del Perú (2019)
Jefe de Prácticas en el departamen
UNSAAC
DOCENTES

Alejandra Inga Queza


Plana docente
Brasil
Plana docente
JEFES DE PRÁCTICA

Ruben Alfredo Tupayachi Latorre


/alejandr
DOCENTES
Aurea Rossy S
Perú /ruben-alfredo-tupayachi-latorre-b3185210b
Aurea Rossy
Magister en Física por la Pontificia Universidad Edwin Jonathan

Candidata a Magister en Producció


Católica del Perú (2019)
Soriano Vargas Escobedo Cárdenas
Brasil
Jefe de Prácticas en el departamento de Física de
UNSAAC

Alejandra Inga Quezada


Brasil
Brasil /aureasoriano
/alejandra-inga-07473394 Perú Doctora
/edwin-escobedo en ciencias d
de Sao Paulo en Brasil

manufactura por la Universidad de


Candidata a Magister en Producción e ingeniería de

Doctora en ciencias de la
manufactura por la Universidad de Campinas, Brasil (2020)

computación por la Universidad Candidato a Doctor por la Investigadora Post-do


de Sao
JeffersonPaulo Quispe enPinares
Brasil(2018) Universidad Federal de Ouro
Universidad de Campi
Investigadora Post-doctorado
Perú /Jefferson-quispe-pinares
y Preto en Brasil (2020) Mentor de
Candidato a Magister en Ciencias de la computación por
Profesora temporal en la investigación en LatinX AI
Edwin Jonatha
la Universidad Católica San Pablo (2020)

Universidad de Campinas
(UNICAMP),
Juan Abel Landeo Brasil. Jacinto
Perú /abel-landeo
Candidato a Magister en Ingeniería de software por la
Perú
Universidad Nacional Mayor de San Marcos (2018)
Java Developer Senior en Globant
Candidato a Doctor po
Preto en Brasil (2020)
Mentor de investigaci

Fiorella Carolin

Jefferson Quispe Pina


Panamá
Candidata a Magister
Georgia Institute of Te
Gerente Senior de BI e

Walter Gianca
Perú
Abraham Fiorella Carolina
Zamudio Henriquez Cruz

Perú /abraham-zamudio Panamá


/Jefferso
Perú
Candidato
/fiorella1605 a Magister
Universidad Ricardo P
Machine Learning Engineer Candidata a Magister en Science
de la Universidad Nacional in Analytics por el Georgia Data Scientist en Ever

Candidato a Magister en Ciencias


de Ingeniería
d
Geanfranco Ja
Institute of Technology (2020)
Gerente Senior de BI en Gillete
y Oral-B Latinoamerica

la Universidad Católica San Pablo (2


Perú
Magíster de Economía
Universidad Nacional
Data Scientist en SUR

Oscar Alonso C
www.datascience.pe Brasil
Walter Giancarlo
de Física de Perú
Candidato a Magister en
Universidad Ricardo Palm
/w

Data Scientist en Everis P

Geanfranco Jaz
DOCENTES Plana docente
Perú /g

a
Magíster de Economía co
Universidad Nacional May
Data Scientist en SURA P
DOCENTES
Oscar Alonso Cu
Aurea
Brasil Rossy So
/o
Brasilen ciencias de la c
Doctor
Plana docente
nga-07473394 JEFES DE PRÁCTICA
de Sao Paulo
Doctora en Brasilde
en ciencias
Investigador
(20
de Sao PauloPost-doctor
en Brasil(2
complex networks y com
Investigadora Post-doc
Ruben Alfredo Tupayachi Latorre
Universidad de Campina
Vargas
Perú /ruben-alfredo-tupayachi-latorre-b3185210b

Geanf ranco Jaz Oscar Alonso


Magister en Física por la Pontificia Universidad

ingeniería de
Católica del Perú (2019)
Cuadros Linares
Edwin Jonathan
Palomino Apolinario Jefe de Prácticas en el departamento de Física de
ano UNSAAC

Alejandra Inga Quezada


tación por la Universidad
Perú /geanf ranco-palomino Brasil
Brasil /oscar-cuadros-linares
/alejandra-inga-07473394 Perú

mpinas, Brasil (2020)


Candidata a Magister en Producción e ingeniería de

Magíster de Economía con Doctor en ciencias de la Candidato a Doctor por


manufactura por la Universidad de Campinas, Brasil (2020)

Profesora temporal en la en finanzas por la


mención computación por la Universidad Preto en Brasil (2020)
AMP), Brasil. Universidad Nacional Mayor de de Sao Paulo en Brasil (2017)
Jefferson Quispe Pinares
Mentor de investigación
San Marcos (2018) Data Scientist Investigador
Perú Post-doctorado
/Jefferson-quispe-pinares
en
Candidato a Magister en Ciencias de la computación por
en SURA Perú tópicos de machine
San Pablo (2020) learning,

obedo Cárdenas Fiorella Carolin


la Universidad Católica

complex networks y computer


vision
Juan Abelen el ámbito
Landeo Jacinto médico
cobedo Perú /abel-landeo Panamá
Candidato a Magister en Ingeniería de software por la

sidad Federal de Ouro Universidad Nacional Mayor de San Marcos (2018) Candidata a Magister en
Java Developer Senior en Globant
Georgia Institute of Tec
X AI Gerente Senior de BI en

riquez Cruz Walter Giancar

es
05 Perú
in Analytics por el Candidato a Magister en
2020) Universidad Ricardo Pal
Oral-B Latinoamerica Data Scientist en Everis

edo Barrientos Aldo Chávez


Walter Giancarlo Geanfranco Jaz
Pinedo Barrientos Perú

quispe-pinares
edob
de datos por la
0)
Perú /aldo-ray-chávez Perú
Magíster de Economía c
Universidad
/wal terpinedob Nacional M
Risk Specialist- IFRS9 at BBVA Candidato a Magister en Data Scientist en SURA
Ciencia
Continental l Big Data l Machine de datos por la Universidad

amino
computación
Apolinario
por
Learning l Data Science.
Universidad Nacional Mayor
de San Marcos
Ricardo Palma (2020)
Data Scientist en Everis Perú
Oscar Alonso C
Brasil

0)
co-palomino-555738a8
ión en finanzas por la
an Marcos (2018)
Doctor en ciencias de la
de Sao Paulo en Brasil (2
Investigador Post-docto
complex networks y com

s Linares
dros-linares-5a8b8a47 www.datascience.pe
Plana docente
JEFES DE PRÁCTICA
Plana Docente
Plana docente Ruben Alfredo Tupa
Jefes de Practica Perú /ruben
Magister en Física por la Pontific

JEFES DE PRÁCTICA
Católica del Perú (2019)
Jefe de Prácticas en el departam
UNSAAC

Ruben Alfredo Tupayachi Latorre Alejandra Inga Quez


Perú Brasil
/ruben-alfredo-tupayachi-latorre-b3185210b /alejan

Plana docente
Magister en Física por la Pontificia Universidad
Católica del Perú (2019) Plana docente
Candidata a Magister en Producc
manufactura por la Universidad d
Jefe de Prácticas en el departamento de Física de
JEFES DE PRÁCTICA
UNSAAC
JEFES DE PRÁCTICA Ruben Alfredo Tupayachi Latorre
Ruben Alf redo Alejandra Inga Quezada
Perú
Alejandra Inga Jefferson Quispe Pin
/ruben-alfredo-tupayachi-latorre-b3185210b
Magister en Física por la Pontificia Universidad

Tupayachi LatorreBrasil Quezada


Católica del Perú (2019)
/alejandra-inga-07473394
Jefe de Prácticas en el departamento de Física de
Perú /Jeffer
Ruben Alfredo Tupayachi
Candidato Latorre
UNSAAC

Candidata a Magister en Producción e ingeniería


Alejandra Inga de
Quezada a Magister en Ciencia
Perú manufactura
/ruben-alf redo-tupayachi por la Universidad Perú
de Campinas,
Brasil
Brasil Brasil (2020) /ruben-alfredo-tupayachi-latorre-b318
la Universidad Católica San Pablo
alejandra-inga
/alejandra-inga-07473394
Candidata a Magister en Producción e ingeniería de
Magister enporFísica porde la Pontificia
Brasil (2020)Universidad
Magister en Física por la Candidata a Magister en
manufactura la Universidad Campinas,

Católica del Perú (2019)


Pontificia Universidad Católica Producción e ingeniería de
del Perú (2019) Jefe de Prácticas
Jefferson Quispe Pinares
Jefe de Prácticas
manufactura
Jefferson
UNSAAC
Quispe enPinares
por elladepartamento
Universidad Juan Abel Landeo Ja
de Física de
en el departamento de Física de de Campinas, Brasil (2020)
Perú /Jefferson-quispe-pinares

UNSAAC Perú
Candidato a Magister en Ciencias de la computación por
/Jefferson-quispe-pinares
la Universidad Católica San Pablo (2020) Perú /abel-l
Alejandra Inga Quezada Candidato a Magister en Ingenie
Candidato a Magister en Ciencias deJuanla computación
Abel Landeo Jacinto
por
Universidad Nacional Mayor de S
Brasil
la Universidad Católica San Pablo (2020)
Perú /abel-landeo /alejandra-inga-07473394
Candidato a Magister en Ingeniería de software por laJava Developer Senior en Globan
Candidata
Universidad a Magister
Nacional Mayor de Sanen Producción
Marcos (2018) e ingeniería de
Java Developer Senior en Globant
manufactura por la Universidad de Campinas, Brasil (2020)
Juan Abel Landeo Jacinto
Perú /abel-landeo
Jefferson
Candidato a Magister en Ingeniería de software Quispe
por la Pinares
Universidad Nacional Mayor de San Marcos (2018)
Perú /Jefferson-quispe-pinares
Java Developer Senior en Globant
Candidato a Magister en Ciencias de la computación por
la Universidad Católica San Pablo (2020)

Jefferson QuispeJuan Abel Landeo Jacinto


Pinares Perú /abel-landeo
Candidato a Magister en Ingeniería de software por la
Perú Universidad Nacional Mayor de San Marcos (2018)
/Jefferson-quispe-pinares
Java Developer Senior en Globant
Candidato a Magister en Ciencias
de la computación por la
Universidad Católica San Pablo
(2020)

www.datascience.pe
Plana Docente
Jefes de Practica

Juan Abel
Fernando Pazos Landeo Jacinto

Perú /fernandopazosruiz Perú abel-landeo

Candidato a Magister en
Bachiller de Economía de la Ingeniería de software por la Uni-
Pontifica Universidad Católica versidad Nacional Mayor de San
del Perú Marcos (2018) Java Developer
Senior en Globant

www.datascience.pe
Fundamentos de análisis de datos
185210b

Códi g o A DP01 20
Secc i ón 101
C ará c ter Obli g ato ri o
Dura ci ón 21 h o ras c ro n o ló g i c as

Sumilla
El presente curso es de naturaleza
teórico-práctico tiene como propósito
brindar las metodologías y conoci-
mientos sobre las herramientas exis-
tentes para que los estudiantes
puedan implementar a futuro proyec-
tos de analítica de datos en su entorno
laboral o académico. Comprende temas
como: met- odología de proyectos de
análisis de datos y ciencia de datos,
tecnologías y herramientas existentes
para análisis de datos y aplicación del
enfoque data driven decisions.

www.datascience.pe
MÓDULO 1: MÓDULO 2:
LA REVOLUCIÓN Y LOS DATOS (4h) TECNOLOGÍAS Y HERRAMIENTAS (5h)
Los datos en el último siglo. Evolución del Herramientas informáticas. Las primeras
valor de los datos. La era industrial y la era herramientas de análisis de datos. Cuadrante
de los datos. Inteligencia de negocios, min- mágico de Garner. Lenguajes de
Módulos
ería de datos y analítica de datos. Ingeniería programación. Sistemas de inteligencia de
de datos y ciencia de datos. Roles y negocios. Sistemas de minería de datos. Big
funciones en el mundo de datos. data. Computación en nube. Herramientas de
análisis avanzado de datos y big data en nube.
Internet de las cosas.
MÓDULO 1: La última revolución industrial. La era de los datos. Evolución del valor de
los datos. Análisis de datos y Analítica. Data analytics thinking. Cultura
LA REVOLUCIÓN
Y LOS DATOS (6h)
de datos. Inteligencia artificial. Ética e inteligencia artificial.

MÓDULO 3:
PROYECTO DE ANÁLISIS DE DATOS (6h)
Minería de datos: Conceptos y herramientas. Ciencia de datos: Conceptos
MÓDULO
Aprendizaje de2máquina.
: y herramientas. Big Data: Conceptos y herramientas. Internet de las
Métodos super-
TECNOLOGÍAS
visados Y cosas:
y no supervisados. Conceptosde
Identificación y herramientas. Cuadrante mágico de Gartner. Nuevos
HERRAMIENTAS (6h) roles y funciones. Perspectivas laborales: responsabilidades, requisitos y
problemas de clasificación,
rangosregresión
salarial. y
segmentación. Metodologías de proyectos.
Metodología CRISP-DM. Enfoque data
driven decisions. Casos de uso para
Técnicas analíti- y de aprendizaje de máquina. Aprendizaje supervi-
estadísticas
ca MÓDULO sadoen
3: de éxito
de datos. Casos y no
la supervisado.
industria Identificación de problemas de clasificación,
regresión y segmentación. Metodologías de proyectos. Metodología
mundial,
PROYECTOlatinoamericana
DE y peruana. Charla
CRISP-DM. Casos de uso para analítica de datos. Casos de éxito en la
ANÁLISIS DE
magistral. Asesoría especializada en loslatinoamericana y peruana. Charla magistral. Asesoría
industria mundial,
DATOS(9h)
proyectos. especializada en los proyectos.

www.datascience.pe
Introducción a Python

Códi g o ADP02 20
Secc i ón 101
C ará c ter Obl i g ato ri o
Dura ci ón 27 h o ras c ro n o ló g i c as

Sumilla
El presente curso es naturaleza
teórico-práctico tiene como propósito
brindar los conocimientos básicos
sobre el lenguaje de programación
Python utilizando como interfaz de
desarrollo la plataforma de Google
Colaboratory. Comprende temas
como: pensamiento computacional,
estructura de datos y algoritmos,
manejo de fuentes de datos,
utilización de librerías y manipulación
y visualización de datos.

www.datascience.pe
PerúMÓDULO 1: MÓDULO 2:
/abel-lan
LA REVOLUCIÓN Y LOS DATOS (4h) TECNOLOGÍAS Y HERRAMIENTAS (5h)
Candidato a Magister en Ingeniería
Los datos en el último siglo. Evolución del Herramientas informáticas. Las primeras
valor de los datos. La era industrial y la era herramientas de análisis de datos. Cuadrante

Universidad
Módulos
Nacional Mayor de San
de los datos. Inteligencia de negocios, min-
ería de datos y analítica de datos. Ingeniería
mágico de Garner. Lenguajes
programación. Sistemas de inteligencia de
de

de datos y ciencia de datos. Roles y negocios. Sistemas de minería de datos. Big

Java Developer Senior en Globant


funciones en el mundo de datos. data. Computación en nube. Herramientas de
análisis avanzado de datos y big data en nube.
Pensamiento computacional. Creación
Internetde
dePython. Escenarios donde
las cosas.
MÓDULO 1: utilizar Python. Introducción a Jupyter Notebooks, Spyder y Google
INTRODUCCIÓN Colaboratory. Tipología y estructura de datos en Python. Sintaxis,
A PYTHON (4h) indentación y sentencias en Python. Ejecución de proyectos en Python.

MÓDULO 3:
PROYECTO DE ANÁLISIS DE DATOS (6h)
Condicionales e iteradores en Python. Resolviendo problemas en Python.
MÓDULO
Aprendizaje de2máquina.
: Conceptos
Métodosdesuper-
programación funcional en Python. Pseudocodigo.
visados Módulos
y no supervisados.
PROGRAMACIÓN
en Python.
Identificación de Lectura y escritura de archivos de distinto formato
CON PYTHON (8h) con Python. Manejo e identificación de errores. Introducción a Numpy
problemas de clasificación, regresión y
y Pandas.
segmentación. Metodologías de proyectos.
Metodología CRISP-DM. Enfoque data
driven decisions. Casos de uso para analíti-
Estructuras de datos en Pandas y Numpy. Tipos de datos en Pandas y
ca MÓDULO 3: de éxito
de datos. Casos en la industria
Numpy. Manipulación de filas y columnas. Limpieza y reemplazo de
mundial, latinoamericana
MANIPULACIÓN DE y peruana.
datos. Charla
Métodos y funciones en Pandas y Numpy. Exploración de otras
DATOS CON PYTHON
magistral. librerías útiles
Asesoría especializada enenlos
la exploración de datos.
(7h)
proyectos.

Visualización de datos con Matplotlib y Seaborn. Creación de gráficos


MÓDULO 4: desde un file. Creación de reportes. Storytelling. Visu- alización de datos
VISUALIZACIÓN DE univariados y multivariados. Charla magistral. Asesoría especializada en
DATOS CON PYTHON
los proyectos.
(8h)

www.datascience.pe
o
software por la
arcos (2018)
Introducción a la estadística

Códi g o ADP0320
Secc i ón 101
C ará c ter O bli g ato ri o
Dura ci ón 33 h o ras c ro n o l ó g i c as

Sumilla
El presente curso es de naturaleza
teórico-práctico tiene como propósito
brindar los conocimientos básicos en
estadística para aplicarlos en
proyectos de análisis de datos. Los
conocimientos que contempla el
curso son: Estadística descriptiva.
Distribución de probabilidad y
estadística inferencial. Test
estadístico. Modelamiento lineal y
métodos de estimación. Regresión
logística.

www.datascience.pe
MÓDULO 1: MÓDULO 2:
LA REVOLUCIÓN Y LOS DATOS (4h) TECNOLOGÍAS Y HERRAMIENTAS (5h)
Los datos en el último siglo. Evolución del Herramientas informáticas. Las primeras
valor de los datos. La era industrial y la era herramientas de análisis de datos. Cuadrante
de los datos. Inteligencia de negocios, min- mágico de Garner. Lenguajes de
Módulos
ería de datos y analítica de datos. Ingeniería programación. Sistemas de inteligencia de
de datos y ciencia de datos. Roles y negocios. Sistemas de minería de datos. Big
funciones en el mundo de datos. data. Computación en nube. Herramientas de
análisis avanzado de datos y big data en nube.
Internet
Origen de la estadística. Variables de las
discretas cosas.
y continuas. Medidas de
MÓDULO 1: tendencia central. Medidas de variación de datos. Percentiles. Tablas de
ESTADÍSTICA frecuencia y estructuradas. Matriz de correlación. Gráficos de barras y
DESCRIPTIVA (6h) distribución de datos. Estimación de densidad.

MÓDULO 3:
PROYECTO DE ANÁLISIS DE DATOS (6h)
Introducción a estadística inferencial. Distribu- ciones de probabilidad.
MÓDULO
Aprendizaje de2máquina.
: Distribuciones discre- tas. Distribuciones continuas. Distribución de cola
Métodos super-
visados larga.
y no supervisados.
ESTADÍSTICA
Distribución
Identificación deChi cuadrado. Grados de libertad. Teorema del límite
INFERENCIAL (6h) central. Inter- valos de confianza. Pruebas de hipótesis P-val- ue. A/B
problemas de clasificación, regresión
Testing. y
Test de correlación, normalidad y varianza. Exploración de campo.
segmentación. Metodologías de proyectos.
Metodología CRISP-DM. Enfoque data
driven decisions. Casos de uso para analíti-
Álgebra lineal. Regresión lineal simple. Supuestos y limitaciones.
ca MÓDULO 3: de éxito
de datos. Casos en la industria
Calculo e interpretación de coeficientes. Análisis de residuales. Métricas.
mundial, latinoamericanaMulticolinealidad.
MODELAMIENTO y peruana. CharlaHeterocedasticidad. Test estadísticos. Introducción a
LINEAL (11h)
magistral. modelos lineales
Asesoría especializada generalizados.
en los
proyectos.

MÓDULO 4: Modelo logístico. Estimación de coeficientes. Métricas de evaluación


para problemas de clasificación binaria. Predicciones para una o más
REGRESIÓN
LOGÍSTICA (10h) clases. Charla magistral.

www.datascience.pe
Introducción a Machine Learning

Códi g o A DP0420
S ecc i ón 101
Cará c ter Obli g ato ri o
Dura ci ón 33 h o ras c ro n o l ó g i c as

Sumilla
El presente curso es de naturaleza
teórico-práctico tiene como propósito
brindar los conocimientos básicos en
machine learning para proyectos
analíticos. Los conocimientos que
contempla el curso son: Técnicas de
machine learning, métricas para
evaluar performance de modelos
analíticos. Aprendizaje supervisado y
no supervisado. Árboles de decisión.
Clustering.

www.datascience.pe
MÓDULO 1: MÓDULO 2:
LA REVOLUCIÓN Y LOS DATOS (4h) TECNOLOGÍAS Y HERRAMIENTAS (5h)
Los datos en el último siglo. Evolución del Herramientas informáticas. Las primeras
valor de los datos. La era industrial y la era herramientas de análisis de datos. Cuadrante
de los datos. Inteligencia de negocios, min- mágico de Garner. Lenguajes de
Módulos
ería de datos y analítica de datos. Ingeniería programación. Sistemas de inteligencia de
de datos y ciencia de datos. Roles y negocios. Sistemas de minería de datos. Big
funciones en el mundo de datos. data. Computación en nube. Herramientas de
análisis avanzado de datos y big data en nube.
Definición. Historia. Aplicaciones. Internet
Tipos de Aprendizaje (Aprendizaje supervisado,
de las cosas.
MÓDULO 1: no supervisado, por refuerzo). Argot de Aprendizaje de Máquina. Áreas
INTRODUCCIÓN Relacionadas (Minería de Datos vs. Aprendizaje Automático, Aprendizaje
A MACHINE Profundo vs. Aprendizaje de Máquina vs. Inteligencia Artificial). Limitaciones.
LEARNING (6h) Bibliotecas. Principales Conferencias.

MÓDULO 3:
PROYECTO DE ANÁLISIS DE DATOS (6h)
Metodología CRISP-DM. Proceso KDD. Fases en Aprendizaje de Máquina:
MÓDULO
Aprendizaje de2máquina.
: Métodos de
Recolección super-
datos, Preparación de datos, Extracción de
visados
FASES yEN
no características,
supervisados.
MACHINE Identificación Selección
de de un modelo, Entrenamiento y Evaluación,
LEARNING (9h) Ajuste de hiperparámetros, Predicción.
problemas de clasificación, regresión y
segmentación. Metodologías de proyectos.
Metodología CRISP-DM. Enfoque data
driven decisions. Casos de uso para
Aprendizaje analíti- Regresión y Clasificación. Técnicas para Regresión (Regresión Lineal,
supervisado.
ca MÓDULO 3: de éxito
de datos. Casos Regresión
en laLogística, Regresión Polinomial, Regresión usando Soporte Vectorial (Support Vector
industria
Regression), Regresión usando Árboles de decisión (Decision Tree Regression)). Técnicas para
mundial, latinoamericanaClasificación
APRENDIZAJE y peruana. Charla por vecinos próximos (k-nearest neighbor), Árboles de decisión,
(Clasificación
Clasificadores Lineales, Máquinas de soporte vectorial (SVM), Bosques aleatorios, Redes
SUPERVISADO (9h)
magistral. Asesoría especializada en losde Desempeño. Overfitting y Underfitting. Métricas de evaluación.
neuronales). Evaluación
Teoría de Decisión.
proyectos.

Aprendizaje no supervisado. Agrupamiento. Técnicas de Agrupamiento:


MÓDULO 4: Algoritmos de particionamiento (K-means. K-means++. K-medoides,
APRENDIZAJE NO
CLARA (Agrupación de aplicaciones grandes)), Algoritmos de jerarquía
SUPERVISADO (9h) (Aglomerativo y Divisivo), Basado en densidad (DBScan). Evaluación de
Desempeño. Métricas de evaluación.

www.datascience.pe
Evaluación
El sistema de evaluación del curso está dirigido a valorar el nivel de
competencias alcanzado para cumplir los objetivos educativos
mediante la evaluación de:

1. Evaluación continua: 40%


2. Proyecto final: 60%

La evaluación continua se puede componer de laboratorios, contro-


les de lectura, prácticas calificadas, casos de estudio, problemas
guiados, controles orales o evaluaciones durante el curso según
disponga el docente.

El proyecto final debe reflejar todo lo aprendido en el curso, este se


puede componer de un código ejecutable, presentación frente a
clase, informe, diapositivas, poster, artículo de difusión o artículo de
investi- gación según disponga el docente.

Estrategias
didácticas
El curso tiene la intención de generar
espacios de dis- cusión donde puedan
compartirse los beneficios de la
experiencia y conocimiento individual.
Las estrategias didácticas que se
desarrollarán durante el curso son:

1. Casos de estudio
2. Aprendizaje orientado a proyectos
3. Aprendizaje colaborativo
4. Enseñanza problémica

www.datascience.pe
Información Adicional

Horarios:
Información
Lunes, Adicional
Miércoles y Viernes de 20:00 a 22:00
Horarios
Inicio: Lunes
: 13 de Julio | Fin: Lunes 26 de octubre
Lunes, Miércoles y Viernes de 20:00 a 22:00
Inicio: Lunes
Martes 2 de Noviembre
y Jueves de 19:00 a 22:00
Inicio:
Martes yMartes 14 19:00
Jueves de de Julio | Fin: Jueves 29 de octubre
a 22:00
Inicio: Martes 3 de Noviembre

Sábado y yDomingo
Sábado Domingode de
10:00 a 13:00
9:00 a 12:00
Inicio: Sábado 7 de Noviembre
Inicio: Sábado 18 de Julio | Fin: Sábado 31 de octubre
Costo: 1,420.00 soles o $400.00 dólares. Cuotas:
Costo: 1,189.00 soles
Cuotas Soles Dolares

Total S/. 1,189.00


1,420.00 $ 355.00
400.00

2 Cuotas S/. 710.00


595.00 $ 200.00
177.00

3 Cuotas S/. 474.00


397.00 $ 134.00
118.00

4 Cuotas S/. 355.00


298.00 $ 100.00
89.00

Cuenta corriente soles INTERBANK: 200- 3002577478


Cuenta corriente soles INTERBANK: 200- 3002577478
CCI: 003-200-003002577478-34
CCI: 003-200-003002577478-34
En caso de pagar por Paypal en dólares se agregará un adicional del 10% del precio de venta ($ 440.00)
con la facilidad de pagarlo en 1,2,3 o 4 cuotas iguales .

Contacto:
RUC: 20605932411
informes@datascience.pe
Razón social: DATA SCIENCE RESEARCH PERU

Contacto: informes@datascience.pe

www.datascience.pe

También podría gustarte