Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESPECIALIZACIÓN EN
CIENCIA DE
DATOS
APLICADO A ECONOMÍA Y FINANZAS
DESCRIPCIÓN
DEL PROGRAMA
El programa de especialización de “Ciencia de Datos aplicado a Economía y Finanzas” está constituido de 5
módulos (fundamentos de ciencia de datos, gestión de datos, visualización de gráficos, machine learning y
deep learning) y busca que el estudiante sea capaz de procesar grandes volúmenes de datos, transformar
enormes cantidades de datos en información clave, analizar tendencias, tomar decisiones acertadas y
estratégicas, predecir escenarios, y crear soluciones creativas y de alto impacto..
Pensando en lo mejor para nuestros alumnos, hemos diseñado una metodología que combina una
videoteca de última generación, la cual permite que el (la) participante absorba los conocimientos teóricos
desde el primer día de su matrícula y durante las 24 horas del día en su momento (su horario) más
oportuno y de mayor comodidad a través de nuestra moderna plataforma educativa, y clases online por
zoom durante todo el año con profesores que trabajan en empresas e instituciones líderes. Estudia en
INFOX, la plataforma educativa de economía y finanzas número 1 en América Latina. Nuestra historia,
experiencia, calidad y prestigio nos respalda.
• Entender las bases sólidas de inteligencia artificial, estadística y economía para la ciencia
de datos.
• Comprender las complejidades de las técnicas de ciencia de datos y sus aplicaciones a
problemas del mundo real.
• Diseñar y liderar proyectos de análisis de datos.
• Elegir el modelo de machine learning que mejor se adapte a su base de datos y a los
objetivos que desea.
• Optimizar procesos y negocios de empresas privadas y públicas que generen alto
impacto en su desarrollo.
• Explorar los ámbitos del aprendizaje automático y las redes neuronales, y cómo se
pueden aplicar a múltiples industrias y contextos comerciales
BENEFICIOS INFOX
PROFESORES
Nuestros profesores son científicos de datos que trabajan en las mejores
empresas del mundo como Amazon o JP Morgan Chase o han estudiado en el
Banco Central del Perú. Todos cuentan con una inmejorable trayectoria académica
y una vasta experiencia en el sector público y privado.
VOCACIÓN
Somos una institución comprometida con democratizar y descentralizar la
educación de calidad en un contexto en el que las diferencias socioeconómicas
cada vez son más amplias.
RED DE CONTACTOS
Nuestros profesores son referentes de la profesión, por lo que un buen
desempeño en INFOX podría generarte Cartas de Recomendación para un
programa de estudios de posgrado en el Perú o en el extranjero.
2. ESTRUCTURAS DE DATOS
a. Vectores
GESTIÓN
- ¿Qué es un vector y cómo
crearlo?
DE DATOS
- Propiedades de un vector 3. ADMINISTRACIÓN DE BASE
- Operaciones matemáticas con DE DATOS
vectores a. Función select
b. Matrices - Tres formas paras seleccionar variables
- ¿Qué es una matriz y cómo crearlo? - Eliminando variables
- Accediendo elementos de una matriz - Usando la función Starts_with
- Operaciones con matrices - Reordenar nuestras variables
- Atención con la multiplicación de - Renombrando variables
matrices b. Función Filter
- Funciones aplicadas a las matrices - 3 formas de seleccionar filas
- Aplicación: Cómo resolver sistema de - Combinando operaciones Boleanas
ecuaciones - Ojo con las leyes de Morgan
- Array y listas - Usando la función subset
c. Data Frames c. Función Arrange
- Ordenar los datos de menor a mayor
- ¿Qué es un data frame y cómo
- Ordenando de mayor a menor
crearlo?
- Ordenamiento de variables string
- Características de una data frame
- Accediendo a variables de un data d. Función Mutate
frame - Tres formas de crear variables
- Usando funciones agregadas
- Recodificando variables
- La función ifelse
- La función case_when
e. Función Group by
- Generando estadísticas agrupadas - Gráfico scatter
- El problema de las bases • Gráfico de dispersión
- intermedias • Gráfico de dispersión por
- Conociendo el operador pipe (%>%) categorías
Aplicando el operador pipe • Personalizando la nube de
4. LIMPIEZA DE DATOS puntos
- Gráfico de líneas
a. Estructura de una base de datos
• Gráfico de series de tiempo
adecuada
- Gráfico de Animados
b. Función Spread y gather
• Conociendo la base de datos
c. Funciones Separate y unite
de gapminder
d. Datos relacionales
• Realizando gráfico con
- Claves primarias y foráneas
transicion_time
- Mutating joins
• Realizando gráfico con
- Joins con claves diferentes
transicion_reveal
- Joins con diferentes claves
- Claves duplicadas 6. ANÁLISIS DE SERIES DE
TIEMPO
VISUALIZACIÓN a. Preparando nuestra data de Yahoo
DE GRÁFICOS Finance
b. Trabajando con fechas
5. GRÁFICOS CON GGPLOT2 c. Formatos de fechas
- Crear fechas desde el epoch
a. Gráfico de una sola variable
- Extraer días meses y años de fechas
- Gráfico de densidad
- Calculando la rentabilidad de Google
• Gráfico de densidad d. Descomposición de una serie
• Gráfico de histogramas Temporal
• Gráfico de densidad por grupos e. Simple Moving Average
• Ridgeline plot
- Gráficos Boxplot - Gráficos Estacionales
• Gráficos BoxPlot de 1 variable - Suavizamiento Exponencial simple
• Gráficos BoxPlot por grupos - Método Holt Winters
• Gráficos BoxPlot por dos f. Modelos Arima
categorías - Transformamos la serie a una
b. Gráfico de 2 variables serie estacionaria
- Gráfico de barras - Pruebas de Dickey y Fuller de
• Gráfico de frecuencias raíz unitaria
- Ajustamos el modelo y
• Personalizando gráfico de barras
• Gráfico de barras apiladas predecimos
- Automated ARIMA forecasting
• Gráfico de barras agrupadas
con Auto.arima
7. ANÁLISIS ESTADÍSTICO
a. Estadísticos descriptivos
- Medidas de tendencia central
- Medidas de dispersión
c. Machine Learning supervisado
b. Frecuencia y tabla
- División de la data entre test y
- Frecuencia de tablas entrenamiento
- Tablas de doble Entrada - Problemas de clasificación
c. Test de independencia
- Matriz de confusión
Chi-Squared
- Problema de Regresión
d. Test de diferencia de Medias
- Error cuadrático medio
e. Correlaciones
- Calculando la rentabilidad de Google
- Tipos de correlaciones
d. Machine Learning No supervisado
- Test de correlación significancia
e. El problema del Overfitting
- Gráficos de correlación
f. Bias vs Varianza
- Calculando la rentabilidad de
Google 10.PRINCIPALES COMPONENTES
PLATFORM
8. REPORTERÍA EN R
a. ¿Qué es el componente principal?
MARKDOWN
b. La matemática de un componente
a. ¿Qué es un R Markdown? principal
b. Mi primer R Markdown c. Aplicaciones en R
c. Elegir el formato de salida d. Interpretación de un componente
d. Sintaxis básica principal
e. Adicionando código en R e. Gráficos Bitplot
f. Opciones sobre los chunks
11. ANÁLISIS DE CLÚSTER
g. Ejemplo en R
a. Clústeres no jerarquizados
- ¿Qué es un clúster?
MACHINE - Algoritmo de k-means
- Aplicaciones en R
LEARNING - Número óptimo de clúster
b. Clúster Jerarquizados
- ¿Qué es un clúster jerarquizado?
9. MACHINE LEARNING - Medidas de distancia y similitud
a. ¿Qué es Machine Learning? - ¿Qué es un dendrograma?
b. Diferencias con la programación - Aplicaciones en R
tradiciona - Cortando nuestro dendrograma
12. MODELO DE CLASIFICACIÓN
a. Preparando los datos
b. Modelos de regresión logística
- ¿Qué es una regresión
logística?
DEEP LEARNING
- ¿Qué es un Odds Ratio?
- La matemática detrás de Odd
(PYTHON)
Ratio 14. INTRODUCCIÓN A LAS
- Evaluación del Modelo REDES NEURONALES
c. ÁRBOLES DE DECISIÓN a. Motivación
- ¿Cómo funciona un árbol de b. Modelo de redes neuronales
decisión? c. El Perceptrón
- La matemática detrás de los d. Adaline
árboles de decisión e. Redes de Hopfield
- Dibujando nuestro primer árbol f. Máquinas de Boltzman
en R g. Modelos alternativos
- Estimamos un árbol de h. ¿Cómo aprenden las redes
regresión neuronales?
- Técnica de Random Forest i. Aplicaciones de las redes
d. Support Vector Machine neuronales
- ¿Cómo funciona un SVM?
- Matemática de las SVM
- Aplicación en R 15. REDES NEURONALES
- SVM con kernel Radial y a. ¿Qué es un perceptrón?
Polinómico b. Funciones de activación
c. El algoritmo de back propagación
13. MODELOS DE REGRESIÓN ¿Puede una red adivinar mi
dibujo?
a. Regresión lineal simple
d. Jugando con una red neuronal:
b. Regresión polinómica
playground tensorflow
c. Regresión múltiple
e. Aplicación en R
d. Regresión con interacciones
Evaluando nuestra red neuronal
e. Diagnóstico de regresiones
f. Red neuronal para regresión
f. Árboles de regresión
g. Evaluación de la red neuronal
16. RED NEURONAL SIMPLE
a. Concepto de Neurona
b. Concepto de Capas Ocultas
c. Arquitectura de una red neuronal
d. Modelo Computacional de una
red neuronal
e. Matemática de una red neuronal
f. Forma matricial de una red
19. CLASIFICACIÓN EN PYTHON
neuronal
g. Función de Costo en una red a. Conceptos de Modelos de
neuronal Clasificación
17. PERCEPTRÓN MULTICAPA b. Casos de Uso de Modelos de
Clasificación
a. Red Neuronal: Perceptrón
c. Aplicación de Modelo de
Multicapa
Clasificación en Python
b. Arquitectura del Perceptrón
d. Implementación del Modelo de
Multicapa
Clasificación
c. Gradiente descendiente con una
e. Métricas para Modelos de
variable
Clasificación
d. Gradiente descendiente
f. Validación de un Modelo de
generalización
Clasificación
e. Forward Propagation
g. Modelo de Clasificación MultiClase
f. Funciones de Activación
g. Comparaciones de Función de
20. REGRESIÓN EN PYTHON
Activación
h. BackPropagation a. Conceptos de Modelos de
Regresión
18. DEEP LEARNING EN PYTHON b. Casos de Uso de Modelos de
a. Deep Learning en Python Regresión
b. Descripción del entorno de c. Aplicación de Modelo de
Python para DL Regresión en Python
c. APIs más utilizadas en Python d. Implementación del Modelo de
para DL Regresión
d. Nuestro Primer Marco de e. Métricas para Modelos de
Aprendizaje Profundo Regresión
e. Entrenamiento utilizando método f. Validación de un Modelo de
Hold Out Regresión
f. Entrenamiento utilizando método
Cross Validation
g. Ajuste de un modelo
h. Tuneo de Hiper Parámetros
21. RED NEURONAL
RECURRENTE
a. Redes Neuronales Recurrentes
b. Elementos de una RNR
c. Arquitectura de una RNR
d. Aplicación de RNR en Python
22.RED NEURONAL
CONVOLUCIONAL
a. ¿Qué es una Red Convolucional?
Redes Neuronales
b. Convolucionales
Elementos de una RNC
c. Arquitectura de una RNC
d. Aplicación de RNC en Python
e. ¿Qué son los Mapas de
Características?
f. Filtros en imágenes
g. Aplicación: ¿Cómo diferenciar
gatitos de perritos?
h. Aplicación: ¿Cómo identificar
neumonía en los pacientes?
IRINA WINTER
Actualmente trabaja como Data Scientist Associate de una de las mejores empresas
del mundo, JP Morgan Chase (Estados Unidos). Es summa cum laude de la maestría y
del pregrado de matemáticas de la Pontificia Universidad Católica del Perú (PUCP), así
como Ph.D de Old Dominion University (Estados Unidos). Entre el 2010 y 2013 ha sido
analista senior del departamento de Riesgo Crediticio del Banco de Crédito del Perú
ALDO LEZAMA
Economista por la Universidad Nacional Mayor de San Marcos (UNMSM) y magíster
en finanzas por la Universidad del Pacíficoy magíster en estadística por la
Universidad Nacional Agraria de la Molina, Cuenta con amplia experiencia en temas
analíticos para el sector banca, telecomunicaciones, medios de pago y plataformas
de Big Data. Actualmente lidera el equipo de científicos de datos de Claro Perú.
EDWARD CRUZ
Economista de la Universidad Nacional San Antonio Abad de Cusco (UNSAAC),
graduado con honores. Estudios en Gestión Avanzada de Riesgo en Microfinancieras
en la Universidad ESAN. Además, ha realizado el curso de Extensión de Economía
Avanzada del Banco Central de Reserva del Perú en el 2016. Cuenta con experiencia
como analista estadístico y de datos con enfoque en Machine Learning y Métodos
Cuantitativos. Actualmente, se desempeña como analista en la Caja Municipal de
Ahorro y Crédito Cusco.
PROCESO
DE MATRÍCULA
1. Pago Link: Pagos con tarjeta de débito o crédito (Visa o Mastercard).
Paypal (Dólares): Pagos con tarjeta de débito o crédito (Visa o
Mastercard y American Express).