Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Profesor
Asignatura INTRODUCCIÓN A LA CIENCIA DE DATOS
Carácter Obligatorio
Carga Horas de docencia presencial: 60 Horas de Trabajo Total Horas: 120
Horaria del Estudiante: 60
OBJETIVO
El objetivo de este módulo es el de introducir al participante en los conceptos relacionados con Ciencia
de Datos, además de proporcionar la introducción a las herramientas informáticas que se usarán en
el resto del Programa. Asimismo, se repasarán los conceptos matemáticos necesarios para los
siguientes módulos. Como parte del módulo se realizará la resolución de casos prácticos y académicos
utilizando técnicas de ciencia de datos.
Proporcionar las bases matemáticas necesarias sobre las temáticas de estadísticas y optimización,
necesarias para el uso y desarrollo de herramientas para ciencia de datos. Como parte del módulo se
realizará la resolución de casos prácticos y académicos.
Algebra matricial
Operaciones con matrices
Determinante de una matriz
Solución de sistemas de ecuaciones lineales
Análisis matemático para la optimización de datos
Programación lineal
Métodos de transporte y asignación
Regresión lineal
Regresión polinomial
Mínimos cuadrados
Distancia Manhattan y Euclidiana
Probabilidades y estadística fundamental
Cálculo multivariable
Métodos de solución de ecuaciones diferenciales
OBJETIVO
OBJETIVO
Los objetivos de este módulo son: aprender las principales arquitecturas de las herramientas de
machine learning, aprender los conceptos de entropía y ganancia en información, trabajar con árboles
de decisión y construirlos, conocer el concepto de clustering. Como parte del módulo se realizará la
resolución de casos prácticos y académicos.
Métodos paramétricos:
Regresión Lineal y mínimos cuadrados
Máxima verosimilitud y MAP
Regresión logística binaria
Regresión Softmax
Redes neuronales: Forward, backpropagation
Support Vector Machines
Métodos kernel para SVM
Métodos no paramétricos:
K-Nearest Neighbors
Arboles de decisión
Métodos ensemble
Bagging: Random Forests
Boosting: AdaBoost, XGBoost y otros métodos de boosting
Modelos generativos supervisados
Clasificador bayesiano
Naive BayesCasos de estudio
Casos de estudio
Profesor
Asignatura ESTADISTICA AVANZADA Y OPTIMIZACIÓN
Carácter Obligatorio
Carga Horas de docencia presencial: 80 Horas de Trabajo del Total Horas: 140
Horaria Estudiante: 60
OBJETIVO
Los objetivos de este módulo son complementar la formación de los estudiantes con conceptos de
estadística avanzada y optimización, base que es muy útil para los algoritmos utilizados en Ciencia de
Datos.
Inferencia Estadística
Probabilidad
Muestra aleatoria
Estimación puntual y por intervalos
Contraste de hipótesis
Análisis estadístico de una o varias poblaciones
Análisis estadístico de una población
Comparación de varias poblaciones
Tablas de contingencia
Redes de Markov
Redes bayesianas
Método de Monte Carlo
Optimización
Conceptos básicos de optimización sin restricciones
Métodos de búsqueda local
Conceptos básicos de optimización con restricciones
Programación Lineal y Entera
Método de la Gradiente
Métodos de búsqueda local
Métodos de búsqueda global
Algoritmos metaheurísticos
Algoritmos genéticos
Profesor
Asignatura INGENIERÍA DE DATOS
Carácter Obligatorio
Carga Horas de docencia presencial: 80 Horas de Trabajo del Total Horas: 140
Horaria Estudiante: 60
OBJETIVO
El módulo tiene como objetivos permitir que el estudiante pueda analizar y limpiar los datos para su
posterior uso en algoritmos de Ciencia de Datos.
OBJETIVO
Este módulo tiene como objetivo que los estudiantes aprendan algoritmos para identificar patrones
subyacentes utilizando herramientas de Minería de Datos.
Preprocesamiento de datos
Discretización
Datos perdidos
Reducción de la dimensionalidad
Selección de modelos lineales
Modelos no lineales
Arboles de decisión. Multiclasificadores
Bagging
Boosting
Random Forest
Algoritmos para la obtención de reglas
Descomposición de problemas multiclase
Máquinas de soporte vectorial (SVM)
Modelos estadísticos
Reglas de asociación
Casos de estudio
OBJETIVO
El módulo tiene como objetivo que los estudiantes repasen o conozcan la metodología de
investigación científica y que posteriormente puedan empezar a estructurar sus trabajos de tesis
utilizando las herramientas de ciencia de datos ya conocidas. Este módulo también tiene el objetivo
de buscar que el proceso de titulación sea más eficiente.
Diseño de la Investigación.
La investigación Científica.
El Problema de Investigación.
Hipótesis.
Variables, Dimensiones e Indicadores.
Instrumentos de Recopilación de Datos.
Planificación de la Investigación.
Estructura del Proyecto de Investigación.
La inferencia científica.
OBJETIVO
En base a los conocimientos desarrollados en Machine Learning I, el presente módulo tiene por
objetivo que los estudiantes comprendan algoritmos más avanzados en el análisis de datos y los
procesos predictivos.
Clustering:
K-Means y variantes
Clustering probabilístico: Gaussian Mixture Models
Reducción de Dimensionalidad y visualización:
PCA y variantes
Aplicaciones de PCA
Inferencia variacional
Perspectiva general de modelos bayesianos
Definiciones de ELBO y divergencia KL
Inferencia variacional mean field
GMM variacional
Miscelánea de modelos probabilísticos
Hidden Markov Models
PMF y Filtros colaborativos
TSNE
LDA (Latent Dirichlet Allocation)
Evaluación y comparación de modelos probabilísticos
OBJETIVO
Cuando el estudiante ya conozca los principales algoritmos utilizados en Machine Learning, podrá
introducirse en Deep Learning o aprendizaje profundo, el modulo tiene como objetivo que el
estudiante pueda comprender y utilizar herramientas de Deep Learning.
El módulo tiene como objetivo introducir al estudiante en los conceptos de Big Data, para que con los
conocimientos de Ciencia de Datos pueda trabajar con grandes cantidades de datos.
OBJETIVO
En el módulo se busca que los estudiantes puedan desarrollar casos de estudio guiados por el docente,
utilizando las diversas herramientas aprendidas a lo largo de la Maestría, esto permitirá al estudiante
comenzar con proyectos como científico de datos.
Caso de estudio 1
Captura de datos
Preprocesamiento
Almacenamiento
Análisis de datos
Caso de estudio 2
Captura de datos
Preprocesamiento
Almacenamiento
Análisis de datos