MIT Programa Ciencia de Datos Aprendizaje Automatico - 15 Feb 23

CIENCIA DE DATOS Y
APRENDIZAJE AUTOMATICO:
TOMA DE DECISIONES
BASADA EN DATOS
Comienza a tomar decisiones basadas en datos con el
programa de 12 semanas impartido por profesores del MIT.
SOBRE EL
MIT IDSS
La educación y la investigación en el MIT Institute for Data, Systems, and Society – o Instituto de Datos, Sistemas y
Sociedad (IDSS) - son llevadas a cabo con el objetivo de proporcionar soluciones a desafíos sociales complejos mediante
la comprensión y el análisis de datos. Así, el Instituto apuesta por el desarrollo de métodos analíticos que puedan ser
aplicados a diversas áreas como las finanzas, sistemas de energía, la urbanización, las redes sociales y la salud.
MIT IDSS abarca la colisión y síntesis de tanto ideas como métodos de disciplinas analíticas incluyendo la estadística,
ciencia de datos, teoría e inferencia de la información, teoría de sistemas y control, optimización, economía,
comportamiento humano y redes. Todas estas disciplinas son relevantes tanto para comprender sistemas complejos
como crear arquitecturas y diseños que permitan la cuantificación y administración.
MISION
La misión del MIT IDSS es promover la educación y la investigación de métodos analíticos en sistemas de información
y decisión, estadística y ciencia de datos, ciencias sociales y aplicar estos métodos para abordar desafíos sociales
complejos en un conjunto diverso de áreas como finanzas, sistemas de energía, urbanización, redes sociales y salud.
Los avances tecnológicos en áreas como sensores inteligentes, big data, comunicaciones, computación y redes sociales
están escalando rápidamente el tamaño y la complejidad de los sistemas y redes interconectados y, al mismo tiempo, están
generando grandes cantidades de datos que pueden conducir a nuevos conocimientos y comprensión.
02
SOBRE
EL PROGRAMA
La demanda de profesionales expertos en datos, análisis y aprendizaje automático está aumentando. Según
un informe de la Oficina de Estadísticas Laborales de EE. UU., la demanda de ciencia de datos aumentará y
creará 11,5 millones de nuevos puestos de trabajo para 2026. Los científicos de datos aportan valor a
organizaciones de todas las industrias porque pueden resolver desafíos complejos e impulsar
importantes procesos de toma de decisiones.
El MIT Instituto de Datos, Sistemas y Sociedad (IDSS) entiende el poder de descubrir el valor de los datos,
por lo que ha creado una gran variedad de cursos y programas en línea para llevar tus habilidades de análisis
de datos al siguiente nivel. Ya sea que estés buscando comenzar en el área, buscando oportunidades de
desarrollo profesional o simplemente quieras brindar información de valor a tu empresa, los programas del
MIT IDSS te enseñarán a aprovechar los datos de nuevas e innovadoras formas.
03
BENEFICIOS DEL
Trabaja en un sólido entorno
PROGRAMA de colaboración para crear redes con
tus compañeros de programa.

Aprende en línea de 11 renombrados
profesores del MIT. Obtén un certificado de finalización del programa
por parte de MIT IDSS.
Impulsa tu carrera con sesiones de revisión
de CV y LinkedIn. Demuestra tu experiencia Obtén tutoría por parte de expertos de la industria

y dominio en ciencia de datos con un portafolio sobre las aplicaciones de la ciencia de datos
de 3 proyectos y más de 15 casos de estudio. en el mundo real.
ESTRUCTURA Obtén más de 30 horas de conferencias grabadas por

parte de los profesores del MIT IDSS, sesiones guiadas
con expertos de la industria, junto con proyectos
DEL PROGRAMA prácticos y sesiones conceptuales, estructurados de la

siguiente manera:
SEMANA 1 y 2 Cursos básicos: Python y estadísticas para ciencia de datos
SEMANA 3 Agrupamiento, agrupamiento espectral, componentes e incrustaciones:

Sesiones, casos de estudio prácticos y cuestionarios
SEMANA 4 Descanso de aprendizaje

Sesión conceptual: dar sentido a los datos no estructurados, así como regresión y predicción
SEMANA 5 y 6 Aprendizaje supervisado y no supervisado: regresión, prueba de hipótesis

y clasificación

Sesión conceptual: clasificación y prueba de hipótesis
SEMANA 8 y 9 Aprendizaje profundo y sistemas de recomendaci6n: redes neuronales, filtrado

colaborativo y técnicas de recomendación personalizadas a través de sesiones, estudio de
casos prácticos y cuestionarios

Sesión conceptual: aprendizaje profundo y sistemas de recomendación
SEMANA 11 y 12 Redes y análisis predictivo: modelos gráficos, modelado predictivo y

técnicas de ingeniería de características a través de sesiones, estudios de casos prácticos y cuestionarios
Nota: Las sesiones conceptuales ayudan a los alumnos a solidificar los conceptos aprendidos en el contenido de video de
la semana o como una sesión preparatoria para las próximas sesiones. Esto también ayuda a los alumnos a preparar sus
preguntas para la sesión en vivo de fin de semana con el experto en la industria. 04
¿PARA QUIÉN ES EL PROGRAMA?
Científicos de datos, analistas de datos y profesionales en activo que deseen extraer conocimientos prácticos
a partir de grandes volúmenes de datos.
Debido a la naturaleza del programa, se adecúa tanto para profesionales con poca experiencia como para
altos directivos, incluyendo directores de tecnología, analistas de inteligencia de negocio, gerentes de ciencia
de datos, entusiastas de la ciencia de datos, profesionales de Tl, consultores y gerentes de empresas.
Para aquellos que cuentan con alguna formación académica o profesional en matemáticas aplicadas y
estadística, les resultará más fácil el aprendizaje. Sin embargo, todos los participantes pueden aprovechar al
máximo el programa aprendiendo sobre estos temas con el apoyo de Great Learning.
DESPUÉS DE ESTE CURSO
SERAS CAPAZ DE:

Comprender las complejidades de Seleccionar la mejor forma para representar
técnicas de ciencia de datos y sus datos al hacer predicciones.
aplicaciones a problemas del mundo real.
Comprender la teoría detrás de los sistemas
lmplementar varias técnicas de aprendizaje de recomendación y explorar sus aplicaciones
automático para resolver problemas complejos y en múltiples industrias y contextos empresariales.
tomar decisiones de negocio basadas en datos.
Crear un portafolio listo con proyectos para

Explorar dos áreas del aprendizaje automático: demostrar tu capacidad de extraer insights e
aprendizaje profundo y redes neurales. Además información empresarial de datos.

de cómo pueden ser aplicadas a áreas como
la visión computarizada.
05
PLAN DE ESTUDIOS DEL
PROGRAMA
El programa tiene una duración de 12 semanas:
SEMANA 1 - 2
Cursos básicos: Python y estadísticas para la ciencia de datos

Python para ciencia de datos Estadística para la ciencia de datos
Numpy Estadística descriptivas
Pandas Estadística inferencial
Visualización de datos
Caso de estudio 1: análisis de la Copa Mundial de la FIFA Caso de estudio 2: análisis de pasos de usuarios de
Evaluación: proyecto Movielens productos de fitness

Evaluación: proyecto Movielens
SEMANA 3
Dar sentido a los datos no estructurados

Introducción
¿Qué es el aprendizaje no supervisado y por qué es un desafío?

Ejemplos de aprendizaje no supervisado
Agrupación
¿Qué es la agrupación?
Cuando usar la agrupación en clústeres
Preliminares de K-means
El algoritmo K-means
¿Cómo evaluar a agrupación?
K-means: ¿Qué es lo que realmente hace un clúster?
Mas allá de K-means: otras nociones de distancia
Mas allá de K-means: datos y preprocesamiento
Mas allá de K-means: big data y Bayes no paramétrico
Mas allá de la agrupación
Caso de estudio 1: códigos genéticos
Caso de estudio 2: encontrar temas en la descripción del proyecto
06
Agrupación espectral, componentes e incrustaciones
¿Qué pasa si no tenemos características para describir los datos o no todos son
significativos?
Encontrar los componentes principales en datos y aplicaciones

La magia de los vectores propios I
Agrupamiento en gráficos y redes
Características de los gráficos: la magia de los vectores propios II
Agrupación espectral
Agrupación de modularidad
Incrustaciones: nuevas características y su significado
Caso de estudio 3: PCA - identificación de rostros
Caso de estudio 4: agrupación espectral - agrupación de noticias
SEMANA 4
DESCANSO DE APRENDIZAJE
Con una sesión conceptual sobre dar sentido a los datos no estructurados
07
SEMANA 5
Regresión y predicción
Regresión y extensiones clásicas lineales y no lineales
Regresión lineal con una y varias variables
Regresión lineal para predicción
Regresión lineal para inferencia causal
Logística y otros tipos de regresión no lineal
Caso de estudio 1: predicción de salarios 1
Caso de estudio 2: brecha salarial de género
Regresión moderna con datos de alta dimensión
Hacer buenas predicciones con datos de alta dimensión
Sobreajuste por validación y validación cruzada
Regularización por Lasso, Ridge y sus modificaciones
Árboles de regresión, bosque aleatorio y árboles potenciados
Caso de estudio 3: ¿Los países pobres crecen más rápido que los países ricos?
El uso de la regresión moderna para la inferencia causal
Ensayos de control aleatorizados
Estudios observacionales con confusión
Caso de estudio 4: predicción de salarios 2

Caso de estudio 5: el efecto de la posesión de armas en las tasas de homicidio
08
SEMANA 6
Clasificación y prueba de hipótesis
· Clasificación y prueba de hipótesis
· ¿Qué son las anomalías? ¿Qué es el fraude? ¿Spam?
· Clasificación binaria: falso positivo/negativo, precisión/recuperación y puntuación F1
· Regresión logística y probit: clasificación binaria estadística
· Prueba de hipótesis: prueba de razón y valores p de Neyman-Pearson; confianza
· Maquina de vectores de soporte: clasificador no estadístico
· Perceptrón: clasificador simple con interpretación elegante
Caso de estudio 1: regresión logística - el desastre del Challenger
SEMANA 7
Con una sesión conceptual sobre clasificación y prueba de hipótesis
SEMANA 8
Aprendizaje profundo
· ¿Qué es la clasificación de imágenes? Presentación ImageNet y ejemplos
· Clasificación utilizando un único umbral lineal (perceptrón)
· Representaciones jerárquicas
· Ajuste de parámetros usando retro propagación
· Funciones no convexas
· ¿Qué tan interpretables son sus características?
· Manipulación de redes profundas (ejemplo del avestruz)
· Transferencia de aprendizaje
· Otras aplicaciones I: reconocimiento de voz
· Otras aplicaciones II: procesamiento del lenguaje natural
Caso de estudio 1: límite de decisión de una red neuronal profunda
09
SEMANA 9
Sistemas de recomendación
Recomendaciones y clasificación
¿Qué hace un sistema de recomendación?
¿Cuál es el problema de la predicción de recomendaciones?

¿Y, que datos tenemos?
Uso de promedios de población
Uso de comparaciones de población y clasificación
Caso de estudio 1: recomendación de películas
Filtración colaborativa
Personalización mediante filtrado colaborativo utilizando usuarios similares
Personalización mediante filtrado colaborativo utilizando elementos similares
Personalización mediante filtrado colaborativo utilizando usuarios y elementos similares
Caso de estudio 2: recomiende nuevas canciones a los usuarios en función de sus hábitos de escucha
Recomendaciones personalizadas
Personalización mediante comparaciones, clasificaciones y elementos de usuarios
Modelo oculto de Markov / redes neuronales, gráfico bipartito y modelo gráfico
Uso de información secundaria
20 preguntas y aprendizaje activo
Construyendo un sistema: desafíos algorítmicos y del sistema
Caso de estudio 3: hacer recomendaciones de nuevos productos
10
SEMANA 10
Con una sesión conceptual sobre aprendizaje profundo y sistemas de recomendación
SEMANA 11
Redes y modelos gráficos

Introducción
Introducción a las redes
Ejemplos de redes
Representación de redes
Caso de estudio 1: navegación / GPS
1.1 : Filtrado de Kalman: seguimiento de la posición 2D de un objeto cuando se mueve con velocidad constante
1.2 : Filtrado de Kalman: seguimiento de la posición 3D de un objeto que cae debido a la gravedad
Redes
Medidas de centralidad: grado, vector propio y rango de página
Centralidad de cercanía e intermediación
Distribución de grados, agrupamiento y mundo pequeño
Modelos de red: Erdos-Renyi, modelo de configuración y conexión preferencial
Modelos estocásticos en redes para la propagación de virus o ideas
Maximización de la influencia
Caso de estudio 2: identificación de nuevos genes que causan autismo
Modelos gráficos
Modelos gráficos no dirigidos
Modelos de Ising y Gaussianos
Aprendizaje de modelos gráficos a partir de datos
Modelos gráficos dirigidos
Estructuras en V, "explicaciones" y aprendizaje de modelos gráficos dirigidos
Inferencia en modelos gráficos: marginales y paso de mensajes
Modelo oculto de Márkov (HMM)
Filtro Kalman
11
SEMANA 12
Análisis predictivo
Modelado predictivo para datos temporales
Ingeniería de predicción
Caso de estudio 1: taxi de la ciudad de Nueva York
Ingeniería de funciones
Introducción
Tipos de funciones
Síntesis profunda de funciones: primitivas y algoritmos
Síntesis profunda de funciones: apilamiento
Caso de estudio 2: conjunto de datos minoristas del Reino Unido
Evaluación: estudio de caso calificado - viajes en taxi en la ciudad de Nueva York
MÓDULOS A TU PROPIO RITMO CON MASTERCLASS OPCIONAL

Desmitificando ChatGPT y sus aplicaciones
Descripción general de ChatGPT y OpenAI

Implicaciones para el trabajo, los negocios y la educación
Ingeniería inmediata para el ajuste de las salidas
ChatGPT: Stack de desarrollo
Fundamentos matemáticos para la IA generativa

Modelos transformadores: IA generativa para el lenguaje natural
Creación práctica de prototipos de ChatGPT
12
PROFESORES
Devavrat Shah
Profesor, EECS e IDSS, MIT
Felipe Rigollet
Profesor, matemáticas e IDSS, MIT
Carolina Uhler
Profesora asociada de Henry L. y Grace Doherty,
EECS e IDSS, MIT
Victor Chernozhukov
Profesor, economía e IDSS, MIT
Stefanie Jegelka
Profesora asociada de desarrollo profesional de X- Consortium,
EECS e IDSS, MIT
13
Ankur Moitra
Profesor asociado de desarrollo profesional de Rockwell International,
matemáticas e IDSS, MIT
Tamara Broderick
Profesora Asociada, EECS e IDSS, MIT
David D. Gamarnik
Profesor de operaciones de la Universidad Tecnológica de Nanyang
investigación, Sloan School of Management e IDSS, MIT
Jonathan Kelner
Profesor, matemáticas, MIT
Kalyan Veeramachaneni
Científico investigador principal en el Laboratorio de Información
y Sistemas de Decisión, MIT
Guy Bresler
Profesor asociado, EECS e IDSS, MIT
14
MENTORES DE
PROGRAMA
El programa te capacita para trabajar en proyectos relevantes para la industria por parte de expertos en ciencia
de datos y aprendizaje automático a través de sesiones de aprendizaje guiado en vivo para brindarte una comprensión
práctica de los conceptos básicos. Algunos de los expertos de la industria que colaboran como mentores son:
Jabes Rivera Luis Castro

Ingeniero Sénior de Científico de Datos
Aprendizaje Automático
Intuit Mailchimp (Canadá)
Clivi Health (México)
Juan Pablo Castillo Luciano Tozato

Ingeniero Sénior de Arquitecto de Datos,
Aprendizaje Automático Servicios financieros
Andium (EE. UU.) Google (EE. UU.)
Juan Carlos Medina

Científico de Datos Sénior
Nubank (México)
COORDINADOR DE PROGRAMA:
TU GUÍA PERSONAL
DE GREAT LEARNING
Tu coordinador de programa, parte del equipo de
Great Learning, será tu único punto de contacto para todas
las consultas académicas y no académicas del programa.
Tu coordinador realizara un seguimiento de tu aprendizaje, te
brindara apoyo personalizado, así como ánimos para
garantizar tu éxito en el programa.
15
CERTIFICADO
La imagen es solo para fines ilustrativos. El certificado real puede estar sujeto a cambios a discreci6n de la universidad.
PROCESO DE SOLICITUD
Paso 1 Paso 2 Paso 3
Formulario de solicitud Evaluación de la solicitud. Tu Únete el programa. Si
Regístrate completando el solicitud será revisada para eres seleccionado, recibirás
formulario de solicitud en línea. determinar si éste es el una oferta de admisión.
programa indicado para ti. Asegura tu lugar en el grupo
pagando la cuota de admisión.
DETALLES DE SOLICITUD Y CUOTAS

Duraci6n del programa: 12 semanas
Cuota: Consulta con tu Asesor de Programa sobre las cuotas y facilidades de pago
16
El programa de aprendizaje automático y ciencia de datos del MIT IDSS, con un plan de
estudios desarrollado e impartido por profesores del MIT, se imparte en colaboración con:
Great Learning es una plataforma de tecnología educativa con la misión de hacer que los
profesionales sean competentes y se mantengan preparados para el futuro. Sus programas se
enfocan en la próxima frontera de crecimiento en la industria y actualmente abarcan análisis,
ciencia de datos, big data, aprendizaje automático, inteligencia artificial, aprendizaje profundo,
computación en la nube y más. Great Learning utiliza tecnología, contenido de alta calidad y
colaboraciones con expertos de la industria para brindar una experiencia de aprendizaje integral
que ayuda a los candidatos a aprender, aplicar y demostrar sus competencias. Todos los
programas se ofrecen en colaboración con universidades líderes a nivel mundial y los toman miles
de profesionales cada año de más de 170 países.
17
COMIENZA AHORA A
TOMAR DECISIONES
BASADAS EN DATOS
APLICA YA
HABLA CON UN ASESOR DEL PROGRAMA
+52 800 283 2768
¿TIENES PREGUNTAS SOBRE EL PROGRAMA O

SOBRE CÓMO ENCAJA CON TUS METAS PROFESIONALES?
dsml-es.mit@mygreatlearning.com
VISITA NUESTRO SITIO WEB
https://www.mygreatlearning.com/mit-idss-es-programa-ciencia-de-
datos-aprendizaje-automatico

MIT Programa Ciencia de Datos Aprendizaje Automatico - 15 Feb 23

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

MIT Programa Ciencia de Datos Aprendizaje Automatico - 15 Feb 23

Cargado por

Copyright:

Formatos disponibles

CIENCIA DE DATOS Y

como crear arquitecturas y diseños que permitan la cuantificación y administración.

tus compañeros de programa.

de CV y LinkedIn. Demuestra tu experiencia Obtén tutoría por parte de expertos de la industria

ESTRUCTURA Obtén más de 30 horas de conferencias grabadas por

DEL PROGRAMA prácticos y sesiones conceptuales, estructurados de la

SEMANA 1 y 2 Cursos básicos: Python y estadísticas para ciencia de datos

SEMANA 3 Agrupamiento, agrupamiento espectral, componentes e incrustaciones:

SEMANA 4 Descanso de aprendizaje

SEMANA 5 y 6 Aprendizaje supervisado y no supervisado: regresión, prueba de hipótesis

SEMANA 7 Descanso de aprendizaje

SEMANA 8 y 9 Aprendizaje profundo y sistemas de recomendaci6n: redes neuronales, filtrado

SEMANA 10 Descanso de aprendizaje

SEMANA 11 y 12 Redes y análisis predictivo: modelos gráficos, modelado predictivo y

de datos, entusiastas de la ciencia de datos, profesionales de Tl, consultores y gerentes de empresas.

DESPUÉS DE ESTE CURSO

SERAS CAPAZ DE:

Crear un portafolio listo con proyectos para

aprendizaje profundo y redes neurales. Además información empresarial de datos.

Cursos básicos: Python y estadísticas para la ciencia de datos

Evaluación: proyecto Movielens productos de fitness

Dar sentido a los datos no estructurados

¿Qué es el aprendizaje no supervisado y por qué es un desafío?

Caso de estudio 1: códigos genéticos

Caso de estudio 2: encontrar temas en la descripción del proyecto

Encontrar los componentes principales en datos y aplicaciones

Caso de estudio 3: PCA - identificación de rostros

Caso de estudio 4: agrupación espectral - agrupación de noticias

Regresión y extensiones clásicas lineales y no lineales

Regresión lineal con una y varias variables

Regresión lineal para predicción

Regresión lineal para inferencia causal

Logística y otros tipos de regresión no lineal

Caso de estudio 1: predicción de salarios 1

Caso de estudio 2: brecha salarial de género

Regresión moderna con datos de alta dimensión

Hacer buenas predicciones con datos de alta dimensión

Sobreajuste por validación y validación cruzada

Regularización por Lasso, Ridge y sus modificaciones

Árboles de regresión, bosque aleatorio y árboles potenciados

El uso de la regresión moderna para la inferencia causal

Ensayos de control aleatorizados

Estudios observacionales con confusión

Caso de estudio 4: predicción de salarios 2

Clasificación y prueba de hipótesis

· Clasificación y prueba de hipótesis

· ¿Qué son las anomalías? ¿Qué es el fraude? ¿Spam?

· Clasificación binaria: falso positivo/negativo, precisión/recuperación y puntuación F1

· Regresión logística y probit: clasificación binaria estadística

· Prueba de hipótesis: prueba de razón y valores p de Neyman-Pearson; confianza

· Maquina de vectores de soporte: clasificador no estadístico

· Perceptrón: clasificador simple con interpretación elegante

Caso de estudio 1: regresión logística - el desastre del Challenger

· ¿Qué es la clasificación de imágenes? Presentación ImageNet y ejemplos

· Clasificación utilizando un único umbral lineal (perceptrón)

· Ajuste de parámetros usando retro propagación

· ¿Qué tan interpretables son sus características?

· Manipulación de redes profundas (ejemplo del avestruz)

· Otras aplicaciones I: reconocimiento de voz

· Otras aplicaciones II: procesamiento del lenguaje natural

Caso de estudio 1: límite de decisión de una red neuronal profunda

¿Qué hace un sistema de recomendación?

¿Cuál es el problema de la predicción de recomendaciones?