Está en la página 1de 18

CIENCIA DE DATOS Y

APRENDIZAJE AUTOMATICO:
TOMA DE DECISIONES
BASADA EN DATOS
Comienza a tomar decisiones basadas en datos con el
programa de 12 semanas impartido por profesores del MIT.
SOBRE EL

MIT IDSS
La educación y la investigación en el MIT Institute for Data, Systems, and Society – o Instituto de Datos, Sistemas y

Sociedad (IDSS) - son llevadas a cabo con el objetivo de proporcionar soluciones a desafíos sociales complejos mediante

la comprensión y el análisis de datos. Así, el Instituto apuesta por el desarrollo de métodos analíticos que puedan ser

aplicados a diversas áreas como las finanzas, sistemas de energía, la urbanización, las redes sociales y la salud.

MIT IDSS abarca la colisión y síntesis de tanto ideas como métodos de disciplinas analíticas incluyendo la estadística,

ciencia de datos, teoría e inferencia de la información, teoría de sistemas y control, optimización, economía,

comportamiento humano y redes. Todas estas disciplinas son relevantes tanto para comprender sistemas complejos

como crear arquitecturas y diseños que permitan la cuantificación y administración.

MISION

La misión del MIT IDSS es promover la educación y la investigación de métodos analíticos en sistemas de información

y decisión, estadística y ciencia de datos, ciencias sociales y aplicar estos métodos para abordar desafíos sociales

complejos en un conjunto diverso de áreas como finanzas, sistemas de energía, urbanización, redes sociales y salud.

Los avances tecnológicos en áreas como sensores inteligentes, big data, comunicaciones, computación y redes sociales
están escalando rápidamente el tamaño y la complejidad de los sistemas y redes interconectados y, al mismo tiempo, están
generando grandes cantidades de datos que pueden conducir a nuevos conocimientos y comprensión.

02
SOBRE
EL PROGRAMA
La demanda de profesionales expertos en datos, análisis y aprendizaje automático está aumentando. Según
un informe de la Oficina de Estadísticas Laborales de EE. UU., la demanda de ciencia de datos aumentará y
creará 11,5 millones de nuevos puestos de trabajo para 2026. Los científicos de datos aportan valor a
organizaciones de todas las industrias porque pueden resolver desafíos complejos e impulsar
importantes procesos de toma de decisiones.

El MIT Instituto de Datos, Sistemas y Sociedad (IDSS) entiende el poder de descubrir el valor de los datos,
por lo que ha creado una gran variedad de cursos y programas en línea para llevar tus habilidades de análisis
de datos al siguiente nivel. Ya sea que estés buscando comenzar en el área, buscando oportunidades de
desarrollo profesional o simplemente quieras brindar información de valor a tu empresa, los programas del
MIT IDSS te enseñarán a aprovechar los datos de nuevas e innovadoras formas.

03
BENEFICIOS DEL
Trabaja en un sólido entorno
PROGRAMA de colaboración para crear redes con

tus compañeros de programa.


Aprende en línea de 11 renombrados
profesores del MIT. Obtén un certificado de finalización del programa
por parte de MIT IDSS.
Impulsa tu carrera con sesiones de revisión

de CV y LinkedIn. Demuestra tu experiencia Obtén tutoría por parte de expertos de la industria


y dominio en ciencia de datos con un portafolio sobre las aplicaciones de la ciencia de datos
de 3 proyectos y más de 15 casos de estudio. en el mundo real.

ESTRUCTURA Obtén más de 30 horas de conferencias grabadas por


parte de los profesores del MIT IDSS, sesiones guiadas
con expertos de la industria, junto con proyectos

DEL PROGRAMA prácticos y sesiones conceptuales, estructurados de la


siguiente manera:

SEMANA 1 y 2 Cursos básicos: Python y estadísticas para ciencia de datos

SEMANA 3 Agrupamiento, agrupamiento espectral, componentes e incrustaciones:


Sesiones, casos de estudio prácticos y cuestionarios

SEMANA 4 Descanso de aprendizaje


Sesión conceptual: dar sentido a los datos no estructurados, así como regresión y predicción

SEMANA 5 y 6 Aprendizaje supervisado y no supervisado: regresión, prueba de hipótesis


y clasificación

SEMANA 7 Descanso de aprendizaje


Sesión conceptual: clasificación y prueba de hipótesis

SEMANA 8 y 9 Aprendizaje profundo y sistemas de recomendaci6n: redes neuronales, filtrado


colaborativo y técnicas de recomendación personalizadas a través de sesiones, estudio de
casos prácticos y cuestionarios

SEMANA 10 Descanso de aprendizaje


Sesión conceptual: aprendizaje profundo y sistemas de recomendación

SEMANA 11 y 12 Redes y análisis predictivo: modelos gráficos, modelado predictivo y


técnicas de ingeniería de características a través de sesiones, estudios de casos prácticos y cuestionarios

Nota: Las sesiones conceptuales ayudan a los alumnos a solidificar los conceptos aprendidos en el contenido de video de
la semana o como una sesión preparatoria para las próximas sesiones. Esto también ayuda a los alumnos a preparar sus
preguntas para la sesión en vivo de fin de semana con el experto en la industria. 04
¿PARA QUIÉN ES EL PROGRAMA?
Científicos de datos, analistas de datos y profesionales en activo que deseen extraer conocimientos prácticos
a partir de grandes volúmenes de datos.

Debido a la naturaleza del programa, se adecúa tanto para profesionales con poca experiencia como para

altos directivos, incluyendo directores de tecnología, analistas de inteligencia de negocio, gerentes de ciencia

de datos, entusiastas de la ciencia de datos, profesionales de Tl, consultores y gerentes de empresas.

Para aquellos que cuentan con alguna formación académica o profesional en matemáticas aplicadas y

estadística, les resultará más fácil el aprendizaje. Sin embargo, todos los participantes pueden aprovechar al

máximo el programa aprendiendo sobre estos temas con el apoyo de Great Learning.

DESPUÉS DE ESTE CURSO

SERAS CAPAZ DE:


Comprender las complejidades de Seleccionar la mejor forma para representar
técnicas de ciencia de datos y sus datos al hacer predicciones.
aplicaciones a problemas del mundo real.
Comprender la teoría detrás de los sistemas
lmplementar varias técnicas de aprendizaje de recomendación y explorar sus aplicaciones
automático para resolver problemas complejos y en múltiples industrias y contextos empresariales.
tomar decisiones de negocio basadas en datos.

Crear un portafolio listo con proyectos para


Explorar dos áreas del aprendizaje automático: demostrar tu capacidad de extraer insights e

aprendizaje profundo y redes neurales. Además información empresarial de datos.


de cómo pueden ser aplicadas a áreas como
la visión computarizada.

05
PLAN DE ESTUDIOS DEL
PROGRAMA
El programa tiene una duración de 12 semanas:

SEMANA 1 - 2

Cursos básicos: Python y estadísticas para la ciencia de datos


Python para ciencia de datos Estadística para la ciencia de datos
Numpy Estadística descriptivas
Pandas Estadística inferencial
Visualización de datos

Caso de estudio 1: análisis de la Copa Mundial de la FIFA Caso de estudio 2: análisis de pasos de usuarios de

Evaluación: proyecto Movielens productos de fitness


Evaluación: proyecto Movielens

SEMANA 3

Dar sentido a los datos no estructurados


Introducción

¿Qué es el aprendizaje no supervisado y por qué es un desafío?


Ejemplos de aprendizaje no supervisado

Agrupación
¿Qué es la agrupación?
Cuando usar la agrupación en clústeres
Preliminares de K-means
El algoritmo K-means
¿Cómo evaluar a agrupación?
K-means: ¿Qué es lo que realmente hace un clúster?
Mas allá de K-means: otras nociones de distancia
Mas allá de K-means: datos y preprocesamiento
Mas allá de K-means: big data y Bayes no paramétrico
Mas allá de la agrupación

Caso de estudio 1: códigos genéticos

Caso de estudio 2: encontrar temas en la descripción del proyecto

06
Agrupación espectral, componentes e incrustaciones
¿Qué pasa si no tenemos características para describir los datos o no todos son
significativos?

Encontrar los componentes principales en datos y aplicaciones


La magia de los vectores propios I
Agrupamiento en gráficos y redes
Características de los gráficos: la magia de los vectores propios II
Agrupación espectral
Agrupación de modularidad
Incrustaciones: nuevas características y su significado

Caso de estudio 3: PCA - identificación de rostros

Caso de estudio 4: agrupación espectral - agrupación de noticias

SEMANA 4

DESCANSO DE APRENDIZAJE
Con una sesión conceptual sobre dar sentido a los datos no estructurados

07
SEMANA 5

Regresión y predicción

Regresión y extensiones clásicas lineales y no lineales

Regresión lineal con una y varias variables

Regresión lineal para predicción

Regresión lineal para inferencia causal

Logística y otros tipos de regresión no lineal

Caso de estudio 1: predicción de salarios 1

Caso de estudio 2: brecha salarial de género

Regresión moderna con datos de alta dimensión

Hacer buenas predicciones con datos de alta dimensión

Sobreajuste por validación y validación cruzada

Regularización por Lasso, Ridge y sus modificaciones

Árboles de regresión, bosque aleatorio y árboles potenciados

Caso de estudio 3: ¿Los países pobres crecen más rápido que los países ricos?

El uso de la regresión moderna para la inferencia causal

Ensayos de control aleatorizados

Estudios observacionales con confusión

Caso de estudio 4: predicción de salarios 2


Caso de estudio 5: el efecto de la posesión de armas en las tasas de homicidio

08
SEMANA 6

Clasificación y prueba de hipótesis

· Clasificación y prueba de hipótesis

· ¿Qué son las anomalías? ¿Qué es el fraude? ¿Spam?

· Clasificación binaria: falso positivo/negativo, precisión/recuperación y puntuación F1

· Regresión logística y probit: clasificación binaria estadística

· Prueba de hipótesis: prueba de razón y valores p de Neyman-Pearson; confianza

· Maquina de vectores de soporte: clasificador no estadístico

· Perceptrón: clasificador simple con interpretación elegante

Caso de estudio 1: regresión logística - el desastre del Challenger

SEMANA 7

DESCANSO DE APRENDIZAJE
Con una sesión conceptual sobre clasificación y prueba de hipótesis

SEMANA 8

Aprendizaje profundo

· ¿Qué es la clasificación de imágenes? Presentación ImageNet y ejemplos

· Clasificación utilizando un único umbral lineal (perceptrón)

· Representaciones jerárquicas

· Ajuste de parámetros usando retro propagación

· Funciones no convexas

· ¿Qué tan interpretables son sus características?

· Manipulación de redes profundas (ejemplo del avestruz)

· Transferencia de aprendizaje

· Otras aplicaciones I: reconocimiento de voz

· Otras aplicaciones II: procesamiento del lenguaje natural

Caso de estudio 1: límite de decisión de una red neuronal profunda

09
SEMANA 9

Sistemas de recomendación

Recomendaciones y clasificación

¿Qué hace un sistema de recomendación?

¿Cuál es el problema de la predicción de recomendaciones?


¿Y, que datos tenemos?

Uso de promedios de población

Uso de comparaciones de población y clasificación

Caso de estudio 1: recomendación de películas

Filtración colaborativa

Personalización mediante filtrado colaborativo utilizando usuarios similares

Personalización mediante filtrado colaborativo utilizando elementos similares

Personalización mediante filtrado colaborativo utilizando usuarios y elementos similares

Caso de estudio 2: recomiende nuevas canciones a los usuarios en función de sus hábitos de escucha

Recomendaciones personalizadas

Personalización mediante comparaciones, clasificaciones y elementos de usuarios

Modelo oculto de Markov / redes neuronales, gráfico bipartito y modelo gráfico

Uso de información secundaria

20 preguntas y aprendizaje activo

Construyendo un sistema: desafíos algorítmicos y del sistema

Caso de estudio 3: hacer recomendaciones de nuevos productos

10
SEMANA 10

DESCANSO DE APRENDIZAJE
Con una sesión conceptual sobre aprendizaje profundo y sistemas de recomendación

SEMANA 11

Redes y modelos gráficos


Introducción
Introducción a las redes

Ejemplos de redes

Representación de redes
Caso de estudio 1: navegación / GPS
1.1 : Filtrado de Kalman: seguimiento de la posición 2D de un objeto cuando se mueve con velocidad constante

1.2 : Filtrado de Kalman: seguimiento de la posición 3D de un objeto que cae debido a la gravedad

Redes
Medidas de centralidad: grado, vector propio y rango de página

Centralidad de cercanía e intermediación

Distribución de grados, agrupamiento y mundo pequeño

Modelos de red: Erdos-Renyi, modelo de configuración y conexión preferencial

Modelos estocásticos en redes para la propagación de virus o ideas

Maximización de la influencia

Caso de estudio 2: identificación de nuevos genes que causan autismo

Modelos gráficos
Modelos gráficos no dirigidos

Modelos de Ising y Gaussianos

Aprendizaje de modelos gráficos a partir de datos

Modelos gráficos dirigidos

Estructuras en V, "explicaciones" y aprendizaje de modelos gráficos dirigidos

Inferencia en modelos gráficos: marginales y paso de mensajes

Modelo oculto de Márkov (HMM)

Filtro Kalman

11
SEMANA 12

Análisis predictivo
Modelado predictivo para datos temporales
Ingeniería de predicción

Caso de estudio 1: taxi de la ciudad de Nueva York

Ingeniería de funciones
Introducción
Tipos de funciones
Síntesis profunda de funciones: primitivas y algoritmos
Síntesis profunda de funciones: apilamiento

Caso de estudio 2: conjunto de datos minoristas del Reino Unido

Evaluación: estudio de caso calificado - viajes en taxi en la ciudad de Nueva York

MÓDULOS A TU PROPIO RITMO CON MASTERCLASS OPCIONAL


Desmitificando ChatGPT y sus aplicaciones

Descripción general de ChatGPT y OpenAI


Implicaciones para el trabajo, los negocios y la educación
Ingeniería inmediata para el ajuste de las salidas

ChatGPT: Stack de desarrollo

Fundamentos matemáticos para la IA generativa


Modelos transformadores: IA generativa para el lenguaje natural
Creación práctica de prototipos de ChatGPT

12
PROFESORES

Devavrat Shah
Profesor, EECS e IDSS, MIT

Felipe Rigollet
Profesor, matemáticas e IDSS, MIT

Carolina Uhler
Profesora asociada de Henry L. y Grace Doherty,
EECS e IDSS, MIT

Victor Chernozhukov
Profesor, economía e IDSS, MIT

Stefanie Jegelka
Profesora asociada de desarrollo profesional de X- Consortium,
EECS e IDSS, MIT

13
Ankur Moitra
Profesor asociado de desarrollo profesional de Rockwell International,
matemáticas e IDSS, MIT

Tamara Broderick
Profesora Asociada, EECS e IDSS, MIT

David D. Gamarnik
Profesor de operaciones de la Universidad Tecnológica de Nanyang
investigación, Sloan School of Management e IDSS, MIT

Jonathan Kelner
Profesor, matemáticas, MIT

Kalyan Veeramachaneni
Científico investigador principal en el Laboratorio de Información
y Sistemas de Decisión, MIT

Guy Bresler
Profesor asociado, EECS e IDSS, MIT

14
MENTORES DE

PROGRAMA
El programa te capacita para trabajar en proyectos relevantes para la industria por parte de expertos en ciencia

de datos y aprendizaje automático a través de sesiones de aprendizaje guiado en vivo para brindarte una comprensión

práctica de los conceptos básicos. Algunos de los expertos de la industria que colaboran como mentores son:

Jabes Rivera Luis Castro


Ingeniero Sénior de Científico de Datos
Aprendizaje Automático
Intuit Mailchimp (Canadá)
Clivi Health (México)

Juan Pablo Castillo Luciano Tozato


Ingeniero Sénior de Arquitecto de Datos,
Aprendizaje Automático Servicios financieros
Andium (EE. UU.) Google (EE. UU.)

Juan Carlos Medina


Científico de Datos Sénior
Nubank (México)

COORDINADOR DE PROGRAMA:

TU GUÍA PERSONAL
DE GREAT LEARNING
Tu coordinador de programa, parte del equipo de
Great Learning, será tu único punto de contacto para todas
las consultas académicas y no académicas del programa.
Tu coordinador realizara un seguimiento de tu aprendizaje, te
brindara apoyo personalizado, así como ánimos para
garantizar tu éxito en el programa.
15
CERTIFICADO

La imagen es solo para fines ilustrativos. El certificado real puede estar sujeto a cambios a discreci6n de la universidad.

PROCESO DE SOLICITUD
Paso 1 Paso 2 Paso 3
Formulario de solicitud Evaluación de la solicitud. Tu Únete el programa. Si
Regístrate completando el solicitud será revisada para eres seleccionado, recibirás
formulario de solicitud en línea. determinar si éste es el una oferta de admisión.
programa indicado para ti. Asegura tu lugar en el grupo
pagando la cuota de admisión.

DETALLES DE SOLICITUD Y CUOTAS


Duraci6n del programa: 12 semanas

Cuota: Consulta con tu Asesor de Programa sobre las cuotas y facilidades de pago

16
El programa de aprendizaje automático y ciencia de datos del MIT IDSS, con un plan de
estudios desarrollado e impartido por profesores del MIT, se imparte en colaboración con:

Great Learning es una plataforma de tecnología educativa con la misión de hacer que los
profesionales sean competentes y se mantengan preparados para el futuro. Sus programas se
enfocan en la próxima frontera de crecimiento en la industria y actualmente abarcan análisis,
ciencia de datos, big data, aprendizaje automático, inteligencia artificial, aprendizaje profundo,
computación en la nube y más. Great Learning utiliza tecnología, contenido de alta calidad y
colaboraciones con expertos de la industria para brindar una experiencia de aprendizaje integral
que ayuda a los candidatos a aprender, aplicar y demostrar sus competencias. Todos los
programas se ofrecen en colaboración con universidades líderes a nivel mundial y los toman miles
de profesionales cada año de más de 170 países.

17
COMIENZA AHORA A
TOMAR DECISIONES
BASADAS EN DATOS

APLICA YA

HABLA CON UN ASESOR DEL PROGRAMA

+52 800 283 2768

¿TIENES PREGUNTAS SOBRE EL PROGRAMA O


SOBRE CÓMO ENCAJA CON TUS METAS PROFESIONALES?

dsml-es.mit@mygreatlearning.com

VISITA NUESTRO SITIO WEB

https://www.mygreatlearning.com/mit-idss-es-programa-ciencia-de-
datos-aprendizaje-automatico

También podría gustarte