Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FOUNDATIONSPROFESIONAL
OF CYBERSECURITY
AND
EN RISK MANAGEMENT
INGENIERÍA DE DATOS
Conocimientos de vanguardia para avanzar en tu carrera de ingeniería de datos.
Realizado
Delivereden
in colaboración con
collaboration with
Panorama general
A medida que el uso de la tecnología se expande, la ingeniería de datos se vuelve cada vez más vital, presionando al alza
la demanda de ingenieros especializados. De hecho, según el informe Dice Tech Job Report, la ingeniería de datos fue la
ocupación tecnológica de más rápido crecimiento en 2020. ¿Por qué? Porque antes de que los científicos de datos puedan
obtener información útil de las montañas de datos que poseen las organizaciones, esos datos deben configurarse,
almacenarse y hacerse accesibles. Y son precisamente los ingenieros de datos los responsables de construir esa
infraestructura.
El Certificado Profesional en Ingeniería de Datos del MIT xPRO es un programa de inmersión, de seis meses, diseñado para
proporcionarte conocimientos de ingeniería de datos listos para aplicarlos en tu trabajo y, así, sumar una ventaja
competitiva a tu currículum y a tu organización. A través de la exploración de conceptos básicos, herramientas, técnicas
y mejores prácticas, los participantes aprenderán lo esencial de la ingeniería de datos, desde la creación de arquitecturas
de datos y almacenes de datos eficaces hasta el diseño de modelos de datos, la racionalización del procesamiento de
datos, la automatización de canalizaciones de datos, la gestión de datos y la ingeniería de big data. Los participantes
también reciben retroalimentación personalizada y tienen consultas semanales en directo con los facilitadores del
aprendizaje, así como la oportunidad de desarrollar una cartera de GitHub para posibles empleadores.
Los programas de aprendizaje en línea de MIT xPRO ofrecen contenidos alineados con la industria y con expertos de
renombre mundial; son accesibles en cualquier momento y lugar, y apoyan a los técnicos en desarrollo a enfrentar los
retos de su entorno profesional.
"Los ingenieros de datos construyen el 'sistema nervioso' de la empresa. Sin él, la organización no
puede reaccionar a los cambios que se presentan en su interior o en el entorno empresarial. También
construyen los sistemas de software y hardware que impulsan la visión de la empresa y dominan no
sólo el software, sino también el hardware, las redes y las aplicaciones analíticas que modifican los
datos cotidianos."
– John R. Williams, Profesor de Ingeniería de la Información, MIT
01
Lo más destacado del programa
02
Experiencia del programa
2 horas de autoestudio y
ejercicios prácticos
04
Herramientas y recursos del programa
El Certificado Profesional en Ingeniería de Datos emplea las últimas herramientas y recursos de la industria, incluyendo:
"La ingeniería de datos es realmente un componente básico de la infraestructura de datos actual. Como
las organizaciones no pueden funcionar sin datos, también es una carrera con muchas oportunidades y
un trabajo increíblemente interesante".
– Abel Sánchez, Investigador Científico y Director Ejecutivo
del Centro de Datos Geoespaciales del MIT
05
¿Para quién es este programa?
Los que deseen impulsar su carrera: Recién licenciados, posgraduados o becarios STEM
que quieran iniciar una carrera en un campo de gran crecimiento, mediante la
exposición a la ingeniería de datos.
Los que deseen cambiar de giro: Profesionales a mitad de carrera que desean redirigir su
desarrollo hacia la ingeniería de datos, desde la tecnología de la información, el análisis, las
finanzas, la gestión de proyectos, la cadena de suministro u otros campos técnicos.
*Los participantes deben tener 18 años o más para solicitar este programa.
06
Aprendizajes clave
Este programa está diseñado para proporcionarte las habilidades que necesitas para iniciar o
continuar tu carrera en ingeniería de datos. Los resultados de aprendizaje de alto nivel para
este programa incluyen:
Desarrollar y analizar bases de datos utilizando la ciencia de datos, herramientas y habilidades de
ingeniería de datos, incluyendo SQL y Python.
• Utilizar múltiples bibliotecas de Python, como NumPy, Pandas, DASK, SciPy, TensorFlow, Matplotlib,
Seaborn, Scikit-learn, OpenSSL, Gym, Arrow, Feather, Lorem, Node-rdkafka, Graphviz, Data-Driven
Documents (D3), NotebookJS, NLTK, Paho, Express y Kafka-Python.
• Diseñar bases de datos conceptual y formalmente.
• Realizar la extracción, transformación y carga (ETL) de un conjunto de datos.
• Realizar la captura de datos de cambio (CDC).
• Desarrollar una aplicación web en Java.
• Conectar una base de datos a Debezium.
• Crear una aplicación utilizando tokens web.
• Crear una aplicación de datos de tránsito utilizando Mapbox y Maven.
• Utilizar NiFi para crear una canalización ETL.
• Utilizar Hadoop para manejar big data.
• Utilizar Docker para crear y manipular imágenes y contenedores Spark.
• Utilizar PySpark para consultar datos.
• Crear un flujo de trabajo en Airflow.
• Aprender la contenedorización de bases de datos, cómo utilizar contenedores cuando se trabaja con
bases de datos, y cómo ejecutar consultas para interactuar con un contenedor de base de datos.
• Aprender visualización de datos.
Gestionar big data utilizando plataformas de almacenamiento de datos y gestión de flujos de trabajo.
• Ejecutar operaciones paralelas en DASK.
• Transmitir datos a través de web sockets.
• Identificar los conceptos clave relacionados con la visualización, los datos no estructurados y
JavaScript.
• Crear una canalización de datos sensemaking.
Construir una interfaz de usuario para visualizar e interactuar con grandes cantidades de datos de
streaming en directo.
• Analizar los casos de uso de Mosquitto.
• Transmitir datos en directo a ThingsBoard.
• Analizar los datos transmitidos en directo utilizando ThingsBoard.
• Construir un servidor web utilizando Kafka.
Crear un portafolio de GitHub para presentar los proyectos que crees a posibles empleadores. 07
Objetivos de aprendizaje del programa
• Explicar los conceptos clave de la ciencia de datos y la ingeniería de datos.
• Desarrollar y analizar bases de datos utilizando la ciencia de datos, herramientas y habilidades de ingeniería de
datos, incluyendo SQL y Python.
• Gestionar big data utilizando plataformas de almacenamiento de datos y gestión de flujos de trabajo.
• Implementar algoritmos de IA y aprendizaje automático, incluidos los de aprendizaje por refuerzo y redes neuronales
profundas.
• Construir una interfaz de usuario para visualizar e interactuar con grandes cantidades de datos de streaming en
directo.
08
Programa
Este programa está organizado en tres secciones:
Sección 1
En la primera sección del programa aprenderás los fundamentos del lenguaje de programación Python, cómo
trabajar con bases de datos relacionales utilizando SQL y cómo trabajar con Python para crear bases de
datos y canalizaciones de servidor.
Módulo 1–3: Python, NumPy, Matplotlib y pandas
• Trabajarás con múltiples librerías punteras de Python, como NumPy, Matplotlib y pandas. Utilizarás
tipos de datos básicos y estructuras avanzadas en Python, como listas, tuplas, conjuntos y
diccionarios.
Módulo 4–6: Bases de datos relacionales y SQL
• Escribirás consultas complejas a bases de datos, utilizarás expresiones regulares, limpiarás una base
de datos, definirás controladores para leer una tabla, escribirás archivos en tu base de datos y
escribirás archivos YAML.
Módulos 7 y 8: Proyectos de cartera
• Construirás un modelo de predicción utilizando la regresión lineal.
• Utilizarás ETL para analizar un conjunto de datos y luego visualizarás los resultados utilizando
Matplotlib.
Sección 2
En la segunda sección del programa aprenderás funciones más avanzadas de Python y crearás una cartera de
GitHub para presentar tus proyectos a posibles empleadores. Después, profundizarás en diversas
herramientas de línea de comandos y seguridad de datos. Trabajarás en tareas como la contenedorización de
bases de datos, CDC y el manejo de datos.
Módulo 9–11: GitHub, Docker, Visual Studio Code y Flask
Aprenderás construcciones más avanzadas de Python, como clases, envoltorios y decoradores.
Trabajarás con varias herramientas de ingeniería de software, como Postman, Docker, Flask,
Bootstrap, cookies y herramientas de seguridad.
Practicarás el uso de comandos de línea de comandos, la programación asíncrona basada en eventos,
la estructura HTTP y la creación de API.
Módulo 12–14: Contenedores de bases de datos, CDC, Java y Debezium
• Aprenderás a utilizar contenedores cuando trabajes con bases de datos y a ejecutar consultas para
interactuar con un contenedor de base de datos. Manipularás datos y realizarás CDC en distintos
tipos de bases de datos, como MongoDB, Cassandra, Redis y Firebase. Practicarás los fundamentos
del lenguaje de programación Java y utilizarás Debezium para realizar CDC en contenedores.
Módulos 15 y 16: Proyectos de cartera
• Crearás una aplicación web y utilizarás tokens web, autenticación y autorización JavaScript Open
Notation (JSON) para crear funciones de seguridad. También manipularás una base de datos
utilizando diccionarios redundantes de Python.
Utilizarás Mapbox y Maven para crear una aplicación de datos de tránsito.
09
Sección 3
En la tercera sección del programa explorarás las herramientas que se utilizan para gestionar big data y el
almacenamiento de datos. Aprenderás cómo se integran el aprendizaje automático, el aprendizaje por
refuerzo, la probabilidad avanzada y las redes neuronales profundas en la ingeniería de datos.
Módulos 17–19
• Utilizarás NiFi para construir una canalización ETL y trabajarás con Hadoop, Spark y Airflow para crear
canalizaciones de datos para el procesamiento de big data. Utilizarás PySpark para consultar big data.
Módulos 20–22
• Practicarás algoritmos matemáticos fundamentales de aprendizaje automático e implementarás la
biblioteca Python Scikit-learn. Transmitirás big data utilizando las bibliotecas pandas, Parquet y
Feather. Utilizarás la biblioteca DASK para crear, leer, escribir y analizar múltiples archivos en paralelo y
simular el procesamiento paralelo en máquinas distribuidas.
Módulos 23 y 24: Proyectos de cartera
• Limpiarás datos de páginas web y utilizarás JavaScript, el Modelo de Objetos de Documento y el
lenguaje de marcas de hipertexto para crear una canalización de datos sensemaking. Visualizarás tus
datos con la biblioteca D3 de JavaScript.
• Utilizarás un protocolo MQTT para producir datos de temperatura y humedad y publicarlos en
ThingsBoard. Utilizarás Kafka para crear una aplicación Python que publique los datos de localización de
los vehículos en un tema Kafka. Por último, utilizarás Node.js para construir un servidor web que actúe
como consumidor de los mensajes recibidos del broker Kafka.
Nota: Se incluyen semanas de descanso para cubrir trabajo para el proyecto y preparar el módulo siguiente. 10
Tareas y proyectos para tu portafolio
Cada módulo incluye tareas atractivas y culmina con al menos un proyecto para tu portafolio de GitHub, que
completarás basándote en lo aprendido en esa parte del programa.
Tareas
Ejercicios de codificación
Los ejercicios de codificación se integran en varios módulos mediante actividades sencillas, utilizando Jupyter
Notebook. Te permiten practicar la construcción de habilidades de composición para prepararte para las tareas
y los proyectos de cartera.
Construye un modelo de aprendizaje por refuerzo para la navegación de robots (desde cero en Python),
ejecuta TensorFlow para un modelo de red neuronal profunda (Deep Dream en Colab).
Carga en streaming 100 millones de líneas de datos, crea y escribe 20 archivos en paralelo utilizando
DASK.
Recibirás comentarios personalizados de los líderes de tu programa sobre tus repositorios de GitHub, asegurándote
una cartera lista para el mercado y para compartir con posibles empleadores.
11
Profesorado
12
Profesorado
Abel Sánchez
agencia Intelligence Advanced Research Projects Activity. En
aprendizaje automático, abordando la detección del fraude, el
Dr. Sánchez diseñó un marco de conocimiento de la situación
Investigador Científico y Director Ejecutivo, que explota diferentes perspectivas de los mismos datos y
Centro de Datos Geoespaciales el MIT
asigna puntuaciones de riesgo a las entidades para Accenture.
13
Preparación y orientación profesional
Este programa ofrece una amplia gama de apoyo y orientación profesional para ayudarte a desarrollar tu trayectoria
profesional. El objetivo principal es ayudarte para que desarrolles las habilidades necesarias para impulsar tu carrera
profesional, pero no garantizamos la colocación laboral. Obtén más información sobre todos los servicios y el apoyo que
tienes a tu disposición, entre ellos:
14
Opciones de financiamiento
Queremos asegurar que el Certificado Profesional en Ingeniería de Datos sea una opción asequible para todos. Por eso,
te ofrecemos formas diferentes de pagar el programa.
Elige hacer tu pago en una, dos, tres o seis exhibiciones para mayor flexibilidad. Los pagos mensuales empiezan
a partir de $1,087 USD.
Puedes optar por cualquiera de las opciones de financiamiento para cubrir el costo total de la matrícula del
programa.
*Debido al tiempo de tramitación, la solicitud de préstamo debe presentarse a más tardar cuatro días laborables antes de la fecha límite
de inscripción.
15
Certificado
¡Obtén un reconocimiento! Al completar con éxito este
programa, MIT xPRO otorga un certificado de
finalización a los participantes. Este programa se
califica como aprobado o no aprobado; los
participantes deben obtener una puntuación de 75%
para aprobar y recibir el certificado de finalización.
P L O
M
This is to certify that
Your Name
Una vez completado con éxito el programa, se te
enviará por correo electrónico tu certificado digital
verificado con el nombre que utilizaste al inscribirte. EJ E has successfully completed
Date
Sobre Emeritus
MIT xPRO colabora con el proveedor de educación en línea Emeritus para impartir sus programas ejecutivos a
través de una plataforma de aprendizaje digital, dinámica e interactiva. Estos programas ayudan a MIT xPRO a
posicionarse como uno de los líderes en ingeniería y gestión de proyectos, liderazgo obtenido después de años de
investigación, enseñanza y práctica.
Programa fácilmente una llamada con un asesor PONTE EN CONTACTO CON
del programa de Emeritus para saber más sobre
este curso xPRO del MIT. UN ASESOR DEL PROGRAMA
APLICA