Aaaa

PROGRAMA DE ESPECIALIZACIÓN
en BIG DATA
PREPARADO POR:
ALONSO MELGAREJO
BIGDATA
ACADEMY
ACERCA DEL CURSO
”
Nuestro objetivo es formar profesionales
que deseen aumentar sus oportunidades
laborales y enriquecer su perfil profesional
aprendiendo a dominar tecnologías de BIG
DATA que actualmente tienen una alta
demanda en el mercado peruano y latinoa-
mericano. Contamos con una plana docen-
te profesional y experimentada. Integramos
prácticas en un entorno real de Big Data
sobre nuestro clúster de servidores de 128
Gb de Ram.
BIGDATA
Clases:
• 40 horas académicas:
10 sesiones Mar-Jue de 7:00pm a 10:00pm y los Sáb de
8:00am a 11:00am.
Inicio de Clases:
• Sábado 26 de Setiembre de 2020
Egresados con doble certificación:
• Big Data Engineer Professional
• Big Data Architect Professional
Ingeniero de Sistemas de la UNMSM, con

especialización en Business Intelligence y Big
Data Analytics en ESAN. Con más de 8 años de
experiencia nacional e internacional como líder
de proyectos, arquitecto de sistemas y big data
aplicado a sectores de la banca, Telcos y
Gobierno. Conferencista recurrente en
ponencias de Big Data. Desempeño como
docente universitario de algorítmica y análisis
de sistemas en la UNMSM.
Alonso Melgarejo
Big Data Architect Senior
Actualmente es responsable de dirigir la
Chief Big Data Architec | Ing. De Sistemas - UNMSM estrategia tecnológica de los proyectos de Big
Data y Analytics en Everis con el rol de Big Data
Architect. Interesado en impulsar la formación
alonsoraulmgs@gmail.com profesional en temas que marquen la
alonsoraulmgs
tendencia tecnológica como el Big data,
Blockchain, IoT, IA y Analítica avanzada.
PROGRAMA AWS BIG DATA ANALYTICS ESPECIALIST 02

CURRÍCULA DEL PROGRAMA
MÓDULO 1 MÓDULO 2
BIG DATA, FUNDAMENTOS PROCESAMIENTO DISTRIBUIDO
Y TÓPICOS AVANZADOS PARALELIZADO
• Conceptos de Big Data. • Tecnologías batch sobre Big Data

• Objetivo fundamental • Hadoop como ecosistema de almacenamiento
• La filosofia de Big Data: Las 5V • Trabajando de manera distribuida sobre un
• Big Data como marco de trabajo clúster
• Clúster computacional • Hadoop
• Alta paralelización • HDFS como motor de almacenamiento
• Distribución de carga de trabajo • YARN como gestor de recursos
• Escalabilidad • MapReduce como motor de procesamiento
• Alta disponibilidad • Replicación controlada de datos
• Seguridad • Asegurando el tamaño de bloque
• Gobierno • Capacidad física de un clúster
• Patrones de diseño •Administración de archivos y recursos sobre
• Capas conceptuales Hadoop
• Arquitectura conceptual • Hive como infraestructura de almacenamiento
• Componentes tecnológicos disponibles • SQL sobre MapReduce
• Arquitectura tecnológica • Archivos de HDFS como tablas Hive
• Arquetipo de una arquitectura Big Data genérica • Particionamiento estático y dinámico
• Definición de un Datalake Productivo • Formatos binarios de archivos: Parquet, ORC y
Avro
• Compresión optimizada de datos
• Configuración y tuneo de procesos en Hive
• Sqoop como motor de ingesta de datos
• Importando datos a Hadoop a bases de datos
relacionables
• Arquetipo de ingesta de datos batch
• Arquetipo de modelamiento de datos
• Arquetipo de procesamiento de datos
• Hue como interfaz gráfica para los procesos

MÓDULO 3 MÓDULO 4
BIG DATA, FUNDAMENTOS PROCESAMIENTO DISTRIBUIDO
Y TÓPICOS AVANZADOS PARALELIZADO
• Tecnologías in-memory sobre Big Data • Procesamiento de datos real time

• Conociendo Spark • ¿Streaming, real time, near real time o micro
• Spark vs Hadoop batch?
• Hive on Spark • Arquitectura general para proyectos real time
• Uso intensivo de memoria con Spark • Captura de datos desde fuentes real time: torenta
• Módulos de Spark de datos
• Spark Core • La importancia de los microservicios
• Trabajando con Resilient Distributed Dataset (RDD) • Kafka como repositorio temporal de baja latencia
• Lectura de datos no estructurados • Tópico, producers y consumers
• Formateo de datos sobre RDDs • Almacenamiento de baja latencia: HBase
• Procesamiento de RDDs • Region Servers y metadata
• Implementación de un proceso MapReduce con • NoSQL: Familias de columnas
Spark • Modelamiento de baja latencia basado en keys
• Trabajando con Dataframes • Integrando HBase y Hive
• Transformations y actions sobre Dataframes • SQL sobre HBase: Phoenix
• Escritura a disco duro de datos in-memory • Procesamiento real time con Spark Streaming
• Spark SQL • Arquetipo de procesamiento real time
• Tuning sobre executors • Arquetipo enriquecimiento real time
• Limitaciones y cómo superarlas
MÓDULO 5
ANALÍTICA EXPLORATORIA, DESCRIPTIVA, PREDICTIVA,
TECNOLOGÍAS DE ANALÍTICA SOBRE BIG DATA Y PATROMES AVANZADOS
• Analítica en el mundo empresarial • Algoritmos predictivos disponibles sobre Spark MLlib

• Analítica exploratoria • Extendiento los recursos computacionales del clúster:
• creando consultas ad_hoc con impala La GPU
• Compartiendo la metadata del clúster entre herramientas • Estrategia de instalación de un clúster de Big Data
• Métodos descriptivos sobre Big data • Instalación de un clúster de Big Data
• Algoritmos descriptivos disponibles sobre Spark MLlib • Virtualización de datos en un Datalake
• Implementación de KMeans con Spark • IoT aplicado sobre Big Data
• Métodos predictivos sobre Big Data • Integrando el Blockchain con el Big Data
• Implementación de un modelo predictivo

METODOLOGÍA MATRÍCULA
DEL CURSO Y PROCESOS DE PAGO
• Los temas serán explicados desde un nivel
básico para entender los conceptos yarqui-
tecturas hasta llegar a programar una
1
solución avanzada. Matrícula automática por la Web
• Todas las prácticas se realizan sobre un Ingresa a www.bigdataacademy.org y haz clic en la
Clúster real de Big Data de 128 GB de Ram página de “cursos”. Selecciona el Programa de
especialización de preferencia e inglresa tus datos.
• Material y códigos del curso del curso Realiza el pago con cualquier tarjeta de crédito/ débito.
disponible en la nube.
• Profesores dedicados a trabajar al 100%

con tecnologías de Big Data (Cloudera, Al finalizar recibirás un correo de confirmación.
Azure).
• Asesoría permanente con el staff de profe-

sores. 2
Depósito / Transferencia a BCP
BIG DATA ACADEMY PERU SAC

Ruc: 20603117655
Cta Ahorros BCP Soles: Nº 193-2514329-0-61
Cta Interbancaria BCP Soles: Nº 002219300251432906114
REQUISITOS Enviar comprobante de pago a

info@bigdataacademy.org indicando
• Conocimientos básicos en SQL. datos del alumno.
• Portar una laptop personal para las clases
Asunto: “Matrícula Big Data”.
de mínimo 1 GB de RAM para el uso de un
Nombres y Apellidos: ..............................................................
clúster de 128 GB en la nube.
DNI: ..................................................................................................
Celular: ............................................................................................
Correo Electrónico: ...................................................................
Puesto y lugar de trabajo: .....................................................
Confirmaremos su inscripción a la
brevedad por el mismo medio o vía
telefónica.
Contacto
info@bigdataacademy.org
Cel:943516891
f/bigdataacademyperu/
http://bigdataacademy.org
05

Aaaa

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Aaaa

Cargado por

Copyright:

Formatos disponibles

PROGRAMA DE ESPECIALIZACIÓN

Ingeniero de Sistemas de la UNMSM, con

PROGRAMA AWS BIG DATA ANALYTICS ESPECIALIST 02

• Conceptos de Big Data. • Tecnologías batch sobre Big Data

PROGRAMA AWS BIG DATA ANALYTICS ESPECIALIST 03

• Tecnologías in-memory sobre Big Data • Procesamiento de datos real time

• Analítica en el mundo empresarial • Algoritmos predictivos disponibles sobre Spark MLlib

PROGRAMA AWS BIG DATA ANALYTICS ESPECIALIST 04

• Profesores dedicados a trabajar al 100%

• Asesoría permanente con el staff de profe-

BIG DATA ACADEMY PERU SAC

REQUISITOS Enviar comprobante de pago a

También podría gustarte