Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Brochure - Introducción A Big Data Usando Spark
Brochure - Introducción A Big Data Usando Spark
A B I G DATA U T I L I Z A N D O
SPARK
I. INFORMACIÓN GENERAL
II. SUMILLA
El curso es de carácter teórico práctico e inicia con una introducción a los términos y
conceptos de Cloud Computing y Big Data, posteriormente se brindará conceptos
sobre Apache Spark. Esta herramienta goza de gran popularidad entre los científicos,
analistas e ingenieros de datos, también ofrece una prolífica carrera en sí. Spark
puede gestionar una enorme cantidad de datos y la demanda de desarrolladores de
Spark por parte de las grandes empresas está en aumento. Independientemente del
nivel de Apache Spark al que desees acceder, este curso te ayudará a aprender esta
aplicación y entender el ecosistema Big Data.
III. OBJETIVOS
General:
• El objetivo principal del curso es proporcionar los elementos necesarios para
empezar a trabajar con Apache Spark en el procesamiento de datos en entornos
de Big Data.
Específico:
• Conocer los principales conceptos relacionados a Cloud Computing.
• Conocer los principales conceptos de Big Data.
• Conocer los conceptos y terminologías de Apache Spark.
• Procesar volúmenes de datos con Apache Spark en un ecosistema Big Data.
SPARK
V. PROGRAMA
Estrategia Duración
Bloque Contenidos
Metodológica horas
Cloud Computing
• Conceptos de Cloud Computing
• Plataformas On-Premise vs. Cloud
• Regiones y Zonas de disponibilidad
Big Data
• Evolución de los datos
Sesiones
• Conceptos de Big data Teóric
1 Virtuales y 3
• Las V del Big data
casos prácticos
• Tecnologías Big
• Nuevos Roles
• Principales Certificaciones
Laboratorio: Laboratorio: Creación de un
clúster con tecnologías Big Data en Google
Cloud Platform - GCP.
Apache Spark
• Conceptos de Apache Spark
• Lenguajes de programación para Big Data Sesiones
2 • Principales entornos de desarrollo. Virtuales y 3
Laboratorio: Procesamiento de datos en casos prácticos
notebook Jupyter con el servicio EMR de
Google Cloud Platform.
Apache Spark II
• Conceptos de Datalake
• Capas del Datalake Sesiones
3 Laboratorio: Ingesta de datos en las Virtuales y 3
distintas capas del Datalake utilizando casos prácticos
notebook Jupyter en Google Cloud
Platform.
INTRODUCCIÓN
A B I G DATA U T I L I Z A N D O
SPARK
VI. EVALUACIÓN
VII. CERTIFICACIÓN
VIII. DOCENTE
Juan Salinas
Cargo Actual:
Senior Data Engineer en Belcorp
Experiencia:
Profesional de Ingeniería de Sistemas, con más de 6 años de experiencia en áreas de Big
Data, BI, Analytics, Gestión de Proyectos, Seguridad de la Información, Base de Datos.
Actualmente se desempeña como Senior Data Engineer en Inetum Perú – Belcorp y
consultor de TI en distintas empresas a nivel nacional. Su experiencia profesional le ha
permitido trabajar en empresas importantes en el país como el Grupo el Comercio,
Derco Perú entre otras.
htps:/ai.w comend?ph=519802&texHola,%0ds2mC3A1%0inforacC3B%20delcursogati%20InrducC3B%20aigDtulzando%20Sprk. w .facebok.com/datmin g.pe/ w w.instagram.com/dmc_peru ht ps:/ dmc.pe/ htps:/w .linked.com/ pany/dta-ming-consultig-sac/