Está en la página 1de 3

INTRODUCCIÓN

A B I G DATA U T I L I Z A N D O

SPARK
I. INFORMACIÓN GENERAL

Modalidad : Clases online, sesiones en vivo


Duración : 09 horas cronológicas / 12 horas académicas
Promoción : 0 soles (curso gratuito)
Horario : Viernes de 7:00pm - 10:00pm.
Sesiones : 20 de agosto, 27 de agosto y 03 de setiembre.

II. SUMILLA

El curso es de carácter teórico práctico e inicia con una introducción a los términos y
conceptos de Cloud Computing y Big Data, posteriormente se brindará conceptos
sobre Apache Spark. Esta herramienta goza de gran popularidad entre los científicos,
analistas e ingenieros de datos, también ofrece una prolífica carrera en sí. Spark
puede gestionar una enorme cantidad de datos y la demanda de desarrolladores de
Spark por parte de las grandes empresas está en aumento. Independientemente del
nivel de Apache Spark al que desees acceder, este curso te ayudará a aprender esta
aplicación y entender el ecosistema Big Data.

III. OBJETIVOS

General:
• El objetivo principal del curso es proporcionar los elementos necesarios para
empezar a trabajar con Apache Spark en el procesamiento de datos en entornos
de Big Data.

Específico:
• Conocer los principales conceptos relacionados a Cloud Computing.
• Conocer los principales conceptos de Big Data.
• Conocer los conceptos y terminologías de Apache Spark.
• Procesar volúmenes de datos con Apache Spark en un ecosistema Big Data.

IV. PRE REQUISITOS

Este curso requiere:


• Conocimientos básicos de programación
• Conocimientos básicos de SQL
INTRODUCCIÓN
A B I G DATA U T I L I Z A N D O

SPARK
V. PROGRAMA

Estrategia Duración
Bloque Contenidos
Metodológica horas

Cloud Computing
• Conceptos de Cloud Computing
• Plataformas On-Premise vs. Cloud
• Regiones y Zonas de disponibilidad
Big Data
• Evolución de los datos
Sesiones
• Conceptos de Big data Teóric
1 Virtuales y 3
• Las V del Big data
casos prácticos
• Tecnologías Big
• Nuevos Roles
• Principales Certificaciones
Laboratorio: Laboratorio: Creación de un
clúster con tecnologías Big Data en Google
Cloud Platform - GCP.

Apache Spark
• Conceptos de Apache Spark
• Lenguajes de programación para Big Data Sesiones
2 • Principales entornos de desarrollo. Virtuales y 3
Laboratorio: Procesamiento de datos en casos prácticos
notebook Jupyter con el servicio EMR de
Google Cloud Platform.

Apache Spark II
• Conceptos de Datalake
• Capas del Datalake Sesiones
3 Laboratorio: Ingesta de datos en las Virtuales y 3
distintas capas del Datalake utilizando casos prácticos
notebook Jupyter en Google Cloud
Platform.
INTRODUCCIÓN
A B I G DATA U T I L I Z A N D O

SPARK
VI. EVALUACIÓN

La composición de la evaluación para obtener el promedio final es:

Criterios de evaluación Ponderación Descripción

Evaluación Final 100% Evaluación al final del curso

VII. CERTIFICACIÓN

El curso es gratuito y todos alumnos participarán de la evaluación final. En el caso que


un alumno requiera que se emita un certificado de aprobación digital, deberá cumplir
con tener una nota mínima de 14 en su evaluación y realizar un pago de 49 soles.

VIII. DOCENTE

Juan Salinas

Cargo Actual:
Senior Data Engineer en Belcorp

Experiencia:
Profesional de Ingeniería de Sistemas, con más de 6 años de experiencia en áreas de Big
Data, BI, Analytics, Gestión de Proyectos, Seguridad de la Información, Base de Datos.
Actualmente se desempeña como Senior Data Engineer en Inetum Perú – Belcorp y
consultor de TI en distintas empresas a nivel nacional. Su experiencia profesional le ha
permitido trabajar en empresas importantes en el país como el Grupo el Comercio,
Derco Perú entre otras.

htps:/ai.w comend?ph=519802&texHola,%0ds2mC3A1%0inforacC3B%20delcursogati%20InrducC3B%20aigDtulzando%20Sprk. w .facebok.com/datmin g.pe/ w w.instagram.com/dmc_peru ht ps:/ dmc.pe/ htps:/w .linked.com/ pany/dta-ming-consultig-sac/

También podría gustarte