Está en la página 1de 7

SILABO

I. INFORMACIÓN GENERAL

Código : PIN-1804
Pilar : Inteligencia de negocios
Programa : Big Data
Curso : Big Data
Créditos : 3
Duración : 48 horas

II. DESCRIPCIÓN DEL CURSO

En este curso, el participante obtendrá los conocimientos y habilidades necesarias para el


reconocimiento de las principales funcionalidades del Big Data, una herramienta diseñada
para gestionar y analizar grandes volúmenes y tipos de datos que no pueden procesarse
mediante el uso de herramientas convencionales del mercado, que se han visto superados
en sus capacidades y límites técnicos.

III. PRE REQUISITOS

 Conocimiento de bases de datos relacionales (nivel básico).


 Conocimiento de expresiones de análisis de datos (nivel básico).
 Conocimiento de tablas dinámicas en Excel (nivel intermedio).

CAPACITACIÓN RECOMENDADA

 Business Intelligence - SQL Server 2016.


 Análisis de información del negocio con Power BI para Excel.

IV. LOGRO DEL CURSO

Al finalizar el curso, el alumno será capaz de usar herramientas Big Data. Adicionalmente,
estará preparado para:

 Diseñar una solución de inteligencia de Big Data para consumirse por herramientas
de reportes especializado

V. LÍNEA DE ESPECIALIZACIÓN

Análisis de Análisis
Business
información interactivo de
Intelligence -
del negocio la información Big Data
SQL Server
con Power BI del negocio
2016
para Excel con Power BI

Cibertec Perú S.A.C – Big Data (PIN-1804) 1


VI. CERTIFICACIONES

 Al término de la capacitación, el alumno obtendrá un certificado de Big Data por


aprobar el programa.
 Al completar satisfactoriamente 3 cursos de la línea de especialización, (ver punto V),
se le acreditará un Diplomado en Inteligencia de Negocios.

VII. METODOLOGÍA

El enfoque práctico-reflexivo de cada una de las sesiones y la participación activa a lo


largo de estas favorecerá no solo el aprendizaje de contenidos, sino también, su aplicación
en la resolución de situaciones reales en diferentes contextos que se planteen. Por ello, el
curso considera el desarrollo de laboratorios guiados e individuales, permitiendo la
consolidación del aprendizaje del tema.

RECURSOS DE APRENDIZAJE

El recurso para el aprendizaje está compuesto por:

 Desktop/Laptop
 Silabo
 Marco teórico
 Diapositivas
 Laboratorios
 Lecturas
 Videos
 Tareas

VIII. EVALUACIÓN DEL CURSO

La calificación es vigesimal (0 a 20), siendo la nota mínima aprobatoria de trece (13.00). El


promedio final del curso será el resultado de la siguiente formula:

PF = EP*0.30 + PP*0.30 + EF*0.40

LEYENDA

 PF: promedio final


 EP: evaluación parcial (30% de la nota final)
 PP: práctica calificadas (30% de la nota final)
 EF: evaluación final (40% de la nota final)

Cibertec Perú S.A.C – Big Data (PIN-1804) 2


IX. CONTENIDO ANALÍTICO

Duración
CAPÍTULO Nº 1: Introducción al Big Data
2.0 h
Modo: Sesión presencial (2.0 h)
Temas Habilidades

 Características de Big Data Al finalizar el capítulo, el alumno podrá:


 Las V’s del Big Data
 El impacto del Big Data en los  Identificar el valor agregado del análisis de
negocios datos para las empresas.
 Ejemplos de Big Data  Conocer las tendencias del mercado en
Big Data.

 Laboratorio Nº 1:
 Ejercicio 1.1: Casos sobre Big Data.
Actividades de autoaprendizaje sugeridas
 Lecturas:
 Términos y conceptos de Big Data.
 Caso de éxito de soluciones de Big Data.
 Tecnologías y herramientas para almacenamiento y tratamiento de datos de Big Data.
Actividades de autoaprendizaje obligatorias
 Tarea Nº1:
 Curso Introduction to Data Science.
Modo: Sesión no presencial (0.5 h)
 Autoevaluación N°1:
 Análisis de datos y tendencias de Big Data.

CAPÍTULO Nº 2: El Big Data y la ciencia de datos Duración


5.5 h
Modo: Sesión presencial (5.5 h)
Temas Habilidades

 La plataforma del Big Data Al finalizar el capítulo, el alumno podrá:


 El científico de datos
 El proceso de la ciencia de datos  Comprender el proceso del Big Data y
el rol del científico de datos.

 Laboratorio Nº 2:
 Ejercicio 2.1: Exploración de una solución Big Data.
Actividades de autoaprendizaje sugeridas
 Lecturas:
 Big Data y sus componentes.
 Los skills del científico de datos.
 Importancia de la ciencia de datos.
Actividades de autoaprendizaje obligatorias
 Tarea N°2:
 Curso: Data Science Methodology
Modo: Sesión no presencial (0.5 h)
 Autoevaluación N°2:
 ¿Qué son los Data Lake?

Cibertec Perú S.A.C – Big Data (PIN-1804) 3


Duración
CAPÍTULO Nº 3: Exploración del Big Data
9.0 h
Modo: Sesión presencial (9.0 h)
Temas Habilidades

 La vista 360 del Cliente Al finalizar el capítulo, el alumno podrá:


 Análisis, diseño y operación del Big Data
 Procesamiento del Big Data  Comprender el modelo de vista 360 del
 Seguridad en el Big Data Cliente.
 Comprender el análisis, diseño y
operación de una solución Big Data.

 Laboratorio Nº 3:
 Metodología de proyectos de Big Data.
Actividades de autoaprendizaje sugeridas
 Lecturas:
 Operatividad de una solución de Big Data.
Actividades de autoaprendizaje obligatorias
 Tarea N°3:
 Curso: Big Data 101
Modo: Sesión no presencial (1.5 h)
 Autoevaluación N°3:
 Diseño de una solución Big Data.

Duración
EVALUACIÓN PARCIAL (EP)
1.5 h

Duración
CAPÍTULO Nº 4: Hadoop
8.0 h
Modo: Sesión presencial (8.0 h)
Temas Habilidades

 Introducción al Hadoop Al finalizar el capítulo, el alumno podrá:


 Ecosistema de Hadoop
 Big Data y el Cloud  Diseñar una arquitectura Hadoop.

 Laboratorio Nº 4:
 Ejercicio Nº 4.1: Revisión de una arquitectura Hadoop.
Actividades de autoaprendizaje sugeridas
 Lectura:
- Hadoop en el entorno Big Data.
 Trabajo de investigación
- Investigar otras distribuciones de Hadoop.
Actividades de autoaprendizaje obligatorias
 Tarea N° 4:
- Curso Hadoop 101.
Modo: Sesión no presencial (1.0 h)
 Autoevaluación N°4:
- Bases de datos NoSQL y sus características.

Cibertec Perú S.A.C – Big Data (PIN-1804) 4


Duración
CAPÍTULO Nº 5: Arquitectura de Hadoop
2.0 h
Modo: Sesión presencial (2.0 h)
Temas Habilidades

 Componente de Hadoop Al finalizar el capítulo, el alumno podrá:


 Implementación de un Clúster Hadoop
 HDFS  Desplegar la arquitectura distribuida de
Hadoop.
 Implementar un Clúster Hadoop.
 Manejar el sistema de archivos HDFS.

 Laboratorio Nº 5:
 Ejercicio Nº 5.1: Crear el cluster de Hadoop.
 Ejercicio Nº 5.2: Añadir nodos al cluster de Hadoop.
 Ejercicio Nº 5.3: Manejar HDFS.
Actividades de autoaprendizaje sugeridas
 Lectura:
 Lección 1: Cluster Hadoop.
Actividades de autoaprendizaje obligatorias
 Tarea N°5:
 Curso: MapReduce and YARN.
Modo: Sesión no presencial (0.5 h)
 Autoevaluación N°5:
 Crear un nodo en Hadoop.

Duración
CAPÍTULO Nº 6: Componentes de Hadoop
9.0 h
Modo: Sesión presencial (9.0 h)
Temas Habilidades

 MapReduce Al finalizar el capítulo, el alumno podrá:


 Pig y Hive
 Flume y Sqoop  Crear Jobs MapReduce.
 Oozie  Utilizar Pig.
 Utilizar Hive.
 Utilizar Flume.
 Utilizar Sqoop.
 Utilizar Oozie.

 Laboratorio Nº 6
 Ejercicio Nº 6.1: Crear Jobs Map Reduce.
 Ejercicio Nº 6.2: Crear consultas Pig.
 Ejercicio Nº 6.3: Crear consultas Hive.
 Ejercicio Nº 6.4: Implementar Flume.
 Ejercicio Nº 6.5: Implementar Sqoop
 Ejercicio Nº 6.6: Implementar Oozie
Actividades de autoaprendizaje sugeridas
 Lecturas:
 Lección 1: Procesos Map Reduce.
Actividades de autoaprendizaje obligatorias
 Tarea N°6:
 Curso: Accessing Hadoop Data Using Hive.

Cibertec Perú S.A.C – Big Data (PIN-1804) 5


 Curso: Moving Data into Hadoop
Modo: Sesión no presencial (1.0 h)
 Autoevaluación N°6:
 Crear consultas en Pig y Hive.

Duración
CAPÍTULO Nº 7: Administración de Hadoop
4.0 h
Modo: Sesión presencial (4.0 h)
Temas Habilidades

 Health Check de Hadoop Al finalizar el capítulo, el alumno podrá:


 Configuraciones y parámetros
 Comprender los parámetros de salud de
un cluster Hadoop.
 Implementar las buenas prácticas en la
administración de Hadoop.

 Laboratorio Nº 7:
 Ejercicio Nº 7.1: Health Check en Hadoop.
 Ejercicio Nº 7.2: Configurar parámetros óptimos de Hadoop.
Actividades de autoaprendizaje sugeridas
 Lectura:
 Lección 7: Administrando Hadoop.
Modo: Sesión no presencial (1.0 h)
 Autoevaluación N°7:
 Crear un Health Check Hadoop.

Duración
CAPÍTULO Nº 8: Big Data 2.0 – Spark
5.0 h
Modo: Sesión presencial (5.0 h)
Temas Habilidades

 Introducción a Spark Al finalizar el capítulo, el alumno podrá:


 Propósitos de Spark
 Componentes  Describir la tecnología Spark.
 Instalación y configuración  Implementar un cluster Spark.
 Scala y Python  Conocer el lenguaje Scala y Python para
ciencia de datos.

 Laboratorio Nº 8:
 Ejercicio Nº 8.1: Implementar Spark.
 Ejercicio Nº 8.2: Scala y Python.
Actividades de autoaprendizaje sugeridas
 Lectura:
 Big Data Spark.
Actividades de autoaprendizaje obligatorias
 Tarea N° 8:
 Curso: Spark Fundamentals I.

Cibertec Perú S.A.C – Big Data (PIN-1804) 6


Modo: Sesión no presencial (2.0 h)
 Autoevaluación N° 8:
 Usar herramientas de visualización de Big Data.

Duración
EVALUACIÓN FINAL (EF)
2.0 h

X. BIBLIOGRAFÍA

 Big Data y Analítica Avanzada


https://azure.microsoft.com/en-us/solutions/big-data/
Consulta: 05 de diciembre del 2017

 Hadoop
https://azure.microsoft.com/es-es/solutions/hadoop/
Consulta: 05 de diciembre del 2017

 Cognitive Class
https://cognitiveclass.ai/courses/
Consulta: 05 de diciembre del 2017

 Hortoworks Tutoriales
https://hortonworks.com/tutorials/
Consulta: 05 de diciembre del 2017

 Apache Hadoop
http://hadoop.apache.org/
Consulta: 05 de diciembre del 2017

 Apache Pig
http://pig.apache.org/
Consulta: 05 de diciembre del 2017

 Apache Flume
http://flume.apache.org/
Consulta: 05 de diciembre del 2017

 Apache Sqoop
http://sqoop.apache.org/
Consulta: 05 de diciembre del 2017

 Apache Hive
http://hive.apache.org/
Consulta: 05 de diciembre del 2017

 Apache Spark
http://spark.apache.org/
Consulta: 05 de diciembre del 2017

Cibertec Perú S.A.C – Big Data (PIN-1804) 7

También podría gustarte