Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Mdulo n 2
DESARROLLADOR CLOUDERA PARA APACHE HADOOP (58 h)
Objetivo:
Tecnologas clave de Hadoop. Cmo funciona HDFS MapReduce. Cmo desarrollar
aplicaciones MapReduce. Cmo crear unidades de testeo (unit tests) para aplicaciones
MapReduce. Cmo usar los combiners, partitioners, y la cache distribuida de un
MapReduce. Mejores prcticas para el desarrollo y depuracin de aplicaciones MapReduce.
Cmo implementar la entrada y salida de datos de aplicaciones MapReduce. Algoritmos
para tareas comunes de MapReduce. Cmo unir conjuntos de datos en MapReduce. Cmo
se integra Hadoop en el CPD. Cmo usar los algoritmos Machine Learning de Mahout.
Cmo utilizar Hive y Pig para el desarrollo rpido de aplicaciones. Cmo crear grandes
workflows utilizando Oozie.
Contenidos terico-prcticos:
-
Introduccin
La Motivacin de Hadoop
- Problemas con los sistemas tradicionales a gran escala
- Necesidades para una nueva aproximacin
Hadoop: Conceptos Bsicos
- El Proyecto Hadoop y Componentes Hadoop
- El Sistema de Ficheros Distribuido Hadoop (HDFS)
- Ejercicios prcticos: Uso de HDFS
- Cmo funciona MapReduce
- Ejercicio prctico: Ejecutando un Job MapReduce
- Cmo Operan los Cluster Hadoop
- Otros Proyectos del Ecosistema Hadoop
- Otros Componentes del Ecosistema Hadoop
Escribiendo una aplicacin MapReduce
- El Flujo MapReduce
- Conceptos Bsicos de la API MapReduce
- Escribiendo Drivers, Mappers, y Reducers de MapReduce en Java
- Escribiendo Mappers y Reducers en Otros Lenguajes utilizando la Streaming
API
- Acelerando el Desarrollo en Hadoop utilizando Eclipse
- Ejercicio Prctico: Escribiendo un Programa MapReduce
- Diferencias entre la antigua API de MapReduce y la nueva
Programas Unit Testing de MapReduce
- Unit testing