HandsOn - MapReduce Avanzado

Cargado por

lucymarisol.garay

0% encontró este documento útil (0 votos)

5 vistas6 páginas

5. HandsOn - MapReduce Avanzado

Título original

5. HandsOn - MapReduce Avanzado

Derechos de autor

Formatos disponibles

DOCX, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

5. HandsOn - MapReduce Avanzado

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

5 vistas6 páginas

HandsOn - MapReduce Avanzado

Cargado por

lucymarisol.garay

5. HandsOn - MapReduce Avanzado

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 6

Buscar dentro del documento

Máster en Big Data

Tecnologías de Almacenamiento

5. Hands-On: Desarrollo MapReduce

Avanzado
Índice

1. Introducción.................................................................................................................................3
2. Entorno de desarrollo...................................................................................................................3
3. Tool Runner y parámetros...........................................................................................................5
4. Combiner.....................................................................................................................................5
5. Partitioner.....................................................................................................................................6

2
1. Introducción
El objetivo de este Hands-On es poner en práctica conceptos avanzados en el desarrollo de Jobs de
MapReduce

2. Entorno de desarrollo
Para realizar el desarrollo lo haremos mediante el IDE Eclipse de la máquina virtual importada en
ejercicios anteriores.
Para crear un nuevo proyecto, haremos click derecho sobre el package explorer New à Java
Project

Introducimos el nombre del proyecto y click en Finish

3
Importamos manualmente las lilbrerías necesarias haciendo click derecho sobre el proyecto que
acabamos de crear y seleccionamos Build Path à Configure Build Path

En la pestaña de libraries, seleccionamos Add Extertnal Jars e importamos todo el contenido de la

carpeta /usr/lib/hadoop/client-0.20/

4
3. Tool Runner y parámetros
Desarrollar y ejecutar el siguiente MapReduce:
Aprovechando el ejercicio del Hands-On anterior (AvarageWordLength) realizar las siguientes
modificaciones:
 La clase driver use ToolRunner

 Modificar el Mapper para referenciar una variable booleana llamada caseSensitive. Si esta
variable es true, el mapper no diferenciara entre mayúsculas ni minúsculas, si es false, hará
una conversión de todas las letras a minúscula.

4. Combiner
Desarrollar y ejecutar el siguiente MapReduce:
Añadir un combiner al proyecto IpCount realizado en el Hands-On anterior

5
5. Partitioner
Desarrollar y ejecutar el siguiente MapReduce:
Aprovechando el proyecto original IpCount realizar los cambios pertinentes para escribir un Job
con múltiples reducers e implementar un partitioner que redirija la salida según el mes del año
hacia un reducer concreto.
Es decir, en total habrán 12 reducers (uno para cada mes del año) y el partitioner será el encargado
de redirigir esa clave/valor hacia el reducer correcto.

La salida final consistirá en 12 ficheros, uno para cada mes del año, y contendrán el número de
veces que se ha repetido la ip en ese mes del año.

Solución:

También podría gustarte

Aplicaciones web con Php
De Everand
Aplicaciones web con Php
Héctor Flórez Fernández
Calificación: 5 de 5 estrellas
5/5 (17)
Matlab aplicado a telecomunicaciones
De Everand
Matlab aplicado a telecomunicaciones
Mauricio Ortega Ruíz
Calificación: 5 de 5 estrellas
5/5 (1)
Manual de R
Documento127 páginas
Manual de R
David Santiago Valenzuela Rocha
0% (1)
Ejercicio 1 - U3
Documento3 páginas
Ejercicio 1 - U3
Edwin Velez
100% (1)
Plantilla de Matriz de Trazabilidad de Requisitos
Documento4 páginas
Plantilla de Matriz de Trazabilidad de Requisitos
noseandrea carrasco
Aún no hay calificaciones
JFo 7 Practice Esp
Documento2 páginas
JFo 7 Practice Esp
ng
Aún no hay calificaciones
Programación y desarrollo de algoritmos con C++
De Everand
Programación y desarrollo de algoritmos con C++
Pablo Augusto Sznajdleder
Aún no hay calificaciones
Manual Dot Project V1
Documento57 páginas
Manual Dot Project V1
che3cho
Aún no hay calificaciones
Trabajo Final Ingenieria de Software
Documento20 páginas
Trabajo Final Ingenieria de Software
David Sanchez Mora
Aún no hay calificaciones
¿Qué es un diagrama de Gantt?: Comprender y utilizar con eficacia el software libre "Gantt Project" para la gestión de proyectos educativos
De Everand
¿Qué es un diagrama de Gantt?: Comprender y utilizar con eficacia el software libre "Gantt Project" para la gestión de proyectos educativos
Cristina Rebiere
Calificación: 1 de 5 estrellas
1/5 (1)
HandsOn - Desarrollo MapReduce - Lucy
Documento14 páginas
HandsOn - Desarrollo MapReduce - Lucy
lucymarisol.garay
Aún no hay calificaciones
Programacion Extrema PDF
Documento23 páginas
Programacion Extrema PDF
Jhonny Lozano
100% (1)
Manual de R y R Comander
Documento142 páginas
Manual de R y R Comander
Anonymous pEiRlWcs
Aún no hay calificaciones
Aldama - Desarrollo de Aplicaciones Multiplataforma Con OutSystems
Documento73 páginas
Aldama - Desarrollo de Aplicaciones Multiplataforma Con OutSystems
Blachofg Fg
Aún no hay calificaciones
Trabajo Fin de Carrera
Documento143 páginas
Trabajo Fin de Carrera
Antonio Gimeno Gimeno
Aún no hay calificaciones
FPR U3 A2 Casc
Documento9 páginas
FPR U3 A2 Casc
Carlos Severiano
Aún no hay calificaciones
Diagrama de Gantt 2
Documento31 páginas
Diagrama de Gantt 2
Oscar Swimmer
Aún no hay calificaciones
FuertesAgras Jaime TFG 2022
Documento74 páginas
FuertesAgras Jaime TFG 2022
man_sof
Aún no hay calificaciones
Desarrollo de Aplicación Multiplataforma de Búsqueda Y Gestión de Recetas
Documento89 páginas
Desarrollo de Aplicación Multiplataforma de Búsqueda Y Gestión de Recetas
Fernando Salvador
Aún no hay calificaciones
Programacionconcurrente 1227716135563909 9 PDF
Documento19 páginas
Programacionconcurrente 1227716135563909 9 PDF
William Jxjxj
Aún no hay calificaciones
User RPL
Documento99 páginas
User RPL
Jose Almanza
Aún no hay calificaciones
Manual de Prácticas de Laboratorio
Documento16 páginas
Manual de Prácticas de Laboratorio
Ub Oroz
Aún no hay calificaciones
Memoria Pablo Berbel
Documento56 páginas
Memoria Pablo Berbel
Jorge Luis Paez
Aún no hay calificaciones
MA Técnicas Avanzadas de Cartografía Digital QGIS 3.22
Documento128 páginas
MA Técnicas Avanzadas de Cartografía Digital QGIS 3.22
rescate2
Aún no hay calificaciones
CalvoGomez Nicolas TFG 2021
Documento71 páginas
CalvoGomez Nicolas TFG 2021
Javier Gomez
Aún no hay calificaciones
GUION DE USO DE R
Documento157 páginas
GUION DE USO DE R
Virginia Huidobro Pelayo
Aún no hay calificaciones
Lab N°5
Documento47 páginas
Lab N°5
Sebastian Suquilanda
Aún no hay calificaciones
Introducción A La Programación
Documento9 páginas
Introducción A La Programación
WDY WDY ABREU/MATEO
Aún no hay calificaciones
User RPL
Documento99 páginas
User RPL
Ruben Rosino
Aún no hay calificaciones
Programacion QT
Documento88 páginas
Programacion QT
Julio Andrade
Aún no hay calificaciones
P13 - Edai Franciso Javier
Documento4 páginas
P13 - Edai Franciso Javier
Paulina Bastida Garcia
Aún no hay calificaciones
Previo 2 Eda Franciso Javier Fi Unam
Documento24 páginas
Previo 2 Eda Franciso Javier Fi Unam
Paulina Bastida Garcia
Aún no hay calificaciones
Roject: Rograma de Itulación
Documento25 páginas
Roject: Rograma de Itulación
Diego Mejia
Aún no hay calificaciones
Herramientas de Software Utilizadas Programación Paralela
Documento33 páginas
Herramientas de Software Utilizadas Programación Paralela
zayu
Aún no hay calificaciones
MyDream - PoC - Documentacion - Tecnica.v.1.00
Documento21 páginas
MyDream - PoC - Documentacion - Tecnica.v.1.00
thorgilr
Aún no hay calificaciones
Reporte P3 Compiladores 5 CM5
Documento24 páginas
Reporte P3 Compiladores 5 CM5
Ed
Aún no hay calificaciones
TFM Daniel Perez Atienza
Documento68 páginas
TFM Daniel Perez Atienza
jjb117343
Aún no hay calificaciones
Ejercicios BDD
Documento107 páginas
Ejercicios BDD
inggaitan
100% (2)
Aplicación Web para Ayuntamiento de Las Palmas2
Documento54 páginas
Aplicación Web para Ayuntamiento de Las Palmas2
Juan R
Aún no hay calificaciones
Lenguajes Concurrentes
Documento23 páginas
Lenguajes Concurrentes
nair
Aún no hay calificaciones
Bases de Datos
Documento114 páginas
Bases de Datos
cuenta_para_mega_03
Aún no hay calificaciones
Conceptos Tecnicas Modelos de Programacion PDF
Documento966 páginas
Conceptos Tecnicas Modelos de Programacion PDF
Alex
100% (1)
TFG Eventis
Documento89 páginas
TFG Eventis
ImpolutoChannel
Aún no hay calificaciones
Entrega 1 Semana 3 Arquitectura de Computadores
Documento8 páginas
Entrega 1 Semana 3 Arquitectura de Computadores
wepetsfordogs
Aún no hay calificaciones
Implementación de Un Módulo de Logística en Un Sistema ERP para Una Pyme
Documento39 páginas
Implementación de Un Módulo de Logística en Un Sistema ERP para Una Pyme
Edinson Asuncion
Aún no hay calificaciones
Proyecto de Desarrollo Tecnológico
Documento59 páginas
Proyecto de Desarrollo Tecnológico
Abigail Martinez Mejia
Aún no hay calificaciones
Plan de Desarrollo Software
Documento16 páginas
Plan de Desarrollo Software
julio garcia
Aún no hay calificaciones
TFG 2018-06-28 AdrianPicazoMarin PDF
Documento112 páginas
TFG 2018-06-28 AdrianPicazoMarin PDF
Gonzalo Muñoz
Aún no hay calificaciones
Guia 2 Desarrollo Software Cañaveral Castañeda Diaz
Documento10 páginas
Guia 2 Desarrollo Software Cañaveral Castañeda Diaz
Harold Cañaveral
Aún no hay calificaciones
Modulo de Programacion Parte B
Documento8 páginas
Modulo de Programacion Parte B
rc_20308989
Aún no hay calificaciones
TFG Robledo Arevalo 2019
Documento80 páginas
TFG Robledo Arevalo 2019
LuisRojasTucto
Aún no hay calificaciones
UD1. Introducción A La Programación
Documento29 páginas
UD1. Introducción A La Programación
Etain Deivae
Aún no hay calificaciones
Monografia Programacion Orientada A Eventos
Documento18 páginas
Monografia Programacion Orientada A Eventos
armando guerra constante
Aún no hay calificaciones
UD1 - Introducción A La Programación
Documento15 páginas
UD1 - Introducción A La Programación
vofec69962
Aún no hay calificaciones
Análisis Bioinformáticos Sobre La Tecnología Hadoop PDF
Documento67 páginas
Análisis Bioinformáticos Sobre La Tecnología Hadoop PDF
josethiagof
Aún no hay calificaciones
BoccardoRuiz2018 UsodeRStudioparaEstadsticaUnivariadaenCienciasSociales19julio PDF
Documento97 páginas
BoccardoRuiz2018 UsodeRStudioparaEstadsticaUnivariadaenCienciasSociales19julio PDF
Julie DZ
Aún no hay calificaciones
Control de Tiempos y La Gestion de Personal Politecnica de Valencia
Documento86 páginas
Control de Tiempos y La Gestion de Personal Politecnica de Valencia
Andres Felipe Clavijo Ramirez
Aún no hay calificaciones
Trabajo de Fin de Ma Ster Ma Ster en Investigacio N en Ingenier Ia de Sistemas Y de La Computacio N
Documento153 páginas
Trabajo de Fin de Ma Ster Ma Ster en Investigacio N en Ingenier Ia de Sistemas Y de La Computacio N
EMERSON JOSE SALVADOR MERIDA
Aún no hay calificaciones
PHP 8: Curso práctico de formación
De Everand
PHP 8: Curso práctico de formación
Italo Morales
Aún no hay calificaciones
Big Data: Técnicas, herramientas y aplicaciones
De Everand
Big Data: Técnicas, herramientas y aplicaciones
María Pérez Marqués
Aún no hay calificaciones
MATLAB Aplicado a telecomunicaciones
De Everand
MATLAB Aplicado a telecomunicaciones
Mauricio Ortega
Aún no hay calificaciones
De Silicon Valley a tu negocio: Innovación, data e inteligencia artificial
De Everand
De Silicon Valley a tu negocio: Innovación, data e inteligencia artificial
David Villaseca
Aún no hay calificaciones
JEE 7 a Fondo: Diseño y desarrollo de aplicaciones Java Enterprise
De Everand
JEE 7 a Fondo: Diseño y desarrollo de aplicaciones Java Enterprise
Pablo Sznajdleder
Aún no hay calificaciones
Esquema de Plan, Programa y Proyescto
Documento14 páginas
Esquema de Plan, Programa y Proyescto
YAHEL LIMA
Aún no hay calificaciones
Curriculum Elisa Medina Navarro
Documento3 páginas
Curriculum Elisa Medina Navarro
Rubén
Aún no hay calificaciones
Pr81 Guión
Documento4 páginas
Pr81 Guión
Luis P
Aún no hay calificaciones
Microsoft Word - Taller de Aprendizaje Banner
Documento2 páginas
Microsoft Word - Taller de Aprendizaje Banner
Pedro Cantor
Aún no hay calificaciones
Modalidad de Exámenes - Semana 6 - Revisión Del Intento
Documento5 páginas
Modalidad de Exámenes - Semana 6 - Revisión Del Intento
Israel Oropeza Rodriguez
Aún no hay calificaciones
Proyecto Procesos Industriales Primera Entrega Aporte Jairo Celi
Documento6 páginas
Proyecto Procesos Industriales Primera Entrega Aporte Jairo Celi
jhon montoya
Aún no hay calificaciones
Cuestionario Photoshop (Info)
Documento3 páginas
Cuestionario Photoshop (Info)
Adrian Chavez
Aún no hay calificaciones
Ingeniería de Software
Documento17 páginas
Ingeniería de Software
Diego
Aún no hay calificaciones
Catalogo de Productos y Servicios ICI - 2011
Documento79 páginas
Catalogo de Productos y Servicios ICI - 2011
Esaú Hernández
Aún no hay calificaciones
Protocolo Evalua 0
Documento4 páginas
Protocolo Evalua 0
yoyoyata
100% (1)
Sesion 08 - Tablas Dinamicas
Documento29 páginas
Sesion 08 - Tablas Dinamicas
José Poémape
100% (1)
Plantilla Protocolo Individual
Documento4 páginas
Plantilla Protocolo Individual
keyla vanessa toloza loreo
Aún no hay calificaciones
Adquisición de Software y Hardware
Documento6 páginas
Adquisición de Software y Hardware
lewis Tg
Aún no hay calificaciones
Gestión de Encomienda Digital-R6
Documento8 páginas
Gestión de Encomienda Digital-R6
danmolar
Aún no hay calificaciones
Metodologia de La Investigacion en Ciencias Sociales Apendice y Respuestas Dec Ejercicios
Documento37 páginas
Metodologia de La Investigacion en Ciencias Sociales Apendice y Respuestas Dec Ejercicios
Esther Marzan Martinez
Aún no hay calificaciones
Puc - Resumen Iic1103
Documento66 páginas
Puc - Resumen Iic1103
IgnacioVillagra
Aún no hay calificaciones
Monografia Twitter
Documento13 páginas
Monografia Twitter
iTzFoxis
0% (1)
Tarea4 Comonente-Practico Jairson Thomas
Documento8 páginas
Tarea4 Comonente-Practico Jairson Thomas
jairson
Aún no hay calificaciones
Metodo Burbuja
Documento25 páginas
Metodo Burbuja
LuisRaúlManzanoMontes
Aún no hay calificaciones
Sqlite Josejuansanchez
Documento11 páginas
Sqlite Josejuansanchez
abelalbertorojas
Aún no hay calificaciones
Examen Excel
Documento4 páginas
Examen Excel
Dercy Navarro Perez
Aún no hay calificaciones
Uned Informatica - Sistemas Operativos Teoria Y Problemas
Documento538 páginas
Uned Informatica - Sistemas Operativos Teoria Y Problemas
Ray
Aún no hay calificaciones
Curriculum
Documento9 páginas
Curriculum
Mario Cesar Sicha Delgadillo
Aún no hay calificaciones
HTML DOM Javascript
Documento35 páginas
HTML DOM Javascript
Paty Zanada
Aún no hay calificaciones
Partes y Elementos para La Construcción de Un Algoritmo
Documento14 páginas
Partes y Elementos para La Construcción de Un Algoritmo
Capecar
Aún no hay calificaciones
Taller - VECTORES 2022 I
Documento2 páginas
Taller - VECTORES 2022 I
daniela mohales
Aún no hay calificaciones
11.1.3.4 Lab - Work With Task Manager
Documento4 páginas
11.1.3.4 Lab - Work With Task Manager
Cristian Ibazeta Serei
100% (1)