02 D Desafío - Ecosistema Hadoop

Cargado por

Alejandra Aravena

0% encontró este documento útil (0 votos)

58 vistas2 páginas

Título original

02_d_Desafío_-_Ecosistema_Hadoop

Derechos de autor

Formatos disponibles

PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

58 vistas2 páginas

02 D Desafío - Ecosistema Hadoop

Cargado por

Alejandra Aravena

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 2

Buscar dentro del documento

Desafío - Ecosistema Hadoop

Para realizar este desafío debes haber revisado todo el material disponibilizado de la unidad.
Debes tener precaución con las rutas y el sistema operativo que utilices.
Una vez terminade el desafío, adjunta los archivos necesarios de cada ejercicio, comprime la
carpeta y sube el .zip a la sección correspondiente.

Ejercicio 1 - Carga de archivos en HDFS

Inicie una instancia de trabajo AWS EMR
Cree una carpeta en hdfs que se llama movielens-20m .
Utilizando s3-dist-cp , copie los archivos del siguiente bucket s3://bigdata-
desafio/challenges/u3lec1/ a su carpeta creada y liste su contenido.
Saque un screenshot del listado con nombre movielens_datos_hdfs .
Identifique el jar de streaming en su máquina. Saque un screenshot con el nombre
id_streaming_jar .

Ejercicio 2 - Utilizando el archivo genome-scores.csv

Desde su instancia de AWS EMR, implemente un trabajo de MapReduce en Hadoop Streaming
donde reporte la media del índice de relevancia por cada uno de los tag id asociados.

Escriba los scripts mapper_1.py y reducer_1.py con las instrucciones asociadas para cada
etapa y súbalos a su instancia de AWS EMR:
No se olvide de hacer ejecutables los scripts.
Guarde los resultados del trabajo en un archivo llamado results_1.txt

Ejercicio 3 - Utilizando el archivo ratings.csv

Desde su instancia de AWS EMR, implemente un trabajo de MapReduce en Hadoop Streaming
donde reporte la cantidad de ratings y su promedio a nivel de usuario.
Escriba los scripts mapper_2.py y reducer_2.py con las instrucciones asociadas para cada
etapa y súbalos a su instancia de AWS EMR:

No se olvide de hacer ejecutables los scripts.

Guarde los resultados del trabajo en un archivo llamado results_2.txt
Ejercicio 4 - Utilizando el archivo ratings.csv
Desde su instancia de AWS EMR, implemente un trabajo de MapReduce en Hadoop Streaming
donde reporte el rating promedio por película.

Escriba los scripts mapper_3.py y reducer_3.py con las instrucciones asociadas para cada
etapa y súbalos a su instancia de AWS EMR:
No se olvide de hacer ejecutables los scripts.
Guarde los resultados del trabajo en un archivo llamado results_3.txt .

Ejercicio 5 - Utilizando el archivo movies.csv

Desde su instancia de AWS EMR, implemente un trabajo de MapReduce en Hadoop Streaming
donde cuente la cantidad de géneros asociados a cada película y reporte la cantidad de
películas con 2, 3, 4, 5, 6, 7, 8, 9 y 10 géneros.
Escriba los scripts mapper_4.py y reducer_4.py con las instrucciones asociadas para cada
etapa y súbalos a su instancia de AWS EMR:

No se olvide de hacer ejecutables los scripts.

Guarde los resultados del trabajo en un archivo llamado results_4.txt .

Ejercicio 6 - Descarga de resultados y eliminación de Instancia

Saque un screenshot del término de la instancia AWS EMR.

En un .zip , adjunte los siguientes archivos:

Los Mappers y Reducers de los ejercicios 2, 3, 4 y 5.
Los resultados en texto plano de los ejercicios 2, 3, 4 y 5.
El screenshot del listado de archivos en HDFS.
El screenshot de la identificación de la ruta del jar Hadoop Streaming.
El screenshot de la terminación de la instancia.

(Opcional) Ejercicio 7 - Utilizando el archivo movies.csv

Desde su instancia de AWS EMR, implemente un trabajo de MapReduce en Hadoop Streaming
donde cuente la cantidad de películas por año.
tip: Puede implementar la expresión regular \(\d+\) para identificar el año asociado en
el título de la película.
Escriba los scripts mapper_5.py y reducer_5.py con las instrucciones asociadas para cada
etapa y súbalos a su instancia de AWS EMR:

No se olvide de hacer ejecutables los scripts.

Guarde los resultados del trabajo en un archivo llamado results_5.txt .

También podría gustarte

Programación Java - Una Guía para Principiantes para Aprender Java Paso a Paso
De Everand
Programación Java - Una Guía para Principiantes para Aprender Java Paso a Paso
Troy Dimes
Calificación: 3 de 5 estrellas
3/5 (7)
Screenshots Desafío Ecosistema Hadoop LGB VF
Documento48 páginas
Screenshots Desafío Ecosistema Hadoop LGB VF
Orlando Soto
Aún no hay calificaciones
Administración de sistemas operativos
De Everand
Administración de sistemas operativos
Marife Aldea Jiménez
Calificación: 3.5 de 5 estrellas
3.5/5 (8)
Actividad 1 y 2
Documento4 páginas
Actividad 1 y 2
Jorge Esquerre
0% (2)
Aprende a Programar para Android
De Everand
Aprende a Programar para Android
Ángel Arias
Calificación: 5 de 5 estrellas
5/5 (3)
Instalación de Apache, MySQL y PHP
Documento6 páginas
Instalación de Apache, MySQL y PHP
Manu Carrasco
Aún no hay calificaciones
Invocar Programas Asm Desde Java Paso A Paso-05!30!09
Documento9 páginas
Invocar Programas Asm Desde Java Paso A Paso-05!30!09
Jose Maria Romero Gomez
Aún no hay calificaciones
L13 Algoritmos
Documento3 páginas
L13 Algoritmos
Michael Angel Ticlla Martinez
Aún no hay calificaciones
L13 Algoritmos
Documento2 páginas
L13 Algoritmos
Dayana Valle
Aún no hay calificaciones
PRACTICA DE CLASE LARAVEL Parte 1
Documento6 páginas
PRACTICA DE CLASE LARAVEL Parte 1
Kelly Alfonso
Aún no hay calificaciones
Ejercicios Spark Ejercicios BIT - SOLUCIONES
Documento24 páginas
Ejercicios Spark Ejercicios BIT - SOLUCIONES
Deogracias Plaud
Aún no hay calificaciones
Capítulo 1. Aplicación Base y Configuración Del Entorno 1.1 Creacion de La Estructura de Directorios Del Proyecto
Documento8 páginas
Capítulo 1. Aplicación Base y Configuración Del Entorno 1.1 Creacion de La Estructura de Directorios Del Proyecto
Andres Fernando
Aún no hay calificaciones
Lab11 Practica Laboratorio Openldap Integracion Samba 2017 II
Documento13 páginas
Lab11 Practica Laboratorio Openldap Integracion Samba 2017 II
Zelmar Mallco Huaraca
Aún no hay calificaciones
Lab14 RSYNC 2020 I
Documento5 páginas
Lab14 RSYNC 2020 I
Jean Pierre Charlie Velasquez Espinoza
0% (1)
NqfPbQyETm2vK-IBCcAfiw s4 Taller2 API
Documento5 páginas
NqfPbQyETm2vK-IBCcAfiw s4 Taller2 API
juan sebastian perdomo becerra
Aún no hay calificaciones
Openldap Danpedmed
Documento14 páginas
Openldap Danpedmed
Daniel Pedrajas Medran
Aún no hay calificaciones
Tutorial MacroAssembler
Documento21 páginas
Tutorial MacroAssembler
lilyfloresr
Aún no hay calificaciones
Instalacion Dspace 5.x.en Windows 7
Documento79 páginas
Instalacion Dspace 5.x.en Windows 7
Juan Pablo Alvarez
Aún no hay calificaciones
Laboratorio #1 2023
Documento8 páginas
Laboratorio #1 2023
DIEGO ANDRES ALONZO MEDINILLA
Aún no hay calificaciones
Tips Program Ac I On
Documento14 páginas
Tips Program Ac I On
ingenlineaco
Aún no hay calificaciones
AWStats Ref Windows ApacheYPerl
Documento9 páginas
AWStats Ref Windows ApacheYPerl
Rocío Quiliano
Aún no hay calificaciones
Trabajo 2 Semestre 01 2024
Documento4 páginas
Trabajo 2 Semestre 01 2024
sergio arango
Aún no hay calificaciones
Tarea6 - Programacion - Dinamica
Documento3 páginas
Tarea6 - Programacion - Dinamica
jesusemmanuelloredo.19
Aún no hay calificaciones
TP 4
Documento9 páginas
TP 4
Abraham Gutierrez
Aún no hay calificaciones
Requisitos de Los Escenarios para Realización de Las Prácticas
Documento5 páginas
Requisitos de Los Escenarios para Realización de Las Prácticas
Miguel Glez
Aún no hay calificaciones
P5. 2023-01 ClusterHadoop - Aplicacion
Documento13 páginas
P5. 2023-01 ClusterHadoop - Aplicacion
Gerson Yarce Franco
Aún no hay calificaciones
C3.AP.14. Componente de Presentación - CORS e Introducción A Vue
Documento13 páginas
C3.AP.14. Componente de Presentación - CORS e Introducción A Vue
Cristian Camilo Sandoval
Aún no hay calificaciones
Actividad 3.1
Documento25 páginas
Actividad 3.1
Aj Aljnb
Aún no hay calificaciones
Manual de Instalacion
Documento7 páginas
Manual de Instalacion
Gerald Ronald Zavala Chiroque
Aún no hay calificaciones
Tarea7 - Programacion - Dinamica
Documento3 páginas
Tarea7 - Programacion - Dinamica
jesusemmanuelloredo.19
Aún no hay calificaciones
Guia Del Proyecto GRUPO 09
Documento1 página
Guia Del Proyecto GRUPO 09
milpalsandra
Aún no hay calificaciones
6.2.7 Lab - Build A Sample Web App in A Docker Container - Es XL
Documento12 páginas
6.2.7 Lab - Build A Sample Web App in A Docker Container - Es XL
Juan Carlos Moreno Henao
Aún no hay calificaciones
Tarea 5 AERMAP
Documento2 páginas
Tarea 5 AERMAP
Nico Rebolledo
Aún no hay calificaciones
Manual para Acceder A La Base de Datos Del Ecmwf
Documento7 páginas
Manual para Acceder A La Base de Datos Del Ecmwf
Laura Paccini
Aún no hay calificaciones
Taller-10 Ejercicios 18 22
Documento4 páginas
Taller-10 Ejercicios 18 22
Jonathan Sampedro
Aún no hay calificaciones
Unix Essentials
Documento10 páginas
Unix Essentials
Thomas Vélez
Aún no hay calificaciones
Práctica 8 Programación de Tareas en Gnu-Linux - Abel
Documento6 páginas
Práctica 8 Programación de Tareas en Gnu-Linux - Abel
Abel Vigara Molero
Aún no hay calificaciones
Prueba Tecnica Linux
Documento6 páginas
Prueba Tecnica Linux
Tatiana Palacios
Aún no hay calificaciones
Prueba Tecnica Linux
Documento6 páginas
Prueba Tecnica Linux
Tatiana Palacios
Aún no hay calificaciones
Crud Basico Con Symfony
Documento52 páginas
Crud Basico Con Symfony
krlosk
Aún no hay calificaciones
Flask Usando Docker
Documento3 páginas
Flask Usando Docker
Jose Lizana
Aún no hay calificaciones
Empaquetado y Despliegue de Aplicaciones Java 2004
Documento12 páginas
Empaquetado y Despliegue de Aplicaciones Java 2004
amon38
Aún no hay calificaciones
LaTeX Template For Preparing Supplementary Material For Submission To Optica Publishing Group S Journals
Documento4 páginas
LaTeX Template For Preparing Supplementary Material For Submission To Optica Publishing Group S Journals
Pedro Martinez
Aún no hay calificaciones
Pia 06
Documento37 páginas
Pia 06
Maximiliano Blanco Villar
Aún no hay calificaciones
Tarea para SOM07
Documento3 páginas
Tarea para SOM07
Alejandro Ramos
Aún no hay calificaciones
Individual Paso 5 Grupo
Documento13 páginas
Individual Paso 5 Grupo
Alexander Higuera Bohorquez
Aún no hay calificaciones
7.3.3. TAREA - Eventos
Documento10 páginas
7.3.3. TAREA - Eventos
Carlos Rodriguez
Aún no hay calificaciones
Pruebas Unitarias
Documento2 páginas
Pruebas Unitarias
Fj Fjpimienta
Aún no hay calificaciones
Practica7 RPL0 Desafio2 Registros Filtros Carnet Nombre
Documento6 páginas
Practica7 RPL0 Desafio2 Registros Filtros Carnet Nombre
Alex Marinero
Aún no hay calificaciones
3-Laboratorio N-2 Comandos-Basicos-Linux
Documento7 páginas
3-Laboratorio N-2 Comandos-Basicos-Linux
Julian Zamudio
Aún no hay calificaciones
Taller4 Shell Tareas Programadas
Documento7 páginas
Taller4 Shell Tareas Programadas
Cristiian Lara
Aún no hay calificaciones
6.2.7 Lab - Build A Sample Web App in A Docker Container
Documento14 páginas
6.2.7 Lab - Build A Sample Web App in A Docker Container
Jesus Hernandez
Aún no hay calificaciones
Preparar Un Ambiente de Desarrollo Python Docker - by Adamo Jordan Figueroa - Medium
Documento5 páginas
Preparar Un Ambiente de Desarrollo Python Docker - by Adamo Jordan Figueroa - Medium
Carmen Bolivar
Aún no hay calificaciones
Reactjs
Documento53 páginas
Reactjs
Ayz Ayz
Aún no hay calificaciones
3.3.2 Modelo de Yang - Netconf y Restconf
Documento38 páginas
3.3.2 Modelo de Yang - Netconf y Restconf
Augusto Rodriguez
Aún no hay calificaciones
Lab14 RSYNC 2020 I
Documento4 páginas
Lab14 RSYNC 2020 I
Jean Pierre Charlie Velasquez Espinoza
Aún no hay calificaciones
Instalar Angular
Documento10 páginas
Instalar Angular
Cesar Alain Mori Padilla
Aún no hay calificaciones
TP 2
Documento5 páginas
TP 2
Abraham Gutierrez
Aún no hay calificaciones
IAW UT01 Tarea 01 Agorreta Domblas Ander
Documento8 páginas
IAW UT01 Tarea 01 Agorreta Domblas Ander
Ander Agorreta
Aún no hay calificaciones
Instalacion Dcm4chee Windows 7
Documento11 páginas
Instalacion Dcm4chee Windows 7
ALVxRIO
Aún no hay calificaciones
Resumen Sesiones 1 y 2 EPED
Documento9 páginas
Resumen Sesiones 1 y 2 EPED
achilipun
Aún no hay calificaciones
Infografia IDE
Documento6 páginas
Infografia IDE
Moises Santiago
Aún no hay calificaciones
Temario Sistemas Electrotécnicos y Automáticos
Documento9 páginas
Temario Sistemas Electrotécnicos y Automáticos
gines
Aún no hay calificaciones
Manual Paso A Paso Gambas
Documento91 páginas
Manual Paso A Paso Gambas
geraldine1972
Aún no hay calificaciones
Linia de Tiempo Algoritmos
Documento1 página
Linia de Tiempo Algoritmos
Robinson Gonzalez
Aún no hay calificaciones
Modalidad de Exámenes - Semana 2 - Programacion - Estructurada
Documento2 páginas
Modalidad de Exámenes - Semana 2 - Programacion - Estructurada
Brandon Matos
Aún no hay calificaciones
Plan de Tesis 19.2 - Desposorio de La Cruz, José Fernando
Documento10 páginas
Plan de Tesis 19.2 - Desposorio de La Cruz, José Fernando
Fernando Desposorio
Aún no hay calificaciones
Informatica Aplicada A La Educacion. NOM PDF
Documento2 páginas
Informatica Aplicada A La Educacion. NOM PDF
Javier Alcivar
Aún no hay calificaciones
Metodo Simplex
Documento12 páginas
Metodo Simplex
julio cesar de la cruz beltran
Aún no hay calificaciones
Herramientas Desarrolladas Con La Teoria de La Programacion PDF
Documento41 páginas
Herramientas Desarrolladas Con La Teoria de La Programacion PDF
Natanias Isai Hernandez Pastrana
Aún no hay calificaciones
Case E1 E3
Documento27 páginas
Case E1 E3
Estrella Camacho
Aún no hay calificaciones
Programacionnew
Documento17 páginas
Programacionnew
Bresly Tatiana Fernandez Pineda
Aún no hay calificaciones
1 Presentación Unidad I
Documento36 páginas
1 Presentación Unidad I
Fredy Montenegro
Aún no hay calificaciones
Desarrollando Sistemas Multiagentes Sobre AgentNet
Documento11 páginas
Desarrollando Sistemas Multiagentes Sobre AgentNet
Eduard Beltre
Aún no hay calificaciones
Ciclo Repetitivo 1
Documento2 páginas
Ciclo Repetitivo 1
armando
Aún no hay calificaciones
Git y Github - Documento Teórico Con Material de Repaso
Documento39 páginas
Git y Github - Documento Teórico Con Material de Repaso
favitop
Aún no hay calificaciones
La Biblia Del SynEdit - Rev7
Documento153 páginas
La Biblia Del SynEdit - Rev7
Ever José Delgado Chacón
Aún no hay calificaciones
Problemas Sesion5
Documento3 páginas
Problemas Sesion5
Yosue
Aún no hay calificaciones
Ejercicio de Lingo
Documento9 páginas
Ejercicio de Lingo
Monica Rocío Herrera Galarza
Aún no hay calificaciones
Chuleta Linux Examen
Documento4 páginas
Chuleta Linux Examen
4203955
Aún no hay calificaciones
Trabajo Práctico Integrador
Documento7 páginas
Trabajo Práctico Integrador
Emi Retamar
Aún no hay calificaciones
Whats New and Whats Next Webinar ES
Documento32 páginas
Whats New and Whats Next Webinar ES
Ruben Jesus Lopez Muñoz
Aún no hay calificaciones
Capítulo 8. Libro Davini M.C.
Documento7 páginas
Capítulo 8. Libro Davini M.C.
Valentina Kieffer
Aún no hay calificaciones
2019 Hernandez Et Al - An de in de Aprovechamiento Rep y Deserc
Documento11 páginas
2019 Hernandez Et Al - An de in de Aprovechamiento Rep y Deserc
Marco Antonio Maciel
Aún no hay calificaciones
Archivomaterial 2020528221349
Documento26 páginas
Archivomaterial 2020528221349
Diego Mejia Diego Mejia
Aún no hay calificaciones
Hibernate Curso AME
Documento152 páginas
Hibernate Curso AME
añusqueta
Aún no hay calificaciones
Informatica Parte II 2020
Documento44 páginas
Informatica Parte II 2020
CarlosAlberto
Aún no hay calificaciones
Trabajo Final Programación 1
Documento7 páginas
Trabajo Final Programación 1
Maria Elena Cuello Hidalgo
Aún no hay calificaciones
Clase1 2 Concurrente
Documento16 páginas
Clase1 2 Concurrente
vrian v-iscaro
Aún no hay calificaciones
Com Vendedores While
Documento3 páginas
Com Vendedores While
Liliana Reyes
Aún no hay calificaciones