Investigacion

Cargado por

Crisel Ventura Amador

0% encontró este documento útil (0 votos)

11 vistas3 páginas

Derechos de autor

Formatos disponibles

DOCX, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

11 vistas3 páginas

Investigacion

Cargado por

Crisel Ventura Amador

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 3

Buscar dentro del documento

(Instituto Tecnológico De las

Américas)

Marianne Mateo
2019-7890
Jostin Jose Cepeda
2019-8082

Materia: Programación Paralela

Fecha: 18/08/2021

Tema: Investigación sobre el modelo Hadoop y

MapReduce
Modelo MapReduce

MapReduce + Hadoop es un modelo de programación que es utilizado por

disímiles empresas que se dedican al desarrollo de software en el mundo,
entre ellas Google y Yahoo. Dicho modelo brinda soporte a la computación
paralela sobre grandes colecciones de datos (Big Data) en grupos de
computadoras.
El presente artículo está enfocado en la evaluación de esta interesante
técnica para la recuperación eficiente de información sobre grandes
volúmenes de datos. Por su parte dicha técnica permite establecer las
capacidades necesarias con las que debe contar una base de datos de
información masiva, tanto desde la perspectiva de almacenamiento y
técnicas de indexación, como de distribución de las consultas, escalabilidad
y rendimiento en ambientes heterogéneos.

Paradigma MapReduce
Existen diversas definiciones para este modelo, por tanto, se adoptará la
posición que asume el Centro de Investigación Científica y Tecnológica de
la Escuela Superior Politécnica del Litoral, Guayaquil, Ecuador, debido a
que es una de las instituciones latinoamericanas que más ha publicado
acerca de este tema en revistas científicas.
En una de sus tesis de pregrado se plantea que MapReduce es un modelo
de programación distribuida que permite el procesamiento masivo de datos
a gran escala de manera paralela. Desarrollado como alternativa escalable y
tolerante a fallos para el procesamiento masivo de datos (Parrales Bravo, y
otros, 2010). Dicho modelo se ha inspirado en las funciones MAP y reduce
utilizadas comúnmente en los lenguajes de programación, aunque con
propósitos totalmente distintos. Por otra parte, es defendido por muchos
como una alternativa muy simple para implementar concurrencia (Dean, y
otros, 2004).
Hadoop

Hadoop es una implementación Open Source de MapReduce para el

procesamiento de grandes clústeres de datos; actualmente tiene el liderazgo
en términos de popularidad para analizar enormes cantidades de
información. El mismo ha sido utilizado exitosamente por grandes
compañías para el almacenamiento y procesamiento de conjuntos de datos
inmensos (Borthakur, 2011) (Abdullah, 2010) y (Sarkar, 2013).

Hadoop está inspirado en el proyecto de Google File System (Ghemawat, y

otros, 2003) y en el paradigma de programación MapReduce. Hadoop está
compuesto de tres piezas fundamentales: Hadoop Distributed File System
(HDFS), Hadoop MapReduce y Hadoop Common.

El trabajo de Hadoop MapReduce consiste principalmente en dos funciones

definidas por el usuario: map y reduce. La entrada de un trabajo Hadoop
MapReduce es un conjunto de pares clave-valor (k, v) y la función map se
llama para cada uno de estos pares. La función map produce cero o más
pares de clave-valor (k’, v’) intermedios. El framework agrupa estos
valores por medio de k’ y llama la función reduce para cada grupo. Por
último, la función reduce produce cero o más resultados agregados. La
belleza de Hadoop MapReduce es que los usuarios por lo general solo
tienen que definir las funciones map y reduce. El framework se encarga de
todo lo demás, como es la paralelización y fallos (Dittrich, y otros, 2012).

También podría gustarte

Big Data
Documento15 páginas
Big Data
junior percy inga aguilar
100% (1)
Cuestionario Del Iot
Documento52 páginas
Cuestionario Del Iot
Alejandro Almanzar
71% (190)
Pensamiento Eje 3
Documento30 páginas
Pensamiento Eje 3
Plinio Ramirez
Aún no hay calificaciones
Introducción A Scala
Documento72 páginas
Introducción A Scala
gustavo12g
Aún no hay calificaciones
Big Data
Documento68 páginas
Big Data
mauge fernandez
Aún no hay calificaciones
1er Parcial (20 PTS) - Revisión Del Intento
Documento7 páginas
1er Parcial (20 PTS) - Revisión Del Intento
Crisel Ventura Amador
Aún no hay calificaciones
Práctica - Leyes Eléctricas Circuito Simple CD (5 PTS) - Revisión Del Intento
Documento5 páginas
Práctica - Leyes Eléctricas Circuito Simple CD (5 PTS) - Revisión Del Intento
Crisel Ventura Amador
Aún no hay calificaciones
0308 - Protagonistas de La IA
Documento8 páginas
0308 - Protagonistas de La IA
Crisel Ventura Amador
Aún no hay calificaciones
Tarea #4 - PDN - Planeacion y Justificacion Del Negocio
Documento8 páginas
Tarea #4 - PDN - Planeacion y Justificacion Del Negocio
Crisel Ventura Amador
Aún no hay calificaciones
Tarea #5 - PDN - Modelo Del Plan o Naturaleza Del Proyecto
Documento10 páginas
Tarea #5 - PDN - Modelo Del Plan o Naturaleza Del Proyecto
Crisel Ventura Amador
Aún no hay calificaciones
Proyecto Final de Laboratorio 1
Documento7 páginas
Proyecto Final de Laboratorio 1
Crisel Ventura Amador
Aún no hay calificaciones
Respuestas
Documento13 páginas
Respuestas
Javier Zaragosi
Aún no hay calificaciones
Consulta Hodoop MapReduce - V2
Documento12 páginas
Consulta Hodoop MapReduce - V2
Brayan Castillo
Aún no hay calificaciones
BigData Tools
Documento10 páginas
BigData Tools
Camilo Alexander Calderón
Aún no hay calificaciones
Big Data
Documento15 páginas
Big Data
bernuy454
Aún no hay calificaciones
Hadoop
Documento105 páginas
Hadoop
Pame Pineda
Aún no hay calificaciones
Universidad Nacional Mayor de San Marcos: Base de Datos: BIG DATA
Documento22 páginas
Universidad Nacional Mayor de San Marcos: Base de Datos: BIG DATA
Diego Alcides Carrión Ramos
Aún no hay calificaciones
Comandos Hadoop
Documento2 páginas
Comandos Hadoop
martinezec
Aún no hay calificaciones
Tu Sitioen 5 Horas PDFV21
Documento31 páginas
Tu Sitioen 5 Horas PDFV21
Vanessa Ortega
Aún no hay calificaciones
Hive
Documento100 páginas
Hive
Mario Molina
Aún no hay calificaciones
Máster Telefonica en Big Data y Business Analytics - Guía Completa - 8a Edición
Documento33 páginas
Máster Telefonica en Big Data y Business Analytics - Guía Completa - 8a Edición
jplizcano
Aún no hay calificaciones
DIPLOMADO IN BIG DATA and Business Analytics
Documento2 páginas
DIPLOMADO IN BIG DATA and Business Analytics
wilfredorangelucv
Aún no hay calificaciones
Material Completo - Analítica de Datos
Documento59 páginas
Material Completo - Analítica de Datos
María Luisa Romero García
Aún no hay calificaciones
Big Data
Documento6 páginas
Big Data
Salomón N Flores B
Aún no hay calificaciones
Hadoop PDF
Documento12 páginas
Hadoop PDF
ruben
Aún no hay calificaciones
2 - Introduccion Al Ecosistema Apache Hadoop
Documento14 páginas
2 - Introduccion Al Ecosistema Apache Hadoop
Rey Castillo Rivera
Aún no hay calificaciones
HDFS
Documento6 páginas
HDFS
Chuyo Enkil Yeah
Aún no hay calificaciones
Manual Big Data
Documento61 páginas
Manual Big Data
manuel
Aún no hay calificaciones
HBase
Documento102 páginas
HBase
Rocío Canizares
Aún no hay calificaciones
Técnicas de Migración EGSBD
Documento13 páginas
Técnicas de Migración EGSBD
widres8
Aún no hay calificaciones
Caso Vestas
Documento5 páginas
Caso Vestas
Willy Campos Lozada
Aún no hay calificaciones
18.big Data
Documento13 páginas
18.big Data
amaia
Aún no hay calificaciones
Big Data
Documento6 páginas
Big Data
Omar David Hernadez Abdala
Aún no hay calificaciones
Vidama 04 Act 1
Documento8 páginas
Vidama 04 Act 1
afahcompany
Aún no hay calificaciones
Parcial 20210707
Documento7 páginas
Parcial 20210707
Софи Шкрум
Aún no hay calificaciones
Sistema de Recomendación de Películas
Documento8 páginas
Sistema de Recomendación de Películas
maestria20090
Aún no hay calificaciones