Nucleo de Hadoop

Cargado por

Juan Camilo Mendoza Maestre

0% encontró este documento útil (0 votos)

4 vistas2 páginas

Derechos de autor

Formatos disponibles

DOCX, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

4 vistas2 páginas

Nucleo de Hadoop

Cargado por

Juan Camilo Mendoza Maestre

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 2

Buscar dentro del documento

NUCLEO DE HADOOP

El proyecto central de hadoop consiste en una forma de almacenar datos conocidos como el
sistema de archivos distribuido de hadoop o HDFS. Y una forma de procesar datos con
MapReduce. El concepto clave es dividimos los datos y los almacenamos en la colección de
máquinas conocida como clúster. Luego, cuando queremos procesar los datos, los procesamos
donde realmente estan almacenados.

en lugar de recuperar los datos de una servidor central, los datos ya estan en el clúster por lo que
podemos procesarlos en el lugar. Puede agregar maquinas al clúster a medida que crecen la
cantidad de datos que estan almacenados. Y de hecho, muchas personas comienzan con solo unas
pocas maquinas agregan más a medida que las necesitan. Las maquinas en su clúster no necesitan
será nada particularmente de alto nivel. Aunque la mayoría de los clústeres se constituyen con
servidores montados en crack, por lo general son servidores de gama media, en lugar de equipos
de gama alta.

MapReduce
Hadoop MapReduce es un paradigma de procesamiento de datos caracterizado por dividirse
en dos fases o pasos diferenciados: Map y Reduce.

Qué es MapReduce
MapReduce es un framework, un modelo de programación que Google lanzó en el
año 2004. Lo realmente innovador en este caso es que permite realizar
computación en paralelo. Explicado de forma sencilla, en lugar de realizar el
procesamiento desde una única máquina, distribuye las enormes cantidades de
datos entre varios servidores que los procesan al unísono.
Para ello, por cada cluster existente, MapReduce cuenta con:
Un servidor principal, el maestro, el que distribuye los datos que recibe.
Varios servidores secundarios, los esclavos, los que procesan esos datos a la vez,
siguiendo las órdenes del servidor maestro.
Este sistema reduce exponencialmente el tiempo en el que se desarrolla el
procesamiento de datos. Es el equivalente a tener a una sola persona
desempeñando una labor o tener un equipo de trabajo, con un jefe que recibe las
tareas y las distribuye entre sus subordinados.
en este archivo se incluyen los ejemplos siguientes:

Muestra Descripción
aggregatewordcount Cuenta las palabras de los archivos de entrada.
aggregatewordhist Calcula el histograma de las palabras de los archivos de entrada.
bbp Usa una fórmula Bailey-Borwein-Plouffe para calcular los dígitos exactos de Pi.
dbcount Cuenta los registros de vistas de página almacenados en una base de datos.
distbbp Usa una fórmula de tipo BBP para calcular los bits exactos de Pi.
grep Cuenta las coincidencias de una expresión regular en la entrada.
join Realiza una unión de conjuntos de datos ordenados con particiones equiparables.
multifilewc Cuenta las palabras de varios archivos.
pentomino Programa para la colocación de mosaicos con el fin de encontrar soluciones a problemas de
pentominó.
pi Calcula Pi mediante un método cuasi Monte Carlo.
randomtextwriter Escribe 10 GB de datos de texto aleatorios por nodo.
randomwriter Escribe 10 GB de datos aleatorios por nodo.
secondarysort Define una ordenación secundaria para la fase de reducción.
sort Ordena los datos escritos por el escritor aleatorio.
sudoku Un solucionador de sudokus.
teragen Genera datos para la ordenación de terabytes (terasort).
terasort Ejecuta la ordenación de terabytes (terasort).
Tera valídate Comprueba los resultados de la ordenación de terabytes (terasort).
wordcount Cuenta las palabras de los archivos de entrada.
wordmean Cuenta la longitud media de las palabras de los archivos de entrada.
wordmedian Cuenta la mediana de las palabras de los archivos de entrada.
wordstandarddeviation Cuenta la desviación estándar de la longitud de las palabras de los archivos de entrada.

También podría gustarte

La programación JavaScript
De Everand
La programación JavaScript
Preston Prescott
Aún no hay calificaciones
Aprende a Programar en R - 2ª Edición
De Everand
Aprende a Programar en R - 2ª Edición
Patricia García Montero
Aún no hay calificaciones
Ponentes Core
Documento21 páginas
Ponentes Core
Guillermo Rambla
Aún no hay calificaciones
Teoria M4
Documento41 páginas
Teoria M4
Luis Molina Reinoso
Aún no hay calificaciones
Práctica 2.1 Investigación Sobre Hadoop
Documento6 páginas
Práctica 2.1 Investigación Sobre Hadoop
fredosanzz1999
Aún no hay calificaciones
INTEGRANTES
Documento6 páginas
INTEGRANTES
Joel Guillen Iparraguirre
Aún no hay calificaciones
Spark para Dummies
Documento6 páginas
Spark para Dummies
jesusdaa1
Aún no hay calificaciones
4 - HDFS
Documento8 páginas
4 - HDFS
kinyo12
Aún no hay calificaciones
CD - M8 AE1 Contenidos - 2023
Documento12 páginas
CD - M8 AE1 Contenidos - 2023
li_sisay
Aún no hay calificaciones
Resumen TASD - 2do Parcial
Documento17 páginas
Resumen TASD - 2do Parcial
German Jugo
Aún no hay calificaciones
Taller Big Data
Documento6 páginas
Taller Big Data
rocky alberto
Aún no hay calificaciones
Datos Estructuras y Algoritmos
Documento119 páginas
Datos Estructuras y Algoritmos
Juan
Aún no hay calificaciones
Análisis de Hadoop y Map/Reduce
Documento12 páginas
Análisis de Hadoop y Map/Reduce
jessicapaumier
Aún no hay calificaciones
Sesion3 HDFS
Documento18 páginas
Sesion3 HDFS
Aaron Olivera Torres
Aún no hay calificaciones
04 Lab1 - Ejercicios de Prolog
Documento58 páginas
04 Lab1 - Ejercicios de Prolog
Gol D Roger
Aún no hay calificaciones
Hadoop Vs Spark
Documento21 páginas
Hadoop Vs Spark
Jamil Cerezo
Aún no hay calificaciones
Pregunta 2
Documento3 páginas
Pregunta 2
Keren Mejia Herrera
Aún no hay calificaciones
01 Hadoop A
Documento36 páginas
01 Hadoop A
RONALD NICOLAS SAENZ CHUQUI
Aún no hay calificaciones
HDFS paraleliza datos
Documento19 páginas
HDFS paraleliza datos
Angel Pérez Souffront
Aún no hay calificaciones
Instalación de Spatial
Documento52 páginas
Instalación de Spatial
Christiam
Aún no hay calificaciones
Unidad 2 Arquitectura Del Gestor
Documento42 páginas
Unidad 2 Arquitectura Del Gestor
mralero
Aún no hay calificaciones
Hadoop
Documento36 páginas
Hadoop
Javier Hurtado
Aún no hay calificaciones
HADOOP-Carac
Documento15 páginas
HADOOP-Carac
emerson vs
Aún no hay calificaciones
Clase 4 - Herramientas Big Data Nov 15
Documento31 páginas
Clase 4 - Herramientas Big Data Nov 15
anamar.prilop
Aún no hay calificaciones
Jose Castillo 2018210061 Tarea5 Introduccion Al Ecosistema Apache Hadoop
Documento4 páginas
Jose Castillo 2018210061 Tarea5 Introduccion Al Ecosistema Apache Hadoop
Rey Castillo Rivera
Aún no hay calificaciones
Arquitectura de La Información
Documento18 páginas
Arquitectura de La Información
javier
Aún no hay calificaciones
Apache Hadoop
Documento27 páginas
Apache Hadoop
Marcelo Espinoza
Aún no hay calificaciones
Separata03 PDF
Documento20 páginas
Separata03 PDF
VALERIA ALEXANDRA VILLACORTA LANDEO
Aún no hay calificaciones
Instalar XAMPP y crear BD PHP
Documento31 páginas
Instalar XAMPP y crear BD PHP
Alejandro Hernandez
Aún no hay calificaciones
Apache Drill
Documento9 páginas
Apache Drill
AXEL IRIARTE
Aún no hay calificaciones
Alta Disponibilidad de Hadoop Con Linux
Documento9 páginas
Alta Disponibilidad de Hadoop Con Linux
Nina
Aún no hay calificaciones
Exposicion Mongo
Documento36 páginas
Exposicion Mongo
Pedrito Fernandez
Aún no hay calificaciones
Terminologia Basica de Bases de Datos
Documento3 páginas
Terminologia Basica de Bases de Datos
valentina
100% (2)
Que Es Hadoop
Documento3 páginas
Que Es Hadoop
snoopdock
Aún no hay calificaciones
Requisitos Hardware Big Data
Documento4 páginas
Requisitos Hardware Big Data
oscar calsina laura
Aún no hay calificaciones
04 Arquitecturas Big Data
Documento23 páginas
04 Arquitecturas Big Data
Esteban
100% (1)
rgncWI4IUtCSOqAp - CC - 2S7UvchCP9-6U-Guia de Los Comandos Mas Utilizados en Phyton
Documento11 páginas
rgncWI4IUtCSOqAp - CC - 2S7UvchCP9-6U-Guia de Los Comandos Mas Utilizados en Phyton
Héctor Rondón Olivera
Aún no hay calificaciones
Big Data Fundamentals - Ma Afq6e2s
Documento6 páginas
Big Data Fundamentals - Ma Afq6e2s
ALEX ALBERT ZUÑIGA MANRIQUE
Aún no hay calificaciones
Pear
Documento6 páginas
Pear
cuestionesmil
Aún no hay calificaciones
Base de Datos Transaccional Usando Hive Sobre Hadoop
Documento8 páginas
Base de Datos Transaccional Usando Hive Sobre Hadoop
fjmerchan21
Aún no hay calificaciones
002 Explicacion 2 - en PDF
Documento18 páginas
002 Explicacion 2 - en PDF
Alexis Rodriguez
Aún no hay calificaciones
Clase 4 - Modelo de Programación Mapreduce
Documento25 páginas
Clase 4 - Modelo de Programación Mapreduce
FranklinCncr
Aún no hay calificaciones
Separata SQL2014 Implementacion Final PDF
Documento131 páginas
Separata SQL2014 Implementacion Final PDF
RichardAndrade
Aún no hay calificaciones
Ecosistema Hadoop La
Documento8 páginas
Ecosistema Hadoop La
gbevolo
Aún no hay calificaciones
Taller1 Middlewares
Documento4 páginas
Taller1 Middlewares
samira ocampo
Aún no hay calificaciones
Programación Paralela en Fortran
Documento6 páginas
Programación Paralela en Fortran
Daniel Romero A
Aún no hay calificaciones
Mongodb PDF
Documento77 páginas
Mongodb PDF
Ayz Ayz
Aún no hay calificaciones
Big Data WorkShop
Documento74 páginas
Big Data WorkShop
Soledad Llashag
Aún no hay calificaciones
Catalogo de Comandos Linux
Documento19 páginas
Catalogo de Comandos Linux
Eder Santiago Salazar
Aún no hay calificaciones
03 Lectura A
Documento5 páginas
03 Lectura A
kathy Montero
Aún no hay calificaciones
Algoritmo Paralelo para Procesar Archivos de Texto
Documento31 páginas
Algoritmo Paralelo para Procesar Archivos de Texto
Jaime Soto
Aún no hay calificaciones
Big Data
Documento15 páginas
Big Data
bernuy454
Aún no hay calificaciones
MongoDB Desde Cero PDF
Documento123 páginas
MongoDB Desde Cero PDF
Emmanuel Lopez
Aún no hay calificaciones
Practica2 - Archivo de Intercambio Nachos 2023
Documento3 páginas
Practica2 - Archivo de Intercambio Nachos 2023
luis isai perez lopez
Aún no hay calificaciones
Instalación y configuración de CouchDB en CentOS 8
Documento7 páginas
Instalación y configuración de CouchDB en CentOS 8
YamilexCarvajal
Aún no hay calificaciones
015-NodeJS & ExpressJS
Documento6 páginas
015-NodeJS & ExpressJS
Seguridad Privada
Aún no hay calificaciones
Tutoría Magistral - ET2 Backend (Creación de La BD, Conexión A La BD, Modelos y Rutas en El Backend, CRUD)
Documento44 páginas
Tutoría Magistral - ET2 Backend (Creación de La BD, Conexión A La BD, Modelos y Rutas en El Backend, CRUD)
aurinwhosnk
Aún no hay calificaciones
Ebook: Herramientas de Visualización de Datos
Documento26 páginas
Ebook: Herramientas de Visualización de Datos
BBVA Innovation Center
100% (1)
Bases de Datos orientadas a Documentos: NoSQL, MongoDB
Documento10 páginas
Bases de Datos orientadas a Documentos: NoSQL, MongoDB
Blanca Palacios
Aún no hay calificaciones
Bases de Datos con MySQL
De Everand
Bases de Datos con MySQL
Ángel Arias
Calificación: 4 de 5 estrellas
4/5 (6)
Proyecto 7.0
Documento68 páginas
Proyecto 7.0
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Ciclo de Vida de Sistemas
Documento3 páginas
Ciclo de Vida de Sistemas
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Sistema de Informacion
Documento8 páginas
Sistema de Informacion
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
La Salud Mental
Documento4 páginas
La Salud Mental
Juan Camilo Mendoza Maestre
100% (1)
017 Sres Rafael Guerrero y Juan Maestre - Evaluadores de Proyecto
Documento1 página
017 Sres Rafael Guerrero y Juan Maestre - Evaluadores de Proyecto
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Que Es Xampp
Documento1 página
Que Es Xampp
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Informe de La Defensoría Del Pueblo
Documento4 páginas
Informe de La Defensoría Del Pueblo
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Las Tic 3
Documento36 páginas
Las Tic 3
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Proyecto Swirs
Documento3 páginas
Proyecto Swirs
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Diagrama de Gant
Documento1 página
Diagrama de Gant
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Diagrama (ER)
Documento1 página
Diagrama (ER)
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Avance de Calculadora
Documento1 página
Avance de Calculadora
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Leyes
Documento4 páginas
Leyes
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Sistema Gestor de Base de Datos
Documento8 páginas
Sistema Gestor de Base de Datos
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Presentacion de La Comunicacion
Documento6 páginas
Presentacion de La Comunicacion
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Parcial Juan Java
Documento1 página
Parcial Juan Java
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Dividor de Otro
Documento1 página
Dividor de Otro
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Charla RRHH - 02 de Marzo 2017
Documento38 páginas
Charla RRHH - 02 de Marzo 2017
Nayla
Aún no hay calificaciones
5 meses juntos felicidad amor
Documento2 páginas
5 meses juntos felicidad amor
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Https 2
Documento1 página
Https 2
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Constitución Trabajo
Documento2 páginas
Constitución Trabajo
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Fase Iv
Documento48 páginas
Fase Iv
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Mantenimientos
Documento4 páginas
Mantenimientos
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Gention Hospitalaria
Documento48 páginas
Gention Hospitalaria
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Trabajo Cultura
Documento15 páginas
Trabajo Cultura
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Que Es Software y La Ingeniería Del Softwar1
Documento3 páginas
Que Es Software y La Ingeniería Del Softwar1
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Control
Documento3 páginas
Control
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Mantenimientos
Documento5 páginas
Mantenimientos
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Parcial Software
Documento3 páginas
Parcial Software
Juan Camilo Mendoza Maestre
Aún no hay calificaciones
Funciones en C: menos de
Documento32 páginas
Funciones en C: menos de
eleno
Aún no hay calificaciones
Manual 03 s3 U1 PC
Documento14 páginas
Manual 03 s3 U1 PC
Dannis Omar Campos Zavaleta
Aún no hay calificaciones
DB 2 A 3 Z 90
Documento459 páginas
DB 2 A 3 Z 90
Joseph Portocarrero Valdivia
Aún no hay calificaciones
Plan Docente
Documento44 páginas
Plan Docente
joshue carbus
Aún no hay calificaciones
2.acta Constitucion Del Proyecto
Documento4 páginas
2.acta Constitucion Del Proyecto
Javier Chandía
Aún no hay calificaciones
Sistemas Operativos
Documento44 páginas
Sistemas Operativos
Daniielita Rodriguez
Aún no hay calificaciones
Arreglos Vectores y Matrices
Documento5 páginas
Arreglos Vectores y Matrices
Romel Arango Daza
0% (1)
EMPRENDIMIENTO
Documento20 páginas
EMPRENDIMIENTO
Sley David Murillo Peña
Aún no hay calificaciones
Reporte Kotlin
Documento12 páginas
Reporte Kotlin
Gregorio HernandezAparicio
Aún no hay calificaciones
Teoría de Estructuras Cíclicas - Borrador
Documento19 páginas
Teoría de Estructuras Cíclicas - Borrador
Camila Zegarra
Aún no hay calificaciones
Visual Basic - Programacion I (Partes)
Documento20 páginas
Visual Basic - Programacion I (Partes)
Mery Christma
Aún no hay calificaciones
CursoAsterisk AGI
Documento22 páginas
CursoAsterisk AGI
Erik Narvaez
Aún no hay calificaciones
Foro 1 Trabajo de Titulacion PDF
Documento5 páginas
Foro 1 Trabajo de Titulacion PDF
Eddy Pardo Calva
Aún no hay calificaciones
Distribucion de Plantas Industriales
Documento9 páginas
Distribucion de Plantas Industriales
Daniel Flores
Aún no hay calificaciones
Requerimientos
Documento22 páginas
Requerimientos
Alexandra Chisaguano
Aún no hay calificaciones
Hosting 2
Documento2 páginas
Hosting 2
Marcus
Aún no hay calificaciones
Proveedores de Datos
Documento2 páginas
Proveedores de Datos
JUAN CARLOS TORRES MORLAN
Aún no hay calificaciones
Plan de Desarrollo de Software Maria
Documento21 páginas
Plan de Desarrollo de Software Maria
Maria Montilla
100% (1)
Presentacion Sesión 6-1
Documento49 páginas
Presentacion Sesión 6-1
Jose Daniel Maza
100% (1)
Dso Final 2016 NO Continua
Documento7 páginas
Dso Final 2016 NO Continua
Francisco Federico Garcia Crespi
Aún no hay calificaciones
Manifiesto Agil
Documento7 páginas
Manifiesto Agil
uR Mal
Aún no hay calificaciones
Lista de Acrónimos de Oracle Database
Documento15 páginas
Lista de Acrónimos de Oracle Database
Domenico Ferraguto Plaza
Aún no hay calificaciones
Gestión del personal de TI y seguridad informática
Documento1 página
Gestión del personal de TI y seguridad informática
Melvin Cusme
Aún no hay calificaciones
Instalación SPSS V27 paso a paso
Documento12 páginas
Instalación SPSS V27 paso a paso
MARIA AZUCENA CRUZADO TOLEDO
Aún no hay calificaciones
Consultoría en Modelos de Seguridad de Desarrollo de Software
Documento13 páginas
Consultoría en Modelos de Seguridad de Desarrollo de Software
zaider garcia
Aún no hay calificaciones
02 - Information Gathering
Documento50 páginas
02 - Information Gathering
HENRY MARCELO NIVICELA BARRETO
Aún no hay calificaciones
Ejemplos de Programas para Microcontrolador PIC
Documento4 páginas
Ejemplos de Programas para Microcontrolador PIC
Ivan Velasquez Irineo
Aún no hay calificaciones
Ciclo For en C
Documento7 páginas
Ciclo For en C
Andree Ovalle
Aún no hay calificaciones
Uso de Arreglos
Documento5 páginas
Uso de Arreglos
Karla Carmona
Aún no hay calificaciones
1 Entrega MB
Documento7 páginas
1 Entrega MB
Mauricio Baquero Soto
Aún no hay calificaciones