Hadoop

Cargado por

Felipe

0% encontró este documento útil (0 votos)

4 vistas15 páginas

Derechos de autor

Formatos disponibles

PPTX, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como PPTX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

4 vistas15 páginas

Hadoop

Cargado por

Felipe

Copyright:

Formatos disponibles

Descargue como PPTX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 15

Buscar dentro del documento

Mejoras en la programación de Hadoop

• Trabajar directamente con las Api de java es algo complejo.

• Hadoop ofrece dos soluciones que son Pig y Hive.
Pig

• Desarrollada por Yahoo para analizar grandes

volúmenes de datos.
• Se construyen programas MapReduce en
menos tiempo.
• Pig latín maneja cualquier tipo de dato.
• Es muy similar a Java con la aplicación y JVM.
• Para un modelo de consultas de alto nivel usa
SQl y para el de bajo nivel MapReduce
• Transforma los datos de entrada para producir
salidas.
• Grandes volúmenes de datos.
Hive

• Hadoop es un data warehouse y HDFS.

• Consultar datos con una sintaxis similar a
SQL es HQL.
• Desarrollada por el equipo de Facebook.
• Utiliza el concepto de base de datos
relacionales y utiliza todos los tipos
primitivos.
• Admite DDL y DML
• Grandes volúmenes de datos.
JAQL

• Donado por IBM a la comunidad de software libre.

• Lenguaje funcional y declarativo para procesar archivos JSON, CSV y XML.
• El motor de Jaql transforma las consultas en procesos MapReduce.

• Grandes volúmenes de datos

Zokeeper

• Proyecto de Apache de código

abierto, permite la sincronización
de procesos en un cluster.
• Crea un archivo en memoria en los
servidores un Znode.
• Znode es actualizada en cualquier
nodo de un cluster y registrado
para recibir información de los
cambios efectuados.
Hbase

• Base de datos columnar, ejecutado

en HDFS.
• No soporta SQL.
• Las tablas contienen filas y
columnas, una columna es una
familia.
• Las familias son guardadas por
aparte.
• Utilizado por Facebook desde el
2010.
Lucene

• Proyecto de Apache realiza

búsquedas sobre textos.
• Provee librerías para indexación y
búsqueda de texto.
• Se utiliza principalmente en motores
de búsqueda.
• No tiene función de crawling y HTML
incorporada.
• Los documento se dividen en
campos de textos y los campos se les
asocia un índice.
Oozie

• Proyecto de código abierto.

• Permite la coordinación
entre cada uno de los
procesos de flujos de trabajo.
• Permite definir acciones y
dependencias para las
acciones previamente
definidas.
Avro

• Proyecto de Apache.
• Cuando se guardan datos en
un archivo, el esquema que
define ese archivo es
guardado dentro de el.
• Para las aplicaciones es más
fácil leer estos archivos.
Cassandra

• Es una base de datos no

relacional.
• Modelo de almacenamiento
clave-valor desarrollada en
Java.
• Grandes volúmenes de datos
en forma distribuida.
• Utilizado por Twitter.
Chukwa

• Diseñado para la colección

análisis de datos a gran
escala de logs.
• Toolkit de un análisis y
monitoreo.
Flume

• Define los datos desde una

fuente a otra
localidad(Hadoop).
• Source cualquier fuente de
datos.
• Sink el destino de una
operación en especifico.
• Decorator una operación de
transformación en el flujo de
datos.

También podría gustarte

Practica 1.4.1
Documento3 páginas
Practica 1.4.1
Ricky Rodriguez
Aún no hay calificaciones
Curriculum Vitae
Documento3 páginas
Curriculum Vitae
Jeff Lima
Aún no hay calificaciones
Manual Mrtienda 5.x PDF
Documento136 páginas
Manual Mrtienda 5.x PDF
Omar Rodriguez
Aún no hay calificaciones
Encuestas Esudiante
Documento2 páginas
Encuestas Esudiante
Andres Guzman
Aún no hay calificaciones
Antecedentes y Allgoritmos
Documento11 páginas
Antecedentes y Allgoritmos
Dany CR
Aún no hay calificaciones
Automatizacion Grados Ip
Documento6 páginas
Automatizacion Grados Ip
Katerin Salinas Gálvez
Aún no hay calificaciones
3 Guia Practica Excel PDF
Documento10 páginas
3 Guia Practica Excel PDF
Yonilson Ramos Rios
Aún no hay calificaciones
Estudio de Caso 5 Seguridad y WSSRA
Documento3 páginas
Estudio de Caso 5 Seguridad y WSSRA
Daniel Martínez
Aún no hay calificaciones
¿Qué Es Microsoft Word
Documento16 páginas
¿Qué Es Microsoft Word
MERCEDES JOHANNA REYES MENDOZA
Aún no hay calificaciones
Material Uso de Mentimeter PDF
Documento14 páginas
Material Uso de Mentimeter PDF
JUDITH ORTIZ
Aún no hay calificaciones
7315 BECBM Rodamientos de Una Hilera de Bolas de Contacto Angular - 20210702
Documento4 páginas
7315 BECBM Rodamientos de Una Hilera de Bolas de Contacto Angular - 20210702
MANTENIMIENTO QUIROCORP
Aún no hay calificaciones
Cuandro Comparativo Prezzi y PPT - Ayrton - Ortiz
Documento1 página
Cuandro Comparativo Prezzi y PPT - Ayrton - Ortiz
Ayrton Ortiz
Aún no hay calificaciones
Resumen Ejecutivo Del Proyecto Impresión 3D
Documento2 páginas
Resumen Ejecutivo Del Proyecto Impresión 3D
Arlette Cruz
Aún no hay calificaciones
EXAMEN FINAL TEORIA DE COTROL - 2020.ok
Documento5 páginas
EXAMEN FINAL TEORIA DE COTROL - 2020.ok
Roberto Buelvas
Aún no hay calificaciones
Metodologia de La Programacion Cap 1
Documento10 páginas
Metodologia de La Programacion Cap 1
Rodry Mmni
Aún no hay calificaciones
Separata S2 Variables C#
Documento5 páginas
Separata S2 Variables C#
alex.pacheco.moya
Aún no hay calificaciones
Curso HP Prime
Documento9 páginas
Curso HP Prime
Luis Brayan Alejo
100% (3)
Funciones de Búsqueda y Referencia
Documento8 páginas
Funciones de Búsqueda y Referencia
PAOLA MART�NEZ MONTOYA
Aún no hay calificaciones
SAM Fusion Informe 4
Documento13 páginas
SAM Fusion Informe 4
Eduardo Garcia
Aún no hay calificaciones
Ups CT005203
Documento128 páginas
Ups CT005203
Juan Carlos Fajardo
Aún no hay calificaciones
(SCB-1001) Unidad 5 - Practica - Seguridad - Equipo 7
Documento14 páginas
(SCB-1001) Unidad 5 - Practica - Seguridad - Equipo 7
Omar Garcia HL
Aún no hay calificaciones
2021AvCLA - Instructivo, Acceso y Manejo Esencial
Documento6 páginas
2021AvCLA - Instructivo, Acceso y Manejo Esencial
Juan Dávid Fonseca cruz
Aún no hay calificaciones
La Robotica en La Agricultura
Documento18 páginas
La Robotica en La Agricultura
Luis David Milla Flores
100% (1)
Ensayo Js
Documento7 páginas
Ensayo Js
KiraKalebPortadorRodriguez
Aún no hay calificaciones
MULTIPLEXOR
Documento6 páginas
MULTIPLEXOR
Guara Lazaro pinto
Aún no hay calificaciones
A Prend Ices
Documento11 páginas
A Prend Ices
David Rodriguez
Aún no hay calificaciones
Cuestioanrio de Pruebas de Software
Documento2 páginas
Cuestioanrio de Pruebas de Software
Juan Alberto
Aún no hay calificaciones
Configuracion de QoS
Documento15 páginas
Configuracion de QoS
rbkirm
Aún no hay calificaciones
Training Brochure Split
Documento50 páginas
Training Brochure Split
Neftalí Rojas
Aún no hay calificaciones
Genially
Documento24 páginas
Genially
Augustin PURIHUAMAN LUCERO
100% (2)