Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Introducción
1.1. ¿Qué es Hive?
Hive es una infraestructura de almacenamiento de datos basada en Apache Hadoop. Hadoop
proporciona capacidades masivas de expansión y tolerancia a fallos para el almacenamiento y
procesamiento de datos en hardware común.
Hive está diseñado para facilitar la resumen de datos, las consultas ad-hoc y el análisis de grandes
volúmenes de datos. Proporciona SQL, lo que permite a los usuarios realizar consultas ad-hoc,
resumen y análisis de datos fácilmente. Al mismo tiempo, el SQL de Hive ofrece a los usuarios
múltiples lugares para integrar su propia funcionalidad para realizar análisis personalizados, como
Funciones Definidas por el Usuario (UDFs)
1 join_table :
2 table_reference [ INNER ] JOIN table_factor [ join_condition ]
3 | table_reference { LEFT | RIGHT | FULL } [ OUTER ] JOIN table_reference
join_condition
4 | table_reference LEFT SEMI JOIN table_reference join_condition
5 | table_reference CROSS JOIN table_reference [ join_condition ]
INNER JOIN
CROSS JOIN
3. Ejemplos
Se definirán dos tablas para llevar a cabo los ejemplos:
autor_id nombre
1 García
2 Borges
3 Allende
Cuadro 1: Autores
Cuadro 2: Libros
nombre titulo
García Cien años de soledad
Borges Ficciones
Allende La casa de los espíritus
Borges El Aleph
Allende Eva Luna
2
Consultas JOIN en Hive
El resultado de la consulta serían todos los autores y sus libros, incluso si no tienen un libro:
nombre titulo
García Cien años de soledad
Borges Ficciones
Allende La casa de los espíritus
Borges El Aleph
Allende Eva Luna
El resultado de la consulta serían todos los libros y sus autores, incluso si un libro no tiene un
autor definido:
nombre titulo
García Cien años de soledad
Borges Ficciones
Allende La casa de los espíritus
Borges El Aleph
Allende Eva Luna
NULL Sobre héroes y tumbas
El resultado de la consulta serían todos los autores y todos los libros, independientemente de si
hay una coincidencia:
3
Consultas JOIN en Hive
nombre titulo
García Cien años de soledad
Borges Ficciones
Allende La casa de los espíritus
Borges El Aleph
Allende Eva Luna
NULL Sobre héroes y tumbas
nombre
García
Borges
Allende
El resultado de la consulta sería (Solo mostrando las primeras filas para ahorrar espacio):
nombre titulo
García Cien años de soledad
García Ficciones
García La casa de los espíritus
... ...