Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Hive
PARTE DE LA FORMACIÓN BIG DATA ENGINEER DE BIG DATA
ACADEMY PERÚ
Map
Reduce v2
Map Motor de
Reduce v1 procesamiento
Map
Spark
Reduce v2
Map Motor de Motor de
Reduce v1 procesamiento procesamiento
Driver
Si este nodo falla, perdemos toda la metadata de Hive y
por lo tanto todas las tablas
Distribución de los servicios de Hive:
Modo Local
<<Master>> <<Master>>
Metastore
Database
Metastore
Database
La base de datos del metastore está separada del resto de
servicios. De esta manera no dependemos de un único
<<Master>> punto de falla.
Metastore
HiveServer2
En el modo local las base de datos del Metastore puede
Driver
configurarse para que trabaje con copias de seguridad.
Distribución de los servicios de Hive:
Modo Remoto
<<Master>> <<Master>>
Metastore
Database
Metastore
Database
Aquí cada servicio se ejecuta sobre su propio nodo.
<<Master>>
Es el modo más recomendado de ejecución para un
Metastore clúster productivo.
<<Master>>
HiveServer2
Driver
¿Cómo funciona Hive?
Los clientes envían
sentencias SQL Para que el servidor Hive pueda entender
que archivo HDFS está asociado a qué
Driver
tabla Hive consulta en la base de datos
de metadatos
Codifiquemos…
Programación avanzada
Programación avanzada
Codifiquemos…
Resumen
Resumen
Hablemos…