Está en la página 1de 22

Maestría en Tecnologías de Información y comunicación

Base de datos
HBASE

Docente
Alvaro Ortiz

Estudiante
• John Jairo Daza Rojas

Universidad Distrital Francisco José de Caldas


Agenda
Concepto

Evolución

Características

Modelo de datos

Arquitectura

Laboratorio practico

23/05/2018 Universidad Distrital Francisco José de Caldas 2


[HBASE]
HBase es un sistema de gestión de bases de datos no relacionales
orientado a columnas que se ejecuta sobre el Sistema de archivos
distribuidos de Hadoop (HDFS).

Hbase es un almacén de datos orientado a columnas de tipo clave-valor y


basado en Hadoop y HDFS.

Es adecuado para el procesamiento de datos en tiempo real o el acceso


aleatorio de lectura / escritura a grandes volúmenes de datos.

Puede ser integrado con diversas herramientas de analítica de datos


e inteligencia de negocios
1/13/20 Universidad Distrital Francisco José de Caldas 3
El objetivo del proyecto HBase es el almacenamiento de tablas muy
grandes, de billones de filas por millones de columnas, para ello
almacena los datos por pares de clave-valor. Buscar por claves en
HBase es muy rápido. La escritura también porque se realiza
prácticamente en memoria.

Actualmente, Hbase se utiliza en sitios web orientados a datos,


incluyendo la plataforma de mensajería de Facebook

1/13/20 Universidad Distrital Francisco Jose de Caldas 4


Evolución
Apache HBase empezó como un proyecto de la empresa Powerset para
satisfacer sus necesidades de proceso masivo de datos de las búsquedas en
lenguaje natural. Actualmente es un proyecto Apache de nivel superior.

Universidad Distrital Francisco José de Caldas 1/13/20


5
Características
• HBase es lineal escalable.
• Fuerte consistencia en lectura y escrituras.
• Se integra con Hadoop, tanto como un origen y un destino.
• Tiene fácil API de java para el cliente.
• Proporciona replicación de datos en clústeres.

1/13/20 Universidad Distrital Francisco Jose de Caldas 6


Modelo de datos
• Tabla: es un conjunto de filas.
• Columna familia es una colección de columnas, con
valores que se almacenan fisícamente en el mismo
archivo
• Columna es una recopilación de los principales pares
de valores.
• Fila: está compuesta de la clave y una o más columnas con
valores asociados a ella. Las filas están ordenadas
alfabeticamente por la clave cuando son almacenadas.
• Celda: es la combinación de una fila con una familia de
columnas y un qualifier. Contiene un valor y un timestamp que
representa la versión del valor.
• Qualifier: se inserta en una familia de columnas como una
columna, generando así un índice para una parte de los datos.
Las filas no tienen porque tener el mismo número de qualifiers.
• Timestamp: es escrito con cada valor y actua como identificador
de un versión.

1/13/20 Universidad Distrital Francisco José de Caldas 7


Arquitectura

1/13/20 Universidad Distrital Francisco José de Caldas 8


¿Quien usa Hbase?
• Adobe : Tienen alrededor de 30 nodos que ejecutan HDFS
• Yahoo! : lo utiliza para consultar documentos duplicados con tráfico
en tiempo real.
• Apache : para su Wiki
• Facebook : Facebook usa HBase para alimentar su infraestructura
de mensajes.
• Mozilla : Para su colección de documentos.
• Mendeley : Mendeley está creando una plataforma para que los
investigadores colaboren y compartan sus investigaciones en línea.
HBase nos está ayudando a crear la colección de documentos de
investigación más grande del mundo y se está utilizando para
almacenar todos nuestros datos importados sin procesar.
• Twitter : Twitter ejecuta HBase en todo su clúster de Hadoop.
Hbase
• proporciona una copia de seguridad distribuida de lectura /
escritura.

Universidad de los Llanos- Grupo de investigación en


1/13/20 9
tecnologías abiertas
Laboratorio
• Cloudera es una compañía que
proporciona software basado
en Apache Hadoop.
• Maquina virtual
Incluye todo lo que se necesita
para trabajar con HBASE.
• puede obtener fácilmente un clúster de
CDH de un solo nodo ejecutándose
dentro de un entorno virtual.
• Los usuarios podrían usar esta VM
para su propio aprendizaje personal,
creando rápidamente aplicaciones en
un clúster dedicado o para muchos
otros fines.

1/13/20 Universidad Distrital Francisco Jose de Caldas 10


Comandos Básicos shell

• Permite la conexión con Hbase

1/13/20 Universidad Distrital Francisco Jose de Caldas 11


Create- crear tabla

• Puede crear una tabla con el comando create, aquí hay que especificar el nombre
de la tabla y la columna nombre de la Familia.
• A continuación, se muestra un esquema de una tabla llamada emp. Tiene dos
columnas las familias: "datos personales" y "datos profesionales".

1/13/20 Universidad Distrital Francisco Jose de Caldas 12


List- Listar tablas

• Es un comando que se utiliza para obtener la lista de todas las


tablas de HBase.

1/13/20 Universidad Francisco Jose de Caldas 13


Put- inserción datos

• Ejecucion

1/13/20 Universidad Distrital Francisco Jose de Caldas 14


Scan- Muestra contenido de la tabla

• Ejecutamos scan para la tabla creada

1/13/20 Universidad Distrital Francisco Jose de Caldas 15


Put- Actualizar datos

• puede actualizar un valor de la celda utilizando comando put. Para


ello, sólo tienes que seguir la misma sintaxis y mencionar el nuevo
valor como se muestra a continuación.

1/13/20 Universidad Distrital Francisco José de Caldas 16


Put- Actualizar datos
• El siguiente comando se actualizará el valor de ciudad del
empleado de nombre "Raju" a Delhi.

1/13/20 Universidad Distrital Francisco Jose de Caldas 17


Get- Leer datos de una table

1/13/20 Universidad Distrital Francisco Jose de Caldas 18


Delete- Eliminar datos
• puede eliminar una celda específica de una tabla. La sintaxis del comando es la
siguiente:

1/13/20 Universidad Distrital Francisco José de Caldas 19


Deleteall
• Mediante el "deleteall" comando, puede eliminar todas las celdas de una fila. A
continuación se muestra la sintaxis del comando deleteall.

1/13/20 Universidad Distrital Francisco Jose de Caldas 20


Referencias:
• Dummy, B. D. (01 de 2017). bigdatadummy. Obtenido de https://bigdatadummy.com/2017/01/25/hbase/:
https://bigdatadummy.com/2017/01/25/hbase/
• Facebook. (13 de 11 de 2019). https://www.facebook.com/. Obtenido de
https://www.facebook.com/notes/facebook-engineering/the-underlying-technology-of-
messages/454991608919
• Facebook. (s.f.). Facebook. Obtenido de
https://www.theregister.co.uk/2010/12/17/facebook_messages_tech/
• George, L. (2018). HBase: The Definitive Guide, 2nd Edition. US.
• HBase. (2019). https://www.sas.com/es_co/insights/big-data/hadoop.html.
• HBase. (10 de 11 de 2019). www.tutorialspoint.com. Obtenido de
https://www.tutorialspoint.com/es/hbase/hbase_overview.htm
• org, A. (2018). Apacheorg. Obtenido de http://hbase.apache.org/poweredbyhbase.html
• Vohra, D. (2017). Apache HBase Primer.
• Wikipedia. (2019). Apache_hadoop. Obtenido de https://es.wikipedia.org/wiki/Apache_Hadoop

1/13/20 Universidad Distrital Francisco José de Caldas 21


Gracias

1/13/20 Universidad Distrital Francisco Jose de Caldas 22

También podría gustarte