Está en la página 1de 2

RESUMEN

NoSQL
En la carrera de informtica, muchos hemos aprendido que los sistemas de
bases de datos se clasifican mayormente en tres tipos: Las bases de
datos relacionales, las orientadas a objetos, y las relacionales orientadas a
objetos. Sin embargo, pronto nos dimos cuenta que, en la prctica, la mayora
de los motores de bases de datos ms populares se basan en la arquitectura
relacional, y todos ellos utilizan el lenguaje de consultas SQL (con variaciones)
para operar con los datos. Tanto es as, que SQL se convirti con el paso de los
aos en un estndar de facto, debido a su uso.
Los sistemas NoSQL intentan atacar este problema proponiendo una estructura
de almacenamiento ms verstil, aunque sea a costa de perder ciertas
funcionalidades como las transacciones que engloban operaciones en ms de
una coleccin de datos, o la incapacidad de ejecutar el producto cartesiano de
dos tablas (tambin llamado JOIN) teniendo que recurrir a la desnormalizacin
de datos.
Algunas implementaciones bien conocidas que podramos como NoSQL son:
CouchDB, MongoDB, RavenDB, Neo4j, Cassandra, BigTable, Dynamo, Riak,
Hadoop, y otras muchas.

MongoDB
MongoDB es una base de datos orientada a documentos. Esto quiere decir que
en lugar de guardar los datos en registros, guarda los datos en documentos.
Estos documentos son almacenados en BSON, que es una representacin
binaria de JSON.
Una de las diferencias ms importantes con respecto a las bases de datos
relacionales, es que no es necesario seguir un esquema. Los documentos de
una misma coleccin concepto similar a una tabla de una base de datos
relacional -, pueden tener esquemas diferentes.

CASSANDRA
Es una base de datos NoSQL distribuida y basada en un modelo de
almacenamiento de clave-valor, escrita en Java. Permite grandes volmenes
de datos en forma distribuida. Por ejemplo, lo usa Twitter para su plataforma. Su
objetivo principal es la escalabilidad lineal y la disponibilidad. La arquitectura
distribuida de Cassandra est basada en una serie de nodos iguales que se
comunican con un protocolo P2P con lo que la redundancia es mxima.
Cassandra est desarrollada por Apache Software Foundation.

HBase
Cuando queremos almacenar cantidades ingentes de datos (Cientos de millones
de tuplas), podemos optar por utilizar sistemas de bases de datos antiguos y
esperar das u horas para obtener informacin de nuestros datos (si es que eso
es posible) o por otra parte podemos optar por utilizar BigData y sus
herramientas.
HBase nos permitir manejar todos esos datos y tenerlos distribuidos a travs
de lo que denominan Regiones. Una regin no es ms que una particin tipo
Nodo de Hadoop que se guarda en un servidor. La regin aleatoria en la que se
guardan los datos de una tabla se decide por nosotros, dndole un tamao fijo a
partir del cual la tabla debe distribuirse a travs de las regiones.

También podría gustarte