Está en la página 1de 14

Apache Cassandra

Estudiantes: Paula Andrea Ruiz - Sergio Muoz Lancheros

Apache Cassandra fue inicialmente


desarrollada en Facebook para impulsar
las bsqueda en la bandeja de entrada
por Avinash Lakshman (uno de los
autores deAmazon's Dynamo) y Prashant
Malik. Fue lanzada como un proyecto
open source de Google code en julio de
2008. En marzo de 2009, se transform
en un proyecto de Apache Incubator. El
17 de febrero de 2010 se gradu como
un proyecto de alto nivel.

HISTORIA

NoSQL
NoSQL, es una amplia clase de sistemas de gestin de bases de datos que difieren del modelo
clsico del sistema de gestin de bases de datos relacionales (RDBMS) en aspectos importantes, el
ms destacado es que no usan SQL como el principal lenguaje de consultas.
No requieren estructuras como tablas.
Normalmente no soportan operaciones Join.
No garantizan ACID.
Categoras clave-valor.
Implementaciones BigTable.
Bases de datos documentales.

Ventajas
Estos sistemas responden a las necesidades de escalabilidad horizontal que
tienen cada vez ms empresas.
Pueden manejar enormes cantidades de datos.
No generan cuellos de botella.
Escalamiento sencillo.
Diferentes DBs NoSQL para diferentes proyectos.
Se ejecutan en clusters de mquinas baratas.

desventajas
El cdigo abierto puede significar una "mancha" en el soporte para las
empresas.
No estn lo suficientemente maduros para algunas empresas.
Limitaciones de Inteligencia de Negocios.
La falta de experiencia.
Problemas de compatibilidad.

QU ES ?
Apache Cassandra es una
base de datos NoSQL
distribuida y basada en un
modelo de almacenamiento de
clave-valor, de cdigo
abierto que est escrita en
Java.

Apache Cassandra
-Sistema NoSQL, distribuido y preparado para big data.
-Software libre (Apache software Foundation).
-Emplea nodos iguales formando anillos.
-Distribuye los datos con la funcin Hash.
-Escala horizontalmente (p2p).
-Emplea familia columnas (Big table +Dynamo).
-CQL lenguaje de consultas.
-Consistencia eventual.
-Soporta mltiples centros de datos.
-Compatible con Hadoop y spark, entre otros.

Caractersticas claves

Arquitectura
Su arquitectura se basa en el entendimiento de que pueden ocurrir y
ocurren fallos del sistema y hardware. Cassandra aborda el problema
de los fallos mediante el empleo de un sistema de peer-to-peer
distribuidos a travs de nodos homogneos donde los datos se
distribuye entre todos los nodos del clster.

Componentes de Arquitectura
Node
Data center
Cluster
Commit log
Table
SSTable

Modelado de datos
Column
SuperColumn
Column Family
KeySpace
Cluster

Modelado de datos
,

Diferencias
no existe la Integridad referencial que existe en el modelo relacional, no hay joins,
pero estos se pueden emular almacenando las claves de una Columfamily en otras
filas de otro columFamily o haciendo uso de ndices.
Otra diferencia entre Cassandra y el Modelo de datos relacional es que Casandra no
normaliza los datos a la hora de generar el modelo, ya que trabaja con un mayor
rendimiento con datos des-normalizados, por ello a la hora de modelar la base de
datos de Cassandra se debe pensar primero en las consultas que se van a realizar y
una vez se sepan qu consultas van a hacerse a las bases de datos se realiza el
modelo de datos para satisfacer a dichas consultas.
CQL

http://www.agevaled.com/2010/12/31/introduccion-a-apach
e-cassandra/
http://es.slideshare.net/MARTINILDEFONSOTORRES/apa
che-cassandra-27913187
http://es.slideshare.net/planetcassandra/cassandra-qu-es
-de-0-a-100-con-apache-cassandra

Bibliografa

También podría gustarte