Está en la página 1de 13

BASE DE DATOS NO SQL

CASSANDRA
INTEGRANTES :

-Alarcn Quispe Kevin


-Ccopa Marin Franco
-Llana Chavez Walter
-Pavn Cuellar Keila

TO

Cassandra es un motor de base de


datos NoSQL, open source e
implementado en Java.
Es una base de datos NoSQL mas
relevantes a nivel mundial.
Cassandra puede manejar muchos
terabytes de datos.
La informacin en la base de datos
relacionales, se almacenan en forma de
filas, pero en Cassandra la informacin
se almacena en columnas con pares
key-value.
Distribuye los datos mediante funciones
hash.

HISTO
RIA

Fue desarrollado inicialmente en Facebook


para impulsar su Bandeja de entrada y
funciones de bsqueda.
En julio del 2008 fue lanzado como un
proyecto de cdigo abierto . En marzo de
2009, fue donada a Apache como software
libre.
En los prximos aos se les fue agregando
mas caractersticas importantes como
ndices secundarios, CQL, trigger, mejoras
en el rendimiento de lecturas, etc.
Actualmente se encuentra en la versin
2.1.4

BIGDATA
Actualmente los sistemas de
informacin sobre todo en las
redes
sociales,
servicios
de
mensajeras, correos elctricos,
entre otros; manejan grandes
cantidad de datos(entre texto,
imgenes, audio y videos)
Hoy en da, de acuerdo con Apache,
"Cassandra
gestiona
masivos
cantidades de datos de forma rpida y
fiable sin comprometer el rendimiento,
independientemente si se ejecuta en
la nube o parcialmente en las
instalaciones de un almacn de datos
hbrido. Su arquitectura totalmente
distribuida proporciona tolerancia a
fallos sin precedentes para asegurar
que las aplicaciones no pierdan
conexin, y su escalabilidad lineal les

AS
Combina lo mejor de Dynamo (consistencia virtual)
con lo mejor de Big Table (familia de columnas).
Cada columna contiene elementos de la forma
Clave-Valor, donde el valor del campo tiempo
es definible por el usuario.
Esquema dinamico: el esquema que define la
estructura de los datos puede cambiar en tiempo
de ejecucin.
Fue diseada para ser ejecutada en multiples nodos
y sin necesidad de que estos nodos este
geogrficamente cercanos.

No hay punto de fallo.


Alta disponibilidad
Particionamiento de los
datos.
Escalabilidad horizontal y
vertical
Soporte profesional

DO

Column: Elemento mas


bsico que se asemeja al
concepto de campo.
Columna(

Nombre->Nombre del campo


Valor->Valor del campo
Timestamp->Marca del
tiempo)
ColumnFamily: Contenedor de
Columnas que se asemeja a las tablas. Se
guarda en un fichero Ordenado por clave
de fila.

SuperColumnF
amily

SimpleColumnF
amily

SuperColumn: Elemento compuesto por varias


columnas y sus nombres
SuperColumna(
Columna1(

)
Columna2(

)
)

KeySpace: Contiene
familia de columnas y
se asemeja a la Base
de Datos relacional.

Twitter abandon MySQL para empezar a


utilizarCassandracomo base de datos, y no
es el nico que se ha decidido por Cassandra,
tal es el caso de:

OS

Facebook
Digg
Cisco

El por qu Facebook usa Cassandra es una


cuestin simple de responder, ya que ellos
son los desarrolladores iniciales y lo han
desarrollado de acuerdo con sus necesidades.

Por qu Facebook desarrollo Cassandra?


Prashant Malik, del equipo de
bsqueda, estaba pensando
cmo resolver el problema
de la bandeja de entrada. El
desafo se centraba en cmo
almacenar ndices inversos
de los mensajes que los
usuarios de Facebook envan
y reciben entre ellos. La gran
cantidad
de
datos
almacenados, su ratio de
crecimiento
y
los
requerimientos para servir la
informacin, hacan aparente
la necesidad de una nueva
solucin de almacenamiento,
que fuera capaz de escalar
incrementalmente.

Por qu la han elegido sitios como Digg/Twitte


Segn palabras de Ian Eure:

Por su parte, Ryan King de Twitter:

Despus de considerar HBase,


Hypertable,
Cassandra,
Tokyo
Cabinet/Tyrant,
Voldemort
y
Dynomite, nos quedamos con
Cassandra. Cada sistema tiene sus
puntos fuertes y sus debilidades,
pero Cassandra es una buena
mezcla
de
todo.
Ofrece
almacenamiento
orientado
a
columnas, por lo que tienes algo
ms
de
estructura
que
los
acercamientos
de
clave/valor.
Opera en un cluster distribuido, de
alto rendimiento y peer-to-peer. Y
aunque
le
faltan
algunas
caractersticas necesarias, nos deja
ms cerca de dnde queremos
llegar que otras soluciones.

Tenemos una gran cantidad de datos,


y con un factor de crecimiento muy
elevado y encima acelerndose.
Tenemos un sistema con mysql +
memcache pero se est convirtiendo
en algo costosamente prohibitivo en
trminos de esfuerzo (personal
trabajando para el sistema).
Necesitamos un sistema que pueda
crecer de una forma ms
automatizada y que presente alta
disponibilidad.
Las principales razones por las que
migramos a Cassandra se resumen
en: 1) No tiene puntos de fallo, 2) las
escrituras son altamente escalables y
3) una comunidad open source
saludable y productiva.

http://
eventos.citius.usc.es/big
data/workshops/Cassandra.
pdf?hc_location=ufi
https://
msdn.microsoft.com/en-us
/magazine/jj553519.aspx
http://www.zdnet.com/arti
cle/cassandra-2-0-the-nex
t-generation-of-big-data
/
http://
www.nosql.es/blog/nosql/c
assandra.html?hc_location

BIBLIOGRAFIA

VIDE
O

También podría gustarte