cassandra
curso:
TEORÍA E IMPLEMENTACIÓN DE BASE
DE DATOS
Alumno: Rodriguez Ramirez Miguel Martin
¿Que es cassandra?
Cassandra es un sistema de gestión de bases de datos
distribuidas y altamente escalable, diseñado para manejar
grandes cantidades de datos en entornos distribuidos. trata
de un software NoSQL distribuido y basado en un modelo de
almacenamiento «tabular», de código abierto que está escrito
en Java. Permite grandes volúmenes de datos en forma
distribuida. Por ejemplo, lo usa Twitter para su plataforma.
¿Para que sirve?
Cassandra permite ajustar la
disponibilidad y la consistencia de
los datos configurando las
propiedades «replication factor» y
«consistency level». Por ejemplo,
si ajustamos el nivel de
consistencia en 3 en un cluster
con 3 nodos, se necesitaría que los
3 nodos tengan consenso para
tener el dato disponible.
ventajas
. alta disponibilidad Gran escalabilidad Rendimiento optimizado
es una característica clave de es una de las principales Cassandra es una base de datos
Apache Cassandra. Esta capacidad características de Cassandra, una NoSQL distribuida, de código
base de datos NoSQL. Esta abierto y de alto rendimiento, la
permite a los usuarios mantener
característica permite a los cual ofrece un rendimiento
sus servicios en línea sin
usuarios a escalar horizontalmente optimizado para los usuarios.
interrupción, incluso en caso de
sin tener que preocuparse por los Cassandra es una herramienta
fallas. Cassandra se caracteriza por intuitiva de fácil uso y su robustez
límites de almacenamiento o
su escalabilidad horizontal, lo que rendimiento, lo que significa que y escalabilidad permiten a los
significa que se puede aumentar el puedes agregar más nodos a tu usuarios manejar grandes
rendimiento con el agregado de base de datos cuando sea volúmenes de datos.
nuevos nodos. necesario.
desventajas
Alto costo de Rendimiento limitado. Baja escalabilidad.
La escalabilidad es una característica
mantenimiento. Cassandra presenta una desventaja
importante en cuanto a rendimiento importante asociada con el diseño de
El alto costo de mantenimiento es bases de datos. Cassandra, un
limitado, ya que no ofrece soporte para
una desventaja importante para el transacciones complejas ni para consultas sistema de base de datos distribuido,
uso de Cassandra, un sistema de avanzadas. Esto significa que los usuarios tiene una desventaja significativa en
base de datos distribuida tienen limitaciones en cuanto a la cantidad de términos de escalabilidad. Esto se
desarrollado por Apache. Esta datos que pueden recuperar de la base de debe a su naturaleza de
característica puede ser una datos en una sola consulta. Además, la almacenamiento de clave-valor, lo
barrera para aquellos que quieran arquitectura de Cassandra tiene una que significa que los datos se
escalabilidad vertical limitada, lo que almacenan en forma de pares clave-
usar esta herramienta, ya que
significa que los usuarios no pueden valor y no se pueden consultar a
requiere una inversión
aprovechar el aumento del rendimiento de la través de una consulta SQL. Por lo
considerable en el tiempo para base de datos al añadir nuevos servidores. tanto, se hace difícil escalar el
llevar a cabo el mantenimiento y
sistema a medida que el volumen de
asegurar el funcionamiento datos aumenta.
óptimo.
sentencias y gestion de sus datos
La manipulación de datos en Apache
Cassandra se realiza mediante sentencias de
CQL (Cassandra Query Language), que es un
lenguaje similar a SQL pero adaptado a las
particularidades de Cassandra.
Crear un espacio clave:
CREATE KEYSPACE nombre_keyspace
WITH replication = {'class': 'SimpleStrategy', 'replication_factor': N};
Usar un espacio clave:
USE nombre_keyspace;
Crear una tabla:
Insertar Datos:
Consultar Datos:
Gracias