0% encontró este documento útil (0 votos)

140 vistas17 páginas

Apache Cassandra BD

Este documento presenta información sobre Apache Cassandra, una base de datos NoSQL distribuida y tolerante a fallos. Describe las características clave de Cassandra como su escalabilidad lineal, arquitectura peer-to-peer, replicación de datos para tolerancia a fallos, y uso del lenguaje CQL similar a SQL. También resume los pasos para instalar y configurar Cassandra en un sistema CentOS 7.

Cargado por

FrancoD Cancino

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

140 vistas17 páginas

Apache Cassandra BD

Cargado por

FrancoD Cancino

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

“AÑO DE LA LUCHA CONTRA LA CORRUPCIÓN

E IMPUNIDAD”
Universidad nacional de la Amazonia peruana
Facultad de ingeniería de sistemas e informática

Integrantes : Hidalgo Paredes, Harold Daniel.

Cabrera Armas, Víctor Ivan.
Garcia Flores, Segundo.
Vargas Curico, Wilfrido.
Cancino Martinez, Franco David.

Docente : Ing. Jose Garcia Diaz.

Asignatura : Taller de Base de Datos.

Tema : Apache CASSANDRA BD

Ciclo :V

Nivel : III

Iquitos – Perú
2019
INDICE

Contenido
INDICE............................................................................................................................................ 2
INTRODUCCION ............................................................................................................................. 3
Tipos de bases de datos ................................................................................................................ 4
Qué es Apache Cassandra ............................................................................................................. 5
Características de Apache Cassandra ............................................................................................ 6
SUS CARACTERÍSTICAS MÁS IMPORTANTES SON: ........................................................................ 7
Cassandra Datastax ....................................................................................................................... 8
VENTAJAS Y DESVENTAJAS DE CASSANDRA .................................................................................. 8
INSTALACION DE CASSANDRA EN CENTOS 7 ................................................................................ 9
Actualizar el sistema e instalar Java en CentOS 7 ......................................................................... 9
Instalar Cassandra en CentOS 7 .............................................................................................. 10
CONECTAR Y VERIFICAR EL CLÚSTER DE CASSANDRA EN CENTOS 7 .......................................... 13
BIBLIOGRAFIA .............................................................................................................................. 17
INTRODUCCION
Apache Cassandra es una base de datos NoSQL (Not Only SQL), un tipo de bases de datos que,
por la cantidad de datos o por la evolución de los datos que hemos tenido en los últimos años,
ha sido necesario crear.

Estas nuevas bases de datos son más flexibles a la hora de recoger datos desestructurados o
semiestructurados que las bases de datos tradicionales o las bases de datos relacionales.
Tipos de bases de datos
Existen cuatro tipos de bases de datos NoSQL:
Bases de datos clave-valor o key-value:
Son bases de datos muy parecidas a un diccionario, ya que al final se reducen a tener
una clave y un valor o un conjunto de valores para la misma. Suelen trabajar en memoria
y son muy rápidas, por ello se usan principalmente para conseguir mucha velocidad.

Bases de datos de familia de columnas (column family):

Son unas bases de datos que, como su nombre indica, almacenan los datos en columnas
en lugar de en filas, como estamos acostumbrados con las bases de datos tradicionales.
Cassandra se sitúa aquí en esta en esta categoría de familia de columnas.

Bases de datos de grafos (Graph DB):

Están formadas por nodos y por aristas, y las relaciones entre nodos la conforman las
aristas. Una de las principales ventajas de estas bases de datos es que podemos
almacenar información tanto en nodos como en aristas. Por lo que por ejemplo podemos
tener un nodo persona con el nombre Abraham, y otro nodo persona con el nombre Juan,
y en la arista podemos almacenar otra información, como que son amigos y la fecha
desde que lo son.

Bases de datos orientadas a documentos:

Almacenan los datos en forma de documentos, que podemos decir de forma muy
resumida que es un archivo JSON. Al almacenarlos en JSON, tenemos mucha flexibilidad,
porque podemos almacenar más menos datos y la base de datos no se va a resentir y va
a seguir funcionando.
Qué es Apache Cassandra
Apache Cassandra fue lanzada en el año 2008 y fue creada inicialmente por Facebook.
Más tarde fue traspasada a la Fundación Apache, convirtiéndose en una herramienta
Open Source, que a día de hoy la sigue manteniendo.
Está inspirada tanto en Amazon Dynamo como en Google BigTable.
Para comprender bien la base de datos Cassandra es importante conocer el Teorema
CAP.

Este Teorema lo que dice es que un sistema distribuido no puede conseguir las tres siglas
del teorema, que son consistencia (Consistency), alta disponibilidad (Avaiability) y
tolerancia a particiones (Partition tolerance).
Lo que quiere decir es que nuestras bases de datos siempre se van a mover en la
intersección de dos de las tres características, pero nunca en el en el triángulo amarillo,
que sería la intersección de las tres.
Como vemos en la imagen, Apache Cassandra está situada en la intersección de alta
disponibilidad y tolerancia a particiones, sacrificando un poco la parte de la consistencia.
Características de Apache Cassandra
SUS CARACTERÍSTICAS MÁS IMPORTANTES SON:

Es una base de datos distribuida, es decir, vamos a tener nuestros servidores

distribuidos.
Escala linealmente, lo que significa que, como vemos en la imagen, si tenemos dos
nodos, vamos a poder realizar 100000 operaciones por segundo. Si tuviéramos cuatro
nodos podremos realizar el doble de operaciones, y así sucesivamente, cada vez que
dupliquemos el número de nodos, duplicaremos el número de operaciones por
segundo.
No sigue un patrón maestro-esclavo, sino que es peer-to-peer o P2P. Esto lo que
conlleva es que si se cae un nodo, el servicio puede seguir funcionando, no como en el
patrón maestro-esclavo, en el que, de forma resumida, si se cae el maestro el sistema
cae también.
Permite la escalabilidad horizontal, que es diferente a la escalabilidad vertical. En la
segunda lo que se aumenta es la máquina, como por ejemplo tener una máquina con 16
gigas de RAM y la aumentamos a 32 gigas de RAM. Y en la primera tenemos una máquina
con 16 gigas de RAM y lo que hacemos es poner otra máquina también con 16 gigas de
RAM trabajando en paralelo con la otra.
Es tolerante a fallos, gracias a que posee la replicación de datos, es decir, los datos
cuando son escritos en un nodo se replican en otros nodos, por lo que si uno de estos
nodos cae, no pasa nada porque el dato está replicado en otros dos.
Permite definir el nivel de consistencia.
Usa el lenguaje CQL, que es un lenguaje muy similar a SQL.
Permite la replicación en varios data center, siendo cada data center un anillo de
máquinas Cassandra, ya que permite que el anillo 1 replique sus datos en el anillo 2.
Cassandra Datastax
Es una base de datos Open Source “comercializada” por Datastax, cuyo modelo de
negocio es ofrecer la base de datos de forma gratuita y cobrar por el mantenimiento y
soporte.

VENTAJAS Y DESVENTAJAS DE CASSANDRA

Algunas de las ventajas de Apache Cassandra son:

 Alta disponibilidad, lo que es muy interesante para el sistema en los que una
caída sea crucial.
 Tolerancia a particiones y escalado.
 Cantidad de recursos que se tienen disponibles.

Algunas de sus desventajas:

 La conexión de nuevos nodos no es tarea fácil, ya que el mismo se tiene que

poner de acuerdo con el resto, y esto conlleva un tiempo.
 Debemos saber qué queries se van a ejecutar previamente, ya que al hacer
SELECT sufre un poco debido a la manera en la que almacena los datos.

En resumen, Cassandra es una base de datos muy potente, que actualmente es

utilizada por grandes empresas como las que podemos ver en esta imagen:

Aprende todo sobre las bases de datos NoSQL. Conoce ahora su arquitectura y cómo
desarrollar tu entorno de trabajo con Cassandra.
INSTALACION DE CASSANDRA EN CENTOS 7

Actualizar el sistema e instalar Java en CentOS 7

Paso 1

El primer paso a dar es actualizar el sistema operativo, esto lo podemos realizar ejecutando el
siguiente comando:

1. sudo yum update -y

Paso 2

Cassandra está escrito en Java, por lo que será necesario instalar Java en CentOS 7 ejecutando
el siguiente comando:

1. sudo yum install java -y

Paso 3

Podremos comprobar la versión de Java instalada ejecutando el siguiente comando:

1. sudo java -version

Instalar Cassandra en CentOS 7

Paso 1
Por defecto, la base de datos Cassandra no se encuentra disponible en el repositorio por
defecto de CentOS 7 por esta razón, será necesario agregar los repositorios oficiales de Apache
Software Foundation a CentOS 7, y esto lo logramos creando el archivo [Link] dentro
del directorio /etc/[Link].d de la siguiente forma:

1. sudo nano /etc/[Link].d/[Link]

Paso 2
En este nuevo archivo creado añadiremos lo siguiente:

1. [cassandra]
2. name = DataStax Repo for Apache Cassandra
3. baseurl = [Link]
4. enabled = 1
5. gpgcheck = 0

Paso 3

Ahora, será necesario actualizar los paquetes del repositorio ejecutando lo siguiente:

1. sudo yum update -y

Paso 4
Ahora podremos instalar Cassandra ejecutando el siguiente comando:

1. sudo yum install dsc20

Paso 5

Una vez descargado e instalado veremos lo siguiente:

Paso 6
Una vez instalado Cassandra procedemos a ejecutar los siguientes comandos:

1. sudo systemctl start cassandra (Inicio del servicio Cassandra)

2. sudo systemctl enable cassandra (Habilitación del servicio de
Cassandra al inicio del sistema)
Paso 7

Finalmente, podremos ver el estado de Cassandra ejecutando el siguiente comando:

1. sudo systemctl status cassandra

3 CONECTAR Y VERIFICAR EL CLÚSTER DE CASSANDRA

EN CENTOS 7
Paso 1

En este punto Cassandra está funcionando, por ello vamos a verificar y conectar Cassandra
Clúster, para ello, en primer lugar, vamos a verificar el estado del Cassandra Clúster con el
siguiente comando:

1. sudo nodetool status

Paso 2

Podemos ver que el estado de conexión con clúster es correcto. En este punto Solvetic desea
añadir un punto de solución porque en muchas ocasiones al ejecutar este comando se
despliega el siguiente error:

1. Error: Failed to connect to ‘[Link]:7199’: Connection refused

(Cassandra)

Paso 3

Para solucionar este error y acceder de forma correcta debemos ir al siguiente directorio
usando el editor deseado:

1. sudo nano /etc/cassandra/[Link]/[Link]

Paso 4

Allí debemos ubicar la siguiente línea:

1. JVM_OPTS="$JVM_OPTS -[Link]=

Paso 5

La apariencia debe ser similar al siguiente texto:

1. # add this if you’re having trouble connecting:

2. # JVM_OPTS=”$JVM_OPTS -[Link]=<public name>”
Paso 6

Allí debemos descomentar la segunda línea y reemplazar la línea public name por la dirección
IP [Link]:

Paso 7

Procedemos a reiniciar el servicio ejecutando lo siguiente:

1. systemctl restart cassandra

Paso 8
En algunos casos se recomienda reiniciar el equipo, de este modo corregiremos dicho error.
Ahora podremos conectarnos al clúster de Cassandra ejecutando el siguiente comando:
1. cqlsh

Paso 9

Podemos ver la respectiva conexión para empezar a trabajar en esta base de datos. Para salir
usaremos el término

1. exit

De esta forma hemos visto como instalar y acceder a Cassandra en CentOS 7.

[Link]
datos-cassandra-centos-7/
BIBLIOGRAFIA

[Link]

También podría gustarte

Proyecto Final - Reporte 5°A
Aún no hay calificaciones
Proyecto Final - Reporte 5°A
24 páginas
Cassandra Gestor de Base de Datos NoSQL
Aún no hay calificaciones
Cassandra Gestor de Base de Datos NoSQL
56 páginas
Introducción a Apache Cassandra SGBD
Aún no hay calificaciones
Introducción a Apache Cassandra SGBD
30 páginas
Bases de Datos NoSQL Caso de Estudio Apa PDF
Aún no hay calificaciones
Bases de Datos NoSQL Caso de Estudio Apa PDF
12 páginas
Cassandra
100% (1)
Cassandra
11 páginas
00 Que Es Cassandra, Arquitectura Con Diagramas
Aún no hay calificaciones
00 Que Es Cassandra, Arquitectura Con Diagramas
9 páginas
Apache Cassandra: Guía Completa
Aún no hay calificaciones
Apache Cassandra: Guía Completa
14 páginas
Cassandra
Aún no hay calificaciones
Cassandra
5 páginas
Apache Cassandra - Sofia Cabrera
Aún no hay calificaciones
Apache Cassandra - Sofia Cabrera
14 páginas
Actividad 07 - Cassandra
Aún no hay calificaciones
Actividad 07 - Cassandra
15 páginas
Ventajas y desventajas de Cassandra
Aún no hay calificaciones
Ventajas y desventajas de Cassandra
11 páginas
Cassandra DB Terminar
Aún no hay calificaciones
Cassandra DB Terminar
6 páginas
Apache Cassandra: Guía Completa SEO
Aún no hay calificaciones
Apache Cassandra: Guía Completa SEO
63 páginas
Cassandra Presentacion Base de Datos No SQL
Aún no hay calificaciones
Cassandra Presentacion Base de Datos No SQL
13 páginas
Fundamentos de Apache Cassandra NoSQL
Aún no hay calificaciones
Fundamentos de Apache Cassandra NoSQL
19 páginas
Introducción a Apache Cassandra: Guía Básica
Aún no hay calificaciones
Introducción a Apache Cassandra: Guía Básica
1 página
¿Qué Es Cassandra DB?
Aún no hay calificaciones
¿Qué Es Cassandra DB?
20 páginas
Apache Cassandra: Base de Datos NoSQL
Aún no hay calificaciones
Apache Cassandra: Base de Datos NoSQL
13 páginas
Introducción a Apache Cassandra: Características y Usos
Aún no hay calificaciones
Introducción a Apache Cassandra: Características y Usos
14 páginas
Introducción a Bases de Datos NoSQL
Aún no hay calificaciones
Introducción a Bases de Datos NoSQL
11 páginas
Alteración de Keyspace en Cassandra
Aún no hay calificaciones
Alteración de Keyspace en Cassandra
19 páginas
Implementación de Cassandra
Aún no hay calificaciones
Implementación de Cassandra
7 páginas
Introducción A Apache Cassandra
Aún no hay calificaciones
Introducción A Apache Cassandra
42 páginas
Arquitectura y Uso de Apache Cassandra
Aún no hay calificaciones
Arquitectura y Uso de Apache Cassandra
11 páginas
Introducción a Bases de Datos NoSQL
Aún no hay calificaciones
Introducción a Bases de Datos NoSQL
20 páginas
Apache Cassandra y Redis: Bases de Datos NoSQL
Aún no hay calificaciones
Apache Cassandra y Redis: Bases de Datos NoSQL
13 páginas
Migración a Cassandra: Ventajas y Requisitos
Aún no hay calificaciones
Migración a Cassandra: Ventajas y Requisitos
2 páginas
Cassandra: Escalabilidad Sin Límites
Aún no hay calificaciones
Cassandra: Escalabilidad Sin Límites
7 páginas
Instalación y Manejo de Apache Cassandra
Aún no hay calificaciones
Instalación y Manejo de Apache Cassandra
22 páginas
Introducción a Bases de Datos NoSQL
Aún no hay calificaciones
Introducción a Bases de Datos NoSQL
14 páginas
Introducción a Apache Cassandra
Aún no hay calificaciones
Introducción a Apache Cassandra
10 páginas
Cassandra Es PDF
Aún no hay calificaciones
Cassandra Es PDF
31 páginas
CASSANDRA NoSQL
Aún no hay calificaciones
CASSANDRA NoSQL
11 páginas
Curso de Cassandra: Instalación y Uso
Aún no hay calificaciones
Curso de Cassandra: Instalación y Uso
22 páginas
Migración de Una Base de Datos Relacional A Nosql Apache Cassandra
Aún no hay calificaciones
Migración de Una Base de Datos Relacional A Nosql Apache Cassandra
5 páginas
Historia y Funciones de Cassandra
Aún no hay calificaciones
Historia y Funciones de Cassandra
28 páginas
2017 05 Apache Cassandra
Aún no hay calificaciones
2017 05 Apache Cassandra
41 páginas
Introducción a Bases de Datos NoSQL
Aún no hay calificaciones
Introducción a Bases de Datos NoSQL
2 páginas
Introducción a Cassandra NoSQL
Aún no hay calificaciones
Introducción a Cassandra NoSQL
8 páginas
Introducción a Bases de Datos NoSQL
Aún no hay calificaciones
Introducción a Bases de Datos NoSQL
59 páginas
Comparativa de Sistemas de Gestión de Bases de Datos
Aún no hay calificaciones
Comparativa de Sistemas de Gestión de Bases de Datos
4 páginas
Sistemas de Gestión de Bases de Datos Distribuidas
Aún no hay calificaciones
Sistemas de Gestión de Bases de Datos Distribuidas
6 páginas
MariaDB Es Un Sistema de Gestión de Bases de Datos Derivado de MySQL Con Licencia GPL
Aún no hay calificaciones
MariaDB Es Un Sistema de Gestión de Bases de Datos Derivado de MySQL Con Licencia GPL
3 páginas
Comparacion de Base de Datos
Aún no hay calificaciones
Comparacion de Base de Datos
5 páginas
Comparativo Cassandra y Oracle
Aún no hay calificaciones
Comparativo Cassandra y Oracle
4 páginas
Cassandra Docker: Bases de Datos NoSQL
Aún no hay calificaciones
Cassandra Docker: Bases de Datos NoSQL
5 páginas
Conceptos de Bases de Datos NoSQL
Aún no hay calificaciones
Conceptos de Bases de Datos NoSQL
7 páginas
Presentacion de Cassandra
Aún no hay calificaciones
Presentacion de Cassandra
7 páginas
Guía de Cassandra para Desarrolladores
Aún no hay calificaciones
Guía de Cassandra para Desarrolladores
31 páginas
Introducción a NoSQL y Cassandra
Aún no hay calificaciones
Introducción a NoSQL y Cassandra
20 páginas
Introducción a Cassandra y NoSQL
0% (1)
Introducción a Cassandra y NoSQL
26 páginas
Introducción a Apache Cassandra
Aún no hay calificaciones
Introducción a Apache Cassandra
8 páginas
Instalar Apache Cassandra en Ubuntu 20.04
Aún no hay calificaciones
Instalar Apache Cassandra en Ubuntu 20.04
12 páginas
Cassandra PDF
Aún no hay calificaciones
Cassandra PDF
29 páginas
Bases de Datos No Relacionales
Aún no hay calificaciones
Bases de Datos No Relacionales
26 páginas
El Menú Inicio
Aún no hay calificaciones
El Menú Inicio
6 páginas
Programa de Innovación Curricular UNELLEZ
Aún no hay calificaciones
Programa de Innovación Curricular UNELLEZ
53 páginas
Informe Técnico de Monitor Multiparametros-Signed
Aún no hay calificaciones
Informe Técnico de Monitor Multiparametros-Signed
3 páginas
Link Cursos Virtuales UMG SÁBADO Peten 2022 5to Semestre
Aún no hay calificaciones
Link Cursos Virtuales UMG SÁBADO Peten 2022 5to Semestre
1 página
Ensayo 2
Aún no hay calificaciones
Ensayo 2
3 páginas
D P C Udx042030157 U4 Aa1
Aún no hay calificaciones
D P C Udx042030157 U4 Aa1
7 páginas
Dib. Téc. Sup.
Aún no hay calificaciones
Dib. Téc. Sup.
55 páginas
Diagnóstico y Recomendaciones para Autosampler Agilent
Aún no hay calificaciones
Diagnóstico y Recomendaciones para Autosampler Agilent
1 página
Diseño de Células Flexibles de Trabajo
Aún no hay calificaciones
Diseño de Células Flexibles de Trabajo
2 páginas
Calzados Marumon: Zapatos en Murcia
Aún no hay calificaciones
Calzados Marumon: Zapatos en Murcia
1 página
Competencias Transversales Minedu 2020
Aún no hay calificaciones
Competencias Transversales Minedu 2020
7 páginas
Estandares de Programacion
Aún no hay calificaciones
Estandares de Programacion
3 páginas
Tipos de Formato Utilizados en Diseño Gráfico
Aún no hay calificaciones
Tipos de Formato Utilizados en Diseño Gráfico
1 página
Quiz de Cálculo I: Semana 3 - Grupo 5
Aún no hay calificaciones
Quiz de Cálculo I: Semana 3 - Grupo 5
6 páginas
Estado de Cuenta de Fatima - Junio 2024
Aún no hay calificaciones
Estado de Cuenta de Fatima - Junio 2024
9 páginas
IX 1000 Datasheet
Aún no hay calificaciones
IX 1000 Datasheet
5 páginas
Lenguaje Documental: Tipos y Características
Aún no hay calificaciones
Lenguaje Documental: Tipos y Características
2 páginas
Diagrama de Flujo y Cálculos de Factura
100% (1)
Diagrama de Flujo y Cálculos de Factura
8 páginas
Factura de Compra Automotriz HMA59637
Aún no hay calificaciones
Factura de Compra Automotriz HMA59637
1 página
RAV21, Miguel Cabrera, 1600329
Aún no hay calificaciones
RAV21, Miguel Cabrera, 1600329
3 páginas
Mantenimiento de Computadoras
Aún no hay calificaciones
Mantenimiento de Computadoras
59 páginas
Diagrama de Cableado AutoGas SGI 76411548
Aún no hay calificaciones
Diagrama de Cableado AutoGas SGI 76411548
38 páginas
Ofimática en Word: Guía 2023
Aún no hay calificaciones
Ofimática en Word: Guía 2023
14 páginas
Trabajo #14 - Grupo 7 - Teoría de Colas
Aún no hay calificaciones
Trabajo #14 - Grupo 7 - Teoría de Colas
16 páginas
Informe
Aún no hay calificaciones
Informe
8 páginas
Ecuaciones en N 1
Aún no hay calificaciones
Ecuaciones en N 1
4 páginas
Metodo de Cornell
Aún no hay calificaciones
Metodo de Cornell
3 páginas
Ejercicios Programación Lineal Libro Taha
Aún no hay calificaciones
Ejercicios Programación Lineal Libro Taha
11 páginas
Verificar Cuentas
Aún no hay calificaciones
Verificar Cuentas
25 páginas