Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ABSTRACT: INTRODUCCION
En la presente investigación no se
pretende tocar todos los tipos de bases de
Figura 2. Ranking de popularidad de
datos NOSQL, solamente los más
motores de búsqueda de tipo clave valor
destacados:
del final del 2014 al 2015.
1. BASES DE DATOS CLAVE A partir de la anterior figura se planea
VALOR: interesante realizar la caracterización de
Normalmente disponen de un reducido dos motores de búsqueda principalmente
como lo son REDIS y AMAZON
conjunto de operaciones, entre las cuales
DYNAMO DB, se tenía en mente incluir a
se encuentran: GET(devuelve el valor de
ORACLE NOSQL, ya que la misma
una llave), SET ( Almacena un par llave -
proporciona una confiabilidad,
valor), DELETE (Elimina un par llave –
escalabilidad y disponibilidad de
valor dada la llave)[4].
almacenamiento a través de un conjunto
A partir de esto se puede establecer que se de sistemas que funcionan como nodos de
caracterizan por su simplicidad, solamente almacenamiento, sin embargo no es muy
se cuenta con un índice de acceso para popular entre los usuarios ya que los otros
toda la información de la base, motores proporcionan mejores
proveyendo de operaciones simples y características, siendo una de sus
veloces, normalmente el valor es principales diferencias el que uno es tipo
almacenado en un objeto BLOB, de esta pago y el otro es libre.
manera el tipo de contenido no es
importante como tal, sino el valor y la
clave, finalmente se puede decir que estas
REDIS:
Es el acrónimo de Remote Dictionary Action Script, C, C++, C#, Clojure, java,
Server. Las principales propiedades de Perl y PHP. [6].
REDIS es que está diseñado para
almacenar todos los datos en la totalidad Entre otras características de REDIS se
de su memoria, mientras se establece una encuentran: [2]
copia de seguridad en el disco, por otra Escalabilidad
parte tiene la capacidad de manipular las Transacciones
estructuras de datos a nivel atómico, este
Pub: Envió de mensajes a
motor cuenta con licencia BSD (licencia
receptores específicos
de Software libre), ocupando el noveno
Lua Scripting: Evalúa
lugar a nivel mundial, esto según la página
secuencias de comandos
de DB-Engines Ranking, ver Figura 3.
utilizando lua incorporado
a REDIS desde la versión
2.6.0.
Expirian claves segundos:
Establece un tiempo de
espera en clave.
Almacenamiento en
Figura 4. Consola de REDIS. memoria y persistencia
asíncrona:
Redis no permite como tal realizar
El que sea una base de
consulta alguna, solo da las opciones de
datos en memoria establece
inserción y extracción de datos, Soporta
que cuando alguno de sus
varios lenguajes de programación como
datos sean modificados de
alguna manera utilizara la Particionado:
memoria principal como A través de esta
elemento de característica, reparte la
almacenamiento principal, carga entre diferentes
utilizando principalmente nodos, principalmente
dos tipos de persistencia maneja por rango, donde
como lo es la RDB: que mapea rangos de objeros a
realiza copias instantáneas instancias concretas y por
de la base de datos durante hash donde aplica una
cada cierto periodo de función resumen a cada
tiempo, esta persistencia elemento, esta básicamente
puede ser configurable. permite establecer donde
Normalmente REDIS copia ira cada nuevo dato entre
la base de datos en un los nodos disponibles en el
periodo de un minuto donde cluster. [3]
se han modificado 1000
claves o un valor superior. Se puede decir que REDIS resulta de gran
La otra persistencia utilidad para los datos que cambian muy
manejada es la AOF, la cual rápidamente, sin embargo es muy poco
se encarga de dejar un común que utilice datos estadísticos ya
registro con todas las que genera varios problemas y finalmente
operaciones realizadas esta no es útil cuando se habla del
es principalmente almacenamiento de grandes volúmenes de
recomendada en caso que información. [7]
se necesite recuperar los REDIS maneja principalmente 5 tipos de
últimos datos del servidor datos: Cadenas de texto, Diccionarios,
en caso de un apagado no Listas, Conjuntos (Colección de cadenas
controlado. de texto), conjuntos ordenados
Replicación y consistencia: (básicamente con las mismas
Utiliza el clásico modelo de características al anterior pero con un
maestro – esclavo donde campo del peso del dato para ser
estableciendo un servidor almacenado por robustez).
maestro que se encargara de
DYNAMO DB:
la actualización de la
información de la base de Fue desarrollado por la famosa compañía
datos y varios servidores de AMAZON en el 2012, esta se
encuentra completamente gestionada en la
esclavos que tendrán una
nube y es principalmente compatible con
copia de la información en los modelos de clave valor y
caso de algún suceso documentales. Se encuentra basada en un
inesperado. sistema pago por uso (Base de datos
propietaria), se puede decir que fue
pionero en “consistencia eventual”, es
decir alta disponibilidad de los archivos,
una propiedad a resaltar es que el mismo
no tiene restricción en el tamaño de los
archivos que se pueden manejar, [5] este
motor se plantea bajo el esquema de tabla,
donde existe una llave primaria que da
acceso directo a la información, sin Figura 6. Entorno gráfico de DYAMO.
embargo también posee acceso a través de
los índices secundarios.
Utiliza EMR (Amazon Elastic
MapReduce), es decir que facilita el
Entre los principales datos que puede
almacenar este motor se encuentran: desarrollo de scripts en diferentes
lenguajes de programación para la
Escalares: Números, creación de funcionalidades y consultas en
cadenas de caracteres, la base de datos.
binarios y booleanos.
Colecciones: Conjuntos Entre las principales características de
homogéneos, listas y mapas DYAMO DB, se encuentra que fue
heterogéneos diseñado principalmente para abordar
Valor nulo. problemas de gestión, rendimiento,
escalabilidad y fiabilidad de los datos, en
Dyamo se encuentra ocupando el puesto vista que el cliente no realiza la instalación
veintidós en el ranking a nivel mundial ni la configuración de este motor, se dice
según la página de DB – Engines Ranking. que el mismo es escalable, ya que solo se
Ver figura 5. paga por los usuarios que lo utilicen, es
decir, en caso que aumentara la demanda
para utilizar Dyamon, sería necesario que
Amazon dispusiera de más servidores para
Figura 5. Ranking mundial de motores manejar la concurrencia de los usuarios.
de bases de datos (DYAMO). Entre las otras características relevantes de
este producto se encuentra:
DYAMO cuenta con un entorno gráfico,
muy deductivo para los usuarios, aunque a - Usabilidad: Uso de
la vez muy sencillo para realizar tareas en interfaz gráfica
él, esto se presenta en la figura 6: - Soporte y solución de
inquietudes: La página
oficial cuenta con los
servicios de AWS
Support, un canal de
soporte personalizado
cualquier día de la
semana y tendrá un a través de un navegador web, sin
costo dependiendo del embargo en la documentación se establece
servicio que adquiera, que el sistema operativo bajo el cual no
entre los mismos se funciona es AIX y claro está, ya que este
incluye medios de motor cuenta con una interfaz gráfica es
comunicación y necesario que el sistema operativo también
respuestas más rápidas. cuente con una.
- Madurez: Amazon
DYAMO DB, tiene como principal
utiliza la amplia gama
ventaja que no requiere de la
de soluciones con las
administración sobre bases de datos, ya
que cuenta para el
que es un servicio directo prestado por
procesamiento interno,
AMAZON. Entre otras desventajas es que
esto ya que no hace
como es un sistema relativamente nuevo
mucho fue creado este
hasta este momento, no todos los
motor.
navegadores pueden ejecutarlo de manera
- Documentación: Cuenta
adecuada, por otra parte este tipo de
con un manual
almacenes no permite generar índices
disponible para todos
segundarios, es decir que, las querys se
los usuarios llamado:
pueden ver beneficiadas por el índice que
“Amazon DynamoDB
se establece sobre la clave primaria, pero
Developer Guide”, el
si se intenta realizar una consulta en
mismo presenta los
cualquier otro campo, se deberá realizar
conceptos e
sin índices. [3]
instrucciones para el
uso de las operaciones 2. BASES DE DATOS
del motor. DOCUMENTALES:
DYAMO DB replica los datos
Busca gestionar un almacén de
automáticamente en tres zonas de
documentos que administre los registros
disponibilidad de una región, esto con el
de datos estructurados de maneja
fin de ofrecer un alto nivel de
jerárquica, proporciona la capacidad de
disponibilidad y durabilidad de los datos
manejar millones de lecturas simultaneas,
frente a alguna posible situación crítica,
donde toda la información se encuentra
por tanto se plantea que tiene muy en
relacionada a una entidad en un solo
cuenta la tolerancia a fallos como parte de
documento. [8]
su desarrollo. [2]
El almacenamiento del documento puede
No se puede establecer un sistema
ser JSON o XML, cada documento tendrá
operativo específico sobre el cual funcione
una clave única y la información
DYAMO DB, ya que lo único necesario
almacenada, en este caso es necesario que
para acceder a él es por medio de internet
la información sea completamente
entendible, no como en el caso de clave – de datos relacionales, a partir de esto se
valor . A partir de todo esto se plantea que puede decir que un documento equivale a
las bases de datos documentales permiten una fila de la relación y la clave del mismo
grandes consultas de información. [9]. será un atributo de la relación, esta
comparación para dar una noción más
Estas bases de datos son principalmente clara de la estructura. [10] Este motor
recomendadas para Consultas avanzzadas cuenta con licencia BSD (licencia de
de datos semi estructurados variedad de Software libre), donde se pueden obtener
datos. características pagas específicas, como es
Entre el ranking de popularidad de los el caso del entorno gráfico.
motores de búsqueda más usados de tipo Mongo principalmente está enfocado
documental se encuentran: [5]. hacia: alta eficiencia, alta disponibilidad y
fácil escalabilidad. A partir de ello se
plantea que este motor tiene unas
características específicas, entre las cuales
se encuentran:
Cassandra está implementada en java y Figura 12. Interfaz gráfica del motor de
cuenta con su propio lenguaje CQL CASSANDRA, utilizando la
(Cassandra Querty Language), utilizado herramienta de OpsCenter.
para llevar a cabo todas las operaciones
sobre la base de datos, así como: La arquitectura básica de cassandra se ha
Consultas, Inserciones, eliminación de tocado hasta el momento de una manera
información y actualización de datos. muy superficial, la arquitectura de la
Normalmente este se asemeja al lenguaje misma también cuenta con espacios
SQL utilizado por las bases de datos claves, cuenta con un espacio llamado
relacionales.[6] system que se utiliza para la gestión de la
información sobre los metadatos, por otra
Cassandra se encuentra en el 7 lugar a parte cabe resaltar que también
nivel mundial en el ranking de DB- implementa algo mejor conocido como
Engines, ver figura 11, siendo la primera peer to peer, es decir que bajo este
del tipo orientado a columnas. concepto se garantiza que los nodos sean
idénticos, por tanto no aparece lo que se
conoce como maestro, finalmente algo
muy importante a resaltar es que
implementa SEDA, es decir, Arquitectura
orientada a eventos por etapas,
normalmente es para la gestión de
operaciones entrantes al sistema.
El sitio oficial de Cassandra es: diferentes clusters, por tanto esta
cassandra.apache.org, donde se pueden flexibilidad y escalabilidad al momento de
encontrar soporte, con algunas de las la distribución por diferentes servidores, se
preguntas más comunes, por otra parte ve afectada por un número demasiado
provee documentación que contiene un elevado de escritura de archivos, llevando
repositorio con las consultas, notaciones y a constantes caídas de red.
respectivos ejemplos.
Estas bases de datos son principalmente
Entre las principales ventajas se resalta recomendadas para Medicina y estadística.
que es muy tolerante a fallos, en vista a
que cada nodo tiene la réplica de datos, Entre el ranking de popularidad de los
por tanto si alguno falla no motores de búsqueda más usados
necesariamente, va a fallar todo la red, sin orientados a grafos se encuentran: [5].
embargo, entre las principales limitaciones
se encuentra que el valor de la columna no
puede ser mayor a 2 GB, y existe un
máximo número de filas por columnas que
llega hasta 2 billones. Finalmente la llave
y los nombres de las columnas deben ser Figura 13. Ranking de popularidad de
menores a 64 KB. motores de búsqueda de tipo orientado
a grafos del final del 2014 al 2015.
4. BASES DE DATOS
En la figura anterior claramente se plantea
ORIENTADAS, A GRAFOS:
como Neo4j, es el motor más destacado en
Principalmente este tipo se concentra en esta categoría.
las características de la relación de los
NEO4J:
datos que en las propias características de
los conjuntos, este modelo es de gran Es una base de datos orientada a grafos, de
utilidad ya que permite conectar un nodo muy alto rendimiento desarrollada por
de datos con varios, realizando consultas NEO TECNOLOGY (empresa SUECA),
o actualizaciones de forma más sencilla, a estas bases de datos difieren porque
partir de lo mismo se plantea que una de cambian completamente la estructura
las principales características de este tipo tradicional que se maneja en las bases de
de bases de datos es la flexibilidad. Se datos de tipo NOSQL, entre las
dice que estas bases de datos son la forma principales características de esta base de
avanzada del almacenamiento tipo clave – datos son: que cuentan con un alto
valor, en vista que se forma solo cuando desempeño y disponibilidad, es escalable
los valores se encuentran interconectados. un ejemplo es contar con 32 miles de
millones de nodos, 32 miles de millones
El principal problema de este tipo de bases
de relaciones y 64 miles de millones de
de datos es que como tal no es sencillo la
propiedades, finalmente se habla de tener
interconexión entre todos los nodos de los
un servidos con una API REST, usable
como una biblioteca java.[2]