Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NoSQL clave-Valor...................................................................................................................3
Características.........................................................................................................................3
¿Cómo se almacenaría la información?(vista de datos).........................................................3
¿Cuándo usarlo?......................................................................................................................3
Ventajas...................................................................................................................................4
Desventajas.............................................................................................................................4
Manejadores de Bases de Datos clave-valor..........................................................................4
DynamoBD..........................................................................................................................4
Sus características:..............................................................................................................5
Redis. Remote Dictionary Server(servidor de diccionarios remoto)..............................5
Sus características:..........................................................................................................5
Características.................................................................................................................6
Ventajas...........................................................................................................................7
Desventajas.....................................................................................................................7
¿Cuándo usarlo?..............................................................................................................8
¿Cómo se almacenaría la información?(vista de datos).................................................8
Manejadores de bases de datos orientados a columnas...............................................8
Cassandra:.......................................................................................................................9
Sus características:..........................................................................................................9
Sus características:........................................................................................................10
Bibliografía............................................................................................................................11
1
NoSQL clave-Valor
Se basa en una tabla de tan solo dos columnas. En una de ellas se guarda un valor y en la
otra, una clave que representa una característica identificativa única. Un valor puede ser
sencillo, como una cadena de caracteres o un número entero, o pueden ser objetos
complejos (un documento también puede ocupar el lugar de un valor, aunque, entonces se
hablaría de una base de datos de documentos. En las bases de datos se pueden incluir
también referencias a archivos, así como a tuplas (conjunto de valores).
Características.
Almacenan los datos en diccionarios
No existe el concepto de relaciones
Puede almacenar información básica
Muy rápidas en la consulta
Fáciles de escalar
Favorecen una alta disponibilidad de los datos
Permiten almacenar y recuperar valores de cualquier tipo a partir de una llave
Tienen un desempeño alto en operaciones de escritura
Se tiene una clave(del lado izquierdo) y un valor(lado derecho), esto puede ser similar a una
cadena, y esta podrá almacenar cualquier objeto a la derecha por que es un solo valor
La clave en un par clave-valor debe ser única. Este es el identificador único que le permite
acceder al valor asociado con esa clave. La clave podría ser cualquier cosa. Pero esto puede
depender del DBMS. Dado que siempre tendrá una clave única para un objeto en particular
que desea devolver, solo puede consultar la base de datos para esa clave única y obtener los
resultados de cualquier nodo que tenga el objeto
¿Cuándo usarlo?
Al querer almacenar datos simples de claves y valores
Al hacer un proyecto con un diseño sencillo en los que la capacidad de almacenar y
recuperar datos importantes
2
Ventajas.
Las bases de datos clave valor almacenan los datos en diccionarios. Esto nos
garantiza tener la información, sin importar su peso, en una clasificación funcional
que podemos recuperar y usar en cualquier momento.
Alto rendimiento y baja exigencia
El volumen de datos no es problema
Es muy flexible en el manejo de datos
Desventajas.
No tiene estándares en el manejo de datos
Los lenguajes de consultas son muy básicos
Carecen de herramientas avanzadas para su uso y configuración personalizada
Las consultas y el ordenamiento de la información pueden ser realizados solo
partiendo de la clave primaria
DynamoBD.
Sus características:
admite algunas de las aplicaciones de escala más grandes del mundo y proporciona
tiempos de respuesta en milisegundos de un solo dígito a cualquier escala. Puede
crear aplicaciones con capacidad de almacenamiento y procesamiento prácticamente
ilimitada. Las tablas globales de DynamoDB replican sus datos en varias regiones
3
de AWS para darle acceso rápido y local a los datos para sus aplicaciones
distribuidas globalmente.
DynamoDB aumenta o reduce automáticamente las tablas para ajustar la capacidad
y mantener el rendimiento. La disponibilidad y la tolerancia a errores están
integradas, por lo que no es necesario tener en cuenta estas capacidades a la hora de
diseñar sus aplicaciones.
proporciona los modos de capacidad bajo demanda y de capacidad aprovisionada
para que pueda optimizar los costos mediante la especificación de la capacidad por
carga de trabajo o el pago de los recursos que consume.
admite las transacciones ACID para que pueda crear aplicaciones de vital
importancia para el negocio a escala.
Todos los datos de Redis residen en la memoria, a diferencia de las bases de datos que
almacenan datos en discos o SSD. Como no hay ninguna necesidad de obtener acceso al
disco, los almacenes de datos en memoria, como Redis, evitan los retrasos y pueden
obtener acceso a los datos en cuestión de milisegundos. Incluye estructuras de datos
versátiles, alta disponibilidad, datos geoespaciales, scripts Lua, transacciones, persistencia
en disco y soporte de clúster, lo que simplifica la creación de aplicaciones a escala de
Internet en tiempo real.
Sus características:
Todos los datos de Redis residen en la memoria principal del servidor, a diferencia
de bases de datos como PostgreSQL, Cassandra, MongoDB, entre otras, que
almacenan la mayor parte de los datos en discos o SSD.
Redis simplifica el código porque le permite escribir menos líneas de código para
almacenar, obtener acceso y utilizar datos en sus aplicaciones.
utiliza una arquitectura con servidor principal y réplica y admite la replicación
asíncrona en la que los datos se replican en numerosos servidores de réplicas. De
este modo, se logra un mejor nivel de rendimiento de lectura
ofrece una arquitectura con servidor principal y réplica en una topología en clústeres
o principal con un único nodo. Esto permite crear soluciones con un alto nivel de
disponibilidad, lo que ofrece fiabilidad y rendimiento estables.
4
Base de datos orientado a columnas.
También conocida como base de datos columnar, está optimizada para lograr una
recuperación rápida de columnas de datos, normalmente en aplicaciones analíticas. El
almacenamiento basado en columnas para las tablas de bases de datos es un factor
importante en el desempeño de las consultas analíticas, ya que reduce notablemente los
requisitos globales e E/S del disco y disminuye el volumen de datos que hay que cargar
desde él.
Las bases de datos columnares están diseñadas para reducir la escala utilizando clústeres
distribuidos de hardware de bajo coste para aumentar el desempeño, de manera que resultan
ideales para el almacenamiento de datos y el procesamiento de Big Data.
Están organizados de columna por columna en lugar de la fila: es decir, todos los casos de
un solo elemento de datos se almacenan de modo que se puede acceder como una unidad.
Cada columna es almacenada contiguamente en un lugar separado en disco, usando
generalmente unidades de lectura grandes para facilitar el trabajo al buscar varias columnas
en disco.
Características.
Rendimiento- los sistemas columnares por lo general superan a los sistemas de
relaciones en consultas que incluyen cálculos o acceso individual
Técnicas de acceso- Algunas bases de datos de columnares solo se pueden acceder
utilizando su propio proveedor de lenguaje de consultas y herramientas. Estos
pueden ser muy poderosos, incluyendo capacidades que son difíciles o imposibles
usando el estándar SQL.
Comprensión de datos- Algunos sistemas columnares pueden comprimir mucho la
fuente de datos y archivos resultantes a fin de tomar una fracción de espacio en el
disco original.
Están optimizadas para operaciones a nivel de columnas
Logran altos niveles de escalabilidad al dividir las filas y columnas para así
distribuirlas de múltiples nodos
Facilitan la representación de datos semi-estructurados
5
Ventajas.
Reutilización y compartición
Capacidad de almacenar instancias de clases y atributos clásicos relacionales
Acceso rápido a los datos- esto nos permite consultar rápidamente los datos
columna a columna al guardarse físicamente de manera contigua
Posibilidad de comprensión- los datos de una columna son siempre del mismo tipo,
como una cadena o un entero. Como todas las entradas de un tipo están próximas
entre si, se pueden comprimir de forma mas eficiente
Desventajas.
Complejidad y el incremento de coste, ya que se pierde la simplicidad del modelo
relacional
No añaden todos los valores de la orientación a objeto
La ‘convivencia’ de datos puramente relaciones y objetos hace que se pierda la
homogeneidad de acceso a la información
No orientado a transacciones
No existe un estándar que unifique los criterios de implementación de este modelo
de base de datos
¿Cuándo usarlo?
Se utilizan cuando hay que analizar grandes cantidades de datos. En muchos campos de
aplicación, los datos pasan por evaluaciones continuas, Esto es mucho más rápido con
sistemas basados en columnas: la razón de esto es que se requiere acceder menos al disco
duro. Los datos de una categoría se almacenan muy próximos entre sí. Si se desea leer y
evaluar un registro de datos, basta con cargar un bloque;
En general estas se orientan a filas. Los campos con la información se listan uno tras otro,
por cada entrada, hay una columna, por lo tanto, los datos de cada entrada están dispuestos
uno debajo del otro.
6
La base de datos orientado a columnas gira la base de datos quedando de esta forma:
Cassandra:
es una base de datos orientada a columnas de código abierto diseñada para gestionar
grandes cantidades de datos en muchos servidores comerciales. A diferencia de una tabla en
una base de datos relacional, las diferentes filas en la misma tabla (familia de columna) no
tienen que compartir el mismo conjunto de columnas.
Sus características:
Es distribuida- La información está repartida a lo largo de los nodos del cluster.
Además ofrece alta disponibilidad, de manera que si alguno de los nodos se cae el
servicio no se degradará.
Escala linealmente- Por ejemplo, si con 2 nodos soportamos 100.000 operaciones
por segundo, con 4 nodos soportaremos 200.000. Esto da mucha predictibilidad a
nuestros sistemas.
Escala de forma horizontal- podemos escalar nuestro sistema añadiendo nuevos
nodos basados en hardware commodity de bajo coste.
HBase
Es una base de datos NoSQL distribuida de código abierto y orientada a columnas. Hbase
se ejecuta en el marco Apache Hadoop. HBase ofrece una manera eficiente y a prueba de
errores para almacenar grandes volúmenes de datos dispersos con almacenamiento y
compresión basados en columnas.
Es una base de datos de código abierto no relacional y con versiones que se ejecuta sobre
Amazon S3(con EMRFS) o el sistema de archivos distribuidos de Hadoop (HDFS) y está
diseñada para brindar acceso en tiempo real aleatorio y estrictamente uniforme a tablas con
miles de millones de filas y millones de columnas.
Sus características:
Rendimiento a escala- está diseñado para mantener el rendimiento mientras escala
horizontalmente a cientos de nodos, con capacidad para miles de millones de filas y
millones de columnas.
Cargas de trabajo de análisis- puede ejecutar de forma sencilla cargas de trabajo de
análisis paralelas de manera masiva en datos almacenados en tablas de HBase.
Integración con Amazon EMR- Puede implementar con facilidad un clúster de
Amazon EMR totalmente configurado que ejecute Apache HBase y otras
aplicaciones de los ecosistemas de Apache Hadoop y Apache Spark en cuestión de
minutos. Amazon EMR sustituye de forma automática los nodos que no funcionan
bien. Además, puede cambiar el tamaño de su clúster en función de sus
necesidades.
8
Tipo de Base No SQL Clave-valor Orientada a Columnas
Bibliografía
https://www.ionos.mx/digitalguide/hosting/cuestiones-tecnicas/base-de-datos
https://aws.amazon.com/es/dynamodb/
https://www.grapheverywhere.com/bases-de-datos-clave-valor/
https://gravitar.biz/bi/base-datos-columnar/
1
0
1
1