Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BD Bi. M2 PDF
BD Bi. M2 PDF
Al ser difícil que se puedan cumplir estas tres propiedades, aparecen las nuevas bases
de datos (BBDD) que resuelven mejor unos aspectos u otros.
El mundo de las bases de datos era el mundo de entornos SQL (lenguaje de consulta
estructurado) hasta que apareció el Big Data.
Aquí se utilizaban:
Estas bases se rigen por las normas llamadas ACID (Atomicity, Consistency, Isolation y
Durability). Este tipo de bases de datos no son la solución en Big Data, y es que a partir
de aquí, aparecieron las BBDD NoSQL (Bases de datos no relacionales), que permiten
solucionar los problemas de escalabilidad y rendimiento.
Y
Página 56
BIG DATA Y BUSINESS INTELLIGENCE
Existen varios tipos de BBDD no relacionales, que veremos a continuación, pero todas
tienen en común las siguientes características:
Y
Página 57
BIG DATA Y BUSINESS INTELLIGENCE
Este tipo de bases de datos son muy útiles cuando se necesitan llevar a cabo
numerosos reports y deben ser unidos dinámicamente por elementos que cambian de
forma constante. Un buen ejemplo de dónde se utilizaría este tipo de base de datos es
Y
Página 58
BIG DATA Y BUSINESS INTELLIGENCE
en el área de salud, donde el contenido varía por el perfil del usuario (edad, residencia,
etc.).
Mongo DB: es la más popular y puede trabajar tanto con datos estructurados
como con no estructurados. Destaca por su capacidad de escalado y
rendimiento. Suele ser la que más perfiles experimentados tiene. No soporta
atomicidad en las operaciones y garantiza integridad eventual. Los cambios se
van replicando a lo largo de todos los nodos pero, no se garantiza que todos
tengan el mismo dato a la vez.
Couchbase Server: base de datos libre creada por el proyecto Apache. Como la
anterior, tampoco garantiza integridad de datos al 100%. Destaca su gran
consola de administración, se puede acceder a muchos datos de forma muy
sencilla.
Mark Logic Server: esta destaca de las anteriores por permitir integridad de
datos y compatibilidad con XML, JSON y RDF. Sistemas soportados: Windows,
Solaris, Red Hat, Sse, CentOS, Amazon Linux y Mac os.
Otras bases de datos a destacar: Elastic Search, RavenDB, Apache Jena y Pivotal
GemFire.
Y
Página 59
BIG DATA Y BUSINESS INTELLIGENCE
Si se quiere sacar rendimiento debe estar totalmente normalizada, de forma que cada
tabla tenga una columna y cada relación dos. Se recomiendan este tipo de bases de
datos si los datos están muy relacionados como en redes sociales, recomendaciones en
tiempo real, etc.
Las bases de datos de grafo son una buena opción cuando hay la necesidad de hallar
relaciones explícitas entre entidades del modelo y de recorrer rápidamente camino
entre las entidades. Algunos casos prácticos son las infraestructuras en redes, acceso
de usuarios y recomendaciones de productos o servicios.
Y
Página 60
BIG DATA Y BUSINESS INTELLIGENCE
Este tipo de base de datos se utiliza en entornos de poca escritura y en los que hay una
necesidad de acceder a varias columnas de muchas filas. Son útiles en el
procesamiento y análisis de eventos, gestión de contenidos o análisis de datos. Se
basan en el sistema Big Table de Google de 2004.
Y
Página 61
BIG DATA Y BUSINESS INTELLIGENCE
i1 i2 i3 i4
Ts Ts Ts ts
1 0 0 0
0 1 0 0
1 1 1 0
0 0 1 1
1 1 0 1
1 1 0
0 1
Estas bases de datos funcionan bien en aplicaciones que requieren que estén
distribuidas geográficamente en varios centros de datos, aplicaciones que puedan
tolerar inconsistencia a corto plazo en réplicas, aplicaciones con campos dinámicos o
aplicaciones con grandes volúmenes de datos como cientos de Terabytes.
Apache Cassandra: base de datos creada por Facebook que ahora es de libre
distribución. Es recomendada para gestionar cantidades masivas de datos. La
versión Enterprise de Cassandra es Datastax Enterprise. Datos soportados:
ASCII, bigint, BLOB, Boolean, counter, decimal, double, flota, int, text,
timestamp, UUID, VARCHAR and varint.
Apache Hbase: soporta grandes cantidades de accesos a lectura y escritura en
tiempo real a grandes cantidades de datos. Corre sobre el sistema de ficheros
Hadoop.
Y
Página 62
BIG DATA Y BUSINESS INTELLIGENCE
Soluciones híbridas que dan cabida a modelos NoSQL junto con modelos relacionales.
Por ejemplo, CortexDB, Foundation DB y Orient DB ofrecen varios modelos NoSQL.
IBM ha extendido su base de datos DB2 para ofrecer la posibilidad de utilizar bases de
datos NoSQL con BLU Acceleration. IBM DB2 en su versión extendida permite
almacenar datos en XML, JSON y almacenamiento en modo grafo.
Y
Página 63