Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AlmacenamientoOlap2 1
AlmacenamientoOlap2 1
Almacenamiento MOLAP
Las bases de datos multidimensionales usan estructuras de tipo arreglo
para almacenar los datos. Estas estructuras estn indexadas con el fin
de proveer un tiempo de acceso optimo a cualquier elemento.
Se pueden distinguir dos enfoques en la forma de organizar estas
estructuras, las MDDBs que usan una arquitectura de hipercubo, y las
que usan multicubos.
Almacenamiento MOLAP
La organizacin hipercubo es mas simple, y tiene una performance
(rendimiento) mas pareja en cuanto al tiempo de respuesta a las
consultas.
Con la arquitectura de multicubos se logra una mejor performance si la
consulta no requiere el acceso a ms de un cubo, pero en el caso
contrario la performance se reduce notoriamente, ya que se requiere un
procesamiento complejo para asegurar que los resultados del cruce de
cubos sea consistente.
Si de habla del espacio en disco, es la arquitectura de hipercubo la que
mas espacio requiere, y adems necesita un buen manejo de la
dispersin de los datos para evitar que el tamao del cubo se vuelva
inmanejable.
Almacenamiento MOLAP
Una de las caractersticas distintivas de MOLAP es la preconsolidacin
de los datos. En una base de datos relacional para responder a una
consulta del tipo cuanta cantidad del producto X se vendi en el ultimo
cuatrimestre? normalmente se tiene que hacer una bsqueda de todos
los registros relevantes y totalizar los datos.
En una base multidimensional en cambio, estos totales se calculan
rpidamente usando operaciones extremadamente eficientes sobre
arreglos. Una vez calculados, los totales se pueden almacenar en las
estructuras de la base misma.
Las MDDBs pueden preconsolidar todos los datos, es decir, hacer los
clculos necesarios para obtener la sumarizacin y totalizacin y
almacenar estos resultados para su posterior uso. Preconsolidar todos
los datos requiere mucho espacio y tiempo de carga de la base. Una
alternativa es preconsolidar solo los totales mas usados y calcular el
resto en el momento en el que se consultan.
Almacenamiento MOLAP
Otra caracterstica de MOLAP tiene que ver con los datos dispersos. Una
MDDB tiene que contar con un manejo de datos dispersos.
La dispersin de datos surge en casos donde no todas las
combinaciones de miembros de dimensiones van a tener su valor
correspondiente. Por ejemplo, considere el caso de una empresa con
varias sucursales, que puede vender cientos de productos por da en
cada una, pero no todos los productos necesariamente se van a vender
todos los das en todas las sucursales. Si analizamos estas ventas en
periodos diarios y por sucursal creando un cubo con las ventas como
medida, y sucursales, productos, y das como dimensiones, el cubo
contendr celdas vacas. Estas celdas corresponden a los productos que
no se vendieron en determinados da y sucursal.
Almacenamiento MOLAP
La mayora de las MDDBs tambin proveen acceso SQL a
datos en una base de datos relacional adjunta para
recuperar filas de informacin detallada, por ejemplo, todas
las filas que conformen un determinado total. Esta
informacin detallada solamente se puede visualizar, pero
no se puede usar para anlisis.
Almacenamiento ROLAP
Aunque las bases de datos relacionales no estn optimizadas para el
anlisis multidimensional, tienen ventajas sobre las MDDBs en otros
aspectos. En particular, son escalables a conjuntos mas grandes de
datos e incluyen soporte para replicacin, rollback y recuperacin.
Considere que en la mayora de las organizaciones es mas probable que
el personal de sistemas est ms familiarizada con el uso de una base
de datos relacional, que con el manejo de las MDDBs.
Con los grandes DataWarehouses, que llegan al orden del terabyte,
estas ventajas se pueden ver claramente.
Las herramientas ROLAP brindan anlisis multidimensional sobre datos
almacenados en una base de datos relacional. Lo hacen a travs de un
mapeo entre los datos en el DataWarehouse a un modelo
multidimensional, usando consultas SQL.
Almacenamiento ROLAP
Las herramientas ROLAP trabajan de distintas maneras con el RDBMS
correspondiente:
Algunas lo usan para hacer todo el procesamiento de datos. Generan
sentencias SQL y crean tablas temporales si es necesario.
Algunas proveen funcionalidad de calculo fuera del RDBMS. Se genera
SQL para recuperar datos, pero algunos clculos (incluyendo algunos
JOINs o totalizaciones) los hace la misma herramienta.
Las herramientas ROLAP no requieren manejo de los datos dispersos.
Para mejorar la performance, se tiende a almacenar algunos valores
totalizados en el DataWarehouse, as que los datos dispersos siguen
siendo un tema de importancia, que en este caso se relega al diseador
del DataWarehouse.
Almacenamiento HOLAP
Existen dos enfoques para definir a las herramientas
HOLAP.
Por un lado, se habla de un MDDB que puede recuperar y
analizar informacin detallada. Esta es la definicin mas
aceptada de HOLAP.
Almacenamiento HOLAP
TAREA DE INVESTIGACIN:
Infrmese sobre ventajas y desventajas del almacenamiento HOLAP.
CONCLUSIN:
Cada alternativa tiene sus ventajas y desventajas. En lugar de discutir
cual de las opciones (MOLAP o ROLAP) es las mejor hay que definir un
criterio para optar por una u otra, y evaluar el alcance de HOLAP, que
en la practica intenta combinar lo mejor de ambos mundos.
Lo mas importante es entender los requerimientos del propio negocio y
las implicancias para el tipo y tamao de los datos a los que se necesita
acceder en el futuro.