Está en la página 1de 10

Definicin. Base de datos Multidimensional. Base de datos de estructura basada en dimensiones orientada a consultas complejas y alto rendimiento.

Puede utilizar un SGBDR en estrella (Base de datos Multidimensional a nivel lgico) o SGBDM (Base de datos Multidimensional a niveles lgico y fsico o Base de datos Multidimensional Pura) INTRODUCCIN Hasta ahora, el modelo ms usado para la implementacin de bases de datos ha sido el modelo relacional, orientado al procesamiento de transacciones (insercin, actualizacin y borrado de datos) relaciona dos tablas de datos por alguno de sus campos de forma que todos ellos son igualmente importantes

De la necesidad de buscar un esquema no homogneo (nos tienen que decir qu es lo importante) y orientado a consultas (el anlisis de datos es su principal objetivo) surge el modelo de datos multidimensional o Data Warehouse. Ahora debemos hablar de un esquema que implementa un almacn de datos, donde los datos slo se entienden en relacin a un dominio definido por la decisiones de la empresa.

DISEO MULTIDIMENSIONAL Para realizar el diseo multidimensional de un conjunto de datos deberemos comprender los diferentes pasos o fases del diseo. En ellas se vern siempre dos puntos de vista: un primer diseo al nivel ms bajo de detalle y otro a alto nivel determinado por el usuario decisor de alto cargo en una empresa. Diseo Conceptual Sera similar al esquema E/R en un modelo relacional, se trata de definir y llegar a un consenso de los elementos que se tratarn. Definicin Usuario: es importante que determinemos para qu tipo de usuario se har el diseo, es decir, qu tipo de usuario es el que tomar las decisiones en cuanto

qu

cmo

tratar

los

datos.

Podra considerarse a bajo nivel de detalle a cualquier tcnico informtico y a alto nivel el directivo de la empresa para la que se trabaja. Decisiones: deberamos hacer una lista de las decisiones que cada uno de los usuarios tomaran con los datos. Estas decisiones determinarn todo el diseo. Se trata de dar relevancia a los datos. A bajo nivel debera de detallarse al mximo pero a alto nivel slo debe considerarse lo estrictamente necesario. Este es uno de los principales problemas del modelado multidimensional ya que la nica manera de obtener otra nueva visin abstracta de los datos y diferente es partiendo de la implementacin de ms bajo nivel donde la anterior podra considerarse intil. Este "cambio de decisiones" se resuelve en base a las operaciones ROLL-UP o DRILL-DOWN, algo as como agrupar y descomponer, respectivamente.

Granularidad En esta etapa debemos definir los hechos y las dimensiones. Los hechos son el foco de atencin, es decir, lo que queremos medir: n ventas; y las dimensiones ser la "manera" de contar: n de ventas en una tienda, bajo una promocin, en un ao, de un producto.

Hechos Los hechos sern por tanto aspectos cuantitativos y representativos, las dimensiones sern los aspectos que definen el cundo, el cmo, el qu, el dnde o el quin. Obtendremos tantos esquemas en estrella como hechos haya de manera que cada hecho ser el centro y las dimensiones sern las puntas de la estrella. Para cada hecho se pueden considerar diferentes mediciones derivadas, por ejemplo, beneficio de una venta, coste, n unidades, etc.

Dimensiones

Para las dimensiones tambin tendrn que ser definidas en detalle: por sus niveles y sus descriptores. En el ejemplo, si tenemos la dimensin Cundo definida como fecha, los niveles de abajo a arriba podran ser: da, mes, trimestre, ao, TODO. Sera una agregacin. Como ejemplo de descriptor para el nivel da podramos tener da de la semana. La idea es identificar todos los posibles niveles de abstraccin donde la informacin podra sernos de utilidad as como sus atributos (descriptores) que os permitan obtener dicha informacin. Cuanto ms detallemos a un nivel bajo de abstraccin ms posibilidades tendremos en el futuro para ejecutar ROLLUP.

Validacin Por supuesto, habr que validar si podemos obtener los datos de alguna manera, si ya existen, si los proporcionamos nosotros o alguna empresa externa, si hay que recogerlos mediante alguna aplicacin o si podemos generarlos.

Diseo Lgico Tablas Cada hecho es una tabla y cada dimensin tambin. En la tabla de los hechos adems de los identificadores (que deberan ser autogenerados para optimizar las consultas) de las dimensiones irn las mediciones que se hayan considerado. Para esta tabla se debern definir las bases, o sea, las dimensiones que identifican a un hecho de manera unvoca. En las tablas de las dimensiones se esperan que aparezcan los niveles y los descriptores como campos adems de las claves primarias o identificadores. Estabilidad de las dimensiones Existe un problema comn en este tipo de esquemas multidimensionales llamado el Problema de las Dimensiones Cambiantes (Slowly Changing Dimension). Esto sucede cuando, tras haber considerado una dimensin,

tenemos en uno de sus registros un atributo que cambia de valor y que no podemos sobreescribir porque toda la informacin relativa a ese registro con el antiguo valor se perdera. Por ejemplo, es posible que a nosotros nos interese conocer informacin de los empleados de nuestra empresa, si uno de nuestros empleados cambiase de su residencia A a otra B y "machacamos" el registro jams sabremos con certeza cules de nuestros empleados llegaron a vivir en la ciudad A. Para ello hay que considerar qu dimensiones son susceptibles a estos cambios y analizar la forma ms razonable de abordar el problema.

Estimacin del tamao Finalmente debe considerarse una estimacin del tamao de nuestra base de datos multidimensional analizando dimensin a dimensin el mximo de registros que podra llegar a alcanzar de una forma razonada.

Cubos e hipercubos de datos. Los hipercubos en aplicaciones de bases de datos se utilizan comnmente para generar resumenes, estadsticas, proyecciones y otros tipos de procesos de informacin. Cuando se tiene fuentes de datos detalladas que constan de millones de registros, usando la metodologa OLAP por medio de un hipercubo, los millones de registros, se preprocesan generando acumulados siguiendo los criterios requeridos por el usuario que finalmente utilizara la informacin ya procesada por este medio. Asimismo, el usuario final tiene la capacidad para especificar diversos criterios que definen cual y de que forma ser presentada, acumulada y ordenada la informacin, obtenindose los resultados a una velocidad muy superior de la que se obtendra con un sistema de bases de datos relacional o a objetos. (complementar)

Los cubos de informacin o cubos OLAP funcionan como los cubos de rompecabezas en los juegos, en el juego se trata de armar los colores y en el

data warehouse se trata de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3 dimensiones, los cubos OLAP tienen un nmero indefinido de dimensiones, razn por la cual tambin reciben el nombre de hipercubos. Un cubo OLAP contendr datos de una determinada variable que se desea analizar, proporcionando una vista lgica de los datos provistos por el sistema de informacin hacia el data warehouse, esta vista estar dispuesta segn unas dimensiones y podr contener informacin calculada. El anlisis de los datos est basado en las dimensiones del hipercubo, por lo tanto, se trata de un anlisis multidimensional. A la informacin de un cubo puede acceder el ejecutivo mediante tablas dinmicas en una hoja de clculo o a travs de programas personalizados. Las tablas dinmicas le permiten manipular las vistas (cruces, filtrados, organizacin, totales) de la informacin con mucha facilidad. Las diferentes operaciones que se pueden realizar con cubos de informacin se producen con mucha rapidez. Llevando estos conceptos a un data warehouse, ste es una coleccin de datos que est formada por dimensiones y variables, entendiendo como dimensiones a aquellos elementos que participan en el anlisis y variables a los valores que se desean analizar. Dimensiones

Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de anlisis de las variables (forman parte de la tabla de dimensiones). Son catlogos de informacin complementaria necesaria para la presentacin de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la informacin general complementaria a cada uno de los registros de la tabla de hechos. Variables

Tambin llamadas indicadores de gestin, son los datos que estn siendo analizados. Forman parte de la tabla de hechos. Ms formalmente, las

variables representan algn aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a la variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podran ser: productos, localidades (o zonas), el tiempo (medido en das, horas.

Cubo de informacin.

Los

cubos

de

Informacin

Cubos

OLAP.

Los cubos OLAP pueden ser comparados con los cubos de rubik donde en estos el juego es tratar de poner los colores de un solo lado y cuenta con tres dimensiones, y en los BDMD se trata de organizar los datos por tablas o relaciones y este no tiene un nmero definido de dimensiones, tambin pueden ser llamados como Hipercubos.

Caractersticas. El cubo OLAP contiene datos de una determinada variable que se desea consultar proporcionando una vista lgica de los datos.

Operaciones

en

los

cubos

de

datos.

Dice. Se realiza una reduccin de los datos mediante las consultas. Pivotaje o Rotacin. Se realiza un cambio de la visin dimensional de los datos.

Dimensiones. Las dimensiones de un cubo son los atributos de los datos, son las vistas de las dimensiones, es decir, las variables de las tablas que forman el cubo. Las dimensiones de un cubo se utilizan para indexar, ordenar, agrupar o abreviar los valores de las variables.

Variables. Tambin llamadas Indicadores de Gestin, son los datos que estn siendo analizados, los cuales forman parte de una tabla.

Normalmente las variables son representadas por valores detallados para cada instancia del objeto o evento medido.

Corte

Corte

del

Cubo.

Las operaciones de corte y corte consiste bsicamente para analizar subconjuntos de cubos, el resultado de estas operaciones llevan el nombre de subcubos o cuboides. La operacin Corte, como la palabra lo dice, realiza un corte del cubo.

Por ejemplo, si una dimensin de tiempo de un cubo nicamente tomamos es mes de Marzo y dejamos ver el resto de las dimensiones, entonces con la operacin de corte y corte la rebanada corresponder al mes de marzo nada ms. Pero si adems de ese corte, queremos otro corte de la dimensin Proveedor, seleccionando algn proveedor X de un cubo de compras, entonces estaramos visualizando un subcubo como resultado de la operacin corte y corte.

Filtrar

Pivotear.

La operacin Filtrar consiste en hacer una consulta de los datos de un cubo utilizando una constante, mientras que Pivotear permite visualizar el cubo desde distintos ngulos.

Ejemplos. Un gerente de una zona estra interesado en visualizar la informacin para todos los productos que distribuye, lo podra tener en una representacin grfica como:

Un director de producto, sin embargo quera examinar la distribucin geogrfica de sus productos para toda la informacin histrica almacenada en el Dataware House.

O se podra tambin examinar los datos en un determinado momento o una visin particularizada.

También podría gustarte