Está en la página 1de 24

Propuesta de un mtodo para el diseo

y modelado de una bodega de datos

Jos Hernando Bahamn L.


Universidad Icesi
jbahamon@icesi.edu.co

Fecha de recepcin: 15-4-2003 Fecha de aceptacin: 25-8-2003

RESUMEN ses. La primera fase comprende la


El desarrollo de los Sistemas de In- identificacin de las necesidades de
formacin Gerencial basados en tec- informacin gerencial, desde la pers-
nologas de Data Warehouse y Herra- pectiva del negocio. La segunda fase
mientas Olap, es relativamente re- comprende todas las actividades re-
ciente y, por lo tanto, no existe una lacionadas con la elaboracin de un
propuesta metodolgica universal- modelo lgico-conceptual de la estruc-
mente vlida y aceptada como tal, por tura de la bodega de datos. La terce-
la comunidad acadmica. ra fase incluye los pasos para reali-
zar el diseo fsico de la estructura
El presente artculo expone una pro- de la bodega de datos.
puesta metodolgica para la realiza-
cin del diseo de una bodega de da- PALABRAS CLAVES
tos, que utiliza como eje articulador
Bodegas de datos, mtodo de diseo
la identificacin de las necesidades de
de la estructura de una bodega de
informacin por parte de la gerencia,
datos.
para el soporte de los procesos de con-
trol y de toma de decisiones. ABSTRACT
El mtodo propuesto est compuesto The development of Management In-
de ocho pasos agrupados en tres fa- formation Systems based on Ware-

SISTEMAS
& TELEMTICA 13
house Data technologies and Olap information requirements from a bu-
tools is relatively new. Therefore, the- siness perspective. The second one
re is no valid methodological appro- deals with all the activities associa-
ach that is generally accepted as such ted with the preparation of a logical
by the academic community. conceptual model for the data ware-
house structure, and the third stage
This article presents a methodologi-
includes the steps to make the phy-
cal approach to the design of a data
sical design of the data warehouse
warehouse using the identification of
structure.
management information require-
ments as a shaft that supports the
KEY WORDS
control and decision-making proces-
ses. The suggested approach consists Data warehouses, approach to the
of eight steps grouped in three diffe- design of a data warehouse struc-
rent stages. The first stage encompas- ture.
ses the identification of management Clasificacin: A

14 SISTEMAS
& TELEMTICA
INTRODUCCIN MTODO PROPUESTO
El desarrollo de los Sistemas de In- El mtodo de diseo propuesto est
formacin Gerencial basados en tec- centrado en la identificacin de la
nologas de Data Warehouse y herra- informacin clave y relevante para so-
mientas Olap, es relativamente re- portar los procesos de direccin y de
ciente y, por lo tanto, no existe una toma de decisiones dentro de la orga-
propuesta metodolgica universal- nizacin. Este mtodo utiliza, como
mente vlida y aceptada como tal, por punto de partida, la identificacin y
la comunidad acadmica. el modelado de: qu es lo que el
negocio est tratando de alcan-
Entre las propuestas ms conocidas
zar, para luego elaborar una estruc-
estn: 1. Ralph Kimball,1 con un es-
tura que apoye el proceso de gestin
quema centrado en la identificacin
hacia el logro de las metas definidas.
de los procesos de la empresa, como
elemento clave para la definicin de Una vez que la informacin clave de
la estructura de variables y dimen- apoyo a los procesos de gestin y con-
siones; 2. W.H. Inmon,2 con un esque- trol de la organizacin ha sido iden-
ma que parte de la construccin del tificada, se inicia la elaboracin del
modelo de datos corporativos, elabo- modelo lgico-conceptual de la estruc-
rado al ms alto nivel de abstraccin, tura de la bodega de datos, que so-
para luego derivar la estructura del portar las consultas y la exploracin
modelo de datos, para el diseo de la de los datos, a partir de los cuales se
bodega; 3. Golfarelli Matteo, Maio construirn los indicadores de gestin
Dario, Rizzi Stefano3 proponen un requeridos por los niveles directivos
esquema que parte de los modelos E- de la organizacin.
R descriptivos de los sistemas tran-
Para darle un orden a este proceso
saccionales de la organizacin, para
sistmico de diseo, los pasos del
luego derivar el modelo E-R de la es-
mtodo propuesto, tal como se presen-
tructura, para la bodega de datos.
tan en la Figura 1, se han agrupado
En este artculo se presenta una pro- en las siguientes fases:
puesta de sistematizacin del proce-
Fase 1: Identificacin de las ne-
so de diseo de una bodega de datos,
cesidades de informacin geren-
que se aparta de los esquemas de di-
cial, desde la perspectiva del ne-
seo referidos, y que utiliza como eje
gocio.
articulador, la identificacin de la in-
formacin gerencial, para el soporte Fase 2: Elaboracin del modelo l-
de los procesos de control y de toma gico-conceptual de la estructura
de decisiones en los niveles directi- de la bodega de datos.
vos de la organizacin.

1. Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996.
2. Inmon W.H. Building The Data Warehouse. QED Press / John Wiley & Sons, 1992.
3. Golfarelli M., Maio D., Rizzi S. Conceptual Design of Data Warehouse From E/R Schemes.
http//www.csr.unib.it/~golfare/db.html, 1998.

SISTEMAS
& TELEMTICA 15
Fase 3: Elaboracin del modelo f- Cul es la informacin que desea
sico de la bodega de datos. obtener del sistema de informacin
gerencial?. Este enfoque puede resul-
tar muy peligroso, si el directivo no
Fase 1: realiza un proceso sistemtico y orde-
Identificacin de las necesidades nado, para establecer sus necesidades
de informacin gerencial, desde de informacin, en relacin con sus ac-
la perspectiva del negocio. tividades de gestin y control.
La primera fase, a partir de la cual Una forma ordenada y sistemtica
se realiza el proceso de diseo de la para realizar esta fase de identifica-
estructura para una bodega de datos, cin de las necesidades de informa-
comprende la identificacin de las ne- cin, que soporte los procesos de ges-
cesidades de informacin gerencial, tin y control gerencial, es la aplica-
lo que significa hacer explcitos los cin del enfoque de sistemas, para
objetivos y los factores claves de xi- guiar el proceso de revisin o defini-
to de la organizacin, o de un rea cin de: 1. Los objetivos estratgicos
del negocio. del negocio o del rea; 2. Los factores
clave para el logro de los objetivos de-
Es bastante comn empezar este pro-
finidos y 3. Los indicadores de con-
ceso de identificacin y modelado
trol, tanto de los objetivos como de los
mediante entrevistas a los directivos,
factores clave.4
en las cuales la pregunta central es:

4. Vase Bahamn Jos H. Construccin de indicadores de gestin bajo el enfoque de sistemas. S&T Revista
de la Facultad de Ingeniera, Universidad Icesi. 2003.

16 SISTEMAS
& TELEMTICA
Mtodo para el diseo y modelado de una bodega de datos

Fase 1: Identificacin de las necesidades de infor-


macin gerencial, desde la perspectiva del negocio.

Fase 2: Elaboracin del modelo lgico-conceptual


de la estructura de la bodega de datos.

2.1. Definir las tablas de hechos o las variables de la


estructura.

2.2. Identificar, para cada tabla de hechos, las dimen-


siones que la referencian.

2.3. Establecer el nivel de granulacin y los niveles de


agregacin.

2.4. Elaborar el diagrama en estrella que representa


la estructura de la bodega.

Fase 3: Elaboracin del modelo fsico de la bodega


de datos.

3.1. Verificacin y ajuste del modelo lgico.

3.2. Definicin del esquema fsico del almacenamien-


to de las dimensiones y sus jerarquas.

3.3. Definicin de los atributos que conforman las


tablas de hechos.

Figura 1. Mtodo para el diseo y modelado de una bodega.

SISTEMAS
& TELEMTICA 17
Como resultado de esta fase, se ten- tin (necesidades de informacin ge-
dr una visin del negocio y de la in- rencial), identificados en la fase an-
formacin requerida para la direccin terior, y termina con la construccin
y el control gerencial, representada de una representacin multidimen-
fundamentalmente por: Los objetivos sional de las variables que conforman
del negocio; los factores clave de xi- cada indicador. En esta representa-
to y, en especial, un conjunto de indi- cin multidimensional, cada variable
cadores clave de la gestin. es modelada mediante un arreglo di-
mensional (multidimensional) de cel-
Fase 2: das, como se presenta en la Figura 2.
Elaboracin del modelo lgico-
Para facilitar el proceso de elabora-
conceptual de la estructura de la
cin del modelo lgico, se utiliza una
bodega.
representacin grfica denominada
En esta fase se elabora el modelo l- diagrama tipo estrella, donde el ele-
gico de la estructura de la bodega, que mento central del esquema es la Va-
soportar las consultas, mediante las riable o Tabla de Hechos (Fact), la
cuales se obtendr la informacin re- cual es referenciada por un conjunto
querida por los niveles directivos de ejes, denominados Dimensiones, a
como apoyo a sus procesos de gestin travs de los cuales se seleccionan los
y de toma de decisiones. valores contenidos en la tabla de he-
chos. En la Figura 3, se esquematiza
La elaboracin de este modelo lgico
el modelo de un diagrama en estrella.
comienza con los indicadores de ges-

18 SISTEMAS
& TELEMTICA
Figura 2. Vista multidimensional de una de las variables que conforman
un indicador.

Figura 3. Diagrama en estrella de una estructura multidimensional.

SISTEMAS
& TELEMTICA 19
Antes de presentar los pasos propues- Cuadro 1 se presentan las definicio-
tos por el mtodo para la elaboracin nes adoptadas para los diferentes
del modelo lgico, es pertinente pre- conceptos utilizados en el mtodo pro-
cisar algunos de los trminos utiliza- puesto.
dos en el mtodo propuesto. En el

Cuadro 1: Definicin de conceptos bsicos.

Grfica Una grfica es una red de nodos interconectados.


Una grfica direccional es aquella en la cual la conexin entre
dos nodos tiene una direccin especfica.
Un modelo E-R puede ser considerado una grfica direccional.

Trayectorias cclicas En una grfica, una trayectoria acclica es aquella que slo
y acclicas tiene una forma de recorrido (en un solo sentido).
Una trayectoria cclica es aquella que se puede recorrer en dos
o ms secuencias diferentes.

Tabla de hechos Es la tabla central de la estructura de la bodega. Esta tabla


contiene los datos de inters para el negocio, es decir, los valo-
res para la construccin de los indicadores claves del negocio.
Tcnicamente, la tabla de hechos es una entidad de intersec-
cin cuya llave primaria est compuesta por la unin de los
dominios de las diferentes dimensiones que la referencian.

Dimensin Las dimensiones corresponden a los ejes con los cuales se cons-
truye la vista multidimensional de la informacin clave del ne-
gocio, almacenada en la tabla de hechos.
Las atributos almacenados en las dimensiones determinan la
granulacin adoptada para el modelo.
Las dimensiones pueden ser:
Propias: Cuando el conjunto de entidades que conforman
la dimensin se encuentran unidas a la tabla de hechos, en
una trayectoria acclica.
Impropias: Cuando el conjunto de entidades que confor-
man la dimensin se encuentran unidas a la tabla de he-
chos, en una trayectoria cclica.
De Informacin: Cuando los atributos contenidos en la
dimensin definen qu tipo de datos se encuentran almace-
nados en la tabla de hechos.

Jerarquas Determinan cmo las instancias de la tabla de hechos pueden ser


agregadas. Las jerarquas permiten las operaciones de drill-down
o rollup, en los procesos de consulta.
Una jerarqua est conformada por el conjunto de entidades
que constituyen la dimensin.

20 SISTEMAS
& TELEMTICA
A continuacin se presentan los cua- El indicador 1 del F.C.E1 puede
tro pasos propuestos para la sistema- ser construido con dos tablas de
tizacin del proceso de elaboracin del hechos que son: ventas por ven-
modelo lgico: dedor y cuota de ventas de cada
vendedor.
Paso No. 1:
El indicador 2 del F.C.E1 puede
Definir las tablas de hechos o las
ser construido con dos tablas de
variables de la estructura.
hechos que son: nmero de visi-
Este paso se realiza a partir del con- tas realizadas por cada vendedor,
junto de los indicadores de gestin, y nmero de visitas presupuesta-
definidos en la fase de identificacin das por cada vendedor.
de las necesidades de informacin
El indicador 1 del F.C.E2 puede
gerencial, desde la perspectiva del
ser construido con una tabla de
negocio. El paso se inicia con la eva-
hechos: nmero de clientes nue-
luacin de las variables (divisores y
vos en la base de datos. En este
dividendos) de cada indicador, para
caso, el denominador del indica-
determinar cules de stas pueden
dor se asume como un nico valor
ser almacenadas en una tabla de he-
y, por lo tanto, no tiene sentido
chos, y cules no.
almacenarlo en otra tabla de he-
En el Cuadro 2 se presenta, a mane- chos.
ra de ejemplo, la informacin obteni-
Los dems indicadores se anali-
da, al aplicar los pasos de la fase 1 al
zan de igual manera.
rea de ventas de una organizacin.
A partir de estos resultados se iden- En suma, al realizar el anlisis de
tifican las variables o tablas de he- todos los indicadores, obtenemos las
chos, como lo establece el paso 1 de siguientes tablas de hecho:
esta fase.
Ventas.
Aplicacin del paso 1: Identificacin
Ventas por vendedor.
de las tablas de hechos
Cuota de ventas de cada vende-
El indicador definido para el mo-
dor.
nitoreo del objetivo puede ser
construido con una sola tabla de Nmero de visitas realizadas por
hechos: Ventas. Se toma una sola cada vendedor.
variable, por cuanto las ventas del Nmero de visitas presupuesta-
ao y las ventas del ao anterior, das por cada vendedor.
que son las dos variables que con-
forman el indicador, se pueden Nmero de clientes nuevos en la
almacenar en la misma tabla de base de datos.
hechos. Nmero de vendedores capacita-
dos que aprobaron los cursos.

SISTEMAS
& TELEMTICA 21
Cuadro 2: Informacin gerencial del rea de ventas,
obtenida al realizar la fase 1.

rea del Negocio - Descripcin. Se trabaja con el rea de ventas de una orga-
nizacin dedicada a la produccin de recipientes elaborados en plstico.
Objetivo del rea: para propsitos del ejemplo, se toma el siguiente objetivo:
Lograr al final del ao un incremento del 15% en las ventas totales de la
compaa, con respecto a las ventas del ao anterior.
Factores claves de xito. Luego de realizado el anlisis de las acciones y las
condiciones necesarias para garantizar el logro del objetivo planteado, se identi-
ficaron los siguientes F.C.E:
F.C.E.1: Planeacin y control de la fuerza de ventas.
F.C.E.2: Bsqueda de nuevos clientes rentables para la organizacin.
F.C.E.3: Capacitacin y entrenamiento de la fuerza de ventas.
Indicadores claves de gestin. Para el control y seguimiento de los F.C.E y los
objetivos, se proponen los siguientes indicadores:

Ventas del ao
I_obj: -1
Ventas del ao anterior

Ventas del vendedor


I1_FCE1:
Cuota de ventas

Nmero de visitas de venta realizadas


I2_FCE1:
Nmero de visitas presupuestadas

Nmero de clientes nuevos en la base de datos


I1_FCE2:
Nmero de clientes nuevos presupuestados

Nmero de vendedores capacitados que aprobaron los cursos


I1_FCE3:
Nmero presupuestado de vendedores capacitados

22 SISTEMAS
& TELEMTICA
Paso No. 2: En este paso, se espera que el usua-
Identificar, para cada tabla de rio visualice cada variable, como un
hechos, las dimensiones que la conjunto de valores almacenados en
referencian. una estructura de varias dimensio-
nes, donde los valores almacenados
Para cada variable o tabla de hechos
son referenciados por la combinacin
se identifican, con la colaboracin del
de los valores definidos para cada eje
usuario lder del rea de negocio, los
(dominio de la dimensin), tal como
ejes de visualizacin multidimensio-
se esquematiza en la Figura 4.
nal los cuales constituyen las dimen-
siones de la variable.

Figura 4: Esquema de una vista multidimensional de una tabla de hechos.

Paso 3: Hechos sobre Ventas, definida en el


Establecer el nivel de granula- ejemplo anterior.
cin y los niveles de agregacin
Aplicacin del paso 2: Identificacin
de cada dimensin.
de las dimensiones.
Una vez que las dimensiones han sido
Supongamos que el gerente de ven-
identificadas se debe establecer, para
tas expresa su inters por visualizar
cada una de ellas, el menor nivel de
la informacin de ventas organizada
granulacin, el cual corresponde al
de la siguiente manera: primero, por
conjunto de atributos que referencian
cada producto de la compaa; en se-
el mayor nivel de detalle deseado
gundo trmino, por cada lugar en
para la variable o tabla de hechos.
donde se venden los productos y, fi-
A manera de ejemplo, se aplican los nalmente, por cada semana. Podemos
dos pasos anteriores para la Tabla de establecer la necesidad de utilizar

SISTEMAS
& TELEMTICA 23
tres ejes para elaborar la vista mul- chos, por cada dimensin. Estos ni-
tidimensional (dimensiones) de la veles de agregacin representan la
Tabla de Hechos - Ventas: jerarqua de cada dimensin.
Dim1: Producto Jerarqua en la Dim. Produc-
to: Las ventas por productos pue-
Dim2: Lugar de venta
den ser agregadas por grupos de
Dim3: Tiempo. productos, por lneas de produc-
tos y, por el total de la venta. De
Aplicacin del paso 3: Definicin del
esta manera, los niveles de agre-
nivel de granulacin.
gacin de la dimensin producto
De acuerdo con la solicitud del geren- son:
te, se establece para cada dimensin
Por grupos de productos.
la siguiente granulacin:
Dim. Producto: El menor nivel Por lneas de productos.
de granulacin es el Tipo de Pro- Total.
ductos. Podemos establecer otros
Jerarqua en la Dim. Lugar:
niveles como: Lnea de Productos,
Las ventas por lugar pueden ser
que tiene un nivel de granulacin
agregadas por regiones y por el
mayor, pero un menor nivel de de-
total del pas.
talle en la variable ventas; o Re-
ferencias de Productos, que tiene Jerarqua en la Dim. Tiempo:
un menor nivel de granulacin, Las ventas por tiempo pueden ser
pero un mayor nivel de detalle. agregadas por mes, por trimestre,
por semestre, por ao.
Dim. Lugar: El nivel de granu-
lacin requerido es la Ciudad. Se
habran podido seleccionar otros
Paso 4:
niveles, como Almacn, que tiene
Elaborar el diagrama en estrella
un menor nivel, o Regin, que tie-
que representa la estructura de
ne uno mayor.
la bodega.
Dim. Tiempo: El menor nivel de
Luego de identificar los elementos
granulacin requerido es la Sema-
que conforman la estructura de la
na. Se habran podido seleccionar
vista multidimensional, de la infor-
otros niveles, como el Da, que tie-
macin gerencial requerida por la
ne un menor nivel, o el Mes, que
organizacin, se pasa a la elaboracin
tiene uno mayor.
de una representacin grfica, en for-
Una vez se han definido los menores ma de estrella; para ello se puede uti-
niveles de granulacin para cada di- lizar la notacin simplificada de los
mensin, se identifican los niveles de diagramas E-R, o la notacin deno-
agregacin requeridos para los valo- minada Dot modeling.5
res almacenados en la tabla de he-

5. Todman, Chris. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall, 2001.

24 SISTEMAS
& TELEMTICA
Notacin tipo E-R: junto de trayectorias de entidades y
En esta notacin, el diagrama en es- relaciones de uno a muchos, que co-
trella est conformado por una enti- rresponde a las dimensiones y a sus
dad central asociativa, que correspon- jerarquas. En la Figura 5 se presen-
de a la tabla de hechos, y por un con- ta un diagrama en estrella con esta
notacin.

Figura 5. Representacin de un diagrama en estrella, mediante la


notacin tipo E-R.

Notacin Dot Modeling trayectorias compuestas por puntos


En esta notacin, el diagrama en es- (dots), que representan las dimen-
trella est conformado por una enti- siones y sus jerarquas. En la Figura
dad central que corresponde a la Ta- 6 se presenta un diagrama en estre-
bla de Hechos, y por un conjunto de lla con esta notacin.

Figura 6. Representacin de un diagrama en estrella, mediante la


notacin Dot Modeling.

SISTEMAS
& TELEMTICA 25
A manera de ejemplo se presenta en anterior. En la Figura 8 se represen-
la Figura 7, el diagrama en estrella, tan los mismos elementos de la es-
con notacin Dot Modeling, para la tructura de la bodega, pero con nota-
Tabla de Hechos y para las dimen- cin tipo E-R.
siones identificadas en el ejemplo

Figura 7. Representacin, mediante la notacin Dot Modeling, de la


estructura para la bodega de datos del ejemplo anterior.

Figura 8. Representacin, mediante la notacin E-R, de la estructura para


la bodega de datos del ejemplo anterior.

26 SISTEMAS
& TELEMTICA
Fase 3: soportado. Si esta verificacin no es
Elaboracin de la estructura f- correcta, se debe retornar a la fase
sica de la bodega anterior, para incorporar las estruc-
turas que soporten los requerimien-
Durante esta fase, se realiza la trans-
tos faltantes de informacin.
formacin del modelo lgico concep-
tual en la estructura fsica, que pos- Terminada la revisin anterior, el
teriormente ser implementada en proceso contina con la evaluacin de
alguna herramienta de Data Ware- la estructura, para asegurar la vali-
house. dez de todas las consultas de infor-
macin realizadas sobre dicha estruc-
Este proceso de transformacin se
tura.
realiza mediante los siguientes pasos:
1. Verificacin y refinamiento del Para realizar este proceso de compro-
modelo lgico para determinar su con- bacin de validez de la estructura,
sistencia. 2. Definicin del esquema recurrimos a la teora de grafos, se-
fsico de almacenamiento de las es- gn la cual una estructura de consul-
tructuras jerrquicas de las dimen- ta es vlida cuando est conformada
siones. 3. Identificacin de los atri- por trayectorias acclicas. Al aplicar
butos que conforman las tablas de esta teora, se puede afirmar que
hechos y las dimensiones. cualquier diseo para una bodega de
datos permitir siempre consultas co-
rrectas, si la estructura propuesta
Paso 1: est conformada nicamente por di-
Verificacin y ajuste mensiones propias, es decir, por tra-
del modelo lgico. yectorias acclicas.
Durante este paso, se realiza la veri- Si al realizar la comprobacin de la
ficacin del modelo lgico, obtenido en estructura se encuentran trayecto-
la fase anterior, para garantizar que rias acclicas, stas deben ser trans-
el modelo, adems de soportar todas formadas, para asegurar la confiabi-
las consultas requeridas por los ni- lidad de las consultas. Las posibles
veles ejecutivos, siempre retorne in- transformaciones son:6
formacin confiable.
Para iniciar este proceso de verifica- 1. Ajuste para los casos de trayecto-
cin se debe elaborar una matriz de rias cclicas simples
cruce, entre los requerimientos de Este caso ocurre cuando la trayecto-
informacin gerencial, definidos en la ria de una dimensin presenta una
fase inicial, y las estructuras (estre- trayectoria alterna que tiene dos en-
llas), definidas en la fase anterior. En tidades comunes. En la Figura 9, se
la matriz de cruce se confirma si el esquematiza una trayectoria cclica
requerimiento est completamente simple.

6. Mcguff, F. Designing the perfect Data Warehouse. 1998.

SISTEMAS
& TELEMTICA 27
Figura 9. Dimensin con trayectoria cclica.

Las opciones de transformacin para 2. Ajuste para los casos de trayecto-


esta clase de trayectorias son: rias alternas, mezcladas con trayec-
torias cclicas.
Tratar cada trayectoria como una
Se presenta cuando la trayectoria de
nueva dimensin, lo cual signifi-
una dimensin est conformada por
ca redibujar el diagrama, elimi-
una trayectoria alterna, ms una tra-
nando las relaciones N1-A2 y A3-
yectoria cclica, tal como se esquema-
N4, para luego crear la relacin:
tiza en la Figura 10.
Tabla de Hechos - A2.
Convertir la trayectoria cclica en
una trayectoria alterna, eliminan-
do la relacin A3-N4.

Figura 10. Dimensin con trayectoria alterna, ms trayectoria cclica.

28 SISTEMAS
& TELEMTICA
En estos casos, el problema ocurre con la bodega de datos, debe ser conver-
la trayectoria cclica; por lo tanto, la tido en una estructura totalmente
transformacin se maneja como se ex- desnormalizada, tal como se presen-
plic en el caso anterior. ta en la Figura 11. Este modelo fsico
est conformado por una tabla de
Paso 2: hechos, y por las entidades en las cua-
Definicin del esquema fsico del les se almacenarn los dominios de
almacenamiento de las dimensio- las dimensiones con sus correspon-
nes y sus jerarquas. dientes niveles jerrquicos.
El modelo en estrella que conforma
la estructura lgica propuesta para

Figura 11. Modelo lgico en estrella, y modelo fsico de la bodega.

Para el proceso de conversin de cada todos los dominios de las entidades


una de las trayectorias que confor- que conforman la trayectoria de la
man el modelo en estrella, en entida- dimensin, es decir, si los dominios
des desnormalizadas, se puede utili- de las entidades que conforman la
zar uno de los siguientes esquemas trayectoria son: {enero, febrero, mar-
de conversin.7 zo, abril ....}; {1er_trim, 2_trim,
3er_trim, 4_trim}; {1er_sem,
1. Conversin vertical 2_sem}, el dominio de la llave prima-
o recursiva ria ser: {enero, febrero, marzo, abril,
En esta conversin, se utiliza una lla- ...., 1er_trim, 2_trim, 3er_trim,
ve primaria nica, para cada dimen- 4_trim; 1er_sem,2_sem}. En la Fi-
sin. El dominio de esta llave prima- gura 12 se presenta, de manera gr-
ria se obtiene mediante la unin de fica, este esquema de conversin.

7. Mcguff, F. Designing the perfect Data Warehouse. 1998.

SISTEMAS
& TELEMTICA 29
Figura 12. Conversin vertical de la trayectoria de una dimensin.

Adicionalmente, en este esquema de quico son precalculadas y almacena-


conversin a cada valor del dominio das en la bodega.
se le asocia un valor padre, el cual
Este esquema de conversin es el ms
tambin pertenece al dominio; de esta
recomendado para implementar la
manera se implementa la jerarqua
estructura fsica de una bodega, cuan-
definida en la trayectoria, represen-
do las dimensiones estn compuestas
tada en la dimensin, dentro del mo-
por jerarquas desbalanceadas.
delo en estrella.
Este esquema para el manejo de las 2. Conversin horizontal
jerarquas (id_dimensin, id_padre) En esta conversin, la llave primaria
permite implementar fcilmente la de la dimensin se conforma como
operacin de desenrolle (drill- una llave compuesta por las llaves de
down), cuando se realizan consultas cada una de las entidades que con-
a la bodega de datos. Sin embargo, forman la trayectoria de la dimen-
esta estructura es eficiente, si las sin. En la Figura 13 se presenta, de
agregaciones para cada nivel jerr- manera grfica, este esquema de con-
versin.

Figura 13: Conversin horizontal de la trayectoria de una dimensin.

30 SISTEMAS
& TELEMTICA
Este esquema de conversin es el ms tos que conforman cada estructura.
recomendable, si las agregaciones de Una vez asignados todos los atribu-
datos se realizan de manera dinmica. tos, se realiza un anlisis cruzado en-
tre la tabla de hechos y las dimen-
Paso 3: siones, para establecer los tipos de
Definicin de los atributos que clculo matemtico que pueden ser
conforman las tablas de hechos realizados, sobre la tabla de hechos.
y las dimensiones del modelo.
La especificacin de los atributos que
En este paso final, se identifican para conforman la tabla de hechos se debe
cada tabla de hechos y cada dimen- realizar siguiendo el formato que apa-
sin las caractersticas de los atribu- rece en el Cuadro 3.

Cuadro 3: Formato para la definicin de los atributos


de una tabla de hechos.

Igualmente, para la especificacin de los atributos que conforman las dimen-


siones se debe utilizar el formato que aparece en el Cuadro 4.

Cuadro 4: Formato para la definicin


de los atributos de una dimensin.

SISTEMAS
& TELEMTICA 31
Finalmente, se deben establecer los de hechos. El resultado de esta revi-
tipos de clculos matemticos como sin debe quedar consignado en una
suma, conteo, promedio, mnimo, matriz de cruce, como la presentada
mximo, que pueden ser aplicados a en el Cuadro 5.
los valores almacenados en las tablas

Cuadro 5: Operaciones matemticas


para cada atributo de la tabla de hechos.

Tabla de hechos

Atributo 1

Dimensiones Suma Conteo Prom. Mn. Mx.


1. Dimensin a
2. Dimensin b
3. Dimensin c
.....

Atributo 2

Dimensiones Suma Conteo Prom. Mn. Mx.


1. Dimensin a
2. Dimensin b
3. Dimensin c

Atributo 3

Dimensiones Suma Conteo Prom. Mn. Mx.


1. Dimensin a
2. Dimensin b
3. Dimensin c
....

A manera de ejemplo, se presenta en los siguientes cuadros la definicin de


atributos para la tabla de hechos y para las dimensiones definidas en el ejem-
plo anterior, y esquematizadas en la Figura 7.

32 SISTEMAS
& TELEMTICA
Cuadro 6: Definicin de los atributos de la tabla de hechos sobre ventas.

Nombre de la estructura de la bodega rea de ventas

Tabla de hechos Ventas

Atributos tipo Pk Descripcin


Id lugar C(35) S Identif. de la dimensin lugar
Id tiempo C(12) S Identif. de la dimensin tiempo
id producto C(30) S Identif. de la dimensin producto
Unidades vendidas N(8,0) Valor 1 de la tabla de hechos
Pesos-venta N(10,2) Valor 2 de la tabla de hechos

Cuadro 7: Definicin de los atributos de las dimensiones,


para la estructura de ventas.

Nombre de la estructura de la bodega

Nombre de la estructura de la bodega

Nombre de la estructura de la bodega

SISTEMAS
& TELEMTICA 33
Cuadro 8: Operaciones matemticas para cada atributo
de la tabla de hechos sobre ventas.

Tabla de hechos Ventas

Atributo 1 Unidades vendidas

Dimensiones Suma Conteo Prom Mn Mx


Lugar
Tiempo
Producto

Atributo 2 Pesos-venta

Dimensiones Suma Conteo Prom Mn Mx


Lugar
Tiempo
Producto

CONCLUSIN organizaciones se realiza de manera


Mediante la aplicacin del enfoque de intuitiva y, en otras mediante la uti-
Sistemas para la definicin de los in- lizacin de estructuras de bodegas
dicadores claves de gestin de la or- que han sido definidas para otras or-
ganizacin, se ha logrado articular ganizaciones. El modelo propuesto,
una propuesta para modelar, de ma- que se aparta de muchos de los enfo-
nera ordenada y sistmica, las estruc- ques presentados por los investigado-
turas de las bodegas de datos que ser- res en este campo, se convierte en una
virn de soporte a la implementacin opcin vlida para el diseo de siste-
de sistemas de informacin gerencial, mas de informacin gerencial, en par-
hechos a la medida de las necesida- ticular para el diseo de bodegas de
des de informacin de la gerencia. datos departamentalizadas (Data
Esta propuesta facilita, ordena y sis- Marts).
tematiza un proceso que en algunas

34 SISTEMAS
& TELEMTICA
BIBLIOGRAFA Modeling Techniques for Data
Warehouse. IBM. 1998.
Mcguff, F. Designing the perfect
Data Warehouse. 1998. http:// Todman, C. Designing a Data
members.aol.com/fmcguff/dwmo- Warehouse: Supporting Customer
del/index.htm Relationship. Prentice Hall. 2001
Kimball R. The Data Warehouse
Toolkit. John Wiley & Sons, 1996.
CURRCULO
Inmon W.H. Building The Data
Warehouse. QED Press /Jhon Jos Hernando Bahamn L. Inge-
Wiley, 1992. niero Electrnico de la Universidad
del Cauca, especialista en Adminis-
Golfarelli, M; Maio, D; Rizzi, S.
tracin de la Universidad Icesi y ma-
Conceptual Design of Data Ware-
gster en Direccin Universitaria de
house From E/R schemes. http//
la Universidad de los Andes. Profe-
www.csr.unib.it/~golfare/db.html,
sor investigador de la Universidad
1998.
Icesi. Vinculado a la Universidad Ice-
Bahamn, J. H. Construccin de si desde 1988. Ha sido jefe del Depar-
indicadores de gestin bajo el en- tamento Acadmico de Sistemas
foque de sistemas. S&T Revista de (1988-1998), Director del programa
la Facultad de Ingeniera, Univer- de Ingeniera de Sistemas (1998-
sidad Icesi. 2003. 2000), y en la actualidad es el Direc-
Chuck, B; Dick, H; Don, S; Rhon- tor Acadmico de la Universidad.
da; Eunsaeng, K.; Ann, V. Data

SISTEMAS
& TELEMTICA 35
36 SISTEMAS
& TELEMTICA

También podría gustarte