Está en la página 1de 24

13

SISTEMAS
& TELEMTICA
Propuesta de un mtodo para el diseo
y modelado de una bodega de datos
Jos Hernando Bahamn L.
Universidad Icesi
jbahamon@icesi.edu.co
RESUMEN
El desarrol l o de l os Si stemas de I n-
formaci n Gerenci al basados en tec-
nol og as de Data Warehouse y Herra-
mi entas Ol ap, es rel ati vamente re-
ci ente y, por l o tanto, no exi ste una
pr opuesta metodol gi ca uni ver sal -
mente vl i da y aceptada como tal , por
l a comuni dad acadmi ca.
El presente art cul o expone una pro-
puesta metodol gi ca para l a real i za-
ci n del di seo de una bodega de da-
tos, que uti l i za como eje arti cul ador
l a i denti fi caci n de l as necesi dades de
i nformaci n por parte de l a gerenci a,
para el soporte de l os procesos de con-
trol y de toma de deci si ones.
El mtodo propuesto est compuesto
de ocho pasos agrupados en tres fa-
ses. La pr i mer a fase compr ende l a
i denti fi caci n de l as necesi dades de
i nformaci n gerenci al , desde l a pers-
pecti va del negoci o. La segunda fase
comprende todas l as acti vi dades re-
l aci onadas con l a el aboraci n de un
model o l gi co-conceptual de l a estruc-
tura de l a bodega de datos. La terce-
ra fase i ncl uye l os pasos para real i -
zar el di seo f si co de l a estructura
de l a bodega de datos.
PALABRAS CLAVES
Bodegas de datos, mtodo de di seo
de l a estr uctur a de una bodega de
datos.
ABSTRACT
The devel opment of Management I n-
for mati on Systems based on War e-
Fecha de recepcin: 15-4-2003 Fecha de aceptacin:25-8-2003
14
SISTEMAS
& TELEMTICA
house Data technol ogi es and Ol ap
tool s i s rel ati vel y new. Therefore, the-
re i s no val i d methodol ogi cal appro-
ach that i s general l y accepted as such
by the academi c communi ty.
Thi s arti cl e presents a methodol ogi -
cal approach to the desi gn of a data
warehouse usi ng the i denti fi cati on of
management i nfor mati on r equi r e-
ments as a shaft that supports the
control and deci si on-maki ng proces-
ses. The suggested approach consi sts
of ei ght steps grouped i n three di ffe-
rent stages. The fi rst stage encompas-
ses the i denti fi cati on of management
i nformati on requi rements from a bu-
si ness per specti ve. The second one
deal s wi th al l the acti vi ti es associ a-
ted wi th the preparati on of a l ogi cal
conceptual model for the data ware-
house structure, and the thi rd stage
i ncl udes the steps to make the phy-
si cal desi gn of the data warehouse
structure.
KEY WORDS
Data war ehouses, appr oach to the
desi gn of a data war ehouse str uc-
tur e.
Clasificacin: A
15
SISTEMAS
& TELEMTICA
INTRODUCCIN
El desarrol l o de l os Si stemas de I n-
formaci n Gerenci al basados en tec-
nol og as de Data Warehouse y herra-
mi entas Ol ap, es rel ati vamente re-
ci ente y, por l o tanto, no exi ste una
pr opuesta metodol gi ca uni ver sal -
mente vl i da y aceptada como tal , por
l a comuni dad acadmi ca.
Entre l as propuestas ms conoci das
estn: 1. Ral ph Ki mbal l ,
1
con un es-
quema centrado en l a i denti fi caci n
de l os procesos de l a empresa, como
el emento cl ave para l a defi ni ci n de
l a estructura de vari abl es y di men-
si ones; 2. W.H. I nmon,
2
con un esque-
ma que parte de l a construcci n del
model o de datos corporati vos, el abo-
rado al ms al to ni vel de abstracci n,
para l uego deri var l a estructura del
model o de datos, para el di seo de l a
bodega; 3. Gol far el l i Matteo, Mai o
Dar i o, Ri zzi Stefano
3
pr oponen un
esquema que parte de l os model os E-
R descri pti vos de l os si stemas tran-
sacci onal es de l a organi zaci n, para
l uego deri var el model o E-R de l a es-
tructura, para l a bodega de datos.
En este art cul o se presenta una pro-
puesta de si stemati zaci n del proce-
so de di seo de una bodega de datos,
que se aparta de l os esquemas de di -
seo referi dos, y que uti l i za como eje
arti cul ador, l a i denti fi caci n de l a i n-
formaci n gerenci al , para el soporte
de l os procesos de control y de toma
de deci si ones en l os ni vel es di recti -
vos de l a organi zaci n.
MTODO PROPUESTO
El mtodo de di seo propuesto est
centr ado en l a i denti fi caci n de l a
i nformaci n cl ave y rel evante para so-
portar l os procesos de di recci n y de
toma de deci si ones dentro de l a orga-
ni zaci n. Este mtodo uti l i za, como
punto de parti da, l a i denti fi caci n y
el model ado de: qu es lo que el
negocio est tratando de alcan-
zar, para l uego el aborar una estruc-
tura que apoye el proceso de gesti n
haci a el l ogro de l as metas defi ni das.
Una vez que l a i nformaci n cl ave de
apoyo a l os procesos de gesti n y con-
trol de l a organi zaci n ha si do i den-
ti fi cada, se i ni ci a l a el aboraci n del
model o l gi co-conceptual de l a estruc-
tura de l a bodega de datos, que so-
portar l as consul tas y l a expl oraci n
de l os datos, a parti r de l os cual es se
construi rn l os i ndi cadores de gesti n
requeri dos por l os ni vel es di recti vos
de l a organi zaci n.
Para darl e un orden a este proceso
si stmi co de di seo, l os pasos del
mtodo propuesto, tal como se presen-
tan en l a Fi gura 1, se han agrupado
en l as si gui entes fases:
Fase 1: I denti fi caci n de l as ne-
cesi dades de i nformaci n geren-
ci al , desde l a perspecti va del ne-
goci o.
Fase 2: El aboraci n del model o l -
gi co-conceptual de l a estructura
de l a bodega de datos.
1. Ki mbal l R. The Data Warehouse Toolkit. John Wi l ey & Sons, 1996.
2. I nmon W.H. Building The Data Warehouse. QED Press /John Wi l ey & Sons, 1992.
3. Gol farel l i M., Mai o D., Ri zzi S. Conceptual Design of Data Warehouse From E/ R Schemes.
http//www.csr.uni b.i t/~gol fare/db.html , 1998.
16
SISTEMAS
& TELEMTICA
Fase 3: El aboraci n del model o f -
si co de l a bodega de datos.
Fase 1:
Identificacin de las necesidades
de informacin gerencial, desde
la perspectiva del negocio.
La pri mera fase, a parti r de l a cual
se real i za el proceso de di seo de l a
estructura para una bodega de datos,
comprende l a i denti fi caci n de l as ne-
cesi dades de i nformaci n gerenci al ,
l o que si gni fi ca hacer expl ci tos l os
objeti vos y l os factores cl aves de xi -
to de l a organi zaci n, o de un rea
del negoci o.
Es bastante comn empezar este pro-
ceso de i denti fi caci n y model ado
medi ante entrevi stas a l os di recti vos,
en l as cual es l a pregunta central es:
Cul es l a i nformaci n que desea
obtener del si stema de i nformaci n
gerenci al ?. Este enfoque puede resul -
tar muy pel i groso, si el di recti vo no
real i za un proceso si stemti co y orde-
nado, para establ ecer sus necesi dades
de i nformaci n, en rel aci n con sus ac-
ti vi dades de gesti n y control .
Una for ma or denada y si stemti ca
para real i zar esta fase de i denti fi ca-
ci n de l as necesi dades de i nforma-
ci n, que soporte l os procesos de ges-
ti n y control gerenci al , es l a apl i ca-
ci n del enfoque de si stemas, par a
gui ar el proceso de revi si n o defi ni -
ci n de: 1. Los objeti vos estratgi cos
del negoci o o del rea; 2. Los factores
cl ave para el l ogro de l os objeti vos de-
fi ni dos y 3. Los i ndi cadores de con-
trol , tanto de l os objeti vos como de l os
factores cl ave.
4
4. Vase Bahamn Jos H. Construccin de indicadores de gestin bajo el enfoque de sistemas. S&T Revi sta
de l a Facul tad de I ngeni er a, Uni versi dad I cesi . 2003.
17
SISTEMAS
& TELEMTICA
Mtodo para el di seo y model ado de una bodega de datos
Fase 1: I denti fi caci n de l as necesi dades de i nfor-
maci n gerenci al , desde l a perspecti va del negoci o.
Fase 2: El aboraci n del model o l gi co-conceptual
de l a estructura de l a bodega de datos.
2.1. Defi ni r l as tabl as de hechos o l as vari abl es de l a
estructura.
2.2. I denti fi car, para cada tabl a de hechos, l as di men-
si ones que l a referenci an.
2.3. Establ ecer el ni vel de granul aci n y l os ni vel es de
agregaci n.
2.4. El aborar el di agrama en estrel l a que representa
l a estructura de l a bodega.
Fase 3: El aboraci n del model o f si co de l a bodega
de datos.
3.1. Veri fi caci n y ajuste del model o l gi co.
3.2. Defi ni ci n del esquema f si co del al macenami en-
to de l as di mensi ones y sus jerarqu as.
3.3. Defi ni ci n de l os atri butos que conforman l as
tabl as de hechos.
Figura 1. Mtodo para el di seo y model ado de una bodega.
18
SISTEMAS
& TELEMTICA
Como resul tado de esta fase, se ten-
dr una vi si n del negoci o y de l a i n-
formaci n requeri da para l a di recci n
y el control gerenci al , representada
fundamental mente por: Los objeti vos
del negoci o; l os factores cl ave de xi -
to y, en especi al , un conjunto de i ndi -
cadores cl ave de l a gesti n.
Fase 2:
Elaboracin del modelo lgico-
conceptual de la estructura de la
bodega.
En esta fase se el abora el model o l -
gi co de l a estructura de l a bodega, que
soportar l as consul tas, medi ante l as
cual es se obtendr l a i nformaci n re-
quer i da por l os ni vel es di r ecti vos
como apoyo a sus procesos de gesti n
y de toma de deci si ones.
La el aboraci n de este model o l gi co
comi enza con l os i ndi cadores de ges-
ti n (necesi dades de i nformaci n ge-
renci al ), i denti fi cados en l a fase an-
teri or, y termi na con l a construcci n
de una representaci n mul ti di men-
si onal de l as vari abl es que conforman
cada i ndi cador. En esta representa-
ci n mul ti di mensi onal , cada vari abl e
es model ada medi ante un arregl o di -
mensi onal (mul ti di mensi onal ) de cel -
das, como se presenta en l a Fi gura 2.
Para faci l i tar el proceso de el abora-
ci n del model o l gi co, se uti l i za una
representaci n grfi ca denomi nada
di agrama ti po estrel l a, donde el el e-
mento central del esquema es l a Va-
ri abl e o Tabl a de Hechos (Fact), l a
cual es referenci ada por un conjunto
de ejes, denomi nados Di mensi ones, a
travs de l os cual es se sel ecci onan l os
val ores conteni dos en l a tabl a de he-
chos. En l a Fi gura 3, se esquemati za
el model o de un di agrama en estrel l a.
19
SISTEMAS
& TELEMTICA
Figura 2. Vi sta mul ti di mensi onal de una de l as vari abl es que conforman
un i ndi cador.
Figura 3. Di agrama en estrel l a de una estructura mul ti di mensi onal .
20
SISTEMAS
& TELEMTICA
Antes de presentar l os pasos propues-
tos por el mtodo para l a el aboraci n
del model o l gi co, es perti nente pre-
ci sar al gunos de l os trmi nos uti l i za-
dos en el mtodo pr opuesto. En el
Cuadro 1 se presentan l as defi ni ci o-
nes adoptadas par a l os di fer entes
conceptos uti l i zados en el mtodo pro-
puesto.
Cuadro 1:Defi ni ci n de conceptos bsi cos.
Una grfi ca es una red de nodos i nterconectados.
Una grfi ca di recci onal es aquel l a en l a cual l a conexi n entre
dos nodos ti ene una di recci n espec fi ca.
Un model o E-R puede ser consi derado una grfi ca di recci onal .
En una grfi ca, una trayectori a ac cl i ca es aquel l a que sl o
ti ene una forma de recorri do (en un sol o senti do).
Una trayectori a c cl i ca es aquel l a que se puede recorrer en dos
o ms secuenci as di ferentes.
Es l a tabl a central de l a estructura de l a bodega. Esta tabl a
conti ene l os datos de i nters para el negoci o, es deci r, l os val o-
res para l a construcci n de l os i ndi cadores cl aves del negoci o.
Tcni camente, l a tabl a de hechos es una enti dad de i ntersec-
ci n cuya l l ave pri mari a est compuesta por l a uni n de l os
domi ni os de l as di ferentes di mensi ones que l a referenci an.
Las di mensi ones corresponden a l os ejes con l os cual es se cons-
truye l a vi sta mul ti di mensi onal de l a i nformaci n cl ave del ne-
goci o, al macenada en l a tabl a de hechos.
Las atri butos al macenados en l as di mensi ones determi nan l a
granul aci n adoptada para el model o.
Las di mensi ones pueden ser:
Propias: Cuando el conjunto de enti dades que conforman
l a di mensi n se encuentran uni das a l a tabl a de hechos, en
una trayectori a ac cl i ca.
Impropias: Cuando el conjunto de enti dades que confor-
man l a di mensi n se encuentran uni das a l a tabl a de he-
chos, en una trayectori a c cl i ca.
De Informacin: Cuando l os atri butos conteni dos en l a
di mensi n defi nen qu ti po de datos se encuentran al mace-
nados en l a tabl a de hechos.
Determi nan cmo l as i nstanci as de l a tabl a de hechos pueden ser
agregadas. Las jerarquas permiten las operaciones de drill-down
o rol l up, en l os procesos de consul ta.
Una jerarqu a est conformada por el conjunto de enti dades
que consti tuyen l a di mensi n.
Grfi ca
Tr ayector i as c cl i cas
y ac cl i cas
Tabl a de hechos
Di mensi n
Jerarqu as
21
SISTEMAS
& TELEMTICA
A conti nuaci n se presentan l os cua-
tro pasos propuestos para l a si stema-
ti zaci n del proceso de el aboraci n del
model o l gi co:
Paso No. 1:
Definir las tablas de hechos o las
variables de la estructura.
Este paso se real i za a parti r del con-
junto de l os i ndi cadores de gesti n,
defi ni dos en l a fase de i denti fi caci n
de l as necesi dades de i nfor maci n
ger enci al , desde l a per specti va del
negoci o. El paso se i ni ci a con l a eva-
l uaci n de l as vari abl es (di vi sores y
di vi dendos) de cada i ndi cador, para
deter mi nar cul es de stas pueden
ser al macenadas en una tabl a de he-
chos, y cul es no.
En el Cuadro 2 se presenta, a mane-
ra de ejempl o, l a i nformaci n obteni -
da, al apl i car l os pasos de l a fase 1 al
rea de ventas de una organi zaci n.
A parti r de estos resul tados se i den-
ti fi can l as vari abl es o tabl as de he-
chos, como l o establ ece el paso 1 de
esta fase.
Apl i caci n del paso 1: I denti fi caci n
de l as tabl as de hechos
El i ndi cador defi ni do para el mo-
ni tor eo del obj eti vo puede ser
construi do con una sol a tabl a de
hechos: Ventas. Se toma una sol a
vari abl e, por cuanto l as ventas del
ao y l as ventas del ao anteri or,
que son l as dos vari abl es que con-
for man el i ndi cador, se pueden
al macenar en l a mi sma tabl a de
hechos.
El i ndi cador 1 del F.C.E1 puede
ser construi do con dos tabl as de
hechos que son: ventas por ven-
dedor y cuota de ventas de cada
vendedor.
El i ndi cador 2 del F.C.E1 puede
ser construi do con dos tabl as de
hechos que son: nmero de vi si -
tas real i zadas por cada vendedor,
y nmero de vi si tas presupuesta-
das por cada vendedor.
El i ndi cador 1 del F.C.E2 puede
ser construi do con una tabl a de
hechos: nmero de cl i entes nue-
vos en l a base de datos. En este
caso, el denomi nador del i ndi ca-
dor se asume como un ni co val or
y, por l o tanto, no ti ene senti do
al macenarl o en otra tabl a de he-
chos.
Los dems i ndi cadores se anal i -
zan de i gual manera.
En suma, al real i zar el anl i si s de
todos l os i ndi cadores, obtenemos l as
si gui entes tabl as de hecho:
Ventas.
Ventas por vendedor.
Cuota de ventas de cada vende-
dor.
Nmero de vi si tas real i zadas por
cada vendedor.
Nmero de vi si tas presupuesta-
das por cada vendedor.
Nmero de cl i entes nuevos en l a
base de datos.
Nmero de vendedores capaci ta-
dos que aprobaron l os cursos.
22
SISTEMAS
& TELEMTICA
Cuadro 2: I nformaci n gerenci al del rea de ventas,
obteni da al real i zar l a fase 1.
rea del Negocio - Descripcin. Se trabaja con el rea de ventas de una orga-
ni zaci n dedi cada a l a producci n de reci pi entes el aborados en pl sti co.
Objetivo del rea: para propsi tos del ejempl o, se toma el si gui ente objeti vo:
Lograr al final del ao un incremento del 15% en las ventas totales de la
compaa, con respecto a las ventas del ao anterior.
Factores claves de xito. Luego de real i zado el anl i si s de l as acci ones y l as
condi ci ones necesari as para garanti zar el l ogro del objeti vo pl anteado, se i denti -
fi caron l os si gui entes F.C.E:
F.C.E.1: Pl aneaci n y control de l a fuerza de ventas.
F.C.E.2: Bsqueda de nuevos cl i entes rentabl es para l a organi zaci n.
F.C.E.3: Capaci taci n y entrenami ento de l a fuerza de ventas.
Indicadores claves de gestin. Para el control y segui mi ento de l os F.C.E y l os
objeti vos, se proponen l os si gui entes i ndi cadores:
Ventas del ao
I _obj: -1
Ventas del ao anteri or
Ventas del vendedor
I 1_FCE1:
Cuota de ventas
Nmero de vi si tas de venta real i zadas
I 2_FCE1:
Nmero de vi si tas presupuestadas
Nmero de cl i entes nuevos en l a base de datos
I 1_FCE2:
Nmero de cl i entes nuevos presupuestados
Nmero de vendedores capaci tados que aprobaron l os cursos
I 1_FCE3:
Nmero presupuestado de vendedores capaci tados
23
SISTEMAS
& TELEMTICA
Paso No. 2:
Identificar, para cada tabla de
hechos, las dimensiones que la
referencian.
Para cada vari abl e o tabl a de hechos
se i denti fi can, con l a col aboraci n del
usuari o l der del rea de negoci o, l os
ejes de vi sual i zaci n mul ti di mensi o-
nal l os cual es consti tuyen l as di men-
si ones de l a vari abl e.
En este paso, se espera que el usua-
ri o vi sual i ce cada vari abl e, como un
conjunto de val ores al macenados en
una estructura de vari as di mensi o-
nes, donde l os val ores al macenados
son referenci ados por l a combi naci n
de l os val ores defi ni dos para cada eje
(domi ni o de l a di mensi n), tal como
se esquemati za en l a Fi gura 4.
Figura 4: Esquema de una vi sta mul ti di mensi onal de una tabl a de hechos.
Paso 3:
Establecer el nivel de granula-
cin y los niveles de agregacin
de cada dimensin.
Una vez que l as di mensi ones han si do
i denti fi cadas se debe establ ecer, para
cada una de el l as, el menor ni vel de
granul aci n, el cual corresponde al
conjunto de atri butos que referenci an
el mayor ni vel de detal l e deseado
para l a vari abl e o tabl a de hechos.
A manera de ejempl o, se apl i can l os
dos pasos anteri ores para l a Tabl a de
Hechos sobre Ventas, defi ni da en el
ejempl o anteri or.
Apl i caci n del paso 2: I denti fi caci n
de l as di mensi ones.
Supongamos que el gerente de ven-
tas expresa su i nters por vi sual i zar
l a i nformaci n de ventas organi zada
de l a si gui ente manera: pri mero, por
cada producto de l a compa a; en se-
gundo tr mi no, por cada l ugar en
donde se venden l os productos y, fi -
nal mente, por cada semana. Podemos
establ ecer l a necesi dad de uti l i zar
24
SISTEMAS
& TELEMTICA
tres ejes para el aborar l a vi sta mul -
ti di mensi onal (di mensi ones) de l a
Tabl a de Hechos - Ventas:
Di m1: Producto
Di m2: Lugar de venta
Di m3: Ti empo.
Apl i caci n del paso 3: Defi ni ci n del
ni vel de granul aci n.
De acuerdo con l a sol i ci tud del geren-
te, se establ ece para cada di mensi n
l a si gui ente granul aci n:
Dim. Producto: El menor ni vel
de granul aci n es el Tipo de Pro-
ductos. Podemos establ ecer otros
ni vel es como: Lnea de Productos,
que ti ene un ni vel de granul aci n
mayor, pero un menor ni vel de de-
tal l e en l a vari abl e ventas; o Re-
ferencias de Productos, que ti ene
un menor ni vel de gr anul aci n,
pero un mayor ni vel de detal l e.
Dim. Lugar: El ni vel de granu-
l aci n requeri do es l a Ciudad. Se
habr an podi do sel ecci onar otros
ni vel es, como Almacn, que ti ene
un menor ni vel , o Regin, que ti e-
ne uno mayor.
Dim. Tiempo: El menor ni vel de
granul aci n requeri do es l a Sema-
na. Se habr an podi do sel ecci onar
otros ni vel es, como el Da, que ti e-
ne un menor ni vel , o el Mes, que
ti ene uno mayor.
Una vez se han defi ni do l os menores
ni vel es de granul aci n para cada di -
mensi n, se i denti fi can l os ni vel es de
agregaci n requeri dos para l os val o-
res al macenados en l a tabl a de he-
chos, por cada di mensi n. Estos ni -
vel es de agr egaci n r epr esentan l a
jerarqu a de cada di mensi n.
J erarqua en la Dim. Produc-
to: Las ventas por productos pue-
den ser agregadas por grupos de
productos, por l neas de produc-
tos y, por el total de l a venta. De
esta manera, l os ni vel es de agre-
gaci n de l a di mensi n producto
son:
Por grupos de productos.
Por l neas de productos.
Total .
J erarqua en la Dim. Lugar:
Las ventas por l ugar pueden ser
agregadas por regi ones y por el
total del pa s.
J erarqua en la Dim. Tiempo:
Las ventas por ti empo pueden ser
agregadas por mes, por tri mestre,
por semestre, por ao.
Paso 4:
Elaborar el diagrama en estrella
que representa la estructura de
la bodega.
Luego de i denti fi car l os el ementos
que confor man l a estr uctur a de l a
vi sta mul ti di mensi onal , de l a i nfor-
maci n ger enci al r equer i da por l a
organi zaci n, se pasa a l a el aboraci n
de una representaci n grfi ca, en for-
ma de estrel l a; para el l o se puede uti -
l i zar l a notaci n si mpl i fi cada de l os
di agramas E-R, o l a notaci n deno-
mi nada Dot model i ng.
5
5. Todman, Chri s. Designing a Data Warehouse: Supporting Customer Relationship. Prenti ce Hal l , 2001.
25
SISTEMAS
& TELEMTICA
Notacin tipo E-R:
En esta notaci n, el di agrama en es-
trel l a est conformado por una enti -
dad central asoci ati va, que correspon-
de a l a tabl a de hechos, y por un con-
junto de trayectori as de enti dades y
rel aci ones de uno a muchos, que co-
rresponde a l as di mensi ones y a sus
jerarqu as. En l a Fi gura 5 se presen-
ta un di agrama en estrel l a con esta
notaci n.
Figura 5. Representaci n de un di agrama en estrel l a, medi ante l a
notaci n ti po E-R.
Notacin Dot Modeling
En esta notaci n, el di agrama en es-
trel l a est conformado por una enti -
dad central que corresponde a l a Ta-
bl a de Hechos, y por un conjunto de
trayectori as compuestas por puntos
(dots), que representan l as di men-
si ones y sus jerarqu as. En l a Fi gura
6 se presenta un di agrama en estre-
l l a con esta notaci n.
Figura 6. Representaci n de un di agrama en estrel l a, medi ante l a
notaci n Dot Model i ng.
26
SISTEMAS
& TELEMTICA
A manera de ejempl o se presenta en
l a Fi gura 7, el di agrama en estrel l a,
con notaci n Dot Model i ng, para l a
Tabl a de Hechos y para l as di men-
si ones i denti fi cadas en el ejempl o
anteri or. En l a Fi gura 8 se represen-
tan l os mi smos el ementos de l a es-
tructura de l a bodega, pero con nota-
ci n ti po E-R.
Figura 7. Representaci n, medi ante l a notaci n Dot Model i ng, de l a
estructura para l a bodega de datos del ejempl o anteri or.
Figura 8. Representaci n, medi ante l a notaci n E-R, de l a estructura para
l a bodega de datos del ejempl o anteri or.
27
SISTEMAS
& TELEMTICA
Fase 3:
Elaboracin de la estructura f-
sica de la bodega
Durante esta fase, se real i za l a trans-
formaci n del model o l gi co concep-
tual en l a estructura f si ca, que pos-
ter i or mente ser i mpl ementada en
al guna herrami enta de Data Ware-
house.
Este pr oceso de tr ansfor maci n se
real i za medi ante l os si gui entes pasos:
1. Ver i fi caci n y r efi nami ento del
model o l gi co para determi nar su con-
si stenci a. 2. Defi ni ci n del esquema
f si co de al macenami ento de l as es-
tructuras jerrqui cas de l as di men-
si ones. 3. I denti fi caci n de l os atri -
butos que confor man l as tabl as de
hechos y l as di mensi ones.
Paso 1:
Verificacin y ajuste
del modelo lgico.
Durante este paso, se real i za l a veri -
fi caci n del model o l gi co, obteni do en
l a fase anteri or, para garanti zar que
el model o, adems de soportar todas
l as consul tas requeri das por l os ni -
vel es ejecuti vos, si empre retorne i n-
formaci n confi abl e.
Para i ni ci ar este proceso de veri fi ca-
ci n se debe el aborar una matri z de
cr uce, entr e l os r equer i mi entos de
i nformaci n gerenci al , defi ni dos en l a
fase i ni ci al , y l as estructuras (estre-
l l as), defi ni das en l a fase anteri or. En
l a matri z de cruce se confi rma si el
r equer i mi ento est compl etamente
soportado. Si esta veri fi caci n no es
correcta, se debe retornar a l a fase
anteri or, para i ncorporar l as estruc-
turas que soporten l os requeri mi en-
tos fal tantes de i nformaci n.
Ter mi nada l a r evi si n anter i or, el
proceso conti na con l a eval uaci n de
l a estructura, para asegurar l a val i -
dez de todas l as consul tas de i nfor-
maci n real i zadas sobre di cha estruc-
tura.
Para real i zar este proceso de compro-
baci n de val i dez de l a estr uctur a,
recurri mos a l a teor a de grafos, se-
gn l a cual una estructura de consul -
ta es vl i da cuando est conformada
por trayectori as ac cl i cas. Al apl i car
esta teor a, se puede afi r mar que
cual qui er di seo para una bodega de
datos permi ti r si empre consul tas co-
r r ectas, si l a estr uctur a pr opuesta
est conformada ni camente por di -
mensi ones propi as, es deci r, por tra-
yectori as ac cl i cas.
Si al real i zar l a comprobaci n de l a
estr uctur a se encuentr an tr ayecto-
ri as ac cl i cas, stas deben ser trans-
formadas, para asegurar l a confi abi -
l i dad de l as consul tas. Las posi bl es
transformaci ones son:
6
1. Ajuste para los casos de trayecto-
rias cclicas simples
Este caso ocurre cuando l a trayecto-
ri a de una di mensi n presenta una
trayectori a al terna que ti ene dos en-
ti dades comunes. En l a Fi gura 9, se
esquemati za una trayectori a c cl i ca
si mpl e.
6. Mcguff, F. Designing the perfect Data Warehouse. 1998.
28
SISTEMAS
& TELEMTICA
Figura 9. Di mensi n con trayectori a c cl i ca.
2. Ajuste para los casos de trayecto-
rias alternas, mezcladas con trayec-
torias cclicas.
Se presenta cuando l a trayectori a de
una di mensi n est conformada por
una trayectori a al terna, ms una tra-
yectori a c cl i ca, tal como se esquema-
ti za en l a Fi gura 10.
Figura 10. Di mensi n con trayectori a al terna, ms trayectori a c cl i ca.
Las opci ones de transformaci n para
esta cl ase de trayectori as son:
Tratar cada trayectori a como una
nueva di mensi n, l o cual si gni fi -
ca redi bujar el di agrama, el i mi -
nando l as rel aci ones N1-A2 y A3-
N4, para l uego crear l a rel aci n:
Tabl a de Hechos - A2.
Converti r l a trayectori a c cl i ca en
una trayectori a al terna, el i mi nan-
do l a rel aci n A3-N4.
29
SISTEMAS
& TELEMTICA
En estos casos, el probl ema ocurre con
l a trayectori a c cl i ca; por l o tanto, l a
transformaci n se maneja como se ex-
pl i c en el caso anteri or.
Paso 2:
Definicin del esquema fsico del
almacenamiento de las dimensio-
nes y sus jerarquas.
El model o en estrel l a que conforma
l a estructura l gi ca propuesta para
l a bodega de datos, debe ser conver-
ti do en una estr uctur a total mente
desnormal i zada, tal como se presen-
ta en l a Fi gura 11. Este model o f si co
est confor mado por una tabl a de
hechos, y por l as enti dades en l as cua-
l es se al macenarn l os domi ni os de
l as di mensi ones con sus correspon-
di entes ni vel es jerrqui cos.
Figura 11. Model o l gi co en estrel l a, y model o f si co de l a bodega.
Para el proceso de conversi n de cada
una de l as trayectori as que confor-
man el model o en estrel l a, en enti da-
des desnormal i zadas, se puede uti l i -
zar uno de l os si gui entes esquemas
de conversi n.
7
1. Conversin vertical
o recursiva
En esta conversi n, se uti l i za una l l a-
ve pri mari a ni ca, para cada di men-
si n. El domi ni o de esta l l ave pri ma-
ri a se obti ene medi ante l a uni n de
todos l os domi ni os de l as enti dades
que conforman l a trayectori a de l a
di mensi n, es deci r, si l os domi ni os
de l as enti dades que confor man l a
trayectori a son: {enero, febrero, mar-
zo, abr i l ....}; {1er _tr i m, 2_tr i m,
3er _tr i m, 4_tr i m}; {1er _s em,
2_sem}, el domi ni o de l a l l ave pri ma-
ri a ser: {enero, febrero, marzo, abri l ,
...., 1er _tr i m, 2_tr i m, 3er _tr i m,
4_tri m; 1er_sem,2_sem}. En l a Fi -
gura 12 se presenta, de manera gr-
fi ca, este esquema de conversi n.
7. Mcguff, F. Designing the perfect Data Warehouse. 1998.
30
SISTEMAS
& TELEMTICA
Figura 12. Conversi n verti cal de l a trayectori a de una di mensi n.
Adi ci onal mente, en este esquema de
conversi n a cada val or del domi ni o
se l e asoci a un val or padre, el cual
tambi n pertenece al domi ni o; de esta
manera se i mpl ementa l a jerarqu a
defi ni da en l a trayectori a, represen-
tada en l a di mensi n, dentro del mo-
del o en estrel l a.
Este esquema para el manejo de l as
jerarqu as (i d_di mensi n, i d_padre)
permi te i mpl ementar fci l mente l a
oper aci n de des en r ol l e (dr i l l -
down), cuando se real i zan consul tas
a l a bodega de datos. Si n embargo,
esta estr uctur a es efi ci ente, si l as
agregaci ones para cada ni vel jerr-
qui co son precal cul adas y al macena-
das en l a bodega.
Este esquema de conversi n es el ms
r ecomendado par a i mpl ementar l a
estructura f si ca de una bodega, cuan-
do l as di mensi ones estn compuestas
por jerarqu as desbal anceadas.
2. Conversin horizontal
En esta conversi n, l a l l ave pri mari a
de l a di mensi n se confor ma como
una l l ave compuesta por l as l l aves de
cada una de l as enti dades que con-
for man l a tr ayector i a de l a di men-
si n. En l a Fi gura 13 se presenta, de
manera grfi ca, este esquema de con-
versi n.
Figura 13: Conversi n hori zontal de l a trayectori a de una di mensi n.
31
SISTEMAS
& TELEMTICA
Este esquema de conversi n es el ms
recomendabl e, si l as agregaci ones de
datos se real i zan de manera di nmi ca.
Paso 3:
Definicin de los atributos que
conforman las tablas de hechos
y las dimensiones del modelo.
En este paso fi nal , se i denti fi can para
cada tabl a de hechos y cada di men-
si n l as caracter sti cas de l os atri bu-
tos que conforman cada estructura.
Una vez asi gnados todos l os atri bu-
tos, se real i za un anl i si s cruzado en-
tr e l a tabl a de hechos y l as di men-
si ones, par a establ ecer l os ti pos de
cl cul o matemti co que pueden ser
real i zados, sobre l a tabl a de hechos.
La especi fi caci n de l os atri butos que
conforman l a tabl a de hechos se debe
real i zar si gui endo el formato que apa-
rece en el Cuadro 3.
Cuadro 3: Formato para l a defi ni ci n de l os atri butos
de una tabl a de hechos.
I gual mente, para l a especi fi caci n de l os atri butos que conforman l as di men-
si ones se debe uti l i zar el formato que aparece en el Cuadro 4.
Cuadro 4: Formato para l a defi ni ci n
de l os atri butos de una di mensi n.
32
SISTEMAS
& TELEMTICA
Fi nal mente, se deben establ ecer l os
ti pos de cl cul os matemti cos como
suma, conteo, pr omedi o, m ni mo,
mxi mo, que pueden ser apl i cados a
l os val ores al macenados en l as tabl as
de hechos. El resul tado de esta revi -
si n debe quedar consi gnado en una
matri z de cruce, como l a presentada
en el Cuadro 5.
A manera de ejempl o, se presenta en l os si gui entes cuadros l a defi ni ci n de
atri butos para l a tabl a de hechos y para l as di mensi ones defi ni das en el ejem-
pl o anteri or, y esquemati zadas en l a Fi gura 7.
Tabl a de hechos
Atri buto 1
Dimensiones Suma Conteo Prom. Mn. Mx.
1. Di mensi n a
2. Di mensi n b
3. Di mensi n c
.....
Atri buto 2
Dimensiones Suma Conteo Prom. Mn. Mx.
1. Di mensi n a
2. Di mensi n b
3. Di mensi n c
Atri buto 3
Dimensiones Suma Conteo Prom. Mn. Mx.
1. Di mensi n a
2. Di mensi n b
3. Di mensi n c
....
Cuadro 5: Operaci ones matemti cas
para cada atri buto de l a tabl a de hechos.
33
SISTEMAS
& TELEMTICA
Cuadro 6: Defi ni ci n de l os atri butos de l a tabl a de hechos sobre ventas.
Nombre de l a estructura de l a bodega rea de ventas
Tabl a de hechos Ventas
Atributos tipo Pk Descripcin
I d l ugar C(35) S I denti f. de l a di mensi n l ugar
I d ti empo C(12) S I denti f. de l a di mensi n ti empo
i d producto C(30) S I denti f. de l a di mensi n producto
Uni dades vendi das N(8,0) Valor 1 de la tabla de hechos
Pesos-venta N(10,2) Valor 2 de la tabla de hechos
Cuadro 7: Defi ni ci n de l os atri butos de l as di mensi ones,
para l a estructura de ventas.
Nombre de la estructura de la bodega
Nombre de la estructura de la bodega
Nombre de la estructura de la bodega
34
SISTEMAS
& TELEMTICA
Cuadro 8: Operaci ones matemti cas para cada atri buto
de l a tabl a de hechos sobre ventas.
Tabl a de hechos Ventas
Atri buto 1 Uni dades vendi das
Dimensiones Suma Conteo Prom Mn Mx
Lugar
Ti empo
Producto
Atri buto 2 Pesos-venta
Dimensiones Suma Conteo Prom Mn Mx
Lugar
Ti empo
Producto
CONCLUSIN
Medi ante l a apl i caci n del enfoque de
Si stemas para l a defi ni ci n de l os i n-
di cadores cl aves de gesti n de l a or-
gani zaci n, se ha l ogr ado ar ti cul ar
una propuesta para model ar, de ma-
nera ordenada y si stmi ca, l as estruc-
turas de l as bodegas de datos que ser-
vi rn de soporte a l a i mpl ementaci n
de si stemas de i nformaci n gerenci al ,
hechos a l a medi da de l as necesi da-
des de i nfor maci n de l a ger enci a.
Esta propuesta faci l i ta, ordena y si s-
temati za un proceso que en al gunas
organi zaci ones se real i za de manera
i ntui ti va y, en otras medi ante l a uti -
l i zaci n de estr uctur as de bodegas
que han si do defi ni das para otras or-
gani zaci ones. El model o propuesto,
que se aparta de muchos de l os enfo-
ques presentados por l os i nvesti gado-
res en este campo, se convi erte en una
opci n vl i da para el di seo de si ste-
mas de i nformaci n gerenci al , en par-
ti cul ar para el di seo de bodegas de
datos depar tamental i zadas (Data
Marts).
35
SISTEMAS
& TELEMTICA
BIBLIOGRAFA
Mcguff, F. Designing the perfect
Data War ehouse. 1998. http://
members.aol .com/fmcguff/dwmo-
del /i ndex.htm
Ki mbal l R. The Data Warehouse
Toolkit. John Wi l ey & Sons, 1996.
I nmon W.H. Building The Data
Warehouse. QED Pr ess /Jhon
Wi l ey, 1992.
Gol farel l i , M; Mai o, D; Ri zzi , S.
Conceptual Design of Data Ware-
house From E/ R schemes. http//
www.csr.uni b.i t/~gol fare/db.html ,
1998.
Bahamn, J. H. Construccin de
indicadores de gestin bajo el en-
foque de sistemas. S&T Revi sta de
l a Facul tad de I ngeni er a, Uni ver-
si dad I cesi . 2003.
Chuck, B; Di ck, H; Don, S; Rhon-
da; Eunsaeng, K.; Ann, V. Data
Model i ng Techni ques for Data
Warehouse. I BM. 1998.
Todman, C. Desi gni ng a Data
Warehouse: Supporting Customer
Relationship. Prenti ce Hal l . 2001
CURRCULO
J os Hernando Bahamn L. I nge-
ni ero El ectrni co de l a Uni versi dad
del Cauca, especi al i sta en Admi ni s-
traci n de l a Uni versi dad I cesi y ma-
g ster en Di recci n Uni versi tari a de
l a Uni versi dad de l os Andes. Profe-
sor i nvesti gador de l a Uni ver si dad
I cesi . Vi ncul ado a l a Uni versi dad I ce-
si desde 1988. Ha si do jefe del Depar-
tamento Acadmi co de Si stemas
(1988-1998), Di rector del programa
de I ngeni er a de Si stemas (1998-
2000), y en l a actual i dad es el Di rec-
tor Acadmi co de l a Uni versi dad.
36
SISTEMAS
& TELEMTICA

También podría gustarte