Documentos de Académico
Documentos de Profesional
Documentos de Cultura
928 959 1 PB PDF
928 959 1 PB PDF
SISTEMAS
& TELEMTICA 13
house Data technologies and Olap information requirements from a bu-
tools is relatively new. Therefore, the- siness perspective. The second one
re is no valid methodological appro- deals with all the activities associa-
ach that is generally accepted as such ted with the preparation of a logical
by the academic community. conceptual model for the data ware-
house structure, and the third stage
This article presents a methodologi-
includes the steps to make the phy-
cal approach to the design of a data
sical design of the data warehouse
warehouse using the identification of
structure.
management information require-
ments as a shaft that supports the
KEY WORDS
control and decision-making proces-
ses. The suggested approach consists Data warehouses, approach to the
of eight steps grouped in three diffe- design of a data warehouse struc-
rent stages. The first stage encompas- ture.
ses the identification of management Clasificacin: A
14 SISTEMAS
& TELEMTICA
INTRODUCCIN MTODO PROPUESTO
El desarrollo de los Sistemas de In- El mtodo de diseo propuesto est
formacin Gerencial basados en tec- centrado en la identificacin de la
nologas de Data Warehouse y herra- informacin clave y relevante para so-
mientas Olap, es relativamente re- portar los procesos de direccin y de
ciente y, por lo tanto, no existe una toma de decisiones dentro de la orga-
propuesta metodolgica universal- nizacin. Este mtodo utiliza, como
mente vlida y aceptada como tal, por punto de partida, la identificacin y
la comunidad acadmica. el modelado de: qu es lo que el
negocio est tratando de alcan-
Entre las propuestas ms conocidas
zar, para luego elaborar una estruc-
estn: 1. Ralph Kimball,1 con un es-
tura que apoye el proceso de gestin
quema centrado en la identificacin
hacia el logro de las metas definidas.
de los procesos de la empresa, como
elemento clave para la definicin de Una vez que la informacin clave de
la estructura de variables y dimen- apoyo a los procesos de gestin y con-
siones; 2. W.H. Inmon,2 con un esque- trol de la organizacin ha sido iden-
ma que parte de la construccin del tificada, se inicia la elaboracin del
modelo de datos corporativos, elabo- modelo lgico-conceptual de la estruc-
rado al ms alto nivel de abstraccin, tura de la bodega de datos, que so-
para luego derivar la estructura del portar las consultas y la exploracin
modelo de datos, para el diseo de la de los datos, a partir de los cuales se
bodega; 3. Golfarelli Matteo, Maio construirn los indicadores de gestin
Dario, Rizzi Stefano3 proponen un requeridos por los niveles directivos
esquema que parte de los modelos E- de la organizacin.
R descriptivos de los sistemas tran-
Para darle un orden a este proceso
saccionales de la organizacin, para
sistmico de diseo, los pasos del
luego derivar el modelo E-R de la es-
mtodo propuesto, tal como se presen-
tructura, para la bodega de datos.
tan en la Figura 1, se han agrupado
En este artculo se presenta una pro- en las siguientes fases:
puesta de sistematizacin del proce-
Fase 1: Identificacin de las ne-
so de diseo de una bodega de datos,
cesidades de informacin geren-
que se aparta de los esquemas de di-
cial, desde la perspectiva del ne-
seo referidos, y que utiliza como eje
gocio.
articulador, la identificacin de la in-
formacin gerencial, para el soporte Fase 2: Elaboracin del modelo l-
de los procesos de control y de toma gico-conceptual de la estructura
de decisiones en los niveles directi- de la bodega de datos.
vos de la organizacin.
1. Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996.
2. Inmon W.H. Building The Data Warehouse. QED Press / John Wiley & Sons, 1992.
3. Golfarelli M., Maio D., Rizzi S. Conceptual Design of Data Warehouse From E/R Schemes.
http//www.csr.unib.it/~golfare/db.html, 1998.
SISTEMAS
& TELEMTICA 15
Fase 3: Elaboracin del modelo f- Cul es la informacin que desea
sico de la bodega de datos. obtener del sistema de informacin
gerencial?. Este enfoque puede resul-
tar muy peligroso, si el directivo no
Fase 1: realiza un proceso sistemtico y orde-
Identificacin de las necesidades nado, para establecer sus necesidades
de informacin gerencial, desde de informacin, en relacin con sus ac-
la perspectiva del negocio. tividades de gestin y control.
La primera fase, a partir de la cual Una forma ordenada y sistemtica
se realiza el proceso de diseo de la para realizar esta fase de identifica-
estructura para una bodega de datos, cin de las necesidades de informa-
comprende la identificacin de las ne- cin, que soporte los procesos de ges-
cesidades de informacin gerencial, tin y control gerencial, es la aplica-
lo que significa hacer explcitos los cin del enfoque de sistemas, para
objetivos y los factores claves de xi- guiar el proceso de revisin o defini-
to de la organizacin, o de un rea cin de: 1. Los objetivos estratgicos
del negocio. del negocio o del rea; 2. Los factores
clave para el logro de los objetivos de-
Es bastante comn empezar este pro-
finidos y 3. Los indicadores de con-
ceso de identificacin y modelado
trol, tanto de los objetivos como de los
mediante entrevistas a los directivos,
factores clave.4
en las cuales la pregunta central es:
4. Vase Bahamn Jos H. Construccin de indicadores de gestin bajo el enfoque de sistemas. S&T Revista
de la Facultad de Ingeniera, Universidad Icesi. 2003.
16 SISTEMAS
& TELEMTICA
Mtodo para el diseo y modelado de una bodega de datos
SISTEMAS
& TELEMTICA 17
Como resultado de esta fase, se ten- tin (necesidades de informacin ge-
dr una visin del negocio y de la in- rencial), identificados en la fase an-
formacin requerida para la direccin terior, y termina con la construccin
y el control gerencial, representada de una representacin multidimen-
fundamentalmente por: Los objetivos sional de las variables que conforman
del negocio; los factores clave de xi- cada indicador. En esta representa-
to y, en especial, un conjunto de indi- cin multidimensional, cada variable
cadores clave de la gestin. es modelada mediante un arreglo di-
mensional (multidimensional) de cel-
Fase 2: das, como se presenta en la Figura 2.
Elaboracin del modelo lgico-
Para facilitar el proceso de elabora-
conceptual de la estructura de la
cin del modelo lgico, se utiliza una
bodega.
representacin grfica denominada
En esta fase se elabora el modelo l- diagrama tipo estrella, donde el ele-
gico de la estructura de la bodega, que mento central del esquema es la Va-
soportar las consultas, mediante las riable o Tabla de Hechos (Fact), la
cuales se obtendr la informacin re- cual es referenciada por un conjunto
querida por los niveles directivos de ejes, denominados Dimensiones, a
como apoyo a sus procesos de gestin travs de los cuales se seleccionan los
y de toma de decisiones. valores contenidos en la tabla de he-
chos. En la Figura 3, se esquematiza
La elaboracin de este modelo lgico
el modelo de un diagrama en estrella.
comienza con los indicadores de ges-
18 SISTEMAS
& TELEMTICA
Figura 2. Vista multidimensional de una de las variables que conforman
un indicador.
SISTEMAS
& TELEMTICA 19
Antes de presentar los pasos propues- Cuadro 1 se presentan las definicio-
tos por el mtodo para la elaboracin nes adoptadas para los diferentes
del modelo lgico, es pertinente pre- conceptos utilizados en el mtodo pro-
cisar algunos de los trminos utiliza- puesto.
dos en el mtodo propuesto. En el
Trayectorias cclicas En una grfica, una trayectoria acclica es aquella que slo
y acclicas tiene una forma de recorrido (en un solo sentido).
Una trayectoria cclica es aquella que se puede recorrer en dos
o ms secuencias diferentes.
Dimensin Las dimensiones corresponden a los ejes con los cuales se cons-
truye la vista multidimensional de la informacin clave del ne-
gocio, almacenada en la tabla de hechos.
Las atributos almacenados en las dimensiones determinan la
granulacin adoptada para el modelo.
Las dimensiones pueden ser:
Propias: Cuando el conjunto de entidades que conforman
la dimensin se encuentran unidas a la tabla de hechos, en
una trayectoria acclica.
Impropias: Cuando el conjunto de entidades que confor-
man la dimensin se encuentran unidas a la tabla de he-
chos, en una trayectoria cclica.
De Informacin: Cuando los atributos contenidos en la
dimensin definen qu tipo de datos se encuentran almace-
nados en la tabla de hechos.
20 SISTEMAS
& TELEMTICA
A continuacin se presentan los cua- El indicador 1 del F.C.E1 puede
tro pasos propuestos para la sistema- ser construido con dos tablas de
tizacin del proceso de elaboracin del hechos que son: ventas por ven-
modelo lgico: dedor y cuota de ventas de cada
vendedor.
Paso No. 1:
El indicador 2 del F.C.E1 puede
Definir las tablas de hechos o las
ser construido con dos tablas de
variables de la estructura.
hechos que son: nmero de visi-
Este paso se realiza a partir del con- tas realizadas por cada vendedor,
junto de los indicadores de gestin, y nmero de visitas presupuesta-
definidos en la fase de identificacin das por cada vendedor.
de las necesidades de informacin
El indicador 1 del F.C.E2 puede
gerencial, desde la perspectiva del
ser construido con una tabla de
negocio. El paso se inicia con la eva-
hechos: nmero de clientes nue-
luacin de las variables (divisores y
vos en la base de datos. En este
dividendos) de cada indicador, para
caso, el denominador del indica-
determinar cules de stas pueden
dor se asume como un nico valor
ser almacenadas en una tabla de he-
y, por lo tanto, no tiene sentido
chos, y cules no.
almacenarlo en otra tabla de he-
En el Cuadro 2 se presenta, a mane- chos.
ra de ejemplo, la informacin obteni-
Los dems indicadores se anali-
da, al aplicar los pasos de la fase 1 al
zan de igual manera.
rea de ventas de una organizacin.
A partir de estos resultados se iden- En suma, al realizar el anlisis de
tifican las variables o tablas de he- todos los indicadores, obtenemos las
chos, como lo establece el paso 1 de siguientes tablas de hecho:
esta fase.
Ventas.
Aplicacin del paso 1: Identificacin
Ventas por vendedor.
de las tablas de hechos
Cuota de ventas de cada vende-
El indicador definido para el mo-
dor.
nitoreo del objetivo puede ser
construido con una sola tabla de Nmero de visitas realizadas por
hechos: Ventas. Se toma una sola cada vendedor.
variable, por cuanto las ventas del Nmero de visitas presupuesta-
ao y las ventas del ao anterior, das por cada vendedor.
que son las dos variables que con-
forman el indicador, se pueden Nmero de clientes nuevos en la
almacenar en la misma tabla de base de datos.
hechos. Nmero de vendedores capacita-
dos que aprobaron los cursos.
SISTEMAS
& TELEMTICA 21
Cuadro 2: Informacin gerencial del rea de ventas,
obtenida al realizar la fase 1.
rea del Negocio - Descripcin. Se trabaja con el rea de ventas de una orga-
nizacin dedicada a la produccin de recipientes elaborados en plstico.
Objetivo del rea: para propsitos del ejemplo, se toma el siguiente objetivo:
Lograr al final del ao un incremento del 15% en las ventas totales de la
compaa, con respecto a las ventas del ao anterior.
Factores claves de xito. Luego de realizado el anlisis de las acciones y las
condiciones necesarias para garantizar el logro del objetivo planteado, se identi-
ficaron los siguientes F.C.E:
F.C.E.1: Planeacin y control de la fuerza de ventas.
F.C.E.2: Bsqueda de nuevos clientes rentables para la organizacin.
F.C.E.3: Capacitacin y entrenamiento de la fuerza de ventas.
Indicadores claves de gestin. Para el control y seguimiento de los F.C.E y los
objetivos, se proponen los siguientes indicadores:
Ventas del ao
I_obj: -1
Ventas del ao anterior
22 SISTEMAS
& TELEMTICA
Paso No. 2: En este paso, se espera que el usua-
Identificar, para cada tabla de rio visualice cada variable, como un
hechos, las dimensiones que la conjunto de valores almacenados en
referencian. una estructura de varias dimensio-
nes, donde los valores almacenados
Para cada variable o tabla de hechos
son referenciados por la combinacin
se identifican, con la colaboracin del
de los valores definidos para cada eje
usuario lder del rea de negocio, los
(dominio de la dimensin), tal como
ejes de visualizacin multidimensio-
se esquematiza en la Figura 4.
nal los cuales constituyen las dimen-
siones de la variable.
SISTEMAS
& TELEMTICA 23
tres ejes para elaborar la vista mul- chos, por cada dimensin. Estos ni-
tidimensional (dimensiones) de la veles de agregacin representan la
Tabla de Hechos - Ventas: jerarqua de cada dimensin.
Dim1: Producto Jerarqua en la Dim. Produc-
to: Las ventas por productos pue-
Dim2: Lugar de venta
den ser agregadas por grupos de
Dim3: Tiempo. productos, por lneas de produc-
tos y, por el total de la venta. De
Aplicacin del paso 3: Definicin del
esta manera, los niveles de agre-
nivel de granulacin.
gacin de la dimensin producto
De acuerdo con la solicitud del geren- son:
te, se establece para cada dimensin
Por grupos de productos.
la siguiente granulacin:
Dim. Producto: El menor nivel Por lneas de productos.
de granulacin es el Tipo de Pro- Total.
ductos. Podemos establecer otros
Jerarqua en la Dim. Lugar:
niveles como: Lnea de Productos,
Las ventas por lugar pueden ser
que tiene un nivel de granulacin
agregadas por regiones y por el
mayor, pero un menor nivel de de-
total del pas.
talle en la variable ventas; o Re-
ferencias de Productos, que tiene Jerarqua en la Dim. Tiempo:
un menor nivel de granulacin, Las ventas por tiempo pueden ser
pero un mayor nivel de detalle. agregadas por mes, por trimestre,
por semestre, por ao.
Dim. Lugar: El nivel de granu-
lacin requerido es la Ciudad. Se
habran podido seleccionar otros
Paso 4:
niveles, como Almacn, que tiene
Elaborar el diagrama en estrella
un menor nivel, o Regin, que tie-
que representa la estructura de
ne uno mayor.
la bodega.
Dim. Tiempo: El menor nivel de
Luego de identificar los elementos
granulacin requerido es la Sema-
que conforman la estructura de la
na. Se habran podido seleccionar
vista multidimensional, de la infor-
otros niveles, como el Da, que tie-
macin gerencial requerida por la
ne un menor nivel, o el Mes, que
organizacin, se pasa a la elaboracin
tiene uno mayor.
de una representacin grfica, en for-
Una vez se han definido los menores ma de estrella; para ello se puede uti-
niveles de granulacin para cada di- lizar la notacin simplificada de los
mensin, se identifican los niveles de diagramas E-R, o la notacin deno-
agregacin requeridos para los valo- minada Dot modeling.5
res almacenados en la tabla de he-
5. Todman, Chris. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall, 2001.
24 SISTEMAS
& TELEMTICA
Notacin tipo E-R: junto de trayectorias de entidades y
En esta notacin, el diagrama en es- relaciones de uno a muchos, que co-
trella est conformado por una enti- rresponde a las dimensiones y a sus
dad central asociativa, que correspon- jerarquas. En la Figura 5 se presen-
de a la tabla de hechos, y por un con- ta un diagrama en estrella con esta
notacin.
SISTEMAS
& TELEMTICA 25
A manera de ejemplo se presenta en anterior. En la Figura 8 se represen-
la Figura 7, el diagrama en estrella, tan los mismos elementos de la es-
con notacin Dot Modeling, para la tructura de la bodega, pero con nota-
Tabla de Hechos y para las dimen- cin tipo E-R.
siones identificadas en el ejemplo
26 SISTEMAS
& TELEMTICA
Fase 3: soportado. Si esta verificacin no es
Elaboracin de la estructura f- correcta, se debe retornar a la fase
sica de la bodega anterior, para incorporar las estruc-
turas que soporten los requerimien-
Durante esta fase, se realiza la trans-
tos faltantes de informacin.
formacin del modelo lgico concep-
tual en la estructura fsica, que pos- Terminada la revisin anterior, el
teriormente ser implementada en proceso contina con la evaluacin de
alguna herramienta de Data Ware- la estructura, para asegurar la vali-
house. dez de todas las consultas de infor-
macin realizadas sobre dicha estruc-
Este proceso de transformacin se
tura.
realiza mediante los siguientes pasos:
1. Verificacin y refinamiento del Para realizar este proceso de compro-
modelo lgico para determinar su con- bacin de validez de la estructura,
sistencia. 2. Definicin del esquema recurrimos a la teora de grafos, se-
fsico de almacenamiento de las es- gn la cual una estructura de consul-
tructuras jerrquicas de las dimen- ta es vlida cuando est conformada
siones. 3. Identificacin de los atri- por trayectorias acclicas. Al aplicar
butos que conforman las tablas de esta teora, se puede afirmar que
hechos y las dimensiones. cualquier diseo para una bodega de
datos permitir siempre consultas co-
rrectas, si la estructura propuesta
Paso 1: est conformada nicamente por di-
Verificacin y ajuste mensiones propias, es decir, por tra-
del modelo lgico. yectorias acclicas.
Durante este paso, se realiza la veri- Si al realizar la comprobacin de la
ficacin del modelo lgico, obtenido en estructura se encuentran trayecto-
la fase anterior, para garantizar que rias acclicas, stas deben ser trans-
el modelo, adems de soportar todas formadas, para asegurar la confiabi-
las consultas requeridas por los ni- lidad de las consultas. Las posibles
veles ejecutivos, siempre retorne in- transformaciones son:6
formacin confiable.
Para iniciar este proceso de verifica- 1. Ajuste para los casos de trayecto-
cin se debe elaborar una matriz de rias cclicas simples
cruce, entre los requerimientos de Este caso ocurre cuando la trayecto-
informacin gerencial, definidos en la ria de una dimensin presenta una
fase inicial, y las estructuras (estre- trayectoria alterna que tiene dos en-
llas), definidas en la fase anterior. En tidades comunes. En la Figura 9, se
la matriz de cruce se confirma si el esquematiza una trayectoria cclica
requerimiento est completamente simple.
SISTEMAS
& TELEMTICA 27
Figura 9. Dimensin con trayectoria cclica.
28 SISTEMAS
& TELEMTICA
En estos casos, el problema ocurre con la bodega de datos, debe ser conver-
la trayectoria cclica; por lo tanto, la tido en una estructura totalmente
transformacin se maneja como se ex- desnormalizada, tal como se presen-
plic en el caso anterior. ta en la Figura 11. Este modelo fsico
est conformado por una tabla de
Paso 2: hechos, y por las entidades en las cua-
Definicin del esquema fsico del les se almacenarn los dominios de
almacenamiento de las dimensio- las dimensiones con sus correspon-
nes y sus jerarquas. dientes niveles jerrquicos.
El modelo en estrella que conforma
la estructura lgica propuesta para
SISTEMAS
& TELEMTICA 29
Figura 12. Conversin vertical de la trayectoria de una dimensin.
30 SISTEMAS
& TELEMTICA
Este esquema de conversin es el ms tos que conforman cada estructura.
recomendable, si las agregaciones de Una vez asignados todos los atribu-
datos se realizan de manera dinmica. tos, se realiza un anlisis cruzado en-
tre la tabla de hechos y las dimen-
Paso 3: siones, para establecer los tipos de
Definicin de los atributos que clculo matemtico que pueden ser
conforman las tablas de hechos realizados, sobre la tabla de hechos.
y las dimensiones del modelo.
La especificacin de los atributos que
En este paso final, se identifican para conforman la tabla de hechos se debe
cada tabla de hechos y cada dimen- realizar siguiendo el formato que apa-
sin las caractersticas de los atribu- rece en el Cuadro 3.
SISTEMAS
& TELEMTICA 31
Finalmente, se deben establecer los de hechos. El resultado de esta revi-
tipos de clculos matemticos como sin debe quedar consignado en una
suma, conteo, promedio, mnimo, matriz de cruce, como la presentada
mximo, que pueden ser aplicados a en el Cuadro 5.
los valores almacenados en las tablas
Tabla de hechos
Atributo 1
Atributo 2
Atributo 3
32 SISTEMAS
& TELEMTICA
Cuadro 6: Definicin de los atributos de la tabla de hechos sobre ventas.
SISTEMAS
& TELEMTICA 33
Cuadro 8: Operaciones matemticas para cada atributo
de la tabla de hechos sobre ventas.
Atributo 2 Pesos-venta
34 SISTEMAS
& TELEMTICA
BIBLIOGRAFA Modeling Techniques for Data
Warehouse. IBM. 1998.
Mcguff, F. Designing the perfect
Data Warehouse. 1998. http:// Todman, C. Designing a Data
members.aol.com/fmcguff/dwmo- Warehouse: Supporting Customer
del/index.htm Relationship. Prentice Hall. 2001
Kimball R. The Data Warehouse
Toolkit. John Wiley & Sons, 1996.
CURRCULO
Inmon W.H. Building The Data
Warehouse. QED Press /Jhon Jos Hernando Bahamn L. Inge-
Wiley, 1992. niero Electrnico de la Universidad
del Cauca, especialista en Adminis-
Golfarelli, M; Maio, D; Rizzi, S.
tracin de la Universidad Icesi y ma-
Conceptual Design of Data Ware-
gster en Direccin Universitaria de
house From E/R schemes. http//
la Universidad de los Andes. Profe-
www.csr.unib.it/~golfare/db.html,
sor investigador de la Universidad
1998.
Icesi. Vinculado a la Universidad Ice-
Bahamn, J. H. Construccin de si desde 1988. Ha sido jefe del Depar-
indicadores de gestin bajo el en- tamento Acadmico de Sistemas
foque de sistemas. S&T Revista de (1988-1998), Director del programa
la Facultad de Ingeniera, Univer- de Ingeniera de Sistemas (1998-
sidad Icesi. 2003. 2000), y en la actualidad es el Direc-
Chuck, B; Dick, H; Don, S; Rhon- tor Acadmico de la Universidad.
da; Eunsaeng, K.; Ann, V. Data
SISTEMAS
& TELEMTICA 35
36 SISTEMAS
& TELEMTICA