Documentos de Académico
Documentos de Profesional
Documentos de Cultura
69-77
RESUMEN
A partir del modelado de la bodega de datos se sigue un patrón para suministrar la información del sistema
mediante la aplicación de los procesos ETL, implementados por medio de la herramienta de diseño grafico de
transformaciones conocida como Kettle. Además, se hace uso de tres motores distintos (Access, PostgreSQL, MyS-
QL) denominadas fuentes aisladas de origen de datos que serán objeto de integración y extracción para nuestra
bodega desarrollada en un motor diferente (Oracle 10g Express) bajo el paradigma Objeto-Relacional. Los resul-
tados expuestos servirán como fundamentos para encargados de administrar sistemas de información, así como
para altos gerentes y administrativos que deseen implementar estrategias en nuevas tecnologías con el objetivo de
lograr mayor eficiencia de acuerdo a las decisiones gerenciales que se dirijan a la obtención de resultados óptimos
para las organizaciones.
Palabras clave: Bodega de Datos, Origen de Datos, Procesos ETL, Base de Datos Objeto-Relacional.
ABSTRACT
The present article present the construction of an administrative system of information developed under the
technology Data Warehousing directed to the business Intelligence. It is implementing a methodology of design
of Data warehouse named dimention fact model, which allows to adapt the functionality of a multidimensional
Data Base of support for uses of control, independent of the data sources which give the historical information.
From the shaped one of the data warehouse it is still a boss to give the information of the system by means of
the application of the processes ETL, implemented by means of the tool of graphical design of transformations
known as Kettle. However, we use three different engines (Access, PostgreSQL, MySQL) named sources isolated
of data origin that will be an object of integration and Extraction for our warehouse developed in a different en-
gine (Oracle 10g Express) under the Object-Relational paradigm. The results exposed will serve as foundations
for entrusted to administer systems of information, as well as for high managers and clerical that they wish im-
plement strategies on new technologies with the aim to achieve major efficiency of agreement to the managerial
decisions that go to the obtaining of ideal results for the organizations.
Key words: Data warehouse, Data Origin, Process ETL, Object-Relational Data Base.
69
Construcción y poblamiento de un datawarehouse basado en el paradigma de bases de datos objeto relacional
70
Prospect. Vol. 9, No. 1, Enero - Junio de 2011, págs. 69-77
71
Construcción y poblamiento de un datawarehouse basado en el paradigma de bases de datos objeto relacional
parte de cada sistema. Podrían para la disminución de la cual implementamos la extracción y poblamiento de datos
complejidad de este paso, recurrir a esquemas gráficos provenientes de las fuentes antes mencionadas.
como modelos relacionales que representen claramente la
lógica aplicada a cada sistema, esto con el objetivo de abs- El uso del modelo de hechos dimensionales surge a partir
traer de manera formal las estructuras lógicas que pasarán del análisis de los datos en un tiempo finito, que ha traí-
a ser componentes vitales dentro la jerarquía de la bodega do consigo estudios sobre la mejor forma de almacenar y
de datos. En la Figura 3 se muestra como el esquema rela- representar estos datos para que puedan ser consultados
cional que representa la lógica de la base de datos almace- de una forma más rápida. El uso del modelo multidimen-
nada en las tres fuentes mencionadas en el paso anterior sional es una de las aproximaciones más acertadas y se-
correspondientes al caso en cuestión. guidas por los especialistas en estos días. Este se basa en
el estudio de los eventos del negocio analizados desde sus
El esquema permite realizar una descripción de la lógica distintas dimensiones [7].
del negocio de esta base de datos, cuando se pueda descri-
bir cada proceso, sus variables y las relaciones que tiene Este modelo exige para la elaboración de nuestra bodega
con otros procesos se prepara para definir que estructuras de datos el uso distintos componentes como son los he-
son vitales y cuáles pueden ser derivadas de estas. Tener chos, las medidas, las dimensiones cada una de las cuales
claro esto será fundamental para la ejecución correcta del se describen brevemente a continuación:
siguiente paso.
Medida es una propiedad de un hecho [7]. Una medida
2.3 Aplicar Modelo de hechos Dimensionales (Diagrama clásica y necesaria para este sistema podría ser el total de
Estrella) la factura, una medida por la cual podrían tomarse deci-
siones importantes sobre el sistema.
En este paso la importancia radica en construir a raíz de
las bases de datos operacionales identificadas y compren- Hecho (Fact) se define como una operación que se realiza
didas en los pasos anteriores nuestra bodega de datos, en el negocio en un tiempo determinado. Son objeto de
este proceso de construcción presenta algunos altibajos análisis para la toma de decisiones. Se representan en una
que podrían hacernos perder mas tiempo del dispuesto y caja con su nombre y las medidas que lo caracterizan [7].
podría ser un paso en falso si no se escoge un modelo ade- El hecho principal sobre un sistema de facturas y ventas,
cuado para el diseño de nuestra data warehouse. El mo- podría ser el hecho de facturar el cual podría contener las
delo de diseño escogido para la estructura de la bodega se dimensiones del modelo.
denomina modelo de hechos dimensionales, a partir del
72
Prospect. Vol. 9, No. 1, Enero - Junio de 2011, págs. 69-77
Dimensión (Dim) es una característica de un hecho que • ¿En qué ciudades se venden la mayor cantidad de
permite su análisis posterior, en el proceso de toma de de- cada categoría?
cisiones [7]. Entre las dimensiones destacadas para el mo-
delo podemos tener, vendedor, cliente, producto y como La respuesta a estas preguntas podría ocasionar para la
todo modelo de DataWarehouse una siempre obligatoria compañía la incorporación de paquetes promocionales de
dimensión tiempo que determine el momento en el cual ciertos productos para ciertas ciudades en épocas del año
fue desarrollado cada hecho. específicas. En este caso esto sería una medida de optimi-
zación de gastos de transporte, puesto que no generaría
2.3.1 Formulación de preguntas dirigidas a la toma de decisiones ganancias enviar productos a ciertas ciudades donde no
se han vendido en los últimos años o buscar la forma de
La importancia en la creación de nuestra bodega y es lo llamar la atención de ese grupo potencial de clientes para
que le da gran importancia a este articulo radica en el in- que levanten su atención sobre ese producto.
terés de las organizaciones de tomar decisiones sobre los
hechos que acontecieron en algún instante de tiempo, para 2.4. Aplicar paradigma objeto-relacional
lograr ese objetivo se necesita entonces un buen análisis.
Algunos interrogantes basados en el modelo construido En este paso el objetivo principal es definir la importancia
sobre el caso citado en este articulo, seria que la compa- de los modelos objeto-relacional para los nuevos sistemas
ñía quisiera determinar cuáles son los productos más de millares de datos a los que están siendo acostumbra-
vendidos y los menos vendidos en temporadas especiales dos los diseñadores de sistemas de información moder-
como la época de navidad, épocas vacacionales etc. Todo nos, una de las ventajas que presenta este modelo es que la
depende del los distintos sistemas para la formulación de integración de las representaciones relacional y orientada
preguntas que pueden causar decisiones importantes para a objetos es semánticamente limpia y considerablemente
una empresa comercial con un sistema como el expuesto más potente en rendimiento y velocidad de búsqueda [3].
en el presente caso:
En teoría el modelo objeto-relacional elimina las restriccio-
• ¿Cuáles son los productos más vendidos y menos ven- nes de llaves foráneas como en los reconocidos esquemas
didos en el mes de diciembre? relacionales, en contraste se hacen al uso de referencias en
• ¿Quiénes son los vendedores que mas producen en las memoria donde cada objeto guarda la dirección en memo-
épocas de temporadas criticas? ria de sus objetos dependientes. El código del objeto que
73
Construcción y poblamiento de un datawarehouse basado en el paradigma de bases de datos objeto relacional
representa la tabla de hechos para la bodega citada en el nombre del servidor que contiene la base de datos, au-
presente artículo es la figura 5: mentaciones para el acceso a esta etc.
Figura 5: Creación del objeto correspondiente a la tabla de 5. Seleccionar/Renombrar valores nos permite hacer
hechos de la Bodega. ajustes a los datos extraídos en componentes de en-
Figure 5: Creation of the object corresponding to the fact trada de tabla, entre los cambios que deben ajustarse a
table of the Data Warehouse. los datos se encuentra el renombrar los campos, cam-
biar el tipo de datos para compactarlo de un motor a
otro; cambio en la longitud máxima de los campos etc.
74
Prospect. Vol. 9, No. 1, Enero - Junio de 2011, págs. 69-77
por medio de consultas rápidas o por medio de la colabo- te las cuales fomentar estrategias, planes promocionales,
ración de una lenguaje de programación que le dé una vis- reestructuración del los empleados etc.
ta mas amigable a los resultados pueden permitir para las
personas encargadas de la toma de decisiones y llevar el Los resultados arrojados representados por medio de ta-
control en las organizaciones sacar conclusiones median- blas del caso citado en el artículo se muestran a continua-
ción:
75
Construcción y poblamiento de un datawarehouse basado en el paradigma de bases de datos objeto relacional
De las conclusiones obtenidas se pueden tomar las si- • El uso del paradigma objeto-relacional maximizó ve-
guientes decisiones: locidad de búsqueda y rendimiento de la bodega, esta
76
Prospect. Vol. 9, No. 1, Enero - Junio de 2011, págs. 69-77
ventaja se representa aun con más importancia cuan- [5] PEREZ, Cesar. Data Mining, soluciones con Enterprise
do las bodegas sobrepasan en millares el número de Miner. Alfaomega , 2006
datos almacenados; la cual es su especialidad.
[6] STACKOWIAK, Robert. Oracle Data Warehousing,
• La herramienta de inteligencia de negocios Kettle fue 2007.
de vital importancia durante el desarrollo de la inves-
tigación, por que sirvió como enlace mediador entre [7] WREMBEL. Robert. CONCILIA, Christian, Data Ware-
los sistemas de bases de datos origen y la bodega de house and OLAP Concepts, Architectures and Solutions,
datos destino, agilizando en gran medida la conexión 2007.
con las fuentes donde se encontraba un obsoleto siste-
ma de archivos como Access. La metodología expues- [8] INMON , William . The Father of Data Warehousing.
ta en este artículo simplifica realizar trabajos sobre Inmon Consulting Services. 2007.
gran cantidad de bases de datos con esta herramienta.
[9] KIMBALL, Ralph. The Data Warehouse Toolkit. John
• En cuanto a los resultados arrojados por el estudio se Wiley & Sons. 2006.
encuentran decisiones en las cuales interviene mucho
dinero de por medio; como transporte de lotes de pro- [10] SANCHEZ, Jorge. Data Warehouse and OLAP Con-
ductos a ciudades donde casi no se venden en ciertas cepts, Architectures and Solutions. 2004.
épocas del año; esto puede dar lugar a fortalecer por
medio de estrategias promocionales la comercializa- [11] MCGUFFEY, F. Designing the perfect Data Warehou-
ción de dichos productos para esta parte del mercado. se. 2008.
Referencias [12] THOMSEN, Erik. Olap Solution. John Wiley & Sons.
2009.
[1] CHAUDHURI, Surajit. DAYAL, Umeshwar. An Over-
view of Data Warehousing and OLAP Technology. SIG- [13] HUMPHIES, Mark. Hawkins, Michael. DATAWARE-
MOD Record, 2007. HOUSING Architecure and Implementation. Harris
Keru’s Enterprise Computing Institute. 2010.
[2] INMON, William.H. Building The Data Warehouse.
QED Press / John Wiley, 2009. ENLACES:
[14] http://wiki.pentaho.com/display/EAIes. Manual+del+
[3] MORGAN, Kaufmann. Data Mining: Practical Machi- Usuario+de+Spoon
ne Learning Tools and Techniques (Second Edition), 2005.
77