Está en la página 1de 9

Prospect. Vol. 9, No. 1, Enero - Junio de 2011, págs.

69-77

Construcción y poblamiento de un datawarehouse basado en el


paradigma de bases de datos objeto relacional

Construction and population of a datawarehouse based on the paradigm


Of databases relational object
Juan Carlos Calabria Sarmiento1

1 Mg Ingeniería de Sistemas y Computación, Especialista en desarrollo de Procesos Cognoscitivos.


Docente Tiempo Completo Universidad Autónoma del Caribe. Grupo de Investigación SINT.
Programa de Ingeniería de Sistemas Universidad Autónoma del Caribe. jcalabria@uac.edu.co

Recibido 09/05/2011, Aceptado 26/06/2011

RESUMEN

El presente artículo presenta la construcción de un sistema de información administrativo desarrollado bajo la


tecnología data warehousing dirigida hacia la inteligencia de negocios. Implementando una metodología de dise-
ño de bodega de datos denominada modelo de hechos dimensionales, la cual permite adaptar la funcionalidad de
una base de datos multidimensional de soporte para usos de control, independiente de las fuentes de datos que
suministran la información histórica.

A partir del modelado de la bodega de datos se sigue un patrón para suministrar la información del sistema
mediante la aplicación de los procesos ETL, implementados por medio de la herramienta de diseño grafico de
transformaciones conocida como Kettle. Además, se hace uso de tres motores distintos (Access, PostgreSQL, MyS-
QL) denominadas fuentes aisladas de origen de datos que serán objeto de integración y extracción para nuestra
bodega desarrollada en un motor diferente (Oracle 10g Express) bajo el paradigma Objeto-Relacional. Los resul-
tados expuestos servirán como fundamentos para encargados de administrar sistemas de información, así como
para altos gerentes y administrativos que deseen implementar estrategias en nuevas tecnologías con el objetivo de
lograr mayor eficiencia de acuerdo a las decisiones gerenciales que se dirijan a la obtención de resultados óptimos
para las organizaciones.

Palabras clave: Bodega de Datos, Origen de Datos, Procesos ETL, Base de Datos Objeto-Relacional.

ABSTRACT

The present article present the construction of an administrative system of information developed under the
technology Data Warehousing directed to the business Intelligence. It is implementing a methodology of design
of Data warehouse named dimention fact model, which allows to adapt the functionality of a multidimensional
Data Base of support for uses of control, independent of the data sources which give the historical information.

From the shaped one of the data warehouse it is still a boss to give the information of the system by means of
the application of the processes ETL, implemented by means of the tool of graphical design of transformations
known as Kettle. However, we use three different engines (Access, PostgreSQL, MySQL) named sources isolated
of data origin that will be an object of integration and Extraction for our warehouse developed in a different en-
gine (Oracle 10g Express) under the Object-Relational paradigm. The results exposed will serve as foundations
for entrusted to administer systems of information, as well as for high managers and clerical that they wish im-
plement strategies on new technologies with the aim to achieve major efficiency of agreement to the managerial
decisions that go to the obtaining of ideal results for the organizations.

Key words: Data warehouse, Data Origin, Process ETL, Object-Relational Data Base.

69
Construcción y poblamiento de un datawarehouse basado en el paradigma de bases de datos objeto relacional

1. Introducción tajas en rendimiento, velocidad de búsqueda y referencia


directa de los objetos la tildan de la mejor alternativa para
El crecimiento acelerado del volumen de datos que gene- un sistema cuyo crecimiento es de valor continuamente
ran las organizaciones; exige a los administradores de los exponencial.
sistemas de información actuales desarrollar estrategias
de análisis dirigidas a la toma de decisiones que benefi- A continuación, se presenta un método optimizado para
cien la compañía. Esta actividad se complica aún más, si la construcción y poblamiento de un datawarehouse, cuyo
tenemos en cuenta que en la actualidad los volúmenes de objetivo además, es permitir a las organizaciones la inte-
datos que generan los procesos productivos, comerciales y gración de los procesos soportados en sistemas de infor-
operacionales de una organización sobrepasan el alcance mación de distintas proveniencias que sirvan como sopor-
de las estructuras que soportan los sistemas de informa- te de diligencias de control y de toma de decisiones para
ción convencionales. las personas responsables la actividad gerencial.

Para los encargados de tomar decisiones fundamentales se 2. Metodología


convierte en una necesidad complementar sus habilidades
humanas con nuevas herramientas gerenciales que surgen La metodología de construcción de bodegas de datos pro-
para la administración de estos robustos sistemas de infor- puesta se centra en una estructura tecnológica diseñada
mación; en la medida que se le dé importancia a la infor- para que la organización disponga, en forma integrada y
mación que se ha suministrado respecto a cada unos de los estandarizada, de la información correspondiente a la ope-
procesos en el pasado, podrán hacerse análisis cuidadosos ración de la empresa, así como, proporciona a los usuarios,
que darán como resultados estrategias para el optimo de- que tienen a su cargo la toma de decisiones, las herramien-
sarrollo de las organizaciones en el futuro. tas adecuadas, para que a través de consultas rápidas, ellos
mismos accedan la información requerida [4].
Pero es aun más exhaustiva esta labor y en muchos ca-
sos delicados, cuando la proveniencia de los datos que Para su adecuada estructuración es necesario reconocer
hacen parte del sistema son inclusive fuentes de informa- un conjunto de operaciones y convertirlas en un sistema
ción completamente aisladas y hasta obsoletas pero que orientado al sujeto donde el instante de tiempo en que
las organizaciones por distintas razones se ven forzadas a ocurre la acción es de importancia vital para su análisis, el
depender de ellas, de acuerdo a los distintos casos citados enfoque inicial se dirige hacia el conocimiento de los dis-
anteriormente se ha hecho más fuerte el concepto de las tintos orígenes de datos (motores administradores de base
llamadas bodegas de datos. de datos, sistemas de archivos etc.) de los cuales serán
extraídos los datos que en nuestra bodega se convertirán
Se define bodega de datos como la  integración  de datos en información, de estas bases de conocimiento se deben
consolidados, almacenados en un dispositivo de memo- excluir un numero de procesos relevantes y entender de
ria no volátil, proveniente de múltiples y posiblemente di- estas sus variables principales, así como la interrelación
ferentes  fuentes  de datos. Con el propósito del análisis y entre sus componentes, a partir de esto se pueden crear
a partir de este tomar decisiones en función de mejorar la una serie de estructuras denominadas dimensiones que
gestión del negocio [1]. Es decir, que el objetivo principal de serán relacionadas en una tabla de hechos dimensionales
la data warehousing es construir un conjunto integrado de que dará soporte a la toma de decisiones.
bases de datos, con orientación temática donde cada uni-
dad de datos es relevante en algún momento del tiempo [2]. Además, es primordial que esas dimensiones abstraídas se
diseñen bajo el paradigma Objeto-Relacional propuesto para
En cuanto a los procesos de transformación, extracción y bodegas en este método, luego de su construcción conviene
carga de los datos de estas distintas fuentes que serán in- definir las reglas de uso para las transformaciones (Organi-
tegradas en nuestra data warehouse se ha venido consoli- zación, Filtros etc.) que darán lugar a manera conveniente
dado en un ordenado grupo de procesos estandarizados para suministrar la información hacia el data warehouse y
denominados ETL (Extracción, Transformación y Carga será necesario el uso de consultas rápidas para verificar la
de datos), por medio de los cuales podemos llevar a cabo correcta alimentación del sistema, a fin de dar mejor claridad
los procedimientos necesarios para la adecuada alimen- al proceso, se muestra en la Figura 2 un esquema grafico de
tación de los datos históricos de una bodega. El modelo los pasos correspondientes al método propuesto.
citado sobre la bodega descrita en el presente artículo se
denomina Objeto-Relacional el cual se usa para describir 2.1 Identificar fuentes de Origen de Datos
una base de datos que ha evolucionado desde el modelo
relacional hasta una base de datos híbrido, que contiene En este paso el objetivo fundamental es la identificación
ambas tecnologías: relacional y de objetos [3] cuyas ven- formal de las distintas fuentes de datos que servirán de

70
Prospect. Vol. 9, No. 1, Enero - Junio de 2011, págs. 69-77

Figura 1: Sistema desarrollado bajo Data Warehouse.


Figure 1: System developed under the Data Warehouse.

Figura 2: Propuesta de metodología para una Bodega de 1. Access


Datos. 2. PostgreSQL
Figure 2: Proposed methodology for a Data Warehouse. 3. MySQL

El primero es un programa, utilizado en los sistemas ope-


rativos  Microsoft Windows, para la gestión de  bases de
datos creado y modificado por Microsoft y orientado a ser
usado en entornos personales o en pequeñas organizacio-
nes [5] por medio de sistemas de archivos.

El segundo es un sistema de gestión de bases de datos que


trabaja bajo el paradigma Objeto-Relacional (ORDBMS)
basado en el proyecto POSTGRES, de la universidad de
Berkeley [6].

El tercero es un sistema de gestión de bases de datos rela-


cional, licenciado bajo la GPL de la GNU. Su diseño mul-
tihilo le permite soportar una gran carga de forma muy
eficiente [6].

Para incitar a mostrar la diferencia entre las distintas fuen-


tes de datos que pueden usarse en la metodología pro-
origen para la alimentación y el suministro de la bode- puesta se ha hecho necesario la utilización de tres orígenes
ga, estas fuentes pueden ser de estructuras tan comple- de distintas procedencias y características incluyendo un
jas como motores avanzados de administración de bases limitado sistema de archivos.
de datos, así como sistemas obsoletos y en cierto sentido
reemplazados, limitados y de menor eficiencia como se- 2.2 Entender procesos operacionales
rian sistemas de archivos almacenados. Cada organización
deberá ofrecer la información necesaria sobre los distintos Este paso necesita del uso de capacidad de análisis e in-
sistemas de almacenamiento que hacen uso concerniente terpretación para entender la lógica operacional de las
de las operaciones primordiales de sus procesos. relaciones existentes entre los procesos de las bases de da-
tos almacenadas en cada fuente. Es muy necesario que las
Para cuestión de comprensión del presente artículo se han personas encargadas de dar soporte a cada base de infor-
identificado tres (3) fuentes de datos para el desarrollo de mación suministren los modelos adecuados para el enten-
este caso guía citado, son las siguientes: dimiento de los distintos procesos de negocios que hacen

71
Construcción y poblamiento de un datawarehouse basado en el paradigma de bases de datos objeto relacional

parte de cada sistema. Podrían para la disminución de la cual implementamos la extracción y poblamiento de datos
complejidad de este paso, recurrir a esquemas gráficos provenientes de las fuentes antes mencionadas.
como modelos relacionales que representen claramente la
lógica aplicada a cada sistema, esto con el objetivo de abs- El uso del modelo de hechos dimensionales surge a partir
traer de manera formal las estructuras lógicas que pasarán del análisis de los datos en un tiempo finito, que ha traí-
a ser componentes vitales dentro la jerarquía de la bodega do consigo estudios sobre la mejor forma de almacenar y
de datos. En la Figura 3 se muestra como el esquema rela- representar estos datos para que puedan ser consultados
cional que representa la lógica de la base de datos almace- de una forma más rápida. El uso del modelo multidimen-
nada en las tres fuentes mencionadas en el paso anterior sional es una de las aproximaciones más acertadas y se-
correspondientes al caso en cuestión. guidas por los especialistas en estos días. Este se basa en
el estudio de los eventos del negocio analizados desde sus
El esquema permite realizar una descripción de la lógica distintas dimensiones [7].
del negocio de esta base de datos, cuando se pueda descri-
bir cada proceso, sus variables y las relaciones que tiene Este modelo exige para la elaboración de nuestra bodega
con otros procesos se prepara para definir que estructuras de datos el uso distintos componentes como son los he-
son vitales y cuáles pueden ser derivadas de estas. Tener chos, las medidas, las dimensiones cada una de las cuales
claro esto será fundamental para la ejecución correcta del se describen brevemente a continuación:
siguiente paso.
Medida es una propiedad de un hecho [7]. Una medida
2.3 Aplicar Modelo de hechos Dimensionales (Diagrama clásica y necesaria para este sistema podría ser el total de
Estrella) la factura, una medida por la cual podrían tomarse deci-
siones importantes sobre el sistema.
En este paso la importancia radica en construir a raíz de
las bases de datos operacionales identificadas y compren- Hecho (Fact) se define como una operación que se realiza
didas en los pasos anteriores nuestra bodega de datos, en el negocio en un tiempo determinado. Son objeto de
este proceso de construcción presenta algunos altibajos análisis para la toma de decisiones. Se representan en una
que podrían hacernos perder mas tiempo del dispuesto y caja con su nombre y las medidas que lo caracterizan [7].
podría ser un paso en falso si no se escoge un modelo ade- El hecho principal sobre un sistema de facturas y ventas,
cuado para el diseño de nuestra data warehouse. El mo- podría ser el hecho de facturar el cual podría contener las
delo de diseño escogido para la estructura de la bodega se dimensiones del modelo.
denomina modelo de hechos dimensionales, a partir del

Figura 3: Modelo Relacional de las fuentes de origen.


Figure 3: Relational model of the original sources.

72
Prospect. Vol. 9, No. 1, Enero - Junio de 2011, págs. 69-77

Dimensión (Dim)  es una característica de un hecho que • ¿En qué ciudades se venden la mayor cantidad de
permite su análisis posterior, en el proceso de toma de de- cada categoría?
cisiones [7]. Entre las dimensiones destacadas para el mo-
delo podemos tener, vendedor, cliente, producto y como La respuesta a estas preguntas podría ocasionar para la
todo modelo de DataWarehouse una siempre obligatoria compañía la incorporación de paquetes promocionales de
dimensión tiempo que determine el momento en el cual ciertos productos para ciertas ciudades en épocas del año
fue desarrollado cada hecho. específicas. En este caso esto sería una medida de optimi-
zación de gastos de transporte, puesto que no generaría
2.3.1 Formulación de preguntas dirigidas a la toma de decisiones ganancias enviar productos a ciertas ciudades donde no
se han vendido en los últimos años o buscar la forma de
La importancia en la creación de nuestra bodega y es lo llamar la atención de ese grupo potencial de clientes para
que le da gran importancia a este articulo radica en el in- que levanten su atención sobre ese producto.
terés de las organizaciones de tomar decisiones sobre los
hechos que acontecieron en algún instante de tiempo, para 2.4. Aplicar paradigma objeto-relacional
lograr ese objetivo se necesita entonces un buen análisis.
Algunos interrogantes basados en el modelo construido En este paso el objetivo principal es definir la importancia
sobre el caso citado en este articulo, seria que la compa- de los modelos objeto-relacional para los nuevos sistemas
ñía quisiera determinar cuáles son los productos más de millares de datos a los que están siendo acostumbra-
vendidos y los menos vendidos en temporadas especiales dos los diseñadores de sistemas de información moder-
como la época de navidad, épocas vacacionales etc. Todo nos, una de las ventajas que presenta este modelo es que la
depende del los distintos sistemas para la formulación de integración de las representaciones relacional y orientada
preguntas que pueden causar decisiones importantes para a objetos es semánticamente limpia y considerablemente
una empresa comercial con un sistema como el expuesto más potente en rendimiento y velocidad de búsqueda [3].
en el presente caso:
En teoría el modelo objeto-relacional elimina las restriccio-
• ¿Cuáles son los productos más vendidos y menos ven- nes de llaves foráneas como en los reconocidos esquemas
didos en el mes de diciembre? relacionales, en contraste se hacen al uso de referencias en
• ¿Quiénes son los vendedores que mas producen en las memoria donde cada objeto guarda la dirección en memo-
épocas de temporadas criticas? ria de sus objetos dependientes. El código del objeto que

Figura 4: Ejemplo Modelo de Hechos Dimensionales


Figure 4: Dimensional Fact Model Example

73
Construcción y poblamiento de un datawarehouse basado en el paradigma de bases de datos objeto relacional

representa la tabla de hechos para la bodega citada en el nombre del servidor que contiene la base de datos, au-
presente artículo es la figura 5: mentaciones para el acceso a esta etc.

Figura 5: Creación del objeto correspondiente a la tabla de 5. Seleccionar/Renombrar valores nos permite hacer
hechos de la Bodega. ajustes a los datos extraídos en componentes de en-
Figure 5: Creation of the object corresponding to the fact trada de tabla, entre los cambios que deben ajustarse a
table of the Data Warehouse. los datos se encuentra el renombrar los campos, cam-
biar el tipo de datos para compactarlo de un motor a
otro; cambio en la longitud máxima de los campos etc.

6. La salida tabla permite disponer de un componente


donde se especifica el destino de los datos transfor-
mados o extraídos en pasos anteriores, el asistente de
configuración define el motor destino de los datos; en
este caso es el motor Oracle 10g donde se encuentra
almacenada la bodega.

La calidad de los procesos de extracción, transformación


2.5 Establecer Procesos ETL (Extracción, Transformación,
y carga se llevan a cabo sobre los orígenes y destinos de
Carga)
datos; la facilidad para unificar datos de distintas fuentes,
realizar modificaciones y suministrar estos datos a una
Hacemos uso de la herramienta kettle, o también conoci-
bodega que es independiente de las fuentes[10]. Para las
da como Spoon; implementada para hacer actividades de
organizaciones una herramienta de base de conocimien-
transformaciones a los datos, realizar trabajos completos
tos de inteligencia de negocios como esta es de vital im-
sobre nuestras fuentes de origen incluyendo conexiones a
portancia si no desean perder la información de archivos
distintos motores de base de datos y extracción de datos
almacenados o de bases de datos cuyas capacidades han
de archivos almacenados como por ejemplo Access, hojas
llegado a su límite superior, este método es una podero-
de cálculo Excel; entre otras. Para el ejemplo citado en el
sa herramienta no solo para recuperar y administrar estos
presente artículo hemos de citar algunas de las caracterís-
datos desde una nueva base de datos si no también que
ticas de esta herramienta entre las cuales se destacan las
se pueden planificar estrategias para el futuro de la orga-
siguientes:
nización a base las decisiones que se tomen luego de res-
ponder los interrogantes de acuerdo al comportamiento
1. Las conexiones de base de datos describen el méto-
de sus procesos y al resultado de sus datos históricos en
do mediante el cual Kettle se conectará a una base de
cualquier instante de tiempo[11].
datos. Se pueden crear conexiones específicas para un
trabajo o transformación o guardarlas en el catálogo
2.6 Verificación de datos históricos
de Kettle para reutilizar las en múltiples transforma-
ciones o trabajos [8].
Antes de realizar el análisis de resultados se debe hacer
una verificación de los datos en cuestión de coherencia
2. Un salto conecta un paso de transformación o entrada
dentro de la DataWarehouse[12].; la herramienta Kettle
de trabajo con otro. La dirección del flujo de datos del
luego de la ejecución de la transformación muestra una
salto se indica con una flecha en el panel de vista gráfica.
ventana de resultados donde entre otras columnas se
Un salto puede estar habilitado o deshabilitado [9].
muestran las cantidad de filas procesadas en cada uno de
los saltos; estos valores deben coincidir con las consultas
3. El Access input permite la realización de una entra-
rápidas dentro de cada uno de las fuentes de origen de
da de datos almacenados en un archivo creado con el
datos; además, la suma total debe coincidir con el numero
programa Access; para la configuración de este paso
de registros almacenados en nuestra bodega[13].
es necesario especificar el archivo al cual se hará refe-
rencia para la extracción de los datos.
3. Resultados
4. La entrada tabla permite disponer de una entrada de
Los resultados obtenidos de llevar a cabo un proceso de
datos para una gran cantidad de motores de bases de
extracción, transformación y carga de datos como la ex-
datos; el asistente de configuración de este paso espe-
puesta en pasos anteriores toman validez en cuanto a dar
cifica el motor a conectar y a raíz de esto se especifican
respuestas concretas a las preguntas formuladas antes de
un conjunto de datos necesarios como por ejemplo el
realizar los procesos[14].; un análisis expuesto en tablas

74
Prospect. Vol. 9, No. 1, Enero - Junio de 2011, págs. 69-77

Figura 6: Aplicación de procesos ETL con Kettle (Spoon).


Figure 6: Implementation of ETL processes with Kettle (Spoon).

por medio de consultas rápidas o por medio de la colabo- te las cuales fomentar estrategias, planes promocionales,
ración de una lenguaje de programación que le dé una vis- reestructuración del los empleados etc.
ta mas amigable a los resultados pueden permitir para las
personas encargadas de la toma de decisiones y llevar el Los resultados arrojados representados por medio de ta-
control en las organizaciones sacar conclusiones median- blas del caso citado en el artículo se muestran a continua-
ción:

Tabla 1: Resultados de la Bodega de Datos.


Table 1: Results of the Data Warehouse.

75
Construcción y poblamiento de un datawarehouse basado en el paradigma de bases de datos objeto relacional

Tablas 2 y 3: Resultado de la Bodega de Datos.


Tables 2 and 3: Result of Data Warehouse.

Tabla 4: Resultado de la Bodega de Datos.


Table 4: Results of the Data Warehouse.

3.1. Análisis de resultados • Para el suministro del mes de diciembre se duplicarán


los productos de ropa y zapatería y se suministrará la
De las tablas arrojadas por la bodega de datos pueden ha- mitad de productos escolares.
cerse las siguientes conclusiones:
• Los vendedores que más venden en meses críticos ten-
• El mes de diciembre no es rentable para la venta de drán mejor porcentaje de bonificación que los demás.
útiles escolares
• Los suministros de la línea de alcohol se incrementa-
• El mes de diciembre es muy rentable para comerciali- rán para la ciudad de barranquilla
zación de ropa, accesorios y zapatería.
• Los suministros de la línea de hogar se incrementarán
• Los vendedores más rentables en los meses críticos para la ciudad de Bogotá.
(Marzo y Agosto) son Edward Guerrero, Alexander
Zapata, Jader Theran y Luis Barraza. 4. Conclusiones

• La ciudad de barranquilla es la ciudad que se ha man- • La implementación del modelo de hechos dimensio-
tenido liderando la compra de licores. nales facilitó la etapa de investigación y diseño; te-
niendo en cuenta que otros modelos podrían causar
• La ciudad de Bogotá lidera la compra de productos una complejidad mucho mayor en la estructura y ad-
para el hogar. ministración de nuestra bodega de datos.

De las conclusiones obtenidas se pueden tomar las si- • El uso del paradigma objeto-relacional maximizó ve-
guientes decisiones: locidad de búsqueda y rendimiento de la bodega, esta

76
Prospect. Vol. 9, No. 1, Enero - Junio de 2011, págs. 69-77

ventaja se representa aun con más importancia cuan- [5] PEREZ, Cesar. Data Mining, soluciones con Enterprise
do las bodegas sobrepasan en millares el número de Miner. Alfaomega , 2006
datos almacenados; la cual es su especialidad.
[6] STACKOWIAK, Robert. Oracle Data Warehousing,
• La herramienta de inteligencia de negocios Kettle fue 2007.
de vital importancia durante el desarrollo de la inves-
tigación, por que sirvió como enlace mediador entre [7] WREMBEL. Robert. CONCILIA, Christian, Data Ware-
los sistemas de bases de datos origen y la bodega de house and OLAP Concepts, Architectures and Solutions,
datos destino, agilizando en gran medida la conexión 2007.
con las fuentes donde se encontraba un obsoleto siste-
ma de archivos como Access. La metodología expues- [8] INMON , William . The Father of Data Warehousing.
ta en este artículo simplifica realizar trabajos sobre Inmon Consulting Services. 2007.
gran cantidad de bases de datos con esta herramienta.
[9] KIMBALL, Ralph. The Data Warehouse Toolkit. John
• En cuanto a los resultados arrojados por el estudio se Wiley & Sons. 2006.
encuentran decisiones en las cuales interviene mucho
dinero de por medio; como transporte de lotes de pro- [10] SANCHEZ, Jorge. Data Warehouse and OLAP Con-
ductos a ciudades donde casi no se venden en ciertas cepts, Architectures and Solutions. 2004.
épocas del año; esto puede dar lugar a fortalecer por
medio de estrategias promocionales la comercializa- [11] MCGUFFEY, F. Designing the perfect Data Warehou-
ción de dichos productos para esta parte del mercado. se. 2008.

Referencias [12] THOMSEN, Erik. Olap Solution. John Wiley & Sons.
2009.
[1] CHAUDHURI, Surajit. DAYAL, Umeshwar. An Over-
view of Data Warehousing and OLAP Technology. SIG- [13] HUMPHIES, Mark. Hawkins, Michael. DATAWARE-
MOD Record, 2007. HOUSING Architecure and Implementation. Harris
Keru’s Enterprise Computing Institute. 2010.
[2] INMON, William.H. Building The Data Warehouse.
QED Press / John Wiley, 2009. ENLACES:
[14] http://wiki.pentaho.com/display/EAIes. Manual+del+
[3] MORGAN, Kaufmann. Data Mining: Practical Machi- Usuario+de+Spoon
ne Learning Tools and Techniques (Second Edition), 2005.

[4] WITTEN, Ian. FRANK, Eibe. Data Mining: Practical


Machine Learning Tools and Techniques (Second Edition).
Morgan Series in Data Magnagement Systems. 2005.

77

También podría gustarte