Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Propuesta de implementación de un
Data Warehouse para el área de
Soporte de Información, Rabie S.A.
Memoria para optar al Título de Ingeniero Civil en
Informática
CHILLÁN, 2013
Universidad del Bío-Bío. Red de Bibliotecas - Chile
2
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Agradecimientos
Por ende agradezco a la Universidad del Bío-Bío, gran institución que me dió la
oportunidad para adquirir los conocimientos, los que me permitieron desarrollar este
proyecto de título.
Finalmente quiero dar gracias a mi pareja, Yenny, por estar a mi lado en los
momentos más importantes de mi carrera, sin mencionar su comprensión y entendimiento,
entregándome así, sentimientos de alegría, amor y cariño.
3
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Resumen
Es por ello que los actuales sistemas de información han evolucionado hacia los
sistemas de gestión, apoyados por el Business Intelligence o Inteligencia de Negocios
permitiendo, de esta manera, poder realizar tomas de decisión de carácter estratégico,
logrando así, disminuir los riesgos que causaban estas decisiones hace algún tiempo atrás.
Una de estas Tecnologías de Información son los sistemas de Data Warehouse y que
corresponden a colecciones de datos orientadas a un determinado ámbito; integrando
información desde diversas fuentes, otorgan la funcionalidad de ayudar a la toma de
decisiones en la entidad en que se implementa.
4
Universidad del Bío-Bío. Red de Bibliotecas - Chile
5
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Tabla de Contenidos
Capítulo 1 ............................................................................................................................. 12
Introducción .......................................................................................................................... 12
1.1 Objetivo del Proyecto ............................................................................................ 13
1.2 Objetivos Específicos del Proyecto ....................................................................... 14
1.3 Alcance y Límites del Proyecto ............................................................................. 15
Capítulo 2 ............................................................................................................................. 17
Descripción de la Empresa ................................................................................................... 17
2.1 Identificación de la Empresa .................................................................................. 17
2.2 Misión y Visión de Rabie S.A. .............................................................................. 18
2.2.1 Misión ............................................................................................................. 18
2.2.2 Visión ............................................................................................................. 18
2.3 Área de Soporte de Información, Rabie S.A.......................................................... 19
Capítulo 3 ............................................................................................................................. 21
Marco Teórico ...................................................................................................................... 21
3.1 Business Intelligence ............................................................................................. 21
3.1.1 Introducción .................................................................................................... 21
3.1.2 Definición ....................................................................................................... 22
3.1.3 Proceso de Business Intelligence .................................................................... 23
3.1.4 Beneficios ....................................................................................................... 24
3.2 DataMart ................................................................................................................ 25
3.3 Data Warehouse ..................................................................................................... 26
3.3.1 Introducción .................................................................................................... 26
3.3.2 Definición ....................................................................................................... 26
3.3.3 Características ................................................................................................. 27
3.3.4 Cualidades ...................................................................................................... 33
3.3.5 Objetivos generales......................................................................................... 34
3.3.6 Ventajas .......................................................................................................... 36
3.3.7 Desventajas ..................................................................................................... 37
3.3.8 Redundancia ................................................................................................... 38
6
Universidad del Bío-Bío. Red de Bibliotecas - Chile
7
Universidad del Bío-Bío. Red de Bibliotecas - Chile
8
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Índice de Figuras
9
Universidad del Bío-Bío. Red de Bibliotecas - Chile
10
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Índice de Tablas
Índice de Gráficos
11
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Capítulo 1
Introducción
12
Universidad del Bío-Bío. Red de Bibliotecas - Chile
El proyecto está enfocado a prestar apoyo a la empresa Rabie S.A., la cual cubre
desde Arica a Chiloé y posee tres grandes Centros de Distribución ubicados en Chillán,
Santiago y Antofagasta, equipados con la más alta tecnología para el almacenamiento,
manejo y despacho de productos. Cabe destacar que la Administración Central de esta
compañía, cuenta con modernas oficinas, ubicadas en el centro de la ciudad de Chillán.
Por último, el Centro de Distribución Chillán, cubre una zona que se extiende entre
la VII y X regiones, incluyendo la Isla Grande de Chiloé. Dicho centro abastece a más de
18.000 clientes, quienes son atendidos por alrededor de 230 vendedores, con un mix de
productos compuesto por más de 5.000 artículos. Cabe destacar que en este Centro de
Distribución se realiza aproximadamente un total de 50.000 ventas al día.
13
Universidad del Bío-Bío. Red de Bibliotecas - Chile
directamente por el área de Soporte de Información, por lo que esta propuesta dará a esta
última un mayor realce.
14
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Debido al tiempo limitado con que se cuenta para desarrollar este proyecto, se
centrará en las etapas de diseño del Data Warehouse y las acciones de ETL.
15
Universidad del Bío-Bío. Red de Bibliotecas - Chile
16
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Capítulo 2
Descripción de la Empresa
En este capítulo se dará a conocer la empresa Rabie S.A., y sus respectivas áreas,
indicando parte de su historia, su posición en el mercado, además de sus actividades.
También se dará a conocer las distintas sucursales que posee a lo largo del país, entregando
datos cuantitativos de sus empleados, proveedores, clientes entre otros.
En 1996 Rabié S.A. construye el Mall Plaza El Roble. El mismo año, don Jorge
Rabié recibe el Premio Icare en la “Categoría Empresario”.
17
Universidad del Bío-Bío. Red de Bibliotecas - Chile
De forma interna Rabie S.A. cuenta con un total de 1.200 empleados y posee sobre
6.000 productos a nivel nacional. Y externamente cuenta con 1.500 transportistas externos
y 200 proveedores, además de un total aproximado de 45.000 clientes a lo largo del país.
2.2.1 Misión
2.2.2 Visión
18
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Cabe señalar que actualmente el área Control Gestión donde se ubica Soporte de
Información, se encuentra ejerciendo la labor de un área de Inteligencia de Negocios o
Business Intelligent, la cual da mayor importancia a los procesos de recolectar y utilizar
efectivamente la información, con el fin de mejorar la forma de operar de una organización,
brindando a sus usuarios, el acceso a la información clave que necesitan para llevar a cabo
sus tareas habituales y más precisamente, para poder tomar decisiones oportunas.
19
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Jefe de Soporte
de Información
Analista Analista
Analista Ventas
Comercial Logístico
Analista Soporte de Información Analista Soporte de Información Analista Soporte de Información
En conjunto a lo anterior, la empresa Rabie S.A. cuenta con dos tipos de clientes;
está el cliente interno, que corresponde a las áreas de Control Gestión internas de la
compañía, y por otro lado está el cliente externo que corresponde a los proveedores,
transportistas y clientes de consumo. El cliente interno (Control Gestión) actualmente tiene
acceso a la información por niveles, los cuales cubren los siguientes ámbitos:
Informe Kpi
Información operacional
Información a pedido
20
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Capítulo 3
Marco Teórico
3.1.1 Introducción
21
Universidad del Bío-Bío. Red de Bibliotecas - Chile
desde diferentes perspectivas, haciendo posible de esta forma encontrar información que
pueda responder a las preguntas no sólo del pasado y del presente, sino que también
posibilite la construcción de modelos, para predecir eventos futuros [4].
3.1.2 Definición
Business Intelligence se puede describir como un concepto que integra por un lado
el almacenamiento y por el otro el procesamiento de grandes cantidades de datos, con el
principal objetivo de transformarlos en conocimiento y en decisiones en tiempo real, a
través de un sencillo análisis y exploración [1].
Cabe señalar que Business Intelligence da mayor realce a los procesos de recolectar
y utilizar efectivamente la información, con el fin de mejorar la forma de operar de una
organización, brindando a sus usuarios, el acceso a la información clave que necesitan para
llevar a cabo sus tareas habituales y más precisamente, para poder tomar decisiones
oportunas basadas en datos correctos y certeros [4].
Esto quiere decir que cuanto más relevante y útil sea la inteligencia que posea una
organización sobre un negocio, sus clientes, proveedores, socios, operaciones, etc., mayor
será su ventaja competitiva y se podrán tomar mejores decisiones. Esto se debe
22
Universidad del Bío-Bío. Red de Bibliotecas - Chile
simplemente a que, por ejemplo, cuanto más se conoce a los clientes, se logra satisfacer sus
necesidades de mejor manera y, por supuesto, anticipar sus necesidades [1].
Fase 1 – Dirigir y Planear. En esta fase inicial es donde se deberán recolectar los
requerimientos de información específicos de los diferentes usuarios, así como entender sus
diversas necesidades, para que luego en conjunto con ellos se generen las preguntas que les
ayudarán a alcanzar sus objetivos [1].
Fase 3 – Procesamiento de Datos. En esta fase es donde se integran y cargan los datos “en
crudo” en un formato utilizable para el análisis. Esta actividad puede realizarse mediante la
23
Universidad del Bío-Bío. Red de Bibliotecas - Chile
creación de una nueva base de datos, agregando datos a una base de datos ya existente o
bien consolidando la información.
Fase 4 – Análisis y Producción. Aquí, se procede a trabajar sobre los datos extraídos e
integrados, utilizando herramientas y técnicas propias de la tecnología Business Intelligent,
para crear inteligencia. Como resultado final de esta fase se obtendrán las respuestas a las
preguntas, mediante la creación de reportes, indicadores de rendimiento, cuadros de mando,
gráficos estadísticos, etc. [1]
Fase 5 – Difusión. Finalmente, se les entregará a los usuarios que lo requieran las
herramientas necesarias, que les permitirán explorar los datos de manera sencilla e intuitiva
[1].
3.1.4 Beneficios
Entre los beneficios más importantes que Business Intelligent proporciona a las
organizaciones, vale la pena destacar los siguientes [4]:
24
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Se pueden identificar cuáles son los factores que inciden en el buen o mal
funcionamiento de la empresa.
Se podrán detectar situaciones fuera de lo normal.
Permitirá predecir el comportamiento futuro con un alto porcentaje de certeza,
basado en el entendimiento del pasado.
El usuario podrá consultar y analizar los datos de manera sencilla e intuitiva.
3.2 DataMart
Fuentes de datos
Procesos de extracción, transformación y carga de los datos (ETL)
Data Warehouse
Herramientas de exploración
25
Universidad del Bío-Bío. Red de Bibliotecas - Chile
3.3.1 Introducción
Cuando una organización genera datos en todos los ámbitos de su actividad diaria
de negocios (compras, ventas, producción, etc.) y/o información externa relacionada, es
necesario gestionar estos datos guardados en diversos formatos, fuentes y tipos, para que
luego sean depurados e integrados, como también su almacenamiento debe ser centralizado
permitiendo así su posterior análisis y exploración. Para ello existe un proceso que satisface
estas exigencias, denominado Data Warehousing.
3.3.2 Definición
"Un Data Warehouse es una colección de datos orientados a temas, integrados, no-
volátiles y variante en el tiempo, organizados para soportar necesidades empresariales".
operacionales, hojas de cálculo, subsistemas operacionales, etc., donde los datos extraídos
son sometidos a un proceso de transformación, integración y son almacenados en un
depósito, para poder acceder a ellos mediante sistemas de aplicación orientados al usuario
[11].
3.3.3 Características
William Inmon indicó que un Data Warehouse se caracterizaba por cumplir con los
siguientes puntos [12]:
27
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Para ello se definen dos tipos de orientación, en el primero hace referencia al nivel
de detalle de los datos, excluyendo de esta forma la información que no tendrán una
participación en el proceso de toma de decisiones, por el contrario en los procesos
orientados a las aplicaciones se incluyen los datos que satisfacen los requerimientos
funcionales de la actividad en cuestión. Y el segundo se basa principalmente en la relación
que existe entre los datos del Data Warehouse ya que son muy abundantes, debido a que
cada tabla está conformada por la integración de otras tablas o fuentes del ambiente
operacional con sus respectivas reglas de negocio.
28
Universidad del Bío-Bío. Red de Bibliotecas - Chile
3.3.3.2 Integrada
29
Universidad del Bío-Bío. Red de Bibliotecas - Chile
fuentes producidos por los distintos departamentos, secciones y aplicaciones ya sea interna
o externamente para ser consolidados en una instancia antes de ser agregados al Data
Warehouse.
Cuando los datos se mueven al Data Warehouse desde las aplicaciones orientadas al
ambiente operacional, los datos se integran antes de entrar al depósito de datos.
30
Universidad del Bío-Bío. Red de Bibliotecas - Chile
consulta, por lo que esta cantidad de tiempo es normal en este ambiente y es por eso que la
información que se encuentra dentro del depósito de datos se denomina, de tiempo variable,
esto quiere decir que la información del Data Warehouse posee un elemento de tiempo
asociado a sus datos.
Debido a lo anterior, se logra que el Data Warehouse pueda entregar los resultados
de una consulta a un gran volumen de datos, almacenados históricamente, en un tiempo de
respuesta relativamente igual a datos recientemente almacenados, siendo ésta una de sus
principales características. Esta cualidad, que no se encuentra presente en fuentes de datos
operacionales, garantiza poder desarrollar un análisis de la dinámica de la información [14].
31
Universidad del Bío-Bío. Red de Bibliotecas - Chile
3.3.3.4 No volátil
En los sistemas operacionales los datos cambian, o sea, se realizan con frecuencia
procesos de actualización, inserción, eliminación, limpieza de datos, en cambio en el Data
Warehouse los datos ingresados no deben cambiar, aunque en algunas ocasiones puede
ocurrir algún cambio en específico.
32
Universidad del Bío-Bío. Red de Bibliotecas - Chile
3.3.4 Cualidades
Un Data Warehouse maneja un gran volumen de datos, esto se debe a que posee
información histórica de la organización, extraída de diferentes fuentes y áreas,
almacenadas en un sólo lugar centralizado. Esto permite que diversos medios de
almacenamiento puedan soportar y mantener el depósito de datos.
Otra característica es que no sólo es un depósito de datos, sino que además posee un
conjunto de herramientas para consultar, analizar y presentar información, que permiten
obtener o realizar análisis, extracción y explotación de los datos, con alta performance, para
transformar dichos datos en información valiosa para la organización.
Con respecto a las tecnologías que son empleadas por los sistemas Data Warehouse,
se pueden encontrar las siguientes:
Arquitectura cliente/servidor.
Técnicas avanzadas para replicar, refrescar y actualizar datos.
Software front-end, para acceso y análisis de datos.
Herramientas para extraer, transformar y cargar datos en el depósito, desde
múltiples fuentes muy heterogéneas.
Sistema de Gestión de Base de Datos (SGBD).
33
Universidad del Bío-Bío. Red de Bibliotecas - Chile
A continuación se detallarán los objetivos específicos que según Ralph Kimball [15]
en su libro “The Data Warehouse Toolkit”, se pretenden alcanzar en el sistema Data
Warehouse:
El contenido del Data Warehouse debe ser comprensible, intuitivo y obvio para el
usuario de negocio. La comprensibilidad implica legibilidad, por lo que el contenido del
Data Warehouse necesita ser etiquetado de manera significativa. El usuario de negocio
debe estar habilitado para extraer porciones del Data Warehouse y combinar esta
información de todas las formas posibles, utilizando herramientas simples y fáciles de usar,
con un tiempo de respuesta mínimo.
La información del Data Warehouse debe ser creíble. Los datos además tienen que
ser cuidadosamente reunidos, de una variedad de orígenes en toda la organización. Estos
deben ser limpiados, con calidad asegurada, y liberados cuando sean aptos para la
utilización de los usuarios. La información de un proceso de negocio, debe coincidir con la
información de otro proceso que se encuentre también dentro del Data Warehouse. Si dos
métricas no significan lo mismo, entonces deben ser nombrados de forma distinta. Para que
la información sea consistente, esta debe ser de alta calidad, esto significa que todos los
datos sean correctos y estén completos. La consistencia también implica que las
definiciones comunes del contenido de un Data Warehouse están disponibles para todos los
usuarios.
34
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Simplemente no se pueden evitar los cambios. Las necesidades de los usuarios, las
condiciones del negocio, los datos, y la tecnología, están sujetos a los cambios en el
transcurso del tiempo. El Data Warehouse debe estar diseñado para manejar estos
inevitables cambios. Los cambios en el Data Warehouse no deben invalidar los datos o las
aplicaciones existentes, además de no ser alterados o quebrantados cuando la comunidad de
usuarios realice nuevas preguntas o se agreguen nuevos datos al Data Warehouse. Si los
datos descriptivos del Data Warehouse son modificados, se debe tener en cuenta esos
cambios adecuadamente.
5. El Data Warehouse debe servir como base para una toma de decisiones mejorada.
El Data Warehouse debe contener la información correcta para soportar los procesos
que corresponden a la toma de decisiones. De esta forma permite generar decisiones que
son consecuencia de los resultados entregados por el Data Warehouse. Estas decisiones
entregan al negocio el impacto y el valor atribuible al Data Warehouse.
No importa que se haya construido una elegante solución usando los mejores
productos y plataformas de su clase. Si los usuarios de la organización no aceptan el Data
Warehouse y desiste de su uso luego de un tiempo posterior a la capacitación, entonces se
ha fallado en la prueba de aceptación. A diferencia de las nuevas implantaciones de
sistemas operacionales, donde los usuarios no tienen otra opción que usar el nuevo sistema,
el uso del Data Warehouse es a veces opcional. La aceptación de los usuarios tiene más que
ver con la simplicidad que con cualquier otra cosa.
35
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Esto refleja claramente que la creación de un Data Warehouse no sólo tiene una alta
demanda de conocimientos técnicos, sino que además involucra un dominio de los procesos
de negocio, un cambio cultural de la organización y una visión muy clara, con objetivos
bien definidos.
3.3.6 Ventajas
36
Universidad del Bío-Bío. Red de Bibliotecas - Chile
3.3.7 Desventajas
3.3.8 Redundancia
Para que los datos pertenezcan al Data Warehouse primero deben ser filtrados del
ambiente operacional, por lo que solo pasan los datos que permitan obtener
información relevante para la toma de decisiones.
En segundo lugar, el horizonte de tiempo es completamente diferente entre el
ambiente operacional y el Data Warehouse.
El Data Warehouse contiene un resumen de la información que no existe en el
ambiente operacional.
Y por último los datos son transformados, para luego ser cargados al Data
Warehouse. Lo que significa que la mayor parte de los datos son alterados para su
selección, consolidándolos y posteriormente movidos al depósito.
38
Universidad del Bío-Bío. Red de Bibliotecas - Chile
3.3.9 Estructura
Como se puede observar, los almacenes de datos están compuestos por diversos
tipos de datos, que se organizan y dividen de acuerdo al nivel de detalle o granularidad que
posean.
Detalle de datos actuales: son aquellos que reflejan las ocurrencias más recientes.
Generalmente se almacenan en disco, aunque su administración sea costosa y
compleja, con el fin de conseguir que el acceso a la información sea sencillo y
39
Universidad del Bío-Bío. Red de Bibliotecas - Chile
veloz, ya que son bastante voluminosos. Su gran tamaño se debe a que los datos
residentes poseen el más bajo nivel de granularidad, o sea, se almacenan a nivel de
detalle.
Por ejemplo, aquí es donde se guardaría el detalle de una venta realizada en tal
fecha.
Detalle de datos históricos: representan aquellos datos antiguos, que no son
frecuentemente consultados. También se almacenan a nivel de detalle, normalmente
sobre alguna forma de almacenamiento externa, ya que el volumen de los datos es
demasiado alto y en adición a esto, no son requeridos con mucha periodicidad. Este
tipo de datos son consistentes con los detalles de los datos actuales. Por ejemplo, en
este nivel, al igual que en el anterior, se encontraría el detalle de una venta realizada
en tal fecha, pero con la particularidad de que el día en que se registró la venta debe
ser lo suficientemente antigua, para que se considere como histórica.
Datos ligeramente resumidos: son los que provienen desde un bajo nivel de detalle y
se agrupan estos datos bajo algún criterio o condición de análisis. Habitualmente
son almacenados en disco. Por ejemplo, en este caso se almacenaría el resumen del
detalle de las ventas realizadas en cada mes.
Datos altamente resumidos: son aquellos que compactan aún más a los datos
ligeramente resumidos. Se guardan en disco y son muy fáciles de acceder. Por
ejemplo, aquí se encontraría el resumen de las ventas realizadas en cada año.
Metadatos: representan la información acerca de los datos. De muchas maneras se
sitúa en una dimensión diferente al de otros datos del Data Warehouse, ya que su
contenido no es tomado directamente desde el ambiente operacional.
40
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Para definir las tablas es necesario establecer un criterio con el cual realizar el
resumen, cada vez que se requiere que los datos en una consulta se presenten en un nivel de
granularidad superior al que se encuentran alojados en el Data Warehouse, se debe llevar a
cabo un proceso de agregación.
Las tablas de hechos pre agregadas cuentan con los siguientes beneficios:
41
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Las tablas de hechos pre agregadas son muy útiles en los siguientes casos generales:
Cuando los datos a nivel detalle (menor nivel granular) son innecesarios y/o no son
requeridos.
Cuando una consulta sumarizada a determinado nivel de granularidad es solicitado
con mucha frecuencia.
Cuando los datos son muy abundantes, y las consultas demoran en ser procesadas
demasiado tiempo.
Como contrapartida, las tablas de hechos pre agregadas presentan una serie de
desventajas:
42
Universidad del Bío-Bío. Red de Bibliotecas - Chile
• Top-down
• Bottom-up
Este modelo fue propuesto por Bill Inmon [10], el enfoque top-down se utiliza
cuando la tecnología y los problemas del negocio se conocen con anterioridad. Este
enfoque logra la sinergia entre los problemas de negocio alcanzando los objetivos
43
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Además, en este método se formula un resumen del sistema, sin especificar detalles.
Cada parte del sistema se refina diseñándola con mayor detalle. Después, cada parte nueva
se vuelve a refinar, cada vez con mayor detalle, hasta que la especificación completa es lo
suficientemente detallada para validar el modelo. Este modelo se diseña con frecuencia con
la ayuda de "cajas negras" que hacen más fácil cumplir requerimientos, aunque estas cajas
negras no expliquen en detalle los componentes individuales.
La idea principal, es comprender cada paso que se realizará, para no caer en el tedio
de tener que seguir un método al pie de la letra sin saber exactamente qué se está haciendo,
ni por qué.
44
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Con el fin de que se llegue a una total comprensión de cada paso o etapa, se
acompañará con la implementación en una empresa real, para demostrar los resultados que
se deben obtener y ejemplificar cada concepto.
3.4.1.1.1.1 Descripción
45
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Una vez hecho esto, se pasará a la construcción del modelo lógico del depósito, en
donde se definirá cuál será el tipo de esquema que se implementará. Seguidamente, se
confeccionarán las tablas de dimensiones que son elementos que contienen atributos (o
campos) que se utilizan para restringir y agrupar los datos almacenados en una tabla de
hechos cuando se realizan consultas sobre dicho datos en un entorno Data Warehouse o
DataMart. Finalmente, se definirá la tabla de hechos la cual es la tabla central de un
esquema dimensional (en estrella o en copo de nieve) que contiene los valores de las
medidas de negocio, para luego efectuar sus respectivas uniones.
3.4.1.1.1.2 Características
46
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Reduce la resistencia al cambio, ya que involucra al usuario final en cada etapa para
que tome decisiones respecto al comportamiento y funciones del Data Warehouse.
Utiliza modelos conceptuales y lógicos, los cuales son sencillos de interpretar y
analizar.
Es independiente del tipo de ciclo de vida que se emplee para contener la
metodología.
Es independiente de las herramientas que se utilicen para su implementación.
Es independiente de las estructuras físicas que contengan el Data Warehouse y de su
respectiva distribución.
Cuando se culmina con una fase, los resultados obtenidos se convierten en el punto
de partida para llevar a cabo el paso siguiente.
Se aplica tanto para Data Warehouse como para DataMart.
Esta metodología propone los mecanismos necesarios para llevar a cabo la correcta
realización de un Data Warehouse. Para Bill Inmon, el diseño de un Data Warehouse
comienza con los procesos que definirán el almacenamiento de los datos en el sistema,
debido a que se almacenarán grandes volúmenes de datos, por lo que depende de este
proceso la eficiencia en el acceso a los datos.
Por último, los actuales sistemas tienen gran cantidad de datos, lo que hace poco
realista el intentar hacer cargas cada poco tiempo. Si el volumen de datos no es
cuidadosamente gestionado y condensado, dicho volumen de datos impide que los
objetivos del Data Warehouse se alcancen.
47
Universidad del Bío-Bío. Red de Bibliotecas - Chile
48
Universidad del Bío-Bío. Red de Bibliotecas - Chile
49
Universidad del Bío-Bío. Red de Bibliotecas - Chile
50
Universidad del Bío-Bío. Red de Bibliotecas - Chile
las partes individuales se diseñan con detalle y luego se enlazan para formar componentes
más grandes, que a su vez se enlazan hasta que se forma el sistema completo.
51
Universidad del Bío-Bío. Red de Bibliotecas - Chile
En esta fase se definirá el equipo de proyecto que debe estar compuesto por
representantes del departamento informático y de los departamentos usuarios del Data
Warehouse, además de la figura de jefe de proyecto. Se definirá el alcance del sistema y
cuáles son las funciones que el Data Warehouse realizará como suministrador de
información de negocio estratégica para la empresa. Se definirán así mismo, los parámetros
que permitan evaluar el éxito del proyecto.
Durante esta fase se mantendrán sucesivas entrevistas entre los representantes del
departamento usuario final y los representantes del departamento de informática. Se
realizará el estudio de los sistemas de información existentes, que ayudarán a comprender
las carencias actuales y futuras que deben ser resueltas en el diseño del Data Warehouse.
Asimismo, en esta fase el equipo de proyecto debe ser capaz de validar el proceso de
entrevistas y reforzar la orientación de negocio del proyecto. Al finalizar esta fase se
obtendrá el documento de definición de requerimientos en el que se reflejarán no sólo las
necesidades de información de los usuarios, sino cuál será la estrategia y arquitectura de
implantación del Data Warehouse.
52
Universidad del Bío-Bío. Red de Bibliotecas - Chile
3.4.2.1.1.4 Implementación
3.4.2.1.1.5 Revisión
53
Universidad del Bío-Bío. Red de Bibliotecas - Chile
54
Universidad del Bío-Bío. Red de Bibliotecas - Chile
55
Universidad del Bío-Bío. Red de Bibliotecas - Chile
La definición de los requerimientos del negocio determina los datos necesarios para
cumplir los requerimientos analíticos de los usuarios. Diseñar los modelos de datos para
soportar estos análisis requiere un enfoque diferente al usado en los sistemas operacionales.
Básicamente, se comienza con una matriz donde se determina la dimensionalidad de cada
indicador y luego se especifican los diferentes grados de detalle dentro de cada concepto
del negocio, así como la granularidad de cada indicador y las diferentes jerarquías que dan
forma al Modelo Dimensional del Negocio (MDN) o mapa dimensional.
56
Universidad del Bío-Bío. Red de Bibliotecas - Chile
convertir o recodificar los datos fuente a fin de poder efectuar la carga efectiva del Modelo
Físico. Por otra parte, los procesos de carga de datos son los procesos requeridos para
poblar el Data Warehouse. Todas estas tareas son altamente críticas pues tienen que ver con
la materia prima del Data Warehouse: los datos. La desconfianza y pérdida de credibilidad
del Data Warehouse provocará efectos inmediatos e inevitables si el usuario se encuentra
con información inconsistente. Es por ello que la calidad de los datos es un factor
determinante en el éxito de un proyecto de Data Warehouse. Es en esta etapa donde deben
sanearse todos los inconvenientes relacionados con la calidad de los datos fuente. Para
cumplir con estas premisas es necesario tener en cuenta ciertos parámetros a la hora de
desarrollar las tablas de dimensión y la tabla de hechos.
57
Universidad del Bío-Bío. Red de Bibliotecas - Chile
58
Universidad del Bío-Bío. Red de Bibliotecas - Chile
No todos los usuarios del Data Warehouse necesitan el mismo nivel de análisis. Es
por ello que en esta etapa se identifican los roles o perfiles de usuarios para los diferentes
tipos de aplicaciones necesarias en base al alcance de los perfiles detectados (gerencial,
analista del negocio, vendedor, etc.)
3.4.2.1.2.10 Implementación
59
Universidad del Bío-Bío. Red de Bibliotecas - Chile
La gestión del proyecto asegura que las actividades del ciclo de vida se lleven a
cabo de manera sincronizada. Entre sus actividades principales se encuentra la
monitorización del estado del proyecto y el acoplamiento entre los requerimientos del
negocio y las restricciones de los sistemas de información para poder manejar
correctamente las expectativas en ambos sentidos
60
Universidad del Bío-Bío. Red de Bibliotecas - Chile
61
Universidad del Bío-Bío. Red de Bibliotecas - Chile
requerimientos.
Luego de la implantación del sistema
se realizan revisiones iterativas.
Kimball – Es una metodología Se basa en los requerimientos de
Ciclo de Vida con un Ciclo de Vida negocio no en fechas límites.
más estructurado Evalúa la factibilidad del proyecto.
Posee diferentes niveles de
requerimientos.
Utiliza un enfoque diferente al usado
en los sistemas operacionales.
Define estándares del entorno de la
base de datos.
Diseña la arquitectura técnica del
entorno del Data Warehouse.
Es una metodología de tipo espiral.
Tabla 1: Comparativa de Métodos y Metodologías
62
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Capítulo 4
Entorno de la Aplicación
Rabie S.A. corresponde a una empresa de nivel nacional, siendo una de las más
importantes en el ámbito de Distribución de Productos al Comercio Minorista y Mayorista,
teniendo como objetivo ser la solución logística más conveniente del país, tanto para los
fabricantes como para los comerciantes. Permitiendo así a los fabricantes ubicar sus
productos en cualquier lugar de Chile, y que los comerciantes tengan un abastecimiento
seguro, confiable y con posibilidades de competir sin importar el lugar geográfico en el que
se encuentren.
Para ello Rabie S.A. cuenta con un control de gestión compuesto por dos tipos de
clientes, los cuales corresponden al cliente externo y al cliente interno como se mencionaba
en capítulos anteriores, siendo el último quién está en constante acceso a la información de
la empresa. El cliente interno está compuesto por cuatro áreas:
Soporte de Información
63
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Esta área está encargada de generar, validar y liberar la información relacionada con
la compañía. Y está compuesta por 5 personas.
Gestión comercial
Esta área maneja precios de producto, márgenes y revisa los ingresos, estando
compuesta por 3 personas.
Gestión Ventas
Esta área trata con información de vendedores, indicadores decisivos para venta,
históricos de venta, históricos de cobertura, entre otros, y está compuesta por 3 personas.
Gestión Logística
En general, se puede decir que Rabie S.A. está organizada en una serie de unidades
administrativas (según se puede visualizar en la Figura 16) y cuenta con alrededor de 950
empleados.
Directorio
Gerencia
General
Gerente
Administración y Auditoría Comercial Logística Personas Sistemas Ventas
Finanzas
Sub Gerente
Control Gestión
Gestíon Soporte de
Gestión Logística Gestión Ventas Presupuesto
Comercial Información
64
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Además, cabe destacar que algunos de los datos no se pueden extraer directamente
de la base de datos, por lo que el área de Soporte de Información debe responder a estas
solicitudes de manera personalizada, realizando un procesamiento del dato para su entrega.
Esto también se ve afectado por el nivel de preparación de los usuarios finales, ya que no
poseen los conocimientos sobre los procesos de extracción de los datos, viéndose esto
reflejado en el tipo de consultas que realizan.
montadas sobre un entorno de un Data Warehouse, de tal forma de poder dar un mejor uso
y obtener un mayor manejo de los datos para que estos entreguen información valiosa que
posteriormente sea transformada en conocimiento.
Debido a que Rabie S.A. ya cuenta con sistemas operacionales aplicados a sus bases
de datos, es factible la implementación de un sistema Data Warehouse, lo que permite en
gran medida abordar el problema de una manera más sencilla y exitosa.
66
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Junto con lo anterior, el universo de usuarios que accederá al Data Warehouse estará
acotado por el área de Soporte de Información, ya que son el área encargada de la
generación de reportes, e informes diarios y mensuales, destinados a las áreas de Gestión
Comercial, Gestión Logística, Gestión Ventas y Presupuesto, lo que facilita la distribución
de éste, en cuanto a la carga de datos operacionales sobre las bases de datos transaccionales
que realizan sus ingresos a través de sistemas centralizados a lo largo de todo el país.
67
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Capítulo 5
Informes Diarios
Quiebres
Muestra las cantidades y valores por productos que la empresa no fue capaz
de abastecer a la demanda de los usuarios. A este informe tiene acceso las
áreas de Logística y Ventas. Se pretende cubrir con el Data Warehouse parte
del informe, en la sección correspondiente a Ventas.
Informe Cobertura
Corresponde a la revisión de las cantidades de clientes atendidos, por zona y
por proveedor, teniendo acceso a esto solo el área de Ventas, a lo cual
pretende cubrir el Data Warehouse la totalidad del informe.
68
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Informes Mensuales
Cubo de venta
Está orientado principalmente a los productos, vendedores y clientes, siendo
esta información abierta, la cual se pretende cubrir con el Data Warehouse.
Cubo de venta tradicional
Filtra solamente el canal tradicional que corresponde a la venta no realizada
por los vendedores especialistas de Proyecto. Cubriéndose en su totalidad
por el Data Warehouse.
Maestra Rentabilidad Comercial
Informe que muestra la rentabilidad por proveedor, categoría y producto de
forma histórica, información solo para el Departamento de Gestión, la cual
se pretende cubrir en su totalidad con el Data Warehouse.
Sellout Comercial
Corresponde al resumen de la venta por producto del mes, información de
carácter publica, la cual se pretende cubrir con el Data Warehouse.
2. Debe proveer la base sobre la que estarán montados los cubos de información de
cada área, esto se refiere a que se utilizará como soporte para la generación de los
informes mencionados en el punto anterior.
69
Universidad del Bío-Bío. Red de Bibliotecas - Chile
70
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Este reporte contiene información de las ventas netas generadas por algún producto
en particular, los datos dependen directamente de la necesidad de información, en otras
palabras, se genera a solicitud del cliente interno. Con el objetivo de obtener el monto total
de ventas por producto.
Este reporte contiene las ventas en unidades de productos, esto quiere decir que
muestra información de las cantidades de uno o varios productos vendidos. De tal forma
obtener el total de unidades vendidas por producto.
71
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Este reporte muestra en detalle las ventas realizadas por cada vendedor. Información
que se genera a pedido. De tal forma obtener el monto total de ventas por vendedor.
Este reporte contiene información de los montos de ventas por zonas, las que
corresponden a los diferentes grupos geográficos al cual pertenece un vendedor. Con el
objetivo de generar el monto total de ventas por zona.
72
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Debe tenerse en cuenta que dicha información, es la que proveerá el soporte para
desarrollar los pasos sucesivos, por lo cual, es muy importante que se preste especial
atención al relevar los datos [1].
Luego se procedió a identificar las necesidades más relevantes con respecto a este
proceso y además de las variables o perspectivas que deben tenerse en cuenta para poder
tomar decisiones basadas en él.
73
Universidad del Bío-Bío. Red de Bibliotecas - Chile
y sus respectivos costos, además de los kilos vendidos; logrando de esta forma obtener las
dimensiones desde las cuales se consultarán dichos indicadores. Cabe señalar que una
dimensión de base de datos es una colección de objetos relacionados, denominados
atributos, que se pueden usar para proporcionar información sobre los datos de hechos de
uno o varios cubos multidimensionales. Estos objetos están enlazados a una o varias
columnas de una o varias tablas de una vista de origen de datos. De manera
predeterminada, estos atributos están visibles como jerarquías de atributo y se pueden
utilizar para comprender los datos de hechos en un cubo multidimensional.
Para simplificar esta tarea se les presentó una serie de ejemplos concretos de otros
casos similares.
Área de Venta:
1. Se desea conocer cuál fue el monto de las ventas de categorías de productos por
zona en un tiempo determinado.
2. Se desea conocer cuál fue el monto de las ventas de las zonas por vendedor en un
tiempo determinado.
3. Se desea conocer cuál fue el monto de las ventas, el monto total de costos y la
ganancia por sector de la compra en un tiempo determinado.
Área Comercial:
4. Se desea conocer cuál fue el monto de las ventas, el monto de los costos y la
ganancia de productos por vendedor en un tiempo determinado.
5. Se desea conocer cuál fue el monto de las ventas, el monto de los costos y la
ganancia de categorías de productos por zona en un tiempo determinado.
Área Logística:
74
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Área de Venta:
Indicador Dimensiones
Indicador Dimensiones
Indicador
75
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Dimensiones
Área Comercial:
Indicadores
Dimensiones
Indicadores
Dimensiones
Área Logística:
Indicador Dimensiones
Indicador Dimensiones
76
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Indicador Dimensiones
Monto de ventas
Monto de costos
Ganancia
Unidades vendidas.
Cantidad de mt3
Cantidad de kilos
Productos
Lugar Compra
Sector Venta (zona)
Vendedor
Tiempo
77
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Producto Monto de
ventas
Monto de
costos
Lugar
Compra
Unidades
vendidas
Tiempo
VENTA Cantidad
de mt3
Sector
Venta
Ganancia
Vendedor
Cantidad
de kilos
Se identificarán las fuentes que alimentarán el Data Warehouse, para ello se tomará
como referencia los procesos OLTP (On Line Transaction Processing), los cuales
representan toda aquella información transaccional que genera la empresa en su accionar
diario, además, de las fuentes externas con las que puede llegar a disponer.
78
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Entre los OLTP más habituales que pueden existir en cualquier organización se
encuentran:
Archivos de textos.
Hipertextos.
Hojas de cálculos.
Informes semanales, mensuales, anuales, etc.
Bases de datos transaccionales.
Actualmente no existen registros sobre algún documento que contenga los modelos
relacionales, ni tampoco un registro de las bases de datos actuales implementadas, esto se
debe a la gran cantidad de tablas existentes, aproximadamente 250 tablas.
Por lo que la extracción de los datos se realizará sobre las Tablas Maestras
existentes, las que contienen una recopilación de los atributos necesarios ya procesados,
siendo estos datos extraídos de las tablas que se generan en las distintas áreas donde se
actualizan los datos diariamente. Por lo que estas tablas siempre estarán actualizadas con
datos consistentes.
En este paso se definirán los cálculos a realizar para obtener los indicadores, como
se especifica a continuación:
“Monto de ventas”:
o Hechos: Venta
o Función de sumarización: SUM.
“Monto de costos”:
o Hechos: Costo
79
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Ganancia
o Hechos: (Venta) – (Costo)
o Función de sumarización: SUM.
Unidades vendidas.
o Hechos: Unidades
o Función de sumarización: SUM.
Cantidad de mt3
o Hechos: (Volumen) * (Unidades)
o Función de sumarización: SUM.
Cantidad de kilos
o Hechos: (Weight) * (Unidades)
o Función de sumarización: SUM.
80
Universidad del Bío-Bío. Red de Bibliotecas - Chile
La idea es que todos los elementos del diagrama conceptual estén correspondidos en
los OLTP.
Corresponden a las fuentes internas que actualmente satisfacen casi la totalidad de los
requerimientos de los usuarios, esto permitirá evaluar los campos relevantes para el Data
Warehouse que pertenecen al sistema, para ello se utilizarán las tablas Maestras que
contienen datos procesados de una gran cantidad de tablas.
81
Universidad del Bío-Bío. Red de Bibliotecas - Chile
82
Universidad del Bío-Bío. Red de Bibliotecas - Chile
COD_REGION 13 SSAA 49
Características:
- Esta tabla contiene los registros que se generan diariamente en distintas áreas,
siendo estas Gestión Comercial, Gestión Logística, Gestión Ventas y Presupuesto.
- Esta tabla tiene un total de 67 atributos.
- La tabla en cada actualización diaria no incorpora los nuevos valores, sino que
elimina los datos y los remplaza por los datos nuevos. Estos datos son los que
contenía anteriormente más los datos nuevos.
- Se actualizan diariamente aproximadamente 50 mil registros.
- La actualización toma un tiempo aproximado de 20 minutos a principio de mes y 40
minutos al finalizar el mes.
83
Universidad del Bío-Bío. Red de Bibliotecas - Chile
NOT_COD_CD 2 CANTIDAD 25
SEC_CODIGO 0 GTO_ESTR 8
NOMBRE_SECTOR 0 GTO_DR 41
COD_REGION 13 OI_RT 0
NOT_PROYECTO_ARTICUL
O 2002
ZONA RM 1
Características:
84
Universidad del Bío-Bío. Red de Bibliotecas - Chile
- Estas tablas existen desde Enero del 2010, generándose mensualmente una nueva,
por lo que se tiene información histórica desde esa fecha, en distintas tablas.
- A la fecha de septiembre del 2012, fecha en la cual se realizó el análisis en la
empresa, se detectó un total de 23 tablas.
- En base a estas tablas se responde la mayor cantidad de consultas que generan los
usuarios finales.
- Esta tabla contiene un total de 78 atributos.
- Contiene un atributo OI_T destacado con color verde en la tabla, que contiene la
suma de los OI, atributos contenidos en la misma tabla.
- Contiene 11 atributos que son ingresados de forma manual mes a mes, que se ven
resaltados con el color amarillo en la tabla, y corresponden a los siguientes
atributos:
o NC_MDC
o CTO_MDC
o GTO_FIN
o GTO_FVTA
o GTO_VVTA
o GTO_REEMB
o GTO_ESTR
o GTO_DR
o RAMPLA
o FLETE_x_CLI
Hace referencia a las fuentes que aportan datos desde otras áreas, siendo en este
caso las tablas que se encuentran en el área de Sistemas.
85
Universidad del Bío-Bío. Red de Bibliotecas - Chile
ENV UND
COD_MARCA R015
DESCR_MARCA REXONA
COD_SECCION 6
COD_EJECUTIVO 002689
BRAVO VILLEGAS ALLISON
NOMBRE_EJECUTIVO ESTRELL
WEIGHT 150
VOLUME 402,04
86
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Cabe destacar que los cálculos realizados son evaluados con datos aproximados, por lo que
los resultados pueden diferir con los actuales.
5.2.2.4 Relaciones
87
Universidad del Bío-Bío. Red de Bibliotecas - Chile
88
Universidad del Bío-Bío. Red de Bibliotecas - Chile
89
Universidad del Bío-Bío. Red de Bibliotecas - Chile
90
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Cabe destacar que la selección de los campos que integrarán cada perspectiva, se
realizó con el respectivo cuidado, ya que esta acción determinará la granularidad de la
información encontrada en el Data Warehouse.
91
Universidad del Bío-Bío. Red de Bibliotecas - Chile
92
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Es la que determinará la granularidad del depósito de datos, los datos más típicos
que pueden emplearse son los siguientes:
93
Universidad del Bío-Bío. Red de Bibliotecas - Chile
VENT
94
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Para generar el modelo lógico, se debe tener presente que los atributos de las
respectivas dimensiones se deben organizar en jerarquías definidas por el usuario, que
proporcionan rutas de exploración para ayudar a los usuarios a examinar los datos de un
cubo.
Las ventajas que trae aparejada la desnormalización, son las de obviar uniones
(Join) entre las tablas cuando se realizan consultas, procurando así un mejor tiempo de
respuesta y una mayor sencillez con respecto a su utilización.
95
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Se procede a diseñar las tablas de dimensiones que formarán parte del Data
Warehouse. El procedimiento consta en tomar cada dimensión con sus campos relacionados
y realizar el siguiente proceso:
96
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Productos Producto
• Invtid PK id_producto
• tru_codigo
• Cod_Marca invtid
• Descr_Marca tru_codigo
• Categoria descr_producto
cod_marca
• Cod_Seccion
descr_marca
• Descr_Seccion
categoria
• Weight
cod_seccion
• Volume descr_seccion
weight
volume
Un producto en especial pertenece sólo a una marca. Una marca puede tener uno o más
productos.
Una marca en especial pertenece sólo a una categoría. Una categoría puede tener una o
más marcas.
Una categoría en especial pertenece sólo a una sección. Y una sección puede tener una
o más categorías.
97
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Vendedor Vendedor
• ven_codigo PK id_vendedor
• cod_persona
• nom_vendedor cod_vendedor
• nom_supervisor
• nom_jefe_regional
cod_persona
• nom_subgerente vendedor
supervisor
jefe_regional
subgerente
98
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Lugar_Compra
Lugar Compra
PK id_lugar_compra
• cod_region
• nom_provincia n_region
region
• nom_comuna provincia
• nom_pueblo comuna
ciudad
99
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Una ciudad en especial pertenece solo a una comuna. Una comuna puede
tener una o más ciudades.
Una comuna en especial pertenece solo a una provincia. Una provincia
puede tener una o más comunas.
Una provincia en especial pertenece solo a una región. Y una región puede
tener una o más comunas.
100
Universidad del Bío-Bío. Red de Bibliotecas - Chile
PK id_sector_venta
•ebitda
•canal canal_1
•cod_zona canal_2
cod_zona
•zona zona
Una zona en especial pertenece solo a un canal 1. Un Canal 1 puede tener uno o más
zonas.
Una zona en especial pertenece solo a un canal 2. Un Canal 2 puede tener uno o más
zonas.
Fecha
Tiempo
PK id_fecha
• Año
• mes_nombre año
• mes mes_nombre
• semestre mes
• trimestre semestre
• semana trimestre
• dia_nombre semana
• dia dia_nombre
• fecha dia
fecha_completa
Un día de la semana pertenece solo a una semana del mes. Una semana del mes
tiene uno o más días de la semana.
Una semana del año pertenece solo a un mes. Un mes tiene una o más semanas del
año.
Un mes del año pertenece solo a un semestre del año. Un semestre del año tiene uno
o más meses del año.
Un mes del año pertenece solo a un trimestre del año. Un trimestre del año tiene uno
o más meses del año.
Un semestre del año pertenece solo a un año. Un año tiene uno o más semestres del
año.
Un trimestre del año pertenece solo a un año. Un año tiene uno o más trimestres del
año.
102
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Se definirán las tablas de hechos, las cuales contendrán los hechos a través de los
cuales se construirán los indicadores de estudio, cumpliendo con lo siguiente:
103
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Venta
PK id_producto
PK id_lugar_compra
PK id_sector_venta
PK id_vendedor
PK id_fecha
PK num_nota_venta
PK not_cod_cd
MontoVenta
MontoCosto
Ganancia
Unidades
Volumen
Kilos
5.3.4 Uniones
104
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Lugar_Compra Sector_Venta
PK id_lugar_compra PK id_sector_venta
n_region canal_1
region canal_2 Vendedor
provincia cod_zona PK id_vendedor
comuna zona
ciudad cod_vendedor
cod_persona
vendedor
supervisor
jefe_regional
subgerente
Producto Venta
PK id_producto PK,FK1 id_producto
PK,FK2 id_lugar_compra Fecha
invtid PK,FK3 id_sector_venta
tru_codigo PK,FK4 id_vendedor PK id_fecha
descr_producto PK,FK5 id_fecha
cod_marca PK num_nota_venta año
descr_marca PK not_cod_cd mes_nombre
categoria mes
cod_seccion MontoVenta semestre
descr_seccion MontoCosto trimestre
weight Ganancia semana
volume Unidades dia_nombre
Volumen dia
Kilos fecha_completa
Una vez definido el modelo lógico, comienza la fase de prueba con datos, a través
de los procesos de ETL, esto quiere decir que se extraerán datos de diferentes fuentes, para
luego integrarlos, filtrarlos y depurarlos, para ello se utilizarán sólo sentencias SQL que
contendrán los datos que serán de interés.
105
Universidad del Bío-Bío. Red de Bibliotecas - Chile
A continuación, se generarán las sentencias SQL para cargar las diferentes tablas de
dimensiones y la tabla de hechos.
106
Universidad del Bío-Bío. Red de Bibliotecas - Chile
[Maestra_Final_MesAño].[Cod_Marca]=[Producto].[Cod_Marca] and
[Maestra_Final_MesAño].[Descr_Marca]= [Producto].[Descr_Marca] and
[Maestra_Final_MesAño].[Categoria]=[Producto].[Categoria] and
[Maestra_Final_MesAño].[Cod_Seccion]=[Producto].[Cod_Seccion] and
107
Universidad del Bío-Bío. Red de Bibliotecas - Chile
108
Universidad del Bío-Bío. Red de Bibliotecas - Chile
,[vendedor]
,[jefe_regional]
,[subgerente])
SELECT [Maestra_Final_MesAño].[ven_codigo],
[Maestra_Final_MesAño].[cod_persona],
[Maestra_Final_MesAño].[nom_supervisor],
[Maestra_Final_MesAño].[nom_vendedor],
[Maestra_Final_MesAño].[nom_jefe_regional],
[Maestra_Final_MesAño].[nom_subgerente]
FROM [Rabie].[dbo].[Maestra_Final_MesAño]
WHERE [Maestra_Final_MesAño].[ven_codigo] is not null and
[Maestra_Final_MesAño].[cod_persona] is not null and
[Maestra_Final_MesAño].[nom_supervisor] is not null and
[Maestra_Final_MesAño].[nom_vendedor] is not null and
[Maestra_Final_MesAño].[nom_jefe_regional] is not null and
[Maestra_Final_MesAño].[nom_subgerente] is not null
EXCEPT
SELECT [Maestra_Final_MesAño].[ven_codigo],
[Maestra_Final_MesAño].[cod_persona],
[Maestra_Final_MesAño].[nom_supervisor],
[Maestra_Final_MesAño].[nom_vendedor],
[Maestra_Final_MesAño].[nom_jefe_regional],
[Maestra_Final_MesAño].[nom_subgerente]
FROM [Rabie].[dbo].[Maestra_Final_MesAño]
INNER JOIN [Data Warehouse P1].[dbo].[Vendedor] ON
[Maestra_Final_MesAño].[ven_codigo]=[Vendedor].[cod_vendedor] and
[Maestra_Final_MesAño].[cod_persona]=[Vendedor].[cod_persona] and
[Maestra_Final_MesAño].[nom_supervisor]=[Vendedor].[supervisor] and
[Maestra_Final_MesAño].[nom_vendedor]=[Vendedor].[vendedor] and
[Maestra_Final_MesAño].[nom_jefe_regional]=[Vendedor].[jefe_regional] and
[Maestra_Final_MesAño].[nom_subgerente]=[Vendedor].[subgerente]
GROUP BY [Maestra_Final_MesAño].[ven_codigo],
[Maestra_Final_MesAño].[cod_persona],
[Maestra_Final_MesAño].[nom_supervisor],
[Maestra_Final_MesAño].[nom_vendedor],
[Maestra_Final_MesAño].[nom_jefe_regional],
[Maestra_Final_MesAño].[nom_subgerente]
109
Universidad del Bío-Bío. Red de Bibliotecas - Chile
110
Universidad del Bío-Bío. Red de Bibliotecas - Chile
111
Universidad del Bío-Bío. Red de Bibliotecas - Chile
EXCEPT
SELECT [Maestra_Final_MesAño].[cod_region]
,[Maestra_Final_MesAño].[nom_provincia]
,[Maestra_Final_MesAño].[nom_comuna]
,[Maestra_Final_MesAño].[nom_pueblo]
,[Maestra_Final_MesAño].[cod_region]
FROM [Rabie].[dbo].[Maestra_Final_MesAño]
INNER JOIN [Data Warehouse P1].[dbo].[Lugar_Compra] ON
[Maestra_Final_MesAño].[cod_region]=[Lugar_Compra].[n_region] and
[Maestra_Final_MesAño].[nom_provincia]=[Lugar_Compra].[provincia] and
[Maestra_Final_MesAño].[nom_comuna]=[Lugar_Compra].[comuna] and
[Maestra_Final_MesAño].[nom_pueblo]=[Lugar_Compra].[ciudad]
GROUP BY [Maestra_Final_MesAño].[cod_region]
,[Maestra_Final_MesAño].[nom_provincia]
,[Maestra_Final_MesAño].[nom_comuna]
,[Maestra_Final_MesAño].[nom_pueblo]
Se consultó a los clientes y se averiguó que se deseaba tener todos los sectores
internos de venta que posee la organización y que no contengan ningún campo con valor
NULL.
EXCEPT
SELECT [Maestra_Final_MesAño].[cod_zona],
[Maestra_Final_MesAño].[zona],
[Maestra_Final_MesAño].[EBITDA],
[Maestra_Final_MesAño].[canal]
FROM [Rabie].[dbo].[Maestra_Final_MesAño]
INNER JOIN [Data Warehouse P1].[dbo].[Sector_Venta] ON
[Maestra_Final_MesAño].[cod_zona]=[Sector_Venta].[cod_zona]
and
[Maestra_Final_MesAño].[zona]=[Sector_Venta].[zona] and
[Maestra_Final_MesAño].[EBITDA]=[Sector_Venta].[canal_1] and
[Maestra_Final_MesAño].[canal]=[Sector_Venta].[canal_2]
GROUP BY [Maestra_Final_MesAño].[cod_zona],
[Maestra_Final_MesAño].[zona],
[Maestra_Final_MesAño].[EBITDA],
[Maestra_Final_MesAño].[canal]
113
Universidad del Bío-Bío. Red de Bibliotecas - Chile
114
Universidad del Bío-Bío. Red de Bibliotecas - Chile
,DATEPART(day,[Maestra_Final_MesAño].[not_fecha_venta])
,[Maestra_Final_MesAño].[not_fecha_venta]
FROM [Rabie].[dbo].[Maestra_Final_MesAño]
WHERE not_fecha_venta is not null
EXCEPT
SELECT DATEDIFF ( day, 01/01/2010 ,
[Maestra_Final_MesAño].[not_fecha_venta] )
,DATENAME(year,[Maestra_Final_MesAño].[not_fecha_venta])
,DATENAME(month,[Maestra_Final_MesAño].[not_fecha_venta])
,DATEPART(month,[Maestra_Final_MesAño].[not_fecha_venta])
,CASE
WHEN DATEPART(month,[Maestra_Final_MesAño].[not_fecha_venta])
between 1 and 6 THEN '1'
WHEN DATEPART(month,[Maestra_Final_MesAño].[not_fecha_venta])
between 7 and 12 THEN '2'
END
,DATENAME(quarter,[Maestra_Final_MesAño].[not_fecha_venta])
,DATENAME(week,[Maestra_Final_MesAño].[not_fecha_venta])
,DATENAME(weekday,[Maestra_Final_MesAño].[not_fecha_venta])
,DATEPART(day,[Maestra_Final_MesAño].[not_fecha_venta])
,[Maestra_Final_MesAño].[not_fecha_venta]
FROM [Rabie].[dbo].[Maestra_Final_MesAño]
INNER JOIN [Data Warehouse P1].[dbo].[Fecha] ON
[Maestra_Final_MesAño].[not_fecha_venta]=[Fecha].[fecha_completa]
GROUP BY [Maestra_Final_MesAño].[not_fecha_venta]
115
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Para la confección de la tabla de hechos, se tuvieron que tomar como fuente las
tablas “Maestra_Final_MesAño” y “Maestra_Final_Diaria”. Al igual que en las tablas de
dimensiones, se recolectaron las condiciones que deben cumplir los datos para considerarse
de interés.
Debido a que la Tabla de hechos accede a las dimensiones, es necesario que éstas
estén creadas con anticipación, ya que utiliza las claves primarias.
GO
ALTER TABLE [dbo].[Venta] WITH CHECK ADD CONSTRAINT [FK_Venta_Fecha]
FOREIGN KEY([id_fecha])
116
Universidad del Bío-Bío. Red de Bibliotecas - Chile
id_producto
id_vendedor
id_lugar_compra
id_sector_venta
117
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Y para la agregación de los valores de los atributos, con respecto a los datos
almacenados en el Data Warehouse, manteniendo de esta forma una consistencia en los
datos, se utilizaron los siguientes códigos por atributo:
UPDATE [Rabie].[dbo].[Maestra_Final_MesAño]
SET [id_producto] = [Producto].[id_producto]
FROM [Data Warehouse P1].[dbo].[Producto]
INNER JOIN [Rabie].[dbo].[Maestra_Final_MesAño] ON
[Producto].[invtid]=[Maestra_Final_MesAño].[invtid] and
[Producto].[tru_codigo]=[Maestra_Final_MesAño].[tru_codigo] and
[Producto].[Descr_Producto]=[Maestra_Final_MesAño].[Descr_Producto] and
[Producto].[Cod_Marca]=[Maestra_Final_MesAño].[Cod_Marca] and
[Producto].[Descr_Marca]= [Maestra_Final_MesAño].[Descr_Marca] and
[Producto].[Categoria]=[Maestra_Final_MesAño].[Categoria] and
[Producto].[Cod_Seccion]=[Maestra_Final_MesAño].[Cod_Seccion] and
[Producto].[Descr_Seccion]= [Maestra_Final_MesAño].[Descr_Seccion] and
[Producto].[Weight]=[Maestra_Final_MesAño].[Weight] and
[Producto].[Volume]=[Maestra_Final_MesAño].[Volume]
WHERE [Maestra_Final_MesAño].[id_producto] is null
UPDATE [Rabie].[dbo].[Maestra_Final_MesAño]
SET [id_vendedor] = [Vendedor].[id_vendedor]
FROM [Data Warehouse P1].[dbo].[Vendedor]
INNER JOIN [Rabie].[dbo].[Maestra_Final_MesAño] ON
[Vendedor].[cod_vendedor]=[Maestra_Final_MesAño].[ven_codigo] and
[Vendedor].[cod_persona]= [Maestra_Final_MesAño].[cod_persona] and
[Vendedor].[supervisor]=[Maestra_Final_MesAño].[nom_supervisor] and
[Vendedor].[vendedor]=[Maestra_Final_MesAño].[nom_vendedor] and
[Vendedor].[jefe_regional]=[Maestra_Final_MesAño].[nom_jefe_regional] and
[Vendedor].[subgerente]=[Maestra_Final_MesAño].[nom_subgerente]
WHERE [Maestra_Final_MesAño].[id_vendedor] is null
UPDATE [Rabie].[dbo].[Maestra_Final_MesAño]
SET [id_lugar_compra]= [Lugar_Compra].[id_lugar_compra]
FROM [Data Warehouse P1].[dbo].[Lugar_Compra]
INNER JOIN [Rabie].[dbo].[Maestra_Final_MesAño] ON
[Lugar_Compra].[n_region]= [Maestra_Final_MesAño].[cod_region] and
[Lugar_Compra].[provincia]=[Maestra_Final_MesAño].[nom_provincia] and
118
Universidad del Bío-Bío. Red de Bibliotecas - Chile
[Lugar_Compra].[comuna]=[Maestra_Final_MesAño].[nom_comuna] and
[Lugar_Compra].[ciudad]= CASE
WHEN [Maestra_Final_MesAño].[nom_pueblo] = '#ANCUL' THEN 'ÑANCUL'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = '#IPAS' THEN 'ÑIPAS'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = '#IQUEN' THEN 'ÑIQUEN'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = '#U#OA' THEN 'ÑUÑOA'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = '#U#OA 35' THEN 'ÑUÑOA
35'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = '#U#OA 36' THEN 'ÑUÑOA
36'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = '#U#OA 37' THEN 'ÑUÑOA
37'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'CA#ETE' THEN 'CAÑETE'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'CHA#ARAL' THEN 'CHAÑARAL'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'CHA#ARAL ALTO' THEN 'CHAÑARAL
ALTO'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'CO#ARIPE' THEN 'COÑARIPE'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'DO#IHUE' THEN 'DOÑIHUE'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'PE#AFLOR' THEN 'PEÑAFLOR'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'PE#ALOLEN' THEN 'PEÑALOLEN'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'PE#ALOLEN 80' THEN
'PEÑALOLEN 80'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'PE#ALOLEN 81' THEN
'PEÑALOLEN 81'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'PE#ALOLEN 82' THEN
'PEÑALOLEN 82'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'PE#ALOLEN /ES' THEN
'PEÑALOLEN /ES'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR' THEN 'VIÑA DEL
MAR'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR 1' THEN 'VIÑA
DEL MAR 1'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR 2' THEN 'VIÑA
DEL MAR 2'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR 3' THEN 'VIÑA
DEL MAR 3'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR 4' THEN 'VIÑA
DEL MAR 4'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR 5' THEN 'VIÑA
DEL MAR 5'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR 6' THEN 'VIÑA
DEL MAR 6'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR 7' THEN 'VIÑA
DEL MAR 7'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR /01' THEN 'VIÑA
DEL MAR /01'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR /02' THEN 'VIÑA
DEL MAR /02'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VI#A DEL MAR /03' THEN 'VIÑA
DEL MAR /03'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = 'VICU#A' THEN 'VICUÑA'
WHEN [Maestra_Final_MesAño].[nom_pueblo] = [Lugar_Compra].[ciudad] THEN
[Maestra_Final_MesAño].[nom_pueblo]
END
WHERE [Maestra_Final_MesAño].[id_lugar_compra] is null
119
Universidad del Bío-Bío. Red de Bibliotecas - Chile
UPDATE [Rabie].[dbo].[Maestra_Final_MesAño]
SET [id_sector_venta]= [Sector_Venta].[id_sector_venta]
FROM [Data Warehouse P1].[dbo].[Sector_Venta]
INNER JOIN [Rabie].[dbo].[Maestra_Final_MesAño] ON
[Sector_Venta].[cod_zona]=[Maestra_Final_MesAño].[cod_zona] and
[Sector_Venta].[zona]= [Maestra_Final_MesAño].[zona] and
[Sector_Venta].[canal_1] =[Maestra_Final_MesAño].[ebitda] and
[Sector_Venta].[canal_2]= CASE
WHEN [Maestra_Final_MesAño].[canal] = 'Otro' THEN 'OTROS'
WHEN [Maestra_Final_MesAño].[canal] = [Sector_Venta].[canal_2] THEN
[Maestra_Final_MesAño].[canal]END
WHERE [Maestra_Final_MesAño].[id_sector_venta] is null
120
Universidad del Bío-Bío. Red de Bibliotecas - Chile
,([Producto].[Weight]*[Maestra_Final_MesAño].[cantidad])
FROM [rabie].[dbo].[Maestra_Final_MesAño]
INNER JOIN [Data Warehouse P1].[dbo].[Producto] ON
[Maestra_Final_MesAño].[id_producto]=[Producto].[id_producto]
WHERE [Maestra_Final_MesAño].[id_producto] is not null and
[Maestra_Final_MesAño].[id_vendedor] is not null and
[Maestra_Final_MesAño].[id_sector_venta] is not null and
[Maestra_Final_MesAño].[id_lugar_compra] is not null and
[Maestra_Final_MesAño].[not_fecha_venta] is not null
EXCEPT
SELECT [Maestra_Final_MesAño].[id_producto]
,[Maestra_Final_MesAño].[id_vendedor]
,DATEDIFF ( day, 01/01/2010 , [Maestra_Final_MesAño].[fecha] )
,[Maestra_Final_MesAño].[id_sector_venta]
,[Maestra_Final_MesAño].[id_lugar_compra]
,[Maestra_Final_MesAño].[not_num_nota_venta]
,[Maestra_Final_MesAño].[not_cod_cd]
,[Maestra_Final_MesAño].[venta]
,[Maestra_Final_MesAño].[costo]
,[Maestra_Final_MesAño].[cantidad]
,([Producto].[volume]*[Maestra_Final_MesAño].[cantidad])
,([Producto].[Weight]*[Maestra_Final_MesAño].[cantidad])
FROM [rabie].[dbo].[Maestra_Final_MesAño]
INNER JOIN [Data Warehouse P1].[dbo].[Producto] ON
[Maestra_Final_MesAño].[id_producto]=[Producto].[id_producto]
INNER JOIN [Data Warehouse P1].[dbo].[Venta] ON
[Maestra_Final_MesAño].[id_producto]=[Venta].[id_producto] and
DATEDIFF(day,01/01/2010,[Maestra_Final_MesAño].[not_fecha_venta])=[Venta]
.[id_fecha] and
[Maestra_Final_MesAño].[id_sector_venta]=[Venta].[id_sector_venta] and
[Maestra_Final_MesAño].[id_lugar_compra]=[Venta].[id_lugar_compra] and
[Maestra_Final_MesAño].[not_num_nota_venta]=[Venta].[num_nota_venta] and
[Maestra_Final_MesAño].[not_cod_cd]=[Venta].[not_cod_cd] and
[Maestra_Final_MesAño].[venta]=[Venta].[MontoVenta]and
[Maestra_Final_MesAño].[costo]=[Venta].[MontoCosto]and
[Maestra_Final_MesAño].[cantidad]=[Venta].[Unidades]and
([Producto].[volume]*[Maestra_Final_MesAño].[cantidad])=[Venta].[Volumen]
and
([Producto].[Weight]*[Maestra_Final_MesAño].[cantidad])=[Venta].[Kilos]
WHERE [Maestra_Final_MesAño].[id_producto] is not null and
[Maestra_Final_MesAño].[id_vendedor] is not null and
[Maestra_Final_MesAño].[id_sector_venta] is not null and
[Maestra_Final_MesAño].[id_lugar_compra] is not null and
[Maestra_Final_MesAño].[not_fecha_venta] is not null
GROUP BY [Maestra_Final_MesAño].[id_producto]
,[Maestra_Final_MesAño].[id_vendedor]
,[Maestra_Final_MesAño].[not_fecha_venta]
,[Maestra_Final_MesAño].[id_sector_venta]
,[Maestra_Final_MesAño].[id_lugar_compra]
,[Maestra_Final_MesAño].[not_num_nota_venta]
,[Maestra_Final_MesAño].[not_cod_cd]
,[Maestra_Final_MesAño].[venta]
,[Maestra_Final_MesAño].[costo]
,[Maestra_Final_MesAño].[cantidad]
,[Producto].[volume]
,[Producto].[Weight]
121
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Es necesario el uso de estos cubos debido a la rápida respuesta para las consultas
aplicadas a grandes volúmenes de datos, como los que almacena Rabie S.A.
Los cubos estarán basados en el modelo lógico diseñado, siguiendo los pasos de la
metodología Hefesto [1], además se presentará la correcta distinción entre:
122
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Área de Venta:
Área Comercial:
Área Logística:
Por lo que el modelo lógico queda representado en la Figura 34: Modelo lógico
Cubo de Ventas 1:
Sector_Venta
PK id_sector_venta
canal_1
canal_2
cod_zona
zona
Producto Venta
Fecha
PK id_producto PK,FK1 id_producto
PK id_fecha
PK,FK2 id_lugar_compra
invtid PK,FK3 id_sector_venta
año
tru_codigo PK,FK4 id_vendedor
mes_nombre
descr_producto PK,FK5 id_fecha
mes
cod_marca PK num_nota_venta
semestre
descr_marca PK not_cod_cd
trimestre
categoria
semana
cod_seccion MontoVenta
dia_nombre
descr_seccion MontoCosto
dia
weight Ganancia
fecha_completa
volume Unidades
Volumen
Kilos
En este momento se crearán seis indicadores que serán incluidos en el cubo “Cubo
de Ventas 1”, los que son representados en la Tabla 6.
123
Universidad del Bío-Bío. Red de Bibliotecas - Chile
124
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Atributo Descripción
1. Secciones De la tabla de dimensión “PRODUCTO”, se tomará el campo
“Descr_Seccion” para la creación del atributo
2. Categorías De la tabla de dimensión “PRODUCTO”, se tomará el campo
“Categoria” para la creación del atributo
3. Marcas De la tabla de dimensión “PRODUCTO”, se tomará el campo
“Descr_Marca” para la creación del atributo
4. Productos De la tabla de dimensión “PRODUCTO”, se tomará el campo
“Descr_Producto” para la creación del atributo
5. Canales 1 De la tabla de dimensión “SECTOR_VENTA”, se tomará el campo
“Canal_1” para la creación del atributo
6. Zonas De la tabla de dimensión “SECTOR_VENTA”, se tomará el campo
“Zona” para la creación del atributo
7. Años De la tabla de dimensión “FECHA”, se tomará el campo “Año” para la
creación del atributo
8. Semestres De la tabla de dimensión “FECHA”, se tomará el campo “Semestre”
para la creación del atributo
9. Meses De la tabla de dimensión “FECHA”, se tomará el campo
“Mes_Nombre” para la creación del atributo
10. Días De la tabla de dimensión “FECHA”, se tomará el campo “Dia” para la
creación del atributo denominado
Tabla 7: Atributos del “Cubo de Ventas 1”
125
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Un producto en especial pertenece sólo a una marca. Una marca puede tener
uno o más productos.
Una marca en especial pertenece sólo a una categoría. Una categoría puede
tener una o más marcas.
Una categoría en especial pertenece sólo a una sección. Y una sección puede
tener una o más categorías.
126
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Producto
PK id_producto
invtid
tru_codigo
descr_producto
cod_marca
descr_marca
categoria
cod_seccion
descr_seccion
weight
volume
Una zona en especial pertenece solo a un canal 1. Un Canal 1 puede tener uno o más
zonas.
Sector_Venta
PK id_sector_venta
canal_1
canal_2
cod_zona
zona
Un día del mes pertenece solo a un mes del año. Un mes del año tiene uno o más
días del mes.
Un mes del año pertenece solo a un semestre del año. Un semestre del año tiene uno
o más meses del año.
Un semestre del año pertenece solo a un año. Un año tiene uno o más semestres del
año.
127
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Fecha
PK id_fecha
año
mes_nombre
mes
semestre
trimestre
semana
dia_nombre
dia
fecha_completa
Cabe destacar que el atributo Proveedores no posee jerarquías para este caso. Esto
se debe a que en el cubo irá solo, sin descendencia ni procedencia.
128
Universidad del Bío-Bío. Red de Bibliotecas - Chile
129
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Área de Venta:
130
Universidad del Bío-Bío. Red de Bibliotecas - Chile
En este momento se crearán dos indicadores que serán incluidos en el cubo “Cubo
de Ventas 2”, los que son representados en la Tabla 8.
131
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Atributo Descripción
1. Vendedores De la tabla de dimensión “VENDEDOR”, se tomará el campo
“vendedor” para la creación del atributo
2. Supervisores De la tabla de dimensión “VENDEDOR”, se tomará el campo
“supervisor” para la creación del atributo
3. Jefes De la tabla de dimensión “VENDEDOR”, se tomará el campo
Regionales “jefe_regional” para la creación del atributo
4. Subgerentes De la tabla de dimensión “VENDEDOR”, se tomará el campo
“subgerente” para la creación del atributo
5. Canales 2 De la tabla de dimensión “SECTOR_VENTA”, se tomará el campo
“Canal_2” para la creación del atributo
6. Zonas De la tabla de dimensión “SECTOR_VENTA”, se tomará el campo
“Zona” para la creación del atributo
7. Años De la tabla de dimensión “FECHA”, se tomará el campo “Año” para
la creación del atributo
8. Trimestres De la tabla de dimensión “FECHA”, se tomará el campo “Trimestre”
para la creación del atributo
9. Meses De la tabla de dimensión “FECHA”, se tomará el campo
“Mes_Nombre” para la creación del atributo
10. Días De la tabla de dimensión “FECHA”, se tomará el campo “Dia” para la
creación del atributo
Tabla 9: Atributos del “Cubo de Ventas 2"
132
Universidad del Bío-Bío. Red de Bibliotecas - Chile
133
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Vendedor
PK id_vendedor
cod_vendedor
cod_persona
vendedor
supervisor
jefe_regional
subgerente
Una zona en especial pertenece solo a un canal 2. Un Canal 2 puede tener uno o más
zonas.
Sector_Venta
PK id_sector_venta
canal_1
canal_2
cod_zona
zona
Un día del mes pertenece solo a un mes del año. Un mes del año tiene uno o más
días del mes.
Un mes del año pertenece solo a un trimestre del año. Un trimestre del año tiene uno
o más meses del año.
Un trimestre del año pertenece solo a un año. Un año tiene uno o más trimestres del
año.
134
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Fecha
PK id_fecha
año
mes_nombre
mes
semestre
trimestre
semana
dia_nombre
dia
fecha_completa
135
Universidad del Bío-Bío. Red de Bibliotecas - Chile
136
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Área de Venta:
Lugar_Compra
PK id_lugar_compra
n_region
region
provincia
comuna
ciudad
Producto Venta
Fecha
PK id_producto PK,FK1 id_producto
PK id_fecha
PK,FK2 id_lugar_compra
invtid PK,FK3 id_sector_venta
año
tru_codigo PK,FK4 id_vendedor
mes_nombre
descr_producto PK,FK5 id_fecha
mes
cod_marca PK num_nota_venta
semestre
descr_marca PK not_cod_cd
trimestre
categoria
semana
cod_seccion MontoVenta
dia_nombre
descr_seccion MontoCosto
dia
weight Ganancia
fecha_completa
volume Unidades
Volumen
Kilos
En este momento se crearán tres indicadores que serán incluidos en el cubo “Cubo
de Ventas 3”, los que son representados en la Tabla 10.
137
Universidad del Bío-Bío. Red de Bibliotecas - Chile
11.
Atributo Descripción
1. Secciones De la tabla de dimensión “PRODUCTO”, se tomará el campo
“Descr_Seccion” para la creación del atributo
2. Categorías De la tabla de dimensión “PRODUCTO”, se tomará el campo
“Categoria” para la creación del atributo
3. Marcas De la tabla de dimensión “PRODUCTO”, se tomará el campo
“Descr_Marca” para la creación del atributo
138
Universidad del Bío-Bío. Red de Bibliotecas - Chile
139
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Un producto en especial pertenece solo a una marca. Una marca puede tener
uno o más productos.
Una marca en especial pertenece solo a una categoría. Una categoría puede
tener una o más marcas.
Una categoría en especial pertenece solo a una sección. Y una sección puede
tener una o más categorías.
Producto
PK id_producto
invtid
tru_codigo
descr_producto
cod_marca
descr_marca
categoria
cod_seccion
descr_seccion
weight
volume
Una ciudad en especial pertenece solo a una comuna. Una comuna puede
tener una o más ciudades.
Una comuna en especial pertenece solo a una provincia. Una provincia
puede tener una o más comunas.
140
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Una provincia en especial pertenece solo a una región. Y una región puede
tener una o más comunas.
Lugar_Compra
PK id_lugar_compra
n_region
region
provincia
comuna
ciudad
Un día del mes pertenece solo a un mes del año. Un mes del año tiene uno o más
días del mes.
Un mes del año pertenece solo a un año. Un año tiene uno o más meses del año.
Fecha
PK id_fecha
año
mes_nombre
mes
semestre
trimestre
semana
dia_nombre
dia
fecha_completa
141
Universidad del Bío-Bío. Red de Bibliotecas - Chile
142
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Capítulo 6
6.1 Introducción
Las herramientas de consulta y análisis son sistemas que permiten al usuario realizar
la exploración de datos del Data Warehouse. Básicamente constituyen el nexo entre el
depósito de datos y los usuarios.
A través de una amigable interfaz gráfica y una serie de pasos simples, el usuario
genera consultas que son enviadas desde la herramienta de consulta y análisis al Query
Manager, este a su vez realiza la extracción de información al Data Warehouse Manager y
devuelve los resultados obtenidos a la herramienta que se los solicitó. Luego, estos
resultados son expuestos ante el usuario en formatos que le son familiares [19].
1. El usuario selecciona o establece qué datos desea obtener del Data Warehouse,
mediante las interfaces de la herramienta que utilice.
143
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Cabe señalar que una de las principales ventajas para el área de Soporte de
Información al utilizar estas herramientas, es que los usuarios no se tienen que preocupar
por conocer cuál es la estructura de los datos, ni por saber emplear el lenguaje SQL, solo se
deben enfocar en el análisis, lo que permitiría aumentar los niveles de conocimiento de las
áreas que se alimentan de la información generada por dicha área.
Se han desarrollado para los usuarios una gran cantidad de poderosas herramientas de
consulta y reporte en el mercado a través de pantallas gráficas intuitivas, la posibilidad de
generar informes avanzados y detallados del área de interés del negocio que se esté
analizando.
144
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Es por ello que a continuación se presentarán detalles más técnicos de una de las
herramientas más utilizadas para realizar consultas y reportes, con el objetivo de entregar
mayor conocimiento al área de Soporte de Información con respecto al uso de estas
tecnologías.
Es una aplicación del ámbito Business Intelligent utilizada para diseñar y generar
informes desde una amplia gama de fuentes de datos. Esta herramienta está orientada para
potenciar a los usuarios de pequeñas y medianas empresas.
Con SAP Crystal Reports, los usuarios finales pueden tener acceso a informes con
una presentación impecable, realizar modelados empresariales en los informes y tomar
decisiones de manera inmediata desde el mismo informe, reduciendo de este modo la
dependencia de las TI y de los desarrolladores. A continuación se presentan las principales
características del producto [20].
145
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Información adicional:
Las herramientas OLAP, se conocen como sistemas analíticos, estos sistemas pueden
encontrarse integrados tanto en suites Business Intelligent o ser simplemente una aplicación
independiente.
Se entiende por OLAP, o proceso analítico en línea, al método ágil y flexible para
organizar datos, específicamente metadatos, sobre un objeto o jerarquía de objetos, como
un sistema u organización multidimensional, y cuyo objetivo es recuperar y manipular
datos y combinaciones de los mismos a través de consultas o incluso informes.
Una herramienta OLAP está formada por un motor y un visor. El motor es, en
realidad, justo el concepto que acabamos de definir. El visor OLAP es una interfaz que
permite consultar, manipular, reordenar y filtrar datos existentes en una estructura OLAP
mediante una interfaz gráfica de usuario [21].
Las estructuras OLAP permiten realizar consultas que serían sumamente complejas
en el lenguaje SQL. Lo que aporta verdaderos beneficios al aplicarlas al Data Warehouse
propuesto en este proyecto, debido a que proporciona libertad a los usuarios finales para
realizar consultas de forma independiente del área de Soporte de Información.
146
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Dentro de las herramientas gratuitas para generar reportes OLAP se destacan las tres
siguientes:
OlapCube
JPivot
Mondrian
147
Universidad del Bío-Bío. Red de Bibliotecas - Chile
6.3.1 OlapCube
148
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Información adicional:
Por lo que se procederá a indicar los pasos desde la instalación y conexión del
OlapCube con el Data Warehouse ya instalado y cargado de datos, hasta los resultados
obtenidos y procesados por dicha herramienta.
149
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Para ello, es necesario llevar a cabo cinco pasos que se detallan a continuación.
http://www.olapcube.com/tr_download.asp.
150
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Luego de abrir el programa ya instalado, se debe hacer clic en el círculo rojo que se
muestra en la Figura 48.
151
Universidad del Bío-Bío. Red de Bibliotecas - Chile
152
Universidad del Bío-Bío. Red de Bibliotecas - Chile
153
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Para conformar el cubo, se utilizará como modelo el Cubo de Ventas 3, del Capítulo
5 punto 5.5.3, basándose estrictamente en los indicadores y dimensiones ahí mencionadas.
Y así sucesivamente hasta obtener la dimensión con sus respectivos atributos, como
se muestra a continuación:
154
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Posterior a esto, para cambiar el nombre de la dimensión, se debe hacer clic derecho
sobre la dimensión y seleccionar Properties.
155
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Se debe realizar el mismo procedimiento para las otras dos dimensiones, obteniendo
el resultado que se muestra a continuación:
Luego agregar los indicadores, para ello se arrastran hasta la carpeta Measures, y se
editan sus nombres de la misma forma que en el punto anterior, obteniendo finalmente esto:
156
Universidad del Bío-Bío. Red de Bibliotecas - Chile
157
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Cabe señalar que el cubo generado en la prueba estaba compuesto por 300 mil
registros, tomando un tiempo de generación de aproximadamente 7 minutos, prueba
realizada en un equipo de uso domestico con las siguientes características:
Para la manipulación del cubo se abre automáticamente luego del paso anterior, la
herramienta OlapCube Reader, la que permite navegar de forma expedita por las
dimensiones del cubo, apreciando a la vez los indicadores seleccionados, a continuación se
presentan algunas capturas de las distintas funcionalidades.
158
Universidad del Bío-Bío. Red de Bibliotecas - Chile
159
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Para trabajar con el cubo OLAP en Excel, se debe hacer clic en el icono Excel y
luego en “Open cube in new Workbook”, como se muestra en la Figura 59.
Luego se abrirá Excel con el cubo cargado, con un formato al estilo tabla dinámica,
en la cual se podrá manipular los datos y generar reportes, entre otros.
160
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Unidades vendidas de las marcas de margarinas por región, entre los meses
agosto y octubre del año 2012 [Gráfico 1].
161
Universidad del Bío-Bío. Red de Bibliotecas - Chile
OHIGGINS
MAULE
-5000000
BIOBÍO
ARAUCANÍA
LOS RÍOS
LOS LAGOS
ABARROTES - MARGARINAS - LONCOLECHE
18000000
16000000
14000000
12000000
10000000
8000000
6000000
4000000
2000000
0
-2000000
ARICA Y
TARAPAC ANTOFAG COQUIMB VALPARAI ARAUCAN LOS
PARINAC ATACAMA RM OHIGGINS MAULE BIOBÍO LOS RÍOS
Á ASTA O SO ÍA LAGOS
OTA
TABAQUERIA 229413 105971 1381990,1 587830 1692812,1 2426518 19684562 2608389,5 2209926 7225993,8 -172879,8 86149,97 1743104,3
162
Universidad del Bío-Bío. Red de Bibliotecas - Chile
60000000
40000000
20000000
0
Agosto Octubre Septiembre
2012
WATTS
Gráfico 3: Ganancia de los Gerentes generada el primer día de cada mes por Canal 2
6.3.2 Mondrian
Para trabajar con los cubos generados se utiliza la herramienta adicional que ofrece
Open Source Pentaho [22], Workbench para editar cubos.
163
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Mondrian es similar a JDBC pero exclusivo para OLAP. Proporciona la conexión a la base
de datos y ejecuta las sentencias SQL.
Información adicional:
6.4.1 Orange
165
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Posee más de 100 widgets, cubriendo así la mayoría de las tareas estándar de
análisis de datos. También ofrece especializados complementos, como Bio Orange
para la bioinformática.
Con interfaz de Python scripting, la programación y el desarrollo de nuevos
algoritmos complejos o procedimientos de análisis de datos resulta de manera más
fácil e inductiva, permitiendo la utilización y reutilización de código.
Información adicional:
6.4.2 RapidMiner
166
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Posee un diseño que permite a los usuarios realizar acciones de forma más intuitiva.
Varias capas de la vista de los datos, garantizan un manejo más eficiente de los
datos.
El modo servidor, o el acceso a través de la API de Java, tienen una interfaz gráfica
de usuario.
Dispone de más de 500 operadores para la integración y transformación de los
datos, minería de datos, evaluación y visualización de los datos.
Genera esquemas de metadatos automáticos de forma optimizada.
Definición de los bloques de construcción reutilizables.
Utiliza XML con formato estandarizado para el intercambio de los procesos.
Diseño de proceso gráfico para tareas estándar, lenguaje de scripts para operaciones
arbitrarias.
Machine Learning Library WEKA totalmente integrado.
Tiene acceso a fuentes de datos, como Excel, Access, Oracle, IBM DB2, Microsoft
SQL, Sybase, Ingres, MySQL, Postgres, SPSS, dBase, archivos de texto y más.
Entrega una completa solución de minería con respecto a la integración,
transformación y métodos de modelado de los datos.
Información adicional:
167
Universidad del Bío-Bío. Red de Bibliotecas - Chile
6.4.3 Weka
Información adicional:
168
Universidad del Bío-Bío. Red de Bibliotecas - Chile
6.4.4 jHepWork
Información adicional:
169
Universidad del Bío-Bío. Red de Bibliotecas - Chile
6.4.5 KNIME
KNIME está escrito en Java y está basado en Eclipse, haciendo uso de su método de
extensión para apoyar plugins, proporcionando así una funcionalidad adicional. A través de
plugins, los usuarios pueden añadir módulos de texto, imagen, y el procesamiento de series
de tiempo, además de la integración de varios otros proyectos de código abierto, tales como
el lenguaje de programación de R, WEKA y LIBSVM.
Proporciona más de 1000 rutinas analíticas para los datos, ya sea nativa o a través
de R y WEKA, por temas tales como:
o Las estadísticas uni y multivariado
o Data Mining
o Series de tiempo
o Procesamiento de imágenes
o Web Analytics
o Text Mining
o Análisis de Redes
170
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Información adicional:
171
Universidad del Bío-Bío. Red de Bibliotecas - Chile
Capítulo 7
Conclusiones
7.1 Introducción
172
Universidad del Bío-Bío. Red de Bibliotecas - Chile
“Identificar los datos necesarios para conformar el Data Warehouse con sus
respectivas fuentes (componente OLTP, On Line Transaction Processing)”.
La identificación de los datos se realizó a través de la generación de los
requerimientos, lo que permitió la interiorización en el área, detectando sus reales
necesidades (ver Capítulo 5).
173
Universidad del Bío-Bío. Red de Bibliotecas - Chile
generar claves primarias para cada una de las dimensiones debido a que no existían
atributos claves para las identidades extraídas.
Además, a través del Data Warehouse y los cubos OLAP se demostró que se puede
obtener información que no existe en algún informe actual, logrando valiosas
funcionalidades que no estaba previstas en un comienzo.
174
Universidad del Bío-Bío. Red de Bibliotecas - Chile
8. Bibliografía
[3] Raúl Horacio Saroka, Sistemas de Información en la Era Digital, Primera ed. San MArtin,
Argentina: Fundación OSDE, 2002.
[4] Josep Lluís Cano, Business Intelligence: Competir con Información, Primera ed., Escuela
Banespyme, Ed. Barcelona, España: Fundación Cultur, 2007.
[5] Elizabeth Santana Beoto, Joan Manuel , and Granadillo Rodriguez, "Primeros pasos hacia la
Inteligencia de Negocios: Almacenes de datos (DataWareHouse), Herramientas ETL(PDI),
Procesamiento analítico en línea.," MsC. Julio Cesar Camps, vol. 10, no. 2, 2011.
[6] Date C. J., Introducción a los Sistemas de Bases de Datos, Séptima ed.: Pearson, 2001.
[7] A. Mendez, A. Mártire, P. Britos, and Martí Garcia, "Fundamentos de Data Warehouse,"
Reportes Técnicos en Ingeniería del Software, vol. 5, no. 1, pp. 19-26, 2003.
[8] Juan Vicente Pérez Palanca, "Proceso de desarrollo de indicadores de gestión. Un caso de
estudio en el contexto de un ERP.," Universidad Politécnica de Valéncia, Valéncia,
Venezuela, Tésis de Magister 2010.
[9] Griselda E. Bressán. (2012, Noviembre) Universidad Nacional del Nordeste, Facultad de las
Ciencias Exactas y Naturales y Agrimensura. [Online].
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressan.htm
[10] Bill Inmon and Richard Hackathorn, Building The Data Warehouse, Third Edition ed.: Jhon
Wiley and sons, 1992.
[11] María de los Ángeles Gil Estallo and Fernando Giner de la Fuente, Los Sistemas de
Información en la Sociedad Del Conocimiento, Primera Edición ed. España: ESIC, 2004.
[12] William Inmon, Building the Data Warehouse, 4th ed.: John Wiley & Sons Inc, 2005.
[13] Itziar Angoitia Espinosa, "Data warehouse para la gestión de lista de espera sanitaria,"
Universidad Politécnica de Madrid, Facultad de Informática, Madrid, Tésis 2008.
175
Universidad del Bío-Bío. Red de Bibliotecas - Chile
[15] Ralph Kimball and Margy Ross, The Data Warehouse Toolkit: The Complete Guide to
Dimensional Modeling, Second Edition ed., Robert Elliott, Ed. Canadá: John Wiley & Sons
Inc, 2002.
[16] Arun Sen and Atish P. Sinha, "A Comparison of Data Warehousing Methodologies,"
Communications of the ACM, vol. 48, no. 3, pp. 79-84, 2005.
[18] R. Kimball, M. Ross, W. Thornthwaite, and J. Mundy, The data warehouse lifecycle toolkit,
2nd ed.: Wiley Publishing, Inc., 2008.
[19] Joel Mija Ferrer, Luis Otiniano Dávila, and César Velásquez Haro, "Estado del Arte de Data
Warehouse".
[20] SAP. (2013, Febrero) SAP The Best-Run Businesses Run SAP. [Online].
http://www.sap.com
[21] Josep Curto Díaz, Introducción al Business Intelligence, Primera Edición en Lengua
Castellana ed. Barcelona, España: UOC, 2010.
[23] César Pérez López and Daniel Santín Gonzalez, Minería de datos: técnicas y herramientas,
Primera ed., Paraninfo S.A., Ed. Madrid, España: THOMSON Ediciones, 2007.
176
Universidad del Bío-Bío. Red de Bibliotecas - Chile
177