Está en la página 1de 121

UNIVERSIDAD REGIONAL AUTNOMA DE LOS ANDES

UNIANDES SANTO DOMINGO

FACULTAD DE SISTEMAS MERCANTILES.


CARRERA DE SISTEMAS

PROYECTO EXAMEN COMPLEXIVO PREVIO A LA OBTENCIN DEL TTULO


DE INGENIERO EN SISTEMAS E INFORMTICA

TEMA:
IMPLEMENTACIN DE UN DATAWAREHOUSE PARA LA TOMA DE
DECISIONES EN EL REA LOGSTICA DE LA COMPAA PRONACA.

AUTOR: LCD. JARAMILLO DELGADO FREDDY RENE


ASESOR: ING. MARTINEZ CAMPAA CARLOS EDUARDO

AMBATO ECUADOR
2016
APROBACIN DEL ASESOR DEL TRABAJO DE TITULACIN

CERTIFICACIN:

Quien suscribe, legalmente CERTIFICA QUE: El presente Trabajo de Titulacin realizado


por el seor Freddy Rene Jaramillo Delgado, estudiante de la Carrera de Sistemas, Facultad
de Sistemas Mercantiles, con el tema IMPLEMENTACIN DE UN DATAWAREHOUSE
PARA LA TOMA DE DECISIONES EN EL REA LOGSTICA DE LA COMPAA
PRONACA, ha sido prolijamente revisado, y cumple con todos los requisitos establecidos
en la normativa pertinente de la Universidad Regional Autnoma de los Andes -
UNIANDES-, por lo que apruebe su presentacin.

Ambato, Septiembre de 2016

_______________________________
Ing. Martnez Campaa Carlos Eduardo.
ASESOR
DECLARACIN DE AUTENTICIDAD

Yo, Freddy Rene Jaramillo Delgado, estudiante de la Carrera de Sistemas, Facultad de


Sistemas Mercantiles, declaro que todos los resultados obtenidos en el presente trabajo de
investigacin, previo a la obtencin del ttulo de INGENIERO EN SISTEMAS E
INFORMTICA, son absolutamente originales, autnticos y personales; a excepcin de las
citas, por lo que son de mi exclusiva responsabilidad.

Ambato, Septiembre de 2016

_______________________________
Lic. Jaramillo Delgado Freddy Rene
CI. 171446660-2
AUTOR
DERECHOS DE AUTOR

Yo, Freddy Rene Jaramillo Delgado, declaro que conozco y acepto la disposicin constante
en el literal d) del Art. 85 del Estatuto de la Universidad Regional Autnoma de Los Andes,
que en su parte pertinente textualmente dice: El Patrimonio de la UNIANDES, est
constituido por: La propiedad intelectual sobre las Investigaciones, trabajos cientficos o
tcnicos, proyectos profesionales y consultara que se realicen en la Universidad o por cuenta
de ella;

Ambato, Septiembre de 2016

_______________________________
Lic. Jaramillo Delgado Freddy Ren
CI. 171446660-2
AUTOR
DEDICATORIA

El presente trabajo de investigacin dedico a mi esposa Mayra Enriquez quien es mi apoyo


incondicional para el logro de mis objetivos.

A mis dos hijos Jearly y Josu, que son la razn de mi vida el tesoro ms grande que Dios
me regal y el motivo de m existir.

A mis padres Mariana Delgado y Faustino Jaramillo que se sacrificaron en post de mi


bienestar, guiaron mis pasos con mucho amor, me ensearon a continuar luchando para
vencer los obstculos, sin perder la esperanza de conseguir las metas propuestas, a pesar de
los tropiezos y dificultades que se han presentado en el difcil sendero de mi vida.

Freddy Rene Jaramillo.


AGRADECIMIENTO

Primero y antes que nada, gracias a Dios, por estar junto a m en cada paso, por fortalecer
nuestros corazones e iluminar nuestras mentes y por haber puesto en el camino a aquellas
personas que han sido soporte y compaa durante mis estudios.

A mi esposa Mayra Enriquez por ser mi motivacin, apoyo incondicional en cada momento
de mi vida, pilar fundamental para el logro de la culminacin de este trabajo.

A la Universidad Regional Autnoma de Los Andes, "Uniandes", por acogerme en sus aulas
y permitir que contine con una mejor formacin profesional.

A mi asesor de Tesis Ing. Carlos Martinez, por la infinita comprensin y colaboracin en


guiarme en la realizacin y fortalecimiento del presente trabajo investigativo.

Freddy Rene Jaramillo.


NDICE GENERAL

APROBACIN DEL ASESOR DEL TRABAJO DE TITULACIN.


DECLARACIN DE AUTENTICIDAD.
DERECHO DE AUTOR.
DEDICATORIA.
AGRADECIMIENTO.
RESUMEN EJECUTIVO.
ABSTRACT.
INTRODUCCIN. ................................................................................................................ 1
Antecedentes de la investigacin. .......................................................................................... 1
Planteamiento del problema. ................................................................................................. 2
Formulacin del problema. .................................................................................................... 2
Identificacin de la lnea de investigacin. ........................................................................... 2
Justificacin del tema. ........................................................................................................... 2
Objetivos................................................................................................................................ 3
Objetivo General.................................................................................................................... 3
Objetivos Especficos. ........................................................................................................... 3
1 CAPITULO I. MARCO TERICO. ............................................................ 4
1.1 Origen y evolucin del objeto de investigacin. ........................................... 4
1.2 Anlisis de distintas posiciones tericas sobre el objeto de investigacin. ... 4
1.3 Valoracin crtica de los conceptos principales de las distintas posiciones
tericas sobre el objeto de investigacin. .............................................................................. 5
1.3.1 Business Intelligence. .................................................................................... 5
1.3.1.1 Introduccin. .................................................................................................. 5
1.3.1.2 Definiciones. .................................................................................................. 5
1.3.1.3 Objetivo de las herramientas de inteligencia de negocios. ............................ 6
1.3.1.4 Caractersticas de la inteligencia de negocios. .............................................. 6
1.3.2 Sistemas de informacin. ............................................................................... 6
1.3.2.1 Sistemas de soporte a decisiones (DSS). ....................................................... 7
1.3.2.1.1 Funcin. ......................................................................................................... 7
1.3.2.1.2 Caractersticas. ............................................................................................... 7
1.3.3 Datawarehouse............................................................................................... 8
1.3.3.1 Definiciones. .................................................................................................. 8
1.3.3.2 Funcin. ......................................................................................................... 9
1.3.3.3 Caractersticas. ............................................................................................... 9
1.3.3.4 Arquitectura de un datawarehouse. ............................................................. 10
1.3.3.5 Estructura. .................................................................................................... 11
1.3.3.6 Proceso de extraccin, transformacin y carga ETL. .................................. 12
1.3.3.7 Modelo dimensional de un datawarehouse. ................................................. 14
1.3.3.7.1 Tablas de dimensiones. ................................................................................ 15
1.3.3.7.2 Tablas de hechos. ......................................................................................... 16
1.3.3.7.3 Nivel. ........................................................................................................... 17
1.3.3.7.4 Jerarquas. .................................................................................................... 18
1.3.3.7.5 Granularidad. ............................................................................................... 18
1.3.3.7.6 Relaciones. ................................................................................................... 18
1.3.3.7.7 Claves subrogadas. ...................................................................................... 19
1.3.3.8 Anlisis OLAP. ............................................................................................ 19
1.3.4 Desarrollo de un datawarehouse basado en la metodologa Ralph Kimball.
21
1.3.4.1 Planeacin y administracin del proyecto. .................................................. 22
1.3.4.2 Definicin de los requerimientos del negocio. ............................................ 24
1.3.4.3 Diseo tcnico de la arquitectura................................................................. 24
1.3.4.3.1 Back Room. ................................................................................................. 24
1.3.4.3.2 Front Room. ................................................................................................. 24
1.3.4.4 Seleccin e instalacin del producto. .......................................................... 25
1.3.4.5 Modelamiento dimensional. ........................................................................ 25
1.3.4.5.1 Paso 1 Seleccionar el Proceso de Negocio. .............................................. 26
1.3.4.5.2 Paso 2 Declaracin de granularidad. ........................................................ 26
1.3.4.5.3 Paso 3 Identificacin de Dimensiones. ..................................................... 26
1.3.4.5.4 Paso 4 Identificacin de Hechos. .............................................................. 26
1.3.4.5.5 Datawarehouse Bus Matrix. ........................................................................ 26
1.3.4.6 Diseo fsico. ............................................................................................... 27
1.3.4.7 Diseo y desarrollo del proceso ETL. ......................................................... 27
1.3.4.7.1 Paso 1 Trazar un plan de alto nivel........................................................... 28
1.3.4.7.2 Paso 2 Seleccionar la herramienta ETL. ................................................... 28
1.3.4.7.3 Paso 3 Desarrollar estrategias por defecto. ............................................... 28
1.3.4.7.4 Paso 4 Profundizar la tabla objetivo. ........................................................ 28
1.3.4.7.5 Paso 5 Poblar las tablas de dimensiones con los datos histricos. ........... 28
1.3.4.7.6 Paso 6 Realizar la carga histrica de la tabla de hechos. .......................... 28
1.3.4.7.7 Paso 7 Procesamiento incremental de la dimensiones.............................. 29
1.3.4.7.8 Paso 8 Procesamiento incremental de los hechos. .................................... 29
1.3.4.7.9 Paso 9 Operacin y automatizacin del sistema ETL. ............................. 29
1.3.5 Herramientas para el desarrollo del datawarehouse. ................................... 29
1.3.5.1 Motor de base de datos. ............................................................................... 29
1.3.5.2 Herramienta ETL. ........................................................................................ 30
1.3.5.3 Microsoft Integration Services. ................................................................... 30
1.3.5.4 Microsoft Analysis Services. ....................................................................... 31
1.3.5.5 Herramienta de presentacin. ...................................................................... 31
1.4 Conclusiones parciales. ............................................................................... 32
2 CAPITULO II MARCO METODOLGICO. ........................................... 33
2.1 Caracterizacin del sector, rama, empresa, contexto institucional o
problema seleccionado para la investigacin. ..................................................................... 33
2.2 Descripcin del procedimiento metodolgico para el desarrollo de
investigacin. 33
2.2.1 Modalidad de la Investigacin. .................................................................... 33
2.2.2 Tipos de investigacin. ................................................................................ 33
2.2.3 Tcnicas ....................................................................................................... 34
2.2.4 Poblacin. .................................................................................................... 35
2.3 Conclusiones parciales. ............................................................................... 44
3 CAPITULO III MARCO PROPOSITIVO. ................................................ 45
3.1 Planeacin y administracin del proyecto. .................................................. 45
3.1.1 Definicin del proyecto. .............................................................................. 45
3.1.2 Alcance y justificacin del proyecto. .......................................................... 45
3.2 Definicin de los requerimientos del negocio ............................................. 46
3.3 Diseo tcnico de la arquitectura................................................................. 48
3.3.1 Back room ................................................................................................... 48
3.3.2 Front room ................................................................................................... 49
3.4 Seleccin del producto................................................................................. 49
3.5 Identificar las dimensiones y mapear los datos. .......................................... 50
3.5.1 Modelo dimensional .................................................................................... 50
3.5.1.1 Dimensin artculo. ..................................................................................... 51
3.5.1.2 Dimensin cliente. ....................................................................................... 52
3.5.1.3 Dimensin proveedor. ................................................................................. 53
3.5.1.4 Dimensin Tipo Movimiento. ..................................................................... 54
3.5.1.5 Dimensin red de distribucin..................................................................... 55
3.5.1.6 Dimensin Compaa. ................................................................................. 56
3.5.1.7 Dimensin Vehculos. ................................................................................. 57
3.5.1.8 Dimensin Tiempo. ..................................................................................... 58
3.5.2 Identificar los hechos ................................................................................... 58
3.5.2.1 Identificar las medidas. ................................................................................ 58
3.5.2.2 Abastecimiento y distribucin de producto terminado ............................... 59
3.5.2.3 Abastecimiento de materia prima ................................................................ 62
3.5.2.4 Nivel de servicio OTIF. ............................................................................... 65
3.5.3 Datawarehouse busmatrix............................................................................ 67
3.6 Diseo fsico. ............................................................................................... 67
3.6.1 Base de datos origen .................................................................................... 67
3.7 Diseo y desarrollo del proceso ETL. ......................................................... 68
3.7.1 Paso 1: Trazar un plan de alto nivel. ........................................................... 68
3.7.2 Paso 2: Funcionalidad de la herramienta ETL............................................. 68
3.7.3 Paso 3: Desarrollar estrategias por defecto.................................................. 68
3.7.3.1 Proyecto SSIS en Integration Services. ....................................................... 71
3.7.4 Paso 4: Poblar las tablas de dimensin con los datos. ................................. 71
3.7.4.1 Extraccin de Datos. .................................................................................... 72
3.7.4.2 Transformacin de Datos............................................................................. 72
3.7.4.3 Carga de datos. ............................................................................................ 72
3.7.5 Paso 5: Poblar las tablas de hecho con datos. .............................................. 72
3.8 Implementacin de cubo. ............................................................................. 73
3.9 Visualizacin de datos. ................................................................................ 73
3.9.1 Tablero de control distribucin de PT. ........................................................ 74
3.9.2 Tablero de control abastecimiento de materia prima................................... 75
3.9.3 Nivel de servicio OTIF ................................................................................ 75
CONCLUSIONES. .............................................................................................................. 76
RECOMENDACIONES. .................................................................................................... 77
BIBLIOGRAFA.
ANEXOS
NDICE DE GRFICOS

Figura 1-1: Pirmide Sistemas de Informacin ..................................................................... 7


Figura 1-2: Arquitectura de un datawarehouse ................................................................... 10
Figura 1-3: Estructura de los datos de un datawarehouse ................................................... 11
Figura 1-4: Proceso ETL ..................................................................................................... 13
Figura 1-5: Esquema Estrella .............................................................................................. 15
Figura 1-6: Esquema copo de nieve .................................................................................... 15
Figura 1-7: Tablas de Dimensiones ..................................................................................... 16
Figura 1-8: Tabla de Hecho ................................................................................................. 17
Figura 1-9: Niveles en la Dimensin ................................................................................... 17
Figura 1-10: Jerarqua en la Dimensin. ............................................................................. 18
Figura 1-11: Relaciones en un Modelo ............................................................................... 18
Figura 1-12: OLAP (On-Line Analytical Processing) ......................................................... 19
Figura 1-13: Cubo OLAP .................................................................................................... 20
Figura 1-14: Operacin OLAP - Drill Down ...................................................................... 21
Figura 1-15: Operacin OLAP - Roll Up ............................................................................ 21
Figura 1-16: The Kimball Lyfecycle Diagramt ................................................................... 21
Figura 1-17: Datawarehouse Bus Matrix............................................................................. 27
Figura 1-18: Arquitectura Integration Services ................................................................... 31
Figura 1-19: Visualizacin datos de cubos en hoja de Excel .............................................. 32
Figura 2-1: Ilustracin datos tabulados pregunta 1. ............................................................ 36
Figura 2-2: Ilustracin datos tabulados pregunta 2. ............................................................ 37
Figura 2-3: Ilustracin datos tabulados pregunta 3. ............................................................ 38
Figura 2-4: Ilustracin datos tabulados pregunta 4. ............................................................ 39
Figura 2-5: Ilustracin datos tabulados pregunta 5. ............................................................ 40
Figura 2-6: Ilustracin datos tabulados pregunta 6. ............................................................ 41
Figura 2-7: Ilustracin datos tabulados pregunta 7. ............................................................ 42
Figura 2-8: Ilustracin datos tabulados pregunta 8. ............................................................ 43
Figura 3-1: Back Room Proyecto ..................................................................................... 48
Figura 3-2: Front Room Proyecto ..................................................................................... 49
Figura 3-3: Diseo fsico tabla de hecho abastecimiento y distribucin de PT. ................. 61
Figura 3-4: Diseo fsico tabla de hecho gestin logstica MP ........................................... 64
Figura 3-5: Diagrama tabla temporal Mantanimiento_DW ................................................ 69
Figura 3-6: Estructura diagramas de base de datos temporal. ............................................ 69
Figura 3-7: Diagrama gestinlog_PT .................................................................................. 70
Figura 3-8: Diagrama GestionLog_MP ............................................................................... 70
Figura 3-9: Diagrama NivelServicio. .................................................................................. 71
Figura 3-10: Esquema paquetes SSIS .................................................................................. 71
Figura 3-11: Carga datos hacia el cubo. .............................................................................. 72
Figura 3-12: Cubo OLAP en Analysis Services .................................................................. 73
Figura 3-13: Men visualizacin de datos del cubo OLAP................................................. 74
Figura 3-14: TC Distribucin de producto terminado. ..................................................... 74
Figura 3-15: TC TM abastecidas de MP. ............................................................................ 75
Figura 3-16: TC Nivel de Servicio OTIF. ........................................................................... 75
NDICE DE TABLAS

Tabla 2-1: La entrevista ....................................................................................................... 34


Tabla 2-2: Datos tabulados pregunta1. ................................................................................ 36
Tabla 2-3: Datos tabulados pregunta 2. ............................................................................... 37
Tabla 2-4: Datos tabulados pregunta 3. ............................................................................... 38
Tabla 2-5: Datos tabulados pregunta 4. ............................................................................... 39
Tabla 2-6: Datos tabulados pregunta 5. ............................................................................... 40
Tabla 2-7: Datos tabulados pregunta 6. ............................................................................... 41
Tabla 2-8: Datos tabulados pregunta 7. ............................................................................... 42
Tabla 2-9: Datos tabulados pregunta 8. ............................................................................... 43
Tabla 3-1: Mapeo de datos Dimensin Artculo ................................................................ 51
Tabla 3-2: Mapeo de datos Dimensin Cliente ................................................................... 52
Tabla 3-3: Mapeo de datos Dimensin proveedor............................................................... 53
Tabla 3-4: Mapeo de datos Dimensin Tipomovimiento .................................................... 54
Tabla 3-5: Mapeo de datos Dimensin redtransporte.......................................................... 55
Tabla 3-6: Mapeo de datos Dimensin compaiatrans ....................................................... 56
Tabla 3-7: Mapeo de datos Dimensin vehculo ................................................................. 57
Tabla 3-8: Mapeo de datos Dimensin Tiempo .................................................................. 58
Tabla 3-9: Medidas tabla de hecho gestin logstica........................................................... 58
Tabla 3-10 : Medidas tabla de hecho Nivel de Servicio ...................................................... 59
Tabla 3-11: Mapeo de datos tabla de hecho gestionlog_PT ................................................ 60
Tabla 3-12: Mapeo de datos tabla de hecho gestionlog MP. ............................................... 63
Tabla 3-13: Mapeo de datos tabla de hecho nivelservicio................................................... 65
Tabla 3-14: Bus Matrix DW. ............................................................................................... 67
ANEXOS.

ANEXO 1- Modelo de la encuesta dirigido a los colaboradores del departamento de


logstica.
ANEXO 2- Manual de implementacin de un proyecto SSIS en Integration Services proceso
ETL.
ANEXO 3- Carga de datos ejecutando el proceso ETL.
ANEXO 4- Diagrama de flujo del funcionamiento del ETL por cada dimensin y tablas de
hecho.
ANEXO 5- Diseo e implementacin de un cubo.
ANEXO 6- Creando conexin OLAP desde Microsoft Excel a SQL Server de Analysis
Services.
RESUMEN EJECUTIVO

Se ha evidenciado en los ltimos aos el crecimiento de informacin en el negocio pecuario


gestionado por el departamento de logstica de la compaa PRONACA, lo cual constituye
un valioso recurso, se ha convertido en un problema al momento de manejar la informacin,
es aqu donde nace la necesidad del departamento logstico al no contar con una herramienta
informtica que permita realizar anlisis de datos.

El presente proyecto se ejecut por la importancia de tener una aplicacin datawarehouse


para gestionar toda la informacin que maneja el departamento de logstica, con el fin de
superar estas debilidades, para ser ms competitivos, eficientes y mejorar la toma de
decisiones.

Para el desarrollo de esta investigacin se aplic el mtodo inductivo que parte de procesos
logsticos en abastecimiento de materias primas y distribucin de producto terminado y de
la funcionalidad de cada proceso, el mtodo deductivo que parte del conocimiento bsico de
inteligencia de negocios, investigando las diferentes ramas que van dirigidas a la
implementacin de este tipo de soluciones. Para el desarrollo de este tipo de proyecto de
datawarehouse se estableci usar la propuesta de Ralph Kimball, porque garantiza
funcionalidad, escalabilidad, permitiendo obtener un producto final de calidad.

El presente estudio est enmarcado en la lnea de investigacin de Tecnologas de


informacin y comunicaciones

Con la implementacin del concepto de datawarehouse dentro del departamento de logstica


se est inculcando en las jefaturas y gerencias de la institucin, para una administracin
eficaz de los directivos encargados del negocio, obteniendo como producto, informacin til
del negocio a analizar.
ABSTRACT

It has been demonstrated in the last few years the growth of information in the livestock
business managed by the logistics department of the company PRONACA, which constitutes
a valuable resource, has become a problem at the time to handle the information, it is here
where is born the need of the logistics department by not having a computer tool that permits
to perform data analysis.

This project was implemented by the importance of having an application datawarehouse to


manage all the information that handles the logistics department, with the aim of overcoming
these weaknesses, to be more competitive, efficient and improve decision-making.

For the development of this research was applied the inductive method that parts of the
logistics processes in terms of the supply of raw materials and distribution of finished
product and the functionality of each process, the deductive method that parts of the basic
knowledge of business intelligence, investigating the different branches that are directed to
the implementation of this type of solutions. For the development of this type of project of
datawarehouse was established using the proposal of Ralph Kimball, because it ensures
functionality, scalability, allowing to obtain a high quality final product.

The present study is framed in the research line of "information technologies and
communications"

With the implementation of the concept of datawarehouse within the logistics department is
to inculcate in the headquarters and the managements of the institution for the effective
management of the managers of the business, obtaining as product, useful information of the
business to analyze.
TEMA: IMPLEMENTACIN DE UN DATAWAREHOUSE PARA LA TOMA DE
DECISIONES EN EL REA LOGSTICA DE LA COMPAA PRONACA.

INTRODUCCIN.
Antecedentes de la investigacin.
En la actualidad, la manera cmo se gestiona la informacin en el mundo es cada vez ms
importante y genera ventajas competitivas, es por esta razn que se han venido desarrollando
un conjunto de estrategias y herramientas enfocadas a la administracin y creacin de
conocimiento mediante el anlisis de datos como son el estudio del datawarehouse como
apoyo soporte a la toma de decisiones de manera que pueda responder a las necesidades en
el mbito gerencial y a las nuevas tecnologas de informacin y comunicacin, de ah que se
ha investigado la herramienta tecnolgica datawarehouse basada en Business Intelligence
(BI).

En la actualidad, el dinmico mundo de los negocios plantea la necesidad de disponer de un


acceso rpido y sencillo a la informacin para la toma de decisiones, pudindose evidenciar el
inters de los sectores empresariales tanto privados como pblicos con relacin a los beneficios
de los (DSS), los cuales han sido implementados por empresas importantes del mundo en reas
como finanzas, contabilidad, venta marketing, manufactura, gestin logstica, entre otros.

En el Ecuador el uso de los sistemas de soporte a la toma de decisiones, se encuentra en


pleno desarrollo, de acuerdo a lo que se ha podido evidenciar en la pgina oficial del (BCE,
2015) quienes cuentan con un sistema de informacin para la toma de decisiones financieras
y econmicas, de igual forma en el sitio web del (INEC, 2015) cuenta con un sistema
estadstico como un auxiliar fundamental para la toma de decisiones de poltica pblica,
tambin se ha podido evidenciar que las grandes empresas sobre todo las trasnacionales
instaladas en el pas son las que estn empleando esta tecnologa para la gestin de sus
procesos de negocio, adems, existen varias consultoras que ofrecen esta herramienta para
pequeas y medianas empresas, ofertando como beneficios la eficiencia y eficacia en la toma
de las decisiones.
Con los antecedentes detallados se afirma que se puede desarrollar una aplicacin
datawarehouse en la empresa PRONACA, en el negocio pecuario gestin logstica regin
Santo Domingo.

1
Planteamiento del problema.
La empresa PRONACA rea de logstica regional Santo Domingo actualmente no cuenta
con el suficiente flujo de informacin para las gerencias del departamento de logstica.
Entendiendo que la informacin no se encuentra estructurada y procesada. Los datos estn
almacenados en diferentes bases de datos (ERP, Excel, sistema de gestin pesaje (Aries)), y
para poder llevar a cabo la obtencin de reportes necesitamos demasiado tiempo. Los
gerentes requieren tener el acceso a la informacin de una manera ms personalizada y
rpida, debido a que en algunas ocasiones se ha perdido tiempo en tomar acciones en
eventualidades por la falta inmediata de informacin estructurada, de forma que se pueda
analizar y tener un soporte en la toma de decisiones. Uno de los problemas principales se da
cuanto a la generacin de reportes, estos son realizados de una forma manual, lo que requiere
tiempo para el rea de sistemas en la generacin de los mismos adems causando un gran
trfico en la base de datos de produccin. Reflejndose en el tiempo de espera de cada
consulta realizada a la base de datos.

Formulacin del problema.


Deficiente gestin de la informacin para la toma de decisiones en el rea logstica de la
compaa PRONACA.

Identificacin de la lnea de investigacin.


El presente trabajo investigativo se enmarca en la lnea denominada:
Tecnologas de informacin y comunicaciones.

Justificacin del tema.


En base a mis conocimientos adquiridos sobre esta investigacin en la implementacin de
un datawarehouse, he podido ver la importancia de tener informacin tratada en un negocio
para la toma de decisiones. Dentro de la gestin logstica se aumentar la capacidad de
generar y recoger datos, los cuales sern identificados, categorizados y resumidos para
aportar con informacin analtica, la misma que podr ser utilizada eficiente y
oportunamente; esto apoyar la toma de decisiones permitiendo incrementar la credibilidad
institucional.
Con la informatizacin de la sociedad y dentro de estas las empresas, ha crecido a nivel
mundial la capacidad de generacin y almacenamiento de la informacin, que no puede ser
analizada por los mtodos tradicionales existentes, mientras mayor es la capacidad para

2
almacenar ms y ms datos, mayor es la incapacidad para extraer informacin realmente til
de stos en las empresas. Mucha informacin importante, quedaba sepultada y disgregada,
y los sistemas existentes no estaban preparados para el nuevo reto.

Por ello se plantea una solucin basada en tecnologas de informacin mediante la


implementacin de un almacn de datos (datawarehouse), para obtener un producto que
permita generar informacin tratada y til, la cual apoyar el anlisis del negocio (procesos)
que se requieran, como son: Gestin logstica pecuaria en abastecimiento de materia prima,
distribucin de producto terminado a diferentes tipos de clientes, lo que permitir dar soporte
a los directivos del negocio en la toma de decisiones.

En el campo de la investigacin podemos decir que este tema constituye un aporte cientfico
del investigador, ya que es original por no existir un tema igual.

Objetivos.
Objetivo General.
Implementar un datawarehouse para mejorar la toma de decisiones en el rea de logstica de
la compaa PRONACA.

Objetivos Especficos.
Realizar el anlisis y levantamiento de los requerimientos para la construccin de un
datawarehouse.
Estudio bibliogrfico de herramientas para construir un datawarehouse, y la gestin
de la informacin.
Implementar el datawarehouse para el rea logstica regional Santo Domingo.

3
1 CAPITULO I. MARCO TERICO.
1.1 Origen y evolucin del objeto de investigacin.
Dentro del marco histrico que presenta la gestin logstica en las empresas al nivel mundial,
los procesos de abastecimiento de materias primas y distribucin de producto terminado, se
originaron por las necesidades de abastecerse de materia prima para cumplir sus demandas
en su produccin y colocar sus productos en el lugar y tiempo adecuado, con el pasar del
tiempo estas necesidades fueron creciendo ya que la demanda de los diferentes productos
iban en aumento, esto ocasiono mayores flujos por lo que se requera de mayor recursos
como el talento humano, el transporte y la informacin, uno de ellos y el ms importante
para la administracin logstica son los datos, grandes cantidades de datos que deben ser
tratados para lograr una buena toma de decisiones en la administracin de sus recursos.

1.2 Anlisis de distintas posiciones tericas sobre el objeto de investigacin.


Segn (Casanovas & Cuatrecasas, 2003). La gestin logstica se debe encargar de coordinar
y gestionar, como un sistema nico, los flujos de informacin y de materiales de un extremo
al otro del canal, a fin de obtener con un coste mnimo el mejor nivel de servicio al cliente,
al mismo tiempo que reducir la inactividad asociada al conducto, generando para la empresa
un valor agregado que contribuya al buen funcionamiento de todos sus procesos.

En el sitio web de la revista Logstica (Tesler, 2010) cita que Las soluciones de Business
Intelligence ofrecen diferentes maneras para ver, analizar y presentar mtricas corporativas,
como Key Performance Indicators (KPI) con el uso de tableros de control, anlisis
interactivo, informes estndar o al publicar informacin al momento que sea necesario,
usando el medio necesario dentro de una infraestructura integrada para mejorar el
desempeo corporativo al tomar mejores decisiones.

En el sitio web de la revista (Logistec, 2014) cita que En la actualidad, la inteligencia de


negocios o Business Intelligence puede aportar muchsimo ms valor a la logstica que en el
pasado. Esto se debe a que la cadena de valor del negocio logstico hoy en da puede recoger
los datos en tiempo real y disponer de estos en cualquier momento gracias a las tecnologas
de las telecomunicaciones.

De acuerdo a los autores citados se puede concluir que por medio de herramientas de
inteligencia de negocios aplicado al anlisis de la informacin en los procesos de

4
abastecimiento de materias primas y distribucin de producto terminado, permite mejorar
significativamente la toma de decisiones.

1.3 Valoracin crtica de los conceptos principales de las distintas posiciones tericas
sobre el objeto de investigacin.

1.3.1 Business Intelligence.


1.3.1.1 Introduccin.
Hoy en da en las empresas y organizaciones, la gestin de informacin es un elemento clave
para poder competir de mejor manera en un mercado muy cambiante, y de una sociedad de
negocio. La informacin que se maneja es de vital importancia, porque en ella se fundamenta
la toma de decisiones, sirviendo de pilar para el crecimiento y gestin, como tambin de
gua en la consecucin de los objetivos que persiguen las empresas. Adems cada vez es ms
importante saber qu es lo que sucede con los negocios que en ellas se gestiona, y de cmo
mejorarlas. Por otro lado existen organizaciones las cuales poseen un sin nmero de datos,
pero que a su vez no cuentan con informacin, esto se debe por el gran problema de que no
saben qu hacer ni cmo utilizar esos datos en beneficio propio, y como resultado, hoy en
da gran parte del sector empresarial no sabe que cuentan con informacin valiosa capaz de
ser utilizada para mejorar la competitividad del negocio.
Aqu es donde nace el concepto de Business Intelligence o Inteligencia de Negocios, como
solucin para el soporte de toma de decisiones, mediante la generacin y anlisis de
informacin, y con la que se busca el conocimiento organizacional. (Rojas & Duque, 2010)

1.3.1.2 Definiciones.
Para definir inteligencia de negocios partiremos de la definicin de Gartner editada en el
libro del autor: (Cano, 2007): BI es un proceso interactivo para explorar y analizar
informacin estructurada sobre un rea (normalmente almacenada en un datawarehouse),
para descubrir tendencias o patrones, a partir de los cuales derivar ideas y extraer
conclusiones. El proceso de inteligencia de negocios incluye la comunicacin de los
descubrimientos y efectuar los cambios.

Una definicin ms amplia es la que proponen The datawarehouse Institute, Business


Intelligence (BI) es un trmino paraguas que abarca los procesos, las herramientas, y las

5
tecnologas para convertir datos en informacin, informacin en conocimiento y planes para
conducir de forma eficaz las actividades de los negocios.
Cavalcanti define como: Un concepto actualizado que va ms all de la gestin empresarial.
Consiste en la utilizacin de productos y soluciones con tecnologas analticas avanzadas
para transformar los datos en informacin que ayuda a los distintos niveles de la
organizacin en la toma de decisiones y otras contribuciones, casi todas en anlisis de
estrategias. (Puerta Glvez, 2015)

1.3.1.3 Objetivo de las herramientas de inteligencia de negocios.


El objetivo principal de la inteligencia de negocios es mejorar la toma de decisiones del
negocio a travs del uso de herramientas tecnologas que permitan reunir, almacenar,
analizar, y proporcionar acceso a los datos de gestin de la empresa.

1.3.1.4 Caractersticas de la inteligencia de negocios.


Tienen en comn las siguientes caractersticas:
Accesibilidad a la informacin.- Los datos son la fuente principal de este concepto
y lo primero que debe garantizar este tipo de herramientas y tcnicas ser el acceso
de los usuarios a los datos con independencia de la procedencia de estos.
Apoyo en la toma de decisiones.- Se busca ir ms all en la presentacin de la
informacin, de manera que los usuarios tengan acceso a herramientas de anlisis
que les permitan seleccionar y manipular slo aquellos datos que les interesen.
Orientacin al usuario final.- Se busca independencia entre los conocimientos
tcnicos de los usuarios y su capacidad para utilizar estas herramientas. (Espinosa,
DATAPRIX, 2010)

1.3.2 Sistemas de informacin.


Las empresas son cada vez ms conscientes de la importancia de disponer de ms y mejor
informacin, actualizada, estructurada, fcilmente accesible y adaptada a sus necesidades
concretas, como un soporte en la toma de decisiones.
Segn Andreu, Ricart y Valor (1991). Definen que, el sistema de informacin: Es el
conjunto formal de procesos que operando sobre una coleccin de datos estructurada de
acuerdo con las necesidades de una empresa, recopila, elabora y distribuye la informacin
necesaria para la operacin de dicha empresa y para las actividades de direccin y control
correspondientes, apoyando, al menos en parte, los procesos de toma de decisiones
6
necesarios para desempear las funciones de negocio de la empresa de acuerdo con su
estrategia. (Lapiedra Alma, Devece Caraana , & Guiral Herrando, 2011)

Figura 1-1: Pirmide Sistemas de Informacin


Fuente: (Ferrer Mos, 2015)

1.3.2.1 Sistemas de soporte a decisiones (DSS).


Un sistema de informacin basado en un computador interactivo, flexible y adaptable,
especialmente desarrollado para apoyar la solucin de un problema de gestin no
estructurado para mejorar la toma de decisiones. Utiliza datos, proporciona una interfaz
amigable y permite la toma de decisiones en el propio anlisis de la situacin. (Turban, 1995)

1.3.2.1.1 Funcin.
La funcin principal del Sistema de Soporte de Decisiones es la de apoyar a la toma de
decisiones mediante el anlisis de las variables de un negocio con la generacin y evaluacin
de diferentes alternativas de decisin, todo esto utilizando modelos y herramientas
computacionales.

1.3.2.1.2 Caractersticas.
El sistema de soporte de decisiones es una de las herramientas ms emblemticas de la
inteligencia de negocios, estas son algunas de sus caractersticas principales:
Informes dinmicos e interactivos, de manera que el usuario no tenga que limitarse
a los listados predefinidos que se configuraron en el momento de la implantacin, y
que no siempre responden a sus dudas reales.

7
No requiere conocimientos tcnicos, un usuario no tcnico puede crear nuevos
grficos e informes y navegar entre ellos, solo con arrastrar y soltar y examinar la
informacin disponible o crear nuevas mtricas.
Rapidez en el tiempo de respuesta, ya que la base de datos suele ser un
datawarehouse corporativo o un datamart, con modelos de datos en estrella o copo
de nieve. Este tipo de bases de datos estn optimizadas para el anlisis de grandes
volmenes de informacin.
Integracin entre todos los sistemas, el proceso de ETL previo a la implantacin
de un sistema de soporte a la decisin garantiza la calidad y la integracin de los
datos entre las diferentes unidades de la empresa.
Cada usuario dispone de informacin adecuada a su perfil, no se trata de que
todo el mundo tenga acceso a toda la informacin, sino de que tenga acceso a la
informacin que necesita para que su trabajo sea lo ms eficiente posible.
Disponibilidad de informacin histrica, en estos sistemas est a la orden del da
comparar los datos actuales con informacin de otros perodos histricos de la
compaa, con el fin de analizar tendencias, fijar la evolucin de parmetros de
negocio, entre otros.

1.3.3 Datawarehouse.
1.3.3.1 Definiciones.
En la actualidad existen muchas definiciones para el datawarehouse, las ms conocidas e
importantes que fueron citadas por (Das & Cnesa, 2010) son: Bill Inmon y Ralph Kimball.

Inmon (considerado por muchos el padre del concepto) dice: Un Data Warehouse es un
conjunto de datos orientados por temas, integrados, variantes en el tiempo y no volayiles, que
tienen por objetivo dar soporte a la toma de decisiones.

Kimball (considerado el principal promotor del enfoque dimensional para el diseo de almacenes
de datos), dice: Un datawarehouse e la copia delos datos transaccionales especficamente
estructurada para la consulta y el anlisis. Tambin fue Kimball quien determin que un data
warehouse no era ms que: la unin de todos los Data marts de una entidad. Defiende por tanto
una metodologa ascendente (Bottom-up) a la hora de disear un almacn de datos.

8
1.3.3.2 Funcin.
La principal funcin de un datawarehouse es almacenar datos para convertirlos en
informacin til para las empresas, esta informacin debe estar disponible para las gerencias
en el momento que requieran y con un formato adecuado sin afectar las operaciones de los
sistemas operacionales.

1.3.3.3 Caractersticas.
Segn defini Bill Inmon, el datawarehouse se caracteriza por ser:

Integrado.- Los datos almacenados en el datawarehouse deben integrarse en una


estructura consistente, por lo que las inconsistencias existentes entre los diversos
sistemas operacionales deben ser eliminadas. La informacin suele estructurarse
tambin en distintos niveles de detalle para adecuarse a las distintas necesidades de
los usuarios.
Temtico.- Slo los datos necesarios para el proceso de generacin del conocimiento
del negocio se integran desde el entorno operacional. Los datos se organizan por
temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por
ejemplo, todos los datos sobre clientes pueden ser consolidados en una nica tabla
del Datawarehouse. De esta forma, las peticiones de informacin sobre clientes sern
ms fciles de responder dado que toda la informacin reside en el mismo lugar.
Histrico.- El tiempo es parte implcita de la informacin contenida en un
Datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado
de la actividad del negocio en el momento presente. Por el contrario, la informacin
almacenada en el datawarehouse sirve, entre otras cosas, para realizar anlisis de
tendencias. Por lo tanto, el Datawarehouse se carga con los distintos valores que toma
una variable en el tiempo para permitir comparaciones.
No voltil.- El almacn de informacin de un Datawarehouse existe para ser ledo, y
no modificado. La informacin es por tanto permanente, significando la
actualizacin del Datawarehouse la incorporacin de los ltimos valores que tomaron
las distintas variables contenidas en l sin ningn tipo de accin sobre lo que ya
exista. (Espinosa, El Rincon del Business Intelligense, 2009)

9
1.3.3.4 Arquitectura de un datawarehouse.
Para comprender el concepto de datawarehouse, es importante considerar los procesos que
lo conforman. A continuacin se describen dichos procesos clave en la gestin de un
datawarehouse: (Fernandez, 2009)

Figura 1-2: Arquitectura de un datawarehouse


Fuente: (Duque Galvez, 2010)

Sistemas origen.- En cuanto a los sistemas origen, son en donde se encuentra los datos de
inters y que sern objeto de extraccin, estos orgenes pueden ser desde mltiples lugares
como por ejemplo las bases de datos, as como tambin hojas de clculo, archivos planos,
Sistemas ERP (Enterprise Resource Planning), entre otros que sern los que proveern los
datos de inters.
Staging Area (Area Temporal).- Es un rea en la que se almacenar de manera temporal
todos los datos que son extrados de los sistemas origen segn las necesidades planteadas
del negocio. La funcin primordial es minimizar la afectacin a los sistemas origen, porque
cuando se realiza la carga al Datawarehouse, los orgenes de datos no intervendrn hasta que
se realice una prxima carga.
ODS (Operational Data Store).- Como su nombre indica, esta rea es la que va a dar
soporte a los sistemas operacionales. El modelo de datos del almacn de datos operacional
sigue una estructura relacional y normalizada, para que cualquier herramienta de reporting
o sistema operacional pueda consultar sus datos. Est dentro del datawarehouse porque se
aprovecha el esfuerzo de integracin que supone la creacin del almacn de datos
corporativo para poder atender tambin a necesidades operacionales, pero no es obligatorio,

10
y ni siquiera es algo especfico del Business Intelligence, los ODS ya existan antes de que
empezramos a hablar de BI y de DWH.
Datawarehouse.- Los datos a ser cargados en el almacn provendrn del Staging Area as
como tambin puede ser desde el ODS. Aqu los modelos de datos no sern tan normalizados
como lo es en los sistemas origen y en el ODS, aqu sucede lo contrario y se realizan tcnicas
de des normalizacin.
Data marts.- Es un subconjunto de los datos del datawarehouse cuyo objetivo es responder
a un determinado anlisis, funcin o necesidad, con una poblacin de usuarios especfica. Al
que en un datawarehouse, los datos estn estructurados en modelos de estrella o copo de
nieve y un data mart puede ser dependiente o independiente de un datawrehouse. Por
ejemplo, un posible uso seria para la minera de datos o para la informacin de marketing.
El data mart est pensado para cubrir las necesidades de un grupo de trabajo o de un
determinado departamento dentro de la organizacin. (Das & Cnesa, 2010)

1.3.3.5 Estructura.
Los datawarehouses tienen una estructura distinta. Hay niveles diferentes de
esquematizacin y detalle que delimitan, en la siguiente figura se puede apreciar mejor su
estructura. (INEI, 1997)

Figura 1-3: Estructura de los datos de un datawarehouse


Fuente: (Bernabeu, 2010)

Detalle de datos actuales.- En gran parte, el inters ms importante radica en el


detalle de los datos actuales, debido a que refleja las ocurrencias ms recientes, las

11
cuales son de gran inters, es voluminoso, ya que se almacena al ms bajo nivel de
granularidad, casi siempre se almacena en disco el cual es de fcil acceso, aunque su
administracin sea costosa y compleja.
Detalle de datos antiguos.- La data antigua es aquella que se almacena sobre alguna
forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a
un nivel de detalle, consistente con los datos detallados actuales. Mientras no sea
prioritario el almacenamiento en un medio de almacenaje alterno, a causa del gran
volumen de datos unido al acceso no frecuente de los mismos, es poco usual utilizar
el disco como medio de almacenamiento.
Datos ligeramente resumidos.- Son aquellos que proviene desde un bajo nivel de
detalle y sumarizan o agrupan los datos bajo algn criterio o condicin de analisis.
Este nivel del datawarehouse casi siempre se almacena en disco.
Datos completamente resumidos.- Estos datos son compactos y fcilmente
accesibles, a veces se encuentra en el ambiente de dfatawarehouse y en otros, fuera
del lmite de la tecnologa que ampara al datawarehouse. (De todos modos, los datos
completamente resumidos son parte del datawarehouse sin considerar donde se
alojan los datos fsicamente.)
Metadata.- El componente final del datawarehouse es el de la metadata. De muchas
maneras la metadata se sita en una dimensin diferente al de otros datos del
datawarehouse, debido a que su contenido no es tomado directamente desde el
ambiente operacional. La metadata juega un rol especial y muy importante en el
datawarehouse y es usada como: Un directorio para ayudar al analista a ubicar los
contenidos del datawarehouse, y es una gua para el mapping de datos de cmo se
transforma, del ambiente operacional al de datawarehouse. Una gua de los
algoritmos usados para la esquematizacin entre el detalle de datos actual, con los
datos ligeramente resumidos y stos, con los datos completamente resumidos, etc.
(INEI, 1997)

1.3.3.6 Proceso de extraccin, transformacin y carga ETL.


El ETL (Extract, Transform and Load) es un proceso destinado a la extraccin,
transformacin y carga de datos procedentes de una base de datos transaccional para un
datawarehouse. En este proceso son obligatorias la extraccin y la carga ya que si los datos

12
estuvieran en el mismo formato o lenguaje de destino no ser necesario hacer la
transformacin. (Puerta Glvez, 2015)

Existe un conjunto bsico de procesos de suma importancia detrs de una arquitectura de


datawarehouse, que garantizan la calidad de datos que en ella se almacenarn. Este proceso
de Extraccin, Transformacin y Carga, tambin conocido como ETL o proceso de
integracin de datos, cumple con la funcin principal de organizar e integrar el flujo de datos
desde mltiples fuentes, hacia un destino que es el almacn de datos (Datawarehouse). El
proceso ETL brinda soporte a la gestin de datos que se va a realizar, obteniendo calidad de
los mismos dentro de un almacn como se puede apreciar en la figura 1-4. (Duque Galvez,
2010)

Figura 1-4: Proceso ETL


Fuente: (Duque Galvez, 2010)

Este proceso general se encuentra subdividido en tres subprocesos fundamentales como se


detalla a continuacin:
Extraccin.- Esta etapa del proceso debe basarse en la bsqueda de las
informaciones ms importantes en sistemas fuentes o externas y que estn en
conformidad con el modelo del datawarehouse. Esta bsqueda en la mayora de los
casos, es dificultada por el hecho de las informaciones estar almacenadas en fuentes
distintas de datos. En su primer momento es normal que la carga inicial sea hecha
para que todos los datos del sistema original sean transferidos a un rea del
datawarehouse llamada de Stage y posteriormente pasada para el rea llamada ODS,
tambin en el datawarehouse. Despus de eso las dems cargas sern incrementales
que segn Kimball es la ms eficiente y carga solamente los registros que fueron
alterados o insertados en la base original. (Puerta Glvez, 2015)

13
Transformacin.- Es el subproceso ms laborioso con respecto a los otros dos,
debido a que en esta etapa se realiza el refinamiento de los datos que han sido
extrados de las diferentes fuentes, por lo que aqu se especificar pasos de acuerdo
a los datos que van a ser tratados dando valor para los usuarios. Este proceso incluye
correccin de errores, decodificacin, borrado de campos que no son de inters,
generacin de claves, agregacin de informacin, etc., lo que es ms conocido como
limpieza de los datos fuentes. (Duque Galvez, 2010)
Carga.- El ltimo subproceso se caracteriza por realizar la carga hacia el
datawarehouse, los datos que previamente han sido extrados y tratados en los dos
subprocesos anteriores para contar con datos de calidad, ahora se proceder a realizar
la carga de los mismos a un nuevo ambiente que es el de almacn de datos, para ello
es importante implementar mtodos y/o maneras de carga de datos con el fin de
controlar por ejemplo datos actualizados o histricos. (Rojas & Duque, 2010)

1.3.3.7 Modelo dimensional de un datawarehouse.


Un datawarehouse adopta un modelo dimensional en su estructura de almacenamiento,
caracterizado por ser un esquema en estrella o copo de nieve, lo que permite maximizar el
rendimiento de las consultas, a continuacin una definicin de modelo dimensional: El
modelado dimensional es una forma de acercar los datos a la manera en que estos sern
convertidos en informacin til para los usuarios del negocio. La aplicacin del modelo
dimensional tiene lugar en la fase de diseo lgico, lo que permite la traduccin del esquema
resultante del diseo conceptual al plano lgico. (Leon, 2014)
Esquema estrella.
Consiste en estructurar la informacin en procesos, vistas y mtricas recordando a
una estrella (por ello el nombre). A nivel de diseo, consiste en una tabla de hechos
y una o varias tablas de dimensin por cada punto de vista de anlisis que participa
de la descripcin de ese hecho. En la tabla de hecho encontramos los atributos
destinados a medir (cuantificar): sus mtricas. La tabla de hecho presenta uniones
con dimensiones. (Das & Cnesa, 2010)

14
Figura 1-5: Esquema Estrella
Fuente: (Duque Galvez, 2010)

Esquema copo de nieve.


Es un esquema de representacin derivado del esquema en estrella, en el que las
tablas de dimensin se normalizan en mltiples tablas. Por esta razn, la tabla de
hecho deja de ser la nica tabla del esquema que se relaciona con otras tablas y
aparecen nuevas uniones. (Das & Cnesa, 2010)

Figura 1-6: Esquema copo de nieve


Fuente: (Duque Galvez, 2010)

1.3.3.7.1 Tablas de dimensiones.


Las tablas de dimensiones definen como estn los datos organizados lgicamente y proveen
el medio para analizar el contexto del negocio, mediante los cuales los usuarios podrn filtrar

15
y manipular la informacin almacenada en la tabla de hechos. En la siguiente figura se puede
apreciar un ejemplo.

Figura 1-7: Tablas de Dimensiones


Fuente: (Duque Galvez, 2010)

Cada tabla posee un identificador nico y al menos un campo o dato de referencia que
describe los criterios de anlisis relevantes para la empresa, los datos dentro de estas tablas,
que proveen informacin del negocio o que describen alguna de sus caractersticas, son
llamados datos de referencia. Cada tabla de dimensin podr contener los siguientes campos:
Clave principal o identificador nico.
Clave forneas.
Datos de referencia primarios que identifican la dimensin. Ej: nombre del cliente.
Datos de referencia secundarios: datos que complementan la descripcin de la
dimensin. Por ejemplo: e-mail del cliente, fax del cliente, etc. (Bernabeu, 2010)

1.3.3.7.2 Tablas de hechos.


Las tablas de hechos contienen, precisamente, los hechos que sern utilizados por los
analistas de negocio para apoyar el proceso de toma de decisiones. Contienen datos
cuantitativos. Los hechos son datos instantneos en el tiempo, que son filtrados, agrupados
y explorados a travs de condiciones definidas en las tablas de dimensiones. Los datos
presentes en las tablas de hechos constituyen el volumen de la bodega, y pueden estar
compuestos por millones de registros dependiendo de su granularidad y antigedad de la
organizacin. Los ms importantes son los de tipo numrico. El registro del hecho posee una
clave primaria que est compuesta por las claves primarias de las tablas de dimensiones

16
relacionadas a este. En la siguiente figura se puede apreciar lo anterior misionado.
(Bernabeu, 2010)

Figura 1-8: Tabla de Hecho


Fuente: (Duque Galvez, 2010)

1.3.3.7.3 Nivel.
En las dimensiones se pueden especificar caractersticas (atributos) en particular de acuerdo
a cada dimensin. Estos atributos necesitan ser ordenados o agrupados de acuerdo a un fin
en especfico como por ejemplo se puede observar en la Figura 1-9, en la cual dos
dimensiones se encuentran agrupadas de cierta manera, a estas agrupaciones son llamadas
niveles.

Figura 1-9: Niveles en la Dimensin


Fuente: (Duque Galvez, 2010)

Para garantizar que existan registros nicos en cada dimensin es necesario contar con una
clave nica para cada nivel de agregacin, la misma que se recomienda sea secuencial.

17
1.3.3.7.4 Jerarquas.
Las jerarquas son estructuras lgicas usadas para categorizar los datos, de acuerdo a los
niveles definidos, la jerarqua tambin ayuda a definir la navegacin por la informacin que
va a tener la dimensin en un orden (de los niveles) definido. (Duque Galvez, 2010)

Figura 1-10: Jerarqua en la Dimensin.


Fuente: (Duque Galvez, 2010)
1.3.3.7.5 Granularidad.
La granularidad es el nivel de detalle en que se almacena la informacin. Por ejemplo:
Las ventas pueden expresarse por da y los objetivos por mes. El atributo de granularidad de
la relacin normal permite gestionar este caso sin problema. En todos los casos, y de forma
especial en el caso de una dimensin realizadora de funciones, usted define en la relacin la
columna o columnas del grupo de medidas ligadas al atributo de granularidad. (Gauchet,
2011)
1.3.3.7.6 Relaciones.
Las relaciones mantienen la integridad de la informacin del negocio, referenciando datos
entre diferentes tablas, en este caso, relacionando las dimensiones con los hechos, como por
ejemplo la relacin Producto Ventas, Almacn Pedidos, etc.

Figura 1-11: Relaciones en un Modelo


Fuente: (Duque Galvez, 2010)

18
1.3.3.7.7 Claves subrogadas.
Una clave subrogada es un identificador nico que se asigna a cada registro de una tabla de
dimensin. Esta clave, generalmente, no tiene ningn sentido especfico de negocio. Son
siempre de tipo numrico. Preferiblemente, un entero autoincremental. (Urquizu, 2009)

1.3.3.8 Anlisis OLAP.


El procesamiento analtico en lnea permite obtener acceso a datos organizados y agregados
de orgenes de datos empresariales, organiza subconjuntos de datos con una estructura
multidimensional de manera que represente un significado especial o responda a una
pregunta en particular (Gomez, 2010). OLAP (On-Line Analytical Processing) o
Procesamiento Analtico en lnea, surge como contraste a OLTP (On-Line Transactional
Processing) que define a los sistemas de ambientes transaccionales.
El anlisis multidimensional (Anlisis OLAP), parte de una visin de la informacin como
dimensiones de negocio, en la que hay que tomar en cuenta que se debe de olvidar lo que
son las tablas y campos, dando mayor nfasis a lo que son las dimensiones y medidas.

Figura 1-12: OLAP (On-Line Analytical Processing)


Fuente: (Duque Galvez, 2010)

Las herramientas OLAP se caracterizan por subdividirse en tres tipos de acuerdo a la manera
de almacenar los datos, estos son:
ROLAP (Relational OLAP).
Arquitectura en la que se almacenan los datos en un motor de base de datos
relacional, pero de igual manera se proporciona la funcionalidad analtica. A travs
de esta implementacin se soporta de mejor manera las capacidades OLAP con
respecto a las bases de datos relacionales, en el sentido que realiza consultas directas
a la base de datos, e igualmente presenta los datos de la manera multidimensional

19
caracterizada por la arquitectura. Los esquemas ms comunes sobre los que se trabaja
son estrella o copo de nieve. La arquitectura est compuesta por un servidor de datos
relacional y el motor OLAP.
MOLAP (Multidimentional OLAP).
En este tipo de arquitectura los datos se almacenan de manera dimensional en un
servidor de base de datos multidimensional, permitiendo optimizar los tiempos de
respuesta en la informacin, ya que al ser sumarizada y/o agregada ayuda mucho a
los datos calculados por adelantado como por ejemplo los totales, lo que aumenta el
desempeo de anlisis.
Para tener un idea de cmo funciona la tecnologa OLAP se puede hacer una analoga
con la representacin de un cubo, y es aqu donde nace el trmino de los cubos de
informacin, que no son otra cosa ms que el anlisis multidimensional de los
datos, como se puede apreciar en la figura 1-13 a continuacin.

Figura 1-13: Cubo OLAP


Fuente: (Sanches, 2012)

En un anlisis OLAP se implementan funcionalidades las cuales permiten interpretar la


informacin de diferentes maneras, estas funciones u operaciones entre las ms importantes
son:
Drill down.- Desglosar una mtrica de lo general a lo particular por la jerarqua de
sus dimensiones.

20
Figura 1-14: Operacin OLAP - Drill Down
Fuente: (Duque Galvez, 2010)
Roll up.- Agregar una mtrica de lo particular a lo general por la jerarqua ascendente
de sus dimensiones.

Figura 1-15: Operacin OLAP - Roll Up


Fuente: (Duque Galvez, 2010)
1.3.4 Desarrollo de un datawarehouse basado en la metodologa Ralph Kimball.
Ralph Kimball plantea una metodologa para el desarrollo de soluciones de BI/DWH, que
garantiza buenas prcticas para la implementacin de un proyecto de este tipo, mediante la
consecucin de una serie de pasos a seguir durante toda la administracin del proyecto, como
se muestra en la figura a continuacin.

Figura 1-16: The Kimball Lyfecycle Diagramt


Fuente: (Kimball, 2008)
21
En base a esta metodologa, se tomar los puntos con mayor importancia para que sean
especificados, y se realizar ciertas adecuaciones para este proyecto segn las necesidades
que se presenten. (Kimball, 2008)
1.3.4.1 Planeacin y administracin del proyecto.
Definicin del proyecto.
En la definicin se identifica el escenario para poder determinar el alcance del proyecto, en
el sentido que se puede apreciar de donde se origina la demanda dentro de la organizacin.
Los posibles escenarios originados dentro de una empresa son:
Demanda de un sector del negocio.- Un Sector en especfico como por ejemplo los
directivos del negocio.
Demasiada demanda de la informacin.- Se caracteriza por provenir de ms de un
sector del negocio, por ejemplo aparte de los directivos del negocio, los de la empresa
y ciertos gerentes relacionados con el negocio.
En busca de demanda.- Escenario en el que se encuentra involucrado el presidente
o directivo principal de la empresa.

Determinar preparacin de la empresa para un proyecto de Datawarehouse.


Son cinco factores importantes segn la metodologa de Ralph Kimball, las que se deben
tomar en cuenta para poder iniciar un proyecto de almacn de datos, estos son:
Patrocinio de la gerencia del negocio.
Motivacin del negocio.
Acompaamiento del departamento de tecnologa y de negocio.
Presencia de cultura analtica.
Factibilidad.
Desarrollo del alcance preliminar.
Se centra en definir de manera preliminar el alcance del proyecto, para poder hacerlo, la base
debe ser los requerimientos del negocio. Para la definicin del alcance es importante seguir
los siguientes parmetros:
Desarrollo de la Justificacin del Negocio.
En la Justificacin se deben especificar e identificar el costo y beneficio que est relacionado
con el proyecto.
Los componentes a ser considerados de inversiones y costos son los siguientes:

22
Costos de Hardware.- Se toma en cuenta el costo de acuerdo a los equipos que sern
utilizados para el proyecto.
Costos de Software.- Tomar en cuenta el costo de Software que se necesitara para
el proyecto, como software para ETL, reportera, entre otros.
Recursos Internos.- Recursos con los que la organizacin cuenta para el proyecto.
Recursos Externos.- En caso de necesitar algn tipo de consultora o servicio
externo a la organizacin.
Costos de Mantenimiento.- La mayora de productos de hardware y software
necesitan de un mantenimiento.
Soporte.- Todo lo que es el soporte a los usuarios ya sean estos a travs de help desk.
Costos de Crecimiento.- Se debe considerar nuevos requerimientos, mejoras
tecnolgicas de los productos relacionados de software.
Se considera tambin los retornos y beneficios a obtener, como:
Incremento de ganancias.
Incremento en los niveles de servicio a los clientes.
Aumento de informacin para la empresa, y su rpido acceso a ella.

Planeacin del Proyecto.


Se debe especificar un nombre para el proyecto, as como los roles de la(s) persona(s) que
participara en el proyecto, dependiendo la participacin de cada una y requerimientos que se
hayan especificado.
Los principales roles para el proyecto son:
Patrocinadores de negocio.
Gerente o administrador del proyecto.
Lder de negocio del proyecto.
Analista de negocio.
Arquitecto de datos.
Modelador de datos.
Administrador de base de datos.
Diseador de proceso de ETL.
Desarrolladores de aplicaciones de BI para usuarios.
Educador o capacitador del almacn de datos.
Administracin del proyecto

23
Aqu se deber considerar las reuniones con el equipo de trabajo, el monitoreo de estado del
proyecto realizado peridicamente, el alcance y estrategias de comunicacin ya sea con el
equipo de trabajo o con usuarios externos, en estos ltimos esencialmente la manera de tratar
por ejemplo cuando llegan nuevos requerimientos a los cuales hay que ver la manera de
manejar estas situaciones.
1.3.4.2 Definicin de los requerimientos del negocio.
Los requerimientos de los usuarios del negocio ayudan a definir el diseo e implementacin
del datawarehouse, es por esto que desde una perspectiva macro los requerimientos son el
centro del negocio y por ende factor de xito para un satisfactorio desarrollo de un
datawarehouse.
Algo importante a tener en cuenta es saber identificar y asociar los requerimientos desde una
perspectiva macro y as como tambin desde pequeas perspectivas.
Para empezar se debe hablar con los usuarios del negocio, sobre sus trabajos, objetivos, e
intentar conocer cmo y en base a que toman decisiones, al contrario lo que no se debe hacer
es preguntar a los usuarios que datos quieren que aparezca o conste en el datawarehouse, ya
que al conocer su objetivos, decisiones, metas tendremos una mayor perspectiva de que
desean o de qu tipo de informacin manejan ms frecuencia.

1.3.4.3 Diseo tcnico de la arquitectura.


Se detalle el ambiente de integracin, junto con las tecnologas a utilizar, y el cmo va a
funcionar, uniendo tres factores que son: los requerimientos, el entorno tcnico, y las
estrategias de diseo a implementar.
Para determinar el diseo tcnico se basar en dos divisiones que son:

1.3.4.3.1 Back Room.


Se implementa la integracin de datos mediante el proceso de ETL, desde el origen de los
datos hasta la carga de los mismos en el datawarehouse que es la base destino.

1.3.4.3.2 Front Room.


Parte pblica y presentable del datawarehouse, en la cual se implementa las aplicaciones
necesarias para poder presentar al usuario final con el fin de que puedan analizar los datos
almacenados en el datawarehouse.

24
En esta etapa, el entregable es diseo de la arquitectura de todo el proceso de integracin de
los datos y de la presentacin de los mismos, con el fin de obtener un esquema grfico del
funcionamiento del datawarehouse.

1.3.4.4 Seleccin e instalacin del producto.


Mediante las especificaciones tratadas en el diseo tcnico de la arquitectura, se visualiza de
mejor manera el ambiente en el cual se va a desarrollar el proyecto. Se evala las
herramientas a utilizar de acuerdo a cada seccin o rea del proceso de desarrollo. Con lo
cual estar dirigido para:

Plataforma DBMS.
Existen dos tipos, motor relacional y motor OLAP, lo que se deber tener en cuenta
cuales son las necesidades, para seleccionar una o ambas opciones.
Herramienta ETL.
Se evala la herramienta a utilizar, tomando en cuenta aspectos importantes, como si
es funcional, y si cumple las posibles necesidades a presentarse en el desarrollo,
como por ejemplo si la herramienta puede generar claves subrogadas y hacer
bsquedas de ellas, entre otras; esto ayudar determinar la herramienta a utilizar.
Herramienta BI.
Para seleccionar la mejor opcin de una herramienta de Front room o de presentacin,
se debe tomar en cuenta la funcionalidad, versatilidad y manejo amigable para el
usuario final. En esta etapa como entregable, son las herramientas a utilizar en cada
seccin de desarrollo.

1.3.4.5 Modelamiento dimensional.


El modelado dimensional es una tcnica de diseo lgico que busca presentar los datos en
un marco de trabajo estndar que es intuitivo y permite acceso de alto desempeo. Es
inherentemente dimensional y se adhiere a una disciplina que usa el modelo relacional con
restricciones de consideracin. Cada modelo dimensional est compuesto de una tabla con
una llave mltiple llamada tabla de hechos y un conjunto de tablas llamadas tablas
dimensin. Cada tabla dimensin est compuesta por una llave simple que corresponde
exactamente a uno de los componentes de la llave mltiple en la tabla de hechos. Esta
estructura caracterstica, similar a una estrella es a menudo llamada Esquema Estrella,
ver figura 1-5. (Mendoza, Cobos, Acosta, Gomez Florez, & Muoz, 2006)
25
En el modelo dimensional se especifican las medidas y las caractersticas. Las medidas son
usualmente numricas y son referidas a los hechos, mientras que las caractersticas de estas
medidas son representadas por las dimensiones, describiendo por ejemplo quien, que,
cuando, de la medida.
Segn la tesis elaborada por Duque Glvez cita cuatro pasos para el diseo dimensional:

1.3.4.5.1 Paso 1 Seleccionar el Proceso de Negocio.


El primer paso es determinar el proceso que va a ser modelado. Esto es un poco formalismo
ya que la seleccin del proceso es bsicamente referente a los requerimientos que se tomaron,
a travs de ello ya se puede determinar cul ser el proceso a que se va a modelar. Los
procesos de negocio son la parte fundamental del datawarehouse, y es aconsejable
construirlo de manera iterativa es decir un proceso por momento. Vale recalcar que cada
proceso de negocio puede producir una o varias tablas de hechos.
1.3.4.5.2 Paso 2 Declaracin de granularidad.
El segundo paso es definir claramente el nivel de granularidad lo que es lo mismo un registro
de la tabla de hecho y decir exactamente la representacin de la medida de la tabla de hechos.
1.3.4.5.3 Paso 3 Identificacin de Dimensiones.
El tercer paso es determinar las dimensiones aplicables a la tabla de hechos en el nivel de
granularidad que se detall. Al agregar nuevas dimensiones los atributos de estas deben
cumplir con la misma granularidad que se haya definido.
1.3.4.5.4 Paso 4 Identificacin de Hechos.
El paso final es identificar los hechos o medidas del negocio. Para la mayora de los procesos
orientados a transacciones, solo hay algunos hechos fundamentales, que miden por ejemplo
la cantidad o monto. (Duque Galvez, 2010)

1.3.4.5.5 Datawarehouse Bus Matrix.


Es una Matriz Procesos versus Dimensiones comunes, la cual permite tener un panorama
ms claro del datawarehouse, al mostrar las dimensiones, hechos, de acuerdo al proceso de
negocio.

26
Figura 1-17: Datawarehouse Bus Matrix
Fuente: (Duque Galvez, 2010)

En la etapa de modelamiento dimensional, como entregable es el diseo de la base de datos


del datawarehouse, es decir el modelo de las tablas, junto con la matriz de procesos-hechos
vs. dimensiones.

1.3.4.6 Diseo fsico.


Esta etapa se centra en definir la estructura fsica, como:
Configuracin del entorno de base de datos.
Creacin de espacios de tablas para datos y metadatos.
Creacin de tablas, para el datawarehouse y para las bases origen en caso de ser
necesario.
Creacin de llaves primarias y forneas.
Creacin de ndices en las tablas.
Desarrollo de tablas temporales (Staging Area) en caso de ser necesario.

En esta etapa, el entregable son los scripts, que son generados al finalizar el diseo y
desarrollo fsico. (Kimball, 2008)

1.3.4.7 Diseo y desarrollo del proceso ETL.


El desarrollo del Sistema ETL es un desafo para un proyecto de este tipo ya que se debe
tomar en cuenta aspectos como: estudio y anlisis de los datos, integracin de los mismos
con el objetivo de resolver problemas de calidad, cargas automticas; por lo que se considera
fundamental al proceso ETL en el marco de desarrollo de un proyecto de BI/DWH.
Se plantean pasos para el diseo y desarrollo de un proceso ETL, estos son:

27
Desarrollo del Plan ETL.
1.3.4.7.1 Paso 1 Trazar un plan de alto nivel.
Se disea un mapa mediante cuadros que especifican la actividad a realizar, con el fin de
mostrar el flujo de datos, desde el origen hacia el destino.
1.3.4.7.2 Paso 2 Seleccionar la herramienta ETL.
Se selecciona la herramienta ETL adecuada, tomando en cuenta las funcionalidades que se
van a utilizar.
1.3.4.7.3 Paso 3 Desarrollar estrategias por defecto.
Teniendo la idea de cmo va a funcionar el proceso ETL, se desarrollar estrategias con el
fin de garantizar y aumentar el rendimiento del mismo, como por ejemplo:
Administracin de cambios en los atributos de las dimensiones.
Carga de datos.
Frecuencia de carga.
Organizacin del rea temporal ETL.
Secuencia de los procesos de transformaciones.
Registro y manejo de errores.
1.3.4.7.4 Paso 4 Profundizar la tabla objetivo.
Se disea la jerarqua de las tablas objetivo mediante grficos, es decir, se le da un orden a
los niveles de las dimensiones, con lo que se puede apreciar la estructura desde un nivel
macro hasta el ms detallado.

Desarrollo de Carga Inicial.


1.3.4.7.5 Paso 5 Poblar las tablas de dimensiones con los datos histricos.
Las dimensiones (tablas objetivo) sern pobladas por primera vez, para lo cual se
implementarn actividades como:
Extraccin de datos
Transformaciones
Carga de datos.
1.3.4.7.6 Paso 6 Realizar la carga histrica de la tabla de hechos.
Al igual que las dimensiones, se realizar el poblado de los hechos por primera instancia,
tomando en cuenta los datos de las dimensiones, y asignando adecuadamente los registros
de las mismas a la de sus respectivos hechos.

28
De igual manera se implementar las actividades de extraccin, transformacin segn la
necesidad, y de carga de datos.

Desarrollo de carga incremental.


1.3.4.7.7 Paso 7 Procesamiento incremental de la dimensiones.
Las dimensiones sern pobladas de manera incremental, es decir a partir de la segunda carga
de datos. Al igual que el poblado inicial, se realizar las transformaciones, y carga de datos,
con la diferencia ahora, que la extraccin se realizar exclusivamente con datos nuevos o
que hayan cambiado en el origen.
1.3.4.7.8 Paso 8 Procesamiento incremental de los hechos.
As mismo el poblado incremental se realizar a partir de la segunda carga a la tabla de
hecho, y tomando en cuenta nicamente de los datos nuevos o que hayan sufrido cambios;
y al igual que la carga inicial se implementa las dems actividades como transformaciones.
1.3.4.7.9 Paso 9 Operacin y automatizacin del sistema ETL.
Con el fin de garantizar la ejecucin peridica del proceso ETL, es necesario automatizar
los trabajos y transformaciones.
Segn la herramienta ETL que se haya seleccionado, esta implementar pasos para
configurar tareas programadas, permitiendo que por cierto tiempo como por ejemplo cada
da se proceda automticamente con el poblado de datos hacia el Datawarehouse. Esto es de
gran ayuda, en el sentido que no se necesitar la intervencin humana para que se realice el
proceso ETL.
Como entregable en la etapa de Diseo y Desarrollo ETL es el documento con las
especificaciones de acuerdo a cada paso de la misma sobre el Proyecto, lo que muestra cmo
funcionar el proceso ETL. (Duque Galvez, 2010)

1.3.5 Herramientas para el desarrollo del datawarehouse.


Las herramientas que se especificarn a continuacin sern utilizadas para el desarrollo del
proyecto. Se dividi en tres tipos de herramientas las cuales sern objeto de uso de acuerdo
a cada etapa en que se encuentre el desarrollo del mismo.

1.3.5.1 Motor de base de datos.


Como se apreci hasta el momento un datawarehouse es un almacn, y desde el punto de
vista tcnico es una base de datos con cualidades y caractersticas especficas de rendimiento.

29
Es por ello la importancia de una base de datos para una aplicacin de este tipo, ya que es la
base, y el ncleo en el cual reposarn los datos que previamente han sido tratados.
Por lo que para la creacin de la base de datos se debe tomar en cuenta ciertas
funcionalidades como:
Alto rendimiento y gestin de datos.
Alta escalabilidad y desempeo para el crecimiento exponencial de datos, lo cual
depende mucho de la cantidad de datos a tratar y ser alojados en el almacn. (Duque
Galvez, 2010)

1.3.5.2 Herramienta ETL.


Hoy en da existe en el mercado varias herramientas ETL de diferente proveedor o casa
comercial, aparte de esto se debe tomar en cuenta funcionalidades que permitan el buen
desarrollo del proceso ETL para lo cual se formul caractersticas bsicas que debe tener un
herramienta de este tipo, lo que permite garantizar el trato de los datos.
Extraccin de datos desde archivos planos, hojas de clculo, bases de datos.
Carga de datos de forma masiva en bases de datos.
Limpieza de datos.
Interfaz grfica amigable.
Unificar datos.
Seguridad de la informacin transmitida.
Retencin temporal de informacin hasta conseguir sincronizacin.
Conectividad con diferentes motores de base de datos.
Soporte de la herramienta para problemas tcnicos.
Interfaz para implementacin de cdigo SQL.

1.3.5.3 Microsoft Integration Services.


Es una plataforma para la actualizacin de almacenamiento de datos, limpieza y minera de
datos, y la administracin de objetos y datos de SQL Server. Los paquetes pueden funcionar
en solitario o junto con otros paquetes para hacer frente a las complejas necesidades de la
empresa.
Integration Services puede extraer y transformar datos de diversos orgenes como archivos
de Excel, archivos planos y orgenes de datos relacionales y, despus, cargarlos en uno o
varios destinos. (Microsoft, 2014)

30
Figura 1-18: Arquitectura Integration Services
Fuente: (Mendoza Rivera, 2008)

1.3.5.4 Microsoft Analysis Services.


Analysis Services de Microsoft SQL Server es un servidor de nivel intermedio para procesos
analticos en lnea (OLAP) y minera de datos. El sistema Analysis Services incluye un
servidor que administra cubos de datos multidimensionales para analizarlos y proporciona
un rpido acceso a la informacin de los cubos, organiza los datos de un almacenamiento de
datos en cubos con datos de agregacin pre calculados para proporcionar respuestas rpidas
a consultas analticas complejas. (Nima Ramos, 2009)

1.3.5.5 Herramienta de presentacin.


Como parte de la explotacin del datawarehouse es importante contar con una herramienta
que permita brindar una interfaz de usuario final, con facilidades y funcionalidades
amigables que permitan una mayor y mejor interpretacin de los datos que se encuentran en
el almacn. Por lo que es recomendable que para la seleccin de una herramienta de este
tipo, ella cuente con funcionalidades como:
Visualizacin de grficos para anlisis.
Navegabilidad dimensional.
Soporte para agregaciones y sumarizaciones.
Interfaz amigable para el usuario final.
Opciones de filtrado o condicionales.
Soporte a operaciones OLAP como Dril Down, Roll Up, Slice, Dice.
Con las funcionalidades antes mencionadas, facilitar el anlisis de datos por parte de los
usuarios finales.

31
Microsoft Excel.
Es mucho ms que una simple hoja de clculo. Se ha convertido en la herramienta
multipropsito del puesto de escritorio: permite realizar clculos, tratar y consolidar
datos, realizar el control de gestin, crear cuadros de mando. Muchas de estas
actividades que han encontrado su lugar natural dentro de Excel se aplican de forma
lgica en el sistema decisional. Aun as Excel es la herramienta ideal para el puesto
de trabajo en lo que respecta al consumo de datos decisionales: su interfaz es
conocida, posee una gran potencia de clculo y de formateo de datos orientada a
business intelligence. Por ltimo, es capaz de conectarse a orgenes de datos
relacionales o decisionales. (Gauchet, 2011)

Figura 1-19: Visualizacin datos de cubos en hoja de Excel


Elaboracin: Freddy Jaramillo.

1.4 Conclusiones parciales.


A lo largo de esta presente investigacin dentro del marco terico se logra constatar
la importancia de tratar los datos para tener informacin concreta al momento de la
toma de decisiones, esto como herramienta para los altos mandos dentro de una
empresa.
Esta investigacin nos ha permitido conocer y validar las teoras propuestas por
diferentes autores sobre la toma de decisiones, tambin conocer las diferentes
tecnologas existentes en el mercado que nos ayudan a elaborar una buena aplicacin
de BI.

32
2 CAPITULO II MARCO METODOLGICO.
2.1 Caracterizacin del sector, rama, empresa, contexto institucional o problema
seleccionado para la investigacin.
En 1957 naci INDIA, empresa precursora del grupo, dedicada a la importacin de insumos
agrcolas. Creci en la industria avcola con la incubacin, venta de huevos comerciales y
ms adelante fortaleci el campo agrcola con la investigacin y produccin de semillas.
En 1979 se crea PRONACA, Procesadora Nacional de Aves, que se convierte en
Procesadora Nacional de Alimentos en 1999.
En los 90 diversific su produccin en crnicos y otros alimentos, e inici la exportacin de
palmito en conserva. En el nuevo siglo PRONACA lleva su modelo de produccin y
comercializacin de palmito a Brasil y productos listos a Colombia.
Esta empresa es el resultado de aos de trabajo, creatividad y constancia. Como empresa
procesadora y comercializadora de alimentos, ha alcanzado el reconocimiento por la alta
calidad de sus productos que provienen de los sectores: crnico, agroindustrial y acuacultura.
Actualmente, es una empresa orgullosamente ecuatoriana, que alimenta bien y genera
desarrollo en el sector agropecuario con responsabilidad social y ambiental.

2.2 Descripcin del procedimiento metodolgico para el desarrollo de investigacin.


2.2.1 Modalidad de la Investigacin.
Para el desarrollo del proyecto se utiliza el mtodo inductivo, este mtodo se utilizar para
el anlisis de la informacin in-situ que se obtuvo de las encuestas aplicadas a los
colaboradores involucrados en los procesos y entrevista al jefe regional de logstica y
correlacionar con la informacin del marco terico respecto a los datawarehouse, esto como
herramienta de apoyo en la toma de decisiones. El mtodo deductivo ha permitido estructurar
el marco terico en forma tcnica, cientfica y ensayar con los resultados que se obtiene de
las encuestas a travs de las conclusiones que se deducen de principios, categoras y de la
idea a defender planteada.

2.2.2 Tipos de investigacin.


Tambin se aplic el mtodo cualitativo porque ha permitido incorporar los resultados
estadsticos a un anlisis e interpretacin crtica por parte del investigador para la validacin
del proyecto.
El mtodo cuantitativo sirvi para identificar los datos pasando por una serie de anlisis,
procesamiento de los datos numricos, estadstica de los hechos y factores que inciden en la

33
utilizacin de datawarehouse por el gerente del negocio logstico y su influencia en la gestin
logstica pecuaria.
Y de campo porque se ha acudido al lugar donde se producen los hechos para adquirir datos
primarios (PRONACA Departamento de logstica pecuaria regional Santo Domingo).

2.2.3 Tcnicas
Las tcnicas de investigacin utilizados para obtener informacin del estado situacional son
las siguientes:

Entrevista.- Utilizado como un medio natural de comunicacin, la misma que se aplic al


jefe logstico regional Santo Domingo Ing. Kelvin Ortiz, con el fin de obtener informacin
relevante, misma que fue estructurada con 5 preguntas previamente elaboradas y
adicionalmente acoger sugerencias, consejos, opiniones y experiencias a ser tomadas en
cuenta en el desarrollo del proyecto, las preguntas y la descripcin de las respuestas se
detallan a continuacin:

N- Preguntas Respuesta narrativa


Cada que tiempo son requeridos los Se hace una reunin de entrega de
informes y reportes gerenciales sobre su resultados cada mes de todos los
1
departamento? departamentos, la misma que es
presentada en informes y reportes.
Para la construccin de estos informes y Se requiere de varios recursos
reportes que recursos tecnolgicos son tecnolgicos para obtener los reportes de
empleados? los sistemas transaccionales, como
2
tambin se requiere de otros programas
como el uso de Excel y Word para
grficos y proyecciones.
Cunto tiempo le toma en elaborar estos Se cuenta con un periodo de una semana
3
informes y reportes? para presentar dichos reportes.
La informacin presentada que tan La informacin es confiable, sin embargo
4 confiable es? al momento de presentarla se puede ver
ciertos errores.
Qu tan complejo es elaborar estos En realidad es bastante complejo, se
5 informes y reportes? requiere de mucho tiempo para elaborar
estos informes y reportes.
Tabla 2-1: La entrevista
Fuente: Jefe regional de logstica.

Encuesta.- Fue aplicada a los colaboradores con relacin directa al proceso de gestin
logstica en abastecimiento y distribucin, que a su vez sirvi para tabular, graficar y analizar

34
la informacin que brind un conocimiento amplio de las necesidades y del problema a
solucionar; as como a determinar el nivel de aceptacin, impacto y beneficios que
proporcionar con la implementacin del sistema datawarehouse en la empresa.

Encuesta dirigida a los colaboradores.- Este instrumento contiene la caracterizacin y


descripcin de las causas y los efectos de la aplicacin datawarehouse en los procesos gestin
logstica en abastecimiento y distribucin en la toma de decisiones del negocio

2.2.4 Poblacin.
La poblacin a la que se va a dirigir la encuesta est conformada por 20 personas, por cual
se toma la totalidad de la misma.

Anexo 1. Modelo de la encuesta dirigida a los colaboradores del departamento de


logstica regional Santo Domingo PRONACA.

35
Cuestionario tabulado las respuestas de la encuesta.

Pregunta 1.
Conoce usted que es un sistema de datawarehouse y para qu sirve?

Respuesta Cantidad Porcentaje


Si 2 10,00%
No 18 90,00%
Tabla 2-2: Datos tabulados pregunta1.
Elaboracin: Freddy Jaramillo.

10%

Si
No

90%

Figura 2-1: Ilustracin datos tabulados pregunta 1.


Elaboracin: Freddy Jaramillo.

Interpretacin: La grafica refleja que el 90% de las personas encuestadas desconocen para
que sirven un datawarehouse.

Anlisis: Esto implica que la mayora de los colaboradores del rea de logstica con una
charla o capacitacin podran conocer y entender sobre los beneficios que brinda un
datawarehouse.

Fuente: Colaboradores del rea de logstica.

36
Pregunta 2.
Ud necesita tener informacin puntual para la tomar decisiones?

Respuesta Cantidad Porcentaje


Si 20 100,00%
No 0 0,00%
Tabla 2-3: Datos tabulados pregunta 2.
Elaboracin: Freddy Jaramillo.

10%

Si
No

90%

Figura 2-2: Ilustracin datos tabulados pregunta 2.


Elaboracin: Freddy Jaramillo.

Interpretacin: La grafica refleja que el 100% de las personas encuestadas necesitan tener
informacin puntual para la toma de decisiones.

Anlisis: Se demuestra que la mayora de personas encuestadas necesitan informacin


puntual para la toma de decisiones.

Fuente: Colaboradores del rea de logstica.

37
Pregunta 3.
Los reportes obtenidos de sistemas informticos son rpidos?

Respuesta Cantidad Porcentaje


Nunca 15 75,00%
Alguna vez 3 15,00%
Casi siempre 2 10,00%
Siempre 0 0,00%
Tabla 2-4: Datos tabulados pregunta 3.
Elaboracin: Freddy Jaramillo.

0%

10%

Nunca

25% Alguna vez


Casi siempre
65% Siempre

Figura 2-3: Ilustracin datos tabulados pregunta 3.


Elaboracin: Freddy Jaramillo.

Interpretacin: Se observa que el 75% opina que la velocidad para obtener reportes nunca
es rpido, el 15% alguna vez, el 10% casi siempre y el 0% siempre.

Anlisis: La mayora de los encuestados, manifiesta que nunca es rpida la velocidad para
obtener los reportes.

Fuente: Colaboradores del ares de logstica.

38
Pregunta 4.
De los reportes obtenidos siempre encuentras la totalidad de los datos que necesitas?

Respuesta Cantidad Porcentaje


Nunca 15 75,00%
Alguna vez 3 15,00%
Casi siempre 2 10,00%
Siempre 0 0,00%
Tabla 2-5: Datos tabulados pregunta 4.
Elaboracin: Freddy Jaramillo.

0%

10%

Nunca

25% Alguna vez


Casi siempre
65% Siempre

Figura 2-4: Ilustracin datos tabulados pregunta 4.


Elaboracin: Freddy Jaramillo.

Interpretacin: Se observa que el 75% opina que nunca obtiene los datos requeridos en un
reporte, el 15% alguna vez obtuvo los datos requeridos, el 10% casi siempre, y el 0%
siempre.

Anlisis: En este caso podemos apreciar que la mayora de los colaboradores encuestados
no obtienen los datos completos al momento de sacar un reporte de los sistemas informticos,
por lo que necesitan elaborar nuevas campos en Excel para obtener lo requerido,
convirtindose en una actividad lenta y compleja.

Fuente: Colaboradores del ares de logstica.

39
Pregunta 5.
Puedes obtener reporte histrico de los sistemas informticos?

Respuesta Cantidad Porcentaje


Si 0 0,00%
No 20 100,00%
Tabla 2-6: Datos tabulados pregunta 5.
Elaboracin: Freddy Jaramillo.

10%

Si
No

90%

Figura 2-5: Ilustracin datos tabulados pregunta 5.


Elaboracin: Freddy Jaramillo.

Interpretacin: Se observa que el 100% de los encuestados no puede obtener reportes


histricos.

Anlisis: El total de las personas encuestadas nos responde que de los sistemas informticos
no es posible obtener reportes histricos de ms de un ao.

Fuente: Colaboradores del ares de logstica.

40
Pregunta 6.
Te gustara tener la informacin en el momento oportuno?

Respuesta Cantidad Porcentaje


Si 20 100,00%
No 0 0,00%
Tabla 2-7: Datos tabulados pregunta 6.
Elaboracin: Freddy Jaramillo.

10%

Si
No

90%

Figura 2-6: Ilustracin datos tabulados pregunta 6.


Elaboracin: Freddy Jaramillo.

Interpretacin: Se observa que el 100% de los encuestados le gustara obtener la


informacin en el momento oportuno.

Anlisis: El total de las personas encuestadas nos responde que, el tener la informacin a la
mano aporta a la toma de decisiones oportunamente.

Fuente: Colaboradores del departamento de logstica.

41
Pregunta 7.
Cree usted que mejorara el desempeo en su puesto de trabajo con las estadsticas de la
gestin logstica que se obtendra del datawarehouse?

Respuesta Cantidad Porcentaje

Si 15 75,00%

No 1 5,00%

Tal vez 4 20,00%

Tabla 2-8: Datos tabulados pregunta 7.


Elaboracin: Freddy Jaramillo.

8%
17%

Si
No
Tal vez

75%

Figura 2-7: Ilustracin datos tabulados pregunta 7.


Elaboracin: Freddy Jaramillo.

Interpretacin: Se observa que el 75% responde que si mejorara las actividades de su


puesto de trabajo ya que contara con datos puntuales en su gestin, el 5% opina que no
mejorara, y el 20% tal vez.

Anlisis: La mayora de los encuestados manifiestan que si mejorara la gestin que realiza
en su puesto de trabajo al contar con datos estadsticos y una minora opina que tal vez o no
aportara mayor cosa en la mejorar de su gestin.

Fuente: Colaboradores de rea de logstica.

42
Pregunta 8.
Frecuentemente obtiene reportes de los sistemas informticos?

Respuesta Cantidad Porcentaje


Nunca 0 0,00%
Alguna vez 2 10,00%
Casi siempre 5 25,00%
Siempre 13 65,00%
Tabla 2-9: Datos tabulados pregunta 8.
Elaboracin: Freddy Jaramillo.

0%

10%

Nunca

25% Alguna vez


Casi siempre
65% Siempre

Figura 2-8: Ilustracin datos tabulados pregunta 8.


Elaboracin: Freddy Jaramillo.

Interpretacin: Se observa que el 0% opina que nunca obtiene reportes de los sistemas
informticos, el 10% alguna vez se requiere un reporte, el 25% casi siempre y el 65%
siempre.

Anlisis: La mayora de los encuestados manifiestan que necesitan obtener datos de los
reportes generados por los sistemas informticos, ya que son imprescindibles para el anlisis
de los mismos.

Fuente: Colaboradores del ares de logstica.

43
2.3 Conclusiones parciales.
De la entrevista aplicada al jefe regional de logstica se obtuvo como resultado una
informacin muy detallada acerca de los procesos que realizan para obtener informes y
reportes estratgicos de la gestin logstica, de esta manera se obtendr un datawarehouse
acorde a las necesidades que se realiza en este departamento y esto a su vez permite optimizar
tiempo y recursos. Y de la encuesta realizada a los empleados, se pudo apreciar que existe
una gran acogida y aceptacin que avala el desarrollo e implantacin de un datawarehouse
para la empresa.

La no existencia de una herramienta datawarehouse incide significativamente en los


procesos logsticos ya que claramente se ha podido notar al momento de la toma de
decisiones que se requiere de varios recursos tecnolgicos, ya que a ms de los reportes
obtenidos por el sistema transaccional de la empresa se requiere de otros programas como:
Word y Excel para grficos y proyecciones que no son los ideales para este tipo de trabajo.

44
3 CAPITULO III MARCO PROPOSITIVO.
Para el desarrollo del datawarehouse, se utilizar como gua la metodologa de Ralph
Kimball tratada en el captulo I. Esto permitir realizar el proyecto en base a pasos que
garantizan la calidad del mismo. Metodologa que ser adaptada a las necesidades del
proyecto.

3.1 Planeacin y administracin del proyecto.


3.1.1 Definicin del proyecto.
Para el desarrollo de este proyecto se identific el alto inters por parte del departamento de
logstica, manifestando su inters por obtener informacin que les permita tomar sus
decisiones en funcin al monitoreo del negocio.
Por lo que se defini el proyecto, dirigindole a las reas interesadas, como proyecto inicial
de este tipo.

3.1.2 Alcance y justificacin del proyecto.


En cuanto a estos puntos, ya fueron definidos en las especificaciones del proyecto en el
captulo I. Pero vale recalcar de manera puntual, el alcance de proyecto, que es el desarrollo
de un datawarehouse, el cual mantendr informacin de anlisis, de la gestin logstica tanto
en abastecimiento de materia prima, abastecimiento y distribucin de producto terminado
para granjas de aves, cerdos y comerciales. Su justificacin, es de contar con informacin
til para el soporte de decisiones en funcin al anlisis de la informacin.
Para la planeacin del proyecto se defini los roles a cumplir en el desarrollo del proyecto,
que son:

Desarrollador del proyecto.


Persona nica la cual estar encargada de:
Desarrollar.
Monitorear el Desarrollo.
Disear y Modelar.
Analizar Negocio.
Jefes Departamentales.
Personas con alto rango en el negocio a las cuales se les va a ir notificando peridicamente
los avances del proyecto, los jefes de:

45
Gestin tecnolgica.
Jefe regional de logstica
Personal involucrado en el departamento.
Empleados que participan activamente en la gestin logstica de abastecimiento y
distribucin.

3.2 Definicin de los requerimientos del negocio


Para la definicin de los requerimientos se realizaron 4 actividades que ayudaron a
determinar las necesidades de los usuarios del negocio, estas son:
Realizar la peticin a las reas controladoras del negocio (gestin logstica en
abastecimiento y distribucin), acerca de qu tipo de informacin necesita y tratan
diariamente.
Reunin con los jefes y coordinadores del departamento de logstica.
Realizar el estudio de los reportes implementados en los sistemas actuales de la
compaa, sistemas relacionados a los procesos del negocio. En este punto vale
recalcar que se dio ms nfasis a los reportes estadsticos, ya que a travs de ellos se
puede recopilar informacin relevante para el negocio a evaluar.
Estudiar los negocios con el fin de entender las necesidades de los usuarios.
Tomando en cuenta los puntos anteriores se obtuvo los requerimientos que se mencionan a
continuacin:

Gestin logstica.
La jefatura de logstica supo dar a conocer la informacin que le interesa y sobre la cual se
soportan para la toma de decisiones, estas son:
TM abastecidas de MP.
Costo de transporte.
Dlares por TM transportada.
TM despachadas de PT.
TM despachadas por especie
Ordenes atendidas.
Cumplimiento de reaprovisionamiento.
Cumplimiento pedidos
Cantidades despachadas.

46
Costo redes de distribucin.
Anlisis de la informacin en un horizonte de tiempo, anual, trimestral, mensual,
semanal.
Costo logstico por tonelada comercial [$/TM].

Indicadores.
Entregas a tiempo.
Descripcin: Este indicador representa las entregas a tiempo sobre el total de
entregas.
Entregas completas.
Descripcin: Este indicador representa las entregas completas sobre el total de
entregas.
Tiempo de ciclo de pedido
Descripcin: Media del valor de tiempo pasado desde que un cliente emite un pedido
hasta que lo recibe.
Costo de transporte medio unitario.
Descripcin: Costo total de transporte sobre el nmero de unidades movidas.
Volumen por red de transporte x 100
Volumen total expedido
Utilizacin de transporte.
Descripcin: Costo total de transporte por red sobre kilogramos totales movidos por
red.
Costo por kilmetros.
Descripcin: Costo total de trasporte sobre kilmetros totales recorridos.

Mencionada la informacin que le interesa a la parte directiva de logstica, manifestaron


consultas para la visualizacin que se tomar en cuenta, los mismos que se especifican a
continuacin:
Cantidad recibida de tems por:
Proveedor.
Familia de tem.
Volmenes.
Tiempo de recepcin

47
Cantidades despachadas de tems por:
Tipo de Cliente.
Cliente
Red de cliente.
Zona de cliente.
Familia de tem.
Volmenes.
Nivel de servicio:
A tiempo.
Completo.
OTIF.

3.3 Diseo tcnico de la arquitectura.


En el diseo de la arquitectura se defini dos ambientes, el primero es el Back Room y el
segundo que es Front Room, los mismos que sern detallados a continuacin.

3.3.1 Back room


Los datos para la poblacin del datawarehouse, sern extrados del servidor de base de datos
SQL Server 2008 R2 de la empresa PRONACA y de hojas de Excel donde hay informacin
relevante para logstica. El proceso ETL se lo realizar mediante la herramienta Microsoft
SQL Server Integration Services (SSIS), y el datawarehouse ser alojado en el servidor de
base de datos de SQL Server.

Figura 3-1: Back Room Proyecto


Elaboracin: Freddy Jaramillo.

48
3.3.2 Front room
En esta seccin se especifica la arquitectura de presentacin del datawarehouse, mediante
aplicaciones dirigidas al usuario final.
Es parte del datawarehouse en donde se encuentra los datos que ya han sido tratados y
almacenados, posteriormente se procede a la presentacin de acuerdo al tipo de aplicacin
de usuario final que se utilice. Para el desarrollo del presente proyecto se implementar una
arquitectura de ambiente analtico para poder disear los cubos OLAP.

Figura 3-2: Front Room Proyecto


Elaboracin: Freddy Jaramillo.

3.4 Seleccin del producto.


Para la seleccin de los productos a utilizar se tom en cuenta las caractersticas planteadas
anteriormente en el Captulo I - Seccin 4 sobre las Herramientas para el desarrollo de un
datawarehouse, con lo cual se plante las siguientes herramientas a ser utilizadas en el
proyecto:
Plataforma DBMS.
La plataforma a utilizar es el motor de base de datos SQL Server 2008 R2 ya que la compaa
PRONACA cuenta con la licencia y su estructura de base de datos esta sobre esta plataforma.
Vale recalcar que este motor tiene incorporado la funcionalidad de la tecnologa OLAP, por
lo que aparte de ser el motor de base de datos, ser tambin un servidor o base de datos
OLAP.
Herramienta ETL.
En cuanto a la herramienta ETL se utiliz Microsoft SQL Server Integration Services (SSIS)
por su versatilidad y facilidad de su manejo.

49
Herramienta DW.
Para la construccin del cubo se utiliz Analysis Services por su facilidad en el manejo.

3.5 Identificar las dimensiones y mapear los datos.


3.5.1 Modelo dimensional
El modelo lgico para el departamento de logstica de la compaa PRONACA, fue realizado
siguiendo el esquema de estrella que optimiza el tiempo de respuesta en consultas complejas,
siguiendo los pasos del modelo dimensional de Ralph Kimball.
Las dimensiones que hemos analizado en el departamento de logstica son:

DIMENSION_ARTICULO
DIMENSION_CLIENTE
DIMENSION_VEHICULOSP
DIMENSION_PROVEEDOR
DIMENSION_TIPOMOVIMIENTO
DIMENSION_TIEMPO
DIMENSION_RUTA
DIMENSION_REDTRANSPORTE
DIMENSION_COMPAIATRANS
HECHO_GESTIONLOG_MP
HECHO_GESTIONLOG_PT
HECHO_NIVELSERVICIO

50
Tabla 3-1: Mapeo de datos Dimensin Artculo
Nombre de la Tabla: DIMENSION_ARTICULO
3.5.1.1 Dimensin artculo.

Tipo de Tabla: DIMENSION


Tablas Origen: ARTICULOS, AUXILIAR_ARTICULOS

DESTINO ORIGEN
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao
ID_ARTICULO Clave primaria Subrogada int Primaria Sistema ETL
mismos estn clasificados por tipo y especie.

CODIGO_ARTICULO cdigo del articulo char(10) articulos cdigo char(10)

51
NOMBRE_ARTICULO Descripcin del articulo varchar(50) articulos titulo varchar(50)
PRESENTACION_ARTICULO Peso en kg por unidad nvarchar(4) auxiliar_articulos presentacin nvarchar(255)
Clasificacin de la especie de
ESPECIE_ARTICULO animales nvarchar(10) auxiliar_articulos especie nvarchar(255)
TIPO_ARTICULO Tipo de Articulo nvarchar(10) auxiliar_articulos tipo nvarchar(255)
NEGOCIO_ARTICULO Calcificacin de negocio nvarchar(15) auxiliar_articulos negocio nvarchar(255)

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
Contiene la informacin acerca de los artculos que maneja el departamento de logstica, los
Tabla 3-2: Mapeo de datos Dimensin Cliente
Nombre de la Tabla: DIMENSION_CLIENTE
3.5.1.2 Dimensin cliente.

Tipo de Tabla: DIMENSION


Tablas Origen: CLIENTES, AUXILIAR_ZONACLIENTE

DESTINO ORIGEN
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao
ID_CLIENTE Clave primaria subrogada int Primaria Sistema ETL
CODIGO_CLIENTE Codigo Cliente varchar(6) clientes codcli varchar(6)

52
NOMBRE_CLIENTE Nombre Cliente varchar(100) clientes nomcli varchar(100)
DIRECCION_CLIENTE Direccion del Cliente nvarchar(100) clientes dircli nvarchar(100)
Clacificacion del Cliengte por
TIPO_CLIENTE tipo char(20) clientes tipocli char(20)
Zona de ubicacin de los
ZONA_CLIENTE Clientes. nvarchar(15) auxiliar_zonacliente zona nvarchar(255)

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
categoras, que son: Clientes relacionados, Clientes Integrados, Clientes Comerciales.
Contiene informacin de clientes atendidos por logstica, estos se clasifican en tres
Tabla 3-3: Mapeo de datos Dimensin proveedor
Nombre de la Tabla: DIMENSION_PROVEEDOR
Tipo de Tabla: DIMENSION
3.5.1.3 Dimensin proveedor.

Tablas Origen: PROVEEDOR, ALMACENES

DESTINO ORIGEN
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao
ID_PROVEEDOR Clave primaria subrogada int Primaria Sistema ETL

53
CODIGO_PROVEEDOR Cdigo Proveedor char(6) Sistema ETL cdigo varchar(6)
NOMBRE_PROVEEDOR Nombre Proveedor varchar(100) Sistema ETL nombrep varchar(100)
Direccin Proveedor
DIRECCION_PROVEEDOR varchar(100) Sistema ETL direcp nvarchar(100)
Clasificacin de Proveedor
TIPO_PROVEEDOR por tipo char(10) Sistema ETL tipo_proveedor char(20)

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
proveedor: Almacenes (propios de la empresa), Proveedores (Ajenos a la empresa)
Contiene informacin de proveedores de materia prima, este se clasifica por tipo de
Tabla 3-4: Mapeo de datos Dimensin Tipomovimiento
Nombre de la Tabla: DIMENSION_TIPOMOVIMIENTO
Tipo de Tabla: DIMENSION
Tablas Origen: PESAJE
3.5.1.4 Dimensin Tipo Movimiento.

DESTINO ORIGEN
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao

54
ID_MOVIMIENTO Clave primaria subrogada int Primaria Sistema ETL
CODIGO_MOVIMIENTO Cdigo movimiento nvarchar(2) pesaje codigo_mov decimal(11,6)
TIPO_MOVIMIENTO Clasificacion movimientos nvarchar(20) Sistema ETL tipo_mov varchar(100)
DETALLE_MOVIMIENTOClase de tipo movimiento nvarchar(30) Sistema ETL Clase_mov varchar(100)

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
transacciones de Logstica, se clasifican por: Abastecimiento, Distribucin.
Contiene informacin de los diferentes Tipos de Movimientos realizados en las
integrados, relacionados.

Tabla 3-5: Mapeo de datos Dimensin redtransporte


Nombre de la Tabla: DIMENSION_REDTRANSPORTE
Tipo de Tabla: DIMENSION
Tablas Origen: DETALLE_PESAJE
3.5.1.5 Dimensin red de distribucin.

DESTINO ORIGEN

55
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao
ID_REDTRANS Clave primaria subrogada int Primaria Sistema ETL
CODIGO_REDTRANS codigo red transporte char(4) detalle_pesaje codred char(4)
DESCRIPCION_REDTRANS
descripcion red de transporte cahr(15) Sistema ETL

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
Contiene informacin de las diferentes redes de distribucin manejadas en logstica, se
clasificad por: Red primaria, red secundaria, red comercial, materia prima, red de granjas,
Logstica.

Tabla 3-6: Mapeo de datos Dimensin compaiatrans


Nombre de la Tabla: DIMENSION_COMPAIATRANS
Tipo de Tabla: DIMENSION
3.5.1.6 Dimensin Compaa.

Tablas Origen: PROPITRAN

DESTINO ORIGEN
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao
ID_COMPAIATRANS Clave primaria subrogada int Primaria Sistema ETL
Cdigo compaa transporte
CODIGO_COMPAIATRANS char(6) propitran Codigopv char(6)

56
Nombre de la compaa
transporte
NOMBRE COMPAIATRANS char(35) propitran propieta char(35)
Direccin compaa de
DIR_COMPAIATRANS transporte char(35) propitran direccionp char(35)
Telefonos de la diferentes
compaias
TELEFONO_COMPAIATRANS char(9) propitran telefonop char(9)

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
Contiene informacin de las diferentes compaas de transporte que prestan servicios a
Contiene la placa del vehculo.

Tabla 3-7: Mapeo de datos Dimensin vehculo


3.5.1.7 Dimensin Vehculos.

Nombre de la Tabla: DIMENSION_VEHICULO


Tipo de Tabla: DIMENSION
Tablas Origen: VEHICULOS
DESTINO ORIGEN

57
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao
ID_VEHICULO Clave primaria subrogada int Primaria Sistema ETL Clave primaria sobrogada
int
PLACA_VEHICULO codigo vehiculo char(7) vehiculos placa char(7)

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
3.5.1.8 Dimensin Tiempo.
Contiene la Informacin acerca del horizonte de tiempo de las actividades de logstica, esta
dimensin es elaborada con un procedimiento almacenado.
Tabla 3-8: Mapeo de datos Dimensin Tiempo
Nombre de la Tabla: DIMENSION TIEMPO
Tipo de Tabla: DIMENSION
Tablas Origen: Procedimiento para crear tabla tiempo

Nombre Columna Descripcin Tipo de Dato/Tamao Clave


FechaSK Clave primaria subrogada int
Fecha Clave primaria date Primaria
Ao Ao de fecha smallint
Nmes Nombre del mes Char(15)
Nsemana Nombre de la semana Char(10)
Ndiasemana Nombre del da de la semana Char(10)

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.

3.5.2 Identificar los hechos


Los hechos a definir soportarn los requerimientos establecidos cumpliendo con la
granularidad especificada para cada negocio. El mapeo de los datos ser especificado en
cada hecho.
En el desarrollo del datawarehouse se definirn hechos referentes a las transacciones que se
realicen de acuerdo al negocio.
Los hechos tendrn dimensiones en comn as como tambin dimensiones especficas para
el negocio.
3.5.2.1 Identificar las medidas.
Las medidas que se implementan en los hechos cumplen con el detalle de granularidad que
se especificaron anteriormente.

Tabla 3-9: Medidas tabla de hecho gestin logstica


Medida Detalle
Kilos Especifica los kg movidos
km recorridos km recorridos en rutas especificas
diferencias peso kg encontrados como diferencias de peso de un punto a otro
valor flete Valor del flete segn su ruta y TM transportadas
Fuente: Proyecto DW.
Elaboracin: Freddy Jaramillo.

58
Tabla 3-10 : Medidas tabla de hecho Nivel de Servicio
Medida Detalle
Insuficiencia Pedidos no entregados
Cumplimiento % cumplimiento de pedidos
A tiempo % cumplimiento de pedidos en la fecha programada

OTIF Pedidos entregados a tiempo y completos

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.

3.5.2.2 Abastecimiento y distribucin de producto terminado


Contiene los indicadores (medidas) de las transacciones de abastecimiento y distribucin de
producto terminado, PT recibidos desde otros almacenes pertenecientes al mismo negocio y
la distribucin de los mismos a nuestros clientes, adems se especifican las claves forneas
que permite relacionar con las dimensiones.

59
Tabla 3-11: Mapeo de datos tabla de hecho gestionlog_PT
Nombre de la Tabla: HECHO_GESTIONLOG_PT
Tipo de Tabla: HECHO
PESAJE, DIMENSION_ARTICULO, DIMENSION_VEHICULO, DIMENSION_COMPAIATRANS, DIMENSION_PROVEEDOR, DIMENSION_RUTA,
Tablas Origen: DIMENSION_TIEMPO, VALORTRA

DESTINO ORIGEN
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao
ID_DISTRIBUCION Clave primaria subrogada int Primaria Sistema ETL
Clave foranea de la dimensin
ID_VEHICULO VEHICULO int Primaria foranea DIMENSION_VEHICULO ID_VEHICULO INT
Clave foranea de la dimensin
ID_COMPAIATRANS COMPAIATRANS int Primaria foranea DIMENSION_COMPAIATRANS ID_COMPAIATRANS INT
Clave foranea de la dimensin
ID_ARTICULO ARTICULO int Primaria foranea DIMENSION_ARTICULO ID_ARTICULO INT
Clave foranea de la dimensin
ID_PROVEEDOR PROVEEDOR int Primaria foranea DIMENSION_PROVEEDOR ID_PROVEEDOR INT

60
Clave foranea de la dimensin
ID_CLIENTE CLIENTE int Primaria foranea DIMENSION_CLIENTE ID_CLIENTE INT
Clave foranea de la dimensin
ID_MOVIMIENTO TIPOMOVIMIENTO int Primaria foranea DIMENSION_MOVIMIENTO ID_MOVIMIENTO INT
Calve foranea de la dimension
ID_RUTA RUTA int Primaria foranea DIMENSION_RUTA ID_RUTA INT
Clave foranea de la dimensin
ID_FECHA TIEMPO date Primaria foranea DIMENSION_FECHA ID_FECHA INT
Clave foranea de la dimensin
ID_REDTRANS REDTRANS int Primaria foranea DIMENSION_REDTRANSPORTE ID_REDTRANS INT
KILOS Kilos despachados decimal(15,2) pesaje pesokilos decimal (15,4)
Diferencia de kg entre peso enviado
DIFERENCIA_PESO y recibido decimal(9,2) pesaje diferencia decimal (9,2)
VALOR_FLETE Valor flete decimal(11,2) pesaje netotrans decimal (11,2)
KMS_RECORRIDO Kilometros recorridos por ruta decimal(5,0) valortra kmsvt decimal (5,2)

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
DIAGRAMA GESTIN LOGSTICA DE PRODUCTO TERMINADO.

Figura 3-3: Diseo fsico tabla de hecho abastecimiento y distribucin de PT.


Elaboracin: Freddy Jaramillo.

3.5.2.3 Abastecimiento de materia prima


Contiene los indicadores (medidas) de las transacciones de abastecimiento y distribucin de
materia prima que se recibe de los diferentes proveedores y almacenes propios del negocio,
adems distribucin de MP a otras plantas, y las claves forneas que permite relacionar con
las dimensiones.

61
Tabla 3-12: Mapeo de datos tabla de hecho gestionlog MP.
Nombre de la Tabla: HECHO_GESTIONLOG_MP
Tipo de Tabla: HECHO
PESAJE, DIMENSION_ARTICULO, DIMENSION_CLIENTE, DIMENSION_VEHICULO, DIMENSION_COMPAIATRANS, DIMENSION_PROVEEDOR,
Tablas Origen: DIMENSION_RUTA, DIMENSION_REDTRANS, DIMENSION_TIEMPO, VALORTRA

DESTINO ORIGEN
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao
ID_GESTIONLOG Clave primaria subrogada INT Primaria Sistema ETL
Clave foranea de la dimensin
ID_VEHICULO VEHICULO INT Primaria foranea DIMENSION_VEHICULO ID_VEHICULO INT
Clave foranea de la dimensin
ID_COMPAIATRANS COMPAIATRANS INT Primaria foranea DIMENSION_COMPAIATRANS ID_COMPAIATRANS INT
Clave foranea de la dimensin
ID_ARTICULO ARTICULO INT Primaria foranea DIMENSION_ARTICULO ID_ARTICULO INT
Clave foranea de la dimensin
ID_PROVEEDOR PROVEEDOR INT Primaria foranea DIMENSION_PROVEEDOR ID_PROVEEDOR INT
Clave foranea de la dimensin

62
ID_CLIENTE CLIENTE INT Primaria foranea DIMENSION_CLIENTE ID_CLIENTE INT
Clave foranea de la dimensin
ID-MOVIMIENTO TIPOMOVIMIENTO INT Primaria foranea DIMENSION_MOVIMIENTO ID_MOVIMIENTO INT
Clave foranea de la dimensin
ID_RUTA RUTA INT Primaria foranea DIMENSION_RUTA ID_RUTA INT
Clave foranea de la dimensin
ID_FECHA TIEMPO date Primaria foranea DIMENSION_TIEMPO fecha date
Clave foranea de la dimensin
ID_REDTRANS REDTRANS INT Primaria foranea DIMENSION_REDTRANSPORTE ID_REDTRANS INT
KILOS Kilos despachados decimal(15,2) pesaje pesokilos decimal (15,2)
Diferencia de kg entre peso enviado
DIFERENCIA_PESO y recibido decimal(9,2) pesaje diferencia decimal (9,2)
VALOR_FLETE Valor flete decimal(11,2) pesaje netotrans decimal (11,2)
KMS_RECORRIDO Kilometros recorridos por ruta decimal(5,0) valortra kmsvt decimal (5,2)

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
DIAGRAMA GESTIN LOGSTICA MATERIA PRIMA

Figura 3-4: Diseo fsico tabla de hecho gestin logstica MP


Elaboracin: Freddy Jaramillo.

3.5.2.4 Nivel de servicio OTIF.


Contiene los indicadores que miden el nivel de servicio gestionado por el departamento de
logstica.

63
Tabla 3-13: Mapeo de datos tabla de hecho nivelservicio
Nombre de la Tabla: HECHO_NIVELSERVICIO
Tipo de Tabla: HECHO
Tablas Origen: TABLAS DE EXCEL BASE_PEDIDOS_M12, DIMENSION_ARTICULO, DIMENSION_CLIENTE, DIMENSION_TIEMPO

DESTINO ORIGEN
Nombre Columna Descripcin Tipo de Dato/Tamao Clave Sistema/Tabla Campo Origen Tipo de Dato/Tamao
ID_SERVICIO Clave primaria subrogada INT Primaria Sistema ETL
Clave foranea de la dimensin
ID_CLIENTE CLIENTE INT Primaria foranea DIMENSION_CLIENTE ID_CLIENTE INT
Clave foranea de la dimensin

64
ID_ARTICULO ARTICULO INT Primaria foranea DIMENSION_ARTICULO ID_ARTICULO INT
Clave foranea de la dimensin
ID_FECHA TIEMPO date Primaria foranea DIMENSION_TIEMPO fecha date
INSUFICIENCIA Kilos no despachados float BASE_PEDIDOS_M12 Sistema ETL numerico
CUMPLIMIENTO Pedidos entregados float BASE_PEDIDOS_M12 Sistema ETL numerico
A_TIEMPO Fecha de pedido cumplido a tiempo float BASE_PEDIDOS_M12 Sistema ETL numerico
OTIF Kilometros recorridos por ruta float BASE_PEDIDOS_M12 Sistema ETL numerico

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.
3.5.3 Datawarehouse busmatrix

Tabla 3-14: Bus Matrix DW.


Dimensiones Comunes

Compaa Transporte
Movimiento
Proveedor

Recorrido
Vehculo
Articulo

Tiempo
Cliente

Red
Proceso de Negocio Tabla de hecho Granularidad
GestionLog_MP Un registro por cada movimiento X X X X X X X X X
Gestion Logistica
GestionLog_PT Un registro por cada movimiento X X X X X X X X X
Pecuaria
Nivel de servicio Un registro por cada movimiento X X X

Fuente: Proyecto DW.


Elaboracin: Freddy Jaramillo.

3.6 Diseo fsico.


El diseo fsico se realiz en funcin a la base de datos ya mencionada, SQLServer 2008
R2.
Base de datos temporal.
Se disea una base de dato temporal, donde se incorpora las tablas con los datos
tratados necesarios de las bases de datos y de tablas de Excel, para la elaboracin del
datawarehouse, esta DDB se denomina Mantenimiento DW.
Base de datos temporal con estructura de datawarehouse.
Se disea una base de datos temporal con estructura de un datawarehouse, donde se
incorpora los datos ya tratados desde su origen.
ndices.
Se configura los ndices en las diferentes dimensiones y tablas de hecho con la
finalidad de mejorar la velocidad de bsqueda, el tipo de ndice que se utilizo es el
NO AGRUPADO (NONCLUSTERED).
Sintaxis:
CREATE NONCLUSTERED INDEX NOMBRE
ON TABLA (CAMPO INDEXADO)

3.6.1 Base de datos origen


Primero se empezar especificado los scripts de creacin para la base de datos origen, lo que
permitir llevar a cabo la tcnica de extraccin CDC (Change Data Capture) la misma que

65
ser explicada en el diseo ETL para su mayor entendimiento as como de la funcionalidad
que aportar.

3.7 Diseo y desarrollo del proceso ETL.


Desarrollo del plan ETL.
A continuacin se elaborar un mapa grfico del funcionamiento ETL de cada una de las
dimensiones y tabas de hecho, el cual permitir tener una mayor idea de cmo se ejecutar
el proceso ETL.

3.7.1 Paso 1: Trazar un plan de alto nivel.


En este paso se disea diagramas de flujo de cada dimensin y tabla de hecho para entender
el funcionamiento del proceso ETL,
Revisar Anexo 4. Diagrama de flujo del funcionamiento del ETL por cada dimensin
y tablas de hecho.

3.7.2 Paso 2: Funcionalidad de la herramienta ETL


Se renombro este paso en funcin a que ya se especific la herramienta ETL a utilizar por lo
que a continuacin se detallar las funcionalidades a utilizar.
Para la elaboracin de los procesos ETL se utilizar dos herramientas del Sofware ETL de
Microsoft SQL Server 2008. Estas son:
Integration Services, que va a permitir disear las transformaciones y trabajos de
manera grfica y amigable.
Agente SQL Server, permiten ejecutar el proceso ETL peridicamente mediante
Jobs, tareas programadas con periodo de tiempo.

3.7.3 Paso 3: Desarrollar estrategias por defecto.


Para elaborar el proceso ETL se dise dos bases de datos:
Base de datos Mantenimiento DW.- Esta es una DDB temporal, donde cargamos
los datos necesarios para la elaboracin del datawarehouse, extraemos los datos
desde la DDB origen denominada Almacen_M12, los datos son transferidos por
medio de un paquete (Extrae_datos), creado en un proyecto SSIS denominado
Proceso_ETL.

66
Diagrama tabla temporal (Mantenimiento DW).

Figura 3-5: Diagrama tabla temporal Mantanimiento_DW


Elaboracin: Freddy Jaramillo.

Base de datos DW_PRONACA.- Esta DDB se disea con estructura de un


datawarehouse, en esta etapa cargamos los datos provenientes de la DDB
Mantenimiento_DW que ya fueron previamente tratados, adems incorporamos las
claves forneas, aqu ya encontramos el diagrama de los diferentes cubos como son:

Figura 3-6: Estructura diagramas de base de datos temporal.


Elaboracin: Freddy Jaramillo.

67
Diagrama GestionLog_PT

Figura 3-7: Diagrama gestinlog_PT


Elaboracin: Freddy Jaramillo.
Diagrama GestionLog_MP

Figura 3-8: Diagrama GestionLog_MP


Elaboracin: Freddy Jaramillo.
68
Diagrama NivelServicio.

Figura 3-9: Diagrama NivelServicio.


Elaboracin: Freddy Jaramillo.

3.7.3.1 Proyecto SSIS en Integration Services.


Se disea un proyecto SSIS denominado Proceso_ETL, aqu creamos cuatro paquetes para
realizar el ETL, se denominan de la siguiente manera:

Figura 3-10: Esquema paquetes SSIS


Elaboracin: Freddy Jaramillo

Mayor detalle se explica en el Anexo 2 denominado Manual de implementacin de un


proyecto SSIS en Integration Services proceso ETL.

3.7.4 Paso 4: Poblar las tablas de dimensin con los datos.


En este paso ejecutamos el ETL para cargar los datos desde las DDB origen hacia los
diferentes cubos, esto se lo realiza por medio del proyecto SSIS que ya se mencion en el
paso anterior. Mayor detalle en el Anexo 3. Manual tcnico carga de datos por medio del
proceso ETL.

69
3.7.4.1 Extraccin de Datos.
La extraccin de los datos se lo realizar mediante sentencias SQL a las tablas de la base
origen. Como resultado devolver todos los registros de acuerdo a la tabla consultada debido
a que es el proceso de carga inicia.
3.7.4.2 Transformacin de Datos.
Los datos antes de ser cargados en el almacn sern transformados segn lo requieran, para
lo cual se especific ciertas transformaciones que se mencionan a continuacin de acuerdo
a cada dimensin, los datos a las tablas de hecho se cargan por medio de procedimientos
almacenados.
3.7.4.3 Carga de datos.
Los datos ya tratados procedemos a cargarlos por medio de una tarea de procesamiento de
Analysis Services.

Figura 3-11: Carga datos hacia el cubo.


Elaboracin: Freddy Jaramillo.

3.7.5 Paso 5: Poblar las tablas de hecho con datos.


En este paso ejecutamos el ETL para cargar los datos desde las DDB origen hacia los
diferentes cubos, esto se lo realiza por medio del proyecto SSIS que ya se mencion en el
paso anterior, especficamente se llama procedimientos almacenados. Mayor detalle en el
Anexo 3. Manual tcnico carga de datos por medio del proceso ETL.

70
3.8 Implementacin de cubo.
Despus de realizar el proceso de ETL y una vez que el datawarehouse ya contiene los datos
se procede a la construccin y publicacin de los cubos con la herramienta Analysis Services
para el anlisis OLAP. Para el caso prctico se presenta en resumen el procedimiento para
la creacin y publicacin de un cubo, el Anexo 5, detalla cada uno de los pasos que a
continuacin se enumeran:
1. Creacin de conexin.- Antes de crear un cubo se debe crear la conexin a la base de
datos de donde se va extraer la informacin.
2. Creacin de vistas de origen de datos.- Se crea un esquema de vista de origen de datos
que es la base para la creacin del cubo.
3. Creacin de cubos.- Se procede con la creacin de los cubos.
4. Creacin de dimensiones.- Aadir las dimensiones de acuerdo al diseo del cubo.
5. Creacin de jerarquas.- Al momento de la creacin de los cubos se debe configurara
las jerarquas, normalmente la jerarquas se configuran a las dimensiones de tiempo,
geogrficas etc.
6. Creacin de medidas.- Aadir medidas en los cubos de informacin de acuerdo al
requerimiento.

Figura 3-12: Cubo OLAP en Analysis Services


Elaboracin: Freddy Jaramillo.

3.9 Visualizacin de datos.


Para visualizar los datos, hemos utilizado Microsoft Excel donde se crea las conexiones
OLAP hacia los diferentes cubos. Revisar el Anexo 6. Creando conexin OLAP desde
Microsoft Excel a SQL Server de Analysis Services.

71
Figura 3-13: Men visualizacin de datos del cubo OLAP.
Elaboracin: Freddy Jaramillo.

3.9.1 Tablero de control distribucin de PT.


En este tablero de control podeos visualizar informacin clasificados por tipo de negocio,
especie, y zona de clientes; contar con estos dato actualizados y comparado en el tiempo nos
ayuda en la toma de decisiones sobre la administracin de nuestros recursos (medio de
transporte, capacidad de bodegas, recurso humano).

Figura 3-14: TC Distribucin de producto terminado.


Elaboracin: Freddy Jaramillo.

72
3.9.2 Tablero de control abastecimiento de materia prima
En este tablero de control podemos visualizar TM de materias primas abastecidas a la planta
de produccin, conocer esta informacin nos permite administrar nuestros recursos
(transporte, productividad logstica).

Figura 3-15: TC TM abastecidas de MP.


Elaboracin: Freddy Jaramillo.
3.9.3 Nivel de servicio OTIF
El OTIF es un indicador de desempeo de la industria logstica que refleja el porcentaje de
despachos que llegan a tiempo (On Time), con el producto y cantidad solicitados, y al lugar
indicado por el cliente (In Full). En el caso de grandes empresas intensivas en procesos
logsticos y recepciones de despachos, como una gran tienda o un hipermercado, resulta
imperativo que este ndice sea superior al 90%.

Figura 3-16: TC Nivel de Servicio OTIF.


Elaboracin: Freddy Jaramillo.

73
CONCLUSIONES.

La implementacin de un datawarehouse con alcance para la gestin logstica, gener


informacin analtica dentro de un nivel organizacional tctico operativo, producto de los
requerimientos de directivos del negocio.

Para el desarrollo del datawarehouse fue indispensable contar con el apoyo tanto del rea de
informtica, los cuales brindan el soporte tecnolgico, as como del rea referente al negocio
con el fin de evaluar en conjunto las necesidades, y ser ente activo durante todas las etapas
de desarrollo.

En el diseo del modelamiento dimensional, es importante identificar el nivel de detalle o


granularidad hasta el que va llegar el anlisis, esto permite realizar diseos que lo soporte, y
que garantice la integridad de datos durante el proceso ETL.

La importancia de entender cmo se evidencia el negocio en los sistemas transaccionales,


como son las bases de datos es fundamental, puesto que ayuda a tener mejor visin sobre los
datos y permitir seleccionar los adecuados para el anlisis de la informacin, despus que
hayan sido integrados por medio del proceso ETL.

74
RECOMENDACIONES.

Se recomienda como alcance para los desarrollos futuros del datawarehouse, trabajar en
conjunto con las TIC y las diferentes regiones, con el fin de visionar y conformar indicadores
representativos, que sean objeto de medicin dentro del negocio logstico al nivel nacional.

Es recomendable contar con el apoyo tcnico del rea informtica y del departamento
logstico, con el fin de recoger adecuadamente las necesidades, y que las mismas sean
reflejadas en el diseo del datawarehouse.

Se recomienda tomar en cuenta la granularidad con el fin de determinar tcnicamente, como


obtener los datos de las fuentes, integrarlos y sin que esto modifique la relacin de los
mismos cuando se encuentren en el ambiente de datawarehouse.

Se recomienda llevar a cabo un estudio del negocio y de la veracidad de fuentes de datos que
lo respalda, con el fin de sustentar un origen de calidad para la integracin de datos.

75
BIBLIOGRAFA.

BCE. (julio de 2015). Banco Central del Ecuador. Obtenido de


https://www.bce.fin.ec/
Bernabeu, R. D. (2010). Data warehousing: Investigacin y Sistematizacin de
Conceptos Hefesto: Metodologa propia para la Construccin de un Data
Warehouse. Cordova - Argentina.
Cano, J. L. (2007). Business Intelligence.
Casanovas, A., & Cuatrecasas, l. (2003). Logistica Empresarial: Gestin Integral de
la informacin y material en la empresa. Barcelona: Ediciones Gestin 2000 SA.
Das, J., & Cnesa, J. (2010). Introduccin a Business Intelligence. Barcelon, Espaa:
UOC.
Duque Galvez, A. (abril de 2010). Tesis: IMPLEMENTACIN DE UN
DATAWAREHOUSE PARA EL INSTITUTO GEOGRFICO MILITAR.
Sangolqui-Quito, Pichincha, Ecuador.
Espinosa, R. (28 de novimbre de 2009). El Rincon del Business Intelligense.
Obtenido de https://churriwifi.wordpress.com/2009/11/
Espinosa, R. (25 de febrero de 2010). DATAPRIX. Obtenido de
http://www.dataprix.com/blogs/respinosamilla/qu-business-intelligence
Fernandez, C. (22 de julio de 2009). Dataprix. Obtenido de de
http://www.dataprix.com/arquitectura-data-warehouse-areas-datos-nuestro-
almacen- corporativo
Ferrer Mos, S. (12 de Febrero de 2015). www.Pertutatis.cat. Obtenido de Per
Tutatis!: http://pertutatis.cat/la-piramide-de-los-diferentes-tipos-de-sistemas-de-
informacion/
Gauchet, T. (2011). SQL Server 2008 R2: Implementacin y despliegue de una
solucin de Business Intelligence. Barcelona: ENI.
Gomez, R. (abril de 2010).
http://revistas.utp.edu.co/index.php/revistaciencia/article/view/1803.
INEC. (julio de 2015). Instituto Ecuatoriano de Estadisticas y Censos. Obtenido de
http://www.inec.gob.ec/estadisticas/
INEI. (1997). Obtenido de
http://www.ongei.gob.pe/publica/metodologias/Lib5084/14.HTM
Kimball, R. (2008). The DataWarehouse Lifecycle Toolkit, segunda edision.
Lapiedra Alma, R., Devece Caraana , C., & Guiral Herrando, J. (2011).
Introduccin a la gestin de sistemas de informacin en la empresa.
Leon, M. (22 de febrero de 2014). Obtenido de
http://luisleonin.blogspot.com/2014/02/modelado-dimensional-y-data-
warehouse.html
Logistec. (2014). Business Intelligence: Mejorando la eficiencia en la cadena de
valores. Logistec, http://www.revistalogistec.com/index.php/supply-chain-
management/380-estrategia-logistica/1528-business-intelligence-mejorando-la-
eficiencia-de-la-cadena-de-valor. Obtenido de
http://www.revistalogistec.com/index.php/supply-chain-management/380-
estrategia-logistica/1528-business-intelligence-mejorando-la-eficiencia-de-la-
cadena-de-valor
Mendoza Rivera, R. (7 de febrero de 2008). In SlideShare. Obtenido de
http://es.slideshare.net/rimenri/business-inteligence-ms-sql-server
Mendoza, M., Cobos, C., Acosta, L., Gomez Florez, L., & Muoz, J. (2006). Bodega
de datos y OLAP en Unicauca Virtual. Revista de la facultad de ingenieras fsico
mecnicas, 4.
Microsoft. (2014). Microsoft Developer Network. Obtenido de
https://msdn.microsoft.com/es-es/library/ms141026.aspx
Nima Ramos, J. D. (2009). Soluciones OLAP con Microsoft SQL Server Analysis
Services.
Puerta Glvez, A. (2015). Business Intelligence y la tecnologia de la informacion. IT
Campus Academy.
Rojas, C., & Duque, A. (abril de 2010). Repositorio digital ESPE. Obtenido de
http://repositorio.espe.edu.ec/handle/21000/336
Sanches, G. (8 de abril de 2012). McGud II. Obtenido de
http://gusmc.wikispaces.com/1.2+Bases+de+datos+multidimensionales+%28BDM
%29
Tesler, J. (10 de octubre de 2010). Logistica. Obtenido de
http://www.logisticamx.enfasis.com/notas/15627-la-tecnologia-como-soporte-la-
actividad-logistica
Turban, E. (1995). Decision support and expert systems: management support
systems. Englewood Cliffs: Prentice Hall.
Urquizu, P. (16 de junio de 2009). Business Intelligense facil. Obtenido de
http://www.businessintelligence.info/serie-dwh/claves-subrogadas.html
ANEXOS
ANEXO 1- Modelo de la encuesta dirigido a los colaboradores del departamento de
logstica.

1. Conoce usted que es un sistema de datawarehouse y para qu sirve?


___Si ___No

2. Ud. necesita tener informacin puntual para la tomar decisiones?


___Si ___No

3. Los reportes obtenidos de sistemas informticos son rpidos?


___Nunca ___ Algunas veces ___Casi siempre ___Siempre

4. De los reportes obtenidos siempre encuentras la totalidad de los datos que necesitas?
___Nunca ___ Algunas veces ___Casi siempre ___Siempre

5. Puedes obtener reporte histrico de los sistemas informticos?


___SI ___No

6. Te gustara tener la informacin en el momento oportuno?


___SI ___No

7. Cree usted que mejorara el desempeo en su puesto de trabajo con las estadsticas de la
gestin logstica que se obtendra del datawarehouse?
___ Si ___ No ___Tal vez

8. Frecuente mente obtiene reportes de los SI?


___Nunca ___ Algunas veces ___Casi siempre ___Siempre
ANEXO 2 Manual de implementacin de un proyecto SSIS en Integration Services
proceso ETL.
Creamos un nuevo proyecto en Integration services, le damos el nombre de Proceso_ ETL

Creamos conexin a origen de datos.

Creamos las vistas de origen de datos donde incorporamos todas las tablas requeridas, en
este caso creamos dos vistas denominadas de la siguiente manera:
Diseo de la vista Abast_Dist_PT, dentro de estas vistas anexaremos los Query
correspondientes que ser el proceso mediante el cual trataremos los datos desde su origen.

Script extraccin de datos tabla pesaje.


Con este script extraemos los datos necesarios desde la BDD de origen, tambin son tratados
y depurados, para ser cargados a la BDD temporal denominada Mantenimiento_DW. En la
tabla DETLLE_PESAJE_PT

SELECT
CASE WHEN ROW_NUMBER() OVER (PARTITION BY ticketpeso
ORDER BY ticketpeso) = 1 THEN 1 ELSE 0 END num_transaccion, dbo.pesaje.ticketpeso,
dbo.pesaje.placast,
CAST(CASE
WHEN codigopv = 'tr0000' THEN REPLACE(codigopv, 'TR0000', 'TR0157')
WHEN codigopv = 'TR0026' THEN REPLACE(codigopv, 'TR0026', 'TR1709')
WHEN codigopv = 'TR1498' THEN REPLACE(codigopv, 'TR1498', 'TR1751')
ELSE codigopv
END AS NVARCHAR(6)) AS COD_COMPAIA,dbo.pesaje.codigo, dbo.pesaje.codigod,
dbo.pesaje.codigovt, dbo.pesaje.codigop, dbo.pesaje.pesoartic, dbo.pesaje.fechasale,
dbo.pesaje.pesosalida,
CASE
WHEN (codigopv = 'TR0157' OR
codigopv = 'tr0000' OR
codigopv = 'pm0198' OR
codigopv = 'tr0685') AND (codigod LIKE '80%') AND pesoartic = 2 THEN 0
ELSE netotrans
END AS netotrans, dbo.pesaje.cantsacos, dbo.pesaje.presentac, dbo.pesaje.pesokilos,
dbo.pesaje.diferencia,
CASE
WHEN (codigop = 'M11' OR
codigop = 'M13' OR
codigop = 'M31' OR
codigop = 'M88' OR
codigop = 'M89') AND (pesoartic = 4) AND codigo LIKE 'T%' THEN '01'
WHEN (codigopv = 'tr0487' OR
codigopv = 'tr1709' OR
codigopv = 'tr0026' OR
codigopv = 'tr1495') AND (codigod LIKE '80%') AND pesoartic = 2 AND codigo LIKE 'T%' THEN
'02'
WHEN (codigod LIKE '0IN%' OR
codigod LIKE '2IN%') AND pesoartic = 2 AND codigo LIKE 'T%' THEN '04'
WHEN codigod LIKE 'M86%' AND pesoartic = 3 AND codigo LIKE 'T%' THEN '05'
WHEN codigod LIKE 'B%' AND pesoartic = 3 AND
codigo LIKE 'T%' THEN '06'
WHEN (codigopv = 'tr0157' OR
codigopv = 'tr0000' OR
codigopv = 'pm0198' OR
codigopv = 'tr0685') AND (codigod LIKE '80%') AND pesoartic = 2 AND codigo LIKE 'T%' THEN
'07'
WHEN codigop = 'M34' OR
codigop = 'M75' OR
codigop = 'M33' AND (codigo LIKE 'S%' OR
codigo LIKE 'VM%' OR
codigo LIKE 'MD%' OR
codigo LIKE 'QU%' OR
codigo LIKE '25%' OR
codigo LIKE '00%') AND pesoartic = 4 THEN '08'
WHEN codigod LIKE 'M%' AND pesoartic = 3 AND codigo LIKE 'T%' THEN '10'
ELSE '11'
END AS codred,
CASE
WHEN valortra.kmsvt IS NULL
THEN 0
ELSE valortra.kmsvt
END AS kmsvt
FROM dbo.pesaje FULL OUTER JOIN
dbo.valortra ON pesaje.CODIGOVT = VALORTRA.CODIGOVT
WHERE(dbo.pesaje.pesosalida <> 'N') AND (dbo.pesaje.pesoartic = 2 OR
dbo.pesaje.pesoartic = 3 OR
dbo.pesaje.pesoartic = 4) AND (dbo.pesaje.codigo <> '' AND pesokilos IS NOT NULL)

Script extraccin de datos tabla histpesa.


Con este script extraemos los datos necesarios desde la BDD de origen, tambin son tratados
y depurados, para ser cargados a la BDD temporal denominada Mantenimiento_DW en la
tabla DETALLE_PESAJE_PT.

SELECT
CASE
WHEN ROW_NUMBER() OVER (PARTITION BY ticketpeso
ORDER BY ticketpeso) = 1 THEN 1
ELSE 0
END num_transaccion, histpesa.ticketpeso, dbo.histpesa.placast,
CAST(CASE
WHEN codigopv = 'tr0000' THEN REPLACE(codigopv, 'tr0000', 'tr0157')
WHEN codigopv = 'TR0026' THEN REPLACE(codigopv, 'TR0026', 'TR1709')
WHEN codigopv = 'TR1498' THEN REPLACE(codigopv, 'TR1498', 'TR1751')
ELSE codigopv
END AS NVARCHAR(6)) AS COD_COMPAIA,dbo.histpesa.codigo, dbo.histpesa.codigod,
dbo.histpesa.codigovt, dbo.histpesa.codigop, dbo.histpesa.pesoartic, dbo.histpesa.fechasale,
dbo.histpesa.pesosalida,
CASE WHEN (codigopv = 'TR0157' OR
codigopv = 'tr0000' OR
codigopv = 'pm0198' OR
codigopv = 'tr0685') AND (codigod LIKE '80%') AND pesoartic = 2 THEN 0
ELSE netotrans
END AS netotrans, dbo.histpesa.cantsacos, dbo.histpesa.presentac, dbo.histpesa.pesokilos,
dbo.histpesa.diferencia,
CASE
WHEN (codigop = 'M11' OR
codigop = 'M13' OR
codigop = 'M31' OR
codigop = 'M88' OR
codigop = 'M89') AND (pesoartic = 4) AND codigo LIKE 'T%' THEN '01'
WHEN (codigopv = 'tr0487' OR
codigopv = 'tr1709' OR
codigopv = 'tr0026' OR
codigopv = 'tr1495') AND (codigod LIKE '80%') AND pesoartic = 2 AND codigo LIKE 'T%'
THEN '02'
WHEN (codigod LIKE '0IN%' OR
codigod LIKE '2IN%') AND pesoartic = 2 AND codigo LIKE 'T%' THEN '04'
WHEN codigod LIKE 'M86%' AND pesoartic = 3 AND codigo LIKE 'T%' THEN '05'
WHEN codigod LIKE 'B%' AND pesoartic = 3 AND
codigo LIKE 'T%' THEN '06'
WHEN (codigopv = 'tr0157' OR
codigopv = 'tr0000' OR
codigopv = 'pm0198' OR
codigopv = 'tr0685') AND (codigod LIKE '80%') AND pesoartic = 2 AND codigo LIKE 'T%'
THEN '07'
WHEN codigop = 'M34' OR
codigop = 'M75' OR
codigop = 'M33' AND (codigo LIKE 'S%' OR
codigo LIKE 'VM%' OR
codigo LIKE 'MD%' OR
codigo LIKE 'QU%' OR
codigo LIKE '25%' OR
codigo LIKE '00%') AND pesoartic = '4' THEN '08'
WHEN codigod LIKE 'M%' AND codigo LIKE 'T%' AND pesoartic = 3 THEN '10'
ELSE '11'
END AS codred,
CASE
WHEN valortra.kmsvt IS NULL THEN 0
ELSE valortra.kmsvt
END AS kmsvt
FROM dbo.histpesa FULL OUTER JOIN dbo.valortra ON HISTPESA.CODIGOVT =
VALORTRA.CODIGOVT
WHERE(dbo.histpesa.pesosalida <> 'N') AND (dbo.histpesa.pesoartic = 2 OR
dbo.histpesa.pesoartic = 3 OR dbo.histpesa.pesoartic = 4) AND (dbo.histpesa.codigo <> '' AND pesokilos
IS NOT NULL)
Diseo de la vista Abastecimiento_MP

Script extraccin de datos tabla histpesa.


Con este script extraemos los datos necesarios desde la BDD de origen, tambin son tratados
y depurados, para ser cargados a la BDD temporal denominada Mantenimiento_DW en la
tabla DETALLE_PESAJE_MP.

SELECT
CASE
WHEN ROW_NUMBER() OVER (PARTITION BY ticketpeso
ORDER BY ticketpeso) = 1 THEN 1
ELSE 0
END num_transaccion, histpesa.ticketpeso, dbo.histpesa.placast,
CAST(CASE WHEN codigopv = 'tr0000' THEN REPLACE(codigopv,'tr0000','TR0157')
WHEN codigopv = 'TR0026' THEN REPLACE(codigopv, 'TR0026', 'TR1709')
WHEN codigopv = 'TR1498' THEN REPLACE(codigopv, 'TR1498', 'TR1751')
ELSE codigopv
END AS NVARCHAR(6)) AS COD_COMPAIA, dbo.histpesa.codigo, dbo.histpesa.codigod,
dbo.histpesa.codigovt,
dbo.histpesa.codigop, dbo.histpesa.pesoartic, dbo.histpesa.fechasale, dbo.histpesa.pesosalida,
CASE
WHEN (codigopv = 'tr0157' OR
codigopv = 'tr0000' OR
codigopv = 'pm0198' OR
codigopv = 'tr0685') THEN 0
ELSE netotrans
END AS netotrans, dbo.histpesa.cantsacos, dbo.histpesa.presentac, pesokilos,
dbo.histpesa.diferencia,
CASE
WHEN (pesoartic = 4 OR pesoartic = 6) THEN '01'
WHEN pesoartic = 1 THEN '03'
ELSE '11'
END AS codred,
CASE
WHEN valortra.kmsvt IS NULL THEN 0
ELSE valortra.kmsvt
END AS kmsvt
FROM dbo.histpesa FULL OUTER JOIN dbo.valortra ON HISTPESA.CODIGOVT =
VALORTRA.CODIGOVT
WHERE(dbo.histpesa.pesosalida <> 'N') AND (dbo.histpesa.pesoartic = 1 OR dbo.histpesa.pesoartic = 4 OR
dbo.histpesa.pesoartic = 6) AND (dbo.histpesa.codigo LIKE 'M%') AND
(dbo.histpesa.codigod = 'M12') AND (dbo.histpesa.codigop <> '' AND pesokilos IS NOT NULL)

Script extraccon de datos tabla pesaje


Con este script extraemos los datos necesarios desde la BDD de origen, tambin son tratados
y depurados, para ser cargados a la BDD temporal denominada Mantenimiento_DW en la
tabla DETALLE_PESAJE_MP.

SELECT
CASE
WHEN ROW_NUMBER() OVER (PARTITION BY ticketpeso
ORDER BY ticketpeso) = 1 THEN 1
ELSE 0
END num_transaccion, dbo.pesaje.ticketpeso, dbo.pesaje.placast,
CAST(CASE
WHEN codigopv = 'tr0000' THEN REPLACE(codigopv, 'tr0000', 'TR0157')
WHEN codigopv = 'TR0026' THEN REPLACE(codigopv, 'TR0026', 'TR1709')
WHEN codigopv = 'TR1498' THEN REPLACE(codigopv, 'TR1498', 'TR1751')
ELSE codigopv
END AS NVARCHAR(6)) AS COD_COMPAIA, dbo.pesaje.codigo, dbo.pesaje.codigod,
dbo.pesaje.codigovt,
dbo.pesaje.codigop, dbo.pesaje.pesoartic, dbo.pesaje.fechasale, dbo.pesaje.pesosalida,
CASE
WHEN (codigopv = 'tr0157' OR
codigopv = 'tr0000' OR
codigopv = 'pm0198' OR
codigopv = 'tr0685') THEN 0
ELSE netotrans
END AS netotrans, dbo.pesaje.cantsacos, dbo.pesaje.presentac, pesokilos, dbo.pesaje.diferencia,
CASE
WHEN (pesoartic = 4 OR
pesoartic = 6) THEN '01'
WHEN pesoartic = 1 THEN '03'
ELSE '11'
END AS codred,
CASE
WHEN valortra.kmsvt IS NULL THEN 0
ELSE valortra.kmsvt
END AS kmsvt
FROM dbo.pesaje FULL OUTER JOIN dbo.valortra ON pesaje.CODIGOVT = VALORTRA.CODIGOVT
WHERE(dbo.pesaje.pesosalida <> 'N') AND (dbo.pesaje.pesoartic = 1 OR
dbo.pesaje.pesoartic = 4 OR dbo.pesaje.pesoartic = 6) AND (dbo.pesaje.codigo LIKE 'M%') AND
(dbo.pesaje.codigod = 'M12') AND (dbo.pesaje.codigop <> '' AND pesokilos IS NOT NULL)

Procedimiento almacenado para crear la tabla tiempo.


create procedure Carga_Tiempo
as
begin
DECLARE @FechaDesde as smalldatetime, @FechaHasta as smalldatetime
DECLARE @FechaAAAAMMDD int
DECLARE @Ao as smallint, @Trimestre char(2), @Mes smallint
DECLARE @Semana smallint, @Dia smallint, @DiaSemana smallint
DECLARE @NTrimestre char(7), @NMes char(15)
DECLARE @NMes3l char(3)
DECLARE @NSemana char(10), @NDia char(6), @NDiaSemana char(10)
SET DATEFORMAT dmy
SET DATEFIRST 1

BEGIN TRANSACTION
SELECT @FechaDesde = CAST('20100101' AS smalldatetime)
SELECT @FechaHasta = CAST(CAST(YEAR(GETDATE())+2 AS CHAR(4)) + '1231' AS
smalldatetime)

WHILE (@FechaDesde <= @FechaHasta) BEGIN


SELECT @FechaAAAAMMDD = YEAR(@FechaDesde)*10000+
MONTH(@FechaDesde)*100+
DATEPART(dd, @FechaDesde)
SELECT @Ao = DATEPART(yy, @FechaDesde)
SELECT @Trimestre = DATEPART(qq, @FechaDesde)
SELECT @Mes = DATEPART(m, @FechaDesde)
SELECT @Semana = DATEPART(wk, @FechaDesde)
SELECT @Dia = RIGHT('0' + DATEPART(dd, @FechaDesde),2)
SELECT @DiaSemana = DATEPART(DW, @FechaDesde)
SELECT @NMes = DATENAME(mm, @FechaDesde)
SELECT @NMes3l = LEFT(@NMes, 3)
SELECT @NTrimestre = 'T' + CAST(@Trimestre as CHAR(1)) + '/' + RIGHT(@Ao, 2)
SELECT @NSemana = 'Sem ' +CAST(@Semana AS CHAR(2)) + '/' +
RIGHT(RTRIM(CAST(@Ao as CHAR(4))),2)
SELECT @NDia = CAST(@Dia as CHAR(2)) + ' ' + RTRIM(@NMes)
SELECT @NDiaSemana = DATENAME(dw, @FechaDesde)
INSERT INTO BI_Temporal.dbo.DIMENSION_TIEMPO
(

FechaSK,Fecha,Ao,Trimestre,Mes,Semana,Dia,DiaSemana,NTrimestre,NMes,NMes3L,NSemana,NDi
a,NDiaSemana
) VALUES
(

@FechaAAAAMMDD,@FechaDesde,@Ao,@Trimestre,@Mes,@Semana,@Dia,@DiaSemana,@
NTrimestre,@NMes,@NMes3l,@NSemana,@NDia,@NDiaSemana
)
SELECT @FechaDesde = DATEADD(DAY, 1, @FechaDesde)
END
COMMIT TRANSACTION
end
Go

Una vez listo nuestras vistas, continuamos con la creacin de los paquetes SSIS, que es
donde se disean los flujos de datos con diferentes conexiones organizadas, en este proyecto
creamos cuatro paquetes que son:
Paquete Extrae_Datos..- En este paquete extraemos los datos desde la DDB origen
Almacen_M12, de cada una de las tablas necesarias, adems incorporamos datos desde
tablas electrnicas de Excel son datos manejados por el departamento de logstica.
Flujo de control Extrae datos desde su origen.

Paquete Transforma_datos.- Con este paquete logramos incorporar datos a una DDB con
estructura de un datawarehouse, adems incorporamos claves forneas para mejorar el
rendimiento de bsqueda.
Flujo de control Transforma datos.

Procedimientos almacenados para cargar datos a la DDB DW_PRONACA.


Script Procedimiento almacenado CARGA_GESTIONLOG_MP.
create procedure CARGA_GESTIONLOG_MP
as
begin
insert into DW_PRONACA..HECHO_GESTIONLOG_MP
(
ID_VEHICULO,ID_COMPAIATRANS,ID_ARTICULO,ID_PROVEEDOR,ID_RUTA,ID_FECHA,I
D_REDTRANS,
ID_MOVIMIENTO,valor_flete,MERMAS,PESO_KILOS,KMS_RECORRIDO,CUENTA_REGISTRO
)
select
ID_VEHICULO,ID_COMPAIATRANS,ID_ARTICULO,ID_PROVEEDOR,ID_RUTA,COD_FECH
A,ID_REDTRANS,ID_MOVIMIENTO,
CASE
WHEN ID_COMPAIATRANS =4 AND NETO<>0 THEN 0
ELSE NETO
END AS NETO,
case
when diferencia < 0 then diferencia
else 0
end as DIFERENCIA,PESOKILOS,KMS_RECORRIDOS,CUENTA_REGISTRO

from Mantenimiento_DW..DETALLE_PESAJE_MP PE
inner join DIMENSION_VEHICULOS dv on pe.COD_PLACA=dv.PLACA_VEHICULO
inner join DIMENSION_COMPAIATRANS dco on
pe.COD_COMPAIA=dco.CODIGO_COMPAIATRANS
inner join DIMENSION_ARTICULO da on pe.COD_ARTICULO=da.COD_ARTICULO
inner join DIMENSION_PROVEEDOR pr on pe.COD_PROVEEDOR=PR.CODIGO_PROVEEDOR
inner join DIMENSION_TIPOMOVIMIENTO tm on
pe.COD_TIPOMOVIMIENTO=tm.CODIGO_MOVIMIENTO
inner join DIMENSION_TIEMPO dt on pe.COD_FECHA=dt.FECHA
inner join DIMENSION_RUTA rc on pe.COD_RUTA=rc.CODIGO_RUTA
inner join DIMENSION_REDTRANSPORTE rt on pe.COD_RED=rt.CODIGO_REDTRANS
end
go

Script Procedimiento almacenado CARGA_GESTIONLOG_PT.


create procedure CARGA_GESTIONLOG_PT
as
begin
insert into DW_PRONACA..HECHO_GESTIONLOG_PT
(
ID_VEHICULO,ID_COMPAIATRANS,ID_ARTICULO,ID_CLIENTE,ID_PROVEEDOR,ID_RUT
A,ID_FECHA,
ID_REDTRANS,ID_MOVIMIENTO,valor_flete,MERMAS,PESO_KILOS,KMS_RECORRIDO,CUE
NTA_REGISTRO
)
select
ID_VEHICULO,ID_COMPAIATRANS,ID_ARTICULO,ID_CLIENTE,ID_PROVEEDOR,ID_RUT
A,COD_FECHA,ID_REDTRANS,ID_MOVIMIENTO,NETO,
case when diferencia < 0 then diferencia
else 0
end as DIFERENCIA,PESOKILOS as CANT_NETA,KMS_RECORRIDOS,CUENTA_REGISTRO

from Mantenimiento_DW..DETALLE_PESAJE_PT PE
inner join DIMENSION_VEHICULOS dv on pe.COD_PLACA=dv.PLACA_VEHICULO
inner join DIMENSION_COMPAIATRANS dco on
pe.COD_COMPAIA=dco.CODIGO_COMPAIATRANS
inner join DIMENSION_ARTICULO da on pe.COD_ARTICULO=da.COD_ARTICULO
inner join DIMENSION_PROVEEDOR pr on pe.COD_PROVEEDOR=PR.CODIGO_PROVEEDOR
inner join DIMENSION_CLIENTE dc on pe.COD_CLIENTE=dc.CODIGO_CLIENTE
inner join DIMENSION_TIPOMOVIMIENTO tm on
pe.COD_TIPOMOVIMIENTO=tm.CODIGO_MOVIMIENTO
inner join DIMENSION_TIEMPO dt on pe.COD_FECHA=dt.FECHA
inner join DIMENSION_RUTA rc on pe.COD_RUTA=rc.CODIGO_RUTA
inner join DIMENSION_REDTRANSPORTE rt on pe.COD_RED=rt.CODIGO_REDTRANS
end
go

Script Procedimiento almacenado CARGA_NI VELSERVICIO


create procedure CARGA_NIVELSERVICIO
as
begin
declare @cumplimiento float
insert into DW_PRONACA..HECHO_NIVELSERVICIO
(
ID_CLIENTE,ID_articulo,fecha,insuficiencia,cumplimiento,a_tiempo,OTIF
)
select
ID_CLIENTE,ID_ARTICULO,fecha_pedido,
case when Cant_Despachado>Cant_Pedidos
then 0 else(Cant_Pedidos-Cant_Despachado)
end as Insuficiencia,
case when Cant_Despachado>=Cant_Pedidos
then 1
else round(Cant_Despachado/Cant_Pedidos,2)
end as cumplimiento,
case when Fecha_despachado<=fecha_pedido
then 1
else 0
end as a_tiempo,
((case when Cant_Despachado>=Cant_Pedidos
then 1
else round(Cant_Despachado/Cant_Pedidos,2)
end)*(case when Fecha_despachado<=fecha_pedido then 1 else 0
end)) AS OTIF

from Mantenimiento_DW..DETALLE_PEDIDOS_PT DP
INNER JOIN DIMENSION_CLIENTE DC ON DP.Cod_Cliente=DC.CODIGO_CLIENTE
INNER JOIN DIMENSION_ARTICULO DR ON DP.Cod_articulo=DR.COD_ARTICULO
INNER JOIN DIMENSION_TIEMPO dt on dp.fecha_pedido=DT.Fecha
order by fecha_pedido
end
go

Paquete Carga_datos.- En este paquete actualizamos nuestros cubos por medio de una tarea
de procedimiento de Analisis Services.
Paquete ETL.- En este paquete demostramos la lgica inherente a un proyecto de
Extraccin, Transformacin y Carga (ETL). ETL es un proyecto que, por naturaleza, es
dividido en tres etapas: la primera etapa es responsable de extraer los datos de orgenes, la
segunda etapa es responsable de la aplicacin de varias transformaciones, como la calidad
de datos y las reglas del negocios, y la ltima etapa es responsable de cargar los datos de
origen transformados al destino.
Por ello hemos configurado este paquete (ETL) como el padre de los paquetes hijos
(extrae_datos, transforma_datos, carga_datos).
ANEXO 3 Carga de datos ejecutando el proceso ETL.
Extraccin de datos.- La extraccin de los datos se lo realizar con la herramienta
Integration Services mediante sentencias SQL a las tablas de la base origen. Como resultado
devolver todos los registros de acuerdo a la tabla consultada debido a que es el proceso de
carga inicia.
Flujo de control extrae datos artculo.

Flujo de control extrae datos clientes

Flujo de control extrae datos vehculos.

Flujo de control extrae datos red_transporte.


Flujo de control extrae datos pesaje y histpesa gestin producto terminado.

Flujo de control extrae datos pesaje y histpesa gestin materia prima.

ANEXO 4 Diagrama de flujo del funcionamiento del ETL por cada dimensin y tablas
de hecho.
Plan ETL Dimension Artculos

Plan ETL Dimension Clientes

Plan ETL Dimensin Compaa de transporte

Plan ETL Dimensin Proveedores


Plan ETL Dimension Tipo de movimiento

Plan ETL Dimension Vehculos

Plan ETL Dimension Ruta recorrido

Plan ETL Dimension Red transporte


Plan ETL Tabla de Hecho Gestin logstica materia prima.
Plan ETL Tabla de Hecho Gestin logstica abastecimiento y distribucin de producto
terminado.
Plan ETL Tabla de Hecho Nivel de servicio OTIF.

ANEXO 5 Diseo e implementacin de un cubo.


Este manual de usuario est enfocado en todos los pasos tcnicos que se debe realizar para
una creacin y una publicacin de un cubo de informacin para un anlisis OLAP.
Interface de usuario.
Para empezar debemos crear nuestro proyecto de Analysis Services.

Creamos la conexin a la fuente de datos, que es la base de datos donde se encuentran


nuestros datos:
Configuramos la conexin al servidor de base de datos:

Definimos que tipo de credenciales usar Analysis Services para conectarse a la fuente de
datos, usaremos la cuenta del servicio

Ya tenemos la conexin a nuestra fuente de datos, ahora vamos a crear la Vista, con la cual
podemos especificar las tablas a usar para nuestro cubo, crear campos calculados, etc...

Seleccionamos la fuente de datos.


Seleccionamos las tablas de Hechos, que sern nuestros grupos de medidas para nuestro
cubo:

Luego seleccionamos las tablas relacionadas a cada tabla de Hecho, si las tablas tienen bien
definidas todas las claves primarias y forneas podemos simplemente usar el botn "Agregar
tablas relacionadas".

Esta lista nuestra vista de fuentes de datos.


Ahora continuamos creando las dimensiones:

A partir de tablas existentes en nuestra Vista de Fuente de Datos:

Seleccionamos los atributos que se visualizaran en nuestra dimensin:

De esa manera ya tenemos creadas nuestras dimensiones.


Una vez creados todas la dimensiones. Podemos continuar creando el cubo.

Usando las tablas de Hechos de nuestra Vista de Fuente de Datos creada:

Seleccionamos las tablas de hecho que va a ser nuestro grupo de medidas.

Seleccionamos las dimensiones a incluir en el cubo:


Listo!, ahora ya podemos procesar nuestros cubo, para esto configuremos la
implementacin.

Ya podemos consultar la informacin de nuestro cubo, cruzando dimensiones y medidas


desde el browser del Analysis Services

ANEXO 6 Creando conexin OLAP desde Microsoft Excel a SQL Server de Analysis
Services.
1. Crear conexin de Excel a un cubo de SQL Server de Analisys Services

2. Conectar con el servidor de la base de datos.- Aqu se escribe el nombre del servidor
donde se encuentra diseado el cubo OLAP.
3. En credenciales de conexin.
Para usar el nombre de usuario y la contrasea actuales de Windows, haga clic en
Usar autenticacin de Windows.
Para escribir el nombre de usuario y la contrasea de una base de datos, haga clic en
Utilizar el nombre de usuario y la contrasea siguientes y, a continuacin, escriba el
nombre de usuario y la contrasea en los cuadros de texto Nombre de usuario y
Contrasea correspondientes.
En este caso seleccionamos la primera opcin.

4. Seleccionar la base de datos y el cubo que requiera.- Seleccionamos la base de datos


que contiene la informacin requerida, como tambin la tabla o cubo.

5. Guardar el archivo de datos y finalizar.- Guardamos el archivo de conexin dando un


nombre y colocando la ruta que deseemos.
6. Seleccionar como desea ver los datos en el libro de Excel.- Y para finalizar
seleccionamos la forma como queremos ver la informacin en una hoja de Excel.

También podría gustarte