Está en la página 1de 11

ESCUELA DE POST GRADO

MAESTRÍA EN INGENIERÍA DE
SISTEMAS

DATAWAREHOUSING

Docente:
Mg. Un Jan

Integrantes:

 Carhuamaca Vilchez Denis


 Guerrero Parejas Carlos
 Hilario Chanco Rosario
 Mallqui Shicshe Maria A

Huancayo - Perú
2007

DEDICATORIA

A todas aquellas personas

con espíritu triunfador,

Que aman, trabajan, aprenden,

Actúan, viven, sirven, buscan el éxito.

Aportan al desarrollo de Perú

Poniendo en acción proyectos

Que benefician a las mayorías


RESUMEN

La compañía en la cual está inmerso este caso, es una empresa del área de
Servicios Múltiples. El giro del negocio de la empresa se enfoca a la venta de productos de
Albañilería, limpieza y automoción.
A la fecha esta empresa se encuentra desarrollando un cambio tecnológico a nivel de toda
la organización, pues ha definido la tecnología como uno de los pilares para la
implementación de su misión organizacional.

Este trabajo se enfoca al área de Ventas, encargada de proveer información del


negocio en forma mensual, a los niveles gerenciales y a los dueños de la compañía. Este
comportamiento queda reflejado en informes con los movimientos de activos y pasivos
generados durante el mes, y con el contraste de ellos, con los presupuestos anuales y
mensuales definidos. Esta información ayuda en la identificación de nuevas áreas de
inversión, como también en los riesgos asumidos tanto a corto, mediano y largo plazo por
la compañía.

Para la generación de estos informes, la compañía debe rescatar toda la


información generada de todas sus sedes durante un mes (venta de productos y gastos,
inversiones nuevas, etc.) y contrastarla con el presupuesto de la compañía.

Las fuentes de información corresponden a todos los Sistemas Operacionales que


soportan el negocio, la mayoría de ellos en proceso de renovación tecnológica, además de
la generación de información manual a partir de los datos operacionales. Dado este
contexto, el objetivo del presente trabajo es crear un DataWareHouse que resuma la
información de análisis del negocio y permita generar informes de gestión, utilizando para
ello la herramienta Microsoft SQL Server. Como parte del proyecto, se construirán los
extractores de información o ETL’s, y se poblará el modelo definido para el
DataWareHouse. Sobre este último se crearán los cubos de gestión

ABSTRACT

The company, in which this case is immersed, is a multiple service company. The
company's line of business focuses for sale of construction products, cleanliness and
automotive industry.
To date, this company is developing a technological change through out all the
organization, because it has defined as one of the organization’s main mission, the state of
the art technological support for the business.

The area were this document was focused in is the Sales Area, which is in charge
of providing the information relative to the business behavior, on a monthly basis, to the
management levels and to the company owners. This behavior is stated in reports of assets
and liabilities movements, generated monthly and are compared to the month and annual
budgets. This information helps to identify new investments areas, and the assumed short
term, middle term and long term risks for the company.

To generate the reports, the company has to gather all the information delivered by
different financial means during a month (product and services sales, expenses, new
investments, and so on) and are compared to the company budget.

The information sources are all the operational systems that support the business;
most of them are currently in a technological renewal process. Other sources are the
manual information generated from operational data.
In this context, the objective of the current assignment is the creation of a DataWareHouse
that summarizes the business analysis information, which will allow the management
report generation with the Microsoft SQL Server 2000 tool. As part of this project, it will
be built the ETL’s (extraction, transformation and load) and the defined model will be
populated for the DataWareHouse. On top of this, the management cubes will be created.
INDICE
Pág.

INDICE I
CARATULA II
DEDICATORIA III
INTRODUCCION
IV
RESUME
V
ABSTRACT VI

CAPITULO I
DATAWAREHOUSE:
DEFINICIONES PRELIMINARES

1.1 Datawehouse 1
1.2 Objetivos 2
1.3 Características 2
1.4 Justificación para la Construcción de un DW 4
1.5 Datamart 5
1.5 Tipos de Datamart
6
1.5.1.1 Datamart Dpendiente
6 1.5.1.1.1 Ventajas
6
1.5.1.1.2 Inconvenientes 6
1.5.1.2 Datamart Independientes 7
1.5.1.2.1 Ventajas
7
1.5.1.2.2 Inconvenientes 8
1.6 Terminología DW 8

CAPITULO II
DATAWAREHOUSING:
ALMACENES DE DATOS
2.1 Datawarehousing 10
2.2 Cubo
10
2.2.1 Conformación de un Cubo
11
2.3 Tipos de Tablas
12
2.3.1 Tabla De Hechos
12
2.3.2 Tablas Lock-Up o Dimensionales
13
2.3.3 Tabla Dimensión Tiempo
13
2.4 Modelamiento de un Datawarehouse 13
2.4.1 Modelo Estrella
14
2.4.1.1 Pasos Para El Diseño De Un Star Schema 14
2.4.2 Modelo Copo De Nieve
14

CAPITULO III
INTELIGENCIA DE DATOS EN
LA EMPRESA DEXUR E.I.R.Ltda

3.1 Problema de Investigación 16


3.1.1. Planteamiento del Problema 16
3.1.2. Formulación del Problema 16
3.1.2.2.1 Problema General
16
3.1.2.2.2 Problemas Específicos
17
3.1.3 Objetivos
17
3.1.3.1 Objetivo General 17
3.1.3.2 Objetivos Específicos 17
3.1.4 Justificación 18
3.2 Diseño y Construcción del Datawarehouse
18
3.2.1 Base de Datos Original en Access 18
3.2.2 Paquete de Transformación de Datos de la Base de Datos en Access
Hacia el Datawarehouse en SQL
19
3.2.3 Descripción de las Tablas del Esquema
19
3.3 Datawarehouse en SQL
19
3.3.1. Descripción de las Tablas del Esquema
20
3.4 Modelamiento del Datawarehouse 24
3.4.1 Dimensiones del DataMart
24
3.4.1.1 Descripcion de las Dimensiones
25
3.4.1.2. Detalle de la Dimensiones
26
3.4.1.3 Detalle de la Tabla De Hechos 29
3.5 Elaboración de la Tabla de Hechos
30
3.5.1 Tabla Bloques Ventas_Fact
30
3.5.2 Tablas Dimesionales
32
3.6 Construcción de los Cubos Olap
34
3.6.1 Proceso de Construcción de un Cubo Olap
34
3.7 Query & Reporting 39

CONCLUSIONES
42
RECOMENDACIONES 43
REFERENCIAS 44
INTRODUCCION

Hoy en día, las necesidades de información de las empresas han variado desde el
punto de vista estratégico, la necesidad de disponer de gran cantidad de información es
vital para los negocios ya que las decisiones de futuro se suelen tomar sobre la base de
dicha información. Este aspecto obliga a la aparición de una nueva estructura en la
información: el Data Warehouse.

El objetivo del DW es el de satisfacer los requerimientos de información interna de


la empresa para una mejor gestión. El contenido de los datos, la organización y estructura
son dirigidos a satisfacer las necesidades de información de los analistas y usuarios
tomadores de decisiones. El DW es el lugar donde la gente puede acceder a sus datos.

Los almacenes de datos o Datawarehouse generan bases de datos tangibles con una
perspectiva histórica, utilizando datos de múltiples fuentes que se fusionan en forma
congruente. Estos datos se mantienen actualizados, pero no cambian al ritmo de los
sistemas transaccionales.

Muchos datawarehouses se diseñan para contener un nivel de detalle hasta el nivel


de transacción, con la intención de hacer disponible todo tipo de datos y características,
para reportar y analizar. Así un datawarehouse resulta ser un recipiente de datos
transaccionales para proporcionar consultas operativas, y la información para poder llevar a
cabo análisis multidimensional. De esta forma, dentro de un datawarehouse existen dos
tecnologías que se pueden ver como complementarias, una relacional para consultas y una
multidimensional para análisis.

La presente tesina pretende describir los elementos necesarios para implementar


con éxito un sistema que permita a los usuarios de DEXUR disponer de la información, a
fin de que logren tomar decisiones con todas las herramientas para actuar ante la
complejidad del mercado, las necesidades de los clientes y la competencia.
El primer capitulo brinda un marco teórico de Datawarehouse, su importancia y su
estructuración.
Luego de tener en claro las definiciones básicas del almacenamiento de datos, en el
segundo capitulo explicamos el proceso de datawarehousing, que nos permite obtener
estos datos e integrarlos en un repositorio organizacional para luego acceder a ellos y hacer
real la Gestión del Conocimiento.

En el capitulo final veremos un caso de aplicación de esta tecnología “Data


Warehousing” en el desarrollo de una solución para la toma de decisiones en el Área de
Ventas de la empresa DEXUR.