Está en la página 1de 37

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERU

ESCUEA DE POSTGRADO
MAESTRIA EN INGENIERIA DE SISTEMAS

TOPICOS EN INGENIERIA DE SISTEMAS

DATAWAREHOUSING

Docente: Mg. Alberto Un Jan

Integrantes:
Carhuamaca Vilchez Denis
Guerrero Parejas Carlos
Hilario Chanco Rosario
Mallqui Shicshe Maria A

Huancayo – Perú

2007
NEX T
DATAWAREHOUSE

• Es un modelo de base de datos, perfectamente


estructurado y depurado, para apoyo al análisis y la
toma de decisiones.
• Separado del entorno operacional y creado a partir del
mismo y de datos complementarios.
• Integrado como base de un modelo de negocio o área del
mismo.
• Enriquecido por periodos de tiempo determinados en
cuyo momento representa una visión puntual y completa
del mismo.
• Orientado a un área o problema específico.
• No volátil, en la medida que no puede modificarse de
forma unitaria en un elemento concreto.
• Accesible para usuarios con poca experiencia y poco
conocimiento de sistemas informáticos.
DATAWAREHOUSE
Características de un DW

Es orientado a sujetos

Los datos son integrados


Características de un DW

Es variante en el tiempo
Es simple de manejar
No volátil
DATAMART
Es un pequeño almacén de datos, diseñado para una unidad
de negocio.
Un Data Mart está enfocado a una sola área o grupo de
usuarios, mientras que un DW contiene información de
diferentes sujetos y áreas de la corporación.
Una organización puede tener un sólo DW, pero varios Data
Marts.
Los Data Marts no contienen información almacenada como
datos operacionales, pero si la tienen los DWs
Data Marts

Sales

Data Service
Service
Warehouse

Other
TIPOS DE DATA MART

DATAMART DEPENDIENTES

DATAMART INDEPENDIENTES
DATAWAREHOUSING

Es el proceso de integrar datos corporativos de la empresa en


un solo repositorio.

Data Marts
y Cubos
Sistemas Fuentes

Data Clientes
Warehou
se

Query Tools
Reportes
Análisis
Data Mining
CUBO

Es una estructura de datos multidimensional, se definen


mediante un conjunto de medidas y dimensiones

OLAP
Lima
“Muéstrame las
ventas de Arequipa
zapatos que se

es
vendieron en

ud s
or
Piura

de ole
Huancayo en la

s
semana 24”

00 0
6, ,00
Huancayo

0
34 00
Ropa

3

Zapatos Cuzco
Sombreros
Bicicletas

03 10 17 24
Semana Termina
Conformación del Cubo

Dimensiones

Representan los criterios de análisis de los datos, macro-objetos


del problema y variables independientes.
Tiempo (dimensión temporal: ¿cuándo se produce la
actividad?)
Producto (dimensión ¿cuál es el objeto de la actividad?)
Almacén (dimensión geográfica: ¿dónde se produce la
actividad?)
Cliente (dimensión ¿quién es el destinatario de la actividad?)
Medida

Son un dato numérico que representa una actividad específica


de un negocio.
importe total de las ventas del producto en el día
número total de unidades vendidas del producto en el día
número total de clientes que han comprado el producto en el
día
TIPOS DE TABLAS
TABLA DE HECHOS (FACT TABLE)
Es la tabla central en un esquema dimensional. Es en ella donde
se almacenan las mediciones numéricas del negocio.
La clave de la tabla fact recibe el nombre de clave compuesta o
concatenada debido a que se forma de la composición (o
concatenación) de las llaves primarias de las tablas
dimensionales a las que está unida.
tabla de
hechos
tabla 3 tabla
Dimensión Dim1 id_dim1 Dim Dimensión
1 id_dim2 3

tabla 2 id_dim3
Dim n tabla
Dimensión
... Dim Dimensión
2
n
id_dim n
....
(hechos)
TABLAS LOCK-UP O DIMENSIONALES
Estas tablas son las que se conectan a la tabla fact, son las que
alimentan a la tabla fact. Una tabla lock_up almacena un
conjunto de valores que están relacionados a una dimensión
particular.
TABLA DIMENSIÓN TIEMPO
Virtualmente se garantiza que cada DW tendrá una tabla
dimensional de tiempo, debido a la perspectiva de
almacenamiento histórica de la información.
MODELAMIENTO DE DW

MODELO ESTRELLA (STAR SCHEMA)

El modelo multidimensional también se conoce con el nombre


de esquema estrella, pues su estructura base es similar: una
tabla central y un conjunto de tablas que la atienden
radialmente. El centro de la estrella consiste de una o más
tablas fact, y las puntas de la estrella son las tablas lock_up.
(Tablas desnormalizadas)
MODELO COPO DE NIEVE (SNOWFLAKE SCHEMA)

Las tablas lock_up en el esquema snowflake están


normalizadas. Cada tabla lock_up contiene sólo el nivel que es
clave primaria en la tabla y la foreign key de su parentesco del
nivel más cercano del diagrama.
(Tablas normalizadas)
INTELIGENCIA DE DATOS EN LA EMPRESA
MULTINACIONAL “DEXUR” E. I. R. Ltda.

PROBLEMA DE INVESTIGACIÓN

PLANTEAMIENTO DEL PROBLEMA.

DEXUR, posee solo un sistema operacional, este que reflejan


la evolución de la empresa a lo largo del tiempo, claro que
también maneja una información en forma “Artesanal” en
papeles e inventarios documentados, facturas, boletas, etc.,
sus éxitos y fracasos están en esa montaña de información
sobre la cual está estructurada la empresa

PROBLEMA GENERAL

¿Cómo transformar toda esa información de una manera


rápida, para el mejoramiento de las tomas de decisiones a la
empresa aprovechando toda esta información contenida en el
sistema operacional de modo que ayuden a encontrar las
claves para que los ejecutivos definan las estrategias en el
Área comercial posicionando a DEXUR en el liderazgo como
empresa distribuidora al por mayor y menor de productos en el
centro de el Perú ?
OBJETIVOS

OBJETIVO GENERAL

Desarrollar un Sistema de Gestión de la Información dedicado


al Manejo de Información Gerencial y Comercial de DEXUR,
para ayuda a la toma de decisiones en esta empresa
aplicando Datawarehousing y Business Intelligence
(Datamining) para la estructuración de la información y la
obtención del conocimiento relativos a mercados, clientes,
proveedores y productos con los que la empresa podrá
generar utilidades y añadir valor agregado a sus actividades.
OBJETIVOS ESPECIFICOS

Aplicar el Modelamiento multidimensional para la


estructuración de la información comercial y posteriormente
hacer un análisis OLAP y aplicar modelos de Datamining.
Aplicar software adecuado para la empresa que haciendo el
análisis coste/beneficio sea muy productivo para esta.
DISEÑO Y CONSTRUCCION DEL DATAWAREHOUSE

BASE DE DATOS ORIGINAL EN ACCESS

E:\TESIS_MA\INTELIGENCIA\datamining\Da
\SABD.mdb

Datawarehouse
PAQUETE DE TRANSFORMACIÓN DE DATOS DE LA BASE DE
DATOS EN ACCESS HACIA EL DATAWAREHOUSE EN SQL
DATA WAREHOUSE EN SQL
MODELAMIENTO DEL DATAWAREHOUSE

1.- DIMENSIONES DEL DATA MART

Origen_venta

Tiempo_dim
Paises_dim

Bloques_Fact

Clientes_dim Productos_dim
Fact table: Ventas_Fact
CONSTRUCCIÓN DE LOS CUBOS
OLAP

Para construir Cubos OLAP se carga el Analysis Services de


SQL Server y se ejecuta el Analysis Manager del Analysis
Services
Creamos el origen de datos y configuramos aquí el proveedor
y la conexión a usar en nuestro caso es el Microsoft OLE DB
provider for SQL Server. El servidor Local y la base de datos
EXPO_DW.
Seleccionamos la Tabla de
Hechos
Seleccionamos las medidas
Creamos las dimensiones
Definimos el modelamiento a usar
Generamos el cubo y
Analizamos los datos previamente
Generamos el cubo y seleccionamos el tipo de Almacenamiento a Usar
Seleccionamos el tipo de almacenamiento
Procesamos el Cubo
QUERY & REPORTING

Para realizar los reportes utilizamos el Programa Microsoft Excel 2003


Generamos la conexión al proveedor OLAP
Seleccionamos la DW_ventas
Reportes generados en Microsoft Excel
2003
Gracias por la atención prestada.