Está en la página 1de 11

BASE DE DATOS ESTRATGICAS

LABORATORIO DISEO DEL DATAWAREHOUSE POBLAMIENTO DEL DATAWAREHOUSE MEDIANTE TRANSACT-SQL


Contenido 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. La informacin estratgica en una organizacin Data warehouse Datawarehouse(OLAP) vs. Bd transaccional(OLTP) Estructura de la bd multidimensional Diseo del almacn de datos Caso de ejemplo Base de datos multidimensional northwind_mart Poblamiento sin verificar los datos en el destino Poblamiento verificando los datos en el destino Generacin de vistas para el poblamiento de dimensiones Script de poblamiento de la dimensin de tiempo Script de poblamiento de la tabla de hechos

Ing. Heber Abanto Cabrera habantoc@upao.edu.pe

2009 - II

LA INFORMACIN ESTRATGICA EN UNA ORGANIZACIN La administracin de la informacin planea, organiza, dirige y controla efectivamente a los datos como un recurso global de la empresa. Beneficios: Apoyar las estrategias y la operacin del negocio con informacin oportuna, relevante y de calidad. Mejoras en la integracin de los datos, para apoyar mejor a la organizacin. Mejor atencin al usuario, al mejorar la productividad del desarrollo de sistemas de informacin. Incremento en la calidad, la consistencia y el conocimiento de los datos DATA WAREHOUSE sistema construido para soportar decisiones que utiliza un almacenamiento de datos separado de los sistemas operacionales, aunque stos lo alimentan. Data Mart: Datawarehouse a baja escala, que apoya a un rea particular, y no a la empresa completa

S i s te m a s d e G ER E N C I A Sistemas de Soporte informacin EIS DSS de Decisin Ejecutivo


Informacin estratgica

Base de Datos Estratgicas (DataWarehouse)

Informacin operativa
RECURSOS HUMANOS PRODUCCION VENTAS

FINANZAS

BD para el procesamiento de transacciones

OPERACIONES

DATAWAREHOUSE(OLAP) VS. BD TRANSACCIONAL(OLTP ) Caractersticas Tamao Fuente Actualizacin Tiempo Carga Actividades Procesamiento Estructura OLTP Megabytes Internas Transacciones Actual Predecible Operacional Pocos registros Relacional Gigabytes Internas y Externas Batch Histrico Ad-hoc Analtica Masivo y complejo Multidimensional OLAP

ESTRUCTURA DE LA BD MULTIDIMENSIONAL Tabla de Hechos : Almacena las medidas numricas del negocio. cada medida es el conjunto de valores cuantitativos de una columna de la tabla de hechos y representa la interseccin de las dimensiones. Tabla de dimensiones : Almacena la descripcin textual y cualitativa de las dimensiones. Mejores atributos: textuales, discretos y son fuente para restricciones y encabezados

Tabla de dimensin

Tabla de hechos

Tabla de dimensin

Atributos
(caracteristicas)

Medidas
(cantidades)

Atributos
(caracteristicas)

Joins Mltiples

DISEO DEL ALMACN DE DATOS Modelamiento Escoger el proceso del negocio a modelar. Escoger el granulo (tamao) para determinar el nivel de detalle de representacin del proceso Escoger las dimensiones que caracterizarn el proceso Escoger los hechos medidos que almacenaran la informacin del proceso

z z

Recoleccin y anlisis de requerimientos

Fuentes de datos necesarias internas y externas Requisitos de usuario

Diseo conceptual

Medidas y atributos

z z

Diseo lgico especfico

Esquema Estrella o Copo de Nieve

Diseo fsico

Estructura Multidimensional

Implementacin

Preparacin de las vistas de usuario (herramienta OLAP)

CASO DE EJEMPLO DESCRIPCIN DE LA EMPRESA La base de datos relacional contiene informacin de las ventas de la corporacin NorthWindTraders, que importa y exporta artculos alrededor del mundo La Base de Datos NorthWind soporta el sistema de ordenes de pedido que contiene las siguientes Tablas:

El Administrador de NorthWind desea incrementar su habilidad para analizar datos enfocando las tendencias que le permitan tomar decisiones sobre las ventas del negocio

Paso 1. Elegir un proceso de la organizacin para modelar La actividad a modelar son las ventas desde que el cliente solicitud los productos hasta que el empleado enva el pedido. Paso 2. Decidir el nivel de detalle Se requiere tener informacin sobre las ventas de cada producto a los respectivos clientes por periodos de tiempo, adems se necesita saber que empleado atendi la venta y como se envi. Paso 3. Identificar las dimensiones que caracterizan el proceso. Tiempo cundo se produce la venta? (dia, mes, trimestre, semestre, ao) Producto cul es el producto vendido? (nombre, categora, proveedor) Envo Cmo se realizo el envo? (nombre) Cliente Quin compr? Empleado Quin atendi la venta? (nombre y apellido, fecha de contratacin) Paso 4. Decidir la informacin estrategica a analizar del proceso. Cantidad de productos vendidos Descuentos otorgados Importe Total de la venta (lnea total del tem) Costo del flete por enviar el producto al cliente Algunas de la medidas son datos precalculados y que se realizaran al momento de hacer la transformacin de los datos por ejemplo:

DIMENSIN CLIENTE

DIMENSION TRANSPORTISTA

DIMENSIN EMPLEADO

DIMENSION PRODUCTO

DIMENSION TIEMPO

TABLA DE HECHOS

BASE DE DATOS MULTIDIMENSIONAL NORTHWIND_MART

POBLAMIENTO SIN VERIFICAR LOS DATOS EN EL DESTINO

POBLAMIENTO VERIFICANDO LOS DATOS EN EL DESTINO METODO DE LIMPIEZA TOTAL

METODO INCREMENTAL

GENERACIN DE VISTAS PARA EL POBLAMIENTO DE DIMENSIONES

SCRIPT DE POBLAMIENTO DE LA DIMENSION DE TIEMPO

10

SCRIPT DE POBLAMIENTO DE LA TABLA DE HECHOS

REFERENCIAS Libros en pantalla de SQL Server 2008 http://msdn.microsoft.com/es-es/library/ms130214.aspx

11

También podría gustarte