Está en la página 1de 18

DATAWAREHOUSE

Datawarehouse (Almacen de datos) se define como una coleccin de datos que verifican las siguientes propiedades:
Est orientado (a un tema) a objetos
Datos integrados No voltiles Variante en el tiempo

que surgieron como una herramienta de soporte para la toma de decisiones a nivel gerencial
2

Orientado hacia temas: los datos se almacenan y agrupan por temas de inters.

Datos integrados: el almacn de datos integra datos que provienen de varias fuentes. Partimos de una base de datos (operacional) y mediante un proceso de carga de datos hacemos el Datawarehouse. El proceso de carga es lo ms complicado por problemas de codificacin, medidas de los atributos de las bases de datos. BD
DW BD
CARGA

BD

No voltiles: son estables, una vez CARGA almacenados los datos no se modifican.
UPDATE

SELECT

INSERT

BD
DELETE

DW

DW

REPORTS

SELECT

Variante en el tiempo: los datos contienen informacin sobre la fecha de los mismos, porque se hacen cargas de datos continuamente. Cuando los datos van cambiando, se actualizan los histricos y se guardan en ficheros temporales. Siempre va haber una variable tiempo.
TIEMPO # id_tiempo * periodo

Podemos resumir las caractersticas de un Datawarehouse:


Trabaja con datos de negocio

Orientado a un sujeto
Almacena datos actuales orientado a un

histrico (actual + histrico) Datos ms bien resumidos (no informacin detallada)

BD OPERACIONAL Datos operacionales Orientado a aplicaciones Datos Actuales Datos Detallados Datos en continuo cambio

DATAWAREHOUSE Datos de negocio Orientado al sujeto Actuales + Histrico Datos Resumidos Datos Estables

Partimos de una BD operacional y se basa en 3 mdulos

BD operacional

GESTOR CARGA

GESTOR ALMACENAMIEN TO

GESTOR CONSULTAS

Permite hacer la carga. Como dificultades nos podemos encontrar:


La integracin de los datos

Eleccin del momento de la carga


El tiempo de carga sea el mnimo posible Buen diccionario de datos o METADATA (para

evitar cometer errores en la carga) Diseo de procedimientos PL/SQL

10

Se encarga del almacenamiento, de la estructura,. Existe una tabla llamada FACT (Hecho) y unas tablas llamadas dimensiones o tablas dimensionales. Entre la tabla FACT y las tablas dimensionales suele haber relaciones 1:N Este modelo tiene forma de estrella por eso se denomina MODELO STAR

11

DIM_TIEMPO
# PK4

DIM_1
# PK1

FACT DIM_3
# PK3 # PK1 # PK2 # PK3 # PK4 *campoA *campoB

DIM_2
# PK2

12

Las consultas se hacen sobre la tabla FACT. Tambin se encarga de los perfiles, pues las consultas (reports) sern diferentes dependiendo del usuario y sus necesidades.

13

14

Por lo tanto ante la imperante necesidad de obtener informacin confiable casi en tiempo real la utilizacin de un sistema de Data Warehouse se considera hoy da como una herramienta primaria no solo en las empresas globales sino inclusive en las PYMES.

15

Las razones bsicas de porque una organizacin implementa Data Warehouse: a) Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y discos que no son utilizados por sistemas de proceso de transacciones. b) Para utilizar modelos de datos o tecnologas de servidores que agilizan los queries y reportes, y que no son apropiados para los procesos de transacciones. c) Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los aspectos tcnicos de tecnologa de bases de datos es requerida para escribir y mantener queries y reportes. d) Para proveer un almacn del sistema de proceso de transacciones limpio que puede ser reportado y que no necesariamente requiere que se arregle el sistema de proceso de transacciones. e) Para hacer los queries y reportes de datos bsicamente ms fcil de los mltiples procesos de transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el propsito de hacer queries y reportes.
16

Ventajas de Data Warehouse: a) Proporciona informacin clave para la toma de decisiones empresariales. Mejora la calidad de las decisiones tomadas. b) Especialmente til para el medio y largo plazo. c) Son sistemas relativamente sencillos de instalar si las fuentes de datos y los objetivos estn claros. d) Muy tiles para el almacenamiento de anlisis y consultas de histricos.
Desventajas: a) No es muy til para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir. En cualquier caso la tendencia de los productos actuales (junto con los avances del hardware) es la de solventar este problema convirtiendo la desventaja en una ventaja. b) Requiere de continua limpieza, transformacin e integracin de datos. c) En un proceso de implantacin puede encontrarse dificultades ante los diferentes objetivos que pretende una organizacin. d) Una vez implantado puede ser complicado aadir nuevas fuentes de datos.
17

Sectores donde se ha implantado Data Ware House Los sectores donde principalmente se ha implantado data warehouse son los siguientes: Empresas de telecomunicaciones. Disponen de datos de millones de clientes, llamadas, acciones de marketing, facturas, servicios, etc. Telefnica mviles es un claro ejemplo de este tipo de compaas adems de Jazztel, Vodafone, France Telecom... Empresas de transporte. Aerolneas, Transporte de Cargas, Transporte de Pasajeros... entre ellas British Airways, Union Pacific, Air France, etc. Turismo. Centrales de Reservas, Cadenas Hoteleras, Agencias de Viajes... Empresas de fabricacin de bienes de consumo masivo. Entre ellas Coca-Cola, Adidas, Nike, 3M, Bosh Siemens, prcticamente todas las empresas de fabricacin de automviles, etc. Entidades Financieras. BBVA, Caja Madrid, Caja Extremadura y en general la practica totalidad de las que conocemos. Comercio Minorista. Corte Ingls, Cortefiel, Eroski entre otros. - Administracin del Estado. Empresas Aseguradoras. Casi todas las importantes que todos conocemos. Organizaciones de Atencin Sanitaria. Sector en aumento. La caracterstica comn de todas ellas es el gran volumen de informacin que genera su operativa, fundamentalmente en lo relativo a clientes finales.
18