Está en la página 1de 17

DATAWAREHOUSE

DIEGO GALARRAGA
8 INFORMÁTICA
Definición

• Datawarehouse (Almacen de datos) se


define como una colección de datos que
verifican las siguientes propiedades:
– Está orientado (a un tema) a objetos
– Datos integrados
– No volátiles
– Variante en el tiempo
que surgieron como una herramienta de
soporte para la toma de decisiones a nivel
gerencial
2
Se puede caracterizar un data warehouse
haciendo un contraste de cómo los datos
de un negocio almacenados en un data
warehouse, difieren de los datos
operacionales usados por las aplicaciones
de producción.

3
Entre las principales se tiene:
·        Orientado al tema
·        Integrado
·        De tiempo variante
·        No volátil

4
Explicación de la definición

• Orientado hacia temas: los datos se


almacenan y agrupan por temas de interés.

5
Explicación de la definición
• Datos integrados: el almacén de datos
integra datos que provienen de varias
fuentes. Partimos de una base de datos
(operacional) y mediante un proceso de carga
de datos hacemos el Datawarehouse. El
proceso de carga es lo más complicado por
problemas de codificación, medidas de los
atributos… de las bases de datos.
BD
DW
CARGA
BD
BD

6
Explicación de la definición

• No volátiles: son estables, una vez


almacenados los datos no se modifican.
CARGA

UPDATE
SELECT

BD DW DW REPORTS SELECT
INSERT
DELETE

7
Explicación de la definición
• Variante en el tiempo: los datos contienen
información sobre la fecha de los mismos,
porque se hacen cargas de datos
continuamente. Cuando los datos van
cambiando, se actualizan los históricos y se
guardan en ficheros temporales. Siempre va
haber una variable tiempo.
TIEMPO
# id_tiempo
* periodo

8
Características

• Podemos resumir las características de


un Datawarehouse:
– Trabaja con datos de negocio
– Orientado a un sujeto
– Almacena datos actuales orientado a un
histórico (actual + histórico)
– Datos más bien resumidos (no información
detallada)

9
DIFERENCIAS

BD OPERACIONAL DATAWAREHOUSE


- Datos - Datos de negocio
operacionales - Orientado al sujeto
- Orientado a - Actuales +
aplicaciones Histórico
- Datos Actuales - Datos Resumidos
- Datos Detallados - Datos Estables
- Datos en continuo
cambio
10
ARQUITECTURA DW

Partimos de una BD operacional y se basa en 3 módulos

BD
operacional

GESTOR GESTOR GESTOR


ALMACENAMIENTO
CARGA CONSULTAS

11
GESTOR DE CARGA

• Permite hacer la carga. Como dificultades nos


podemos encontrar:
– La integración de los datos
– Elección del momento de la carga
– El tiempo de carga sea el mínimo posible
– Buen diccionario de datos o METADATA (para
evitar cometer errores en la carga)
– Diseño de procedimientos PL/SQL

12
GESTOR DE ALMACENAMIENTO

• Se encarga del almacenamiento, de la


estructura,….
Existe una tabla llamada FACT (Hecho) y unas
tablas llamadas dimensiones o tablas
dimensionales.
Entre la tabla FACT y las tablas dimensionales
suele haber relaciones
Este modelo tiene forma de estrella por eso se
denomina MODELO STAR

13
MODELO STAR

DIM_TIEMPO
# PK4 DIM_1
# PK1

FACT
# PK1
# PK2
# PK3
DIM_3 # PK4
*campoA DIM_2
# PK3 *campoB
# PK2

14
GESTOR DE CONSULTAS

• Las consultas se hacen sobre la tabla


FACT. También se encarga de los
perfiles, pues las consultas (reports)
serán diferentes dependiendo del
usuario y sus necesidades.

15
Ejemplo 1: USUARIOS

#CATEGORIAS_PROF
PK1
# c_categoria
# c_usuario
* nombre
* descripción * apellido1
* salario_min * apellido2
* salario_max * c_categoria
* direccion

USU_OFERTAS
# c_usuario
# c_categoria
# c_oferta
* salario_deseado

TIEMPO OFERTAS
# c_tiempo # c_oferta
* descripcion * descripción
* salario_min
* salario_max
* fx_alta 16
REPORTS

• ¿Cuántos usuarios se han apuntado a las


ofertas de empleo del mes de enero?
SELECT count(*)
FROM USUARIOS_OFERTAS U, OFERTAS O
WHERE U.c_oferta=o.c_oferta
AND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)

17

También podría gustarte