Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Almacenes de Datos
Almacenes de Datos
(Data Warehouses)
Wladimiro Díaz Villanueva
Wladimiro.Diaz@uv.es
Universitat de València
Salvado de
datos limpios
ALMACÉN DE DATOS
Limpieza
Actualizaciones/Nuevos datos
OLAP
DSSI/EIS
MINERÍA
DE DATOS
P123
P125 r es
Valo
P126
...
P123
P125 r es ...
Valo Trim.3
P126
e
Trim.2
tr
es
...
Trim.1
im
Tr
13019 – Diseño de bases de datos– p.23/72
3. Modelado de datos...
Las herramientas de explotación OLAP de los almacenes de
datos han adoptado un modelo multidimensional de datos.
én
m ac
Al
Cl
ie
nt
e
Tiempo
Ventas
Producto
Tablas de dimensiones
Dim1 Dim2
Hecho
id_Dim1 id_Dim2
... ...
id_Dim1
id_Dim2
id_Dim3
Dim3 id_Dim4 Dim4
valor1
valor2
id_Dim3 id_Dim4
... ...
Tabla de hechos
T1
T3
id_T1
... id_T3
...
Dim1 Dim2
Hecho
id_Dim1 id_Dim2
id_T1 id_T3
T2 id_Dim1
id_T2 ...
... id_Dim2
id_T2 id_Dim3
... id_Dim4 Dim4
Dim3 valor1
T4
valor2
id_Dim4
id_Dim3
... id_T4 id_T4
Tabla de hechos ... ...
Hecho2
id_T2
id_T4
id_Dim3
id_Dim4
valor1
valor2
Tiempo
id_fecha
Producto día Almacén
semana
id_producto mes id_almacén
num_producto año num_almacén
descripción día_semana nombre
marca día_mes dirección
subcategoría trimestre distrito
categoría festivo ciudad
departamento ... país
peso teléfono
peso_unidad fax
tipo_envase Ventas superficie
dietético tipo_almacén
... ...
id_fecha
id_producto
id_almacén
importe
unidades
num_clientes
Tabla de hechos
13019 – Diseño de bases de datos– p.31/72
4. Construcción de un almacén
de datos
requieren consultas distintas y tablas de resultados
distintas.
V P CANT
V1 P1 300
V1 P2 200
V2 P1 300
V2 P2 400
V3 P2 200
V4 P2 200
VP
V P CANT
V1 P1 300 SELECT SUM(CANT)
V1 P2 200 CANT
FROM VP
V2 P1 300 1600
GROUP BY ();
V2 P2 400
V3 P2 200
V4 P2 200
VP
V P CANT V CANT
V1 P1 300 SELECT V, SUM(CANT) V1 500
V1 P2 200 FROM VP V2 700
V2 P1 300 V3 200
GROUP BY (V);
V2 P2 400 V4 200
V3 P2 200
V4 P2 200
VP
V P CANT
V1 P1 300 SELECT P, SUM(CANT) P CANT
V1 P2 200 FROM VP P1 600
V2 P1 300 P2 1000
GROUP BY (P)
V2 P2 400
V3 P2 200
V4 P2 200
VP
V P CANT
V P CANT
V1 P1 300
V1 P1 300 SELECT V, P, SUM(CANT) V1 P2 200
V1 P2 200 FROM VP V2 P1 300
V2 P1 300 GROUP BY (V, P) V2 P2 400
V2 P2 400 V3 P2 200
V3 P2 200 V4 P2 200
V4 P2 200
“agrupar por todas las combinaciones siguientes” :
todos los subconjuntos posibles del conjunto ”.
13019 – Diseño de bases de datos– p.64/72
6.1. Tabulaciones cruzadas
Con frecuencia, los productos OLAP muestran los resultados
no como tablas al “estilo SQL”, sino como tabulaciones
cruzadas (”tabcruz” ).
Ejemplo: Consulta 4 (“total de envíos por proveedor y parte” ):
P1 P2
V1 300 200
V2 300 400
V3 0 200
V4 0 200