Documentos de Académico
Documentos de Profesional
Documentos de Cultura
de Data Warehouse
Caso de Estudio
Requerimientos:
Los gerentes desean analizar las ventas.
Interesa clasificarlas según los clientes, el tiempo
(fecha, mes y año) y familia (tipo) del producto.
Interesa evaluar las ventas por ciudad y departamento
de los clientes.
3
Fuentes
La empresa tiene diferentes formas de almacenamiento
de datos.
Clientes: Base de Datos
Productos: Planilla Excel (.xls)
Ventas: Planilla (.csv)
Clientes
4
Fuentes
Clientes
Productos
Ventas
5
Diseño Conceptual
Dimensiones y Jerarquías
Meses
mes #
Ciudades Productos nom_mes
id_ciudad # id_producto #
nom_ciudad nom_producto
Fechas
id_fecha #
Clientes fecha
id_cliente #
nom_cliente
6
Diseño Conceptual
Relación Dimensional
CLIENTES
TIEMPO
7
Diseño Conceptual
Estudio de Aditividad
Medida
Cantidad
Dimensión
Fechas → Meses +
Años → ALL +
Productos → Familias +
Productos
Familias → ALL +
Clientes → Ciudades +
Departamentos → ALL +
8
Diseño Lógico
Esquema Estrella
CLIENTES
TIEMPO
9
Diseño Físico
Seleccionar los tipos de datos más pequeños del DBMS
que permitan representar los datos.
https://www.postgresql.org/docs/current/static/datatype-numeric.html
10
Diseño Físico
11
Diseño Físico
Seleccionar un conjunto de índices adecuado, que permita realizar
joins de forma eficiente: B-TREE, HASH, etc.
12
Carga de Dimensiones
Dimensión Tiempo:
Generar las fechas
Para cada fecha generar los identificadores y los
restantes campos de la tabla.
Insertar en la tabla Tiempo del DW.
13
Carga de Dimensión: Tiempo
14
Carga de Dimensión: Tiempo
15
Carga de Dimensión: Cliente
BD Fuente (BD):
Tabla en el DW:
16
Carga de Dimensión: Cliente
Dimensión Cliente:
Leer los registros de las tres tablas de la base fuente.
Unir (“join”) los registros de cliente, ciudad y dpto.
Insertar en la tabla CLIENTE del DW.
Cliente: Transformación
Cliente: Step
«Obtener ciudades»
18
Carga de Dimensión: Cliente
Cliente: Step
«Ordenar por Dpto.»
19
Carga de Dimensión: Cliente
Cliente: Step
«Unión por Clave»
20
Carga de Dimensión: Cliente
Cliente: Step
«Actualizar dimensión
Cliente»
21
Carga de Dimensión: Producto
Fuente (.xls):
Tabla en el DW:
22
Carga de Dimensión: Producto
Dimensión Producto
Leer los registros de la planilla Excel (.xls)
Insertar en la tabla Producto del DW
Transformación
23
Carga de Dimensión: Producto
24
Carga de Dimensión: Producto
25
Carga de Dimensión: Producto
26
Carga de Hechos
Ventas
Fuente (.csv):
27
Carga de Hechos
28
Carga de Hechos: Ventas
Transformación
29
Carga de Hechos
Ventas: Step
«Obtener Ventas»
30
Carga de Hechos
Ventas: Step
«Filtrar valores»
31
Carga de Hechos
Ventas: Step «Calcular Fecha»
32
Carga de Hechos
Ventas: Step
«Ordenar filas»
33
Carga de Hechos
Ventas: Step
«Agrupar por Fecha-Cliente-Producto»
34
Carga de Hechos
Ventas: Step
«Consultas Ventas del DW»
35
Carga de Hechos
Ventas: Step
«Unión por Clave»
36
Carga de Hechos
Ventas: Step
«Calcular nuevos
valores del DW»
Para las combinaciones
Fecha-Cliente-Producto
que ya existen en el DW,
sumar la cantidad
37
Carga de Hechos
Ventas: Step
«Actualizar Ventas en el DW»
38
Transformaciones
39
Trabajo (Job)
Primera Carga:
Cargar todas las Dimensiones
Cargar los Hechos
40