Está en la página 1de 56

Desarrollo de Sistemas de Inteligencia de Negocios

FUNDAMENTOS DE MODELADO
DIMENSIONAL

© 2014, UCV. Inteligencia de Negocios. Prof. Wilfredo Rangel : wilfredorangel.ucv@gmail.com 1


Objetivos de Aprendizaje
 Al finalizar este tema, usted estará en capacidad de:

 Entender los conceptos básicos del Modelado de datos dimensional

 Entender los aspectos relacionados al desarrollo de esquemas estrellas


Tabla de contenido
Modelo de dato dimensional
Modelo dimensional básico
Fundamentos de Modelado Dimensional Modelo relacional

Modelos de datos relacional


Fundamentos de Modelado Dimensional Modelo Relacional

Modelos de datos relacional


Criterio de diseño: Normalización
Fundamentos de Modelado Dimensional Modelo Relacional

Modelos de datos relacional


FACTURACION

¿Cuál es la ganancia de las ventas en el año 2014 a empresas de


Panamá según tipo de artículos?
Fundamentos de Modelado Dimensional Modelo Relacional

Modelos de datos relacional


¿Cuál es la ganancia de las
ventas en el año 2014 a
empresas de Panamá según
tipo de artículos?

Select sum (unidades*(precio_unitario-coste_unitario)), cod_tipo_artc


From Empresas, Clientes, Facturas, Lineas_factura
Where Empresa.Codigo_empresa = Clientes.Codigo_cliente
And Facturas.Codigo_cliente = Clientes.Codigo_cliente
And Facturas.Numero_factura = Lineas _factura.Numero_factura
And Lineas_factura.Codigo_articulo = Articulos.Codigo_articulo
And Articulos.Cod_tipo_artc = Tipos_articulos.Cod_tipo_artc
And Fecha Between ‘1/1/2014’ And ’31/12/2014’
And Pais = ‘Panama’
Group By Cod_tipo_artc
Fundamentos de Modelado Dimensional Modelo Relacional

Modelos de datos relacional


• En la mayoría de los cursos de BDD:
– Base de datos relacionales
– 3NF = IDEAL
– Claves, Uniones, Roles, Flexibilidad
• OLTP (OnLine Transaction Processing)
– Base de datos que soporte la aplicación
– IDEAL para:
• Muchos usuarios, pequeños pedazos
de información
• Ej: Transacción # 1002 $40.00
Realizada en el cajero # 33354
– NO es bueno para:
• Pocos Usuarios y grandes pedazos de
información
• Sumas o cálculos
Fundamentos de Modelado Dimensional Del modelo relacional al modelo estrella

Esquema de Hechos y dimensiones


Fundamentos de Modelado Dimensional Del modelo relacional al modelo estrella

Modelos de datos dimensional


Fundamentos de Modelado Dimensional Del modelo relacional al modelo estrella

Modelos de datos dimensional


Consideremos un ejemplo de una operación de ventas, en la cual el tiempo, producto,
región, tienda y cliente son las dimensiones de la base de datos, y se busca medir la
transacción de venta en la tabla fact.
Modelo Dimensional

Modelos de datos dimensional


Kimball, Ralph; et al. (1998). The Data Warehouse Lifecycle Toolkit.
Geografía
Producto Vendedores
 Tablas de base de datos
estándares
 Técnica de modelaje, no de Fact Ventas
implementación de base de datos
 Optimizada para agregaciones Cliente Tiempo
masivas y dinámicas

Los modelos dimensionales a veces se llaman esquemas estrella


 Tabla Fact (Hechos)  Tabla Dimensión

 Una tabla fact contiene elementos que se  Dimensiones son las formas que se
quieren medir. Por ejemplo: quieren ver los datos. Por ejemplo:
 Ingreso  Por cliente
 Cantidad Vendida  Por fecha
 Precio Promedio  Por producto
 Medidas son valores que se tratan de  Las dimensiones dan contexto a la
información en los reportes
reportar (agrupaciones, etiquetas, filtros, etc.)
Fundamentos del modelado dimensional Del modelo relacional al modelo estrella

Del modelo relacional al modelo dimensional


Fundamentos del modelado dimensional Del modelo relacional al modelo estrella

Del modelo relacional al modelo dimensional

Dimensional 3NF

• Rendimiento de consultas • Rendimiento transaccional


• Agregación dinámica • Consulta y almacenamiento detallado
• Análisis de tendencias históricas • Compactación de datos históricos
• Datos no volátiles • Datos volátiles
Fundamentos del modelado dimensional

Fases en el diseño dimensional‫‏‬


Procesos de 4 pasos para construir modelos estrellas

1.- Seleccionar los procesos de negocio a


modelar

2.- Declarar el grano del proceso de negocios

3.- Escoger las dimensiones

4.- Identificar los hechos que deben


considerarse
Fundamentos del modelado dimensional

Fases en el diseño dimensional‫‏‬


Procesos de 4 pasos para construir modelos estrellas

1.-Seleccionar
los procesos • En función de la preguntas estratégicas a responder
de negocio a • Se basa en los ERS
modelar

• Es preferible información al máximo nivel de detalle


2.-Declarar el
grano del • Los datos guardados ya no se pueden analizar a un nivel de grano más fino
proceso de • Normalmente, las consultas no pretenden ver el nivel individual
negocios
• El nivel del grano condiciona la flexibilidad de las consultas admisibles

3.-Escoger las • El grano determina la dimensionalidad


dimensiones • Es preciso ajustar las dimensiones al grano

4.-Identificar
• Buscar la aditividad de los hechos a observar
los hechos
que deben • Porcentajes y proporciones ->deben guardarse numerador y denominador
considerarse • El precio unitario no es aditivo -> guardar venta = precio x unidades
Fundamentos del modelado dimensional

Aditividad de las medidas


Fundamentos del modelado dimensional

Las tablas de dimensiones y sus atributos


Fundamentos del modelado dimensional

Extensibilidad del esquema


Fundamentos del modelado dimensional

Nueva dimensión promoción


Fundamentos del modelado dimensional

Tabla de Hechos sin Hechos


Fundamentos del modelado dimensional

Modelo Snowflaking (copo de nieve)


Normalización de dimensiones
Fundamentos del modelado dimensional

Modelo Snowflaking (copo de nieve)


• Modelo estrella es el más puro
acercamiento al modelado
dimensional
– Mejores prácticas
– Siempre intenta utilizarlo
• El copo de nieve es un modelo más

Normalización
normalizado
– Más espacio físico/ Problemas de
performance
Fundamentos del modelado dimensional

Modelo Snowflaking (copo de


Esquena Estrella vs. Copo de Nieve
nieve)
Estrella Copa de nieve

• Todos los niveles dimensionales están • Niveles dimensionales son normalizados


contenidos en una sola tabla a tablas separadas
• Introduce redundancia en los datos • Elimina redundancia en los datos
• Indexación y consultas simplificadas • Reutilización simplificada de
• Generalmente el método preferido dimensiones de alto nivel en agregados
Fundamentos del modelado dimensional

Modelo Snowflaking (copo


Ejemplo
de nieve)
Mfr Mfrid Marca Prodid
Nombre Mfrid Día Prodid Unid. Bs Pago Clientid
Mfr
Producto

Mfr es un diseño en copa Ventas


de nieve

Año Trim Mes Día Estado Ciudad Clientid

Tiempo
Cliente
Fundamentos del modelado dimensional

Dimensiones Conformadas (compartidas)


• Son aquellas que son compartidas entre esquemas estrella (tablas de hechos)
• Permite el diseño escalable de bases de datos analíticas
• Permite el análisis y agregación por área entre distintos sujetos
Geografía

Cliente Empleado
Ventas

Producto (transacciones)
Tiempo
Inventarios

Almacén (foto - snapshot)

Compra
Proveedor
(transacciones)
Transaccional vs. Snapshot
•Transaccional
• Cada fila representa un evento
• La información se encuentra a nivel más detallado
•SnapShot
• Cada fila representa un instante en el tiempo
• Generalmente los snapshot se toman a intervalos predefinidos
• Ej.: diarios, semanales, mensuales
• Suministran una visión acumulativa
• Se utilizan para gestionar procesos continuos y medidas de intensidad
• Ejemplos: Balance bancario, Inventario, Tracking de entregas
Fundamentos del modelado dimensional

Tabla de hechos semi-aditivos


Gestión de inventario

Margen de retorno de inversión = Uds_vendidas * ( Precio_ult_venta – precio_coste) /


(Uds_entrada * Precio_ult_venta)
Modelo de dato dimensional
Data warehouse vs data mart
Arquitectura en Bus del Data Warehouse
(Kimball)
Matriz en Bus de BI/DW (Kimball)
Dimensiones Conformadas (compartidas)
• Son aquellas que son compartidas entre esquemas estrella (tablas de hechos)
• Permite el diseño escalable de bases de datos analíticas
• Permite el análisis y agregación por área entre distintos sujetos
Geografía

Cliente Empleado
Ventas

Producto (transacciones)
Tiempo
Inventarios

Almacén (foto - snapshot)

Compra
Proveedor
(transacciones)
Dimensiones conformadas
Dimensiones conformadas
Hechos conformados
Data marts
Data marts
Data marts
Modelo de dato dimensional
Modelo dimensional Extendido
Roles de una dimensión
Relación n a m
Dimensión degenerada
Junk dimensión
Dimensiones Combinadas (Junk dimension)
• Si hay más de una dimensión degenerada y
– tienen algún grado de relación
– sus cardinalidades son relativamente pequeñas, de forma tal que un producto
cartesiano no produce muchas filas
• Entonces, estas dimensiones son “combinadas” para formar una dimensión combinada
– Una columna por atributo/dimensión
– Una fila por cada combinación
• Puede ser pre cargada si el total de combinaciones es pequeña
• Puede ser cargada de acuerdo a su necesidad también
Dimensiones Combinadas (Junk dimension)
• También llamadas dimensiones basura (junk)
• Antes de tener muchas columnas de 0 y 1 en la tabla de hechos
– Crea una dimensión que sea el producto cartesiano de dos dimensiones degeneradas
– Las búsquedas deben hacerse por los atributos

Dimensiones Generadas Dimensión Combinada


Sexo Dimensión ID / Sexo / Tipo de Orden
M/F/I Todas las 1 / M / Nuevo
Tipo de Orden combinaciones 2 / M / Retornado
Nuevo / Retornado 3 / F / Nuevo
4 / F / Retornado
5 / U / Nuevo
6 / U / Retornado
Modelo de datos relacional frente al
dimensional
Modelo de dato dimensional
Ejemplos
Delicatessen International
Paso 1: Seleccionar el proceso de negocio
Gestión de ventas
Delicatessen International
Paso 1: Seleccionar el proceso de negocio
Necesidades de análisis
Delicatessen International
Paso 1: Seleccionar el proceso de negocio
Modelo de datos operacional (OLTP)
Delicatessen International
Paso 2: Declarar el grano
Orden de Pedido

Línea de pedido
Delicatessen International
Paso 3: Seleccionar dimensiones
Delicatessen International
Paso 4: Identificar los hechos

Métricas
•Importe línea
•Unidades vendidas
•Descuento
Métricas derivadas
•Coste flete
•Beneficio neto
Delicatessen International
Delicatessen International
Modelo de datos analítico (OLAP): Data mart de ventas

También podría gustarte