Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capítulo 2
Diseño Dimensional
Objetivo
Temas
1. Concepto de medida
2. Tabla de hechos
3. Granularidad
4. Criterios para agrupar la información
5. Relaciones entre las tablas
6. Tipos de modelo dimensional
7. Pasos del modelo dimensional
1. Concepto de medida
Measures (medidas):
• Son valores cuantitativos que almacenan las métricas del negocio y responde a la pregunta
¿Cuánto?
• Están representados por columnas numéricas en la fact table.
• En algunos casos provienen directamente de los sistemas transaccionales.
• Son las variables que ayudarán a medir el desempeño del negocio.
• Una fila en una tabla de hechos corresponde a una o varias medidas
• Marketing
Unidades vendidas
Valores actuales
Valores presupuestados
• Logística
Unidades aceptadas
Unidades devueltas
Peso
Costo inventario
Montos comprados
• Producción
Tiempo de producción
Capacidad usada
Unidades embarcadas
Unidades planificadas
Unidades producidas
Costos producción
Horas hombre
Peso ingresado
Peso procesado
Al usar una dimensión para segmentar una medida, la medida se resume en las
jerarquías contenidas en la dimensión. Todas las medidas que se crean están
respaldadas por una función de agregación que determina la operación de la
medida.
1.2.1 Aditivas
1.2.2 Semiaditivas
1.2.3 No aditivas
2. Tabla de hechos
Las tablas de hechos son tablas que registran eventos como las ventas que hacemos, las
páginas visitadas en nuestro sitio web o las entradas de productos en nuestro
inventario. Son tablas que se actualizan constantemente y esa periodicidad de
actualización la define el negocio.
Son las tablas más importantes del modelo de negocio que representan un hecho o
evento que ocurre en el proceso de negocio y son de tres tipos: transacción, periódicas y
acumulativas.
Es en definitiva es la tabla principal del modelo dimensional que contiene campos clave
asociados con la tabla de dimensiones, que contiene las métricas o también conocidas
como métricas que queremos medir o analizar. Estos suelen ser valores que
normalmente sumarían.
Ejemplo:
Por otro lado, las tablas de dimensiones incluyen criterios por lo que podemos
segmentar los "hechos" (en inglés Fact Table). Por ejemplo, si la tabla de hechos
contiene ventas por internet, podemos querer segmentar las ventas por cliente quien
nos han comprado o quienes les hemos vendido (Dimensión Customer), o podemos
querer segmentarlas según el país, región o ciudad en el que se producen
(Dimension DimGeography), o según la categoría del producto vendido
(Dimension DimProductCategory). Las tablas de dimensiones son normalmente
estáticas, casi siempre no se modifican o en algunos casos se modifican con poca
frecuencia (Método Slowly Changing Dimensions).
3. Granularidad
Puede administrar varias granularidades de datos usando varias tablas de hechos (tablas
diarias, mensuales y anuales). Asimismo, se puede disponer de una sola tabla con un
distintivo de granularidad, o una columna que indique el grano de la tabla. Pero, no
gestione datos con distintas granularidades en una misma tabla de hechos (Fact Table).
Cuando identifique los granos de los objetos de datos, realice los pasos siguientes:
Validar la atomicidad (nivel de detalle) del grano para asegurarse de que está en
el nivel de mayor detalle. Esta opción define la consideración por anticipado de las
necesidades posteriores con el fin de minimizar la necesidad de crear un nuevo
diseño cuando cambien los requisitos del negocio.
Ejemplo, una tabla de dimensión de tiempo (fecha) que sólo tiene un atributo año
(Year). Como sólo hay un atributo, no puede consultar la información a nivel
trimestral, mensual o diario.
Definir las tablas de dimensión y medidas de alto nivel, de las cuales se entendería
la definición de grano. Para identificar estos elementos, no se lleva a cabo ningún
análisis detallado.
Las medidas son las que se logran definir fácilmente consultando la definición de
grano. Ejemplo, las medidas como el precio unitario, la cantidad y el descuento se
identifican fácilmente viendo el grano.
Son las áreas temáticas o sujetos del negocio que proveen un método general para organizar la
información corporativa. Se definen como un grupo de uno o más atributos. Las dimensiones
no comparten atributos, estas definen los niveles de análisis (Jerarquías). Esto permite obtener
agregación o sumarización.
Tienen una relación uno a muchos con la tabla de hechos (fact table).
Incluyen una clave primaria, de preferencia numérica y auto
incrementado.
Ejemplo:
• Las dimensiones definen los niveles de análisis (Jerarquías). Esto permite obtener
agregación o sumarización.
• Es una entidad de negocios respecto de la cual, se deben analizar las métricas.
• Ventas
Producto
Organización
Tiempo
Cliente
Formas de pago
• Marketing
Producto
Organización
Tiempo
Segmento de clientes
Medios de entrega
Territorios
• Logística
Estado
Proveedores de inventario
Materiales
Productos
Ubicación
Organización
Tiempo
• Producción
Organización
Producto
Procesos
Estaciones de trabajo
• Es preciso que toda dimensión signifique lo mismo para cada tabla de hechos con la
que se relacione: fechas, productos, geografía, cliente …
• Generalmente provienen de las tablas maestras de los sistemas transaccionales.
• En cantidad de registros las dimensiones son las tablas más pequeñas.
• Las dimensiones están compuestas de dos partes:
Atributos
Jerarquías
Atributos
Jerarquías y niveles
Para crear tablas relacionadas, se debe definir una relación entre dos tablas. Una relación se
establece cuando el valor de un campo, denominado campo de coincidencia (a veces recibe el
nombre de campo de clave) en un lado de la relación se compara con éxito con un valor en el
campo de coincidencia en el otro lado de la relación de acuerdo con los criterios que
especifique en la relación.
Por ejemplo, puede crear una relación tal que cuando el valor en el campo ID de estudiante de
una tabla Alumnos sea igual al valor del campo ID de estudiante de una tabla Clases, los
registros de las dos tablas se relacionen.
o Clave principal:
o Clave externa:
Un campo de una tabla que identifica un registro de otra tabla. Los valores en
claves externas no tienen que ser exclusivos en la tabla y pueden estar vacíos
(nulos). Puede haber varias claves externas en una tabla.
El modelo físico puede ser de dos tipos Star Schema (Modelo en estrella) o tipo Snowflake (Copo
de nieve).
• Esto quiere decir que la única tabla que tiene relación con otra es la de hechos, lo
que significa que toda la información relacionada con una dimensión debe estar
en una sola tabla.
• Características
• Inconvenientes
• En este modelo la tabla de hechos deja de ser la única relacionada con otras
tablas ya que existen otras tablas que se relacionan con las dimensiones y que no
tienen relación directa con la tabla de hechos.
• Características
• Inconvenientes
7.1 Entrevistas
Template de entrevistas:
Medida 1 X X X X
Medida 2 X X X
Medida 3 X X X X X
Medida 4 X X
…
Medida N X X X X
• Como podemos ver, la matriz de Bus en este caso nos sirvió para mostrar
de una manera fácil y sencilla cuáles son nuestras dimensiones, cuáles son
nuestras medidas y cuáles son las relaciones entre ellas.
• Por tanto, adoptar la matriz Bus como una herramienta para definir el
diseño y así poder mostrarlo al usuario de negocio, que agradecerá por
simplificarle el entendimiento del modelo del Datawarehouse para su
negocio.
7.4 Jerarquías
• Una base de datos con “modelo dimensional” es una base de datos que
tiene una estructura adecuada para resolver consultas analíticas.
• Se trata de modelos sencillos que aseguran unos buenos tiempos de
respuesta, y que se corresponden bastante con el lenguaje de negocio de
los usuarios
• La implementación de una base de datos relacional, construirás el “modelo
dimensional” utilizando una estructura en estrella, o una estructura en
copo de nieve.
• Por ejemplo:
Ejemplo:
a) SnapShot
b) Transaccional
c) Incremental
d) Ventajas
• Optimiza T° Respuesta
• Simplifica modelo para usuario final
e) Desventajas
a) Dimensión de roles
b) Súper dimensión
Sobrescribir el valor
Es fácil de implementar, pero no mantiene la historia de
los cambios los atributos.
Menos usada