Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capítulo 2
Diseño de un Data Mart
Objetivos:
Temas
1. Diferencias de diseño entre los sistemas OLTP y los sistemas OLAP.
2. Principios de diseño de bases de datos OLAP.
Data Warehouse & Olap 2
El objetivo de las bases de datos OLAP es responder a las preguntas clave del
negocio. Estas preguntas suelen la siguiente apariencia:
Fact table (tabla de hechos): Almacena eventos (por ejemplo, las ventas).
Contiene las métricas que miden la efectividad de las operaciones del
negocio.
Fact (hecho): Es una fila de la fact table. Representa un evento específico.
Measures (medidas): Valores cuantitativos que almacenan las métricas del
negocio. Están representados por columnas numéricas en la fact table.
Dimensión: Es una entidad de negocios respecto de la cual se deben calcular
las métricas. Ejemplos: clientes, productos, tiempo.
Dimension Table (tabla de dimensión): Tablas que almacenan las
dimensiones.
Data Warehouse & Olap 4
La técnica más popular para diseñar un data mart es el esquema STAR (Estrella).
Esta estructura asocia una tabla de hechos (Fact Table) con múltiples tablas de
dimensión (dimension tables).
Fact Table
Un data mart implementado con Analysis Services está orientado a brindar a los
usuarios información numérica, que contribuya a entender el comportamiento del
negocio y tomar mejores decisiones. Esta información numérica recibe el nombre de
medida (measure). Algunos ejemplos de medidas comúnmente utilizadas por todo
tipo de negocio son: ventas, unidades vendidas, costo, gasto, etc.
Las medidas se almacenan en una o más tablas de hechos (fact tables). Toda tabla
de hechos contiene una cantidad variable de columnas numéricas, que almacenan los
valores de las medidas.
Tablas de dimensión
Para entender el negocio, es fundamental conocer los valores de las ventas, los costos
y los gastos. Sin embargo, estos números son de escasa utilidad si no se definen los
criterios que se usarán para cruzar la información.
las ventas para un determinado período de tiempo? ¿Es necesario ver las ventas
desglosadas por cliente y producto? ¿Se desea visualizar las ventas por distribuidor?
Tienen una relación uno – muchos con la tabla de hechos (fact table).
Incluyen una clave primaria, de preferencia numérica y auto incrementada.
PRODUCTO_DIM
Producto_Key
IDProducto
Familia
Subfamilia
Marca
Presentación
Un data mart está constituido por tablas de hechos y tablas de dimensión. Cada tabla
de hechos está enlazada con múltiples tablas de dimensión. El siguiente diseño
corresponde con una tabla de hechos que almacena información de ventas:
VENTAS_FACT
Tiempo_Key
Producto_Key
Cliente_Key
Monto
Cantidad
Posee una clave primaria compuesta por los campos que representan sus
relaciones con las tablas de dimensión.
Posee columnas numéricas para las medidas.
STAR SNOWFLAKE
Entendimiento del modelo Sencillo Mayor dificultad
Número de tablas Menor Mayor
Complejidad de la consulta Baja Alta
Performance de las consultas y Rápida Lenta
el procesamiento del cubo
Por otro lado, un modelo STAR es baDE DDE VDSVxed31qstante más sencillo que
un modelo SNOWFLAKE. El modelo SNOWFLAKE es más difícil de entender, y
sus procesos de carga de datos son más complejos.
Debido a que una Fact Table puede almacenar grandes volúmenes de información, se
debe eliminar de ella cualquier dato no relevante: información redundante,
operaciones no necesarias, eventos que no representan una operación del negocio.
Es una buena práctica estimar desde la fase de diseño el tamaño que tendrá una Fact
Table. Este cálculo puede efectuarse con base en el ancho (en bytes) de cada fila, y el
número de transacciones esperadas por unidad de tiempo.
Data Warehouse & Olap 11