Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dimensional
Agenda
Modelo Dimensional
Definicin
Componentes
Ejemplos
Comparacin con E/R
Proceso del diseo dimensional
Modelos de arquitectura
Arquitectura en bus
Modelamiento dimensional
Definicin
Una tcnica para disear el modelo
lgico de la bodega de datos
Permite alto rendimiento en el momento
de acceder a los datos (orientado a
consultas)
Dimensional (orientado al negocio)
Usa algunos conceptos del modelo
entidad/relacin
Diferente del modelo entidad/relacin
Modelo dimensional
Define un nivel mnimo de detalle
(granularidad)
Se compone de:
Hechos
Medidas
Dimensiones
Atributos
Elementos
Jerarquas
Relaciones
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia
Modelo dimensional
Dimensin
Tiempo
Dimensin
Cliente
Tabla de
hechos
Dimensin
Geografa
Dimensin
Producto
Modelo E/R
Comparacin
Operacionales
Enfocado a la actualizacin:
Enfocado a eliminar redundancia,
coordinar actualizaciones y repetir
el mismo tipo de operaciones
muchas veces en el da
Altamente normalizadas para
soportar actualizaciones
consistentes y mantenimiento de la
integridad referencial
Tiempos de respuesta en segundos
o inferior
Almacenan pocos datos derivados
Pocos datos agregados
BI (Dimensional)
Enfoque a la consulta
Medidas
Son las variables que ayudarn a medir
el desempeo del negocio.
Las medidas bsicas, existen fsicamente
en el warehouse junto a los atributos que
los caracterizan
Las medidas derivadas o calculadas se
construyen a partir de las medidas bsicas
y pueden o no estar almacenados
fsicamente en el data warehouse
Hechos y medidas
Una fila en una tabla de hechos
corresponde a una o varias medidas
Todas las medidas en la tabla de hechos
deben tener el mismo nivel de
granularidad
Las medidas mas usadas son numricas y
aditivas
Las tablas de hechos representan la
relacin muchos a muchos que existe
entre las dimensiones!
Dimensiones
Son las reas temticas o sujetos del
negocio.
Proveen un mtodo general para organizar
la informacin corporativa
Se definen como un grupo de uno o ms
atributos. Las dimensiones no comparten
atributos
Las dimensiones definen los niveles de
anlisis (Jerarquas). Esto permite
obtener agregacin o sumarizacin.
Atributos
Los atributos son una agrupacin de
elementos o items dentro de una
dimensin.
Representan categoras o clases de
elementos que tienen el mismo nivel
lgico dentro de una dimensin.
La finalidad de los atributos es ver la
informacin de cada dimensin a
diferentes niveles de detalle y
agrupar los datos para ser analizados.
Elementos
Relaciones
Relaciones
Uno-a-uno (1:1)
Uno-a-muchos (1:M)
Muchos-a-uno (M:1)
Muchos-a-muchos (M:N)
Jerarquas
Representadas por un ordenamiento
lgico dentro de la dimensin, se
encuentran formadas por los diferentes
tipos de relaciones entre los atributos de
una misma dimensin.
Como convenciones del modelado, la
jerarqua principal se dibuja verticalmente
desde el atributo ms agregado (arriba)
hasta el ms atmico (abajo) y las
jerarquas caractersticas se adicionan por
los costados.
Ejemplo
Caso de estudio
Cadena de almacenes
100 almacenes en cinco (5) regiones
Cada almacn tiene varios departamentos
Requerimientos
del
negocio
Modelo dimensional
1. Proceso del negocio
2. Granularidad
3. Dimensiones
4. Hechos
Realidad de
los datos
Tomado de [5]
Caso de estudio
1. Seleccionar el proceso de negocio a modelar
Administrador desea
Entender las compras de los clientes desde el
POS (punto de venta)
Caso de estudio
2. Definir el nivel de granularidad del proceso del negocio
Caso de estudio
3. Escoger las dimensiones
Promocin
Caso de estudio
Modelo preliminar
Caso de estudio
4. Identificar los hechos
Qu ms debe aparecer en la tabla de
hechos?
Hechos que correspondan con la
granularidad: Transaccin de venta
Caso de estudio
4. Identificar los hechos
Caso de estudio
4. Identificar los hechos
Caso de estudio
Atributos de las entidades
Dimensin Tiempo
Caso de estudio
Atributos de las entidades- Dimensin Tiempo
Caso de estudio
Atributos de las entidades- Dimensin Tiempo
Caso de estudio
Atributos de las entidades
Dimensin Producto
Caso de estudio
Atributos de las entidades- dimensin producto
Caso de estudio
Atributos de las entidades
Dimensin Almacn
Caso de estudio
Atributos de las entidades
Dimensin promocin
Caso de estudio
Atributos de las entidades
Dimensin degenerada
Caso de estudio
Modelo
Caso de estudio
Modelo extendido
Bodegas de Datos
Modelos de Arquitectura
Dos arquitecturas de acuerdo con la
normalizacin de sus dimensiones:
Estrella
Desnormalizado
Copo de Nieve
Normalizado
Estrella
Desnormalizado
Habilidad para anlisis dimensional
Copo de nieve
Modelo Estrella
Dimensin
Tiempo
Dimensin
Geografia
Tabla de
hechos
Dimensin
Cliente
Dimensin
Producto
Tabla de
Hechos
Dimensin
Producto
Dimensin
Clase de Producto
Dimensin
Categora
de Producto
Caso de estudio
Dimensin producto (parcial) en copo de nieve
Normalizado en 3FN
Reducir 2.7 MB
(150.000*18 bytes)
La tabla de hechos ocupa 10GB
Prdida de tiempo
tratar
de -normalizar
la dimensin!
Por Elizabeth
Len Guzman
TEBD Universidad Nacional de Colombia
Muchas dimensiones
Una tabla de hechos es normalizada y
compacta. Tentacin de desnormalizar
Una tabla de hechos con muchas
dimensiones lleva a un crecimiento
significativo de requerimientos de espacio
La mayora de procesos del negocio
pueden ser representados con menos de
15 dimensiones
Llaves subordinadas(1)
Llaves artificiales,
llaves sintticas,
llaves enteras
Se recomienda el uso
de estas llaves
Son enteros que son
asignados
secuencialmente al
poblar una dimensin
Llaves subordinadas(2)
Cada join entre dimensiones y tabla de
hechos debe estar basado en llaves
subordinadas.
Evitar el uso de cdigos naturales de los
sistemas que soportan la operacin
Beneficios:
Caso de estudio
Anlisis de la canasta de mercado
Arquitectura en Bus
Arquitectura en Bus
Tomado de [2]
Arquitectura en Bus
Permite una mejora en la administracin
de los componentes de la bodega.
Basado en el principio reduccionista de
control sobre cada uno de los elementos.
Los elementos de desarrollo de los Data
Mart siguen las pautas de la arquitectura
Fcil incorporacin de nuevos Data Marts
a la arquitectura (plug and play)
Bus Matrix
Data
marts
Tomado de [2]
Bus Matrix
1.
2.
Sobrescribir el valor
Id_producto
Nombre
Depto
SKU_nmero
12345
NioInte1.0
Software
ABC922-Z
Nombre
Depto
SKU_nmero
12345
NioInte1.0
Estrategia
ABC922-Z
No puede
ser llave
primaria
Nombre
Depto
SKU_nmero
12345
NioInte1.0
Educacin
ABC922-Z
35896
NioInte1.0
Estratega
ABC922-Z
Llave
subordinada
Id_producto
Nombre
Depto
Depto
anterior
SKU_nmero
12345
NioInte1.0
Estrategia
Educacin
ABC922-Z
Modificar
(aplicar 1)
Tcnicas Hbridas
1.
2.
Actualizacin de los
clientes peridicamente!
Tabla de hechos
Id_cliente
Dimensin cliente
Id_cliente
Nombre
Direccin
Fecha_nacimiento
Ingresos
Educacin
Nmero_hijos
Estado_civil
Puntaje-credito
Tabla de hechos
Dimensin cliente
Id_cliente
Nombre
Fecha_nacimiento
Dimensin demografa
Id_demog
Direccin
Ingresos
Educacin
Nmero_hijos
Estado_civil
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia
Puntaje-credito
Id_cliente
Id_demog
Dimensiones Junk
Dimensiones Junk
210 registros
Dimensin diagnstico
Id_diagnstico(PK)
Id_time(FK)
Id_paciente(FK)
Id_proveedor(FK)
Id_diagnostico(FK)
Mltiples diagnsticos
para el mismo
paciente?
Dimensin diagnstico
Id_diagnstico (PK)
Id_diagnstico_grupo (PK)
Id_diagnstico (PK)
Peso_diagnstico
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia
Id_time(FK)
Id_paciente(FK)
Id_proveedor(FK)
Id_diagnostico_grupo(FK)
Dimensin diagnstico
Id_diagnstico (PK)
Id_diagnstico_grupo (PK)
Id_diagnstico (PK)
Id_paciente (PK)
Peso_diagnstico
fecha_inicial
fecha_final
Id_time(FK)
Id_paciente (FK)
Id_proveedor (FK)
Id_diagnostico_grupo (FK)
Ejercicio
Dimensiones Role-playing
Construir la matrix
Referencias
[1] Wiley - Mastering Data Warehouse Design Relational And Dimensional Techniques 2003.
[2] Wiley - Data Analysis -The Data Warehouse
Toolkit - Second Edition.
[3] Wiley - Building The Data Warehouse - Third
Edition
[4] Wiley - The Data Warehouse ETL Toolkit 2005.
[5] Wiley - The Data Warehouse Lifecycle Toolkit
1998
[6] MicroStrategy - Business Intelligence - 2006
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia