Está en la página 1de 78

Modelamiento

Dimensional

Por Elizabeth Lon Guzmn


Profesora Universidad Nacional de Colombia
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Agenda

Modelo Dimensional

Definicin
Componentes
Ejemplos
Comparacin con E/R
Proceso del diseo dimensional
Modelos de arquitectura
Arquitectura en bus

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Modelamiento dimensional
Definicin
Una tcnica para disear el modelo
lgico de la bodega de datos
Permite alto rendimiento en el momento
de acceder a los datos (orientado a
consultas)
Dimensional (orientado al negocio)
Usa algunos conceptos del modelo
entidad/relacin
Diferente del modelo entidad/relacin

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Modelo dimensional
Define un nivel mnimo de detalle
(granularidad)
Se compone de:

Hechos
Medidas
Dimensiones
Atributos

Elementos
Jerarquas

Relaciones
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Hechos: algo que ocurre en el tiempo


(operacin o actividad)

Medidas: Valores numricos que


describen el hecho que se est
analizando

Dimensiones: Son categoras que


describen el contexto en el cual se
analizan las medidas
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Modelo dimensional
Dimensin
Tiempo

Dimensin
Cliente
Tabla de
hechos

Dimensin
Geografa

Dimensin
Producto

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Modelo E/R

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Comparacin
Operacionales
Enfocado a la actualizacin:
Enfocado a eliminar redundancia,
coordinar actualizaciones y repetir
el mismo tipo de operaciones
muchas veces en el da
Altamente normalizadas para
soportar actualizaciones
consistentes y mantenimiento de la
integridad referencial
Tiempos de respuesta en segundos
o inferior
Almacenan pocos datos derivados
Pocos datos agregados

BI (Dimensional)
Enfoque a la consulta

Altamente desnormalizada ya que


se requiere disminucin de tiempos
en la obtencin de grandes
cantidades de datos
Tiempos de respuesta aceptables
pueden ser segundos, minutos,
horas
Gran cantidad de datos derivados
(redundancia)
Agregacin: Varios niveles de datos
precalculados

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Medidas
Son las variables que ayudarn a medir
el desempeo del negocio.
Las medidas bsicas, existen fsicamente
en el warehouse junto a los atributos que
los caracterizan
Las medidas derivadas o calculadas se
construyen a partir de las medidas bsicas
y pueden o no estar almacenados
fsicamente en el data warehouse

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Hechos y medidas
Una fila en una tabla de hechos
corresponde a una o varias medidas
Todas las medidas en la tabla de hechos
deben tener el mismo nivel de
granularidad
Las medidas mas usadas son numricas y
aditivas
Las tablas de hechos representan la
relacin muchos a muchos que existe
entre las dimensiones!

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Dimensiones
Son las reas temticas o sujetos del
negocio.
Proveen un mtodo general para organizar
la informacin corporativa
Se definen como un grupo de uno o ms
atributos. Las dimensiones no comparten
atributos
Las dimensiones definen los niveles de
anlisis (Jerarquas). Esto permite
obtener agregacin o sumarizacin.

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Atributos
Los atributos son una agrupacin de
elementos o items dentro de una
dimensin.
Representan categoras o clases de
elementos que tienen el mismo nivel
lgico dentro de una dimensin.
La finalidad de los atributos es ver la
informacin de cada dimensin a
diferentes niveles de detalle y
agrupar los datos para ser analizados.

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Elementos

Son las instancias o valores de los


atributos que, como componentes
atmicos del modelo.

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Relaciones

Los atributos dentro de una dimensin


estn directamente relacionados uno con
otros a travs de los diferentes tipos de
relaciones antes definidos.

Los atributos en las diferentes


dimensiones estn relacionados otros a
travs de las medidas o variables del
negocio definidas como interseccin de
las dimensiones.
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Relaciones

Son asociaciones lgicas de atributos


dentro de una jerarqua definida por las
instancias de los atributos y transitivas
dentro de una jerarqua:

Uno-a-uno (1:1)
Uno-a-muchos (1:M)
Muchos-a-uno (M:1)
Muchos-a-muchos (M:N)

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Jerarquas
Representadas por un ordenamiento
lgico dentro de la dimensin, se
encuentran formadas por los diferentes
tipos de relaciones entre los atributos de
una misma dimensin.
Como convenciones del modelado, la
jerarqua principal se dibuja verticalmente
desde el atributo ms agregado (arriba)
hasta el ms atmico (abajo) y las
jerarquas caractersticas se adicionan por
los costados.

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Ejemplo

Empresa: Cadena de supermercados


Actividad objeto de anlisis: ventas de
productos
Informacin registrada sobre una venta:
Se vendi 5 unidades del producto A, en
el almacn nmero 1, el da 20/01/2007
por un total de 250.000 pesos
Para hacer el anlisis no interesa la venta individual realizada
por un cliente, si no las ventas diarias de productos en los
distintos almacenes de cadena
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Mitos del modelo dimensional


Modelos dimensionales y data marts
Solo para datos sumarizados
Son construidos por departamentos
Son no escalables
No pueden ser integrados

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Proceso de diseo dimensional


Pasos
1.
2.
3.
4.

Seleccionar el proceso del negocio a


modelar
Definir el nivel de granularidad del
proceso del negocio
Escoger las dimensiones que aplican en
cada fila de la tabla de hechos
Identificar los hechos numricos que
poblaran la tabla de hechos

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

1. Seleccionar el proceso de negocio


a modelar

El primer modelo dimensional debe ser


uno con gran impacto (debe responder la
mayora de preguntas del negocio y estar
accesible para la extraccin de los datos)

Decidir el proceso(s) del negocio a


modelar combinando y entendiendo los
requerimientos del negocio con los datos
disponibles
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

2. Definir el nivel de granularidad


del proceso de negocio

Preferiblemente, desarrollar el modelo


dimensional con los datos mas atmicos
capturados del proceso de negocio

Datos atmicos son los mas detallados

Una bodega casi siempre requiere los


datos expresados al mas bajo nivel de
granuralidad posible en cada dimensin.
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

3. Escoger las dimensiones


La granularidad determina la
dimensionalidad de la tabla de hechos
Es posible adicionar mas dimensiones a la
granularidad bsica de la tabla de hechos:

Toman solo un valor bajo cada combinacin de


las dimensiones

Si la dimensin adicional viola la


granularidad causando mas filas en la
tabla de hechos, la granularidad debe ser
revisada para acomodar la dimensin.
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

4. Identificar los hechos


Determinar las medidas que aparecern
en la tabla de hechos
La granularidad define el nivel de detalle
de las medidas

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Cadena de almacenes
100 almacenes en cinco (5) regiones
Cada almacn tiene varios departamentos

Requerimientos
del
negocio

Modelo dimensional
1. Proceso del negocio
2. Granularidad
3. Dimensiones
4. Hechos

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Realidad de
los datos
Tomado de [5]

Caso de estudio
1. Seleccionar el proceso de negocio a modelar
Administrador desea
Entender las compras de los clientes desde el
POS (punto de venta)

Proceso del negocio


Ventas realizadas en el POS

Analizar que productos se estn vendiendo, en que almacenes,


en que das, y en que condiciones de promocin
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
2. Definir el nivel de granularidad del proceso del negocio

Cul es el nivel de detalle de los datos?


Posibles anlisis:

Diferencia de ventas entre Lunes y Viernes


Existencia de productos en ciertos almacenes,
ej: cereales
Entender por que ciertos compradores tomaron
la promocin del shampoo

Requieren datos detallados en diferente forma


No es posible responder con datos sumarizados
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
3. Escoger las dimensiones

La fecha, producto y almacn


(dimensiones primarias)
otras dimensiones?

Promocin

Nueva dimensin viola la granularidad?


(nuevas filas en la tabla de hechos)

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Modelo preliminar

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
4. Identificar los hechos
Qu ms debe aparecer en la tabla de
hechos?
Hechos que correspondan con la
granularidad: Transaccin de venta

Precio por unidad


Cantidad vendida
Venta total
Costo del producto
Calcular la ganancia (Venta total Costo total)
Dilema: Almacenar calculado o calcular
con herramienta de consulta?

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
4. Identificar los hechos

Porcentaje de ganancia (calculada al dividir la


ganancia por el total de la venta)
No puede ser sumarizada por ser
con respecto a la dimensin!

Los porcentajes y proporciones no son aditivos. El numerador y el


denominador deben ser almacenados en la tabla de hechos.
La proporcin puede ser calculado a tiempo de consulta de acuerdo
con la situacin.

La proporcin de las sumas != La suma de las


proporciones
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
4. Identificar los hechos

Estimar el nmero de filas que se


almacenarn en la tabla de hechos

Caso de estudio: Hablar con la persona


experta para conocer cuantas transacciones de
venta pueden ocurrir en un periodo de tiempo

Estimar el nmero de filas que se


almacenarn anualmente a la tabla de
hechos
Determinar si es razonable
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Atributos de las entidades

Dimensin Tiempo

Puede ser construida con anticipacin


(historia y aos futuros)
La bodega siempre necesita una dimensin
de tiempo.

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Atributos de las entidades- Dimensin Tiempo

La Dimensin Tiempo en detalle

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Atributos de las entidades- Dimensin Tiempo

Si se desea acceder al tiempo de la


transaccin por partes del da (Ej: tardes)

Conviene una Dimensin por horas


Es mejor tener las mismas 3.650 filas y una
dimensin con 1.440 filas correspondientes a
los minutos del da
Si se maneja en una dimensin a nivel de
Fecha y hora (HH:MM), se tendra una
dimensin con demasiados registros:
365 das x 10 aos x 24 horas x 60 minutos
= 5.256.000 filas
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Atributos de las entidades

Dimensin Producto

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Atributos de las entidades- dimensin producto

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Atributos de las entidades

Dimensin Almacn

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Atributos de las entidades

Dimensin promocin

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Atributos de las entidades

Dimensin degenerada

Nmero de transaccin del POS

Las dimensiones degeneradas son comunes cuando la granularidad de la


tabla de hechos representa una simple transaccin (Ej: nmero de
ordenes, nmero de recibos, nmero de la factura, etc)
Algunas veces la dimensinPordegenerada
es llave
de la tabla de hechos
Elizabeth Len Guzman
- TEBD primaria
Universidad Nacional de Colombia

Caso de estudio
Modelo

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Modelo extendido

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Bodegas de Datos
Modelos de Arquitectura
Dos arquitecturas de acuerdo con la
normalizacin de sus dimensiones:

Estrella

Desnormalizado

Copo de Nieve

Normalizado

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Estrella vs Copo de nieve

Estrella

Desnormalizado
Habilidad para anlisis dimensional

Copo de nieve

Variacin del modelo estrella


Forma normalizada de las dimensiones (solo
las dimensiones primarias estn enlazadas con
la tabla de hechos)
Rompe el anlisis dimensional
Se usa cuando no se puede implementar un
modelo estrella
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Modelo Estrella
Dimensin
Tiempo

Dimensin
Geografia
Tabla de
hechos

Dimensin
Cliente

Dimensin
Producto

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Modelo Copo de nieve

Dimensiones desnormalizadas (valores


repetidos) puede llevar a la normalizacin
de una dimensin

Tabla de
Hechos

Dimensin
Producto

Dimensin
Clase de Producto

Dimensin
Categora
de Producto

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Modelo Copo de nieve


Atributos redundantes son removidos de
la entidad y creando una segunda
dimensin.
Reduce espacio
Fcil de mantener (si la descripcin de un
departamento cambia, solo se necesita
actualizar una ocurrencia y no alrededor
de 3.000)
Extensin del modelo dimensional (vlido)

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Dimensin producto (parcial) en copo de nieve

Normalizado en 3FN

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Modelo Copo de nieve


En el diseo del modelo se debe tener en
cuenta: uso y desempeo
Consideraciones de este modelo

Mltiples tablas aumentan la complejidad de uso


Mas tablas y joins afectan el desempeo de las
consultas
Navegar a travs de las dimensiones puede ser
ms lento (cruce de dimensiones)
No se pueden aprovechar los ndices Bitmap que
son tiles para indexar campos con baja
cardinalidad
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Modelo Copo de nieve

El espacio salvado en las dimensiones es


insignificante comparado con el tamao de la
tabla de hechos.

Descripcin del depto (20 bytes)


En la tabla de producto (150.000 filas)

Nueva dimensin con 2 bytes


de cdigo

Reducir 2.7 MB
(150.000*18 bytes)
La tabla de hechos ocupa 10GB

Prdida de tiempo
tratar
de -normalizar
la dimensin!
Por Elizabeth
Len Guzman
TEBD Universidad Nacional de Colombia

Muchas dimensiones
Una tabla de hechos es normalizada y
compacta. Tentacin de desnormalizar
Una tabla de hechos con muchas
dimensiones lleva a un crecimiento
significativo de requerimientos de espacio
La mayora de procesos del negocio
pueden ser representados con menos de
15 dimensiones

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Muchas dimensiones (2)


Un nmero largo de dimensiones es signo
de que varias dimensiones no son
completamente independientes y pueden
ser combinadas en una sola dimensin
Si el negocio tiene mas de 25
dimensiones, se debe combinar
dimensiones correlacionadas en una sola
dimensin
Es un error representar elementos de una
jerarqua como dimensiones separadas

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Llaves subordinadas(1)

Llaves artificiales,
llaves sintticas,
llaves enteras
Se recomienda el uso
de estas llaves
Son enteros que son
asignados
secuencialmente al
poblar una dimensin

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Llaves subordinadas(2)
Cada join entre dimensiones y tabla de
hechos debe estar basado en llaves
subordinadas.
Evitar el uso de cdigos naturales de los
sistemas que soportan la operacin
Beneficios:

Mantener flexibilidad al cambio.


Permite integracin
Ventajas de rendimiento computacional
(pequeas)
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Anlisis de la canasta de mercado

Analizar que productos son vendidos en la


misma canasta de mercado!
Grado de afinidad de los productos: paales
son vendidos con cerveza

OLAP y minera de datos pueden ser


usados
Se puede tener una solucin a nivel de
bodega!

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Caso de estudio
Anlisis de la canasta de mercado

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Arquitectura en Bus

Construir la bodega en un solo paso?

Usar una arquitectura incremental


Arquitectura de bus!

Los Data Marts son construidos por tema de negocio en


tiempos diferentes o con grupos diferentes.
Los Data Marts pueden ser conectados y ser usados
consistentemente si se adhieren al estndar

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Arquitectura en Bus

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Tomado de [2]

Arquitectura en Bus
Permite una mejora en la administracin
de los componentes de la bodega.
Basado en el principio reduccionista de
control sobre cada uno de los elementos.
Los elementos de desarrollo de los Data
Mart siguen las pautas de la arquitectura
Fcil incorporacin de nuevos Data Marts
a la arquitectura (plug and play)

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Bus Matrix

Herramienta para documentar y comunicar la


arquitectura de bus.

Data
marts

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Tomado de [2]

Bus Matrix
1.

Lista de data marts de primer nivel

2.

Derivados de una fuente


Minimizar el riesgo en implementaciones
ambiciosas ( ETL, diseo e implementacin)
Suficientes datos interesantes para los
usuarios, mientras se continua trabajando en
implementaciones ms difciles

Identificar data marts consolidados

Con mltiples fuentes


Ms difciles de implementar
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Dimensiones que cambian


lentamente
La dimensin puede cambiar con el tiempo
(no esttica): cambian atributos
Inaceptable colocar todo en la tabla de
hechos o crear dimensiones dependientes

Si el valor de un atributo cambia en el sistema operacional


Cmo responder a ese cambio en el modelo dimensional?

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Dimensiones que cambian


lentamente
1.

Sobrescribir el valor
Id_producto

Nombre

Depto

SKU_nmero

12345

NioInte1.0

Software

ABC922-Z

Se decide que NioIntwl1.0 debe ser retirado del depto


de software y adicionado al depto de estrategia en
enero 5 del 2006
Id_producto

Nombre

Depto

SKU_nmero

12345

NioInte1.0

Estrategia

ABC922-Z

El atributo siempre refleja el nuevo valor


La historia mostrar que NioInte1.0 siempre ha
pertenecido al depto de estrategia
Es fcil de implementar, pero no mantiene
Por Elizabeth Len Guzman - TEBD la historia
de los cambios los atributos
Universidad Nacional de Colombia

Dimensiones que cambian


lentamente
2.

No puede
ser llave
primaria

Adicionar una fila a la dimensin


Id_producto

Nombre

Depto

SKU_nmero

12345

NioInte1.0

Educacin

ABC922-Z

35896

NioInte1.0

Estratega

ABC922-Z
Llave
subordinada

Representa la historia correctamente


En la tabla de hechos, antes de enero 5 del 2006 se
referencia el articulo con llave primaria 1234, despus
de esta fecha el articula tendr la llave 35896
Es poderosa ya que la nueva fila divide
automticamente la historia en la tabla de hechos
Sin embargo no permite asociar el nuevo valor del
Elizabeth Len Guzman - TEBD atributo con laPor
historia
de los hechos y viceversa
Universidad Nacional de Colombia

Dimensiones que cambian


lentamente
3.

Adicionar una columna a la dimensin

Id_producto

Nombre

Depto

Depto
anterior

SKU_nmero

12345

NioInte1.0

Estrategia

Educacin

ABC922-Z

Modificar
(aplicar 1)

Es apropiado cuando se necesita soportar dos vistas del


mundo al mismo tiempo
Es inapropiado si se desea hacer seguimiento de valores
intermedios de los atributos
Menos usada
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Dimensiones que cambian


lentamente

Tcnicas Hbridas

1.
2.

Ms flexibles pero ms complejas


Combinan las tcnicas simples
Usarlas si son necesarias para cumplir con los
requerimientos
Cambios predecibles con versiones
mltiples sobrepuestas
Cambios no predecibles con nica
versin sobrepuesta
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Dimensiones que cambian


rpidamente
Mensualmente
Separar los atributos que cambian en una
o ms dimensiones separadas

La tabla de hechos tendr dos llaves forneas

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Dimensiones que cambian


rpidamente - Ejemplo
Compaas de
seguros

Actualizacin de los
clientes peridicamente!
Tabla de hechos

Id_cliente

Dimensin cliente

Id_cliente
Nombre
Direccin
Fecha_nacimiento

Ingresos
Educacin
Nmero_hijos
Estado_civil
Puntaje-credito

Tabla de hechos
Dimensin cliente

Id_cliente
Nombre
Fecha_nacimiento

Dimensin demografa

Id_demog
Direccin
Ingresos
Educacin
Nmero_hijos
Estado_civil
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia
Puntaje-credito

Id_cliente
Id_demog

Dimensiones Junk

Banderas, indicadores, atributos que no


son usados frecuentemente (parecen no
organizados coherentemente!)
No se debe:

Dejarlos en la tabla de hechos


Colocar cada uno en su propia dimensin

Estudiarlos cuidadosamente y colocarlos


en una o ms dimensiones junk
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Dimensiones Junk

Ejemplo: 10 indicadores Si/No

210 registros

Encuestas con preguntas de si y no.

Una dimensin junk compone un grupo de banderas y


atributos de texto removidos de la tabla de hechos

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Tablas de dimensiones extendidas

Muchos a muchos Tabla de hechos


Registro Medico

Dimensin diagnstico

Id_diagnstico(PK)

Id_time(FK)
Id_paciente(FK)
Id_proveedor(FK)
Id_diagnostico(FK)

Mltiples diagnsticos
para el mismo
paciente?

Crear una tabla puente entre la dimensin y la


Tabla de hechos
tabla de hechos
Registro Medico

Dimensin diagnstico

Id_diagnstico (PK)

Tabla puente que agrupa


diagnsticos

Id_diagnstico_grupo (PK)
Id_diagnstico (PK)
Peso_diagnstico
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Id_time(FK)
Id_paciente(FK)
Id_proveedor(FK)
Id_diagnostico_grupo(FK)

Tablas de dimensiones extendidas

Con el tiempo el paciente puede tener varios


grupos de diagnstico
Tabla de hechos
Registro Medico

Dimensin diagnstico

Id_diagnstico (PK)

Tabla puente que agrupa


diagnsticos

Id_diagnstico_grupo (PK)
Id_diagnstico (PK)
Id_paciente (PK)
Peso_diagnstico
fecha_inicial
fecha_final

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Id_time(FK)
Id_paciente (FK)
Id_proveedor (FK)
Id_diagnostico_grupo (FK)

Ejercicio

Cuentas de balance. Una cuenta puede


pertenecer a ms de una persona.

Tabla de hechos Balance mensual de la cuenta

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Dimensiones Role-playing

Una sola dimensin aparece muchas veces


en la tabla de hechos
Tabla de hechos
fecha_orden (FK)
fecha_de_empaque (FK)
fecha_de_compra (FK)
fecha_de_envio (FK)
fecha_de_pago (FK)
fecha_de_devolucin (FK)

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Todos los atributos


son FK a la dimensin
fecha

Construir la matrix

Lista de data marts


Lista de dimensiones

Usar el mtodo de 4 pasos para cada tabla


de hechos (data mart)
Descripcin detallada de los atributos de
las dimensiones
Hoja de datos derivados o calculados
Definiciones de los datos fuente
Mapa de fuente-destino (entrada al ETL)

Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

Referencias

[1] Wiley - Mastering Data Warehouse Design Relational And Dimensional Techniques 2003.
[2] Wiley - Data Analysis -The Data Warehouse
Toolkit - Second Edition.
[3] Wiley - Building The Data Warehouse - Third
Edition
[4] Wiley - The Data Warehouse ETL Toolkit 2005.
[5] Wiley - The Data Warehouse Lifecycle Toolkit
1998
[6] MicroStrategy - Business Intelligence - 2006
Por Elizabeth Len Guzman - TEBD Universidad Nacional de Colombia

También podría gustarte