Está en la página 1de 10

CONCEPTOS

Antes de crear un modelo dimensional, debe comprender los objetos bsicos que se utilizan
para crear modelos dimensionales: tablas y entidades de hechos, tablas y entidades de
dimensiones, jerarquas, outriggers y medidas.

Tablas y entidades de hechos


Una tabla de hechos o una entidad de hecho es una tabla o entidad de un esquema
de estrella o copo de nieve que almacena medidas para medir el negocio, como las
ventas, el coste de las mercancas o las ganancias.

Tablas y entidades de dimensiones


Una tabla de dimensiones o entidad de dimensiones es una tabla o entidad de un
esquema de estrella, copo de nieve o constelacin que almacena detalles acerca de
hechos. Por ejemplo, una tabla de dimensin de hora almacena los distintos
aspectos del tiempo, como el ao, trimestre, mes y da.

Jerarquas
Una jerarqua es una relacin de muchos a uno entre los miembros de una tabla o
entre tablas. Una jerarqua consta bsicamente de distintos niveles, y cada uno
corresponde a un atributo de dimensin.

Outriggers
Un outrigger es una entidad o una tabla de dimensiones unida a otras tablas de
dimensiones en un esquema de estrella. Los outriggers se utilizan cuando una tabla
de dimensiones tiene un esquema de copo de nieve.

Medidas
Las medidas definen un atributo de medida y se utilizan en las tablas de hechos.
Puede calcular medidas correlacionndolas directamente con un valor numrico en
una columna o atributo. Una funcin de agregacin resume el valor de las medidas
para el anlisis dimensional.

TABLA DE ENTIDAD O HECHOS

Una tabla de hechos o una entidad de hecho es una tabla o entidad de un esquema de
estrella o copo de nieve que almacena medidas para medir el negocio, como las ventas, el
coste de las mercancas o las ganancias.

Las tablas y entidades de hechos agregan medidas o los datos numricos de un negocio.
Para medir los datos de una tabla o entidad de hechos, todas las medidas de una tabla o
entidad de hechos debe corresponder al mismo grano.

Para obtener los datos ms tiles de una tabla o entidad de hechos, debe utilizar medidas
que sean numricas y aditivas. La utilizacin de estas medidas garantiza que los datos se
puedan recuperar y agregar de manera que el negocio pueda hacer uso de la riqueza de
datos de negocio de la base de datos.

Las tablas y entidades de hechos tambin contienen claves forneas a las tablas de
dimensiones. Estas claves forneas relacionan cada fila de datos de la tabla de hechos con
sus correspondientes dimensiones y niveles.
Las tablas y entidades de hechos utilizan claves primarias que son claves compuestas.
Una clave compuesta consta de un subconjunto de otras claves. Si una tabla o entidad de
un modelo dimensional utiliza una clave compuesta, esa tabla ser una tabla o entidad de
hechos. El uso de claves compuestas hace que la tabla o entidad tenga una relacin de
muchos a uno con otras tablas y entidades del modelo dimensional.

Tipos de tablas y entidades de hechos

Hay tres tipos de tablas y entidades de hechos:

Transaccin

Una tabla de hechos de transacciones o entidad de hechos de transacciones registra una


fila por transaccin.

Peridico

Una tabla de hechos peridicos o entidad de hechos peridicos almacena una fila para un
grupo de transacciones que se realizan a lo largo de un perodo de tiempo.

Acumulativo

Una tabla de hechos acumulativos o entidad de hechos acumulativos almacena una fila para
el tiempo de vida total de un suceso. Un ejemplo de una tabla o entidad de hechos
acumulativos registra el tiempo de vida de una aplicacin de tarjetas de crdito desde el
momento en que se enva al momento en que se acepta.
Nota: No puede especificar explcitamente el tipo de tabla o entidad de hechos utilizando el
entorno de trabajo. Para documentar los tipos de tablas de hechos que est utilizando,
puede aadir la informacin a la documentacin.

En la tabla siguiente se comparan los distintos tipos de tablas y entidades de hechos. En la


tabla se enfatiza que cada una tiene un tipo distinto de grano y que hay diferencias en
cmo se realizan en cada una las operaciones de insercin y actualizacin. Por ejemplo, en
las tablas y entidades de hechos peridicos, slo se realizan operaciones de insercin. Sin
embargo, en una tabla o entidad de hechos acumulativos, la fila se inserta primero, y
cuando se consigue un objetivo y se hacen disponibles medidas adicionales, se actualiza
posteriormente la tabla o entidad.

Tabla 1. Comparacin de tipos de tablas de hechos


Caracterstic
Transaccin Peridico Acumulativo
a

Una fila por Una fila para el tiempo de vida total


Grano Una fila por perodo de tiempo
transaccin de un suceso

Dimensin de fecha en
Dimensin de fecha en la
Dimensin el nivel ms bajo de Varias dimensiones de fecha
granularidad de fin de perodo
granularidad

Nmero ms alto de dimensiones


Nmero de Ms que el tipo de Menos que el tipo de hechos
cuando se compara con otros tipos de
dimensiones hechos peridicos de transacciones
tablas de hechos

Utiliza dimensiones
Dimensiones Utiliza dimensiones Utiliza dimensiones conformadas
conformadas
conformadas conformadas compartidas compartidas
compartidas

Se relaciona con
Se relaciona con actividades Se relaciona con actividades que
Medidas actividades de
peridicas tienen un tiempo de vida definitivo
transacciones
Ms pequea que la tabla de
Es el mayor tamao.
hechos de transacciones, ya La de tamao ms pequeo cuando
Tamao de En el nivel de grano ms
que el grano de la dimensin de se compara con las tablas de hechos
base de datos detallado, tiende a
fecha y hora es peridicos y de transacciones.
crecer muy rpido.
significativamente mayor.

Funciona bien y se Funciona mejor que otros


puede mejorar eligiendo tipos de tablas de hechos, ya
Rendimiento Funciona bien
un grano por encima del que los datos se almacenan en
ms detallado un grano menos detallado

Insertar S S S

S, cuando se alcanza un objetivo en


Actualizar No No
una actividad determinada.

Suprimir No No No

Crecimiento Lento en comparacin con Lento en comparacin con la tabla


de tabla de Muy rpido una tabla de hechos basada en de hechos peridicos y de
hechos transacciones transacciones

Media, porque los datos se


Alta, principalmente Baja o muy baja, almacenan principalmente en el nivel
Necesidad
porque los datos se principalmente porque los datos diario. Sin embargo, los datos de las
de tablas de
almacenan a un nivel ya estn almacenados en un tablas de hechos acumulativos se
agregacin
muy detallado nivel alto de agregacin encuentran en un nivel inferior al nivel
de transaccin.

Tabla de hechos de ejemplo

En la tabla siguiente se realiza un seguimiento de las ventas de los productos vendidos por
la empresa ficticia Great Outdoors:

GOSALESDW.SLS_SALES_FACT

ORDER_DAY_KEY

ORGANIZATION_KEY

EMPLOYEE_KEY

RETAILER_KEY

RETAILER_SITE_KEY

PRODUCT_KEY

PROMOTION_KEY

ORDER_METHOD_KEY

SALES_ORDER_KEY

SHIP_DAY_KEY

CLOSE_DAY_KEY

QUANTITY

UNIT_COST

UNIT_PRICE

UNIT_SALE_PRICE

GROSS_MARGIN

SALE_TOTAL

GROSS_PROFIT

TABLA DE DIMENSIONES O ENTIDADES DE DIMENSIONES


Una tabla de dimensiones o entidad de dimensiones es una tabla o entidad de un esquema
de estrella, copo de nieve o constelacin que almacena detalles acerca de hechos. Por
ejemplo, una tabla de dimensin de hora almacena los distintos aspectos del tiempo, como
el ao, trimestre, mes y da.
Una tabla de dimensiones almacena informacin descriptiva sobre los valores numricos de
una tabla de hechos. Por ejemplo, las tablas de dimensiones para una aplicacin de anlisis
de mercado pueden incluir el tipo de perodo de tiempo, regin comercial y producto.

Las tablas de dimensiones describen los distintos aspectos de un proceso de negocio. Por
ejemplo, si desea determinar los objetivos de ventas, puede almacenar los atributos de
dichos objetivos en una tabla de dimensiones. Las tablas de dimensiones agrupan los datos
en la base de datos cuando el negocio crea informes. Por ejemplo, puede agrupar objetivos
de ventas por pas, producto o minorista, y dichas agrupaciones se almacenarn en tablas
de dimensiones.

Cada tabla de dimensiones contiene varias columnas y atributos que se utilizan para
describir los procesos de negocio.

Dado que los datos de una tabla de dimensiones se suelen desnormalizar, las tablas de
dimensiones tienen un gran nmero de columnas. Las tablas de dimensiones contienen
menos filas de datos que la tabla de hechos. Las columnas de una tabla de dimensiones se
utilizan para crear informes o para mostrar resultados de consultas. Por ejemplo, las
descripciones textuales de un informe se crean desde las etiquetas de las columnas de una
tabla de dimensiones.

Considere los puntos siguientes cuando cree las tablas de dimensiones:

Grano

Cada tabla de dimensiones tiene slo un elemento en el nivel ms bajo de detalle, y este
elemento se conoce como grano de la dimensin.

Elementos no de clave

Cada elemento no de clave debe aparecer en una nica tabla de dimensiones.

Dimensiones de tiempo y fecha

Generalmente tendr varias dimensiones de tiempo y fecha en el modelo dimensional.

Nmero de dimensiones

Los modelos dimensionales generalmente slo contienen entre 10 y 15 tablas de


dimensiones. Si necesita ms dimensiones, fusiones esas tablas de dimensiones en una
sola tabla.

Creacin de relaciones de uno a muchos

Las filas de una tabla de dimensiones establecen una relacin de uno a muchos con la tabla
de hechos o los outriggers.

Dimensiones compartidas

Generalmente, las tablas de dimensiones compartidas por varias tablas de hechos (o varios
modelos dimensionales) se denominan dimensiones compartidas. Si ya existen dimensiones
compartidas para cualquiera de las dimensiones del depsito de datos o del modelo
dimensional, debe utilizar las dimensiones compartidas. Si va a desarrollar nuevas
dimensiones que puedan utilizarse en todo el almacn de empresa, debe desarrollar un
diseo que anticipe las necesidades del almacn de empresa.

JERARQUIA

Una jerarqua es una relacin de muchos a uno entre los miembros de una tabla o entre
tablas. Una jerarqua consta bsicamente de distintos niveles, y cada uno corresponde a un
atributo de dimensin.

En otras palabras, una jerarqua es una especificacin de niveles que representa relaciones
entre distintos atributos de una jerarqua. Por ejemplo, una posible jerarqua en la
dimensin de fecha es Ao > Trimestre > Mes > Da.

OUTRIGGER

Un outrigger es una entidad o una tabla de dimensiones unida a otras tablas de


dimensiones en un esquema de estrella. Los outriggers se utilizan cuando una tabla de
dimensiones tiene un esquema de copo de nieve.

Los outriggers son entidades o tablas compartidas por ms de una dimensin.

Una entidad o tabla que est incluida en una jerarqua pero no est relacionada
directamente con la tabla de hechos se conoce como outrigger. Los outriggers se utilizan
con frecuencia cuando otra dimensin hace referencia a una entidad o tabla de
dimensiones. La clave fornea de una entidad o tabla de dimensiones hace referencia a la
clave primaria de un outrigger.

MEDIDAS

Las medidas definen un atributo de medida y se utilizan en las tablas de hechos. Puede
calcular medidas correlacionndolas directamente con un valor numrico en una columna o
atributo. Una funcin de agregacin resume el valor de las medidas para el anlisis
dimensional.

Las medidas tienen sentido en el contexto de un conjunto de dimensiones. Por ejemplo,


unos ingresos de 300 no tienen sentido en s mismos. Cuando se pone una medida de
ingresos en el contexto de las dimensiones, como por ejemplo regin y tiempo, la medida
tiene sentido: los ingresos de Nueva York en enero son de 300. Ejemplos comunes de
medidas son los ingresos, el coste y las ganancias.

Una medida se define mediante una lista de agregacin. Si una medida tiene ms de una
agregacin, las funciones de agregacin se realizarn en el orden en que aparecen listadas,
y cada agregacin posterior tomar como entrada el resultado de la agregacin anterior.

Cada agregacin especifica una funcin que se aplica a la lista de dimensiones


correspondiente. La funcin de agregacin puede ser cualquier funcin de agregacin
soportada por la base de datos subyacente. Los entornos de trabajo soportan varias
funciones de agregacin:
AVG
CORRELATION
COUNT
COUNT_BIG
COVARIANCE
MAX
MIN
STTDEV
SUM
VARIANCE

El objeto de medida slo puede agregar cada dimensin una vez. Una medida debe tener
una agregacin con una lista vaca de dimensiones, y otras agregaciones deben tener una
lista explcita de dimensiones. La agregacin para una lista vaca de dimensiones se aplica a
todas las dimensiones del modelo de cubo que no son utilizadas especficamente por otra
agregacin.

Si la medida tiene una funcin de agregacin, como por ejemplo CORRELATION, que
requiere dos o ms parmetros, la medida tendr dos o ms expresiones SQL.

Las medidas tambin tienen un tipo de datos basado en tipos de datos SQL. El entorno de
trabajo determina automticamente el tipo de datos de una medida.

Las medidas de una tabla de hechos pueden ser de uno de estos tipos:

Aditiva

Las medidas aditivas son aquellas que se pueden agregar a todas las dimensiones
de la tabla de hechos, y son el tipo ms comn de medida. Las medidas aditivas se
utilizan en varias dimensiones con el fin de realizar sumas.

Dado que el modelado dimensional implica jerarquas en dimensiones, la agregacin


de informacin en distintos miembros de la jerarqua es un elemento clave en la
utilidad del modelo. Puesto que la agregacin es un proceso aditivo, utilice medidas
aditivas el mayor nmero de veces posible.

Semiaditiva

Las medidas semiaditivas se pueden agregar a algunas dimensiones, pero no a


todas. Por ejemplo, medidas como el recuento de personas y el inventario se
consideran semiaditivas.

No aditiva

Las medidas no aditivas son aquellas que no se pueden agregar a ninguna de las
dimensiones. Estas medidas no se pueden agregar lgicamente entre registros o
filas de hechos. Las medidas no aditivas generalmente son el resultado de
proporciones u otros clculos matemticos. El nico clculo que se puede realizar
para dicha medida es obtener un recuento del nmero de filas de tales medidas.

Esquema Dimensional

Una base de datos consta de una o ms tablas, y las relaciones entre todas las tablas de la base de
datos se denomina colectivamente el esquema de base de datos. Aunque hay muchos diseos de
esquema diferentes, las bases de datos en las que se realizan consultas de datos histricos
generalmente utilizan un diseo de esquema dimensional.

El modelado dimensional en el entorno de trabajo se realiza a nivel lgico y fsico. Los conceptos del
modelado dimensional se aplican a los modelos de datos lgicos y fsicos. El modelado dimensional
aade otra capa a los modelos de datos, que funcionan con muchos proveedores de gestin de base
de datos.

Utilice el modelado dimensional para conseguir los siguientes beneficios:


Puede crear consultas que respondan a cuestiones de negocio. Generalmente, una consulta
calcula alguna medida de rendimiento entre varias dimensiones de negocio.
Puede crear consultas SQL. La mayora de proveedores RDBMS utilizan el lenguaje SQL.

Un esquema dimensional separa fsicamente las medidas que cuantifican el negocio de los elementos
descriptivos (tambin llamados dimensiones) que describen y categorizan el negocio. El esquema
dimensional puede ser fsico o lgico. Un esquema dimensional fsico generalmente se representa en
forma de esquema de estrella o de copo de nieve, en el que los objetos que contiene son en realidad
tablas de base de datos. El esquema dimensional puede incluso adoptar la forma de una sola tabla o
vista, en la que todos los hechos y dimensiones estn en columnas distintas de dicha tabla o vista. En
un esquema dimensional lgico, los hechos, las medidas y las dimensiones se representan como
entidades y atributos independientes a un proveedor de base de datos y, por lo tanto, se pueden
transformar en un esquema dimensional fsico para cualquier proveedor de base de datos.

Esquemas de estrella
Un esquema de estrella es un tipo de esquema de base de datos relacional que consta de una
sola tabla de hechos central rodeada de tablas de dimensiones.

Esquemas de copo de nieve


El esquema de copo de nieve consta de una tabla de hechos que est conectada a muchas
tablas de dimensiones, que pueden estar conectadas a otras tablas de dimensiones a travs
de una relacin de muchos a uno.

Esquemas de constelacin
Un esquema de constelacin es una combinacin de un esquema de estrella y un esquema de
copo de nieve. Los esquemas de constelacin son esquemas de copo de nieve en los que slo
algunas de las tablas de dimensiones se han desnormalizado.

Esquemas de estrella

Un esquema de estrella es un tipo de esquema de base de datos relacional que consta de una sola
tabla de hechos central rodeada de tablas de dimensiones.
En la siguiente figura se muestra un esquema de estrella con una sola tabla de hechos y cuatro tablas
de dimensiones. Un esquema de estrella puede tener cualquier nmero de tablas de dimensiones. Las
ramas situadas al final de los enlaces que conectan las tablas indican una relacin de muchos a uno
entre la tabla de hechos y cada tabla de dimensiones.
Figura 1. Esquema de estrella con una sola tabla de hechos con enlaces a varias tablas de
dimensiones.
Esquemas de copo de nieve

El esquema de copo de nieve consta de una tabla de hechos que est conectada a muchas tablas
de dimensiones, que pueden estar conectadas a otras tablas de dimensiones a travs de una
relacin de muchos a uno.

Las tablas de un esquema de copo de nieve generalmente se normalizan en el tercer formulario


de normalizacin. Cada tabla de dimensiones representa exactamente un nivel en una jerarqua.

En la siguiente figura se muestra un esquema de copo de nieve con dos dimensiones, cada una
con tres niveles. Un esquema de copo de nieve puede tener varias dimensiones y cada
dimensin puede tener varios niveles.

Figura 1. Esquema de copo de nieve con dos dimensiones y tres niveles cada una

Esquemas de constelacin
Un esquema de constelacin es una combinacin de un esquema de estrella y un esquema de
copo de nieve. Los esquemas de constelacin son esquemas de copo de nieve en los que slo
algunas de las tablas de dimensiones se han desnormalizado.
El objetivo de los esquemas de constelacin es aprovechar las ventajas de los esquemas de
estrella y de copo de nieve. Las jerarquas de los esquemas de estrella estn desnormalizadas,
mientras que las jerarquas de los esquemas de copo de nieve estn normalizadas.

Los esquemas de constelacin estn normalizados para eliminar las redundancias de las
dimensiones. Para normalizar el esquema, las jerarquas dimensionales compartidas se colocan
en outriggers.

En la siguiente figura se representa un esquema de constelacin de ejemplo:

Figura 1. Esquema de constelacin con un hecho y dos dimensiones que comparten un outrigger

Relaciones de muchos a uno


Una relacin de muchos a uno hace referencia a una tabla o entidad que contiene valores y hace
referencia a otra tabla o entidad que tiene valores exclusivos. Las relaciones de muchos a uno
con frecuencia son impuestas por las relaciones de clave fornea y clave primaria, y
generalmente las relaciones se establecen entre las tablas de hechos y las entidades o tablas de
dimensiones y entre los niveles de una jerarqua.

La relacin se utiliza con frecuencia para describir clasificaciones o agrupaciones. Por ejemplo, en
un esquema geogrfico que tenga las tablas Regin, Estado y Ciudad muchos estados
pertenecen a una regin determinada, pero los mismos estados no pueden pertenecer a dos
regiones diferentes. Lo mismo ocurre con las ciudades, una ciudad slo est en un estado (las
ciudades que tienen el mismo nombre pero estn en ms de un estado se deben tratar de forma
algo distinta). Cada ciudad existe en un solo estado, pero un estado puede tener muchas
ciudades, de ah el trmino muchos a uno.
Los distintos elementos, o niveles, de una jerarqua deben tener relaciones de muchos a uno
entre los niveles hijo y padre, independientemente de si la jerarqua se representa fsicamente
en un esquema de estrella, de copo de nieve o de constelacin. Los datos deben cumplir con estas
relaciones. Los datos limpios que son necesarios para aplicar las relaciones de muchos a uno son una
caracterstica importante de un esquema dimensional. Adems, estas relaciones posibilitan la creacin
de cubos a partir de los datos relacionales.

Al definir un modelo dimensional, las relaciones de muchos a uno que definen la jerarqua se
convierten en niveles de una dimensin.