Está en la página 1de 5

Data Warehouse & Olap 1

BAFING

1.1 Modelamiento Estrella (STAR)

Para en el caso de nuestra organización la técnica más popular


para diseñar un data mart es el esquema STAR (Estrella). Esta
estructura asocia una tabla de hechos (Fact Table) con múltiples
tablas de dimensión (dimension tables).

Este modelo que hemos implementado incrementa la


performance de las consultas, al reducir considerablemente
el número de lecturas efectuadas sobre el disco.

A continuación se listan los componentes de un esquema STAR:

Fact Table

Un data mart implementado con Analysis Services está orientado a


brindar a los usuarios información numérica, que contribuya a
entender el comportamiento del negocio y tomar mejores
Data Warehouse & Olap 2

decisiones. Esta información numérica recibe el nombre de


medida (measure).

Algunos ejemplos de medidas comúnmente utilizadas por todo


tipo de negocio son: ventas, unidades vendidas, costo, gasto, etc.

Las medidas se almacenan en una o más tablas de hechos (fact


tables). Toda tabla de hechos contiene una cantidad variable de
columnas numéricas, que almacenan los valores de las medidas.
Tablas de dimensión

Para entender el negocio, es fundamental conocer los valores de


las ventas, los costos y los gastos. Sin embargo, estos números son
de escasa utilidad si no se definen los criterios que se usarán para
cruzar la información.

Por el caso en lo que es la medida Ventas, por sí sola, no brinda


suficiente información. En un reporte, ¿estamos visualizando el
total de ventas desde que se fundó la empresa? ¿O las ventas para
un determinado período de tiempo? ¿Es necesario ver las ventas
desglosadas por cliente y producto? ¿Se desea visualizar las ventas
por distribuidor?

En este caso, tiempo, cliente, producto y distribuidor


constituyen ejemplos de lo que, en la terminología de Business
Intelligence, se denomina dimensiones. Las dimensiones
contienen las descripciones de las entidades principales del
negocio, respecto de las cuales se calcularán las medidas.

Las dimensiones tienen múltiples criterios de agrupación. Por


ejemplo, una dimensión de ubicación geográfica puede agrupar su
información en continentes, regiones, países y ciudades. Estos
criterios de agrupación se denominan niveles (levels). La
principal característica de los niveles es que cada nivel se
encuentra contenido en su nivel superior: una ciudad está
contenida en un país, dicho país en una región, y la región en un
continente.

AQUÍ ACABA LO QUE ES MODELAMIENTO STAR…..


Data Warehouse & Olap 3

AQUÍ en ejemplo para un Datamart de tarjetas de crédito en


Bafing (si usa tarjetas de crédito xd)

Diseño de un data mart para tarjetas de crédito. (BAFING)

El área de tarjetas de crédito de un banco desea implementar un


data mart. Se desea visualizar la información de créditos
concedidos y pagos hasta llegar a cada tarjeta. Las tarjetas pueden
ser de dos tipos: “VISA” y “MASTERCARD”. También se desea
visualizar los créditos y pagos por cada vendedor y cada cliente.
Cada cliente pertenece a un distrito, cada distrito a una provincia
y cada provincia a un departamento. Cada vendedor pertenece a
una agencia, y cada agencia pertenece a un distrito, cada distrito a
una provincia y cada provincia a un departamento. Las métricas
deben visualizarse como totalizados anuales, semestrales,
trimestrales y mensuales. Diseñe las dimensiones, las medidas y el
modelo de datos.

Solución:

El primer paso en la construcción de un data mart es la definición


de las medidas. Del enunciado del problema, puede deducirse que
existen dos medidas en este data mart: créditos concedidos y
pagos.

A continuación, se deben establecer las dimensiones del data


mart. Se desea visualizar la información por cliente y vendedor.
Esto sugiere la existencia de dos dimensiones: Cliente y
Vendedor. Para cada dimensión, se deben establecer los niveles.
Cada cliente está en un distrito, cada distrito en una provincia y
cada provincia en un departamento. Por tanto, la dimensión
Cliente tiene los siguientes niveles:
Data Warehouse & Olap 4

Dimensión Cliente
. Departamento
.. Provincia
… Distrito
…. Nombre cliente

Obsérvese el uso de la notación de puntos para representar a los


niveles. El nivel más superior se representa por un punto al lado
izquierdo, el nivel siguiente por dos puntos, y así sucesivamente.

Respecto de la dimensión Vendedor, se sabe que cada vendedor


está en una agencia, cada agencia en un distrito, cada distrito en
una provincia y cada provincia en un departamento. Por tanto, los
niveles de la dimensión Vendedor son:
Dimensión Vendedor
. Departamento
.. Provincia
… Distrito
…. Agencia
….. Nombre Vendedor

Por otro lado, las tarjetas de crédito pueden ser de dos tipos:
“VISA” y “MASTERCARD”. Esto sugiere la existencia de la
dimensión Tipo Tarjeta, con un solo nivel.

Dimensión Tipo Tarjeta


. Tipo Tarjeta
.. Nro. Tarjeta

Por último, las medidas deben visualizarse como totalizados


anuales, semestrales, trimestrales y mensuales. Por lo general,
todo data mart tiene una dimensión que representa las escalas
temporales. En este caso, existe una dimensión llamada Tiempo,
que tiene la siguiente estructura:

Dimensión Tiempo
. Año
.. Semestre
… Trimestre
…. Mes

El modelo del STAR para este datamart es:

TIEMPO_DIM
Tiempo_Key
Año
Semestre
Trimestre
Mes
Data Warehouse & Olap 5

TARJETAS_FACT
Tiempo_Key
Cliente_Key
VENDEDOR_DI Vendedor_Key
M TipoTarjeta_Key
Vendedor_Key Creditos
IdVendedor concedidos TIPOTARJETA_D
Pagos IM
Departamento
TipoTarjeta_Key
Provincia
IdTipoTarjeta
Distrito
TipoTarjeta
Agencia
NumeroTarjeta
Nombre
vendedor