Está en la página 1de 56

Tcnicas de modelado de Data Warehousing

ING. WILLIAM ESCOBAR

El modelo dinmico de DW

Introduccin

El modelado de DW es el proceso

de construccin de un modelo de datos que ser almacenado en el DW. Las tcnicas se involucran en el proceso de modelado de DW.

Origen de las diferencias del modelado


Hay tres razones principales de la necesidad

de tcnicas:
Una

DW tiene propiedades base que hacen la diferencia con OLTP. El contexto computacional difiere entre DW y OLTP. Inherente a la habilitacin de DW es la imprecisin y el carcter incompleto de las necesidades del usuario final y la evolucin continua del DW.

Propiedades base
Un DW es una coleccin integradas de bases

de datos. Un DW contiene datos de diferentes reas. Un DW contiene diferentes categoras, como datos primitivos, resumidos y agregados. Un DW generalmente contiene bases de datos de soporte

Propiedades base

Contexto computacional
Se diferencia por la manera en que los

usuario utilizan los DWs y OLTP. Los usuarios de OLTP estn protegidos por la capa de aplicacin. Un DW se centra mas en los datos que en los procesos.

Data Marts

Data Marts
Cierta complejidad inherente de los DW no

est presente en los DMs. Por lo que las tcnicas son diferentes, tal es el caso de la arquitectura de datos. Los DMs se deben enfocar ms al usuario final que los DWs. Aunque, tal como se mencion en el capitulo anterior el desarrollo de DW aplica para DMs.

Modelado Dimensional
Por otro lado hay quienes proclaman

que los modelos ER son inutilizables para el modelado dimensional por los tecnicismos y complejidad.

Actividades

Actividades: Toma de requerimientos


Durante esta actividad se recolectan los

requerimiento de usuarios finales y se documenta. Se orienta a entender el problema. Generalmente no hay detalla ni esquemas. Se recomiendan entrevistas, estudio de documentacin y reportes, y monitoreo de informacin.

Actividades: Anlisis de requerimientos

Se investiga de forma informal los

requerimientos, se producen los modelos dimensionales iniciales. Una tcnica de notacin se muestra a continuacin:

Actividades: Anlisis de requerimientos

As tambin es importantes las

actividades propias del anlisis de requerimientos:

Actividades: Validacin de requerimientos

En

esta actividad se utiliza el modelo dimensional inicial, para validarlo con los requerimientos del usuario final Verificar el alcance e impacto.

Actividades: Modelado de requerimientos


Luego de la validacin el modelo se

convierte en un modelo dimensional detallado. De esta manera puede ser extendido y optimizado.

Actividades

Luego se proceden con estas sub

actividades:
Diseo

Construccin
Validacin Integracin

A continuacin se detalla cada actividades identificando las diferentes tcnicas.

Toma de requerimientos

Toma de requerimientos
Puede ser clasificado en dos categoras:
Requerimientos

orientados al proceso, representa los principales elementos de procesamiento de informacin que los usuarios finales ejecutarn. Requerimientos orientados a la informacin, representa las principales categoras de informacin y los datos que los usuarios finales requieren para el anlisis.

Toma de requerimientos
Los requerimientos se toman conforme a las

categoras anteriores, ciertos factores:


El

dependiendo

de

tipo de problema de anlisis de informacin que se consider para la implementacin del proyecto. Y la capacidad de que los usuarios finales expresen las necesidades de informacin y los escenarios y estrategias

Requerimientos orientados al proceso


Existen diferentes tipos disponibles:
Objetivos

de negocio: Son expresiones de alto nivel de los objetivos del anlisis de informacin, expresados en trminos de negocio.

Por ejemplo: El DW debe tener soporte

para el anlisis de costos de fabricacin y ventas de productos fabricados y vendidos.

Requerimientos orientados al proceso


Consultas de negocio: Son representadas por

consultas, hiptesis y preguntas analticas que los usuarios finales quieren resolver.
A

un cliente en particular que determinado producto se le vende. Comparar los valores de compras de dos clientes en los ltimos seis meses. Clculo del promedio de ventas por categora de producto y por regin.

Requerimientos orientados al proceso


Escenarios de anlisis de datos: Son una

manera de agregar sustancia al conjunto de requerimientos que sern capturados y analizados. Hay dos tipos de escenarios:
Escenarios

de flujo de trabajo de consultas: Representan secuencias de consultas del negocio. Estrategias de inferencia de conocimiento: Proveen mas entendimiento de las actividades del usuario final.

Requerimientos orientados a la informacin


Capturan la percepcin inicial de los

tipos de informacin que el usuario final utiliza en sus actividades. Hay diferentes categoras:
Temas

de informacin: Son categora de alto nivel de informacin de negocio, es usualmente utilizado para la construccin del modelo.

Requerimientos orientados a la informacin

Modelos de alto nivel: Hay muchos

modelos disponibles utilizados para especificar los requerimientos Dichos modelos pueden integrarse de la siguiente manera:

Anlisis de requerimientos

Anlisis de requerimientos
La tcnicas asociadas son utilizadas

para la construccin del modelo inicial que representa los requerimientos tomados de forma informal anteriormente. Se debe producir una representacin esquemtica del modelo.

Anlisis de requerimientos
Al alcance se resume en:
Determinar

las mtricas candidatas, tabla de hechos, dimensiones y jerarquas. Determinar la granularidad. Construir el modelo inicial Establecer un directorio de negocio para los elementos del modelo.

Anlisis de requerimientos

Se debe lograr una tcnica de

notacin esquemtica

Determinar las mtricas, dimensiones y tabla de hechos


Es necesaria la identificacin de: Mtricas Dimensiones y sus jerarquas Tabla de hechos

Hay

tres enfoques para determinar el modelo:


Determinar

primero las mtricas Determinar la dimensiones Determinar la tabla de hechos

Determinar primero las mtricas


Se determina primero las mtricas,

luego las dimensiones asociadas a las mtricas y por ltimo la tabla de hechos. Este enfoque es llamado enfoque orientado a consultas.

Determinar las dimensiones


Determinar primero las dimensiones, luego

las mtricas y por ltimo la tabla de hechos. Se utiliza cuando la fuente de datos est empezando a ser utilizado como la base determinando los elementos candidatos. Este enfoque es llamado enfoque orientado a la fuente de datos.

Determinar la tabla de hechos


Determinar primero la tabla de hechos,

luego las dimensiones y por ltimo las mtricas. Este enfoque es llamado enfoque orientado al negocio. Se enfoca en el dominio del negocio.

NOTA
Hay que tener claro que estos elementos son

los candidatos, por la naturaleza del DW estos pueden cambiar en el modelo final

Mtricas candidatas
Son organizadas analizando las consultas de

negocio, esencialmente corresponden a los datos que los usuarios utilizan en sus consultas para medir el comportamiento o rendimiento de un objeto o proceso de negocio. Requiere de un anlisis inteligente y no mecnico.

Mtricas candidatas
La buenas mtricas candidatas son

aquellas numricas y que estn involucradas en clculos agregados.


Total

de ingresos Total de costos

Granularidad de las mtricas


Puede ser definida intuitivamente como el

nivel ms bajo de detalle utilizado para registrar la mtrica. Por ejemplo el promedio de stock de un producto por mes. La mtricas estn asociadas a varias dimensiones. La granularidad est determinada por la combinacin de las dimensiones.

Granularidad de las mtricas


Se ver que mtricas de igual granularidad

pueden ser candidatas para formar una tabla de hechos. Bsicamente la granularidad determina la profundidad que los usuarios podrn utilizar a la hora de analizar los datos.

Dimensiones candidatas
Las mtricas requieren dimensiones para su

interpretacin. Por ejemplo la cantidad en stock requiere que se conozca el producto, ubicacin y periodo de tiempo en que el valor est asociado. Las dimensiones son las coordenadas en las cuales las mtricas son interpretadas.

Dimensiones candidatas
Un enfoque genrico y muy utilizado

para identificar las dimensiones candidatas es investigar los propiedades fundamentales de las mtricas, en el contexto del proceso y reglas de negocio.

Tabla de hechos candidata


En principio, la mtricas junto con las

dimensiones hacen una tabla de hecho del modelo dimensional. Es importante identificar si habr una o mas tablas de hecho, relacionando las diferentes mtricas y su granularidad.

Propiedades semnticas de los hechos


Los hechos son los elementos base del

modelo dimensional. Una seleccin representativa de la tabla de hechos corresponde a un dominio del problema dado. Identificando la tabla de hechos a travs del proceso de consolidacin de las mtricas y dimensiones es un enfoque viable.

Propiedades semnticas de los hechos


La

tabla de hechos representan varias cosas fundamentales relacionadas con el negocio:


Representa

una transaccin o un evento de

negocio. Representa el estado de un objeto de negocio. Representa cambios de estado.

Gua para seleccionar la tabla de hechos


Cada hecho debe ser equivalente a un

mundo real de los negocios. Se enfoca en determinado hecho de negocio que representa:
Transacciones

o eventos Estados de objetos de negocio Cambios de estado en los objetos de negocio

Gua para seleccionar la tabla de hechos


Cada hecho debe ser identificable de

manera nica. La granularidad de cada hecho debe ser de grano fino como sea posible.

Tabla de hechos
Transacciones o eventos de negocio

Estado de objetos de negocio


Cambios

en estado de objetos de

negocio

Transacciones o eventos
Las ventas son ejemplos de este tipo, de

manera especifica si se desea analizar el rendimiento se utilizan mtricas como costos totales o ingresos totales. Existen mtricas que son agregadas naturalmente asociadas a otras, por ejemplo en ingresos total, puede estar asociada la cantidad vendida.

También podría gustarte