Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El modelo dinmico de DW
Introduccin
El modelado de DW es el proceso
de construccin de un modelo de datos que ser almacenado en el DW. Las tcnicas se involucran en el proceso de modelado de DW.
de tcnicas:
Una
DW tiene propiedades base que hacen la diferencia con OLTP. El contexto computacional difiere entre DW y OLTP. Inherente a la habilitacin de DW es la imprecisin y el carcter incompleto de las necesidades del usuario final y la evolucin continua del DW.
Propiedades base
Un DW es una coleccin integradas de bases
de datos. Un DW contiene datos de diferentes reas. Un DW contiene diferentes categoras, como datos primitivos, resumidos y agregados. Un DW generalmente contiene bases de datos de soporte
Propiedades base
Contexto computacional
Se diferencia por la manera en que los
usuario utilizan los DWs y OLTP. Los usuarios de OLTP estn protegidos por la capa de aplicacin. Un DW se centra mas en los datos que en los procesos.
Data Marts
Data Marts
Cierta complejidad inherente de los DW no
est presente en los DMs. Por lo que las tcnicas son diferentes, tal es el caso de la arquitectura de datos. Los DMs se deben enfocar ms al usuario final que los DWs. Aunque, tal como se mencion en el capitulo anterior el desarrollo de DW aplica para DMs.
Modelado Dimensional
Por otro lado hay quienes proclaman
que los modelos ER son inutilizables para el modelado dimensional por los tecnicismos y complejidad.
Actividades
requerimiento de usuarios finales y se documenta. Se orienta a entender el problema. Generalmente no hay detalla ni esquemas. Se recomiendan entrevistas, estudio de documentacin y reportes, y monitoreo de informacin.
requerimientos, se producen los modelos dimensionales iniciales. Una tcnica de notacin se muestra a continuacin:
En
esta actividad se utiliza el modelo dimensional inicial, para validarlo con los requerimientos del usuario final Verificar el alcance e impacto.
convierte en un modelo dimensional detallado. De esta manera puede ser extendido y optimizado.
Actividades
actividades:
Diseo
Construccin
Validacin Integracin
Toma de requerimientos
Toma de requerimientos
Puede ser clasificado en dos categoras:
Requerimientos
orientados al proceso, representa los principales elementos de procesamiento de informacin que los usuarios finales ejecutarn. Requerimientos orientados a la informacin, representa las principales categoras de informacin y los datos que los usuarios finales requieren para el anlisis.
Toma de requerimientos
Los requerimientos se toman conforme a las
dependiendo
de
tipo de problema de anlisis de informacin que se consider para la implementacin del proyecto. Y la capacidad de que los usuarios finales expresen las necesidades de informacin y los escenarios y estrategias
de negocio: Son expresiones de alto nivel de los objetivos del anlisis de informacin, expresados en trminos de negocio.
consultas, hiptesis y preguntas analticas que los usuarios finales quieren resolver.
A
un cliente en particular que determinado producto se le vende. Comparar los valores de compras de dos clientes en los ltimos seis meses. Clculo del promedio de ventas por categora de producto y por regin.
manera de agregar sustancia al conjunto de requerimientos que sern capturados y analizados. Hay dos tipos de escenarios:
Escenarios
de flujo de trabajo de consultas: Representan secuencias de consultas del negocio. Estrategias de inferencia de conocimiento: Proveen mas entendimiento de las actividades del usuario final.
tipos de informacin que el usuario final utiliza en sus actividades. Hay diferentes categoras:
Temas
de informacin: Son categora de alto nivel de informacin de negocio, es usualmente utilizado para la construccin del modelo.
modelos disponibles utilizados para especificar los requerimientos Dichos modelos pueden integrarse de la siguiente manera:
Anlisis de requerimientos
Anlisis de requerimientos
La tcnicas asociadas son utilizadas
para la construccin del modelo inicial que representa los requerimientos tomados de forma informal anteriormente. Se debe producir una representacin esquemtica del modelo.
Anlisis de requerimientos
Al alcance se resume en:
Determinar
las mtricas candidatas, tabla de hechos, dimensiones y jerarquas. Determinar la granularidad. Construir el modelo inicial Establecer un directorio de negocio para los elementos del modelo.
Anlisis de requerimientos
notacin esquemtica
Hay
luego las dimensiones asociadas a las mtricas y por ltimo la tabla de hechos. Este enfoque es llamado enfoque orientado a consultas.
las mtricas y por ltimo la tabla de hechos. Se utiliza cuando la fuente de datos est empezando a ser utilizado como la base determinando los elementos candidatos. Este enfoque es llamado enfoque orientado a la fuente de datos.
luego las dimensiones y por ltimo las mtricas. Este enfoque es llamado enfoque orientado al negocio. Se enfoca en el dominio del negocio.
NOTA
Hay que tener claro que estos elementos son
los candidatos, por la naturaleza del DW estos pueden cambiar en el modelo final
Mtricas candidatas
Son organizadas analizando las consultas de
negocio, esencialmente corresponden a los datos que los usuarios utilizan en sus consultas para medir el comportamiento o rendimiento de un objeto o proceso de negocio. Requiere de un anlisis inteligente y no mecnico.
Mtricas candidatas
La buenas mtricas candidatas son
nivel ms bajo de detalle utilizado para registrar la mtrica. Por ejemplo el promedio de stock de un producto por mes. La mtricas estn asociadas a varias dimensiones. La granularidad est determinada por la combinacin de las dimensiones.
pueden ser candidatas para formar una tabla de hechos. Bsicamente la granularidad determina la profundidad que los usuarios podrn utilizar a la hora de analizar los datos.
Dimensiones candidatas
Las mtricas requieren dimensiones para su
interpretacin. Por ejemplo la cantidad en stock requiere que se conozca el producto, ubicacin y periodo de tiempo en que el valor est asociado. Las dimensiones son las coordenadas en las cuales las mtricas son interpretadas.
Dimensiones candidatas
Un enfoque genrico y muy utilizado
para identificar las dimensiones candidatas es investigar los propiedades fundamentales de las mtricas, en el contexto del proceso y reglas de negocio.
dimensiones hacen una tabla de hecho del modelo dimensional. Es importante identificar si habr una o mas tablas de hecho, relacionando las diferentes mtricas y su granularidad.
modelo dimensional. Una seleccin representativa de la tabla de hechos corresponde a un dominio del problema dado. Identificando la tabla de hechos a travs del proceso de consolidacin de las mtricas y dimensiones es un enfoque viable.
mundo real de los negocios. Se enfoca en determinado hecho de negocio que representa:
Transacciones
manera nica. La granularidad de cada hecho debe ser de grano fino como sea posible.
Tabla de hechos
Transacciones o eventos de negocio
en estado de objetos de
negocio
Transacciones o eventos
Las ventas son ejemplos de este tipo, de
manera especifica si se desea analizar el rendimiento se utilizan mtricas como costos totales o ingresos totales. Existen mtricas que son agregadas naturalmente asociadas a otras, por ejemplo en ingresos total, puede estar asociada la cantidad vendida.