Bill Inmon ve la necesidad de transferir la informacin de los diferentes OLTP (Sistemas Transaccionales) de las organizaciones a un lugar centralizado donde los datos puedan ser utilizados para el anlisis a la Fbrica de Informacin Corporativa (CIF o Corporative Information Factory). Insiste adems en que ha de tener las siguientes caractersticas:
Orientado a temas.- Los datos en la base de datos estn organizados de manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre s. Integrado.- La base de datos contiene los datos de todos los sistemas operacionales de la organizacin, y dichos datos deben ser consistentes. No Voltil.- La informacin no se modificar ni se elimina, una vez almacenado un dato, ste se convierte en informacin de solo lectura, y se mantiene para futuras consultas. Variante en el tiempo.- Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejan esas variaciones. La informacin debe estar a los mximos niveles de detalle. Los Data warehouses departamentales o datamarts son tratados como subconjuntos de este Data warehouse corporativo, son construidos para cubrir las necesidades individuales de anlisis de cada departamento, y siempre a partir del Data Warehouse central (de este tambin se puede construir ODS (Operacional Data Store) o similares).
Figura 1 Metodologa Inmon Data Warehouse Corporativo
La metodologa Inmon tambin es conocida como Top-down. Al tener este enfoque global, es ms difcil de desarrollar en un proyecto sencillo (pues se intentar abordar el todo, a partir del cual luego se ir al detalle).
2. Metodologa Ralph Kimball El Data Warehouse es un conglomerado de todos los Datamarts dentro de una empresa, siendo una copia de los datos transaccionales estructurados de una forma especial para el anlisis, de acuerdo al modelo dimensional (no normalizado), que incluye las dimensiones de anlisis y sus atributos, su organizacin jerrquica, as como los diferentes hechos de negocios que se quieren analizar. Por un lado se tiene las tablas para la representacin de dimensiones y por otro lado las tablas para los hechos. Los diferentes Datamarts estn conectados por la llamada estructura de bus, que contiene los elementos anteriormente citados a travs de las dimensiones conformadas (que permiten que los usuarios puedan realizar consultas conjuntas sobre los diferentes Datamarts, pues este bus contiene los elementos en comn que los comunican). Una dimensin conformada puede ser compartida por diferentes Datamarts (Venta, pedidos, gestin de cobros, etc.).
Figura 2 Metodologa Kimball Arquitectura Bus del DW
Esta metodologa tambin se referencia como Botton-up, pues al final del Data Warehouse Corporativo no es ms que la unin de los diferentes Datamarts, que estn estructurados en una forma comn a travs de la estructura en bus. Esta caracterstica la hace ms flexible y sencilla de implementar, pues se puede construir un Datamart como primer elemento del sistema de anlisis, y luego ir aadiendo otros que comparten las dimensiones ya definidas o incluyen otras nuevas. En este sistema, los procesos ETL extraen la informacin de los sistemas operacionales y los procesan igualmente en las area stage, realizando posteriormente el llenado de cada uno de los Datamart de una forma individual, aunque siempre respetando la estandarizacin de la dimensiones (dimensiones conformadas). La metodologa para la construccin del Data warehouse incluye las 4 fases que son: Seleccin de procesos de negocio. Definicin de la granularidad de la informacin. Eleccin de las dimensiones de anlisis. Identificacin de los hechos o mtricas. Tratamiento de los cambios, Dimensiones lentamente cambiantes (SCD).
3. Seleccin de la Metodologa
El desarrollo del proyecto para hacer seguimiento y anlisis de los procesos de cada rea requiere un desarrollo incremental, en la que la primera rea implementada es planta. El Datamart se va a desarrollar intentando que las dimensiones estn conformadas (dentro del concepto de Data Warehouse bus). Con lo que dejamos la puerta abierta a una ampliacin posterior dentro el mbito de la organizacin, aadiendo nuevos cubos que utilizarn las dimensiones conformadas ya definidas.
4. Metodologa Kimball para desarrollo de Datamarts
Etapas de la metodologa Kimball. Planificacin, Planificacin del proyecto. Requerimientos, Definicin de requerimientos. Anlisis, Arquitectura tcnica. Diseo, Seleccin de herramientas, diseo fsico. Construccin, Diseo de puesta en escena (Staging) y desarrollo. Despliegue, Implementacin y Mantenimiento.