DATA WAREHOUSE Que es un Data Warehouse Un Data Warehouse es un repositorio de datos corporativo que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. Un Data Warehouse proporciona información a Sistemas de Soporte a Decisiones (DSS), Sistemas de información ejecutiva (EIS) o herramientas para hacer consultas o informes. Los usuarios finales pueden hacer fácilmente consultas sin tocar o afectar la operación del sistema. Que NO es un Data Warehouse
Un Producto: Un Data warehouse no es un sistema desarrollado en
masa. Un Lenguaje: Un Data warehouse no se codifica mediante un lenguaje de programación, porque se basa en diferentes tecnologías que pueden tener diferentes entornos. Una copia del sistema de transacciones: Un error común es creer que duplicar la base de datos transaccional es crear un Data warehouse. Características
Integrado: los datos almacenados deben integrarse en una
estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. Temático: Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Histórico: el tiempo es parte implícita de la información contenida en un repositorio. la cual sirve, entre otras cosas, para realizar análisis de tendencias. No volátil: la información existe para ser leída y no para ser modificada. la actualización se refleja con la incorporación de los últimos valores de las distintas variables y sin ningún tipo de acción sobre lo que ya existía. TABLA DE HECHOS En las bases de datos, y más concretamente en un data warehouse, una tabla de hechos (o tabla fact) es la tabla central de un esquema dimensional (en estrella o en copo de nieve) y contiene los valores de las medidas de negocio o dicho de otra forma los indicadores de negocio. Cada medida se toma mediante la intersección de las dimensiones que la definen, dichas dimensiones estarán reflejadas en sus correspondientes tablas de dimensiones que rodearán la tabla de hechos y estarán relacionadas con ella. TABLA DE DIMENSIONES
En la construcción de cubos OLAP,
las tablas de dimensiones son elementos que contienen atributos (o campos) que se utilizan para restringir y agrupar los datos almacenados en una tabla de hechos cuando se realizan consultas sobre dicho datos en un entorno de almacén de datos o data mart. MODELO ESTRELLA En las bases de datos usadas para data warehousing, un esquema en estrella es un modelo de datos que tiene una tabla de hechos (o tabla fact) que contiene los datos para el análisis, rodeada de las tablas de dimensiones. Este aspecto, de tabla de hechos (o central) más grande rodeada de radios o tablas más pequeñas es lo que asemeja a una estrella, dándole nombre a este tipo de construcciones. MODELO COPO DE NIEVE En las bases de datos utilizadas en (data warehousing), un esquema en copo de nieve es una estructura algo más compleja que el esquema en estrella. Se da cuando alguna de las dimensiones se implementa con más de una tabla de datos. La finalidad es normalizar las tablas y así reducir el espacio de almacenamiento al eliminar la redundancia de datos; pero tiene la contrapartida de generar peores rendimientos al tener que crear más tablas de dimensiones y más relaciones entre las tablas (JOINS) lo que tiene un impacto directo sobre el rendimiento. MODELO ESTRELLA – COPO DE NIEVE PROCESOS ETL
Extract, Transform and Load («extraer, transformar y cargar»,
frecuentemente abreviado ETL) es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio. Los procesos ETL también se pueden utilizar para la integración con sistemas heredados. Se convirtieron en un concepto popular en los años 1970.1 Estructura Data Marts
Un Datamart es una base de datos departamental,
especializada en un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Dpto Contable Data MartsDpto VentasDpto RH CUBOS Es una base de datos especial, en la cual el almacenamiento físico de los datos se realiza en un vector multidimensional. VENTAJAS Proporciona información clave para la toma de decisiones empresariales. Especialmente útil para el medio y largo plazo. Son sistemas relativamente sencillos de instalar si las fuentes de datos y los objetivos están claros. Transforma los datos en información y la información en conocimiento. Las empresas obtienen un aumento de la productividad. Proporciona una comunicación fiable entre todos los departamentos de la empresa. Permite conocer qué está pasando en el negocio, es decir, estar siempre enterado de los buenos y malos resultados. CONCLUSIONES
El concepto de Data Warehouse abarca mucho más que
simplemente copiar datos operacionales a una base de datos informacional distinta. El sistema deberá ofrecer una solución completa para gestionar y controlar el flujo de información desde bases de datos corporativas y fuentes externas a sistemas de soporte de decisiones de usuarios finales. Además, debe permitir a los usuarios conocer qué información existe en el almacén de datos, y cómo poder acceder a ella y manipularla