Documentos de Académico
Documentos de Profesional
Documentos de Cultura
24 de abril de 2004
1.
1.1.
Un Almacn de Datos (o Data Warehouse) es una gran coleccin de datos e o que recoge informacin de mltiples sistemas fuentes u operacionales dispersos, o u y cuya actividad se centra en la Toma de Decisiones es decir, en el anlisis a de la informacin en vez de en su captura. Una vez reunidos los datos de los o sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos histricos; as los almacenes de datos proporcionan al usuario una interfaz o consolidada unica para los datos, lo que hace ms fcil escribir las consultas para a a la toma de decisiones.
1.2.
1.3.
Data Warehousing
Data Warehousing es el proceso que facilita la creacin y explotacin de un o o Almacn de Datos. e Los Sistemas de Data Warehousing incluyen funcionalidades como: Integracin de bases de datos heterogneas (relacionales, documentales, o e geogrcas, archivos, etc.) a Ejecucin de consultas complejas no predenidas visualizando el resultado o en forma grca y en diferentes niveles de agrupamiento y totalizacin de a o datos. Agrupamiento y desagrupamiento de datos en forma interactiva. 1
1.4.
1.5.
La estructura bsica de la arquitectura Data Warehouse incluye: a 1. Datos operacionales. Origen de datos para el componente de almacenamiento f sico del Almacn de Datos. e 2. Extraccin de datos. Seleccin sistemtica de datos operacionales usados o o a para formar parte del Almacn de Datos. e 3. Transformacin de datos. Procesos para sumarizar y realizar cambios en o los datos operacionales. 4. Carga de datos. Insercin de datos en el Almacn. o e 5. Almacn. Almacenamiento f e sico de datos de al arquitectura Data Warehouse. 6. Herramienta de acceso. Herramientas que proveen acceso a los datos. 2
1.6.
La estructura lgica de un Almacn de Datos est compuesta por los sio e a guientes niveles: Metadatos. Describen la estructura de los datos contenidos en el almacn. e Estn en una dimensin distinta al resto de niveles. a o Datos detallados actuales. Obtenidos directamente del procesado de los datos. Forman el nivel ms bajo de detalle. a Ocupan mucho espacio. Se almacenan en disco, para facilitar el acceso. Datos detallados histricos. Igual que los anteriores, pero con datos coo rrespondientes al pasado. Se suelen almacenar en un medio externo, ya que su acceso es poco frecuente. Datos ligeramente resumidos. Primer nivel de agregacin de los datos o detallados actuales. Corresponden a consultas habituales. Se almacenan en disco. Datos muy resumidos. Son el nivel ms alto de agregacin. a o Corresponden a consultas que se realizan muy a menudo y que se deben obtener muy rpidamente. a Suelen estar separados del Almacn de datos, formando Supermere cados de Datos (Data Marts).
1.7.
La estructura f sica puede presentar cualquiera de las siguientes conguraciones: Arquitectura centralizada. Todo el Almacn de datos se encuentra en un e unico servidor. Arquitectura distribuida. Los datos del Almacn se reparten entre varios e servidores. Asignando cada servidor a uno o varios temas lgicos. o Arquitectura distribuida por niveles. Reeja la estructura lgica del Alo macn, asignando los servidores en funcin del nivel de agregacin de los e o o datos que contienen. Un servidor est dedicado para los datos de detalle, a otro para los resumidos y otro para los muy resumidos. Cuando los datos muy resumidos se duplican en varios servidores para agilizar el acceso se habla de Supermercados de datos (Data Marts). 3
1.8.