Está en la página 1de 4

Almacenes de datos (Datawarehouse)

Roberto Hernando Velasco


(http://www.rhernando.net)

24 de abril de 2004

1.
1.1.

Almacn de datos (Data Warehouse) e


Denicin de Almacn de Datos o e

Un Almacn de Datos (o Data Warehouse) es una gran coleccin de datos e o que recoge informacin de mltiples sistemas fuentes u operacionales dispersos, o u y cuya actividad se centra en la Toma de Decisiones es decir, en el anlisis a de la informacin en vez de en su captura. Una vez reunidos los datos de los o sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos histricos; as los almacenes de datos proporcionan al usuario una interfaz o consolidada unica para los datos, lo que hace ms fcil escribir las consultas para a a la toma de decisiones.

1.2.

Diferencias entre Base de Datos y Almacn de Datos e


Base de Datos Operacional Datos operacionales Orientado a aplicacin o Actual Detallada Cambia continuamente Almacn de Datos e Datos del negocio para Informacin o Orientado al sujeto Actual + Histrico o Detallada + Resumida Estable

1.3.

Data Warehousing

Data Warehousing es el proceso que facilita la creacin y explotacin de un o o Almacn de Datos. e Los Sistemas de Data Warehousing incluyen funcionalidades como: Integracin de bases de datos heterogneas (relacionales, documentales, o e geogrcas, archivos, etc.) a Ejecucin de consultas complejas no predenidas visualizando el resultado o en forma grca y en diferentes niveles de agrupamiento y totalizacin de a o datos. Agrupamiento y desagrupamiento de datos en forma interactiva. 1

Anlisis del problema en trminos de dimensiones. a e Control de calidad de datos.

1.4.

Caracter sticas del Almacn de Datos e


Organizado en torno a temas. La informacin se clasica en base a los o aspectos que son de inters para la empresa. e Integrado. Es el aspecto ms importante. La integracin de datos consiste a o en convenciones de nombres, codicaciones consistentes, medida uniforme de variables, etc. Dependiente del tiempo. Esta dependencia aparece de tres formas: La informacin representa los datos sobre un horizonte largo de tiemo po. Cada estructura clave contiene (impl cita o expl citamente) un elemento de tiempo (d semana, mes, etc.). a, La informacin, una vez registrada correctamente, no puede ser aco tualizada. No voltil. El Almacn de Datos slo permite cargar nuevos datos y aca e o ceder a los ya almacenados, pero no permite ni borrar ni modicar los datos.

1.5.

Arquitectura Data Warehouse

La estructura bsica de la arquitectura Data Warehouse incluye: a 1. Datos operacionales. Origen de datos para el componente de almacenamiento f sico del Almacn de Datos. e 2. Extraccin de datos. Seleccin sistemtica de datos operacionales usados o o a para formar parte del Almacn de Datos. e 3. Transformacin de datos. Procesos para sumarizar y realizar cambios en o los datos operacionales. 4. Carga de datos. Insercin de datos en el Almacn. o e 5. Almacn. Almacenamiento f e sico de datos de al arquitectura Data Warehouse. 6. Herramienta de acceso. Herramientas que proveen acceso a los datos. 2

1.6.

Estructura lgica del Almacn de Datos o e

La estructura lgica de un Almacn de Datos est compuesta por los sio e a guientes niveles: Metadatos. Describen la estructura de los datos contenidos en el almacn. e Estn en una dimensin distinta al resto de niveles. a o Datos detallados actuales. Obtenidos directamente del procesado de los datos. Forman el nivel ms bajo de detalle. a Ocupan mucho espacio. Se almacenan en disco, para facilitar el acceso. Datos detallados histricos. Igual que los anteriores, pero con datos coo rrespondientes al pasado. Se suelen almacenar en un medio externo, ya que su acceso es poco frecuente. Datos ligeramente resumidos. Primer nivel de agregacin de los datos o detallados actuales. Corresponden a consultas habituales. Se almacenan en disco. Datos muy resumidos. Son el nivel ms alto de agregacin. a o Corresponden a consultas que se realizan muy a menudo y que se deben obtener muy rpidamente. a Suelen estar separados del Almacn de datos, formando Supermere cados de Datos (Data Marts).

1.7.

Estructura f sica del Almacn de Datos e

La estructura f sica puede presentar cualquiera de las siguientes conguraciones: Arquitectura centralizada. Todo el Almacn de datos se encuentra en un e unico servidor. Arquitectura distribuida. Los datos del Almacn se reparten entre varios e servidores. Asignando cada servidor a uno o varios temas lgicos. o Arquitectura distribuida por niveles. Reeja la estructura lgica del Alo macn, asignando los servidores en funcin del nivel de agregacin de los e o o datos que contienen. Un servidor est dedicado para los datos de detalle, a otro para los resumidos y otro para los muy resumidos. Cuando los datos muy resumidos se duplican en varios servidores para agilizar el acceso se habla de Supermercados de datos (Data Marts). 3

1.8.

Software Data Warehouse


Red Brick Warehouse Essbase Pilot Decission Support Suite Microsoft SQL Server

También podría gustarte