Está en la página 1de 14

Introduccin Las bases de datos se convirtieron en una herramienta fundamental de control y manejo de las operaciones comerciales, fue as como

en unos pocos aos en grandes empresas y negocios exista un considerable nmero de informacin almacenada en diferentes fuentes de datos y estas ya haban alcanzado un tamao considerablemente grande. Por tanto, pensaron en lo ideal que sera unificar las diferentes fuentes de informacin de las cuales disponan, en un nico lugar, al que slo se le incorporara informacin relevante, sobre la base de una estructura organizada, integrada, lgica, dinmica y de fcil explotacin esto fueron los almacenes de datos o Data Warehouse (DW).

1.1 Definicin de Almacn de Datos Un almacn de datos o data warehouse (DW) es una gran coleccin de datos que recoge informacin de mltiples sistemas fuentes u operacionales dispersos, y cuya actividad se centra en la toma de decisiones, es decir, en el anlisis de la informacin en vez de su captura.

Una vez reunidos los datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos histricos; as los almacenes de datos proporcionan al usuario una interfaz consolidada nica para los datos, lo que hace ms fcil escribir las consultas para la toma de decisiones.

1.2 Diferencia entre Base de datos y Almacn de datos Base de datos operacional Datos operacionales Almacn de datos Datos de negocio para informacin Orientado al sujeto Actual + Histrico

Orientado a aplicacin Actual

Detallada
Cambia continuamente

Detallada + Resumida
Estable

1.3 Data Warehousing Es el proceso que facilita la creacin y explotacin de un almacn de datos. Los sistemas de data warehousing incluyen funcionalidades como: Integracin de bases de datos heterogneas (relacionales, documentales, geogrficas, archivos, etc.) Ejecucin de consultas complejas no predefinidas visualizando el resultado en forma grfica y en diferentes niveles de agrupamiento y totalizacin de datos.

Agrupamiento y desagrupamiento de datos en forma interactiva.

Anlisis del problema en trminos de dimensiones. Control de calidad de datos.

1.4 Caractersticas de Almacn de Datos Organizado en torno a temas. La informacin se clasifica en base a los aspectos que son de inters para la empresa. Integrado. Es el aspecto ms importante. La integracin de datos consiste en convenciones de nombres, codificaciones consistentes, medida uniforme de variables, etc. Dependiente del tiempo. Esta dependencia aparece de tres formas: La informacin representa los datos sobre un horizonte largo de tiempo. Cada estructura clave contiene (implcita o explcitamente) un elemento de tiempo (da, semana, mes, etc.). La informacin una vez registrada correctamente no puede ser actualizada.

No voltil. El almacn de datos slo permite cargar nuevos datos y acceder a los ya almacenados, pero no permite ni borrar ni modificar los datos.

1.5 Arquitectura Data Warehouse La estructura bsica de la arquitectura data Warehouse incluye: 1. Datos operacionales. Origen de datos para el componente de almacenamiento fsico del Almacn de Datos. 2. Extraccin de datos. Seleccin sistemtica de datos operacionales usados para formar parte del Almacn de Datos. 3. Transformacin de datos. Procesos para sumarizar y realizar cambios en los datos operacionales. 4. Carga de datos. Insercin de datos en el Almacn. 5. Almacn. Almacenamiento fsico de datos de al arquitectura Data Warehouse. 6. Herramienta de acceso. Herramientas que proveen acceso a los datos.

1.6 Estructura lgica del almacn de datos

Metadatos. Describen la estructura de los datos contenidos en el almacn. Estn en una dimensin distinta al resto de niveles.
Datos detallados actuales. Obtenidos directamente procesado de los datos. Forman el nivel ms bajo de detalle. Ocupan mucho espacio. Se almacenan en disco, para facilitar el acceso. del

Datos detallados histricos. Igual que los anteriores, pero con datos correspondientes al pasado. Se suelen almacenar en un medio externo, ya que su acceso es poco frecuente.

Datos ligeramente resumidos. Primer nivel de agregacin de los datos detallados actuales. Corresponden a consultas habituales. Se almacenan en disco. Datos muy resumidos. Son el nivel ms alto de agregacin. Corresponden a consultas que se realizan muy a menudo y que se deben obtener muy rpidamente. Suelen estar separados del Almacn de datos, formando Supermercados de Datos (Data Marts).

1.7 Estructura fsica del almacn de datos

La estructura fsica puede presentar cualquiera de las siguientes configuraciones:


Arquitectura centralizada. Todo el almacn de datos se encuentra en un nico servidor. Arquitectura distribuida. Los datos del almacn se reparten entre varios servidores. Asignando cada servidor a uno o varios temas lgicos.

Arquitectura distribuida por niveles. Refleja la estructura lgica del almacn, asignando los servidores en funcin del nivel de agregacin de los datos que contienen.

1.8 Software data warehouse

Red Brick Warehouse


Essbase Pilot Decission Support Suite Microsoft SQL Server

También podría gustarte