Está en la página 1de 4

Data Warehouse

Definicin.

Data warehouse es una coleccin de informacin recopiladas de mltiples base de datos operacionales. Data warehouse provee una plataforma slida de datos integrados e histricos de los cuales se puede sacar un anlisis. Otra definicin podra ser que se encarga de organizar y almacenar los datos necesarios para los procesos de informacin y anlisis en un tiempo histrico.

Usualmente son construda para almacenar grandes cantidades de informacin recolectada de diferentes fuentes operacionales. Por ejemplo: una empresa quiere determinar si la causa de la baja de los precios de su producto fue causada por la cantidad de vendedores que tomaron vacaciones. Para poder encontrar la respuesta, el data warehouse necesita contener informacin tanto de la base de dato del producto, como de la base de dato del personal de la empresa. De aqu que se diga que el data warehouse se utilice para examinar problemas o posibles problemas y determinar su causa.

Caractersticas.

Data warehouse tiene cuatro caractersticas genereles que la definen como tal:

1. Subject-oriented (orientada a un tema): el diseo del warehouse est orientado en cuanto temas globales. Esta cualidad contrasta con el clsico mtodo que era orientado al proceso y funcionamiento de las aplicaciones utilizados en sistemas operacionales ms antiguos. En estos sistemas los datos giraban en torno a las aplicaciones o funciones como: prstamos, ahorros, etc. En el warehouse, los datos giran alrededor de temas globales como: vendedores, clientes, productos, etc.

2. Integrada: los datos necesitan ser almacenados en el data warehouse de una forma globalmente aceptable y singular, aunque el programa operacional los almacene de una forma distinta. Los datos deben de ser consistentes siempre dentro del data ware house. Por ejemplo : a. Cdigo: al introducir una informacin, sta debe llegar al data ware house de una forma consistente independientemente de cmo fue introducido en el programa de aplicacin.

b. Medidas de atributos: independientemente de cual sea la medida utilizada (por ejemplo: centmetros, metro, yardas, pulgadas), al ser almacenados los datos en el data warehouse deben tener una misma medida.

3. Variacin de tiempo: las caractersticas de los datos contenidos en el warehouse son distinto a aquellos en el ambiente operacional. En el ambiente operacional, al momento de accesar los datos stos son exactos a aquellos que se espera recibir. Sin embargo, en el warehouse, los datos son exactos en algn momento del tiempo. Las variantes del tiempo se pueden notar de tres formas: a. Lmite de tiempo: el margen de tiempo del warehouse es mucho mayor en cuanto a los datos (puede contener datos entre 5 y 10 aos de almacenamiento). Por otro lado, en el ambiente operacional, el margen de tiempo de almacenamiento de los datos es mucho menor por lo que la informacin que se accesa es mucho ms fresca (60- 90 das); ya que un programa de aplicacin para trabajar eficientemente debe llevar la mnima cantidad de data necesaria para realizar las transacciones. b. Clave de estructura (key structure): los datos en el warehouse contienen un elemento de tiempo (da, semana, mes, ao, etc.). c. Actualizaciones: los datos una vez almacenados correctamente en el warehouse no se puden ser alterados, por lo tanto no se pueden actualizar.

4. No voltil: la manipulacin de datos en el warehouse es mucho ms simple. Slo existen dos tipos de operaciones que se llevan a cabo en el warehouse: cuando se cargan inicialmente los datos y cuando se accesan. Componentes. Los diferentes componentes del warehouse son: 1. Datos actualmente detallados (current detail data): es una de las informaciones ms concerniente ya que refleja y detalla los acontecimientos ms recientes dentro del warehouse. Tambin los datos son almacenados en discos de almacenamiento, por lo que los datos pueden ser accesados ms rpidamente.

2. Datos anteriormente detallados (Older detail data): son datos almacenados de alguna forma masiva. Usualmente no se almacena en discos de almacenamiento ya que son grandes volmenes de datos que son accesados infrecuentemente. 3. Datos ligeramente resumidos (lightly summarized data): son datos filtrados o resumidos que se encuentran en los datos actualmente detallados. Debe inclur los atributos y unidad de tiempo en la cual debe ser realizada. 4. Datos sumamente resumidos (highly summarised data): son datos compactos y de fcil acceso. 5. Datos meta (meta data): son datos que no son directamente tomados del ambiente operacional. Se usa como directorio para ayudar a localizar al analista el contenido del warehouse. Tambin como una gua de cmo los datos son transformados desde el ambiente operacional hasta el ambiente del warehouse. Finalmente, como una gua para los algoritmos utilizados para el

Highly summarized

Slightly Summarized

D a t a M e t a

Current detail data

Older detail data

resumen entre los diferentes datos (actualmente detallados, ligeramente resumidos etc.).

Ventajas.

1. Reduccin en tiempos de consultas: por parte de los usuarios, se reduce considerablemente el tiempo de espera. 2. Apoyo a las tomas de desiciones: proporciona un resumen de la informacin lo cual ayuda a los empresarios a tener una base para tomar decisiones en cuento a lo que su empresa requiere. 3. Acceso a cualquier base de datos: soporta el acceso a mltiples bases de datos por lo que se puede obtener informacin variada y necesaria desde un mismo punto de origen. 4. Acceso directo, fcil y econmico a todos los datos de la empresa. 5. Los logros son evidentes: en una empresa que utilice data warehouse va a existir una mayor productividad por las decisiones correctas tomadas a partir de los informes obtenidos del warehouse en un tiempo ms corto.

También podría gustarte