Está en la página 1de 9

Datawarehouse

Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar


y depurar informacin de una o ms fuentes distintas, para luego procesarla
permitiendo su anlisis desde infinidad de perspectivas y con grandes velocidades de
respuesta. La creacin de un datawarehouse representa en la mayora de las ocasiones
el primer paso, desde el punto de vista tcnico, para implantar una solucin completa y
fiable de Business Intelligence.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que
se almacena la informacin (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc). Este tipo de persistencia de la informacin es homognea y fiable,
y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un
entorno diferente a los sistemas operacionales).

El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y se traduce
literalmente como almacn de datos. No obstante, y como cabe suponer, es mucho
ms que eso. Segn defini el propio Bill Inmon, un datawarehouse se caracteriza por
ser:
Integrado: los datos almacenados en el datawarehouse deben integrarse en
una estructura consistente, por lo que las inconsistencias existentes entre los
diversos sistemas operacionales deben ser eliminadas. La informacin suele

estructurarse tambin en distintos niveles de detalle para adecuarse a las


distintas necesidades de los usuarios.
Temtico: slo los datos necesarios para el proceso de generacin del
conocimiento del negocio se integran desde el entorno operacional. Los datos se
organizan por temas para facilitar su acceso y entendimiento por parte de los
usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una nica tabla del datawarehouse. De esta forma, las
peticiones de informacin sobre clientes sern ms fciles de responder dado
que toda la informacin reside en el mismo lugar.
Histrico: el tiempo es parte implcita de la informacin contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre reflejan el
estado de la actividad del negocio en el momento presente. Por el contrario, la
informacin almacenada en el datawarehouse sirve, entre otras cosas, para
realizar anlisis de tendencias. Por lo tanto, el datawarehouse se carga con los
distintos

valores

que

toma

una

variable

en

el

tiempo

para

permitir

comparaciones.
No voltil: el almacn de informacin de un datawarehouse existe para ser
ledo, pero no modificado. La informacin es por tanto permanente, significando
la actualizacin del datawarehouse la incorporacin de los ltimos valores que
tomaron las distintas variables contenidas en l sin ningn tipo de accin sobre
lo que ya exista.
Otra caracterstica del datawarehouse es que contiene metadatos, es decir, datos sobre
los datos. Los metadatos permiten saber la procedencia de la informacin, su
periodicidad de refresco, su fiabilidad, forma de clculo... etc.
Los metadatos sern los que permiten simplificar y automatizar la obtencin de la
informacin desde los sistemas operacionales a los sistemas informacionales.
Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido,
son:
Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su
propio lenguaje de negocio, indicando qu informacin hay y qu significado
tiene. Ayudar a construir consultas, informes y anlisis, mediante herramientas
de Business Intelligence como DSS, EIS o CMI.

Dar soporte a los responsables tcnicos del datawarehouse en aspectos


de

auditora,

gestin

de

la

informacin

histrica,

administracin

del

datawarehouse, elaboracin de programas de extraccin de la informacin,


especificacin

de

las

interfaces

para

la

realimentacin

los

sistemas

operacionales de los resultados obtenidos... etc.


Por

ltimo,

destacar

que

para

comprender

ntegramente

el

concepto

de

datawarehouse, es importante entender cual es el proceso de construccin del mismo,


denominado ETL (Extraccin, Transformacin y Carga), a partir de los sistemas
operaciones de una compaa:
Extraccin: obtencin de informacin de las distintas fuentes tanto internas
como externas.
Transformacin: filtrado, limpieza, depuracin, homogeneizacin y agrupacin
de la informacin.
Carga: organizacin y actualizacin de los datos y los metadatos en la base de
datos.

Una de las claves del xito en la construccin de un datawarehouse es el desarrollo de


forma gradual, seleccionando a un departamento usuario como piloto y expandiendo
progresivamente el almacn de datos a los dems usuarios. Por ello es importante
elegir este usuario inicial o piloto, siendo importante que sea un departamento con
pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se
puedan obtener y medir resultados a corto plazo.

Principales aportaciones de un datawarehouse

Proporciona una herramienta para la toma de decisiones en cualquier rea


funcional, basndose en informacin integrada y global del negocio.
Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para
encontrar relaciones ocultas entre los datos del almacn; obteniendo un valor
aadido para el negocio de dicha informacin.
Proporciona la capacidad de aprender de los datos del pasado y de predecir
situaciones futuras en diversos escenarios.
Simplifica dentro de la empresa la implantacin de sistemas de gestin integral
de la relacin con el cliente.
Supone una optimizacin tecnolgica y econmica en entornos de Centro de
Informacin, estadstica o de generacin de informes con retornos de la inversin
espectaculares.
Si no est familiarizado con el concepto de datawarehouse, puede resultarle til,
adems, examinar las siguientes definiciones:
Datamart
Datamining
Cuadro de Mando Integral
Sistemas de Soporte a la Decisin (DSS)

Sistemas de Informacin Ejecutiva (EIS)

Datamart
Un

Datamart

es

una

base

de

datos

departamental,

especializada

en

el

almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por


disponer la estructura ptima de datos para analizar la informacin al detalle desde
todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart
puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo
un compendio de distintas fuentes de informacin.

Por tanto, para crear el datamart de un rea funcional de la empresa es preciso


encontrar la estructura ptima para el anlisis de su informacin, estructura que puede
estar montada sobre una base de datos OLTP, como el propio datawarehouse, o sobre
una base de datos OLAP. La designacin de una u otra depender de los datos, los
requisitos y las caractersticas especficas de cada departamento. De esta forma se
pueden plantear dos tipos de datamarts:

Datamart

OLAP

Se basan en los populares cubos OLAP, que se construyen agregando, segn los
requisitos de cada rea o departamento, las dimensiones y los indicadores necesarios
de cada cubo relacional. El modo de creacin, explotacin y mantenimiento de los
cubos OLAP es muy heterogneo, en funcin de la herramienta final que se utilice.

Datamart

OLTP

Pueden basarse en un simple extracto del datawarehouse, no obstante, lo comn es


introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las
operaciones ms usuales) aprovechando las caractersticas particulares de cada rea
de la empresa. Las estructuras ms comunes en este sentido son las tablas report, que
vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las
vistas materializadas, que se construyen con la misma estructura que las anteriores,

pero con el objetivo de explotar la reescritura de queries (aunque slo es posibles en


algunos SGBD avanzados, como Oracle).
Los datamarts que estn dotados con estas estructuras ptimas de anlisis presentan
las siguientes ventajas:
Poco volumen de datos
Mayor rapidez de consulta
Consultas SQL y/o MDX sencillas
Validacin directa de la informacin
Facilidad para la historizacin de los datos

Si no est familiarizado con el concepto de datamart, puede resultarle til, adems,


examinar las siguientes definiciones:
Datawarehouse
Sistemas de Soporte a la Decisin (DSS)
Bases de datos OLTP y OLAP

Datamining

Tipos De Sistemas De Informacin


Un sistema de informacin es un grupo de elementos utilizados para la administracin
de datos, los cuales se encuentran coordinados entre s para su uso ulterior. Estos
elementos, adems, fueron concebidos con el objeto de lograr un determinado fin. Desde el
punto de vista empresarial, los sistemas de informacin tienen como propsito perfeccionar
las actividades llevadas a cabo en una organizacin, y as alcanzar ventajas competitivas.
Siguiendo esta lnea, y de acuerdo a su funcin se distinguen tres tipos de sistemas de
informacin:
SISTEMA DE PROCESAMIENTO DE TRANSACCIONES: cuando un sistema
recopila, almacena y altera la informacin creada a partir de transacciones llevadas a cabo
dentro de una organizacin se denomina sistema de procesamiento de transacciones. Tiene
como finalidad procesar las transacciones diarias de una empresa, acumulando toda la
informacin recibida en una base de datos para su posterior consulta.
SISTEMA DE INFORMACIN GERENCIAL: un sistema de informacin gerencial es
aquel utilizado por la empresa para solventar inconvenientes en la misma. Es decir, el
objetivo del mismo es la suministracin de informacin para la resolucin de problemas a
travs de la interaccin entre tecnologas y personas.
Los datos aportados por el sistema deben disponer de cuatro cualidades elementales:
calidad, oportunidad, cantidad y relevancia.
SISTEMA DE SOPORTE A DECISIONES: este sistema se basa en el estudio y la
comparacin entre un conjunto de variables con el objeto de contribuir a la toma de
decisiones dentro de una empresa. El apoyo dado por el sistema involucra la estimacin,
valoracin y balance entre alternativas. Al igual que el sistema de informacin gerencial,
esta tecnologa interacciona con personas en el filtrado de informacin que permite optar
por la decisin mas acertada.
SISTEMA DE INFORMACION EJECUTIVA: esta tecnologa es utilizada por los
gerentes de una empresa, ya que permite acceder a la informacin interna y externa de la
misma, disponiendo de los datos que puedan llegar a afectar su buen rendimiento.
De esta manera, el ejecutivo podr conocer el estado de todos los indicadores, incluso
aquellos que no cumplan con las expectativas y a partir de esto, tomar las medidas que
considere adecuadas.

También podría gustarte