Está en la página 1de 8

UNIVERSIDAD ALAS PERUANAS

CAPITULO I: DATAWAREHOUSE
1.1 DATOS HISTORICOS
Data warehousing es el centro de la arquitectura para los sistemas de
informacin en la dcada de los '90. Soporta el procesamiento informtico
al proveer una plataforma slida, a partir de los datos histricos para hacer
el anlisis. Facilita la integracin de sistemas de aplicacin no integrados.
Organiza y almacena los datos que se necesitan para el procesamiento
analtico, informtico sobre una amplia perspectiva de tiempo.
Un Data Warehouse o Depsito de Datos es una coleccin de datos
orientado a temas, integrado, no voltil, de tiempo variante, que se usa
para el soporte del proceso de toma de decisiones gerenciales.
Se puede caracterizar un data warehouse haciendo un contraste de cmo
los datos de un negocio almacenados en un data warehouse, difieren de
los datos operacionales usados por las aplicaciones de produccin.

Base de Datos Operacional


Datos Operacionales

Data Warehouse
Datos

del

negocio

para

Informacin

Orientado a la aplicacin

Orientado al sujeto

Actual

Actual + histrico

Detallada

Detallada + ms resumida

Cambia continuamente

Estable

Diferentes tipos de informacin

SISTEMAS CONTABLES

UNIVERSIDAD ALAS PERUANAS

El ingreso de datos en el data warehouse viene desde el ambiente


operacional en casi todos los casos. El data warehouse es siempre un
almacn de datos transformados y separados fsicamente de la aplicacin
donde se encontraron los datos en el ambiente operacional.
1.2 DEFINICION:
Un Datawarehouse es una base de datos corporativa que se caracteriza
por integrar y depurar informacin de una o ms fuentes distintas, para
luego procesarla permitiendo su anlisis desde infinidad de perspectivas y
con grandes velocidades de respuesta. La creacin de un datawarehouse
representa en la mayora de las ocasiones el primer paso, desde el punto
de vista tcnico, para implantar una solucin completa y fiable de Business
Intelligence.
La ventaja principal de este tipo de bases de datos radica en las
estructuras en las que se almacena la informacin (modelos de tablas en
estrella, en copo de nieve, cubos relacionales... etc). Este tipo de
persistencia de la informacin es homognea y fiable, y permite la consulta
y el tratamiento jerarquizado de la misma (siempre en un entorno diferente
a los sistemas operacionales).

SISTEMAS CONTABLES

UNIVERSIDAD ALAS PERUANAS

1.3 CARACTERISTICAS
El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y
se traduce literalmente como almacn de datos. No obstante, y como cabe
suponer, es mucho ms que eso. Segn defini el propio Bill Inmon, un
datawarehouse se caracteriza por ser:
Integrado: los

datos

almacenados

en

el

datawarehouse

deben

integrarse en una estructura consistente, por lo que las inconsistencias


existentes entre los diversos sistemas operacionales deben ser
eliminadas. La informacin suele estructurarse tambin en distintos
niveles de detalle para adecuarse a las distintas necesidades de los
usuarios.
Temtico: slo los datos necesarios para el proceso de generacin del
conocimiento del negocio se integran desde el entorno operacional. Los
datos se organizan por temas para facilitar su acceso y entendimiento
por parte de los usuarios finales. Por ejemplo, todos los datos sobre
clientes pueden ser consolidados en una nica tabla del datawarehouse.
De esta forma, las peticiones de informacin sobre clientes sern ms
fciles de responder dado que toda la informacin reside en el mismo
lugar.
Histrico: el tiempo es parte implcita de la informacin contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre
reflejan el estado de la actividad del negocio en el momento presente.
Por el contrario, la informacin almacenada en el datawarehouse sirve,
entre otras cosas, para realizar anlisis de tendencias. Por lo tanto, el
datawarehouse se carga con los distintos valores que toma una variable
en el tiempo para permitir comparaciones.
No voltil: el almacn de informacin de un datawarehouse existe para
ser ledo, pero no modificado. La informacin es por tanto permanente,
significando la actualizacin del datawarehouse la incorporacin de los
ltimos valores que tomaron las distintas variables contenidas en l sin
ningn tipo de accin sobre lo que ya exista.
SISTEMAS CONTABLES

UNIVERSIDAD ALAS PERUANAS

Otra caracterstica del datawarehouse es que contiene metadatos, es decir,


datos sobre los datos. Los metadatos permiten saber la procedencia de la
informacin, su periodicidad de refresco, su fiabilidad, forma de clculo...
etc.
1.4 APLICACIONES

Sistemas de Marketing

Anlisis de Riesgo Financiero

Anlisis de Riesgo de Crdito

Control de Gestin

Logstica

Recursos Humanos

1.5 ALTERNATIVAS DE DISEO


Creacin de varios Datamarts independientes, uno por cada dominio o
fuente de informacin, y definicin de una Capa Usuario por cada uno de
estos Datamarts.
Creacin de un nico Datawarehouse que englobe todos los datos, del
que se extraigan diferentes Datamarts, uno por cada dominio o fuente de
informacin y definicin de una Capa Usuario por cada Datamart.
Creacin de un nico Datawarehouse con definicin de una nica Capa
Usuario.
Creacin de un nico Datawarehouse con definicin de varias Capas
Usuario.
1.6 LOS METADATOS
Los metadatos sern los que permiten simplificar y automatizar la
obtencin de la informacin desde los sistemas operacionales a los
sistemas informacionales.
Los objetivos que deben cumplir los metadatos, segn el colectivo al que
va dirigido, son:

SISTEMAS CONTABLES

UNIVERSIDAD ALAS PERUANAS

Dar soporte al usuario final, ayudndole a acceder al datawarehouse


con su propio lenguaje de negocio, indicando qu informacin hay y qu
significado tiene. Ayudar a construir consultas, informes y anlisis,
mediante herramientas de Business Intelligence como DSS, EIS o CMI.
Dar soporte a los responsables tcnicos del datawarehouse en aspectos
de auditora, gestin de la informacin histrica, administracin del
datawarehouse, elaboracin de programas de extraccin de la
informacin, especificacin de las interfaces para la realimentacin a los
sistemas operacionales de los resultados obtenidos... etc.
1.7 PROCESOS DE COSTRUCCION
Por ltimo, destacar que para comprender ntegramente el concepto de
datawarehouse, es importante entender cul es el proceso de construccin
del mismo, denominado ETL (Extraccin, Transformacin y Carga), a partir
de los sistemas operaciones de una compaa:

Extraccin: obtencin de informacin de las distintas fuentes tanto


internas como externas.
Transformacin: filtrado, limpieza, depuracin, homogeneizacin y
agrupacin de la informacin.
Carga: organizacin y actualizacin de los datos y los metadatos en
la base de datos.

SISTEMAS CONTABLES

UNIVERSIDAD ALAS PERUANAS

Una de las claves del xito en la construccin de un datawarehouse es


el desarrollo de forma gradual, seleccionando a un departamento usuario
como piloto y expandiendo progresivamente el almacn de datos a los
dems usuarios. Por ello es importante elegir este usuario inicial o piloto,
siendo importante que sea un departamento con pocos usuarios, en el
que la necesidad de este tipo de sistemas es muy alta y se pueda
obtener y medir resultados a corto plazo.
1.8 DATAMINING (MINERA DE DATOS)
Es el conjunto de tcnicas y tecnologas que permiten explorar grandes
bases de datos, de manera automtica o semiautomtica, con el objetivo
de encontrar patrones repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado contexto. Hace uso de
prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda
prximos a la Inteligencia Artificial y a las redes neuronales.
1.9 BASE DE DATOS MULTIDIMENSIONALES
Se utilizan principalmente para crear aplicaciones OLAP y pueden verse
como bases de datos de una sola tabla, su peculiaridad es que por
cada dimensin tienen

un campo (o

columna),

otro campo por

cada mtrica o hecho, es decir estas tablas almacenan registros cuyos


campos son de la forma:
(d1,d2,d3,...,f1,f2,f3,...)
Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y los
campos 'fi' a las mtricas o hechos que se quiere almacenar, estudiar o
analizar.
1.10

TCNICAS DE EXPLOTACIN
La explotacin del Data Warehouse mediante informacin de gestin, se

fundamenta bsicamente en los niveles agrupados o calculados de


informacin.

SISTEMAS CONTABLES

UNIVERSIDAD ALAS PERUANAS

Principales aportaciones de un datawarehouse


Proporciona una herramienta para la toma de decisiones en cualquier
rea funcional, basndose en informacin integrada y global del negocio.
Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin
para encontrar relaciones ocultas entre los datos del almacn;
obteniendo un valor aadido para el negocio de dicha informacin.
Proporciona la capacidad de aprender de los datos del pasado y de
predecir situaciones futuras en diversos escenarios.
Simplifica dentro de la empresa la implantacin de sistemas de gestin
integral de la relacin con el cliente.
Supone una optimizacin tecnolgica y econmica en entornos de
Centro de Informacin, estadstica o de generacin de informes con
retornos de la inversin espectaculares.

SISTEMAS CONTABLES

UNIVERSIDAD ALAS PERUANAS

CONCLUSION

El DW es un proceso, no un producto
Es un conjunto de procesos y acciones, orientados a un tema,
integrados y no voltiles que sirve para la toma de decisiones de la
gerencia.
E data warehouse a pesar de su alto costo, sigue funcionando y
brindando credibilidad a la informacin que provee a los usuarios.

SISTEMAS CONTABLES