Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ada A. Byron
Data Warehousing
Introduccin
Desde que se inici la era de la computadora, las organizaciones han usado los
datos desde sus sistemas operacionales para atender sus necesidades de
informacin. Algunas proporcionan acceso directo a la informacin contenida
dentro de las aplicaciones operacionales. Otras, han extrado los datos desde
sus bases de datos operacionales para combinarlos de varias formas no
estructuradas, en su intento por atender a los usuarios en sus necesidades de
informacin.
2 Sistemas de Informacin
Como indica su nombre, son los sistemas que ayudan a manejar la empresa
con sus operaciones cotidianas. Estos son los sistemas que operan sobre el
"backbone" (columna vertebral) de cualquier empresa o institucin, entre las
que se tiene sistemas de ingreso de rdenes, inventario, fabricacin, planilla y
contabilidad, entre otros.
Por otra parte, hay otras funciones dentro de la empresa que tienen que ver
con el planeamiento, previsin y administracin de la organizacin. Estas
funciones son tambin crticas para la supervivencia de la organizacin,
especialmente en nuestro mundo de rpidos cambios.
o Orientado al tema
o Integrado
o De tiempo variante
o No voltil
3.2 Integracin
A travs de los aos, los diseadores de las diferentes aplicaciones han tomado
sus propias decisiones sobre cmo se debera construir una aplicacin. Los
estilos y diseos personalizados se muestran de muchas maneras.
Tal como se muestra en la figura, los puntos de integracin afectan casi todos
los aspectos de diseo - las caractersticas fsicas de los datos, la disyuntiva de
tener ms de una de fuente de datos, el problema de estndares de
denominacin inconsistentes, formatos de fecha inconsistentes y otros.
3.4 No Voltil
Los data warehouses tienen una estructura distinta. Hay niveles diferentes de
esquematizacin y detalle que delimitan el data warehouse. La estructura de un
data warehouse se muestra en la Figura N 5.
Meta data
El detalle de ventas antiguas son las que se encuentran antes de 1992. Todos
los detalles de ventas desde 1982 (o cuando el diseador inici la coleccin de
los archivos) son almacenados en el nivel de detalle de datos ms antiguo.
Una de las razones por las que el desarrollo de un data warehouse crece
rpidamente, es que realmente es una tecnologa muy entendible. De hecho,
data warehousing puede representar mejor la estructura amplia de una
empresa para administrar los datos informacionales dentro de la organizacin.
A fin de comprender cmo se relacionan todos los componentes involucrados en
una estrategia data warehousing, es esencial tener una Arquitectura Data
Warehouse.
Sin embargo, a causa del enfoque limitado de los sistemas operacionales, las
bases de datos diseadas para soportar estos sistemas, tienen dificultad al
acceder a los datos para otra gestin o propsitos informticos.
Cada vez ms, las organizaciones grandes adquieren datos adicionales desde
bases de datos externas. Esta informacin incluye tendencias demogrficas,
economtricas, adquisitivas y competitivas (que pueden ser proporcionadas por
Instituciones Oficiales - INEI). Internet o tambin llamada "information
superhighway" (supercarretera de la informacin) provee el acceso a ms
recursos de datos todos los das.
El acceso a los datos universales significa que, tericamente por lo menos, los
usuarios finales sin tener en cuenta la herramienta de acceso a la informacin o
ubicacin, deberan ser capaces de acceder a cualquier o todos los datos en la
empresa que es necesaria para ellos, para hacer su trabajo.
5.2.3 Metadata
Otro paso necesario es crear la metadata. La metadata (es decir, datos acerca
de datos) describe los contenidos del data warehouse. La metadata consiste de
definiciones de los elementos de datos en el depsito, sistema(s) del (os)
elemento(s) fuente. Como la data, se integra y transforma antes de ser
almacenada en informacin similar.
El sistema de depsito ejecuta las consultas que se pasa a los datos por el
software de acceso a los datos del usuario. Aunque un usuario visualiza las
consultas desde el punto de vista de un GUI, las consultas tpicamente se
formulan como pedidos SQL, porque SQL es un lenguaje universal y el estndar
de hecho para el acceso a datos.
6.2 Metadata
El modelo de datos del data warehouse (es decir, los elementos de datos y sus
relaciones).
7 Flujo de Datos
Sea eliminado
Sea resumido
Sea archivado
Requerimientos de respuesta
Requerimientos de respuesta no crticos
inmediata
Por lo general, los diferentes niveles de datos dentro del data warehouse
reciben diferentes usos. A ms alto nivel de esquematizacin, se tiene mayor
uso de los datos.
Hay una buena razn para mover una organizacin al paradigma sugerido en la
figura, la utilizacin del recurso. La data ms resumida, permite capturar los
datos en forma ms rpida y eficiente. Si en una tarea se encuentra que se
hace mucho procesamiento a niveles de detalle del data warehouse, entonces
se consumir muchos recursos de mquina. Es mejor hacer el procesamiento a
niveles ms altos de esquematizacin como sea posible.
Los elementos de datos son fcilmente accesibles para otros usos, no slo para
un reporte particular.
10 Consideraciones Adicionales
Por lo mismo, los datos en los niveles ms altos de detalle pueden ser
reestructurados fcilmente, mientras que el volumen de datos en los niveles
ms inferiores es tan grande, que los datos no pueden ser fcilmente
reestructurados.
Para los diferentes tipos de tablas hay diferentes unidades de tiempo que
fsicamente dividen las unidades de informacin. El histrico de fabricacin est
dividido por trimestres, el histrico de la orden de piezas est dividido por aos
y el histrico de cliente es un archivo nico, no dividido por el tiempo.
Una de ellas es la data resumida pblica, que es la data que ha sido calculada
fuera del data warehouse pero es usada a travs de la corporacin. La data
resumida pblica se almacena y administra en el data warehouse, aunque su
clculo se haya hecho fuera de l.
El medio donde se almacena la data debe ser tan seguro como sea
posible.
Los datos deben permitir ser restaurados.