Está en la página 1de 4

Mantenimiento de un almacn de datos

Un almacn de datos es una base de datos diseada para dar soporte al


proceso de toma de decisiones en una organizacin. Un sistema de almacn de
datos integra en un nico repositorio, informacin histrica procedente de
distintas fuentes de datos operacionales de la organizacin o externas a ella.
Para que el almacn de datos sea en todo momento un reflejo fiel de la
organizacin a la que sirve, debe ser actualizado peridicamente. Este proceso
puede consumir muchos recursos, y en algunos casos inhabilitar el almacn de
datos para los usuarios. En organizaciones donde el sistema debe estar
disponible para los analistas en todo momento, el mantenimiento del almacn
se convierte en un punto crtico del sistema. Por este motivo la investigacin
en estrategias eficientes de mantenimiento de almacenes de datos ha recibido
la atencin de los investigadores desde la aparicin de esta tecnologa.
ETL (Extraccin, transformacin y Load (Carga))

Fases
Extraccin: es el proceso que extrae datos de las fuentes operacionales para
enviarlos al almacn de datos (seleccin de datos).

Debe realizarse una seleccin de registros y campos de los sistemas


operacionales, ya que no todos los datos de las fuentes son relevantes para el
almacn de datos. Ejemplo: la Figura 2 ilustra una seleccin de datos de la
fuente operacional; se han seleccionado dos campos del registro (categora e
importe) y slo interesan los registros que en categora contengan como valor
1, 2 o 3 y que la fecha sea 30-09-2004.

Transformacin: es el proceso que prepara los datos de la manera adecuada,


para ser incorporados al almacn de datos. El proceso de transformacin se
compone de las siguientes actividades: limpieza de datos, integracin de
formato, integracin semntica, conversin de estructuras internas, integracin
de datos, resumen o agregacin de datos.
Tiene :
Limpieza de datos, Limpieza moderada, limpieza intensa, Integracion de
formato, integracin semntica,
Conversin de estructuras internas: frecuentemente, los datos son
estructurados de forma distinta, cuando pasan de un sistema operacional a un
sistema de almacn de datos. En la Tabla 2, se muestra un ejemplo.

Carga: una vez que la informacin ha sido extrada de las fuentes y


transformada, puede ser aadida al almacn de datos. Despus de la carga
inicial la estrategia de mantenimiento ms frecuente consiste en actualizar el
almacn peridicamente (diariamente, semanalmente, etc.).

Tareas
Transformacin de datos.
En el desarrollo del sistema de informacin de una organizacin, es frecuente
la creacin de bases de datos independientes que son diseadas para
satisfacer los requisitos de las aplicaciones a las que sirven, generando
problemas de heterogeneidad. En la referencia se describen dos tipos de
heterogeneidad:
Heterogeneidad de formato: hace referencia a las diferencias entre
definiciones locales, tales como tipo de datos, formato o precisin
Heterogeneidad semntica: hace referencia a las diferencias en el
significado de los datos (variacin en la manera en la que los datos con el
mismo significado son representados y estructurados en diferentes sistemas).
Como ejemplo, se puede ilustrar una empresa donde en el rea de produccin
se utiliza como unidad de medida el metro y en el rea de ventas la unidad de
mediada utilizada es la yardas. En estas situaciones, la informacin debe ser
integrada semnticamente antes de ser registrada en el almacn de datos,
para que las personas (analistas) que toman decisiones en la empresa, puedan
disponer de los datos de una manera segura y puedan realizar anlisis que
conduzcan a una correcta y oportuna toma de decisiones.

Arquitectura general para la integracin de datos.


Las fuentes de datos (sistemas operacionales) se comunican con el almacn de
datos a travs de un wrapper/monitor (Figura 13), cuya funcin principal es
detectar actualizaciones en las fuentes de datos y enviarlas al almacn de
datos. El trabajo del mdulo integrador es integrar los datos seleccionados de
las diferentes fuentes, solucionar cualquier conflicto y propagarlo al almacn
de datos

También podría gustarte