Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Data Warehouse
Data Warehouse
Bases de Datos 1
Casales Cabrera Mara Evelia
Maestra en Ciencias e Ingeniera de la Computacin, 2009-1
Page 2
Almacn de Datos
Datos Operacionales
Orientado a aplicacin
Actual
Detallada
Cambia
continuamente
Page 3
Page 4
Data Warehousing
Data Warehousing es el proceso que facilita la creacin y
explotacin de un Almacn de Datos. Los Sistemas de Data
Warehousing incluyen funcionalidades como:
Integracin de bases de datos heterogneas (relacionales, documentales,
geogrficas, archivos, etc.)
Ejecucin de consultas complejas no predefinidas visualizando el resultado en
forma grfica y en diferentes niveles de agrupamiento y totalizacin de datos.
Agrupamiento y desagrupamiento de datos en forma interactiva.
Anlisis del problema en trminos de dimensiones.
Control de calidad de datos.
Page 5
Page 7
Diagramas de Formalizacin
Cada etapa o nivel necesita formalismos de modelado diferentes.
Una aproximacin es la siguiente, donde el diseador del Almacn
de Datos no necesita definir todos los diagramas que se especifican:
Page 8
Page 9
Page 10
Page 11
Page 12
Page 13
Page 14
Page 15
Page 16
Page 18
Page 19
Page 21
Page 22
Flujo de Datos
Flujo de Entrada
Es el proceso de extraccin y carga de los sistemas de origen de datos al
almacn a travs del repositorio de datos, aunque es necesario reconstruir
los datos antes de introducirlos en el almacn, realizando la limpieza, la
reestructuracin para conseguir los requisitos del almacn y conseguir la
coherencia entre s y los ya existentes.
Page 23
Flujo de Datos
Flujo Ascendente
Es el proceso de resumen, empaquetamiento y distribucin con el fin de
aadir valor a los datos. Donde el resumen agrupa los datos con el fin de
hacerlos ms cmodos y tiles para el usuario final. El empaquetamiento
convierte los datos de detalle o resumen a otros formatos ms tiles. La
distribucin de los datos a los usuarios apropiados.
Page 24
Flujo de Datos
Flujo Descendente
Es el proceso de archivado y creacin de copias de seguridad de los datos,
donde el archivado es importante para el mantenimiento, efectividad y las
prestaciones del almacn, ya que los datos antiguos con menor valor son
transferidos a un archivo permanente. Otro de los fines es garantizar la
reconstruccin del almacn en el estado actual en caso de producirse una
prdida de datos o fallo.
Page 25
Flujo de Datos
Flujo de Salida
Es el proceso de disponibilidad de los datos a los usuarios finales a travs de
las herramientas. Es el flujo que ms influye en cuestin de obtener una
ventaja competitiva, o lo que es lo mismo obtener el mximo beneficio al
almacn mediante la actividad de Acceso, la solicitud del usuario en obtener
los datos intentando que la herramienta de consulta para acceder al origen
de datos sea la ms apropiada y efectiva. Y la actividad de Suministro que
intenta suministrar informacin a las estaciones de trabajo de los usuarios.
Page 26
Flujo de Datos
Metaflujo
Es el proceso de gestin de transferencia de los metadatos. Debido a los
constantes cambios producidos en el entorno de la organizacin, los
metadatos deben actualizarse continuamente para que reflejen estos
cambios.
Page 27
Consultas prefinidas y
actualizables
Cantidades pequeas de
datos detallados
Requerimientos de respuesta
inmediata
Requerimientos de respuesta no
crticos
Page 28
Page 29