Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bases de Datos 1
Casales Cabrera María Evelia
Page 2
Diferencias entre Base de Datos y Almacén de
Datos
Page 3
Características del Almacén de Datos
Page 4
Data Warehousing
Page 5
Etapas de Diseño del Almacén de Datos
Origen (Source): Define los orígenes de datos del Almacén de Datos,
como los sistemas de Procesamiento de Transacciones en Línea (On-
Line Transaction Processing, OLTP), las fuentes de datos externas (datos
sindicados, datos censales), etc.
Cliente (Client): Define las estructuras concretas que son empleadas por
los clientes para acceder al Almacén de Datos, como Data Marts o
aplicaciones
Page 6 OLAP.
Niveles por Etapa del Diseño del Almacén de Datos
Lógico: Abarca aspectos lógicos del diseño del Almacén de Datos, como la
definición de las tablas y claves, la definición de los procesos ETL, etc.
Page 7
Diagramas de Formalización
Page 8
Arquitectura de un Almacén de Datos
Page 9
Arquitectura de un Almacén de Datos
Page 10
Arquitectura de un DW – Repositorio de Datos
Page 11
Arquitectura de un DW – Gestor de Carga
Page 12
Arquitectura de un DW – Gestor del Almacén de Datos
Page 13
Arquitectura de un DW – Tipos de Datos (1)
Page 14
Arquitectura de un DW – Tipos de Datos (2)
Datos Poco Resumidos y Muy Resumidos. Contienen los
datos que el gestor del Almacén de Datos ha establecido
como resúmenes predefinidos, con el propósito de acelerar
las consultas. Pueden verse modificados constantemente
con el fin de responder a las variaciones de las consultas.
Los datos poco resumidos corresponden al primer nivel de
agregación de los datos detallados actualmente, o lo que es
lo mismo a las consultas que se realizan habitualmente,
siendo estos almacenados en disco. Mientras que los muy
resumidos corresponden con el nivel más alto de agregación,
o lo que es lo mismo a las consultas que se realizan muy a
menudo y que se deben obtener muy rápidamente.
Page 15
Arquitectura de un DW – Tipos de Datos (3)
Page 16
Arquitectura de un DW – Sistema Gestor de Bases de
Datos (SGBD)
Page 17
Arquitectura de un DW – Gestor de Consultas
Page 18
Arquitectura de un DW – Herramientas de Acceso para
Usuarios (1)
El objetivo es proporcionar una herramienta de
acceso para los usuarios en la cual se puedan tomar
decisiones estratégicas. Por tanto la comunicación
entre el Almacén de Datos y la herramienta será
mediante consultas de tipo ad-hoc.
Page 19
Arquitectura de un DW – Herramientas de Acceso
para Usuarios (2)
Page 21
Data Marts (Mercados de Datos)
Page 22
Flujo de Datos
Flujo de Entrada
Es el proceso de extracción y carga de los sistemas de origen de datos al
almacén a través del repositorio de datos, aunque es necesario reconstruir
los datos antes de introducirlos en el almacén, realizando la limpieza, la
reestructuración para conseguir los requisitos del almacén y conseguir la
coherencia entre sí y los ya existentes.
Page 23
Flujo de Datos
Flujo Ascendente
Es el proceso de resumen, empaquetamiento y distribución con el fin de
añadir valor a los datos. Donde el resumen agrupa los datos con el fin de
hacerlos más cómodos y útiles para el usuario final. El empaquetamiento
convierte los datos de detalle o resumen a otros formatos más útiles. La
distribución de los datos a los usuarios apropiados.
Page 24
Flujo de Datos
Flujo Descendente
Es el proceso de archivado y creación de copias de seguridad de los datos,
donde el archivado es importante para el mantenimiento, efectividad y las
prestaciones del almacén, ya que los datos antiguos con menor valor son
transferidos a un archivo permanente. Otro de los fines es garantizar la
reconstrucción del almacén en el estado actual en caso de producirse una
pérdida de datos o fallo.
Page 25
Flujo de Datos
Flujo de Salida
Es el proceso de disponibilidad de los datos a los usuarios finales a través de
las herramientas. Es el flujo que más influye en cuestión de obtener una
ventaja competitiva, o lo que es lo mismo obtener el máximo beneficio al
almacén mediante la actividad de Acceso, la solicitud del usuario en obtener
los datos intentando que la herramienta de consulta para acceder al origen
de datos sea la más apropiada y efectiva. Y la actividad de Suministro que
intenta suministrar información a las estaciones de trabajo de los usuarios.
Page 26
Flujo de Datos
Metaflujo
Es el proceso de gestión de transferencia de los metadatos. Debido a los
constantes cambios producidos en el entorno de la organización, los
metadatos deben actualizarse continuamente para que reflejen estos
cambios.
Page 27
Uso del Data Warehouse
Page 28
Ventajas del Uso de Data Warehouse
Page 29
Desventajas del Uso de Data Warehouse
La subestimación del tiempo requerido para extraer, limpiar y cargar los
datos en el Almacén.
Problemas con los sistemas de origen de los datos.
Los datos obtenidos no son suficientes.
Pueden suponer altos gastos, además de los gastos de mantenimiento
que son muy elevados
Pueden quedarse obsoletos relativamente pronto si los usuarios
incrementan sus necesidades.
En Almacenes de Datos de considerable tamaño puede que la
homogeneización de los datos disminuya su valor.
Debido a que están estrechamente relacionadas con los sistemas
operativos se han de tener en cuenta cuales son las funcionalidades que
pueden aprovecharse. Como por ejemplo, la utilización de gran cantidad
de espacio en disco.
La construcción de un Almacén de Datos puede requerir de mucho
tiempo.
La integración de las herramientas de Almacén de Datos, para conseguir
un beneficio en la organización, es muy compleja.
Page 30