Está en la página 1de 16

Almacenes de datos

En este módulo, estudiaremos cómo las bases de datos se han transformado en un


corazón habitual de todo sistema, ya sea transaccional, data whare house o,
inclusive, en la actualidad, en el corazón de los sistemas de big data.

Almacenes de datos

Referencias

Descarga en PDF
LECCIÓN 1 de 3

Almacenes de datos

Caso práctico profesional

Para ejemplificar de mejor forma los conceptos de los grandes almacenes de


datos, tomaremos, como referencia, el siguiente caso.

Trayendo el ejemplo visto en otros módulos de la materia, podemos volver a


leer la situación profesional del complejo de cines de alta tecnología y, como
caso práctico, asumimos que somos contratados para implementar un
sistema que le permita saber el perfil de las personas que acuden a sus salas
de cine, el lugar geográfico de los barrios desde donde acuden y, por último,
la preferencia que poseen sobre el tipo de película que miran.

Una arquitectura básica de la implementación de un mercado de datos


puede ser la que se observa en la figura 1.

Figura 1: Ejemplo de una arquitectura de un almacén de


datos con varios mercados de datos dentro
Fuente: elaboración propia.

De la base de datos transaccional al almacén de datos

Históricamente, las bases de datos transaccionales son utilizadas para


guardar los datos de las operaciones diarias; como el registro de ventas,
actualización de stocks, gestión de pedidos y los asientos contables.

En el caso del cine del shopping, en la base de datos operativa,


almacenamos las funciones organizadas de las películas que se presentan
en la actualidad y las compras de entradas que realizan los clientes.
A partir de estos datos operativos, se puede obtener muchísima información
de gestión y, comúnmente, se utilizaban sistemas específicos para capturar
y presentar esa información a los usuarios.

En el último tiempo, se comenzaron a utilizar sofisticadas herramientas de


software que almacenan grandes volúmenes de datos obtenidos de
diferentes orígenes de datos transaccionales, para analizarlos e identificar
patrones.

Es aquí donde las distintas tecnologías interrelacionadas, como almacenes


de datos, procesamiento analítico en línea y el data mining desempeñan un
papel muy importante.

El proceso denominado data whare housing es el proceso a través del cual se


obtienen los datos operaciones desde distintas fuentes de datos y alimentan
distintas herramientas que son usadas para la toma de decisiones
estratégicas. En nuestro caso, estos procesos obtienen información de las
bases de datos operativas de las funciones y ventas y alimentan el almacén
de datos correspondiente.

Almacenes de datos

Particularmente, en esta lectura, nos vamos a enfocar en los almacenes de


datos, que son sistemas de bases de datos diseñados exclusivamente para
ayudar en la toma de decisiones estratégicas. El principal objetivo que
poseen es incrementar la productividad y eficiencia de la toma de decisiones
en una organización.

Un almacén de datos se diferencia de una base de datos tradicional,


fundamentalmente, en tres aspectos.

Volumen de datos: probablemente, en un almacén de datos se


encuentre mucho más volumen de información que en cualquier
base de datos relacional.

Diversas fuentes de datos: posiblemente, los datos almacenados


en un almacén de datos hayan sido obtenidos desde diferentes
orígenes de datos, a través de diferentes herramientas y procesos
destinados a tal fin. Posiblemente, pocos de ellos son bases de
datos.

Acceso dimensional: los almacenes de datos se diseñan de


acuerdo a la forma que los usuarios desean ver la información para
la tomar decisiones, cada una de estas formas son comúnmente
llamadas dimensiones.

Un almacén de datos es una colección de datos orientados a un tema,


integrados, variantes con el tiempo y no volátiles, utilizados para apoyar la
toma de decisiones de la dirección (Evaluando Software.com, 2016).

¿Por qué son orientados a un tema?


Un almacén de datos se estructura de acuerdo a las principales áreas que
posee la organización donde este se implementa.

¿Por qué son integrados?

Un almacén de datos posee un repositorio de información que integra datos


que pueden tener, como origen, varios sistemas con diferentes arquitecturas
de hardware y software y, también, cada uno de ellos, a su vez, pueden tener
diferentes formatos y tipos de datos.

¿Por qué son variantes en el tiempo?

Un almacén de datos asocia, específicamente, cada dato o foto de


información a un momento dado, es decir que toda información es válida
solo para un momento determinado.

¿Por qué no son volátiles?

Los datos del almacén de datos no se actualizan en tiempo real y en forma


constante. Estos se refrescan periódicamente, a partir de los datos que se
manipulan en los sistemas transaccionales.

Beneficios del uso de un almacén de datos

Principalmente, un almacén de datos beneficia a una organización en:


brinda una estructura sencilla para el almacenamiento de los datos
que, luego, se transforman en información para la toma de
decisiones estratégicas;

permite a los usuarios que pertenecen a la organización ejecutar


consultas complejas sobre información que atraviesa diferentes
áreas de negocios; y

permite el uso y aplicación de herramientas de inteligencia de


negocios, analíticas y de minería de datos.

Dificultades en el uso de un almacén de datos

Los proyectos de creación de almacenes de datos son considerados de gran


escala y, normalmente, lleva varios años analizarlos, desarrollarlos y ponerlos
a punto. En el transcurso de ese tiempo, se presentan algunas dificultades
que se deben sortear:

saber de antemano lo que necesitan los usuarios y determinar las


fuentes de datos y qué se extraerá de cada una de ellas;

seleccionar, instalar e integrar diferentes sistemas que poseen


varias combinaciones de hardware y software;

las grandes cantidades y volúmenes de datos que manipula el


almacén de datos implica inversiones en grandes espacios de
discos;

identificar, reconciliar y limpiar todos los datos que son obtenidos


desde las fuentes externas de información para, luego, cargarlas
en el almacén de datos; y

mantener funcionando de forma correcta y eficaz el proceso de


refresco y actualización de los datos del almacén de datos.

Componentes de un almacén de datos

Figura 2: Componentes de un almacén de datos

Fuente: Beynon-Davies, 2014.


Datos operativos o transaccionales: se pueden obtener datos
desde varios orígenes de datos, bases de datos transaccionales
propias de la organización y sistemas externos privados o públicos.

Funciones de extracción, transformación y carga: estas funciones


son las que manipulan los datos desde las fuentes orígenes y los
organizan y ordenan para guardarlos en el lugar correspondiente
del almacén de datos.

Gestión del almacén: existen varias herramientas para gestionar el


almacén y mantener de forma operativa la consistencia de
información, la indexación, la desnormalización, agregación, copias
de seguridad y archivado.

Gestión de consultas: las consultas que ofrece el almacén tienen


que estar disponibles para que otras herramientas de consultas,
generación de informes, herramientas OLAP y minería de datos
obtengan de forma eficaz lo que necesitan.

Tipos de datos de un almacén de datos

Datos detallados: son datos obtenidos desde las bases de datos


operativas con un gran detalle de transacción, normalmente, no se
almacenan en línea, sino que a intervalos definidos de tiempo.

Datos resumidos: los datos resumidos se desarrollan para hacer


más rápidas las consultas que los utilizan. Los datos pueden estar
ligeramente resumidos o fuertemente resumidos. Ambos deben
actualizarse al mismo momento que los datos detallados, para
para garantizar la consistencia de información de todo el almacén.

Metadatos: son datos que se refieren a otros datos dentro del


almacén.

Archivado de datos: periódicamente, es necesario archivar de


modo off-line información ya analizada, para garantizar que la base
de datos del almacén no crezca demasiado y sea
contraproducente para el rendimiento de las consultas.

Copias de seguridad: de la misma forma que las bases de datos


operativas o transaccionales, es necesario gestionar los backups
para que estén disponibles en el momento de su necesidad.

Mercado de datos

Un mercado de datos es un almacén de datos restringido por:

tipo de datos: puede estar limitado a un solo origen de datos;

área de negocios: puede estar diseñado para almacenar


información de una sola área de negocios y no para toda la
organización; y
área geográfica: se puede establecer para un área geográfica
específica relacionada con lo que la organización realiza.

Sobre nuestro caso de estudio, el cine del shopping, tenemos diagramados


dos mercados de datos dentro del almacén de datos, uno sobre el tipo de
película que los clientes vienen a ver y otro sobre el origen barrial de cada
uno de ellos.

Distintos esquemas de un almacén de datos

El diseño de los esquemas de los almacenes de datos son casos particulares


de los diseños de las bases de datos.

Hay dos aspectos, especialmente, a tener en cuenta que son: el gran


volumen de datos y el gran problema de alcanzar niveles satisfactorios de
rendimiento en la restauración.

Esquemas en estrella: es una tabla central rodeada por tablas de


referencia que contienen datos que afectan a determinadas
dimensiones de la organización.

Figura 3: Esquema en estrella


Fuente: Beynon-Davies, 2014.

Esquemas de copo de nieve: es una variación del esquema en


estrella, cada dimensión tiene un número de sus propias
dimensiones y las tablas de referencia no están desmoralizadas.

Figura 4: Esquema de copo de nieve


Fuente: Beynon-Davies, 2014.

Esquemas de copo de estrella: se encuentran entre los esquemas


de estrella y de copo de nieve, algunas tablas se normalizarán y
otras se desnormalizarán.

Figura 5: Esquema de copo de estrella


Fuente: Beynon-Davies, 2014.

C O NT I NU A R
LECCIÓN 2 de 3

Referencias

Beynon-Davies, P. (2014). Sistemas de bases de datos. (s.d.). Editorial


Reverté.

Evaluando Software.com (2016). ABC del Data Warehouse. Recuperado de


https://www.evaluandosoftware.com/abc-del-data-
warehouse/#:~:text=Un%20data%20warehouse%20o%20dep%C3%B3sito,de
%20toma%20de%20decisiones%20gerenciales.
LECCIÓN 3 de 3

Descarga en PDF

Módulo 4 - Lectura 1.pdf


313.6 KB

También podría gustarte