Está en la página 1de 3

13-6-2019 BASE DE

DATOS II
CUBOS Y MINERIA DE DATOS

Usuario de Windows
[NOMBRE DE LA EMPRESA]
Cubo OLAP
Un cubo OLAP, OnLine Analytical Processing o procesamiento Analítico en Línea, término acuñado
por Edgar Frank Codd de EF Codd & Associates, encargado por Arbor
Software (en la actualidad Hyperion Solutions), es una base de datos
multidimensional, en la cual el almacenamiento físico de los datos se realiza
en un vector multidimensional. Los cubos OLAP se pueden considerar como
una ampliación de las dos dimensiones de una hoja de cálculo.
A menudo se pensaba que todo lo que los usuarios pueden querer de un
sistema de información se podría hacer de una base de datos relacional. No
obstante, Codd fue uno de los precursores de las bases de datos relacionales,
por lo que sus opiniones fueron y son respetadas.

Introducción
La propuesta de Codd consistía en realizar una disposición de los datos en
vectores para permitir un análisis rápido. Estos vectores son llamados cubos.
Disponer los datos en cubos evita una limitación de las bases de datos
relacionales, que no son muy adecuadas para el análisis instantáneo de
grandes cantidades de datos. Las bases de datos relacionales son más
adecuadas para registrar datos provenientes de transacciones (conocido
como OLTP o procesamiento de transacciones en línea). Aunque existen
muchas herramientas de generación de informes para bases de datos
relacionales, éstas son lentas cuando debe explorarse toda la base de datos.
Por ejemplo, una empresa podría analizar algunos datos financieros por
producto, por período, por ciudad, por tipo de ingresos y de gastos, y
mediante la comparación de los datos reales con un presupuesto. Estos
parámetros en función de los cuales se analizan los datos se conocen como
dimensiones. Para acceder a los datos sólo es necesario indexarlos a partir de
los valores de las dimensiones o ejes.
El almacenar físicamente los datos de esta forma tiene sus pros y sus contras.
Por ejemplo, en estas bases de datos las consultas de selección son muy
rápidas (de hecho, casi instantáneas). Pero uno de los problemas más
grandes de esta forma de almacenamiento es que una vez poblada la base de
datos ésta no puede recibir cambios en su estructura. Para ello sería
necesario rediseñar el cubo.
En un sistema OLAP puede haber más de tres dimensiones, por lo que a los
cubos OLAP también reciben el nombre de hipercubos. Las herramientas
comerciales OLAP tienen diferentes métodos de creación y vinculación de
estos cubos o hipercubos (véase Tipos de OLAP en el artículo sobre OLAP).

Dimensiones y jerarquías
Cada una de las dimensiones de un cubo OLAP puede resumirse mediante
una jerarquía. Por ejemplo si se considera una escala (o dimensión) temporal
"Mayo de 2005" se puede incluir en "Segundo Trimestre de 2005", que a su
vez se incluye en "Año 2005". De igual manera, otra dimensión de un cubo
que refleje una situación geográfica, las ciudades se pueden incluir en
regiones, países o regiones mundiales; los productos podrían clasificarse por
categorías, y las partidas de gastos podrían agruparse en tipos de gastos. En
cambio, el analista podría comenzar en un nivel muy resumido, como por
ejemplo el total de la diferencia entre los resultados reales y lo
presupuestado, para posteriormente descender en el cubo (en sus
jerarquías) para poder observar con un mayor nivel de detalle que le permita
descubrir en el cubo los lugares en los que se ha producido esta diferencia,
según los productos y períodos.

También podría gustarte