Está en la página 1de 4

Cubo OLAP

1
Cubo OLAP
Cubo OLAP de tres dimensiones (Ciudades, Productos y Tiempo).
Un cubo OLAP, OnLine Analytical Processing o
procesamiento Analtico en Lnea, trmino acuado por
Edgar Frank Codd de EF Codd & Associates, encargado
por Arbor Software (en la actualidad Hyperion
Solutions), es una base de datos multidimensional, en la
cual el almacenamiento fsico de los datos se realiza en
un vector multidimensional. Los cubos OLAP se pueden
considerar como una ampliacin de las dos dimensiones
de una hoja de clculo.
A menudo se pensaba que todo lo que los usuarios
pueden querer de un sistema de informacin se podra
hacer de una base de datos relacional. No obstante Codd
fue uno de los precursores de las bases de datos
relacionales, por lo que sus opiniones fueron y son
respetadas.
Introduccin
La propuesta de Codd consista en realizar una disposicin de los datos en vectores para permitir un anlisis rpido.
Estos vectores son llamados cubos. Disponer los datos en cubos evita una limitacin de las bases de datos
relacionales, que no son muy adecuadas para el anlisis instantneo de grandes cantidades de datos. Las bases de
datos relacionales son ms adecuados para registrar datos provenientes de transacciones (conocido como OLTP o
procesamiento de transacciones en lnea). Aunque existen muchas herramientas de generacin de informes para
bases de datos relacionales, stas son lentas cuando debe explorarse toda la base de datos.
Por ejemplo, una empresa podra analizar algunos datos financieros por producto, por perodo, por ciudad, por tipo
de ingresos y de gastos, y mediante la comparacin de los datos reales con un presupuesto. Estos parmetros en
funcin de los cuales se analizan los datos se conocen como dimensiones. Para acceder a los datos slo es necesario
indexarlos a partir de los valores de las dimensiones o ejes.
El almacenar fsicamente los datos de esta forma tiene sus pros y sus contras. Por ejemplo, en estas bases de datos las
consultas de seleccin son muy rpidas (de hecho, casi instantneas). Pero uno de los problemas ms grandes de esta
forma de almacenamiento es que una vez poblada la base de datos sta no puede recibir cambios en su estructura.
Para ello sera necesario redisear el cubo.
En un sistema OLAP puede haber ms de tres dimensiones, por lo que a los cubos OLAP tambin reciben el nombre
de hipercubos. Las herramientas comerciales OLAP tienen diferentes mtodos de creacin y vinculacin de estos
cubos o hipercubos (vase Tipos de OLAP en el artculo sobre OLAP).
Un ejemplo
Un analista financiero podra querer ver los datos de diversas formas, por ejemplo, visualizndolos en funcin de
todas las ciudades (que podran figurar en el eje de abscisas) y todos los productos (en el eje de ordenadas), y esto
podra ser para un perodo determinado, para la versin y el tipo de gastos. Despus de haber visto los datos de esta
forma particular el analista podra entonces querer ver los datos de otra manera y poder hacerlo de forma inmediata.
El cubo podra adoptar una nueva orientacin para que los datos aparezcan ahora en funcin de los perodos y el tipo
de coste. Debido a que esta reorientacin implica resumir una cantidad muy grande de datos, esta nueva vista de los
Cubo OLAP
2
datos se debe generar de manera eficiente para no malgastar el tiempo del analista, es decir, en cuestin de segundos,
en lugar de las horas que seran necesarias en una base de datos relacional convencional.
Dimensiones y jerarquas
Cada una de las dimensiones de un cubo OLAP puede resumirse mediante una jerarqua. Por ejemplo si se considera
una escala (o dimensin) temporal "Mayo de 2005" se puede incluir en "Segundo Trimestre de 2005", que a su vez
se incluye en "Ao 2005". De igual manera, otra dimensin de un cubo que refleje una situacin geogrfica, las
ciudades se pueden incluir en regiones, pases o regiones mundiales; los productos podran clasificarse por
categoras, y las partidas de gastos podran agruparse en tipos de gastos. En cambio, el analista podra comenzar en
un nivel muy resumido, como por ejemplo el total de la diferencia entre los resultados reales y lo presupuestado, para
posteriormente descender en el cubo (en sus jerarquas) para poder observar con un mayor nivel de detalle que le
permita descubrir en el cubo los lugares en los que se ha producido esta diferencia, segn los productos y perodos.
Dispersin en cubos OLAP
Vincular o enlazar cubos es un mecanismo para superar la dispersin. sta se produce cuando no todas las celdas del
cubo se rellenan con datos (escasez de datos o valores nulos). El tiempo de procesamiento es tan valioso que se debe
adoptar la manera ms efectiva de sumar ceros (los valores nulos o no existentes). Por ejemplo los ingresos pueden
estar disponibles para cada cliente y producto, pero los datos de los costos pueden no estar disponibles con esta
cantidad de anlisis. En lugar de crear un cubo disperso, a veces es mejor crear otro cubo distinto, pero vinculado, en
el que un subconjunto de los datos se pueden analizar con gran detalle. La vinculacin asegura que los datos de los
dos cubos mantengan una coherencia.
Acceso y clculo de un cubo OLAP
Los datos de los cubos pueden ser actualizados de vez en cuando, tal vez por personas diferentes de forma
concurrente. Para solventar este problema a menudo es necesario bloquear partes de un cubo mientras otro usuario
est escribiendo, para volver a calcular los totales en el cubo. Otras implementaciones aaden la posibilidad de
mostrar una alerta que indique que los totales calculados previamente ya no son vlidos tras los nuevos datos.
Tambin hay algunos productos que calculan los totales cuando se les necesita con los ltimos datos producidos en
el sistema.
Definicin tcnica
En teora de bases de datos, un cubo OLAP es una representacin abstracta de la proyeccin de una relacin de un
RDBMS (Sistema administrador de bases de datos relacionales). Dada una relacin de orden N, se considera la
posibilidad de una proyeccin que dispone de los campos X, Y, Z como clave de la relacin y de W como atributo
residual. Categorizando esto como una funcin se tiene que:
W : (X,Y,Z) W
Los atributos X, Y, Z se corresponden con los ejes del cubo, mientras que el valor de W devuelto por cada tripleta
(X, Y, Z) se corresponde con el dato o elemento que se rellena en cada celda del cubo.
Debido a que los dispositivos de salida (monitores, impresoras, ...) slo cuentan con dos dimensiones, no pueden
caracterizar fcilmente cuatro dimensiones, es ms prctico proyectar "rebanadas" o secciones de los datos del cubo
(se dice proyectar en el sentido clsico vector analtico de reduccin dimensional, no en el sentido de SQL, aunque
los dos conceptos son claramente anlogos), tales como la expresin:
W : (X,Y) W
Cubo OLAP
3
Aunque no se conserve la clave del cubo (al faltar el parmetro Z), puede tener algn significado semntico, sin
embargo, tambin puede que una seccin de la representacin funcional con tres parmetros para un determinado
valor de Z tambin resulte de inters.
La motivacin que hay tras OLAP vuelve a mostrar de nuevo el paradigma de los informes de tablas cruzadas de los
sistema de gestin de base de datos de los 80. Se puede desear una visualizacin al estilo de una hoja de clculo,
donde los valores de X se encuentran en la fila $1, los valores de Y aparecen en la columna $A, y los valores de W:
(X,Y) W se encuentran en las celdas individuales a partir de la celda $B2 y desde ah, hacia abajo y hacia la
derecha. Si bien se puede utilizar el Lenguaje de Manipulacin de Datos (o DML) de SQL para mostrar las tuplas
(X,Y,W), este formato de salida no es tan deseable como la alternativa de tablas cruzadas. El primer mtodo
requiere que se realice una bsqueda lineal para cada par (X,Y) dado, para determinar el correspondiente valor de W,
mientras que el segundo permite realizar una bsqueda ms convenientemente permitiendo localizar el valor W en la
interseccin de la columna X apropiada con la fila Y correspondiente.
Se ha desarrollado el lenguaje MDX (MultiDimensional eXpressions o expresiones multidimensionales) para poder
expresar problemas OLAP de forma fcil. Aunque es posible traducir algunas sus sentencias a SQL tradicional, con
frecuencia se requieren expresiones SQL poco claras incluso para las sentencias ms simples del MDX. Este
lenguaje ha sido acogido por la gran mayora de los proveedores de OLAP y se ha convertido en norma de hecho
para estos sistemas.
Fuentes y contribuyentes del artculo
4
Fuentes y contribuyentes del artculo
Cubo OLAP Fuente: http://es.wikipedia.org/w/index.php?oldid=71034697 Contribuyentes: Boja, Diegusjaimes, GermanX, Humbefa, J2deme, Jesuja, Khiari, PasabaPorAqui, VARGUX, 43
ediciones annimas
Fuentes de imagen, Licencias y contribuyentes
Archivo:OLAP Cube.png Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:OLAP_Cube.png Licencia: Creative Commons Attribution 3.0 Contribuyentes: Konrad Roeder
Licencia
Creative Commons Attribution-Share Alike 3.0
//creativecommons.org/licenses/by-sa/3.0/