Está en la página 1de 8

Un cubo OLAP, OnLine Analytical Processing o procesamiento Analtico en Lnea, trmino

acuado por Edgar Frank Codd de EF Codd & Associates, encargado por Arbor Software
(en la actualidad Hyperion Solutions), es una base de datos multidimensional, en la cual el
almacenamiento fsico de los datos se realiza en un vector multidimensional.
Los cubos OLAP se pueden considerar como una ampliacin de las dos dimensiones de
una hoja de clculo.
A menudo se pensaba que todo lo que los usuarios pueden querer de un sistema de
informacin se podra hacer de una base de datos relacional. No obstante Codd fue uno
de los precursores de las bases de datos relacionales, por lo que sus opiniones fueron y
son respetadas.
ndice
[ocultar]

1 Introduccin

2 Un ejemplo

3 Dimensiones y jerarquas

4 Dispersin en cubos OLAP

5 Acceso y clculo de un cubo OLAP

6 Definicin tcnica

7 Vase tambin

Introduccin[editar]
La propuesta de Codd consista en realizar una disposicin de los datos en vectores para
permitir un anlisis rpido. Estos vectores son llamados cubos. Disponer los datos en
cubos evita una limitacin de las bases de datos relacionales, que no son muy adecuadas
para el anlisis instantneo de grandes cantidades de datos. Las bases de datos
relacionales son ms adecuados para registrar datos provenientes de transacciones
(conocido como OLTP o procesamiento de transacciones en lnea). Aunque existen
muchas herramientas de generacin de informes para bases de datos relacionales, stas
son lentas cuando debe explorarse toda la base de datos.
Por ejemplo, una empresa podra analizar algunos datos financieros por producto, por
perodo, por ciudad, por tipo de ingresos y de gastos, y mediante la comparacin de los
datos reales con un presupuesto. Estos parmetros en funcin de los cuales se analizan
los datos se conocen como dimensiones. Para acceder a los datos slo es necesario
indexarlos a partir de los valores de las dimensiones o ejes.
El almacenar fsicamente los datos de esta forma tiene sus pros y sus contras. Por
ejemplo, en estas bases de datos las consultas de seleccin son muy rpidas (de hecho,
casi instantneas). Pero uno de los problemas ms grandes de esta forma de

almacenamiento es que una vez poblada la base de datos sta no puede recibir cambios
en su estructura. Para ello sera necesario redisear el cubo.
En un sistema OLAP puede haber ms de tres dimensiones, por lo que a
los cubos OLAP tambin reciben el nombre de hipercubos. Las herramientas
comerciales OLAP tienen diferentes mtodos de creacin y vinculacin de estos cubos o
hipercubos (vase Tipos de OLAP en el artculo sobre OLAP).

Un ejemplo[editar]
Un analista financiero podra querer ver los datos de diversas formas, por ejemplo,
visualizndolos en funcin de todas las ciudades (que podran figurar en el eje de
abscisas) y todos los productos (en el eje de ordenadas), y esto podra ser para un perodo
determinado, para la versin y el tipo de gastos. Despus de haber visto los datos de esta
forma particular el analista podra entonces querer ver los datos de otra manera y poder
hacerlo de forma inmediata. El cubo podra adoptar una nueva orientacin para que los
datos aparezcan ahora en funcin de los perodos y el tipo de coste. Debido a que esta
reorientacin implica resumir una cantidad muy grande de datos, esta nueva vista de los
datos se debe generar de manera eficiente para no malgastar el tiempo del analista, es
decir, en cuestin de segundos, en lugar de las horas que seran necesarias en una base
de datos relacional convencional.

Dimensiones y jerarquas[editar]
Cada una de las dimensiones de un cubo OLAP puede resumirse mediante una jerarqua.
Por ejemplo si se considera una escala (o dimensin) temporal "Mayo de 2005" se puede
incluir en "Segundo Trimestre de 2005", que a su vez se incluye en "Ao 2005". De igual
manera, otra dimensin de un cubo que refleje una situacin geogrfica, las ciudades se
pueden incluir en regiones, pases o regiones mundiales; los productos podran clasificarse
por categoras, y las partidas de gastos podran agruparse en tipos de gastos. En cambio,
el analista podra comenzar en un nivel muy resumido, como por ejemplo el total de la
diferencia entre los resultados reales y lo presupuestado, para posteriormente descender
en el cubo (en sus jerarquas) para poder observar con un mayor nivel de detalle que le
permita descubrir en el cubo los lugares en los que se ha producido esta diferencia, segn
los productos y perodos.

Dispersin en cubos OLAP[editar]


Vincular o enlazar cubos es un mecanismo para superar la dispersin. sta se produce
cuando no todas las celdas del cubo se rellenan con datos (escasez de datos o valores
nulos). El tiempo de procesamiento es tan valioso que se debe adoptar la manera ms
efectiva de sumar ceros (los valores nulos o no existentes). Por ejemplo los ingresos
pueden estar disponibles para cada cliente y producto, pero los datos de los costos
pueden no estar disponibles con esta cantidad de anlisis. En lugar de crear un cubo

disperso, a veces es mejor crear otro cubo distinto, pero vinculado, en el que un
subconjunto de los datos se pueden analizar con gran detalle. La vinculacin asegura que
los datos de los dos cubos mantengan una coherencia.

Acceso y clculo de un cubo OLAP[editar]


Definicin tcnica[editar]
En teora de bases de datos, un cubo OLAP es una representacin abstracta de la
proyeccin de una relacin de un RDBMS (Sistema administrador de bases de datos
relacionales). Dada una relacin de orden N, se considera la posibilidad de una proyeccin
que dispone de los campos X, Y, Z como clave de la relacin y de W como atributo
residual. Categorizando esto como una funcin se tiene que:
W : (X,Y,Z) W
Los atributos X, Y, Z se corresponden con los ejes del cubo, mientras que el valor
de W devuelto por cada tripleta (X, Y, Z) se corresponde con el dato o elemento que
se rellena en cada celda del cubo.
Debido a que los dispositivos de salida (monitores, impresoras, ...) slo cuentan con
dos dimensiones, no pueden caracterizar fcilmente cuatro dimensiones, es ms
prctico proyectar "rebanadas" o secciones de los datos del cubo (se dice proyectar en
el sentido clsico vector analtico de reduccin dimensional, no en el sentido de SQL,
aunque los dos conceptos son claramente anlogos), tales como la expresin:
W : (X,Y) W
Aunque no se conserve la clave del cubo (al faltar el parmetro Z), puede tener
algn significado semntico, sin embargo, tambin puede que una seccin de la
representacin funcional con tres parmetros para un determinado valor
de Z tambin resulte de inters.
La motivacin que hay tras OLAP vuelve a mostrar de nuevo el paradigma de
los informes de tablas cruzadas de los sistema de gestin de base de datos de los
80. Se puede desear una visualizacin al estilo de una hoja de clculo, donde los
valores de X se encuentran en la fila $1, los valores de Y aparecen en la
columna $A, y los valores de W: (X,Y) W se encuentran en las celdas
individuales a partir de la celda $B2 y desde ah, hacia abajo y hacia la derecha. Si
bien se puede utilizar el Lenguaje de Manipulacin de Datos(o DML)
de SQL para mostrar las tuplas (X,Y,W), este formato de salida no es tan deseable
como la alternativa de tablas cruzadas. El primer mtodo requiere que se realice
una bsqueda lineal para cada par (X,Y) dado, para determinar el correspondiente
valor de W, mientras que el segundo permite realizar una bsqueda ms
convenientemente permitiendo localizar el valor W en la interseccin de la
columna X apropiada con la fila Y correspondiente.

Se ha desarrollado el lenguaje MDX (MultiDimensional


eXpressions o expresiones multidimensionales) para poder expresar
problemas OLAP de forma fcil. Aunque es posible traducir algunas sus
sentencias a SQL tradicional, con frecuencia se requieren expresiones SQL poco
claras incluso para las sentencias ms simples del MDX. Este lenguaje ha sido
acogido por la gran mayora de los proveedores de OLAP y se ha convertido en
norma de hecho para estos sistemas.

OLAP
OLAP es el acrnimo en ingls de procesamiento analtico en lnea (On-Line Analytical
Processing). Es una solucin utilizada en el campo de la llamada Inteligencia
empresarial(o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes
cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que
contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales
(OLTP). Se usa en informes de negocios de ventas, marketing, informes de
direccin, minera de datos y reas similares.
La razn de usar OLAP para las consultas es la rapidez de respuesta. Una base de datos
relacional almacena entidades en tablas discretas si han sido normalizadas. Esta
estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es
relativamente lenta. Un modelo mejor para bsquedas (aunque peor desde el punto de
vista operativo) es una base de datos multidimensional.
La principal caracterstica que potencia a OLAP, es que es lo ms rpido a la hora de
ejecutar sentencias SQL de tipo SELECT, en contraposicin con OLTP que es la mejor
opcin para operaciones de tipo INSERT, UPDATE Y DELETE [cita requerida].
ndice
[ocultar]

1 Funcionalidad

2 Tipos de sistemas OLAP


o

2.1 ROLAP

2.2 MOLAP

2.3 HOLAP (Hybrid OLAP)

2.4 Comparacin

2.5 Otros tipos

3 Vase tambin

4 Enlaces externos

Funcionalidad[editar]
En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (tambin
llamado cubo multidimensional o hipercubo). Se compone de hechos numricos
omedidas, que se clasifican por dimensiones. El cubo de metadatos es tpicamente
creado a partir de un esquema en estrella o copo de nieve, esquema de las tablas en una
base de datos relacional. Las medidas se obtienen de los registros de una tabla de hechos
y las dimensiones se derivan de la dimensin de los cuadros.

Tipos de sistemas OLAP[editar]


Tradicionalmente, los sistemas OLAP se clasifican segn las siguientes categoras:

ROLAP[editar]
Artculo principal: ROLAP

Implementacin OLAP que almacena los datos en un motor relacional. Tpicamente, los
datos son detallados, evitando las agregaciones y las tablas se encuentran
desnormalizadas Los esquemas ms comunes sobre los que se trabaja son estrella copo
de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La
arquitectura est compuesta por un servidor de banco de datos relacional y el motor OLAP
se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que
permite el anlisis de una enorme cantidad de datos.

MOLAP[editar]
Artculo principal: MOLAP

Esta implementacin OLAP almacena los datos en una base de datos multidimensional.
Para optimizar los tiempos de respuesta, el resumen de la informacin es usualmente
calculado por adelantado. Estos valores precalculados o agregaciones son la base de las
ganancias de desempeo de este sistema. Algunos sistemas utilizan tcnicas de
compresin de datos para disminuir el espacio de almacenamiento en disco debido a los
valores precalculados.

HOLAP (Hybrid OLAP)[editar]


Artculo principal: HOLAP

Almacena algunos datos en un motor relacional y otros en una base de datos


multidimensional.

Comparacin[editar]
Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las
caractersticas especficas de los beneficios entre los proveedores).
Algunas implementaciones MOLAP son propensas a la "explosin" de la base de datos;
este fenmeno provoca la necesidad de grandes cantidades de espacio de
almacenamiento para el uso de una base de datos MOLAP cuando se dan ciertas
condiciones: elevado nmero de dimensiones, resultados precalculados y escasos datos
multidimensionales. Las tcnicas habituales de atenuacin de la explosin de la base de
datos no son todo lo eficientes que sera deseable.
Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexacin y a
las optimizaciones de almacenamiento. MOLAP tambin necesita menos espacio de
almacenamiento en comparacin con los especializados ROLAP porque su
almacenamiento especializado normalmente incluye tcnicas de compresin.
ROLAP es generalmente ms escalable. Sin embargo, el gran volumen de
preprocesamiento es difcil de implementar eficientemente por lo que con frecuencia se
omite; por tanto, el rendimiento de una consulta ROLAP puede verse afectado.
Desde la aparicin de ROLAP van apareciendo nuevas versiones de bases de datos
preparadas para realizar clculos, las funciones especializadas que se pueden utilizar
tienen ms limitaciones.
HOLAP (OLAP Hbrido) engloba un conjunto de tcnicas que tratan de
combinar MOLAP y ROLAP de la mejor forma posible. Generalmente puede pre-procesar
rpidamente, escala bien, y proporciona una buena funcin de apoyo.

Otros tipos[editar]
Los siguientes acrnimos a veces tambin se utilizan, aunque no son sistemas tan
generalizados como los anteriores:

WOLAP o Web OLAP: OLAP basado u orientado para la web.

DOLAP o Desktop OLAP: OLAP de escritorio

RTOLAP o Real Time OLAP: OLAP en tiempo real

SOLAP o Spatial OLAP: OLAP espacial

Vase tambin[editar]

Cubo OLAP

ROLAP

MOLAP

OLTP

AQL

Inteligencia empresarial (Business Intelligence)

Almacn de datos (Data Warehousing)

Base de datos multidimensional

Minera de datos

Modelo de base de datos

Enlaces externos[editar]

La diferencia entre Transaccional y Analtico Explicacin no-tcnica de los sistemas de


Business Intelligence desde una perspectiva estratgica (en espaol)

Comparativa de servidores OLAP (en ingls)

The OLAP Report (en ingls)

Providing OLAP to User-Analysts: An IT Mandate, the Paper by Codd first describing


OLAP

OLAP Council White Paper

Introduction to OLAP

Dimensional Modeling and OLAP Tutorial

DataTime Universal: ROLAP product

Data Warehousing and OLAP: A Research-Oriented Bibliography

Microsoft OLAP information

A chapter from Erik Thomsen's book OLAP Solutions: Building Multidimensional


Information Systems, 2nd Edition

OLAP.com
Qu es OLAP?

Segn la Wikipedia, OLAP es:

OLAP es el acrnimo en ingls de procesamiento analtico en lnea (On-Line Analytical


Processing). Es una solucin utilizada en el campo de la llamada inteligencia empresarial (o
Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para
ello utiliza estructuras multidimensionales (o cubos OLAP) que contienen datos resumidos de
grandes bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de
ventas, marketing, informes de direccin, minera de datos y reas similares.

Te has enterado de algo? No? Pues tal vez te ayude esta imagen:

En un sistema OLAP, los datos de se pueden acceder desde las distintas dimensiones
empresariales (tpicamente: por tiempo, por producto, por cliente, por red comercial).

Todava no? Pues aqu tienes una explicacin mucho mejor (via TodoBI). Esto es OLAP:

Porque OLAP no es ms que eso: Una manera de acceder a tu informacin utilizando un


lenguaje natural. Esta seora selecciona su pizza filtrando todas las pizzas posibles a travs
de sus caractersticas relevantes.

En el mundo corporativo, los analistas acceden a la informacin filtrando sus indicadores de


negocio por regiones, por producto, por tiempo...

A partir de esta definicin bsica, existen distintas tecnologas que lo implementan (ROLAP,
MOLAP,...), pero bsicamente todas hacen las mismas acciones bsicas sobre la informacin:

Segmentar: Como cuando pides las ventas por producto y por trimestre
Filtrar: Como cuando pides el informe de ventas de Espaa en 2011
Profundizar (Drill down): Como cuando ves los datos de trimestre 2 y te interesa el desglose de
abril, mayo, junio.
Sintetizar (Drill up): Cuando deshacesel desglose anterior y vuelves al desglose por trimestre.

Rotar (Drill anywhere): Cuando en lugar de pasar de un desglose por trimestres a uno mensual,
te interesa un desglose por familia de producto, o por nacionalidad, es decir, por una
caracterstica de una jerarqua distinta a la que lo estas viendo actualmente.
No s si la enumeracin anterior es completa o clara. Sospecho que no. En cualquier caso, lo
relevante es que el anlisis OLAP te permite navegar fcilmente por la informacin,
solicitndola con el detalle preciso y con los filtros adecuados, y que puedes hacerlo de
manera dinmica, fcil, ad hoc, sobre la marcha, sin necesitar asistencia, rpido, y utilizando el
lenguaje de negocio. Vamos, como la seora del vdeo.

Offtopic: En nuestro otro blog hoy tambin hemos publicado un artculo. Tal vez te interese
suscribirte tambin a ese otro blog de Business Intelligence. (Google: Esto va por ti, tambin).
:-)

También podría gustarte