Documentos de Académico
Documentos de Profesional
Documentos de Cultura
informacion
adicional
digitalizada
traves
de
datos
Modelo Multidimensional:
Tal vez el principal obstculo que puede encontrar una persona al momento de
trabajar con una representacin abstracta de una realidad que conoce bien, es tener
que adaptarse a un modelo o forma de trabajo muy distante de como esa
persona razona o visualiza esa realidad.
El xito de las planillas de clculo se debe en gran medida a que su modelo de
datos en forma de grilla fue y es fcilmente aceptado. Los usuarios adoptan ese
modelo en forma natural porque les es cercano a la forma en que piensan o realizan
su trabajo.
La estructuracin de la informacin en una base de datos en un sistema
OLTP persigue fines tcnicos muy especficos, orientados a que las aplicaciones (que
mediatizan
entre
esa
compleja
representacin
el
usuario)
se
ejecuten
eficientemente.
Para que un usuario pueda trabajar en forma directa sobre la informacin, sin las
restricciones que plantea una aplicacin especfica es necesario presentar y organizar
esa informacin en una forma dirigida a las personas y no a los sistemas. Eso
es lo que se consigue a travs del llamado Modelo Multidimensional.
Las bases de datos multidimensionales se utilizan principalmente para crear
aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su
peculiaridad es que por cada dimensin tienen un campo (o columna), y otro campo
por cada mtrica o hecho, es decir estas tablas almacenan registros cuyos campos
son de la forma:
Donde los campos ' ' hacen referencia a las dimensiones de la tabla, y los campos ' '
a las mtricas o hechos que se quiere almacenar, estudiar o analizar.
Veamos un caso clsico. Supongamos que un responsable del rea comercial de una
empresa necesita analizar las ventas. Un modelo multidimensional clasifica y
cuantifica todos los elementos que deben considerarse para analizar un tema. Para
este caso podramos tener como clasificacin:
Y como medidas: Unidades, Venta, Costo y Resultado (ver cuadro No. 6).
Una forma simple de entender como se refleja cada hecho de la realidad en este
modelo es en forma de grilla, donde las columnas son clasificaciones o medidas y las
filas son cada uno de los hechos (en este ejemplo ventas).Modelos Multidimensionales
El modelo se completa con la posibilidad de ordenar en forma jerrquica cada una de
las dimensiones (columnas de la tabla anterior).
CUADRO 6
En nuestro ejemplo, las fechas se organizaran en aos, meses y das, los productos
en lneas y familias, las regiones en pases, provincias y localidades.
La principal funcin del modelo es permitir que el usuario consulte cualquier la
informacin a travs de cualquier combinacin de las dimensiones y medidas.
En el ejemplo, un usuario podra comenzar un anlisis de las ventas verificando la
evolucin del margen de ventas de los ltimos tres meses.
CUADRO 7
En caso de encontrar un valor bajo en alguno de ellos, con gran facilidad puede
consultar las medidas unidades, venta y costo. En caso de que el motivo de esa baja
fuera una baja en las unidades vendidas, podra explorar si ese comportamiento se
mantiene para los distintos productos o regiones de venta.
Las operaciones bsicas para realizar la exploracin anterior no requieren el
conocimiento de detalles tcnicos ni de lenguajes de consulta. As como en una
planilla es fcil seleccionar una celda o una columna este modelo admite un control
completo de las consultas a travs de un dilogo sencillo basado en el uso del
mouse.
Capacidad de Anlisis: Para que los usuarios sean capaces de explotar el
potencial de la informacin en forma efectiva es necesario brindarles una buena
combinacin de facilidades avanzadas para la manipulacin y presentacin de
datos.
Entre las caractersticas de OLAP dirigidas
en este sentido se destacan la utilizacin de
avanzadas interfaces grficas, capaces de
presentar
la
informacin
en
forma
el
usuario
directamente
sobre
la
Es decir que el usuario que realiza consultas o anlisis trabaje directamente con el
sistema ejecutando no una sino varias consultas en una misma sesin de trabajo.
Esto esta motivado en que el anlisis de la informacin no tiene un camino
preestablecido, ya que justamente depende de la valoracin de cada situacin que se
plantea y de la bsqueda de causas y consecuencias a las que da lugar.
Un sistema que asista realmente al usuario en este trabajo, debe poder incorporarse
al propio proceso de bsqueda que el analista realiza. Para ello, adems de prever
un conjunto de capacidades particulares (como se present ms arriba), es
fundamental establecer tiempos de respuesta muy altos, que permitan que el usuario
se concentre en su objetivo y mediante una secuencia de ciclos compuestos de:
elaboracin, de la consulta, visualizacin de resultados, nueva consulta, se logre una
cabal percepcin y comprensin de la situacin. La resolucin de la consulta
normalmente es realizada en trminos de unos pocos segundos.
Estos tiempos de respuesta nunca han podido obtenerse mediante el trabajo directo
sobre las bases de datos operativas. Para lograrlo se requiere un enfoque en el que
la informacin de anlisis sea preparada a priori y est disponible en forma
independiente y sobre sistemas capaces de alcanzar la flexibilidad y velocidad en las
operaciones especficas que el anlisis requiere.
Accesibilidad: El potencial de OLAP estara seriamente comprometido si por
distintos motivos el mismo no pudiera alcanzar a las personas que lo requieren para
aumentar su nivel de trabajo y efectividad.
Esta tecnologa es de gran valor para los niveles ejecutivos y gerenciales debido a la
importancia que reviste el contar con informacin oportuna y facilidades para su
anlisis en el momento de la toma de decisiones. Pero tambin tiene un alto valor
para otros niveles de una organizacin.
Por ejemplo, para la fuerza de venta de una organizacin que pretende poder dirigir
su actividad a la concrecin de los objetivos planteados, tanto la capacidad de
anlisis de los planes en los trminos que la organizacin se los propone (satisfaccin
del cliente, mrgenes brutos a obtener, etc.) como el seguimiento del nivel de
cumplimiento en forma diaria pueden impulsar radicalmente los resultados de su
actividad.
Para facilitar el acceso a esta tecnologa, la misma debe poder desarrollarse
basndose en la infraestructura comnmente disponible en una organizacin (red
local, PCs). Por otra parte, el potencial de esta herramienta no debe quedar limitado
a los confines de la organizacin, debiendo ser posible la utilizacin de la
computacin mvil y de las redes como Internet.
Beneficios:
Los beneficios que son posibles de obtener mediante la aplicacin de esta tecnologa
estn estrechamente vinculados con el poder que la informacin puede aportar a
las organizaciones que logren la capacidad de aplicarla como un agente activo para
la mejora de los procesos y desarrollo de una ventaja competitiva.
El uso oportuno, eficiente y profundo de la informacin, por parte de cada uno
de los niveles de la organizacin puede ser la base de una mejora sustancial
en el desarrollo de los procesos y la capacidad de la empresa de alcanzar sus
objetivos.
Otro de los beneficios de esta tecnologa es la reduccin de los costos propios
de la generacin y trabajo con la informacin, mediante la aplicacin de
mecanismos integrados y modernos de extraccin, armado, distribucin,
comprensin y anlisis.
La estrategia:
debido a la imperiosa necesidad de las organizaciones de poner en prctica los
beneficios de esta tecnologa y a su capacidad de integracin con la tecnologa ya
existente, es que se abre la oportunidad de encarar su
incorporacin mediante
SISTEMA OLAP
CONTEXTO
La propuesta de Codd consista en realizar una disposicin de los datos en vectores
para permitir un anlisis rpido. Estos vectores son llamados cubos. Disponer los
datos en cubos evita una limitacin de las bases de datos relacionales, que no son
muy adecuadas para el anlisis instantneo de grandes cantidades de datos. Las
bases de datos relacionales son ms adecuados para registrar datos provenientes de
transacciones (conocido como OLTP o procesamiento de transacciones en lnea).
Aunque existen muchas herramientas de generacin de informes para bases de datos
relacionales, stas son lentas cuando debe explorarse toda la base de datos.
Por ejemplo, una empresa podra analizar algunos datos financieros por producto, por
perodo, por ciudad, por tipo de ingresos y de gastos, y mediante la comparacin de
los datos reales con un presupuesto. Estos parmetros en funcin de los cuales se
analizan los datos se conocen como dimensiones. Para acceder a los datos slo es
necesario indexarlos a partir de los valores de las dimensiones o ejes.
El almacenar fsicamente los datos de esta forma tiene sus pros y sus contras. Por
ejemplo, en estas bases de datos las consultas de seleccin son muy rpidas (de
hecho, casi instantneas). Pero uno de los problemas ms grandes de esta forma de
almacenamiento es que una vez poblada la base de datos sta no puede recibir
cambios en su estructura. Para ello sera necesario redisear el cubo.
DEFINICIONES
Mediante la funcionalidad OLAP es posible llevar adelante la forma ms
sencilla de anlisis, permitiendo que cualquier persona pueda ver de manera
minuciosa subconjuntos de datos interrelacionados o "cubos", simplemente
con un clic. Los usuarios pueden analizar los datos empleando caractersticas
OLAP estndar, como page-by, sort, filtros, drill-up/down para obtener distintas
vistas de los reportes. Los Anlisis OLAP ofrecen a los usuarios acceso a sus
data warehouses para que puedan obtener las funcionalidades de anlisis
avanzados que requieren los power users y los analistas.
En un sistema OLAP puede haber ms de tres dimensiones, por lo que a los
cubos OLAP tambin reciben el nombre de hipercubos. Las herramientas
comerciales OLAP tienen diferentes mtodos de creacin y vinculacin de
estos cubos o hipercubos (vase Tipos de OLAP en el artculo sobre OLAP).
OLAP es el acrnimo en ingls de procesamiento analtico en lnea (On-Line
Analytical Processing). Es una solucin utilizada en el campo de la llamada
Funcionalidad
En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP
(tambin llamado cubo multidimensional o hipercubo). Se compone de hechos
numricos o medidas, que se clasifican por dimensiones. El cubo de metadatos es
tpicamente creado a partir de un esquema en estrella o copo de nieve, esquema de
las tablas en una base de datos relacional. Las medidas se obtienen de los registros
de una tabla de hechos y las dimensiones se derivan de la dimensin de los cuadros.
El cambio que propone la tecnologa OLAP, es en esencia una revisin del
enfoque que tradicionalmente se ha aplicado al desarrollo de los sistemas de
apoyo a la toma de decisiones y de anlisis del negocio.
La concentracin en la atencin de los sistemas de informacin en las
operaciones de la empresa, dio lugar a sistemas especializados en el
tratamiento eficiente y seguro de altos volmenes de transacciones cortas
(facturacin, movimientos de inventarios, etc.). Esto es conocido como OLTP
(On-Line Transaction Processing).
Pero dentro de la ptica de los sistemas dirigidos a OLTP, el soporte de las
actividades de anlisis jug un papel secundario, generalmente caracterizado
por mtodos de trabajo que acceden en forma directa a la base de datos (la
misma que est soportando las operaciones on-line) con la finalidad de extraer
y procesar la informacin.
Sistemas MOLAP
La arquitectura de sistemas MOLAP se fundamenta, para proporcionar el
anlisis, en bases de datos multidimensionales. Su principal premisa es que se
trata del entorno OLAP mejor implantado y adaptado para el almacenamiento y
gestin de datos multidimensionalmente. Por el contrario, la arquitectura y gestin
de entornos
ROLAP
presupone
que las capacidades
OLAP
estn
perfectamente implantadas y reflejadas sobre bases de datos relacionales.
Un sistema MOLAP usa una base de datos multidimensional, en la que la
informacin se almacena multidimensionalmente,
para
ser
visualizada
multidimensionalmente (valga la redundancia). El sistema MOLAP utiliza una
arquitectura de dos niveles: La bases de datos multidimensionales y el motor
analtico.
Sistemas ROLAP
En una arquitectura ROLAP, el sistema accede directamente a los datos
almacenados
en un DataWarehouse para proporcionar los anlisis OLAP
solicitados. La premisa de estos sistemas es que las capacidades OLAP se
soportan mejor contra las bases de datos relacionales, ms que tenerlas
directamente implementadas en la base de datos (como en entornos MOLAP). La
esencia de estos entornos es las acciones de filtrado y agregacin es equivalente a
la inclusin de una clusula WHERE" en una sentencia SQL.
El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos
relacional maneja los requerimientos de almacenamiento de datos, y el motor
ROLAP proporciona la funcionalidad analtica.
El nivel de base de datos usa bases de datos relacionales para el
manejo, acceso y obtencin del dato.
El nivel de aplicacin es el motor que ejecuta las consultas
multidimensionales de los usuarios.
El motor ROLAP se integra con niveles de presentacin, a travs de los
cuales los usuarios realizan los anlisis OLAP.
Los sistemas con alta volatilidad de los datos (aquellos en los que
cambian las reglas de agregacin
y
consolidacin),
requieren
una
arquitectura que pueda realizar esta consolidacin ad-hoc. Los sistemas
ROLAP soportan bien esta consolidacin dinmica, mientras que los MOLAP
estn ms orientados hacia consolidaciones batch.
N PAS TC
N Doctores
Notas
N PDI
Universidad
Campus
Centro
Matriculas
ROLAP
Crditos
MOLAP
Universidad
Campus
Centro
A
lumno
Alum.
Tit.
P
laza
s
Matricula
CCAA
Asig.
Colec.
Campus
Univ
Plazas
centro
CCE
lumno
Universidad
Campus
Centro
Notas
Crditos
Hombre
Mujer
100
100
400
350
50
65
90
98
100
110
320
295
400
430
120
125
100
105
Matriculas
Universidad
sexo
Cdiz
Sevilla
Pablo Olavide
Jan
Almera
Mlaga
Granada
Crdoba
Huelva
Crditos
Un entorno MOLAP, como se aprecia en el dibujo anterior genera previamente los cubos multidimensionales
que le permitirn los anlisis que se estimen necesarios. Esto significa que p.e. al realizar anlisis de
crditos, matrcula o notas, por cualquier atributo organizativo (universidad, campus, centro) sobre un
atributo caracterstico del alumno (sexo, edad, provincia) el sistema acceder al primer cubo y resolver
la consulta agregando lo datos directamente de dicho cubo multidimensional:
Como el dato est previamente agregado los tiempos de respuesta son prcticamente inmediatos.
Un entorno ROLAP, como se aprecia en el dibujo anterior se basa directamente en esquemas en estrella
tpicos de bases de datos relacionales, esto significa que al realizar anlisis de crditos, matrcula o notas,
por cualquier atributo organizativo (universidad, campus, centro) sobre un atributo caracterstico del
alumno (sexo, edad, provincia) el sistema generar la sentencia SQL que de respuesta al informe solicitado:
Alum.
Crditos
Universidad
sexo
Hombre
Mujer
Cdiz
100
100
Sevilla
400
350
Pablo Olavide
50
65
Jan
90
98
Almera
100
110
Select Universidad,sexo,
sum(creditos)
Mlaga
320
295
From matriculas, alumno Where matricula.dni=alumno.dni
Granada
400
430
Crdoba
120
125
Huelva
100
105
group by Universidad, sexo
Univ
Campus
Asig.
centro
Tit. Matricula
CCAA
Como la consulta se calcula y ejecuta en tiempo real el dato NO est previamente agregado y el tiempo de
respuesta depender de la complejidad, volumen de datos y nmero de tablas involucradas en la
consulta.
Situacin diferente nos encontramos cuando la consulta solicitada aglutina datos de reas de
anlisis diferentes:
Universidad
sexo
Cdiz
Sevilla
Pablo Olavide
Hombre
Crditos
N
100
400
50
PDI
11
31
6
Mujer
Crditos
100
400
50
N PDI
10
35
7
Jan
Almera
Mlaga
Granada
Crdoba
Huelva
90
100
320
400
120
100
12
11
15
30
17
10
90
100
320
400
120
100
14
10
16
34
15
10
Tit.
Univ
Colec.
Campus
Matricula
Plazas
Create table TT2 as Select
Universidad, sexo,
sum(creditos) as creditos
CCAA
Asig.
centro
CCE
CONCLUSIONES
Bibliografa:
-
Laundon y Laundon
So Paulo: Saraiva.
-
gerao de informaes para tomada de deciso, VIII Congresso ABC, Porto Seguro,
Brasil.
-