Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presenta a los usuarios una visin multidimensional de los datos (matricial) para
cada tema de inters del negocio.
de
otras
herramientas
que
requieran
Al contar con muestras grandes, se pueden explorar mejor los datos en busca
de respuestas.
H-OLAP.
Es una combinacin de R-OLAP y M-OLAP, que son otras posibles implementaciones de
OLAP. HOLAP permite almacenar una parte de los datos como en un sistema M-OLAP
y el resto como en uno R-OLAP. El grado de control que le operador de la aplicacin
tienen sobre este particionamiento varia de unos productos a otros.
Reportes y Consultas.
OLAP.
Dashboards.
Data Mining.
EIS.
A travs de una interfaz grfica y una serie de pasos, los usuarios generan consultas
que son enviadas desde la herramienta de consulta anlisis al Query Manager, este a
su vez realiza la extraccin de informacin al DW Manager y devuelve los resultados
obtenidos a la herramienta que se los solicito. Luego, estos resultados son expuestos
ante los usuarios en formatos que le son familiares.
Este proceso se puede comprender al observar la siguiente figura:
1. Los usuarios seleccionan o establecen que datos desean obtener del DW,
mediante las interfaces de la herramienta que utilice.
2. La herramienta recibe el pedido de los usuarios, construye la consulta
(utilizando la metadata) y la enva al Query Manager.
3. El Query Manager ejecuta la consulta sobre la estructura de datos con la que
se est trabajando (cubo multidimensional, Business Model, etc.).
4. El Query Manager obtiene los resultados de la consulta.
5. El Query Manager enva los datos a la herramienta de consulta y anlisis.
6. La herramienta presentan a los usuarios la informacin requerida.
Las herramientas de consulta y anlisis son sistemas que permiten a los usuarios
realizar la exploracin de datos del DW. Bsicamente constituyen el nexo entre el
depsito de datos y los usuarios.
Utilizan la metadata de las estructuras de datos que han sido creadas previamente
(cubos multidimensionales, Business Models, etc.) para trasladar a travs de consultas
SQL los requerimientos de los usuarios, para luego, devolver el resultado obtenido.
Estas herramientas tambin pueden emplear simples conexiones a bases de datos
(JNDI, JDBC, ODBC), para obtener la informacin deseada.
A travs de una interfaz grfica y una serie de pasos, los usuarios generan consultas
que son enviadas desde la herramienta de consulta y anlisis al Query Manager, este a
su vez realiza la extraccin de informacin al DW Manager y devuelve los resultados
obtenidos a la herramienta que se los solicit. Luego, estos resultados son expuestos
ante los usuarios en formatos que le son familiares.
Una de las principales ventajas de utiizar estas herramientas, es que los usuarios no
tienen que preocuparse por conocer cules son las caractersticas y funcionalidades
de las estructuras de datos utilizadas, ni por saber emplear el lenguaje SQL, solo se
deben enfocar en el anlisis.
Las herramientas de consulta y anlisis, en general, comparten las siguientes
caractersticas:
Reportes y Consultas
Se han desarrollado muchas herramientas para la produccin de consultas y reportes,
que ofrecen a los usuarios, a travs de pantallas grficas intuitivas, la posibilidad de
generar informes avanzados y detallados del tema de inters de inters que se est
analizando. Los usuarios solo deben seguir una serie de simples pasos, como por
ejemplo seleccionar opciones de un men, presionar tal o cual botn para especificar
los elementos de datos, sus condiciones, criterios de agrupacin y dems atributos que
se consideren significativos.
Actualmente las herramientas de generacin de reportes y consultas cuentan con
muchas prestaciones, las cuales permiten dar variadas formas y formatos a la
presentacin de la informacin. Entre las opciones ms comunes se encuentran las
siguientes:
Inclusin de imgenes.
Formatos tipogrficos.
Esta consulta regresara todas las instancias de la BD donde el valor del atributo
"precio "sea mayor que 1000. Como este ejemplo ilustra, la consulta en su concepcin
ms simple sirve como un filtro que permite al usuario seleccionar instancias desde una
tabla basada en ciertos valores de los atributos. No importa que tan grande o pequea
sea la tabla de la BD, una consulta regresara como resultado todas las instancias que
cumplen con la condicin que se le haya indicado. Suponiendo entonces que sea una
tabla muy grande, digamos con miles de productos, entonces la respuesta puede
sobrepasar las capacidades de anlisis que como usuarios se puede tener.
A partir de estas dificultades es que surge el concepto de minera de datos y la
diferencia con una base de datos. Al consultar una BD simplemente se obtienen los
valores que cumplen ciertas condiciones, en cambio la minera de datos busca construir
modelos de datos. Estos modelos pueden ser vistos como resmenes de alto nivel de
las capas de informacin obtenida en un nivel ms bajo y en la mayora de los casos son
ms tiles que los datos crudos, ya que en la orientarse al negocio se ha buscado que
sean datos comprensibles y procesables. Dependiendo de las preguntas de inters, los
modelos de minera de datos pueden tomar diferentes formas. Esto incluye desde
rboles y reglas de decisin para tareas de clasificacin, asociacin de reglas, as
como agrupamientos de mercado entre otros modelos posibles.
Siguiendo con el ejemplo de la consulta SQL, un algoritmo de minera de datos que
construye reglas de decisin debe regresar el siguiente conjunto de reglas para
productos que tienen un precio de ms de mil pesos:
IF Departamento = Perfumera AND Proveedor = Perfumera Francesa THEN Precio >
1000
o
IF Proveedor = Chocolates Belgas
Esta informacin como se observa ya es de otro estilo a diferencia de los datos
crudos. En este caso es un resumen de los datos obtenidos. Nos dice que cuando el
departamento es Perfumera, los productos comprados a "Perfumera Francesa
siempre tienen un precio mayor de 1000. Por otro lado, nos podemos dar cuenta que
los chocolates que son ofrecidos por Chocolates Belgas siempre son de un costo
mayor a mil pesos. Esta pequea pero sutil diferencia nos puede indicar varias cosas,
en primero puede que Perfumera Francesa ofrezca artculos de bao y entonces
cuando estn en ese departamento sus precios no superan los mil pesos. En cambio
Chocolates Belgas puede ser que slo ofrezca en un departamento o que ofrezca en
varios y que siempre sean sus precios mayores a mil pesos.
Es importante destacar que las reglas siempre tienen un fin y presentan una
informacin relevante al negocio, por ejemplo, puede ser que tengan una noche de
promocin y los precios de perfumera deban reducirse a menos de mil pesos. Por lo
tanto deben comunicarse con "Perfumera Francesa" para negociar. O tal vez decidan
eliminar del inventario los productos de Chocolates Belgas" por su alto costo. Es decir
todas estas reglas tienen aplicacin de una u otra forma.
Es aqu entonces donde se puede observar la principal diferencia entra las BD y sus
consultas a una minera de datos. Que la minera de datos no regresa datos crudos,
ms bien obtiene modelos de los datos que se trabajan. Estos modelos son benficos
porque en general son entendibles y pueden generar acciones concretas.
Sistemas OLAP.
Los sistemas OLAP son una propuesta para la toma de decisiones, la cual ayuda a
extraer conocimiento de un almacn de datos, o ms especficamente de un mercado
de datos. Su principal idea es proveer navegacin a travs de los datos a los usuarios
inexpertos, para que sean capaces de generar interactivamente consultas que no
estuvieran previamente definidas o ad hoc sin la intervencin de algn tipo de
profesional. El nombre se contrapone a los sistemas OLTP ya que refleja
requerimientos y caractersticas totalmente diferentes. Ambos son parte del rea de
BI.
El anlisis de datos fue un uso para las computadoras que fue inmediatamente
resaltado por parte de las empresas. Sin embargo las herramientas de anlisis
requeran directamente el uso por parte de algn especialista en el rea de las
tecnologas de la informacin que ayudara a hacer consultas a los datos, en especfico
las de tipo ad-hoc, adems de que el software y hardware era caro y prohibitivo para
empresas pequeas. Es as como surge el concepto de OLAP. En 1993 Codd, define el
trmino aunque se vena trabajando con este desde tiempo antes, buscando sistemas
que fueran lo suficientemente rpidas para soportar consultas interactivas, que
ayudaran a las tareas de anlisis al proveer flexibilidad en el uso de herramientas
estadsticas, que ofrecieran seguridad, que permitieran vistas multidimensionales y
que finalmente manejaran grandes volmenes de datos y metadatos.
Como se dijo los sistemas OLAP se contraponen a los sistemas OLTP en sus
requerimientos. En la figura 3.1 se muestran algunas diferencias sobresalientes. En
primer lugar, su uso es diferente. Mientras que los sistemas OLTP son creados para
solucionar problemas concretos y son usados en el trabajo diario de las compaas, los
sistemas OLAP son usados en la toma de decisiones. Es fcil notar entonces que la
carga de trabajo est claramente definida para los sistemas OLTP, mientras que por
otro lado los sistemas de toma de decisiones resuelven nuevos problemas cada da. Es
ms los sistemas OLAP son considerados de slo lectura porque la toma de decisiones
no afecta directamente a los datos, mientras que los OLTP s llegan a modificar estos.
Sobre el tipo de consultas que ejecutan cada uno, se tiene que los sistemas OLAP son
mucho ms complejas y manejan un gran nmero de datos, requiriendo operaciones de
tipo join entre algunas tablas, junto a algunas agrupaciones de datos y funciones de
clculo; los sistemas OLTP en cambio no trabajan grandes volmenes de datos al
menos no de la magnitud de OLAP, ni tantas tablas, agrupaciones y clculos. El nmero
de registros en operaciones OLTP puede ser estimado en decenas o miles a lo mucho,
mientras que las consultas OLAP requieren de miles o de millones de registros.
Finalmente, el nmero de usuarios es tambin diferente en ambos tipos de sistemas.
Los sistemas OLTP pueden tener miles o millones de usuario pensemos en algn
sistema de compras en lnea, mientras que los sistemas OLAP tiene decenas o miles
tal vez de usuarios.
Despus de este completo anlisis es posible identificar que OLAP es un cambio en las
definiciones de los datos de BD relacionales de una manera que se permite el precmputo de ciertas consultas. OLAP en s es una manera de mirar estos resultados de
consultas pre-agregadas en tiempo real. Sin embargo, por s mismo OLAP no es ms
que una forma de evaluar consultas que es diferente a construir modelos de datos
como en la minera de datos. As, no es posible considerar por s mismo a los sistemas
OLAP como minera de datos.
Consultas OLAP.
SELECT
nation;
o_year;
sum(amount) as sum_profit
FROM
(
SELECT
n_name as nation,
extract(year from o_orderdate) as o_year,
l_extendedprice * (1-1_discount) ps_supplycost * l_quality as amount
FROM
part,
supplier,
lineitem,
partsupp,
orders,
nation
WHERE
s_suppkey = l_suppkey
and ps_suppkey = l_suppkey
and ps_partkey = l_partkey
and p_partkey = l_partkey
and o_orderkey = l_orderkey
and s_nationkey = n_nationkey
and p_name like %:1 %
) AS profit
GROUP BY
nation,
o_year
ORDER BY
nation,
o_year desc;
En esta consulta, se ve que seis relaciones de la BD se ven involucradas al estar
presentes en la parte FROM de la consulta interiory que las condiciones presentes
en la parte WHERE, todas son sobre la tabla fact, que en este caso es la tabla
"lineitem".
La tabla fact en las consultas OLAP es la ms presente, ya sea siendo el centro de las
consultas estrella o estando en consultas donde es la nica tabla accesada. Todo esto
debido a que concentra la mayora de los datos.