Está en la página 1de 19

Área Tecnologías de

Información y
Ciberseguridad

INTELIGENCIA DE NEGOCIOS
P2022

N9 - Sistemas OLAP

Juan Pablo Yañez Riquelme.


Ingeniero en Informática
Licenciado en Ciencias de la Información
Técnico de Nivel Superior Analista Programador
Universidad Tecnológica de Chile – Inacap
La Serena

Contacto: juan.yanez34@inacapmail.cl
RECORDEMOS…DATA MARTS - TIPOS
• Data mart OLAP
– Se basan en los populares cubos OLAP, que se construyen agregando, según los requisitos de cada área o departamento, las
dimensiones y los indicadores necesarios de cada cubo relacional.

• Data mart OLTP


– Pueden basarse en un simple extracto del data warehouse, no obstante, lo común es introducir mejoras en su rendimiento (las
agregaciones y los filtrados suelen ser las operaciones más usuales)aprovechando las características particulares de cada área de la
empresa.
SISTEMAS OLAP
• En 1970 , Edgar Frank Codd construye la primera RDB.

• En 1979, Oracle toma el mercado lanzando la primera RDB comercial (Oracle V2).

• A finales de los 90, el mercado se encuentra completamente dominado por Oracle y las RDB.

• En la actualidad es imposible pensar un negocio sin considerar la inclusión de una RDB a sus
operaciones.

• En 1989, Howard Dresner, acuña el termino “Inteligencia de Negocios” (BI), definiéndolo


como:

– “Los conceptos y métodos para mejorar la toma de decisiones empresariales mediante el uso de sistemas basados
en hechos de apoyo”.

• A la vez que se volvían populares las RDB en los 90’s, estas al poco tiempo,
demostraron claros problemas de rendimiento frente a las exigencias proveniente de
la recién estrenada BI como disciplina.
SISTEMAS OLAP (Continuación)
• El principal problema de la RDB como herramienta de BI, se basa en su poco idoneidad para realizar
cálculos de totales en grandes volúmenes en tiempo real.

• Esto provoca que la generación de reportes históricos de larga data resultan lentos y no faltos de errores.

• Aun con el avance en potencia del hardware moderno, este problema aun persiste.

• Los sistemas OLAP (Online Analytical Processing), fueron y han sido la solución a este problema.
SISTEMAS OLAP (Continuación)
• La idea principal de un sistema OLAP, es pre-calcular todos los totales necesarios para el reporte.

• Esto se realiza en periodos en que el sistema tiene menos carga, como un fin de semana, un
festivo, etc…

• Esta tarea se realiza, en una base de datos especial, denominada “Cubo OLAP” ,“Cubo
Multidimensional” o “Hipercubo”.

• Un cubo OLAP es una instantánea de los datos almacenados en una o mas RDB, almacenados
como totales.
CUBO OLAP
• En el Cubo OLAP, conviven tres caras (ancho, alto y largo), dos consideradas
dimensiones y la tercera enfocada a representar eso que se intenta medir (medida).

c ho
An
Alto
CUBO OLAP – DIMENSIÓN CATEGORÍA

• La dimensión que hace referencia al ancho usualmente se utiliza


para definir los totales asociados a las categorías o atributos
provenientes de los datos contenidos en la RDB.
CUBO OLAP – DIMENSIÓN TIEMPO

• La dimensión que hace referencia al alto se utiliza para definir los


totales asociados al tiempo (meses, días, años) provenientes de los
datos contenidos en la RDB.
CUBO OLAP – MEDIDAS/FACTS

• Las medidas o hechos (facts) hacen referencia al largo y se utiliza


para definir lo que se desea medir (en stock, ordenes, total de
ventas) provenientes de los datos contenidos en la RDB.
CUBO OLAP – MEDIDAS VS HECHOS (FACT)
• Usualmente el termino medida y hecho son utilizados para hacer referencia al
mismo elemento, aun que existen diferencias entre ellos:

• Un hecho o fact esta compuesto por la “key dimension (dimensión clave)” y la


medida.

– Una key dimension, se crea de los componentes de la dimensión que permite la obtención del
valor total almacenado en el Cubo OLAP y la medida que representa el valor que toma.

– Ejemplo: en un data warehouse que almacena las transacciones de ventas, el hecho debe tener
dimensiones claves provenientes de cliente, vendedor, producto, tiempo y lugar de la
transacción. Mientras que su medida será el numero de productos vendidos y el monto del dinero
pagado en cada venta.

• En otras palabras un hecho es eso que el negocio a demarcado como relevante de


analizar, será lo que el cubo OLAP, se encargara de calcular y presentar para ser
explotado como parte del proceso BI del negocio.
CUBO OLAP - JERARQUÍAS
• Una jerarquía, hace referencia a la agrupación de elementos pertenecientes a la
misma dimensión y que permite el “Drill down” (minado) de datos.

• En una jerarquía convive un padre y uno o muchos hijos.


CUBO OLAP – QUERY MDX (MULTI-DIMENTIONAL
EXPRESSION)
• La información observable en la OLAP Pivot Table en MS Exel,
se obtiene desde el cubo gracias a la MDX.
OLAP, ROLAP, MOLAP
• El Cubo OLAP es la base para un sistema de BI, el destino de sus datos puede determinar el tipo de
cubo con el cual estamos tratando:

• ROLAP: Implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos
son detallados, evitando las agregaciones y las tablas se encuentran desnormalizadas. Los esquemas más
comunes sobre los que se trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier
base de datos relacional. La arquitectura está compuesta por un servidor de banco de datos relacional y
el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que
permite el análisis de una enorme cantidad de datos.

• MOLAP: Esta implementación OLAP almacena los datos en una base de datos multidimensional. Para
optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por
adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeño de
este sistema. Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de
almacenamiento en disco debido a los valores precalculados.

• OTROS:
– WOLAP o Web OLAP: OLAP basado u orientado para la web.
– DOLAP o Desktop OLAP: OLAP de escritorio
– RTOLAP o Real Time OLAP: OLAP en tiempo real
– SOLAP o Spatial OLAP: OLAP espacial
MODELO DE DATOS OLAP

• Al igual que las base de datos transaccionales, un Cubo OLAP,


debe ser modelado en torno a la necesidad que intenta solventar.

• Entre los marcos de diseño mas expandidos y conocidos se


reconocen dos, Estrella, Copo de Nieve
MODELO DE DATOS OLAP (CONTINUACIÓN)
• Estrella (STAR): El modelo estrella es el más sencillo en estructura. Consta de una tabla central de "Hechos" y varias
"dimensiones", incluida una dimensión de "Tiempo". Lo característico de la arquitectura de estrella es que sólo existe
una tabla de dimensiones para cada dimensión. Esto quiere decir que la única tabla que tiene relación con otra es la de
hechos, lo que significa que toda la información relacionada con una dimensión debe estar en una sola tabla.
MODELO DE DATOS OLAP (CONTINUACIÓN)
• COPO DE NIEVE (SNOWFLAKE): El modelo copo de nieve es una variación o derivación del modelo estrella. En
este modelo la tabla de hechos deja de ser la única relacionada con otras tablas ya que existen otras tablas que se
relacionan con las dimensiones y que no tienen relación directa con la tabla de hechos. El modelo fue concebido para
facilitar el mantenimiento de las dimensiones, sin embargo esto hace que se vinculen más tablas a las secuencias SQL,
haciendo la extracción de datos más difícil así como vuelve compleja la tarea de mantener el modelo.
MODELO DE DATOS OLAP (CONTINUACIÓN)
• Ambas aproximaciones son utiles, pero la utilización de uno y otro dependerá del nivel de
granularidad requerida por el negocio.

• La granularidad hace referencia al nivel de detalle en la información que se almacena y procesa.

• Snowflake presenta un nivel de granularidad mayor en comparación al modelo estrella, pero la


dificultad que representa su modelado e implementación eleva importantemente los riesgos del
sistema.

• Otros modelos reconocidos pero menos utilizados son:

– Galaxia (Galaxy): dos o mas modelos estrellas que comparten tablas dimension.

– Conglomerado de estrellas (Star Cluster): se basa en el modelo estrella pero las jerarquías
son definidas como tablas para reducir la redundancia.
MODELO DE DATOS OLAP (CONTINUACIÓN)

• Galaxia (Galaxy): dos o


mas modelos estrellas que
comparten tablas
dimension.

• Conglomerado de
estrellas (Star Cluster): se
basa en el modelo estrella
pero las jerarquías son
definidas como tablas
para reducir la
redundancia.
BIBLIOGRAFÍA
• Material visual de apoyo:

– Exelcentral.com, “Excel Tutorial: What is Business Intelligence and an OLAP Cube?”, 2015. consultado y disponible en:
https://www.youtube.com/watch?v=yoE6bgJv08E&t=428s

– softwaretestinghelp.com, “Schema Types In Data Warehouse Modeling – Star & SnowFlake Schema”, 2 de Agosto de 2020. consultado y disponible en:
https://www.softwaretestinghelp.com/data-warehouse-modeling-star-schema-snowflake-schema/

– Guru99.com, “Star and SnowFlake Schema in Data Warehouse”. Consultado y disponible en:
https://www.guru99.com/star-snowflake-data-warehousing.html#:~:text=SNOWFLAKE%20SCHEMA%20is%20a%20logical,splits%20data%20into%20additional%20tables .

También podría gustarte