Está en la página 1de 57

UNIVERSIDAD LOS ÁNGELES DE CHIMBOTE

FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERIA DE SISTEMAS

INTELIGENCIA DE NEGOCIOS

Modelo Fisico
Universidad Los Ángeles de Chimbote

Tabla de Contenido
• Modelo Físico
▫ Modelo dimensional  Modelo Físico
▫ Dimensionamiento de la BD
▫ Estrategia de indexación.
▫ Estrategia de particionamiento.
▫ Actualización de la metadata

• MOLAP, ROLAP, HOLAP

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Objetivos
Después de completar esta lección, comprenderá:
 Trasladar el modelo dimensional a un modelo
físico.
 Explicar varias técnicas de dimensionamiento.
 Describir las técnicas de indexación para data
warehousing.
 Discutir las estrategias de almacenamiento de
tablas e índices.
 Discutir las opciones de particionamiento.
 Actualizar el documento de meta data con la
información del modelo físico.
Facultad de Ingeniería – Escuela de Ingeniería de Sistemas
MODELO FÍSICO
Universidad Los Ángeles de Chimbote

El modelo físico
• El modelo físico reside en un (RDBMS), por lo que
es necesario asegurar:
▫ Que el almacenamiento de cada objeto (tablas) se soporte
de manera apropiada y contenga los índices necesarios.
▫ El desempeño de la base de datos.
▫ El particionamiento de la base de datos.
• Trasladar el modelo dimensional al modelo físico.
• Usar estándares de nombres, adicionar formato a
los atributos, medir el desempeño de la BD y
plantear las estrategias de indexación y
particionamiento.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Checklist del Modelo Físico


1. Trasladar el modelo dimensional a un modelo físico
▫ Aplicar estándares de nombramiento y BD.
▫ Identificar el formato y longitud de columnas.
▫ Etiquetar atributos como Not Null (*) o Null (o)
2. Desarrollar el dimensionamiento de la BD.
3. Definir la estrategia de indexación inicial.
4. Definir la estrategia de almacenamiento de
tablas/índices.
▫ Definir la estrategia de particionamiento.
5. Actualizar el documento de la meta data.

Dimensio- Almace-
MD  MF Indexación Meta data
namiento namiento

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


TRASLADAR EL MODELO
DIMENSIONAL AL MODELO
FÍSICO

Dimensio- Indexació Almace-


MD  MF Meta data
namiento n namiento
Universidad Los Ángeles de Chimbote

Estándares para nombres de objetos


• Mantener los nombre lógicos y físicos similares.
• Encontrar un balance entre nombres específicos y
vagos.
• Nombre de tablas y atributos en mayúscula.
• Utilizar subrayado para separar palabras.
• Utilizar el sufijo _ID para indicar llaves producción.
• Utilizar el sufijo _KEY para indicar llave primaria.
• Desarrollar una lista razonable de abreviaciones.
• Listar todos los nombres de los objetos y trabajar
con la comunidad de usuarios para definirlos.
• Resolver las disputas de nombres.
• Documentar estándares de nombres en un
documento.
Facultad de Ingeniería – Escuela de Ingeniería de Sistemas
Universidad Los Ángeles de Chimbote

Modelo Dimensional  Modelo Físico


• Listar las columnas de una tabla con las columnas claves
primarias al inicio.
Etiquetas:
• Las claves primarias con un PK y (* #)
• Las llaves únicas con un (#)
• Las columnas con restricciones NULL (o) o NOT NULL
(*).
• Las llaves foráneas con una FK y (* #) si es parte de la
llave primaria (PK).
• Identificar el formato y longitud de las columnas.
▫ d para decimales
▫ n para numéricos
▫ c para caracteres
▫ v para carácter variables
▫ date para fecha
Facultad de Ingeniería – Escuela de Ingeniería de Sistemas
Universidad Los Ángeles de Chimbote

Ejercicio 1
• Trasladar el modelo dimensional lógico a un
modelo dimensional físico.

• Aplicar los estándares propuestos.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Ejercicio 1 – Modelo dimensional lógico


Day Key (PK) Product Key (PK)
Day ID Product ID
Day Desc Product Desc
Weekend Category Key
Holiday Eve Category ID
Holiday Day Category Desc
Holiday Wknd Day Type Key
Month Key Type ID
Month ID Type Desc
Month Desc Rentals Fact Status
Year Key Age Classification
Year ID Day Key (FK)
Rental Period
Year Desc Customer Key (FK)
Sold Out rating
Time Band Product Key (FK)
Daily Rate
Store Key (FK)
Customer Key (PK)
Store Key (PK)
Customer ID Number of Rentals
Store ID
Customer Name Rental Amount
Store Desc
Status Rental Cost
Location
Geog. proximity Profit
Size
Activity level
Type
Type pref.
District Key
Movie category pref.
District ID
Movie age pref.
District Desc
Movie rate pref. Game
Region Key
category pref.
Region ID
Game age pref.
Region Desc
Game rate pref.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Ejercicio 1 - Modelo dimensional físico


# * DAY_KEY (PK) n # * PRODUCT_KEY (PK) n

* DAY_ID date * PRODUCT_ID v(11)


* DAY_DESC v(9) * PRODUCT_DESC v(125)
* WEEKEND v * CATEGORY_KEY n
* HOLIDAY_EVE v * CATEGORY_ID v(20)
* HOLIDAY_DAY v * CATEGORY_DESC v(25)
* HOLIDAY_WKND_DAY v * TYPE_KEY n
* MONTH_KEY n * TYPE_ID v(20)
* MONTH_ID n Rentals Fact * TYPE_DESC v(15)
* MONTH_DESC v(9) * STATUS v(15)
* YEAR_KEY n # * DAY KEY (FK) n * AGE n
* YEAR_ID n * CLASSIFICATION v(25)
# * CUSTOMER KEY (FK) n
* YEAR_DESC v(9) * RENTAL_PERIOD n
# * PRODUCT KEY (FK) n
* TIME_ BAND v(2) * SOLD_OUT_RATING v
# * STORE KEY (FK) n * DAILY_RATE n
# * CUSTOMER_KEY (PK) n
* RENTALS_NUMBER d
# CUSTOMER_ID v(25) * RENTAL_AMOUNT d # * STORE_KEY (PK) n
* CUSTOMER_NAME v(50) * RENTAL_COST d
* STATUS v * PROFIT d * STORE_ID v
* GEOG_PROXIMITY n * STORE_DESC v
* ACTIVITY_LEVEL v * LOCATION v(50)
* TYPE_PREF v(20) * SIZE n
* MOVIE_CAT_PREF v(20) * TYPE v(15)
* MOVIE_AGE_PREF v(20) * DISTRICT_KEY n
* MOVIE_RATE_PREF v(20) * DISTRICT_ID n
* GAME_CAT_PREF v(20) * DISTRICT_DESC v(50)
* GAME_AGE_PREF v(20) * REGION_KEY n
* GAME_RATE_PREF v(20) * REGION_ID n
* REGION_DESC v(50)

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


DIMENSIONAMIENTO DE LA BASE
DE DATOS

Dimensio- Almace-
MD  MF Indexación Meta data
namiento namiento
Universidad Los Ángeles de Chimbote

Dimensionar Base de Datos


• Calcular el tamaño físico de la base de datos.
• Espacio en disco para almacenar:
▫ Tablas, vistas, indices.
• El dimensionamiento es requerido para:
▫ La arquitectura del medio ambiente.
▫ Tareas de backup y recuperación.
▫ Técnicas de BD espejos
▫ Espacio temporal y técnicas de carga de datos.
• Dimensionamiento no es una ciencia, existen
varias técnicas

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Estimar el tamaño de la Base de Datos


• Estimar el tamaño de fila de la tabla hechos.
• Estimar el nro. filas de la tabla de hechos:
▫ Determinar la granularidad de cada dimensión.
▫ Estimar el número de entradas en el nivel mas
fino.
▫ Multiplicar el número de filas de c/dimensión.
• Tamaño BD = tamaño de fila * nro. filas.
• Estimar la reducción o incremento en el tamaño
según el grado de dispersión.
▫ Baja dispersiónrestar entre el 5% al 10%
▫ Media dispersión restar entre el 10% al 25%
▫ Alta dispersión restar entre el 25% al 50%
Facultad de Ingeniería – Escuela de Ingeniería de Sistemas
Universidad Los Ángeles de Chimbote

Estimar el tamaño de la Base de Datos


Tamaño Tamaño Nro de
BD
= ( de la fila
*
filas )- Dispersión

• Tamaño fila = Σ tamaño columnas.

• Nro de filas = estimación de transacciones por


año

• Dispersión = Es el % de dispersión de los datos.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Ejercicio 2
• Calcular el tamaño de la tabla de
hechos para el ejemplo propuesto.

• El horizonte es de 3 años, asuma # * DAY KEY (FK)


# * CUSTOMER KEY (FK)
n
n
# * PRODUCT KEY (FK) n
una dispersión del 10% (baja # * STORE KEY (FK) n

dispersión) *
*
RENTALS_NUMBER
RENTAL_AMOUNT
d
d
* RENTAL_COST d
* PROFIT d

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Ejercicio 2 – método 1
Descripción Fórmula Valor Comentario
Tamaño de una fila de la tabla hechos 16*4+4*4 80 asumido para este ejemplo

Estimar el número de entradas en el nivel mas bajo para cada dimensión


DAY KEY (FK) n 3*365 1095 3 años (48 meses)
CUSTOMER KEY (FK) n 65 65 clientes
PRODUCT KEY (FK) n 36 36 ítems
STORE KEY (FK) n 4 3 canales

Número de entradas 10,249,200

nro de entradas de cada dimensión X 10,249,200 * 80 819,936,000


tamaño fila tabla hechos
Dispersión 0.1*819,936,000 81,993,600 Si es baja se asumen 10%

Tamaño estimado BD 0.9*819,936,000 737,942,401 737.9 MB

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Ejercicio 2 – método 2
Descripción fórmula valor unidades
Ingresos totales de la empresa 2000 billones X año
Precio promedio venta por línea de ítem 50 $

Línea ítems por año 200 billones/$50 4 Billones


Registros en 3 años 4 billones×3 años 12 billones

Tamaño de registro 80 Bytes

Tamaño tabla hecho base 12 billiones* 80 bytes = 960,000,000,000


960 GB

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


ESTRATEGIA DE INDEXACIÓN
DE DATOS

Dimensio- Almace-
MD  MF Indexación Meta data
namiento namiento
Universidad Los Ángeles de Chimbote

Índices
• Los índices son objetos de la bases de datos,
cuya función es optimizar el acceso a datos.

• A medida que las tablas se van haciendo más


grandes y se desea hacer consultar sobre estas
tablas, los índices son indispensables.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Índices
• Internamente un índice normal es una estructura de árbol,
que cuenta con una página principal y luego esta con
paginas hijas, que a su vez tiene más paginas hijas hasta
llegar a la pagina final del índice (leaf level).

Hoja de páginas
• La clave del índice está repartida en las páginas del índice,
de modo tal que la búsqueda se haga leyendo la menor
cantidad posible de datos.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Tipos de Índices
• Índice no agrupado
▫ El orden físico de las filas es independiente del orden
indizado

CREATE NONCLUSTERED INDEX IX_SalesPerson_SalesQuota_SalesYTD


ON Sales.SalesPerson (SalesQuota, SalesYTD);

• Indice agrupado.
▫ El orden lógico de los valores de clave determina el orden físico de
las filas correspondientes de la tabla.
▫ El nivel inferior u hoja, de un índice agrupado contiene las filas de
datos en sí de la tabla.
▫ Una tabla o vista permite un índice agrupado al mismo tiempo.

CREATE INDEX IX_ProductVendor_VendorID ON


Purchasing.ProductVendor (VendorID, SalesQuota, ),;

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

índice no agrupado
• Almacena, por cada elemento del índice, un
"identificador" para encontrar en la tabla los datos
asociados a este. RID

• Cuando el DBMS utiliza el índice y determina que


debe ir a buscar los datos, utiliza ese
"identificador" para ubicar los datos en la tabla.
• En este caso el identificador utilizado es el RID
(row id)
• RID está conformado por:
▫ el numero del archivo de la base de datos
▫ el número de la página dentro de ese archivo.
▫ el número de la fila en la página.
Facultad de Ingeniería – Escuela de Ingeniería de Sistemas
Universidad Los Ángeles de Chimbote

Índice Agrupado
• El “identificador” utilizado es la llave del índice
agrupado.

• La llave del índice agrupado está conformado por:


▫ Todas las columnas del índice agrupado.

• No confundir la llave del índice con la llave


primaria de una tabla, aunque muchas veces
tienen el mismo "valor," en especial cuando la
tabla se creó sin darle mayor importancia a este
tema.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Búsqueda con índice


• También se denomina LookUp

• Realiza una operación de búsqueda, con un


"identificador" de una fila, para traer más
información, de la fila específica, desde la tabla.
▫ Índice agrupado. Utiliza el RID.
▫ Índice no agrupado. Utiliza la llave del índice agrupado.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Búsqueda con índices


Índice no agrupado.
• Se usa el RID.
• Se identifica las filas que
cumplen con la condición de
filtrado.
• Resultado: Celdas amarillas.

Índice agrupado.
• Se usan los tres identificadores
de filas (rojo, verde y azul).
• Se realiza la operación de
búsqueda en el índice agrupado.
• Se identifica las filas que
cumplan los tres
identificadores.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Índice agrupado vs no agrupado


• Índice non-clustered, la clave tiene un puntero a la
página de datos donde se encuentra el registro.
• Índice clustered, la leaf level es la pagina de datos.
(se ahorra un salto para leer los datos del registro)
• La diferencia es importante, ya que el uso de este
tipo de índices al evitar tener que hacer lecturas
adicionales para traer el registro.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Índice único
• Dos filas no pueden tener = valor de clave del índice.
• Las columnas utilizadas deben establecerse en NOT NULL
(dado los valores nulos se consideran duplicados)
• No se admite la creación de un índice único sobre columnas
que ya contengan valores duplicados, independientemente
de si se ha establecido o no IGNORE_DUP_KEY en ON.
CREATE UNIQUE INDEX AK_UnitMeasure_Name ON
Production.UnitMeasure(Name);

CREATE UNIQUE INDEX AK_Index ON Test (C2) WITH


(IGNORE_DUP_KEY = ON);

CREATE UNIQUE INDEX AK_Index ON Test (C2) WITH


(IGNORE_DUP_KEY = OFF);

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Estrategias
• Un DBMS optimiza una consulta usando dos
enfoques:

• Optimización basada en reglas


▫ rule-based optimization (RBO)
▫ Que consiste en usar índices siempre.

• Optimización basada en costos


▫ cost-based optimization (CBO)
▫ El cuál determina si usar un índice es apropiado

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Tipos de índices
 Índices B*-tree
 Usado para pequeño número de valores distintos en una
columna
 Índices Bitmap
 Usado con el enfoque CBO.
 Se crea un índice para cada clave foránea.
 Índices Particionados
 Se denomina índices localizados, colocándose el índice
en un partición determinada.
 Tablas organizadas por índice.
 En este tipo de índice la data esta sostenida en el índice,
cambios en los datos solo representa cambios en el
índice.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Estrategias de indexación
size = ‘SMALL’
’ 0 0 1 0 0 1 0 1 0 1 0 0 0 1 0 1
size = ‘MED’
’ 1 0 0 0 1 0 1 0 0 0 0 1 0 1 0 0
size = ‘LARGE’
’ 0 1 0 1 0 0 0 0 1 0 1 0 1 0 1 0

color = ‘BLUE’ 0 1 0 1 0 0 1 0 1 0 1 0 0 0 1 0
color = ‘RED’ 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 1
color = ‘GREEN’ 1 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0

Que columnas son?


Que tablas?
Que tipo de índice?

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Índice B*-tree
• Es usado para pocas filas
• Los datos se organizan como un árbol.
• A la derecha están los menores a la izquierda los
mayores
• La forma de llegar a un valor es fija.

• Si los datos son: H


• ADGHPRZ
D R

A G P Z

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Índice Bitmap
 Almacena valores con 1’s y 0’s

 Utilizado en lugar de índices B*-tree cuando:


 Tablas son muy grandes
 Columnas tienen una cardinalidad baja
 Múltiples columnas son restringidas en la misma
consulta.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Ejemplo índice Bitmap


CUSTOMER table
CUSTOMER# MARTIAL_STATUS REGION GENDER INCOME_LEVEL
101 single east male bracket_1
102 married central female bracket_4
103 married west female bracket_2
104 divorced west male bracket_4
105 single central female bracket_2
106 married central female bracket_3

CREATE BITMAP INDEX cust_region ON customer(region);

Ejemplo de índice bitmap en la columna REGION

REGION = ‘east’ REGION = ‘central’ REGION = ‘west’


1 0 0
0 1 0
0 0 1
0 0 1
0 1 0
0 1 0
Facultad de Ingeniería – Escuela de Ingeniería de Sistemas
Universidad Los Ángeles de Chimbote

Ejemplo índice Bitmap


SELECT COUNT(*)
FROM CUSTOMER
WHERE MARITAL_STATUS = ‘married’
AND REGION IN (‘central’, ‘west’);

status = region = region = Query


‘married’ ‘central’ ‘west’ Result
0 0 0 0 0 0
1 1 0 1 1 1
col 2
1 AND 0 OR 1 = 1 AND 1 = 1
0 0 1 0 1 0
col 3
0 1 0 0 1 0
1 1 0 1 1 1
col 5
Facultad de Ingeniería – Escuela de Ingeniería de Sistemas
ESTRATEGIA DE
ALMACENAMIENTO

Dimensio- Almace-
MD  MF Indexación Meta data
namiento namiento
Universidad Los Ángeles de Chimbote

Archivos de Datos
• Controlan la asignación de espacio en el disco.

• Asigna cuotas de espacio.

• Controla la disponibilidad de datos.

• Desarrolla el respaldo y recuperación parcial de la


Base de Datos.

• Asigna almacenamiento de datos a través de los


dispositivos

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Estructura Física de la Base de Datos


 Provee asignación automática de extensiones (extents).
 Evita asignación dinámica de extensiones (extents).

Segmento
148KB

Extent Extent
Base de Datos 36KB 112KB
tablespace tablespace
2KB 2KB 2KB
2KB 2KB 2KB
2KB 2KB 2KB
2KB 2KB 2KB
2KB 2KB 2KB

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Evitando la Fragmentación
• Recordar actividades de carga e indexación.
• Determinar la tasa de crecimiento de la BD para no
crecer constantemente.
• Mantener suficiente espacio en el DD
Extent
50 KB
CREATE TABLE
sales_fact ... Extent
SIZE = 50KB, 50 KB
FILEGROWTH = 25KB Extent
75 KB

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Consideraciones de Archivos de Datos


• Crear un archivo de datos con las características del objeto
que el va ha mantener.
• Localizar objetos grandes dentro de un archivo de datos .
• Localizar objetos con propiedades y patrones de acceso
similares juntos.
• Se puede cambiar los datos de un archivo de datos :
▫ Incrementando el numero de archivos de datos.
▫ Creando archivos de datos que puedan crecer dinámicamente
Tablespace Tablespace Tablespace
SALES SALES SALES

Tablespace Tablespace
SALES_1 SALES_2

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


ESTRATEGIA DE
PARTICIONAMIENTO

Dimensio- Almace-
MD  MF Indexación Meta data
namiento namiento
Universidad Los Ángeles de Chimbote

Particionamiento de índices y tablas


• Tablas grandes e índices pueden ser particionados
en piezas mas pequeñas y manejables.

Tablespace
Segment
Extent
Blocks

Estructura

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Ventajas del Particionamiento


Particionamiento puede ser útil en las siguientes
áreas:
 Grandes Base de Datos (VLDBs)
 Reducción de tiempo de baja para mantenimiento
programado.
 Reducción de tiempo de baja por fallas de datos.
 Performance en Sistemas de Soporte a las
Decisiones (DSS).
 Performance de I/O
 Disk striping.
 Particionamiento transparente.

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Particionamiento Horizontal
 Particionamiento de datos de tablas e índices por:
 Tiempo
 Ventas
 Geografía January 1996
 Organización February 1996
March 1996
 Línea del negocio April 1996
May 1996
June 1996
 Partición por tiempo

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Particionamiento Vertical
 Partición de datos por columna (raro)
 Permite acceso a cierto grupo de usuarios.

Col A Col B Col C Col D

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Particiones
• El ejemplo siguiente crea un índice no agrupado
con particiones en TransactionsPS1, un esquema
de partición existente.

• Este ejemplo asume que se ha instalado el ejemplo


de índice con particiones.

CREATE NONCLUSTERED
INDEX IX_TransactionHistory_ReferenceOrderID
ON Production.TransactionHistory (ReferenceOrderID)
ON TransactionsPS1 (TransactionDate);

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


ACTUALIZACIÓN DE LA META
DATA

Dimensio- Almace-
MD  MF Indexación Meta data
namiento namiento
Universidad Los Ángeles de Chimbote

Actualizando el documento de Metadata


Información del modelo Físico

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

Actualizando el documento de Metadata


Información del plan de indexación

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


ROLAP, MOLAP, HOLAP
Universidad Los Ángeles de Chimbote

Esquema Físico
• Existe tres formas de almacenar los datos:
AGREGACIONES
Y DATOS

Vista de
Base de Datos Usuario
Relacional
Base de Datos
Multidimensional

. MOLAP - Multidimensional OLAP.


AGREGACIONES DATOS AGREGACIONES
Y DATOS

Vista de
Base de Datos Usuario
Vista de Relacional Base de Datos
Base de Datos Usuario Multidimensional
Relacional Base de Datos
Multidimensional

ROLAP - Relacional OLAP. HOLAP - OLAP híbrido

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

MOLAP - OLAP Multidimensional


• Los datos origen y sus agregaciones están en una
estructura multidimensional.
• Los objetos dimensionales son procesados para incorporar
cambios de los datos operacionales, el resumen de datos se
hace por adelantado.
• Existe latencia. tiempo comprendido entre procesamientos
• Características:
▫ Provee excelente rendimiento y compresión de datos.
▫ Mejor tiempo de respuesta, depende de las las agregaciones.
▫ Estructura optimizada para maximizar las consultas.
▫ Apropiado para cubos de rápida respuesta.

AGREGACIONES
Y DATOS

Vista de
Base de Datos Usuario
Relacional
Base de Datos
Multidimensional

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

ROLAP - OLAP Relacional


• La información del cubo, sus datos, su agregación, sumas
son almacenados en una base de datos relacional.
• No copia la BD original, accede a las tablas origen.
• Es más lenta que las otras estrategias (MOLAP o HOLAP).
• Se utiliza para ahorrar espacio de almacenamiento en
grandes DB de baja frecuencia de consulta.
• Usos comunes:
▫ Cuando los clientes desean ver los cambios
inmediatamente.
▫ Cuando contamos con grandes conjuntos de datos que
no son frecuentemente buscados
AGREGACIONES
Y DATOS

Vista de
Base de Datos Usuario
Relacional Base de Datos
Multidimensional

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Universidad Los Ángeles de Chimbote

HOLAP – OLAP Híbrido


• Combina atributos de MOLAP y ROLAP.
• Las agregaciones se almacenen en una estructura
multidimensional y los detalle, en la BD original.
• Cubos más pequeños q’ MOLAP y más rápidos q’
ROLAP.
• Usos comunes:
▫ Cubos que requieren rápida respuesta
▫ Cuando existen sumarizaciones basadas en una gran cantidad de datos de
origen.
▫ Solución de compromiso para bajar el espacio ocupado sin perjudicar
totalmente el rendimiento de las consultas.
DATOS AGREGACIONES

Vista de
Base de Datos Usuario
Relacional Base de Datos
Multidimensional

Facultad de Ingeniería – Escuela de Ingeniería de Sistemas


Características
MOLAP ROLAP HOLAP
Almacenamiento de Modelo Base de datos
las Agregaciones
Modelo Multidimensional
Multidimensional relacional
Almacenamiento de Modelo Base de datos
los datos
Base de datos relacional
Multidimensional relacional
Facilidad de
Creación
Sencillo Muy Sencillo Sencillo
Buena para consultas
Velocidad de que posean
respuesta
Buena Regular o Baja
agregaciones, Regular
para datos de bajo nivel
Problemas de
Escalabilidad Son más escalables
escalabilidad
Datos que no son
Recomendados Cubos con uso Si el cubo requiere una
Para
frecuentemente
frecuente rápida respuesta
usados
Ventajas y Desventajas
Ventajas Desventajas
Duplica el almacenamiento
Mejor performance en los
MOLAP tiempos de respuesta
de datos (ocupa más
espacio)

Tiempo de Latencia

Ahorra espacio de
almacenamiento.
El tiempo de respuesta a
ROLAP Útil cuando se trabaja con
consultas es mayor.
muy grandes conjuntos de
datos.

Buen tiempo de respuesta Volúmenes de datos más


HOLAP sólo para información grandes en la base de
sumarizada datos relacional

También podría gustarte