Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Data Warehouse y OLAP: Marta Zorrilla Universidad de Cantabria
Data Warehouse y OLAP: Marta Zorrilla Universidad de Cantabria
Marta Zorrilla
Universidad de Cantabria
2007/08
Tabla de contenido
Procesos ETL
Cubos OLAP
2007/08
2007/08
Herramientas de anlisis
y consulta
Fuentes de datos
internas
Datos detalle
Contabilidad
..
.
Solucin
Web
BD Relacional (OLTP)
Compras
ETL
ETL
Solucin
aplicativa
Staging
Area
RR/HH
ROLAP / HOLAP
agregados
Data mining
Web log,..
Hipercubos
dedatos
Hipercubos
dedatos
MOLAP
Hipercubos
dedatos
EIS
Fuentes de datos
externas
INE, INEM,
Hipercubos
de datos
Hipercubos
de datos
2007/08
2007/08
Planificacin
Planificacin
proyecto
proyecto
Definicin
Definicin
de
de
Requisitos
Requisitos
del
del
negocio
negocio
Diseo
Diseo
Arquitectura
Arquitectura
Seleccin
Seleccin
Productos
Productos ee
Instalacin
Instalacin
Modelo
Modelo
dimensional
dimensional
Diseo
Diseo
fsico
fsico
Diseo
Diseo
procesos
procesos ETL
ETL
Integracin
Mantenimiento
Integracin yy Mantenimiento
yy crecimiento
despliegue
crecimiento
despliegue
Desarrollo
Desarrollo
Aplicacin
Aplicacin
Usuario
Usuario
Especificacin
Especificacin
Aplicacin
Aplicacin
Usuario
Usuario
Gestin
Gestin del
del proyecto
proyecto
Marta Zorrilla - Universidad de Cantabria
2007/08
Planificacin
Planificacin
proyecto
proyecto
Definicin
Definicin
de
de
Requisitos
Requisitos
del
del
negocio
negocio
Diseo
Diseo
Arquitectura
Arquitectura
Seleccin
Seleccin
Productos
Productos ee
Instalacin
Instalacin
Modelo
Modelo
dimensional
dimensional
Diseo
Diseo
fsico
fsico
Especificacin
Especificacin
Aplicacin
Aplicacin
Usuario
Usuario
Diseo
Diseo
procesos
procesos ETL
ETL
Desarrollo
Desarrollo
Mantenimiento
Mantenimiento
yy crecimiento
crecimiento
Desarrollo
Desarrollo
Aplicacin
Aplicacin
Usuario
Usuario
Gestin
Gestin del
del proyecto
proyecto
A tener en cuenta:
Hacer partcipes a usuarios operacionales, tcnicos IT y analistas.
2007/08
Definicin de requisitos
Planificacin
Planificacin
proyecto
proyecto
Definicin
Definicin
de
de
Requisitos
Requisitos
del
del
negocio
negocio
Diseo
Diseo
Arquitectura
Arquitectura
Seleccin
Seleccin
Productos
Productos ee
Instalacin
Instalacin
Modelo
Modelo
dimensional
dimensional
Diseo
Diseo
fsico
fsico
Especificacin
Especificacin
Aplicacin
Aplicacin
Usuario
Usuario
Diseo
Diseo
procesos
procesos ETL
ETL
Desarrollo
Desarrollo
Mantenimiento
Mantenimiento
yy crecimiento
crecimiento
Desarrollo
Desarrollo
Aplicacin
Aplicacin
Usuario
Usuario
Gestin
Gestin del
del proyecto
proyecto
Determinar indicadores
2007/08
Planificacin
Planificacin
proyecto
proyecto
Definicin
Definicin
de
de
Requisitos
Requisitos
del
del
negocio
negocio
Diseo
Diseo
Arquitectura
Arquitectura
Seleccin
Seleccin
Productos
Productos ee
Instalacin
Instalacin
Modelo
Modelo
dimensional
dimensional
Diseo
Diseo
fsico
fsico
Especificacin
Especificacin
Aplicacin
Aplicacin
Usuario
Usuario
Diseo
Diseo
procesos
procesos ETL
ETL
Desarrollo
Desarrollo
Mantenimiento
Mantenimiento
yy crecimiento
crecimiento
Desarrollo
Desarrollo
Aplicacin
Aplicacin
Usuario
Usuario
Gestin
Gestin del
del proyecto
proyecto
Source: Gartner
(December 2005)
SGBD Relacional:
SQL Server, Oracle, Informix, DB2,
2007/08
Herramientas
Data Mining
USUARIO
Fuente de datos
Extraccin
Gestores de
consultas
Gestor de
bases de datos
Estrellas
Relacional
Directas
Directas
Consultas
Transformacin
Carga
Repositorio
Herramienta
ETL
Mu
Agregados
(hipercubos)
Agregados
(hipercubos)
Marta Zorrilla - Universidad de Cantabria
l
na
o
i
ens
m
i
ltid
ROLA
P
HOLAP
2007/08
OLAP
OLAP
AP
MOL
HOLAP
Agregados
(hipercubos)
Agregados
(hipercubos)
10
Evaluacin de herramientas
Pentaho project: reporting, analysis, dashboard, data mining and workflow (firebird
RDBMS, Weka DM, Mondrian OLAP, Enhydra ETL, JaWE workflow, BIRT reporting components)
2007/08
11
Ventajas:
Problemas:
2007/08
12
Marta Zorrilla
Universidad de Cantabria
2007/08
Tabla de contenido
2007/08
14
Nombre
Direccion
Codigo_empresa
A-234
Luis Aja
Alta, 5 Stder.
E-54
A-741
Ana Ros
Pez, 21 Madrid
E-33
A-562
Jos Maza
Ercilla, 3 Bilbao
E-54
Nombre
Direccion
Luis Aja
Alta, 5 Stder.
Jos Maza
2007/08
Ercilla, 3 Bilbao
15
Criterio de diseo:
No repetir datos
innecesariamente
(Normalizacin)
Clientes
Codigo_cliente
Nombre
Direccion
Codigo_empresa
A-234
Luis Aja
Alta, 5 Stder.
E-54
A-741
Ana Ros
Pez, 21 Madrid
E-33
A-562
Jos Maza
Ercilla, 3 Bilbao
E-54
Facturas
Unas tablas se refieren a otras
mediante vnculos de tipo
jerrquico.
Este vnculo de referencia
entre dos tablas se establece
mediante columnas con idntico
tipo de dato.
Marta Zorrilla - Universidad de Cantabria
Codigo_cliente
Fecha
Tipo_IVA
Numero_factura
A-741
22-6-2004
16
3421
A-562
22-6-2004
16
3422
A-741
24-6-2004
16
3423
16
Facturas
Facturas
Numero_factura
Numero_factura
Codigo_cliente
Codigo_cliente
Fecha
Fecha
Tipo_IVA
Tipo_IVA
Lineas_factura
Lineas_factura
Numero_factura
Numero_factura
Numero_linea
Numero_linea
Codigo_articulo
Codigo_articulo
Unidades
Unidades
Precio_unitario
Precio_unitario
Coste_unitario
Coste_unitario
Articulos
Articulos
Codigo_articulo
Codigo_articulo
Cod_tipo_artic
Cod_tipo_artic
Descripcion
Descripcion
Ult_coste_unitario
Ult_coste_unitario
Empresas
Empresas
Codigo_empresa
Codigo_empresa
Nombre_empresa
Nombre_empresa
Pais
Pais
Direccion_central
Direccion_central
Paises
Paises
Pais
Pais
Tipos_articulos
Tipos_articulos
Cod_tipo_artic
Cod_tipo_artic
Descripcion_tipo
Descripcion_tipo
2007/08
17
Beneficio de ventas en el ao
2004 a empresas francesas
segn tipos de artculos?
Facturas
Facturas
Numero_factura
Numero_factura
Codigo_cliente
Codigo_cliente
Fecha
Fecha
Tipo_IVA
Tipo_IVA
Lineas_factura
Lineas_factura
Numero_factura
Numero_factura
Numero_linea
Numero_linea
Codigo_articulo
Codigo_articulo
Unidades
Unidades
Precio_unitario
Precio_unitario
Coste_unitario
Coste_unitario
Articulos
Articulos
Codigo_articulo
Codigo_articulo
Cod_tipo_artic
Cod_tipo_artic
Descripcion
Descripcion
Ult_coste_unitario
Ult_coste_unitario
Empresas
Empresas
Codigo_empresa
Codigo_empresa
Nombre_empresa
Nombre_empresa
Pais
Pais
Direccion_central
Direccion_central
Paises
Paises
Pais
Pais
Tipos_articulos
Tipos_articulos
Cod_tipo_artic
Cod_tipo_artic
Descripcion_tipo
Descripcion_tipo
2007/08
18
Clientes
Clientes
Codigo_cliente
Codigo_cliente
Empresa
Empresa
Nombre
Nombre
Pais
Pais
Direccin
Direccin
Transformacin de datos
Desnormalizacin
Ventas
Ventas
Fecha
Fecha
Codigo_articulo
Codigo_articulo
Codigo_cliente
Codigo_cliente
Unidades
Unidades
Importe
Importe
Coste
Coste
Beneficio
Beneficio
Articulos
Articulos
Codigo_articulo
Codigo_articulo
Descripcin
Descripcin
Tipo_articulo
Tipo_articulo
Medida
Hecho
Tabla de hechos:
Cada fila corresponde a una medida
Igual grado de detalle (grano) en todos los hechos
Los hechos ms tiles son los numricos y aditivos
Tablas de dimensin:
Contienen descriptores textuales
Son los puntos de entrada en la tabla de hechos
An no es el modelo dimensional
Marta Zorrilla - Universidad de Cantabria
2007/08
19
Cubos e hipercubos
Fechas
te
n
lie
C
2007/08
20
Articulos
te
n
lie
C
Fechas
2007/08
21
Articulos
te
n
lie
C
Fechas
2007/08
22
Articulos
te
n
lie
C
Fechas
2007/08
23
2007/08
24
Articulos
d es el nmero de
dimensiones
Muchos de los cubos no
tiene medida (no ocupan
espacio)
Espaa
Francia
Ao 2003
te
n
lie
C
Ao 2004
Fechas
Marta Zorrilla - Universidad de Cantabria
2007/08
25
Clientes
Clientes
Ventas
Ventas
Fecha
Fecha
Codigo_articulo
Codigo_articulo
Codigo_cliente
Codigo_cliente
Unidades
Unidades
Importe
Importe
Coste
Coste
Beneficio
Beneficio
Codigo_cliente
Codigo_cliente
Empresa
Empresa
Nombre
Nombre
Pais
Pais
Direccin
Direccin
Tabla de hechos:
Atributos (hechos) [aditividad]
Claves de referencia
Clave simple (autonumrica)
Articulos
Articulos
Tablas de dimensin:
Codigo_articulo
Codigo_articulo
Descripcin
Descripcin
Tipo_articulo
Tipo_articulo
Claves de gestin
Atributos [criterios de agregacin]
Claves simples (autonumricas)
Fechas
Fechas
Id_fecha
Id_fecha
Fecha
Fecha
Ao
Ao
Mes
Mes
Dia
Dia
Clientes
Clientes
Id_cliente
Id_cliente
Codigo_cliente
Codigo_cliente
Empresa
Empresa
Nombre
Nombre
Pais
Pais
Direccin
Direccin
Ventas
Ventas
Id_venta
Id_venta
Id_fecha
Id_fecha
Id_articulo
Id_articulo
Id_cliente
Id_cliente
Unidades
Unidades
Importe
Importe
Coste
Coste
Beneficio
Beneficio
Articulos
Articulos
Id_articulo
Id_articulo
Codigo_articulo
Codigo_articulo
Descripcin
Descripcin
Tipo_articulo
Tipo_articulo
Esquema dimensional
(en Estrella)
2007/08
26
Facturas
Facturas
Numero_factura
Numero_factura
Codigo_cliente
Codigo_cliente
Fecha
Fecha
Tipo_IVA
Tipo_IVA
Lineas_factura
Lineas_factura
Numero_factura
Numero_factura
Numero_linea
Numero_linea
Codigo_articulo
Codigo_articulo
Unidades
Unidades
Precio_unitario
Precio_unitario
Coste_unitario
Coste_unitario
Articulos
Articulos
Codigo_articulo
Codigo_articulo
Cod_tipo_artic
Cod_tipo_artic
Descripcion
Descripcion
Ult_coste_unitario
Ult_coste_unitario
Extraccin
Transformacin
Empresas
Empresas
Esquema
relacional
Codigo_empresa
Codigo_empresa
Nombre_empresa
Nombre_empresa
Pais
Pais
Direccion_central
Direccion_central
Paises
Paises
Pais
Pais
Tipos_articulos
Tipos_articulos
Cod_tipo_artic
Cod_tipo_artic
Descripcion_tipo
Descripcion_tipo
Fechas
Fechas
Id_fecha
Id_fecha
Fecha
Fecha
Ao
Ao
Mes
Mes
Dia
Dia
Clientes
Clientes
Id_cliente
Id_cliente
Codigo_cliente
Codigo_cliente
Empresa
Empresa
Nombre
Nombre
Pais
Pais
Direccin
Direccin
2007/08
Carga
Ventas
Ventas
Id_venta
Id_venta
Id_fecha
Id_fecha
Id_articulo
Id_articulo
Id_cliente
Id_cliente
Unidades
Unidades
Importe
Importe
Coste
Coste
Beneficio
Beneficio
Articulos
Articulos
Id_articulo
Id_articulo
Codigo_articulo
Codigo_articulo
Descripcin
Descripcin
Tipo_articulo
Tipo_articulo
Esquema dimensional
(en Estrella)
27
2007/08
28
2007/08
29
2007/08
30
Nuevas dimensiones:
Hay que aadir una nueva clave de referencia en la tabla de hechos
Y cargar los nuevos valores de la tabla de hechos
Nuevas medidas:
Nuevas columnas en la tabla de hechos
Hay que rellenar de valor las filas anteriores al cambio
2007/08
31
Clientes
Clientes
Id_cliente
Id_cliente
Codigo_cliente
Codigo_cliente
Empresa
Empresa
Nombre
Nombre
Pais
Pais
Direccin
Direccin
Ventas
Ventas
Id_venta
Id_venta
Id_fecha
Id_fecha
Id_articulo
Id_articulo
Id_cliente
Id_cliente
Id_promocion
Id_promocion
Unidades
Unidades
Importe
Importe
Coste
Coste
Beneficio
Beneficio
Articulos
Articulos
Id_articulo
Id_articulo
Codigo_articulo
Codigo_articulo
Descripcin
Descripcin
Tipo_articulo
Tipo_articulo
Promocion
Promocion
Id_promocion
Id_promocion
Nombre_prom
Nombre_prom
Tipo_prom
Tipo_prom
Fecha_ini_prom
Fecha_ini_prom
Fecha_fin_prom
Fecha_fin_prom
2007/08
32
Ej.: Qu productos
estuvieron en promocin
en qu almacenes y en
qu das?
Cobertura
Cobertura
promocin
promocin
Fechas
Fechas
Almacenes
Almacenes
Id_fecha
Id_fecha
Id_articulo
Id_articulo
Id_almacen
Id_almacen
Id_promocion
Id_promocion
Promotion
Promotion count(=1)
count(=1)
2007/08
Artculos
Artculos
Promocin
Promocin
33
Clientes
Clientes
Empresas
Empresas
Id_empresa
Id_empresa
Empresa
Empresa
Pas
Pas
Ventas
Ventas
Id_venta
Id_venta
Id_fecha
Id_fecha
Id_articulo
Id_articulo
Id_cliente
Id_cliente
Id_promocion
Id_promocion
Unidades
Unidades
Importe
Importe
Coste
Coste
Beneficio
Beneficio
Articulos
Articulos
Id_articulo
Id_articulo
Codigo_articulo
Codigo_articulo
Descripcin
Descripcin
Tipo_articulo
Tipo_articulo
Promocion
Promocion
Id_promocion
Id_promocion
Nombre_prom
Nombre_prom
Tipo_prom
Tipo_prom
Fecha_ini_prom
Fecha_ini_prom
Fecha_fin_prom
Fecha_fin_prom
Id_cliente
Id_cliente
Codigo_cliente
Codigo_cliente
Id_empresa
Id_empresa
Nombre
Nombre
Direccin
Direccin
2007/08
34
Clientes
Clientes
Fechas
Fechas
Empleados
Empleados
Proveedores
Proveedores
Promocion
Promocion
Ventas
Ventas
[transacciones]
Inventario
Inventario
[fotos (snapshot)]
Articulos
Articulos
Almacenes
Almacenes
Compras
Compras
[transacciones]
2007/08
35
Transaccional
Snapshot
Ejemplos:
Balance bancario
Inventario
Temperaturas de una habitacin
2007/08
36
Inventario
Inventario (snapshot)
(snapshot)
Alm_ID
Alm_ID
Atributos
Atributos alm.
alm.
Margen de retorno
=
de inventario
inventario_ID
inventario_ID
Alm_ID
Alm_ID
Producto_ID
Producto_ID
Fecha_ID
Fecha_ID
Uds_entradas
Uds_entradas
Uds_vendidas
Uds_vendidas
Precio_coste
Precio_coste
Precio_ult_venta
Precio_ult_venta
Producto_ID
Producto_ID
Atributos
Atributos producto
producto
Fecha
Fecha
Fecha_ID
Fecha_ID
Atributos
Atributos derivados
derivados
2007/08
37
2007/08
Fechas
Artculos
Almacenes
Promocin
Empleados
Clientes
Proveedores
Marta Zorrilla - Universidad de Cantabria
2007/08
39
Hechos
Dimensiones
Ventas
s
n
es
e
r
s
o
s
s
i
o
n
o
s
c
lo
e
a
d
te
o
u
c
ed
a
h
n
c
a
c
e
e
m
i
e
l
i
v
p
Fe Art Alm Pro
Cl Pro
m
E
Inventario
Compras
Movimientos
2007/08
40
2007/08
41
2007/08
42
Hechos conformados
2007/08
43
Data marts
Data mart:
2007/08
44
2007/08
45
2007/08
46
2007/08
Ejemplos:
Id_venta
Id_venta
Id_fecha_pedido
Id_fecha_pedido
Id_fecha_entrega
Id_fecha_entrega
.
.
Unidades
Unidades
Total
Total
.
.
Id_fecha
Id_fecha
Fecha
Fecha
Ao
Ao
Mes
Mes
Dia
Dia
Marta Zorrilla - Universidad de Cantabria
Ventas
Ventas
2007/08
48
Relaciones n a m
En ocasiones puede darse el caso de que a una fila de la tabla de hechos le pueda
corresponder un nmero variable de filas de una dimensin (adems de lo normal,
una fila de dimensin que pueda tener asociadas varias filas en la tabla de hechos)
Ejemplo: movimientos de cuentas que puedan ser ms de un cliente
Cuent_client
Cuent_client
Fechas
Fechas
Movimientos_cuenta
Movimientos_cuenta
Id_fecha
Id_fecha
Fecha
Fecha
Ao
Ao
Mes
Mes
Dia
Dia
Id_movimiento
Id_movimiento
Id_fecha
Id_fecha
Id_cuenta
Id_cuenta
Id_tipo
Id_tipo
Debe
Debe
Haber
Haber
Cuentas
Cuentas
Id_cuenta
Id_cuenta
Numero_cuenta
Numero_cuenta
Descripcin
Descripcin
Fecha_apertura
Fecha_apertura
Id_cuenta
Id_cuenta
Id_cliente
Id_cliente
Factor_particip
Factor_particip
Clientes
Clientes
Id_cliente
Id_cliente
Codigo_cliente
Codigo_cliente
Empresa
Empresa
Nombre
Nombre
Pais
Pais
Direccin
Direccin
Tipo_movim
Tipo_movim
Id_tipo
Id_tipo
Codigo_tipo
Codigo_tipo
Descr_tipo
Descr_tipo
2007/08
49
Junk dimensin
Ej.: tipo de pago (crdito o dbito), tarjeta con comisin o sin ella, venta nacional
o internacional,
Junk dimensin, dimensin que combina todos los valores posibles de este
tipo de atributos.
2007/08
50
Dimensin degenerada
2007/08
Ventas
Ventas
Id_venta
Id_venta
Id_fecha
Id_fecha
Id_articulo
Id_articulo
Id_cliente
Id_cliente
Id_promocion
Id_promocion
Numero_pedido
Numero_pedido
Unidades
Unidades
Total
Total
Coste
Coste
Beneficio
Beneficio
51
Kimball vs Inmon
2007/08
52
Modelo
Relacional
Dimensional
Objetivos
Consultas estratgicas
Datos
Actualizados dinmicamente
Histricos estticos
Usuario
Consistencia
Redundancias
Se persigue
Se da por supuesta
Se impiden
Se permiten
2007/08
53
2007/08
2007/08
55
Ejemplo de pedido
2007/08
56
Modelo de datos
2007/08
57
Anlisis
2007/08
58
Parmetros de negocio
Nivel de grano: lnea de pedido
Mtricas
Importe lnea
Unidades vendidas
Descuento
Dimensiones:
Tiempo
Mtricas derivadas
Coste flete
Beneficio neto
Mensual
Trimestral
Anual
2007/08
59
Clave autonumrica
(_key)
Atributos
Niveles de
agregacin
Clave
compuesta
Medidas
Clave
operacional
(_ID)
Dimensin
degenerada
2007/08
60
Dimensiones
2007/08
61
Dimensiones
2007/08
62
Dimensiones
2007/08
63
Dimensiones
2007/08
64
Dimensiones
2007/08
65
Tabla de hechos
2007/08
66
Marta Zorrilla
Universidad de Cantabria
2007/08
Objetivo
Fuentes de datos
internas
Compras
BD Relacional (OLTP)
Contabilidad
..
.
Herramienta
ETL
Extraccin
Transformacin
Carga
ETL
RR/HH
Datos detalle
ETL
Staging
Area
Web log,..
Fuentes de datos
externas
INE, INEM,
2007/08
81
Nota importante
2007/08
82
Datos archivados
2007/08
83
Limpieza
Integracin
Transformacin
Carga de datos
2007/08
84
2007/08
85
Incompletos porque
Incorrectos debido a
Inconsistentes porque
2007/08
86
Data warehouse
integracin consistente de datos con calidad
2007/08
87
Caractersticas de calidad
Preciso
Completo
Consistente
Creble
Con valor aadido
Interpretable
Accesible
Riguroso en el tiempo
2007/08
88
Importancia
Tareas
2007/08
89
qu soluciones?
2007/08
90
Integracin de datos
El problema de la redundancia:
2007/08
91
Transformacin
errores tipogrficos
datos que no tienen sentido (fecha de nacimiento > hoy)
resolver conflictos de dominio
aclarar datos ambiguos
asignar valor a datos nulos (missing data)
2007/08
92
Transformacin (y 2)
Uso de metadata
2007/08
93
Carga
Inicial
2007/08
94
Fuentes de datos
internas
Compras
BD Relacional (OLTP)
Staging area
Contabilidad
..
.
RR/HH
Herramienta
ETL
ETL
Extraccin
Transformacin
Carga
Datos detalle
ETL
Staging
Area
Web log,..
Fuentes de datos
externas
INE, INEM,
2007/08
95
Cubos OLAP
2007/08
2007/08
108
VENTAS
Tiempo
Marta Zorrilla - Universidad de Cantabria
2007/08
Cl
te
n
e
P
r
o
d
u
c
t
o
109
Informe OLAP
rea
geogrfica
(cliente)
Producto
IN
Ao
E
M
R
O
F
2007/08
110
Componentes de un cubo
Cliente
Miembro
Argentina
Blgica
Canad
Francia
Italia
VENTAS
()
Producto
Camembert
Gorgonzola
Chocolate
Pat Chinoise
Ravioli
Propiedades
Celdas
Niveles
Da1 Da 2 ....
Enero Febr. ....
Trim.1 Trim. 2 ....
Tiempo
Producto
Camembert
Gorgonzola
Chocolate
Pat Chinoise
Ravioli
Stock min.
10
20
35
15
125
Obsoleto
N
N
N
N
N
2007/08
111
Definir dimensiones
balanceada (producto)
no balanceada (empleado)
desigual (el padre de un miembro no se encuentra en el
nivel que est por encima inmediatamente de ste, cliente)
2007/08
112
Dimensin equilibrada
2007/08
113
Dimensin no equilibrada
2007/08
114
Dimensin desigual
2007/08
115
Definir cubos
Aditivas y no aditivas
Mtricas calculadas
Mtricas calculadas:
2007/08
116
MOLAP
MOLAP
Base Datos Multidimensional
Capacidad
ROLAP
ROLAP
HOLAP
HOLAP
Sistema hbrido
DOLAP
DOLAP
Desktop OLAP
Marta Zorrilla - Universidad de Cantabria
2007/08
117
MOLAP
Son portables
Buen comportamiento con no ms de 10 dimensiones
y volumen inferior a 5 Gb.
2007/08
118
ROLAP
No son portables
Tiene sentido utilizarse para datos poco consultados
2007/08
119
HOLAP
No son portables
Ofrecen solucin intermedia (coste almacenamiento
rendimiento consultas)
2007/08
120
Almacenar particiones
Tener escalabilidad
Establecer diferente tipo de procesamiento a cada particin
Mejorar el rendimiento de las consultas
Optimizacin de cada particin
1999
2000
2001
Particiones
2007/08
121
Cubos virtuales
2007/08
122
Seguridad
Independientes
2007/08
123
Herramientas OLAP
Lo interesante no es poder realizar consultas que, en
cierto modo, se pueden hacer con selecciones,
proyecciones, concatenaciones y agrupamientos
tradicionales.
Lo realmente interesante de las herramientas OLAP
son sus operadores de refinamiento o manipulacin
de consultas.
DRILL
ROLL
SLICE & DICE
PIVOT
Marta Zorrilla - Universidad de Cantabria
2007/08
124
Seleccin y proyeccin
Pivot (rotar):
Reorientar el cubo
Drill:
2007/08
125
Informe OLAP
Los informes permiten mostrar la
informacin con diferentes niveles
de agrupacin.
Actividad
Agricultura
Comercio
Construccin
Resto
Transporte
Total
Total
1
34
10
5
10
60
Total
33
10
17
60
2007/08
126
Herramientas OLAP
Las herramientas de OLAP se caracterizan por:
9 ofrecer una visin multidimensional de los datos (matricial).
9 no imponer restricciones sobre el nmero de dimensiones.
9 ofrecer simetra para las dimensiones.
9 permitir definir de forma flexible (sin limitaciones) sobre las
dimensiones: restricciones, agregaciones y jerarquas entre
ellas.
9 ofrecer operadores intuitivos de manipulacin: drill-down, rollup, slice-and-dice, pivot.
9 ser transparentes al tipo de tecnologa que soporta el almacn
de datos (ROLAP o MOLAP).
2007/08
127