Está en la página 1de 39

Diseño y Optimización de

Bases de Datos:
DataWareHouse

Dr. Eugenio Santos Menéndez

Departamento de O.E.I. - U.P.M.


Diseño y Optimización de Bases de Datos

Introducción
z En un entorno de competencia global, sólo aquellas
organizaciones capaces de detectar, evaluar y
responder rápida y acertadamente a cambios y
tendencias en el mercado, tendrán éxito; usando
tecnología punta, utilizando de forma eficiente sus
recursos y teniendo a la información como ventaja
competitiva.
z Los beneficios que la arquitectura DW brinda son:
z Incrementar la productividad del negocio.
z Proveer los cimientos de las decisiones ejecutivas.
z Originar en la empresa nuevas formas de hacer negocios

Dpto. O.E.I. - U.P.M. / DataWareHouse: 2


Diseño y Optimización de Bases de Datos

Tendencias en el tiempo.
ƒ En los años de la posguerra, la economía estaba
orientada al producto. La prioridad estaba en la
producción.

ƒ En los años 70 la prioridad estaba en mejorar la calidad


de los productos.

ƒ En los años 80 se toma conciencia del factor tiempo. La


prioridad estaba en reducir plazos (diseño, entrega).

ƒ En los años 90 la prioridad estaba en la mejora de los


servicios asociados al producto (servicios a los
clientes, garantía...)

ƒ Actualmente la prioridad esta en la personalización. Dar a


cada cliente la impresión de ser único.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 3


Diseño y Optimización de Bases de Datos

Definición de Data WareHouse


z “El Data WareHouse es una colección de datos
orientados al tema, integrados, no volátiles e historiados,
organizados para el apoyo de un proceso de ayuda a la
toma de decisiones”. Bill Inmon en su obra de referencia
“Using the Data WareHouse”.

z Formas de utilizar la información de un Data WareHouse:

ƒ Aumentar el enfoque del cliente. ¡Los mercados no compran, los


clientes sí!.
ƒ Volver a colocar los productos y manejar su cartera de productos.
ƒ Hacer correcciones ambientales a los planes de mercadotecnia.
ƒ Analizar operaciones y buscar fuentes de ingresos.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 4


Diseño y Optimización de Bases de Datos

Estructura de un Data WareHouse


Un Data WareHouse se estructura en cuatro clases de datos.

M Alto nivel de Ventas mensuales


por delegación
e Sumarización (1983-1996)

t Sumarización
a media Ventas semanales
por productos
(1983-1996)

D Ventas
(1991-1996)
Nivel Operacional de
a Detalle

t Ventas Históricos
a (1983-1990)
(cinta...etc)

Dpto. O.E.I. - U.P.M. / DataWareHouse: 5


Diseño y Optimización de Bases de Datos

Arquitectura de referencia
z La arquitectura de referencia se describe del
siguiente modo:
ƒ Un conjunto de datos extraídos de bases de datos operacionales.
ƒ Un software que prepara los datos para que puedan ser
accedidos por los usuarios.
ƒ Un conjunto de aplicaciones y herramientas que ejecutan un
conjunto de consultas y análisis complejos.

ƒ La arquitectura de
referencia del Data
WareHouse divide los
componentes en los
siguientes bloques:

Dpto. O.E.I. - U.P.M. / DataWareHouse: 6


Diseño y Optimización de Bases de Datos

Diseño y construcción de un DW (I)


z Mismo ciclo de perfeccionamiento que todos los
desarrollos de software.

2º Modelizar
3º Localizar
datos datos

1º Proceso Desarrollar
iterativo Extracción
Análisis de de
Especificaciones Construcción
Definir

Data Marts
7º Cargar
Construir
y
Replicar procedimientos
Replicación 6º
Dpto. O.E.I. - U.P.M. / DataWareHouse: 7
Diseño y Optimización de Bases de Datos

Diseño y construcción de un DW (y
II)
z Es importante realizar una buena selección de la
metodología de desarrollo. Las más importantes son:

Método en cascada. Método en espiral.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 8


Diseño y Optimización de Bases de Datos

OLTP vs OLAP.
z OLTP (On Line Transactional Processing): Tipo de entorno de
tratamiento de la información en el que debe darse una
respuesta en un tiempo aceptable y consistente.
z OLAP (On Line Analytical Processing): Caracteriza la
arquitectura necesaria para la implementación de un sistema de
ayuda a la toma de decisiones.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 9


Diseño y Optimización de Bases de Datos

Técnicas de modelado (I)


z El modelado dimensional es una técnica para
modelar bases de datos simples y entendibles al
usuario final.
z Consideremos un punto en el espacio. El espacio se
define a través de sus ejes de coordenadas (por
ejemplo X, Y, Z). Un punto cualquiera de este
espacio quedará determinado por la intersección de
tres valores particulares de sus ejes.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 10


Diseño y Optimización de Bases de Datos

Técnicas de modelado (y II)


Modelo Multidimensional:

Representa los datos como matrices N-Dimensionales denominadas


Hipercubos

• Las dimensiones definen


dominios como geografía,
producto, tiempo, cliente...
• Los miembros de una
dimensión se agrupan de forma
jerárquica ( dimensión
geográfica: ciudad, provincia,
autonomía, país ... ).
• Cada celda contiene datos
agregados que relacionan los
elementos de las dimensiones.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 11


Diseño y Optimización de Bases de Datos

El Modelo Multidimensional.
z La estructura básica de un DW para el Modelo
Multidimensional está definida por dos elementos:
esquemas y tablas.
z Tablas DW: como cualquier base de datos
relacional, un DW se compone de tablas.
ƒ Tablas Fact.
ƒ Tablas Lock_up.
z Esquemas DW: la colección de tablas en el DW se
conoce como esquema.
ƒ Esquemas estrella.
ƒ Esquemas snowflake (copo de nieve).

Dpto. O.E.I. - U.P.M. / DataWareHouse: 12


Diseño y Optimización de Bases de Datos

Tablas DW del Modelo Dimensional.


ƒ Tabla Fact o de hechos: Es la tabla central en un
esquema dimensional y contiene los valores de las
medidas de negocios. Cada medida es tomada de la
intersección de las dimensiones que la definen.

ƒ Tablas Lock-up o dimensionales: Estas tablas son las


que se conectan a la tabla fact. Una tabla Lock-up
almacena un conjunto de valores que están relacionados
con una dimensión particular. Están compuestas por una
clave primaria.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 13


Diseño y Optimización de Bases de Datos

Esquemas del Modelo


Dimensional (I)

z Esquema estrella:
ƒ Recibe este nombre por su estructura visual: una
tabla central y un conjunto de tablas que la
“atienden” radicalmente. El centro consta de una
o más tablas fact y los extremos son las tablas
lock_up.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 14


Diseño y Optimización de Bases de Datos

Esquemas del Modelo Dimensional (II)


Producto Cliente

Ventas
Tabla de
hechos

Fecha Sucursal

Tablas de dimensión
Dpto. O.E.I. - U.P.M. / DataWareHouse: 15
Diseño y Optimización de Bases de Datos

Esquemas del Modelo


Dimensional (III)
z Esquema snowflake o en copo de
nieve:
ƒ Las tablas lock_up en el esquema snowflake
están normalizadas, con respecto al esquema
estrella.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 16


Diseño y Optimización de Bases de Datos

Esquemas del Modelo Dimensional (y IV)


MODELO MULTIDIMENSIONAL
DIMENSION
CLIENTE

MERCADOS DIMENSION
PRODUCTO

CLIENTES FAMILIAS

INSTALACION
PRODUCTOS
CLIENTE

VENTAS

PROVINCIAS MESES

REGIONES AÑOS

DIMENSION
DIMENSION
TIEMPO
GEOGRAFICA

Dpto. O.E.I. - U.P.M. / DataWareHouse: 17


Diseño y Optimización de Bases de Datos

Finalidad del Data WareHouse.


z La finalidad de un Data WareHouse consiste en
auxiliar a la administración a comprender el pasado
y planear el futuro. La administración busca
respuestas a preguntas como:
ƒ ¿Qué están comprando nuestros clientes? ¿Qué no están
comprando? ¿Qué incentivos han funcionado antes con los
mismos clientes en esta época del año?.
ƒ ¿Cuántos de nuestros vendedores visitan a un mismo cliente?.
ƒ ¿Qué están haciendo nuestros competidores?
ƒ Cómo se comparan nuestros costos para cada línea de producto
durante los últimos tres años?.
z La promesa del data warehousing es “sacar datos”
de los sistemas operacionales para ayudar a las
empresas a tomar mejores decisiones.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 18


Diseño y Optimización de Bases de Datos

El potencial de Data WareHouse.


z El aprovechamiento del potencial del data
WareHouse sólo está limitado por el
rendimiento, capacidad y creatividad de los
usuarios de la empresa.
z Varios puntos sobre los que poder aplicar el
potencial del DW en una empresa son:
ƒ Crecimiento y análisis de rentabilidad.
ƒ Administración estratégica.
ƒ Administración de las relaciones con el cliente.
ƒ Cambio de la base de competencia.
ƒ Administración de los activos corporativos.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 19


Diseño y Optimización de Bases de Datos

Usuarios de un DW (I)
z Desde la perspectiva de un Data WareHouse,
los usuarios se dividen en tres categorías, y
cada uno de ellos tendrá unas visiones distintas
del Data WareHouse y del acceso a sus datos:
ƒ Por jerarquía.
ƒ Por función.
ƒ Por nivel de competencia en la empresa.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 20


Diseño y Optimización de Bases de Datos

Usuarios de un DW (y II)

Dpto. O.E.I. - U.P.M. / DataWareHouse: 21


Diseño y Optimización de Bases de Datos

Necesidades básicas de usuario.


z Las necesidades básicas de todos los usuarios de
un Data WareHouse se conocen respondiendo a
las siguientes preguntas:
ƒ ¿Qué contiene exactamente el Data WareHouse?.
ƒ ¿Cómo puedo acceder y recuperar el contenido (datos) del
Data WareHouse?.
ƒ ¿Qué son las herramientas de análisis?.
ƒ ¿Qué son las herramientas de informe y presentación?.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 22


Diseño y Optimización de Bases de Datos

Uso del Data WareHouse.


z El uso del Data WareHouse en el curso diario
consta de dos actividades principales:
ƒ Acceso y recuperación.
ƒ Análisis e informes.
z El uso del Data WareHouse evoluciona en fases:
ƒ Primera fase: El Data WareHouse se usa para informes y
consultas predefinidas.
ƒ Segunda fase: Se utiliza para analizar los datos de resumen y de
detalle, presentando los resultado en forma de informes y
gráficas.
ƒ Tercera fase: Conforme los usuarios se sientes más a gusto con
la calidad de los datos y herramientas se comienza a usar el
Data WareHouse con fines estratégicos, con análisis
multidimensional y operaciones sofisticadas.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 23


Diseño y Optimización de Bases de Datos

Ejemplo (I)
z En lo referente a requisitos la empresa nos ha
contratado para realizar una herramienta de
presupuestación, pues necesita un cambio brusco en
el modelo de gestión de su negocio. La empresa
pretende:
ƒ Una herramienta que les permita disponer de la información que
mide el grado de cumplimiento de los objetivos fijados en los
planes estratégicos, así como crear nuevos planes.
ƒ Tener un acceso rápido a la información esencial, para así poder
transmitir las acciones necesarias a cada nivel de su organización.
ƒ Entorno visual de fácil manejo.
ƒ Creación de informes dinámicos, para así aprovechar rendimiento,
capacidad y creatividad de los directivos de la empresa.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 24


Diseño y Optimización de Bases de Datos

Ejemplo (y II)
z En la situación actual, la empresa ya
dispone de una herramienta operacional y
de una antigua herramienta de creación de
presupuestos que nos servirá para tener
datos de partida.
z Separamos el diseño en 3 partes
diferenciadas:
ƒ Procesos de datos: procesos de alta/mantenimiento
de datos en el DW.
ƒ Dimensiones y Jerarquías: estructura de DW.
ƒ Pantallas de aplicación.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 25


Diseño y Optimización de Bases de Datos

Procesos de Datos.
z Los 4 procesos de datos que vamos a implementar
son:
ƒ ACT_PARTIDA: Copia datos de partida de la antigua
herramienta al Data WareHouse. Cuando el usuario
quiera y solo una vez.
ƒ ACT_DIARIA: Copia de los datos diarios de la
herramienta operacional al Data WareHouse. Nocturno.
ƒ ACT_DIMENSIONES: Nuevas altas diarias (productos,
clientes…). Nocturno.
ƒ COPIA: Copia datos de un punto de partida indicado a un
nuevo presupuesto. Cuando el usuario quiera.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 26


Diseño y Optimización de Bases de Datos

Esquema DW. Dimensiones.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 27


Diseño y Optimización de Bases de Datos

Jerarquías

Dpto. O.E.I. - U.P.M. / DataWareHouse: 28


Diseño y Optimización de Bases de Datos

Pantalla de Informes.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 29


Diseño y Optimización de Bases de Datos

Pantalla de Gráficas.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 30


Diseño y Optimización de Bases de Datos

Pantalla Modificación de Precios.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 31


Diseño y Optimización de Bases de Datos

Ejercicio a resolver
z Sea un hospital en el que se ha decidido la
construcción de un Data WareHouse para
analizar:
ƒ Ocupación

ƒ Tratamientos

ƒ Diagnósticos

Dpto. O.E.I. - U.P.M. / DataWareHouse: 32


Diseño y Optimización de Bases de Datos

Pasos a seguir
z Estudiar el problema.
z Determinar los hechos fundamentales a
estudiar.
z Para cada hecho:
ƒ Analizar la granularidad del hecho.
ƒ Decidir las dimensiones.
z Diseñar las dimensiones.

Dpto. O.E.I. - U.P.M. / DataWareHouse: 33


Diseño y Optimización de Bases de Datos

Ocupación de camas

July 2001

Pacientes
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
Ocupación 15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

Fecha

Camas

Dpto. O.E.I. - U.P.M. / DataWareHouse: 34


Diseño y Optimización de Bases de Datos

Tratamientos
July 2001
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

Fecha
Pacientes
Tratamientos

Médicos Tratamientos

Dpto. O.E.I. - U.P.M. / DataWareHouse: 35


Diseño y Optimización de Bases de Datos

Diagnósticos
July 2001
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

Fecha
Pacientes
Diagnósticos

Doctores Diagnósticos

Dpto. O.E.I. - U.P.M. / DataWareHouse: 36


Diseño y Optimización de Bases de Datos

Tabla de ocupaciones
Fecha
Codigo Ocupación
Cod_Fecha Cama
Día
Día semana Cod_cama Codigo
Festivo Cod_paciente Planta
Mes "1" Sección
___ Especialidad

Paciente
Codigo
Sucesos
Nombre
Codigo_Fecha Fecha_nacimiento
Epidemia
Sexo
___
Fe
___

Dpto. O.E.I. - U.P.M. / DataWareHouse: 37


Diseño y Optimización de Bases de Datos

Tabla de diagnósticos
Paciente
Codigo
Médico Nombre
Codigo Fecha_nacimiento
N colegiado Sexo
Nombre Diagnosticos_realizados Fe
Fecha_nacimiento Cod_Medico ___
Especialidad Cod_Paciente
___ Cod_Diagnostico
Cod_Fecha
Cod_Ingreso
Coste

Diagnostico
Codigo
Nombre Fecha Sucesos
Especialidad Codigo Codigo_Fecha
Tipo Día Epidemia
Día semana ___
Festivo
Mes
___

Dpto. O.E.I. - U.P.M. / DataWareHouse: 38


Diseño y Optimización de Bases de Datos

Médico
Tabla de tratamientos
Codigo
N colegiado Paciente
Nombre
Fecha_nacimiento Codigo
Especialidad Nombre
___ Tratamientos_realizados Fecha_nacimiento
Sexo
Cod_Medico
Fe
Cod_Paciente
___
Cod_Fecha
Cod_Tratamiento
Tratamiento NIngreso
Coste
Codigo
Número de días
Nombre
Tomas diarias
Presentación
Cod_Junk
Laboratorio
Posología
Fecha Sucesos
Flags_efectos_secundarios Codigo Codigo_Fecha
Codigo Día Epidemia
Exito Día semana ___
Problemas gastricos Festivo
Insomnio Mes
Alergia ___
___

Dpto. O.E.I. - U.P.M. / DataWareHouse: 39