Está en la página 1de 35

Ejemplo

Marta Millan
millan@eisc.univalle.edu.co

www.eisc.univalle.edu.co/materias

Hechos


Los hechos son transacciones que han ocurrido en


algn punto en el pasado, y que es muy poco
probable que cambien en el futuro
Los hechos se pueden analizar de diferentes
formas dependiendo de la informacin de
referencia
Los hechos suelen tener pocos atributos, puesto
que no tiene datos operacionales

Dimensiones





Sirven para representar cada uno de los factores por los


que se puede analizar un determinado rea de negocio
Son tablas siempre ms pequeas
A menudo se desnormalizan

clave_da
da
clave_mes

mes
mes
clave_mes

clave_da
da
clave_mes

mes

Hechos y dimensiones

Sucursales
Clientes

Ventas
Productos

July 2001
M

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

Pc

Porttil

Ratn
Telfono

Fax

Fecha

Diagramas en estrella

Cliente

Producto

Ventas

Fecha

Tabla de
hechos

Sucursal

Tablas de dimensin

TV
PC
VCR
suma

1Qtr

Fecha

2Qtr 3Qtr

4Qtr

Ventas totales de
television en T1.
suma
T1
T2
T3
suma

Tienda

Pr
od
uc
t

Datos multidimensionales

Diseo STAR: pasos a seguir




De diagrama E/R surgen mltiples diagramas


en estrella
Separar en procesos discretos de negocio
(hechos) y modelar cada hecho
Seleccionar relaciones n:m con atributos
numricos
Desnormalizar las tablas de dimensin

Diseo STAR: pasos a seguir

Diagrama E/R
T

C
S

Diagrama en
estrella
A

B
R

Fecha

Diseo de la tabla de hechos







Decidir la granularidad de la tabla de hechos


 Establece lo que significa cada registro de la
tabla de hechos
Decidir las dimensiones
Decidir los hechos de la tabla de hechos
 Deben ser especficos para la granularidad
seleccionada para la tabla de hechos

Diseo de la tabla de hechos







Identificar el periodo histrico significativo para los


distintos procesos y el grado de detalle requerido
Eliminar todas las columnas del hecho que no sean
requeridas para responder a preguntas de toma de
decisiones
Ajustar el tamao de cada columna
Usar claves generadas

Claves primarias y extranjeras




Todas las claves que se utilicen en tablas del Data


Warehouse deben ser claves sin significado
Nunca se deben usar claves de produccin
 Facilitar los cambios
 Situaciones no lo se, desconocido
 Dimensiones que cambian en el tiempo

Aditividad


Siempre que sea posible, los hechos de la tabla de


hechos deberan elegirse para que sean
perfectamente aditivos (se pueden sumar por
cualquier dimensin)
Las medidas de actividad son generalmente
aditivas
Las medidas de intensidad no siempre lo son
(niveles de inventario, balance de cuentas...)

Anlisis de aditividad
Fecha

Ventas
Cod_Fecha
Cod_Sucursal

producto

Cod_Producto

Sucursal

Cod_Cliente
Unidades
Almacenes

Fecha

Cantidad
aditiva

Cod_Fecha
Cod_Almacn
Cod_Producto

Almacn

Cliente

Stock

producto

Cantidad
NO aditiva

Diseo de las dimensiones





Son tablas ms pequeas


Desnormalizar si se acceden muy a menudo en las
consultas para acelerar el desempeo (Esquemas
estrella)
Establecer la poltica para dimensiones cambiantes
 Actualizar los cambios
 Atributos valor antiguo valor nuevo
 Generar un nuevo cdigo para el nuevo valor

Normalizacin de dimensiones








Se dice que una dimensin est snowflaked


cuando los atributos de baja cardinalidad se llevan
a tablas separadas
Generalmente no se recomienda
A veces se usa para ahorrar espacio de
almacenamiento
No permite hacer uso de los ndices de bitmap
Sin embargo existen situaciones (datos
demogrficos) en las que son aconsejables

Disear las tablas dimensin


Categorias comerciales
Clave_categoria_comercial
Categoria_comercial

Marketing
Clave_marca_comercial
Marca_comercial
Clave_categoria_comercial

Finanzas
Categorias financieras
Clave_categoria_financiera
Categoria_financiera

Clave_marca_financiera
Marca_financiera
Clave_categoria_financiera

Embalajes
Clave_tipo_embalaje
Tipo_embalaje

Sabores
Clave_sabor
Sabor

Producto
Clave_producto
SKU
Descripcion
Clave_marca_comercial
Clave_marca_financiera
Clave_tipo_embalaje
Tamao
Clave_sabor
Altura
Cantidad_por_caja

Disear las tablas dimensin


Producto
Clave_producto
SKU
Descripcin
Clave_marca_comercial
Clave_marca_financiera
Clave_tipo_embalaje
Tamao
Clave_sabor
Altura
Cantidad_por_caja
Categoria_comercial
Categoria_financiera
Marca_financiera
Marca_comercial
Tipo_embalaje
Sabor

Tabla de hechos
Clave_producto

Disear las tablas dimensin

Cliente

Subdimensin demogrfica
Departamento
Nmero de segmento
Nombre del segmeto
Contador del segmento
Porcentaje del segmento
Ranking del segmento

Clave cliente (PK)


ID_cliente
Nombre
Direccin
Ciudad
Departamento
Fecha primera compra
Score de compra
Score de crdito

Ventas
Clave_cliente
Clave_producto

Un esquema en estrella
Fechas
Cdigo
Sysdate
Da
Mes
da_semana
___

Sucursal

Ventas
Cliente
Clave cliente (PK)
ID_cliente
Nombre
Direccin
Ciudad
Departamento
Fecha primera compra
Score de compra
Score de crdito

Subdimensin demogrfica
Departamento
Nmero de segmento
Nombre del segmento
Contador del segmento
Porcentaje del segmento
Ranking del segmento

Cod_Fecha
Clave_Cliente
Clave_Sucursal
Clave_Producto
unidades
precio_unidad
ticket

Clave
Direccin
Segmento
Descripcin

Producto
Clave_producto
SKU
Descripcin
Clave_marca_comercial
Clave_marca_financiera
Clave_tipo_embalaje
Tamao
Clave_sabor
Altura
Cantidad_por_caja
Categoria_comercial
Categoria_financiera
Marca_financiera
Marca_comercial
Tipo_embalaje
Sabor

La importancia de los atributos




La calidad del Data Warehouse se mide por la


calidad de los atributos
 Descriptivos
 Completos (sin valores nulos)
 Indexados
 Palabras enteras
 Documentados (metadatos)
 Calidad asegurada

Tabla de fechas
Sucesos politicos
Codigo_Fecha
Codigo de suceso
Nombre de suceso

Fecha
Codigo
Da
Da semana (numero)
Dia semana (nombre)
Festivo
Mes (numero)
Mes (nombre)
Fin de semana
Dia antes fin de semana
....

Sucesos climaticos
Codigo_Fecha
Codigo de suceso
Nombre de suceso

Fiestas nacionales
Codigo_Fecha
Codigo de fiesta
Nombre fiesta

Fiestas locales
Codigo_Fecha
Codigo de fiesta
Nombre fiesta

Dimensin degenerada





La mayora de los diseos multidimensionales estn


alrededor de un documento de control: nmero de
pedido, factura, ticket, ...
Generalmente son contenedores de ms de un
producto
Generalmente en estos casos la granularidad de la
tabla la marca este nmero
Qu se hace con los nmeros?
Se ponen en las tablas pero no tienen una dimensin
con la que hacer join

Aplicacin de dimensiones degeneradas

Fechas
Codigo
Sysdate
Da
Mes
da_semana
___

Cliente
Codigo
Nombre
Sexo
Cluster
___

Sucursal

Ventas
Cod_Fecha
Cod_Cliente
Cod_Sucursal
Cod_Producto
unidades
precio_unidad
ticket

Dimensin
degenerada

Codigo
Direccin
Segmento
Descripcion

Producto
Codigo
Descripcin
tipo
seccin

Dimensin Cajn desastre


 En ocasiones se tienen atributos textuales y flags de
distinta naturaleza que no parecen organizarse de
manera coherente
 La solucin no parece sencilla
Dejar los atributos en la tabla de hechos
Hacer dimensiones separadas para cada atributo
Quitar directamente estos atributos

 La mejor solucin es compactarlos todos en lo que se


denomina una junk dimension

Aplicacin de dimensin junk"

Habitacion
Codigo
Planta
Seccin
Tamao

Gustos
Codigo
Nios
Ascensor
Almohada
Tipo_cama
___

Cliente

Reservas
Cod_Cliente
Cod_Habitacion
Cod_Fecha
Reserva
Gustos
das
coste
descuento

Cajn desastre

Codigo
Nombre
Fecha_nacimiento
Sexo
Tipo
___

Fecha
Codigo
Da
Da semana
Festivo
Mes
___

Sucesos
Codigo_Fecha
Suceso Politico
___

Tablas de hechos sin hechos




Hay situaciones en las que se tiene en el


diseo final una tabla de hechos sin hechos
Son situaciones en las que interesa el
suceso en s
 Afluencia de pblico
 Coberturas

Tablas de hechos sin hechos


Fecha
Codigo
Da
Da semana
Festivo
Mes
___

Producto
Codigo
Nombre
Tipo
___

Productos en promocion
Cod_Fecha
Cod_promocion
Cod_producto
"1"

Promocion
Codigo
Tipo
Dias
Descripcion

Ejercicio a resolver


Supnga un hospital en el se ha decidido construir


un Data Warehouse para analizar
 Ocupacin

 Tratamientos

 Diagnsticos

Pasos a seguir




Estudiar el problema
Determinar los hechos fundamentales a estudiar
Para cada hecho
 Analizar la granularidad del hecho
 Decidir las dimensiones
Disear las dimensiones

Ocupacin de camas

July 2001

Pacientes

Ocupacin

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

Fecha

Camas

Tratamientos

July 2001
S

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

Fecha
Pacientes
Tratamientos

Mdicos

Tratamientos

Diagnsticos

July 2001
S

S
7

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

Fecha
Pacientes
Diagnsticos

Doctores

Diagnsticos

Tabla de ocupaciones
Fecha
Cdigo
Da
Da semana
Festivo
Mes
___

Ocupacin
Cod_Fecha
Cod_cama
Cod_paciente
"1"

Paciente
Sucesos
Cdigo_Fecha
Epidemia
___

Cdigo
Nombre
Fecha_nacimiento
Sexo
Identificacin
Datos mdicod
___

Cama
Cdigo
Planta
Seccin
Especialidad

Tabla de diagnsticos
Paciente
Mdico
Cdigo
Licencia
Nombre
Fecha_nacimiento
Especialidad
Sexo
___
Fecha de Grado...

Diagnsticos_realizados
Cod_Medico
Cod_Paciente
Cod_Diagnstico
Cod_Fecha
Cod_Ingreso
Costo

Cdigo
Nombre
Fecha_nacimiento
Sexo
Fe
___

Diagnstico
Cdigo
Nombre
Especialidad
Tipo

Fecha

Sucesos

Cdigo
Da
Da semana
Festivo
Mes
___

Cdigo_Fecha
Epidemia
___

Tabla de tratamientos
Mdico
Cdigo
Licencia
Nombre
Fecha_nacimiento
Especialidad
___

Paciente

Tratamientos_realizados

Tratamiento
Cdigo
Nombre
Presentacin
Laboratorio
Posologa

Cdigo
Nombre
Fecha_nacimiento
Sexo
Fe
___

Cod_Medico
Cod_Paciente
Cod_Fecha
Cod_Tratamiento
NIngreso
Costo
Nmero de das
Dosis diarias
Cod_Junk

Fecha
Flags_efectos_secundarios
Cdigo
Exito
Problemas gstricos
Insomnio
Alergia
___

Cdigo
Da
Da semana
Festivo
Mes
___

Sucesos
Cdigo_Fecha
Epidemia
___

También podría gustarte