Está en la página 1de 38

Gestin de negocios con

Business Intelligence:
DW Toma decisiones
1. Seleccionar el proceso de negocio a modelar
2. Declarar la granularidad del proceso de negocio
3. Escoger las dimensiones que describen cada fila de la
tabla de hechos
4. Identificar los hechos numricos que poblarn cada fila
de la tabla de hechos
2
Diseo del Modelo Dimensional
3
Diseo del Modelo Dimensional
Modelo E-R

Entidades
Atributos
Relaciones

Modelo dimensional

Hechos
Dimensiones
Medidas
Proceso de Negocio:
Conjunto de actividades lgicamente relacionadas que
persiguen un objetivo
Se apoya en un conjunto de sistemas de informacin que
recolectan datos
No es lo mismo que una Funcin de Negocio:
Unidad atmica de un proceso de negocio
Varias funciones de negocio constituyen un proceso
de negocio
Ejemplo: Contabilidad, Marketing, Finanzas, Recursos
Humanos
4
Seleccionar Proceso de negocio a modelar (1/3)
El DW no se puede restringir a una funcin de negocios
Posibles problemas:
Duplicar datos con diferentes atributos y terminologa
Inconsistencia de datos
Necesidad de mltiples esfuerzos de:
ETL
Almacenamiento
Gestin del DW
Se necesita publicar la informacin una sola vez
5
Seleccionar Proceso de negocio a modelar (2/3)
Ejemplos:
Produccin:
Ensamblar productos, Verificar calidad, Producir
listado de materiales
Contabilidad y Finanzas
Pagar cuentas, Crear reportes financieros,
Administrar cuentas corrientes
Recursos Humanos
Contratar personal, Evaluar desempeo, Afiliar
empleados en planes de beneficios

6
Seleccionar Proceso de negocio a modelar (3/3)
Especificar exactamente qu representar una fila de la
tabla de hechos
Pregunta clave: Cmo describe una fila de la tabla de
hechos?
Ejemplos:
Una lnea (tem individual) de la boleta que se le entrega al
cliente de una cadena de retail, capturada por el scanner
de cdigo de barra
Una tarjeta de embarque individual que se obtiene para
abordar un vuelo
Una foto diaria de los niveles de inventario de cada
producto en una bodega
Una cartola mensual para cada cuenta bancaria 7
Declarar la granularidad del proceso de negocio
Encontrar todas las posibles descripciones para cada fila
de la tabla de hechos
Pregunta clave: Cmo describen los usuarios del
negocio los datos que resultan del proceso de negocio?
Adems, se deben listar todos los atributos tipo texto y
discretos que completan cada tabla dimensional
Ejemplos:
Fecha
Producto
Cliente
Tipo de transaccin
8
Escoger dimensiones para describir tabla de hechos
Pregunta clave: Qu se est midiendo?
Los usuarios del negocio manifiestan su inters en
medir ciertas mtricas de rendimiento del negocio
Deben ser consistentes con la granularidad definida
Ejemplos:
Cantidad pedida
Costo en una cierta unidad monetaria
Claves para el proceso de diseo
9
Identificar hechos numricos
1. Seleccionar el Proceso de Negocio:
La gerencia desea entender mejor el comportamiento
de compra de los clientes, de acuerdo a la informacin
capturada en el sistema POS
Qu productos se estn vendiendo en qu tiendas, en
qu das, y bajo qu promociones
Proceso de Negocio: Venta a travs de sistema POS
Escoger aquel modelo que tenga mayor impacto:
atacar las preguntas de negocios ms contingente y
con datos ms fciles de extraer.
10
Caso: Supermercados Cenco-Lder (1/7)
2. Declarar la Granularidad:
Ventajas de los datos atmicos:
Altamente dimensional: saber ms cosas sobre
cada hecho particular
Mayor flexibilidad analtica: permite dar acceso al
usuario del negocio al nivel de detalle que desee
Desventaja: rendimiento
11
Caso: Supermercados Cenco-Lder (2/7)
2. Declarar la Granularidad:
Granularidad:
Una lnea (tem individual) en una transaccin del
POS
Ventas diarias por producto y promocin en una
tienda en un da: alternativa menos detallada
Preferiblemente, considerar la informacin ms
atmica (detallada y no divisible) capturada por el
proceso de negocio
12
Caso: Supermercados Cenco-Lder (3/7)
3. Escoger Dimensiones:
Dimensiones:
Producto
Fecha
Local
Promocin
Nmero Transaccin POS
13
Caso: Supermercados Cenco-Lder (4/7)
14
Caso: Supermercados Cenco-Lder (5/7)
Esquema ventas de retail - preliminar
4. Identificar hechos numricos:
Hechos aditivos:
Cantidad Vendida
Monto Venta
Costo Venta
Utilidad Venta (Monto Venta Costo Venta)
Hechos no aditivos
Margen Venta (Utilidad Venta / Monto Venta)
Precio Unitario
Porcentajes y tasas (relaciones) no son aditivas. El
numerador y el denominador deben almacenarse en
la tabla de hechos.
Calcular la tasa de las sumas y no la suma de las tasas
15
Caso: Supermercados Cenco-Lder (6/7)
16
Caso: Supermercados Cenco-Lder (7/7)
Esquema ventas de retail hechos numricos
Tabla de hechos
Nmero de filas en una transaccin del POS que se
generan en un perodo de tiempo
Cmo?
Experto en el negocio
Estimacin gruesa:
Ventas anuales: $ 1.000.000.000.000
Precio promedio por lnea en una transaccin
$1.000
Nmero de lneas anuales: 1.000.000.000
17
Dimensionar requerimientos de almacenamiento
Usar atributos robustos en las tablas de dimensin
Fecha
Producto
Local
Promocin

Qu contiene?
Cmo se obtiene?
Descripcin detallada de cada atributo
18
Dimensionar requerimientos de almacenamiento
Dimensin Fecha
Presente en la mayora de los modelos dimensionales
para DW
Se puede poblar por adelantado
10 aos x 1 da = 3.650 registros
Eventual manejo de la hora del da
Dimensin separada (e independiente), enlazada
directamente a la tabla de hechos
24 horas x 60 minutos = 1.440 registros
19
Dimensionar requerimientos de almacenamiento
Dimensin Fecha: atributos
20
Dimensionar requerimientos de almacenamiento
Clave Fecha (PK)
Fecha completa
Descripcin de la Fecha
Da de la semana
Nmero Da en poca
Nmero Semana en poca
Nmero Mes en poca
Nmero Da en Mes Calendario
Nmero Da en Ao Calendario
Nmero Semana en Ao Calendario
Nmero Mes en Ao Calendario
Nombre Mes Calendario
Trimestre Calendario
Trimestre-Ao Calendario (QX-YYYY)
Semestre-Ao Calendario (SX-YYYY)
Ao Calendario

Indicador de ltimo da en la
semana
Indicador de ltimo da en el mes
Fecha Trmino Semana en
Calendario
Nombre Mes en Ao Calendario
Trimestre del ao (1..4)
Indicador de feriado (Feriado / No
Feriado)
Indicador de da de semana (Da
Semana / Fin de Semana)
Temporada de Venta
Evento Especial


Dimensin Producto (1/3)
Describe todos los SKU que maneja la empresa (Stock
keeping unit - nmero de referencia)
60.000 SKU por tienda + historia + diferencias
estacionales + diferentes mercados geogrficos
150.000 SKU o ms
Extrada del archivo maestro de productos de los
sistemas operacionales
Administrado centralmente (se preocupan de
cmo agregar nuevos)
Se extrae hacia el DW cada vez que cambia
21
Dimensionar requerimientos de almacenamiento
Dimensin Producto (2/3)
Generalmente, tabla contiene 50 o ms atributos
descriptivos
Es una de las dos o tres dimensiones claves en todo
DW
Jerarqua Comercial es un atributo importante
SKU -> Tamao Paquete -> Marca -> Sub-categora
-> Categora -> Departamento

22
Dimensionar requerimientos de almacenamiento
Dimensin Producto (3/3)
Ejemplo:
SKU: Toalla Nova 3 unidades, UPC #XXXXX
Tamao paquete: 3 unidades
Marca: Nova
Subcategora: Toalla de Papel (Papel Absorbente)
Categora: Papel
Departamento: Limpieza
Normalizacin
Se podra, pero no es necesario ni recomendado
23
Dimensionar requerimientos de almacenamiento
Dimensin Producto: atributos
24
Dimensionar requerimientos de almacenamiento
Clave Producto (PK)
Descripcin Producto
Nmero SKU (clave natural)
Descripcin de Marca
Descripcin de Categora
Descripcin del Departamento
Descripcin del tipo de paquete
Tamao Paquete
Contenido grasa
Tipo Dieta
Dimensin

Peso
Unidad de Medida de Peso
Tipo de Almacenamiento
Tipo de Estantera
Ancho Estantera
Alto Estantera
Fondo Estantera


Dimensin Local (1/2)
Es una dimensin geogrfica
No existe en archivo maestro operacional
Se construye a partir de mltiples fuentes
corporativas
Pueden converger varias jerarquas
Poltico administrativas: regin, provincia, comuna
Administracin empresa: VI regin, sector costa,
Santiago centro, Santiago Oriente
Tipos de local
Valores numricos y aditivos
25
Dimensionar requerimientos de almacenamiento
Dimensin Local (2/2)
Es comn representar mltiples jerarquas en una
tabla dimensional
Idealmente, los nombres y valores de los atributos
deberan ser nicos entre las distintas jerarquas
26
Dimensionar requerimientos de almacenamiento
Clave Local (PK)
Nombre Local
Nmero Local (Clave Natural)
Direccin del Local
Comuna del Local
Ciudad del Local
Regin del Local
Gerente Local
Tipo de Layout de piso
Tipo de Procesamiento Foto
Tipo de Servicio Financiero
M2 de Estanteras
M2 Totales
Fecha Apertura
Fecha ltima Remodelacin



Dimensin Promocin (1/2)
Dimensin causal (como opuesto a casual)
Factor controlable, puede causar un cambio en las
ventas
Condiciones causales:
Reduccin de Precios
Aviso
Despliegue
Cupn
27
Dimensionar requerimientos de almacenamiento
Dimensin Promocin (2/2)
Condiciones causales podran estar separadas en 4
tablas dimensionales diferentes
Pero, estn altamente correlacionadas
No est en promocin
Evitar llaves nulas en la tabla de hechos

28
Dimensionar requerimientos de almacenamiento
Dimensin Promocin: atributos
29
Dimensionar requerimientos de almacenamiento
Clave Promocin (PK)
Nombre Promocin
Tipo de Reduccin de Precio
Tipo de Promocin en Medios
Tipo de Aviso
Tipo de Despliegue
Tipo de Cupn
Nombre de Aviso en Medios
Proveedor de Despliegue
Costo de Promocin
Fecha de Inicio Promocin
Fecha de Trmino Promocin


Dimensin Nmero de Transaccin
Dimensin anmala
No tiene atributos descriptivos
Llave privada de tabla de hechos est formada por
llaves exportadas y/o atributos que corresponden a
dimensiones anmalas
Ejemplo Retail:
Nmero Transaccin
Clave Producto (FK)
Nmeros de control operacional, como nmero de
transaccin o nmero de pedido, dan origen a
dimensiones anmalas
30
Dimensionar requerimientos de almacenamiento
Cada atributo de las tablas dimensionales puede ser
usado para restringir el reporte o agregarle columnas
(construir el reporte):
Drill down: Agregar un atributo de una tabla
dimensional como columna
Roll up: Remover una columna
Si es un atributo dentro de una jerarqua, permite
obtener una mirada ms general
31
Reportes
32
Reportes: Ejemplo de Drill-down
33
Reportes: ejemplo Anlisis Promocin
34
Reportes: ejemplo Anlisis Promocin
Error 1: No armonizar hechos y dimensiones a travs de
tablas de hecho separadas
Error 2: Esperar que los usuarios consulten los datos
atmicos de bajo nivel en una forma normalizada
Desagregacin de los datos debera llegar hasta el
nivel ms bajo que podra interesar a los usuarios
Error 3: Disear el modelo dimensional pensando en un
reporte especfico
Enfocarse en la construccin de un modelo numrico
para medir un proceso de negocio
35
Errores en modelado dimensional: Top ten
Error 4: No declarar o no respetar la granularidad de la
tabla de hechos
Cada nivel de granularidad requiere su propia tabla de
hechos
Error 5: Utilizar llaves operacionales para enlazar las
tablas dimensionales a una tabla de hechos
Usar llave creada especialmente para identificar cada
elemento de la tabla dimensional
Error 6: Solucionar todos los problemas de rendimiento
de las consultas, agregando ms hardware
Error 7: Ignorar la necesidad de seguir los cambios en los
atributos de las dimensiones
36
Errores en modelado dimensional: Top ten
Error 8: Separar jerarquas y niveles jerrquicos en
mltiples dimensiones
Error 9: Limitar los atributos descriptivos verbosos en las
dimensiones para ahorrar espacio
Constituyen la interfaz del usuario para recorrer,
restringir, filtrar o Agrupar
Contenido de los encabezados de filas y columnas en
los reportes finales
37
Errores en modelado dimensional: Top ten
Error 10: Colocar atributos de texto usados para restringir
y agrupar en una tabla de hechos
Tabla de hechos: medidas numricas del proceso de
negocio
Tabla de dimensiones: atributos de textos que
describen el contexto de la medicin
38
Errores en modelado dimensional: Top ten