Está en la página 1de 33

Inteligencia de Negocios

CLASE 02: DISEÑO Y ARQUITECTURA DE BI

Docente: Mg. Miguel Casma Salcedo


Fuentes de Información Datawarehouse/Datamart

Base de Datos Datawarehouse/


Transaccional ETL
Datamart

SSIS

Prof. Mg. Miguel Casma Salcedo


Las Bases de Datos son creadas específicamente para dar soporte a las
decisiones.
La información es extraída desde los sistemas bases y/o externo,
transformada e integrada.
El DWH es un sistema que permite almacenar datos ordenadamente en el
servidor de una empresa, ya sea on-premise o cloud.

DWH

Prof. Mg. Miguel Casma Salcedo


Ejemplos del uso de DWH en distintos sectores
1) DWH en el sector de telecomunicaciones
El mundo de las telecomunicaciones es extremadamente dinámico y competitivo. Por esta razón, las
organizaciones recurren a herramientas que les permitan estudiar su productividad interna, el mercado,
sus cambios y comportamientos frente a las nuevas tecnologías.

Por lo tanto, las empresas de telecomunicaciones utilizan data warehouses para almacenar los datos de
millones de clientes. Esto implica el respaldo de facturas, servicios utilizados, registros de llamadas
realizadas, equipos vendidos, entre otros. Toda esta información es de gran utilidad para actividades
como:
✓ El diseño de estrategias de marketing
✓ Las auditorías en el área de operaciones
✓ Los análisis sobre la prestación de los servicios
✓ Las previsiones de riesgos de fuga de clientes y demás

Fuente: https://blog.mdcloud.es/dwh-ejemplos-arquitectura-data-warehouse/

Prof. Mg. Miguel Casma Salcedo


Ejemplos del uso de DWH en distintos sectores
2) DWH en el sector de consumo masivo
Las empresas de consumo masivo implementan el data warehousing para mantener su competitividad
en el mercado. De esta forma pueden predecir, por ejemplo, la cantidad de producción que necesitarán
para satisfacer la demanda en un rango de tiempo determinado.

Las cadenas minoristas también pueden compartir ciertos accesos de sus data warehouses con sus
proveedores. Esto les dará a los fabricantes información relacionada con el suministro de productos y la
venta de los mismos al consumidor final.

Todo este proceso permite coordinar la gestión entre los productores y las tiendas, además de acceder a
datos determinantes para la elaboración de campañas de marketing.

Fuente: https://blog.mdcloud.es/dwh-ejemplos-arquitectura-data-warehouse/

Prof. Mg. Miguel Casma Salcedo


Ejemplos del uso de DWH en distintos sectores
3) DWH en el sector de transporte

Tanto en el sector de viajes como en el de distribución, el uso del DWH es una excelente herramienta
para almacenar información de los clientes, destinos más frecuentados, administración de transportes
de carga, seguimiento del equipaje, entre otros.

Datos como las reservas de viaje a un determinado destino, o los tiempos de entrega de los pedidos,
permitirán desarrollar análisis para la creación de promociones o para diagnósticos de los procesos
logísticos de la organización

Fuente: https://blog.mdcloud.es/dwh-ejemplos-arquitectura-data-warehouse/

Prof. Mg. Miguel Casma Salcedo


Ejemplo: DATAWAREHOUSE DE UN BANCO
Mapa de Procesos del Banco DataWarehouse Bancario

Soporte a la Toma de decisiones

Se realiza un análisis global de los datos a nivel corporativo

Prof. Mg. Miguel Casma Salcedo


Ejemplo: Diseño Físico de Datawarehouse

Datawarehouse

Prof. Mg. Miguel Casma Salcedo


ARQUITECTURA DE UN DWH

OLAP
Fuentes Server
externas Adquisición de Extracción de
datos datos OLAP

Consultas/
Reportes
Consultas y
Integración Datos análisis de datos
de Datos
(ETL)
Warehouse Dashboard

Metadata Minería
de datos
Fuentes Supervisión
internas Administración

Construcción y
mantenimiento
Prof. Mg. Miguel Casma Salcedo
Arquitectura de DW

Características del DW
Orientado a temas.- Los datos en la base de datos están organizados de manera que todos los
elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre sí.
Integrado.- La base de datos contiene los datos de todos los sistemas operacionales de la
organización, y dichos datos deben ser consistentes.
No volátil.- La información no se modifica ni se elimina, una vez almacenado un dato, éste se
convierte en información de sólo lectura, y se mantiene para futuras consultas.
Variante en el tiempo.- Los cambios producidos en los datos a lo largo del tiempo quedan registrados
para que los informes que se puedan generar reflejen esas variaciones.

Prof. Mg. Miguel Casma Salcedo


Un Datamart es una base de datos que consolida información relevante
de un departamento/proceso de la empresa o una determinada línea de
negocio para la toma de decisiones, ejm. Ventas, Compras, Operaciones.

Tipos:

DataMart dependiente DataMart independiente

Prof. Mg. Miguel Casma Salcedo


Ejemplo DataMart (independiente)
Cubo Multidimensional

Proceso de
Ventas

Diseño Físico
DataMart (B.D.)

Prof. Mg. Miguel Casma Salcedo


TICKET DE VENTA

N° Ticket 99999
Fecha: dd/mm/aaaa
Código Cajero: 999 nnnnnnnnnn
Código Supermercado: 999 local
Detalle venta

Descripción Unidad Cantidad Precio Total

IGV
Forma de pago ffffffffff Total venta

Prof. Mg. Miguel Casma Salcedo


Análisis Funcional: Representación de variables y métricas
Dimensiones (variables)

Tiempo
Semana
Mes
Año Supervisor Vendedor
Medidas Vendedor

Ventas Soles Empresa Sucursal


Ventas dólares Zona Sector
Ventas unidades Zona
Tipo Cliente
Cliente
Categoría

Producto Cliente
Tipo
Producto
Forma de
pago
Tabla Dimensional
✓ Contienen entidades del negocio.
✓ Utiliza terminología del negocio.
✓ Poseen datos descriptivos.
✓ Pueden contener subniveles.
Ejemplo de Dimensiones

• Cliente. • Contrato.
• Almacén. • Vendedor.
• Producto. • Cuenta.
• Servicio. • Estatus.
• Empleado. • Ubicación.
• Partes. • Tiempo.
Tabla de Hechos

✓ Contiene información a medir relacionadas con los procesos o


eventos que son analizados por las dimensiones contenidas en las
tablas de dimensiones.
✓ Cada Hecho es un Evento
✓ La información que contiene es un evento ocurrido.
✓ Permite definir la relación entre dos o más dimensiones.
✓ Son usualmente más grandes que las tablas de Dimensiones.
Ejemplo de hechos

▪ Ventas. ▪ Nivel de Inventario.


▪ Ordenes. ▪ Balance Contable.
▪ Envíos. ▪ Chequeo de Txs.
▪ Txs ATM.
▪ Cuentas.
▪ Suscripciones
▪ Reservaciones
▪ Atenciones.
▪ Rentas.
Ejercicio: elaborar un modelo dimensional

a. El área de tarjetas de crédito de un banco desea implementar un datamart. Se


desea visualizar la información de créditos concedidos y pagos hasta llegar a cada
tarjeta.
b. Las tarjetas pueden ser de dos tipos: “VISA” y “MASTERCARD”. También se desea
visualizar los créditos y pagos por cada vendedor y cada cliente.
c. Cada cliente pertenece a un distrito, cada distrito a una provincia y cada provincia a
un departamento.
d. Cada vendedor pertenece a una agencia, y cada agencia pertenece a un distrito,
cada distrito a una provincia y cada provincia a un departamento.
e. Las métricas deben visualizarse como totalizados anuales, semestrales, trimestrales
y mensuales.
Solución

Dimensiones
a. Cliente
b. Vendedor
c. Tipo Tarjeta
d. Tiempo

Medidas
a. Créditos concedidos
b. Pagos
MODELO ESTRELLA

VENDEDOR_DIM
TIEMPO_DIM

Vendedor_Key
TARJETAS_FACT Tiempo_Key
IdVendedor
Año
Departamento Tiempo_Key Semestre
Provincia
Trimestre
Vendedor_Key
Distrito
Mes
Cliente_Key
Agencia

NombreVendedor TipoTarjeta_Key

CreditosConcedidos
CLIENTE_DIM
TIPOTARJETA_DIM Pagos

Cliente_Key
TipoTarjeta_Key
IdCliente
IdTipoTarjeta
Departamento
TipoTarjeta
Provincia
NumeroTarjeta
Distrito
NombreCliente
Modelo de Jerarquía
➢Dimensión Cliente ➢ Dimensión Tipo Tarjeta
. Departamento . Tipo Tarjeta
.. Provincia
.. Nro. Tarjeta
… Distrito
…. Nombre cliente

➢Dimensión Vendedor ➢ Dimensión Tiempo


. Departamento . Año
.. Provincia .. Semestre
… Distrito
… Trimestre
…. Agencia
….. Nombre Vendedor …. Mes
¿QUÉ ES LA GRANULARIDAD?
La granularidad:
◦ Es el nivel de detalle al que se desea almacenar información sobre la actividad a modelar.
◦ Define el nivel atómico de datos en el almacén de datos.
◦ Determina el significado de las tuplas de la tabla de hechos.
Por ejemplo en la dimensión Sucursal:

Prof. Mg. Miguel Casma Salcedo


Granularidad
Ejemplo de la dimensión tiempo. Se desea los datos por:
◦ Información anual
◦ Información semestral
◦ Información trimestral
◦ Información mensual. .... + granularidad
◦ Información semanal + detalle
◦ Información diaria

Prof. Mg. Miguel Casma Salcedo


¿Qué es un Modelo Estrella
Es un Modelo desnormalizado de base de datos relacional para representar datos
de forma multidimensional.
Es la forma más simple de un esquema de Data Warehouse, la misma que
contiene una o más dimensiones y tablas de hechos.
El Centro de la estrella consiste en una tabla de hechos grande que está conectada
a las tablas dimensionales en base a las relaciones.
Las ventajas del Modelo Estrella son:
◦ Fácil entendimiento de los datos
◦ Alto rendimiento (Performance)
MODELO ESTRELLA (ejemplo)
Dimensión Tiempo Dimensión Producto
Tiempo_Id (FK) Fact Table Ventas Producto_Id (FK)
Dia_semana Codigo_producto
Tiempo_Id (FK)
Numero_semana Descripcion_producto
Almacen_Id (FK)
Mes Marca
Producto_Id (FK)
Categoria
Promocion_Id (FK)
Dimensión Almacén Dolares
Dimensión Promoción
Almacen_Id (FK) Unidades
Costos Promocion_Id (FK)
Codigo_almacen
Nombre_almacen Nombre_promocion
Distrito Tipo_promocion
Region
Modelo estrella y su almacenamiento de datos
Dimensión Tiempo Dimensión Producto
Tiempo_Id (FK) Fact Table Ventas Producto_Id (FK)
Año Producto
Tiempo_Id (FK)
Mes Línea
Producto_Id (FK)
Día Familia
Cliente_Id (FK)
Tiempo_Id Año Mes Día Monto US$ Producto_Id Familia Línea Producto
25 2018 Setiembre 11
Monto S/. 106 Gaseosa Plástico Coca Cola 1/2 L

Unidades
Dimensión Cliente
tiempo_Id Cliente_Id Producto_Id Monto US$
25 15 106 72.5
Cliente_Id (FK)
Cliente
Tipo Cliente

Cliente_Id Tipo Cliente Cliente


15 Persona Nat. Miguel Casma
MODELO COPO DE NIEVE
Producto_Id (FK) Fact Table
Codigo_producto Producto_Id (FK)
Descripcíon_producto
Marca_comercial
Categoria_comercial
Tamaño
Sabor

Marca_comercial_Id (FK) Producto_Id (FK) Fact Table


Marca_comercial Codigo_producto Producto_Id (FK)
Categoria_comercial Descripcíon_producto
Marca_comercial_Id
Tamaño
Sabor
EJEMPLO MODELO ESTRELLA REPORTE Dimensión Producto
Dimensión Tiempo
Producto_id
Tiempo_id Fact Table Ventas ___________________
___________________ Código_producto
Día_semama Tiempo_Id (FK) Descripción-producto
Número_semana Almacén_id(FK) Marca
Mes Producto_id(FK) Categoría
Promoción_id(FK)
___________________
Dólares
Dimensión Almacén Unidades
Costo Dimensión Promoción
Almacén_id
___________________ Promoción_id
Código almacén ___________________
Nombre_almacén Nombre_promoción
Distrito Tipo_promoción
Región

Distrito Marca Total Dólares Total Costo Utilidad


Atherton Clean Fast $ 1,233 $ 1,058 $ 175
CONSULTA
Atherton More Power $ 2,239 $ 2,200 $ 39
REPORTE
Atherton Zippy $ 848 $ 650 $ 198
Belmont Clean Fast $ 2,097 $ 1,848 $ 249
INTEGRANDO MODELOS ESTRELLA
Zona

Cód.zona: VARCHAR2(4)
Tiempo
___________________ Fact .Ventas Cód.tiempo: VARCHAR2(10)
Zona: VARCHAR2(40) ___________________
Cód.producto: VARCHAR2(20) Año: NUMBER (4)
Cód.zona: VARCHAR2(4) Trimestre: NUMBER(2)
Condición pago Cód.pago: VARCHAR2(4) Mes. VARCHAR2(20)
Cód.pago: VARCHAR2(4) Cód.doc: VARCHAR2(12) Día: NUMBER (2)
___________________ Cód.vendedor: VARCHAR2(4)
Cód.clientes: VARCHAR2(8) Clientes
Descripción: VARCHAR2(40)
Días Neto: NUMBER (6) Cód.tiempo: VARCHAR2(10)
Cód.clientes: VARCHAR2(8)
___________________
___________________
Documento Venta Local: NUMBER(15,4)
Categoría: VARCHAR2(40)
Venta dólar: NUMBER(15,4)
Nombre: VARCHAR(80)
Cód.doc: VARCHAR2(12) Costo Local: NUMBER(15,4)
Tipo: VARCHAR2(3) Costo dólar: NUMBER(15,4)
Vendedor
___________________ Cantidad: NUMBER(15,4)
Descripción: VARCHAR2(40) Devolución: NUMBER(15,4) Cód.vendedor : VARCHAR2(4)
Diferencia favor local: NUMBER(15,4) ___________________
Diferencia favor dólar: NUMBER(15,4) Grupo: VARCHAR2(40)
Producto Diferencia contra local: NUMBER(15,4) Nom. vendedor: VARCHAR2(40)
Diferencia favor dólar: NUMBER(15,4)
Cód.doc: VARCHAR2(20)
___________________
Familia: VARCHAR2(40) Fact .Cobranzas
Línea: VARCHAR2(40)
Articulo: VARCHAR2(50) Cód.clientes: VARCHAR2(8)
Fecha de Vencimiento: DATE Cód.tiempo: VARCHAR2(10)
Cód.vendedor: VARCHAR2(4)
___________________
Cobranza dólar NUMBER (15,4)
Ejercicio: Diseñar el Modelo Multidimensional
a) Un cliente solicita un SOAT en una Agencia Bancaria.
b) El gestor del área de ventas de la Agencia, entrega la información y tarifa del SOAT. Sí el
Cliente esta interesado debe sacar copia de su DNI y Tarjeta de propiedad del vehículo,
también llena el formulario “venta de SOAT”. Luego el cliente se dirige a la ventanilla a
realizar el pago.
c) En la ventanilla el cliente realiza el pago y el operador registra el pago del SOAT en el
sistema “CoreBank” y entrega el voucher al cliente, quién debe retornar al área de ventas de
la agencia para que el gestor registre los datos del vehículo y el pago realizado en el sistema
“SoatSis”, por este sistema se imprime el certificado SOAT y póliza.
d) El cliente firma la póliza, el gestor de ventas entrega el original y una copia se archiva en la
agencia.

Prof. Mg. Miguel Casma Salcedo


Preguntas
1. ¿Qué es un Datamart?
2. ¿Características de DW?
3. ¿Qué es un DM dependiente?
4. ¿qué es un modelo estrella?
5. Método para elaborar un modelo estrella, ej. Sector minero).

Prof. Mg. Miguel Casma Salcedo


Gracias
por su
atención

Prof. Mg. Miguel Casma Salcedo

También podría gustarte