Está en la página 1de 30

CIN-IN26

Inteligencia de Negocios
1er Semestre 2022

prof. Alfredo Bolt


Clase 3:
Data Warehouse
Diferentes mundos de información
Uno de los activos más importantes de una organización es la
información
• Este activo es resguardado de al menos dos maneras:
Sistemas
operacionales
transaccionales Usuarios
(ej: ERP, CRM, Ingreso de datos
SCM…)
ETL

Extracción de Analistas
datos
Data Warehouse
(DW)
Diferentes mundos de información
Los usuarios de un sistema operacional son el motor de la
organización.
• Ingresan datos al sistema:
• toman pedidos, ingresan nuevos usuarios, registran quejas, despachan camiones, etc.

Los usuarios normalmente trabajan con un registro a la vez


Trabajan repetidamente realizando las mismas tareas operacionales
una y otra vez.
• Proceso de Negocio
Diferentes mundos de información
Los analistas observan cómo funciona el motor de la organización
• Extraen información de un Data Warehouse:
• cuentan las nuevas órdenes y las comparan con las de la última semana, preguntan por
qué ingresaron nuevos clientes y cuáles eran sus quejas, revisan el nivel de
cumplimiento de órdenes, despachos, etc.

Los analistas casi nunca trabajan con un registro a la vez


• Frecuentemente sus consultas requieren que cientos o miles de registros
sean buscados y comprimidos a un conjunto de respuestas.
Y para complicarlo mas, los analistas continuamente cambian el tipo de
consultas que hacen.
¿Qué es un Data Warehouse (DW)?
• Oracle:
• Un sistema de data warehouse es un tipo de sistema de administración de datos que
está diseñado para habilitar y respaldar actividades de BI (especialmente análisis)
• Los data warehouse están destinados únicamente a realizar consultas y análisis y, a
menudo, contienen grandes cantidades de datos históricos
• Un data warehouse centraliza y consolida grandes cantidades de datos de múltiples
fuentes, como archivos de registro de aplicaciones y sistemas operacionales
transaccionales
• Con el tiempo, en el data warehouse se crea un crea un registro histórico que puede
ser invaluable para los científicos de datos y analistas de negocios.
• Debido a estas capacidades, un data warehouse puede considerarse la
"única fuente de la verdad" de una organización.
¿Qué es un Data Warehouse (DW)?
Es una base de datos centralizada que contiene información histórica y
consolidada de la operación de las organizaciones

La función del Data Warehouse es el almacenamiento pero a veces se habla de


“Sistemas de Data Warehouse” para referirse no sólo al almacén de datos si no que
a las herramientas de staging, integración, y acceso y las herramientas de
Inteligencia de Negocios (reportes, Data Mining, tableros, cubos, etc).
¿Qué es un Data Mart (DM)?
Son subconjuntos de datos del DW enfocados en un tema o un área de
negocio especifico:
• Ventas
• Despachos
• Producción
• Reclamos
• Etc.

|DM|<<|DW|
Contexto de un DW
Corrientes de DW

Ralph Kimball Bill Inmon


• Enfoque dimensional, el DW debe ser • Enfoque normalizado, los datos en un DW son
modelado dimensionalmente o con un almacenados siguiendo reglas de
esquema estrella normalización en un modelo E-R
• Los datos transaccionales son particionados • Las tablas se agrupan por temas , los datos se
en “hechos” o “dimensiones” separan en entidades que crean diversas
tablas en una base de datos relacional
• Es un modelo más simple de comprender y
usar • Resulta en muchas tablas unidas por una red
• La recuperación de datos es veloz de uniones
• Es complejo de cargar con datos de • Es muy simple agregar nueva información
diferentes sistemas operacionales • Dado el alto número de tablas dificulta unir
diferentes fuentes hacia información útil
• Es difícil modificar su estructura
• Es difícil accesar información sin entender el
modelo
Corrientes de DW

Ralph Kimball Bill Inmon


• Diseño bottom-up • Diseño top-down
• Se crean primero los data marts para proveer • Las tablas se agrupan por temas , los datos se
de reportería y capacidades analíticas a separan en entidades que crean diversas
procesos de negocio específicos tablas en una base de datos relacional.
• Los Data Marts tienen principalmente hechos • Es un gran repositorio central con la
y dimensiones. Cada uno modela un área información de la empresa completa.
específica del negocio • El DW contiene los datos atómicos. Se crean
• Los Data Marts se integrados en una Data Marts a partir del DW.
colección de dimensiones conformadas. • El DW es orientado a temas, es no volátil, es
• El DW termina siendo segmentado en un integrado y varía en el tiempo.
conjunto de data marts consistentes y
autocontenidos. • Representa un proyecto muy amplio y de
largo alcance.
• Se obtienen resultados en etapas tempranas.
Objetivo de un DW
• Los objetivos de un DW se pueden definir caminando por los pasillos
de cualquier organización:
• “Tenemos montones de datos en esta compañía pero no tenemos acceso a
ellos”.
• “Necesitamos cortarlos y combinarlos (slice and dice)”
• “La gente de negocio necesita llegar directamente a los datos”
• “Sólo necesito ver lo importante”
• “Me molesta cuando dos personas en una reunión presentan las mismas
métricas del negocio con números diferentes”
Lo que debe cumplir un DW
• El DW debe hacer que la información de la organización sea facilmente
accesible.
• El contenido debe ser entendible, los datos deben ser intuitivos y obvios para el
usuario de negocio. Las herramientas para acceder al DW deben ser simples y
permitirle al usuario realizar todas las combinaciones que desee y responder muy
rápidamente.
• El DW debe presentar la información de la organización de forma
consistente.
• Los datos deben ser confiables, cuidadosamente compuestos desde una variedad de
fuentes, limpiados, revisados.
• El DW debe ser adaptativo y resiliente
• Los cambios en el DW deben incorporarse sin impacto en los datos existentes y las
aplicaciones.
Lo que debe cumplir un DW
• El DW debe resguardar la información
• Debe controlar el acceso a los datos de manera efectiva. Son datos
generalmente confidenciales.
• El DW debe servir como la base para la mejora en la toma de
decisiones.
• La efectividad de un DW (su output) se mide en las decisiones que se toman
en base a la evidencia que éste entrega.
• Debe contener los datos correctos para esto
• El DW debe ser aceptado por el negocio
• Si los usuarios de negocio no lo usan activamente, es un fracaso.
• Debe ser intuitivo y fácil de usar
Modelamiento Dimensional
Modelamiento Dimensional
• Tabla de Hechos: Es la tabla principal del modelo donde se almacenan
las métricas numéricas de desempeño.
• Las métricas (KPI) solo se almacenan aquí.
• Se usa la palabra “hecho” para representar la ejecución de una actividad del
negocio.
• Una venta
• Un despacho
• Etc.
• Un “hecho” corresponde a un registro (fila) de a tabla
• Las métricas más útiles son numéricas y aditivas (para OLAP)*
• Las tablas de hechos tiene una relación 1:N con las tablas
dimensionales
Modelamiento dimensional
• Tabla de Hechos: Un ejemplo
Modelamiento dimensional
• Tablas de Dimensiones: Acompañan a la tabla de hechos y le dan el
contexto a la información
• Describen hechos detalladamente desde una dimensión particular:
• Tiempo, Producto, Cliente, etc.
• Normalmente tienen muchos atributos:
• Tiempo: (día, mes, año, hora, minuto, segundo, trimestre, día de semana, etc.)
• Producto: (SKU, precio unitario, tipo, tamaño, categoría, etc.)
• Cliente: (Nombre, Rut, teléfono, dirección, edad, categoría, vip, etc.)
Modelamiento dimensional
• Tablas de Dimensiones: Acompañan a la tabla de hechos y le dan el
contexto a la información
• Los atributos de las tablas de dimensiones son cruciales para los DW
• Usar nombres auto-explicativos y verbosos, poblarlos con valores y asegurar su calidad.
• Se usarán para el Cruce de datos (para OLAP)*
• Las tablas de dimensiones son los puntos de entrada a la tabla de hechos.
• Si sus atributos son robustos, permiten análisis robustos.
• Los mejores atributos son textuales y discretos.
Modelamiento dimensional
• Tablas de Dimensiones : un ejemplo
Estructuras de Modelos
Dimensionales
• Modelo Estrella
• Modelo Copo de Nieve (Snowflake)
Estructuras de Modelos
Dimensionales
• Modelo Estrella
• Modelo Copo de Nieve (Snowflake)
Esquemas de
Modelos Dimensionales
• Modelo Estrella
• Modelo Copo de Nieve (Snowflake)
Ventas: Esquema Estrella
Ventas: Esquema Copo de
Nieve
¿Que Esquema elegir?
• El esquema de estrella es más rápido y simple, y debiera ser escogido
para herramientas de consulta que exponen bastante a los usuarios a
las estructuras de tablas subyacentes, y en ambientes donde la
mayoría de las consultas son de naturaleza simple
• El esquema de copo de nieve es generalmente mejor con
herramientas de consulta más sofisticadas y para ambientes que
tienen muchas consultas con criterios complejos
Modelamiento Dimensional:
Ventas de Retail
Modelamiento Dimensional:
Inventarios
Modelamiento dimensional

• Otros:
• Adquisiciones
• Gestión de ordenes
• Gestión de clientes
• Contabilidad
• Servicios financieros
• Telecomunicaciones
• Recursos humanos
• Educación
• Seguros
• etc
• En general, cada área tiene tablas de hechos distintas, pero varias
dimensiones en común

También podría gustarte