Está en la página 1de 43

Facultad de Ingeniería Industrial y Sistemas

Taller de Base de Datos

Sesión 04

Dr. Iván Carlo Petrlik Azabache


Universidad Nacional
Federico Villarreal

Temario

Metodología Hefesto para el diseño de un Data WareHouse.


Universidad Nacional
Federico Villarreal
Universidad Nacional
Federico Villarreal

Metodologías de Data Warehouse

Un Data Warehouse es un
sistema que sirve para
recopilar, administrar datos
de diversas fuentes, analizar
y conectar los datos
empresariales. Siendo el
núcleo del sistema
de Business
Intelligence para el análisis
de una grandes cantidades
de información, la creación
de reportes para consultas y
toma de decisiones.
Universidad Nacional
Federico Villarreal

Metodología de Ralph Kimball


Al diseñar una solución de Data
Warehouse, las organizaciones
se topan con distintas
metodologías a seguir, cada una
con sus ventajas. Así como
ciertas características
limitantes. Las cuales se
deberán evaluar para
seleccionar la que mejor se
adapte a los requisitos del
proyecto y la organización.
Las metodologías más
discutidas y principales suelen
ser las diseñadas por Ralph
Kimball, Bill Inmon
Universidad Nacional
Federico Villarreal

Metodología de Ralph Kimball


 Esta metodología mantiene un diseño ascendente. Por lo que los Data
Marts son los primeros en crearse y después se integran al Data
Warehouse, donde se busca que el almacenamiento de datos de los
usuarios se ejecute de la forma más rápida posible.
Según Kimball, un Data Warehouse es la copia de los datos transaccionales
específicamente estructurados para consultas analíticas e informes, con el
fin de apoyar la toma de decisiones. Con esta metodología, al crear primero
los Data Marts se proporcionan capacidades analíticas de informes para
procesos específicos de negocio y funcionales.
Universidad Nacional
Federico Villarreal

Metodología de Ralph Kimball

Principales Ventajas:
• No requiere un equipo muy grande de desarrolladores y arquitectos de
datos para mantener el Data Warehouse (menor costo).
• Brinda buena funcionalidad y seguimiento de las métricas o KPI´s, orienta
los Data Marts a informes en cuanto a procesos de departamento o de
negocios.
• Administración mas “simplificada” al estar concentrado en los procesos y
las áreas individuales en vez de toda la organización.
• La optimización de consultas es sencilla, predecible y controlable.
Universidad Nacional
Federico Villarreal

La metodología de Kimball, propone crear una matriz de negocio que contenga los elementos
comunes que son utilizados por los Data Marts, como conformed-shared, dimensión,
measures, etc., teniendo esta información, el usuario puede desarrollar soluciones que apoyen
el análisis a través de los procesos de negocio para la venta cruzada.
Universidad Nacional
Federico Villarreal

Metodología de Bill Innon

La metodología relacional
de Bill Inmon muestra un
diseño descendente, donde
se construye primero
el Data Warehouse y
posteriormente los Data
Marts. Ubicando el Data
Warehouse en el centro de
la información corporativa
lo que asegura un marco
lógico en los datos.
Universidad Nacional
Federico Villarreal

Metodología de Bill Innon

Crea una estructura de


entidades procurando que no
se repitan datos. Este modelo
crea una única fuente de
verdad para todo el negocio.
La carga de datos se vuelve
menos compleja debido a la
estructura normalizada del
modelo. Sin embargo, el uso
de esta disposición para
realizar consultas, es
complicado; ya que incluye
gran cantidad de tablas y
vínculos.
Universidad Nacional
Federico Villarreal

Metodología de Bill Innon

Este modelo propone la


construcción de Data
Marts por separado para cada
departamento. Todos los
datos que entran en el Data
Warehouse están integrados
para garantizar la integridad y
la coherencia en toda la
empresa. Actuando el Data
Warehouse como el único
origen de datos.
Universidad Nacional
Federico Villarreal

Metodología de Bill Innon


Principales Ventajas:
El Data Warehouse proporciona una
única versión de la verdad, al ser el
único origen de datos para los Data
Marts.
Tiene una mayor facilidad de
comprensión de los procesos
empresariales para los usuarios, ya
que el modelo lógico representa
entidades empresariales detalladas.
Resulta más fácil y menos propenso
al fracaso el proceso de ETL, puesto
que en la actualización de los datos
y las anomalías se evitan al contar
con una redundancia muy baja.
Mayor flexibilidad a cambios por
necesidades analíticas, de negocio
y/o por fuentes de datos.
Universidad Nacional
Federico Villarreal

Metodología de Bill Innon


Universidad Nacional
Federico Villarreal

Diferencias entre metodologías


Universidad Nacional
Federico Villarreal

Diferencias entre metodologías


Universidad Nacional
Federico Villarreal

Diferencias entre metodologías


Universidad Nacional
Federico Villarreal

Diferencias entre metodologías


Universidad Nacional
Federico Villarreal

¿Qué metodología de Data Warehouse debo usar en mi proyecto?

Debido a sus diferencias, una metodología en especifico pueden


generar mejor costo-beneficio para ciertas áreas de negocio,
adicionalmente dependerá de los requerimientos del proyecto y
necesidades del mismo para determinar la mejor alternativa.
No obstante y sin ser una regla como tal, se mencionan a
continuación algunos escenarios donde una metodología puede
tener mejor beneficio según el giro, proyecto, enfoque y tamaño.
Universidad Nacional
Federico Villarreal

¿Qué metodología de Data Warehouse debo usar en mi


proyecto?

Ralph Kimball
Comercial: es un modelo que tiene similitudes entre diversas giros
de negocio, el cual es muy común que se diseñe con la metodología
Multidimensional.
Marketing: al ser un área o departamento especializado, no requiere
de elementos como inventario, almacenaje, logística, etc. Y no
necesita regularmente involucrar otras áreas más interrelacionadas.
Se recomienda en escenarios y modelos donde no se necesita
profundizar a un nivel de detalle transaccional y cuando no es
necesario vincular todas las áreas y procesos.
Universidad Nacional
Federico Villarreal

¿Qué metodología de Data Warehouse debo usar en mi


proyecto?

Bill Inmon
Aseguradoras: al requerir un mayor detalle a nivel clientes
individuales, grupos, historiales de quejas, tendencias,
demográficos, psicográficos, rentabilidad, etc. Llega a necesitar
integrar elementos y aspectos que se encuentran muy
interrelacionados.
Manufactura / Cadena de Suministro: el proceso de producción
conlleva la participación de múltiples funciones, trabajos y acciones
diferentes sujetas a una misma cadena o sistema. Precisa de un
modelo más integrado.
Bancos: para el escenario en donde existe una vinculación de todos
los procesos, divisiones del banco y profundizar a un gran nivel de
detalle.
Universidad Nacional
Federico Villarreal

Metodologías HEFESTO
Conceptos Generales

La metodología HEFESTO, que permite la construcción de Data Warehouse de


forma sencilla, ordenada e intuitiva. Su nombre fue inspirado en el dios griego de
la construcción y el fuego, y su logotipo es el siguiente:

HEFESTO es una metodología propia, cuya propuesta está fundamentada en una


muy amplia investigación, comparación de metodologías existentes, experiencias
propias en procesos de confección de almacenes de datos. Cabe destacar que
HEFESTO está en continua evolución, y se han tenido en cuenta, como gran valor
agregado, todos los feedbacks que han aportado quienes han utilizado esta
metodología en diversos países y con diversos fines.
Universidad Nacional
Federico Villarreal

Metodologías HEFESTO
Arquitectura
Universidad Nacional
Federico Villarreal

Proceso de la Metodologías HEFESTO

PROCESO

MODELO CONCEPTUAL MODELO CONCEPTUAL AMPLIADO MODELO LÓGICO DEL DW


Universidad Nacional
Federico Villarreal

Objetivo de hoy es el Modelo Conceptual


Universidad Nacional
Federico Villarreal

Metodologías HEFESTO
Análisis de Requerimientos
Universidad Nacional
Federico Villarreal

Metodologías HEFESTO
a) Identificar preguntas
Universidad Nacional
Federico Villarreal

Metodologías HEFESTO
a) Identificar preguntas
Universidad Nacional
Federico Villarreal

Metodologías Hefesto

B) Identificar indicadores y perspectivas


Universidad Nacional
Federico Villarreal

Metodologías Hefesto

CASO PRACTICO
Universidad Nacional
Federico Villarreal

Metodologías Hefesto

C) Modelo conceptual
Universidad Nacional
Federico Villarreal

Metodologías Hefesto

C) Modelo conceptual
Universidad Nacional
Federico Villarreal

Caso estudio
El equipo de Ingenieros de
Sistemas desea construir
un Data WareHouse (Data
Mart ) , aplicando la
Metodología Hefesto de las
cuales al ejecutar la
primera fase de Análisis
de Requerimiento me
permitió hacer una
indagación hacia los
usuarios de la Empresa a
través de una serie de
técnicas de levantamiento
de información.
Universidad Nacional
Federico Villarreal

Análisis de Requerimientos
Universidad Nacional
Federico Villarreal

Caso estudio
Proceso
Estas técnicas me permitieron venta
determinar al proceso de ventas
centrado en las necesidades de
información para la respectiva toma de
decisiones por pate de la alta
dirección para la construcción del Data
wareHouse. Adicionalmente se
identifico sus indicadores y Toma de
perspectivas. decisiones

Se les preguntó cuáles eran según


Indicadores Perspectiva
ellos, los indicadores que representan
de mejor modo el proceso de Ventas y
qué sería exactamente lo que se
desea analizar del mismo. La
respuesta obtenida, fue que se deben
tener en cuenta y consultar datos
sobre la cantidad de unidades
vendidas y el monto total de ventas. Cantidad de unidades Monto total de
vendidas venta
Universidad Nacional
Federico Villarreal

Caso estudio
a.- Identificar preguntas
Luego se les preguntó cuáles serían las perspectivas que me permitirán realizar las consultas a los
respectivos indicadores que se han identificado.
A continuación, vamos a presentarles las preguntas que se han identificado.

Primera pregunta identificada


¿ Cuantas unidades de cada producto fueron
vendidas a sus clientes en un periodo
determinado ?

Segunda pregunta identificada

¿Cuál fue el monto total de ventas de productos


a cada cliente en un periodo determinado ?
Universidad Nacional
Federico Villarreal

a.- Identificar preguntas


Caso estudio
Para entenderlo mejor las preguntas se colocarán en una simple oración :

Primera pregunta identificada


¿ Cuantas unidades de cada producto Unidades vendidas de cada
fueron vendidas a sus clientes en un producto a cada cliente en un
periodo determinado ? tiempo determinado

Segunda pregunta identificada


¿Cuál fue el monto total de ventas de Monto total de ventas de cada
productos a cada cliente en un producto a cada cliente en un
periodo determinado ? tiempo determinado

36
Universidad Nacional
Federico Villarreal

Caso estudio
Necesidades de
información expuestas Estrategias
Unidades vendidas de
cada producto a cada
Que este acorde
cliente en un tiempo
determinado Objetivos
Monto total de ventas
de cada producto a
cada cliente en un Analizar el Lograr obtener una
tiempo determinado comporta ventaja competitiva
Permitirá
miento de y maximizar las
los clientes ganancias.
Proporciona

Toma de
Ámbito Para la
decisiones

37
Universidad Nacional
Federico Villarreal

b.- Identificar indicadores y perspectivas de


análisis
Indicadores

Preguntas claves
descomposición
identificadas

Perspectivas

Numéricos y representan saldos, promedios,


Indicadores lo que se desea analizar cantidades, sumatorias,
concretamente fórmulas,

Objetos mediante los clientes, proveedores,


Perspectivas cuales se quiere examinar sucursales, países,
los indicadores productos, rubros
Universidad Nacional
Federico Villarreal

b.- Identificar indicadores y perspectivas de


análisis
Se analizarán las preguntas obtenidas en el paso anterior y se detallarán cuáles
son sus respectivos indicadores y perspectivas.

En síntesis, los indicadores son :


 Unidades vendidas.
 Monto total de ventas.

Y las perspectivas de análisis son :


 Clientes.
 Productos.
 Tiempo.
Universidad Nacional
Federico Villarreal

C.- Modelo conceptual


En esta etapa , se construirá un
modelo conceptual a partir de los
indicadores y perspectivas obtenidas.
Perspectiva 1 Indicador 1
A través de este modelo , se podrá
observar con claridad cuales son los
alcances del proyecto, para luego Perspectiva 2 Relación Indicador 2
poder trabajar sobre ellos, además
al poseer un alto nivel de definición
de los datos, permite que pueda ser Perspectiva 3 Indicador 3
presentado ante los usuarios y
explicado con facilidad.
La representación grafica del modelo
conceptual es la siguiente :
Universidad Nacional
Federico Villarreal

C.- Modelo conceptual

Unidades
Cliente
vendidas

Producto Venta

Monto total
Tiempo
ventas
Universidad Nacional
Federico Villarreal

Conclusiones
Universidad Nacional
Federico Villarreal

GRACIAS

También podría gustarte