Está en la página 1de 17

Metodologa Hefesto

Catedra: Sistemas de Gestin


5k10
Integrantes: Corrales, Manuel
Mezzabotta, Fernando
Palma, Facundo
Yaez, Rodrigo
HEFESTO es una metodologa propia para la
Construccin de un Data Warehouse:
Caractersticas
Los objetivos y resultados esperados en cada fase se distinguen fcilmente
Se basa en los requerimientos de los usuarios
Reduce la resistencia al cambio
Utiliza modelos conceptuales y lgicos (sencillos de interpretar y analizar)
Es independiente del tipo de ciclo de vida que se emplee
Es independiente de las herramientas que se utilicen para su
implementacin
Es independiente de las estructuras fsicas que contengan el DW y de su
respectiva distribucin
Los resultados obtenidos se convierten en el punto de partida para llevar a
cabo el paso siguiente
Identificar preguntas: identificar los requerimientos de los usuarios a travs de
preguntas que expliciten los objetivos de su organizacin.
Se desea conocer cuntas unidades de cada producto fueron vendidas a sus
clientes en un periodo determinado:
Unidades vendidas de cada producto a cada cliente en un
tiempo determinado.
Se desea conocer cul fue el monto total de ventas de productos a cada cliente
en un periodo determinado:
Monto total de ventas de cada producto a cada cliente en un
tiempo determinado.
Identificar indicadores y perspectivas: se analizarn estas preguntas a fin de
identificar cules sern los indicadores y perspectivas que sern tomadas en
cuenta para la construccin del DW.
Indicadores: son valores numricos y representan lo que se desea
analizar concretamente.
Perspectivas: son los objetos mediante los cuales se quiere examinar
los indicadores, con el fin de responder a las preguntas planteadas.
Modelo Conceptual: se podr observar con claridad cules son los alcances del
proyecto
OLTP (OnLine Transaction Processing): es un tipo de procesamiento que facilita
y administra aplicaciones transaccionales, usualmente para entrada de datos y
recuperacin y procesamiento de transacciones .
Conformar indicadores: explicitar cmo se calcularn los indicadores.
Hechos: Hecho/s que lo componen, con su respectiva frmula de clculo:
h1+h2+h3
Funcin: Funcin de sumarizacin que se utilizar para su agregacin:
SUM, AVG, COUNT
Monto Total de Ventas:
Hechos: (Unidades Vendidas) * (Precio de Venta).
Establecer correspondencias: Examinar los OLTP para identificar las
correspondencias entre el modelo conceptual y las fuentes de datos.

La tabla Productos se relaciona con la perspectiva Productos.

La tabla Clientes con la perspectiva Clientes.

El campo cantidad de la tabla Detalles_Venta con el indicador Unidades


Vendidas.
Nivel de granularidad: Se deben seleccionar los campos que contendr cada
perspectiva, ya que ser a travs de estos por los que se examinarn y filtrarn
los indicadores.
Con respecto a la perspectiva Tiempo, es muy importante definir el mbito
mediante
el cual se agruparn o sumarizarn los datos. Sus campos posibles pueden ser:
da de la
semana, quincena, mes, trimestres, semestre, ao, etc.
Modelo conceptual ampliado: En este paso se ampliar el modelo conceptual,
colocando bajo cada perspectiva los campos seleccionados y bajo cada
indicador su respectiva frmula de clculo.

Ejemplo
Tipo de modelado lgico del DW: Se debe seleccionar cul ser el tipo de
esquema que se utilizar para contener la estructura del depsito de datos, que
se adapte mejor a los requerimientos y necesidades de los usuarios. Es muy
importante definir objetivamente si se emplear un esquema en estrella,
constelacin o copo de nieve, ya que esta decisin afectar considerablemente
la elaboracin del modelo lgico.
Tablas de dimensiones: Cada perspectiva definida en modelo conceptual
constituir una tabla de dimensin. Para ello deber tomarse cada perspectiva
con sus campos relacionados y realizarse el siguiente proceso:
Se elegir un nombre que identifique la tabla de dimensin.
Se aadir un campo que represente su clave principal.
Se redefinirn los nombres de los campos si es que no son lo suficientemente intuitivos.

Para los esquemas copo de nieve, cuando existan jerarquas dentro de una tabla
de dimensin, esta tabla deber ser normalizada.
Tablas de hechos: Se definirn las tablas de hechos, que son las que contendrn
los hechos a travs de los cuales se construirn los indicadores de estudio.
esquema constelacin

Esquema estrella y copo de nieve caso 1 caso 2


Uniones: Para los tres tipos de esquemas, se realizarn las uniones
correspondientes entre sus tablas de dimensiones y sus tablas de hechos.
Carga inicial: Se realiza la carga inicial, poblando el modelo de datos que hemos
construido anteriormente. Para lo cual debemos llevar adelante una serie de
tareas bsicas, tales como limpieza de datos, calidad de datos, procesos ETL, etc.
Se debe evitar que el DW sea cargado con valores faltantes o anmalos, as como
tambin se deben establecer condiciones y restricciones para asegurar que solo
se utilicen los datos de inters.
Primero se cargarn los datos de las dimensiones y luego los de las tablas de
hechos, teniendo en cuenta siempre, la correcta correspondencia entre cada
elemento.
Actualizacin: Cuando se haya cargado en su totalidad el DW, se deben
establecer sus polticas y estrategias de actualizacin o refresco de datos.
Una vez realizado esto, se tendrn que llevar a cabo las siguientes acciones:
Especificar las tareas de limpieza de datos, calidad de datos, procesos ETL, etc., que debern
realizarse para actualizar los datos del DW.
Especificar de forma general y detallada las acciones que deber realizar cada software.