Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DWH Tesis Guia Metodologica PDF
DWH Tesis Guia Metodologica PDF
DWH Tesis Guia Metodologica PDF
FACULTAD DE INGENIERIA
Profesor Tutor
A Ericka Daniela,
el ser que ha sido capaz de llenar
con su esencia y presencia cada elemento de mi vida.
Gracias
por mostrarme el significado de
vivir y amar
AGRADECIMIENTOS
A Ronaldo Sevilla y Vida Berros, mis amados padres, quienes me dieron la vida y hasta el
da de hoy han guiado mi camino con su amor y dedicacin, porque siempre han estado all
para m, con sus brazos abiertos llenos de comprensin y la preocupacin en el corazn,
compartiendo mis alegras y tristezas, infinitas gracias y an es poco.
A mi querido hermano Ronaldo, siempre dispuesto, perseverando y acompandome en el
andar de la vida y para la construccin de esta monografa.
A mi tutor Carlos, por su disponibilidad y ayudarme a delimitar y esclarecer mis ideas, a
Flavia e Irene y dems amigos por todos sus consejos y su tiempo, y a mis compaeros y
colegas que juntos recorrimos la senda del saber.
A todas aquellas personas que no han escatimado sus palabras ni acciones para apoyarme,
darme nimos, ideas, etc y que por razones de espacio no puedo enumerar.
CONTENIDO
INTRODUCCIN ................................................................................................. i
I.
ANTECEDENTES ..................................................................................iii
II.
OBJETIVOS ............................................................................................. v
A. General: ................................................................................................. v
B. Especficos:............................................................................................ v
DESARROLLO DE LA TESIS............................................................................ 1
I.
II.
III.
CONTEXTO NICARAGENSE........................................................... 50
CONCLUSIONES .............................................................................................. 99
RECOMENDACIONES................................................................................... 101
ANEXO A: INDICES DE ILUSTRACIONES Y TABLAS
ANEXO B: BIBLIOGRAFA
ANEXO C: COTIZACIONES DE EQUIPOS Y CRONOGRAMA
ANEXO D: ENTREVISTAS
INTRODUCCIN
El presente estudio monogrfico, satisface la necesidad de un marco de
referencia para la construccin de un Data Warehouse, unificado y adaptado a profesionales
o estudiantes de Informtica que inician su aprendizaje sobre sta tecnologa. El resultado
obtenido es una gua metodolgica que apoya la definicin y ensea el desarrollo de un
Data Warehouse que rene y unifica las metodologas ms aceptadas y que adems
concuerda con el conocimiento que sobre este proceso tienen los principiantes que desean
por primera vez introducirse en la construccin de un Data Warehouse. Todo esto con el
propsito de que quien utilice y ponga en prctica la gua encuentre una referencia slida y
comprensible que le dirija a travs del proceso de desarrollo de un Data Warehouse.
Un Data Warehouse es una coleccin almacenada de datos corporativos
originados en diversos sistemas transaccionales dentro de una organizacin. Un Data
Warehouse es un repositorio nico de informacin cuyo propsito especfico es soportar la
toma de decisiones en un negocio, no las operaciones del mismo, por ello se encuentra
organizado de una forma muy distinta a las bases de datos tradicionales.
En el contexto nacional, las empresas nicaragenses que desean expandir su
mercado ms all de nuestras fronteras o mejorar su rendimiento en el sector en el que se
desempean, deben ser competitivas y obtener ventajas de todos sus recursos para asegurar
la efectividad de sus estrategias y su correspondiente remuneracin. Uno de los recursos
ms importantes con los que cuenta cualquier organizacin es la informacin. La
explotacin de la informacin de la empresa habilita a los ejecutivos tomar decisiones ms
adecuadas y efectivas, fundamentalmente reconocer oportunidades y posibilidades de
crecimiento.
Sin embargo, el uso apropiado que se haga de la informacin de una empresa
estar en dependencia de la calidad de los datos que la originan, la claridad del significado
que tienen para los tomadores de decisiones, su estructura lgica, organizacin y la
disposicin a tiempo y en forma. Si los datos son veraces y adecuados pero son
extemporneos difcilmente servirn para la toma de decisiones, ya que la problemtica que
se le present a la empresa no pudo ser resuelta de la mejor manera posible. La velocidad
ii
I.
ANTECEDENTES
El trmino Arquitectura de una Organizacin se refiere a la coleccin de
componentes tecnolgicos y sus interrelaciones que integrados nos permiten satisfacer las
necesidades de informacin en una compaa. Aqu se introduce el concepto de
Arquitectura de Tecnologa de la Informacin de una Organizacin con la intencin de
proporcionar un base de referencia sobre la tecnologa de Data Warehousing como uno de
muchos componentes de una arquitectura de Tecnologa de la Informacin (IT).
El concepto de Data Warehouse se desarrolla basndose en la necesidad de
encontrar una estructura ptima para analizar los datos dejando el enfoque tradicional de
estructuras orientadas al registro de transacciones; con ello la tecnologa de data
Warehousing se establece como un modelo que evoluciona paralelamente al cambio en las
necesidades actuales de construir sistemas que faciliten el proceso de toma de decisiones.
Segn la definicin de W. H. Inmon, Un Data Warehouse es un conjunto de
datos integrados, orientados hacia una materia, que varan con el tiempo y que no son
transitorios,
los
cuales
apoyan
el
proceso
de
toma
de
decisiones
de
una
iii
iv
II.
A.
OBJETIVOS
General:
Disear una gua metodolgica para que apoye la definicin y muestre
el desarrollo de un Data Warehouse, mediante la elaboracin de un estudio para
adaptar los enfoques y estrategias de construccin de las metodologas ms
utilizadas hasta el ao 2001, a Tecnlogos de la Informacin noveles en Data
Warehousing.
B.
Especficos:
i. Proponer una estrategia para la planificacin, definicin y desarrollo de un Data
Warehouse, a travs de un anlisis cualitativo de las metodologas ms
utilizadas, para lograr un mtodo base que sea fcil, entendible, prctico y
adaptado a noveles en Data Warehousing.
ii. Precisar la viabilidad de la puesta en prctica de la gua, a travs de la
realizacin de un anlisis de Costo-Beneficio, para la factibilidad de
construccin de un Data Warehouse utilizando la gua metodolgica propuesta.
iii. Esbozar una propuesta de diseo de Data Warehouse, que utilice los criterios
formulados en esta gua metodolgica dentro de una institucin financiera, a
travs del uso de Modelado Dimensional de datos, para comprobar la
funcionalidad de la gua.
DESARROLLO DE LA TESIS
I.
MARCO TERICO
A.
El Data Warehouse
La concepcin generalizada que se tiene acerca de lo que es un Data
Warehouse, implica algn tipo de Base de Datos que proporciona varias funciones a varios
usuarios, proviene ms bien de la implementacin del Data Warehouse que de su definicin
conceptual. La divergencia de criterios sobre una el concepto en s se cimienta en el hecho
de que no exista una definicin oficial de Data Warehouse, esto es, una definicin estndar
soportada por un comit de estndares. A pesar de esto, las caractersticas del entorno
analtico que supone ser el Data Warehouse son ampliamente reconocidas y aceptadas.
Ambos, definicin y caractersticas a continuacin.
1.
Definicin
Data Warehouse es un anglicismo que, como muchas de las expresiones que
2.
de Inmon, nos indican claramente que un Data Warehouse se caracteriza por ser:
Temtico: slo los datos necesarios para generar informacin del negocio se
integran desde el entorno operacional. Los datos se organizan por temas, no por
aplicacin, as se facilita el acceso y entendimiento por parte de los usuarios finales
a los datos contenidos en el Data Warehouse. Esta caracterstica permite realizar
anlisis y minera de datos (data mining).
Tabla I-1.- Diferencias entre Data Warehouse y las Bases de Datos Estndar
Base de Datos Estndar
Data Warehouse
Mb Gb de Datos
Gb Tb de datos
Snapshots Actuales
Historia
Datos Crudos
Por sobre todo, las bondades del Data Warehouse no son cuantificables de
manera cuantitativa sino cualitativa -Cunto vale una buena decisin, oportuna y a
tiempo?- Los beneficios que brinda un Data Warehouse derivan directamente de los nuevos
usos de la la informacin existente o de la disponibilidad de informacin que difiere en
sustancia, calidad o detalle de la informacin que se tienen disponible y se usa en ese
momento. Es a partir de esa informacin que las ventajas competitivas fluyen [Porter85].
Otras ventajas ms tangibles son:
Consultas slo del mbito del Data Warehouse. En el Data Warehouse se puede
realizar consultas que fuera de l seria imposible de conseguir, por restricciones de
recursos y tiempo.
B.
conocer y comprender cuales son las filosofas y metodologas ms exitosas para utilizarlas
y obtener mayores beneficios, en lugar de enfocarse en una sola y disminuir la perspectiva.
A continuacin se abordan ligeramente ests tres metodologas ya
mencionadas.
1.
Replicacin de Datos
Devlin la define como un conjunto de tcnicas que proveen soporte, de una
forma comprensiva, para copiar y transformar los datos de la localidad fuente hacia la
destino de una manera consistente, repetible y bien entendida, y que consta de los
siguientes tres componentes de ejecucin claves:
1.1.
activo del activo de datos para la organizacin- un activo que debe ser administrado y
protegido, razn por la cual existe el BDW. En la concepcin de Devlin el BDW es
rigurosamente definido y en mayor parte centralizado que el BIW.
Existen dos etapas que deben ser tomadas en consideracin:
Diseo del BDW
Segn el enfoque de Devlin, el BDW debe ser diseado con considerable
cuidado, debido a que es un componente central del Data Warehouse. La etapa de diseo
puede adems subdividirse en las siguientes partes:
I.
10
III. Archivo y recuperacin: este proceso debe disear una funcin que pueda proveer
almacenamiento manejable y eficiente y recuperacin de datos entre los diferentes
niveles en la jerarqua de almacenaje.
Poblacin del BDW
La poblacin del BDW ha sido considerada una de las partes tcnicamente ms
demandantes de la construccin del Data Warehouse, lo que hace necesario disear un
proceso de obtencin de datos que permita que los datos fluyan sin problemas y de forma
confiable desde los sistemas operacionales a el BDW.
I.
Captura- de datos desde los sistemas operacionales. Se debe definir la captura para la
carga del BDW tomando en cuenta los requerimientos del sistema en cuanto a
desempeo y la necesidad de transformar datos transitorios o semi- peridicos a datos
peridicos.
II.
Transformacin- de datos entre los dos ambientes. Existen una serie de funciones de
transformacin de las que deben seleccionarse las que ms satisfagan las necesidades
del negocio con el objetivo de normalizar y alinear los datos entrantes al Modelo de
Datos de la Organizacin.
11
del uso del Business Information Warehouses (BIWS). Los desarrolladores necesitan
estructurar los BIW para permitir el acceso de los usuarios tan lejos como sea posible pues
en su vasta mayora dicho acceso de parte de los usuarios ocurrir en este nivel [Devlin97,
p245].
Diseo de BIW
El diseo de BIW debe proveer un buen desempeo sobre un rango de las
formas ms probables en que los usuarios utilizarn los datos en el BIW, puesto que el
comportamiento de los usuarios es impredecible y no se puede conocer en avance.
En general, los BIW son sustancialmente denormalizados en relacin al BDW,
esto con el objetivo de incrementar el desempeo de las consultas y para reducir la
complejidad de los datos desde el punto de vista de los usuarios [Devlin97, p231]. El
diseo de BIWS tiene mucho en comn con el diseo del BDW en cuanto a las partes en las
que se divide, pero se diferencia en los enfoques con que se aborda algunas partes:
I.
II.
Datos Histricos en el BIW: conjuntos de datos histricos deben ser generados segn
se requiera para necesidades analticas especficas y retenidos slo por los perodos de
tiempo requeridos.
Captura- de datos desde el BDW. Los BIW en su mayora utilizan datos provenientes
de ms de una tabla del BDW, por lo que es necesaria la sincrona entre dichas tablas
del antes de comenzar con la poblacin del BDW.
II.
Transformacin- de datos entre los dos ambientes. Se limita a aquellas funciones que
utilizan primordialmente el estndar SQL para realizar las transformaciones entre las
12
13
1.3.
14
el Data Warehouse.
Obstculos a la Implementacin
Aborda los problemas de las reas claves y su posible resolucin:
Tamao y alcance del Data Warehouse
Segn [Devlin97, p304] un verdadero Data Warehouse envuelve a la empresa
por completo, esto implica que el tamao del Data Warehouse es enorme. Con el objetivo
de evitar desastres potenciales en la implementacin que puedan poner en peligro la
realizacin del proyecto Devlin plantea dividir la implementacin completa en piezas
alcanzables que puedan ser implementadas en un proceso de etapas. El resultado es un
proceso que se expande a varios aos pero que entrega valor al negocio en ciclos de seis o
doce meses, en paralelo con una implementacin progresiva y en etapas de la arquitectura
del Data Warehouse.
Colocacin del BDW y BIW en la empresa
Esta etapa se refiere a la arquitectura fsica del Data Warehouse y se deben
considerar aspectos de la estructura organizacional, geogrfica y de las plataformas fsicas
usadas por la compaa, decidir si implementar de forma centralizada o distribuida. Esta
etapa es altamente dependiente del ambiente de la empresa porque no existe una nica
forma de implementacin.
Planeacin de la Implementacin
El aspecto ms importante de la planeacin de la implementacin es que este
proceso debe armonizar juntos valor para el negocio y la infraestructura de entrega. El
resultado es una serie de proyectos cada uno entregando valor al negocio e infraestructura
de una manera controlada y en etapas. La prioridad de la secuencia de entregas en este
proceso es determinada por una combinacin de las necesidades del negocio y de aspectos
tcnicos, siendo la influencia ms importante el modelo de datos de la empresa [Devlin97,
p333].
15
16
2.
El enfoque de W. H. Inmon
William H. Inmon es considerado el padre del Data Warehouse, pues fue el
primero en acuar el trmino, adems su libro con el cual dio a conocer su teora sobre el
Data Warehouse, es hoy en da, una dcada despus de su primera publicacin, una de las
referencias ms completas y utilizadas por los profesionales que ingresan al mundo de la
tecnologa del Data Warehouse. l ha a escrito ms de 32 libros solo o en compaa, con lo
que ha consolidado una serie de obras que abarcan cada aspecto del diseo, construccin y
gestin de un Data Warehouse.
17
que ella construye sobre esfuerzos previos- construye sobre ambos cdigo y procesos que
han sido desarrollados con anterioridad. La nica forma en que el desarrollo sobre
esfuerzos previos puede ser alcanzado es a travs del reconocimiento de aspectos comunes.
Antes que el desarrollador inicie su trabajo, l o ella necesita saber que es lo que realmente
existe y como eso afecta el proceso de desarrollo. Esta es una de las esencias de la
metodologa dirigida por los datos.
Una metodologa dirigida por los datos tiene cuando menos dos caractersticas
distintivas [Inmon96, p290]:
1. Se enfoca en utilizar el cdigo y los datos que han sido elaborados previamente
como base para la nueva construccin en lugar de construir alrededor de ellos. Para
realizar esto, es imperativo el reconocimiento de aspectos comunes en los datos y el
procesamiento, la clave para este reconocimiento es el modelo de datos.
2. Hay un nfasis en el almacn central de datos El Data Warehouse- como la base
para el procesamiento de soporte a la toma de decisiones, lo que reconoce que el
procesamiento de soporte a la toma de decisiones tiene un ciclo de vida de desarrollo
sumamente diferente a los sistemas operacionales.
El desarrollo de sistemas operacionales se forma alrededor de un ciclo de vida
de desarrollo que inicia con los requerimientos y termina con el cdigo, lo que se diferencia
grandemente del procesamiento de soporte a la toma de decisiones, el cual inicia con los
datos y termina con los requerimientos.
18
19
20
Conversiones de datos
Escritura de la documentacin
21
DSS7. Anlisis de los Sistemas Fuente: Identificacin del sistema de registro, es decir el
mapeo de los datos del ambiente operacional al ambiente analtico. Se deben
resolver los siguientes aspectos relacionados a la integracin de los datos:
22
23
2.2.
24
Migration Path
El punto inicial del plan de migracin es el modelo de datos. El modelo de
Atributos
Las llaves
Relaciones de subtipos.
Datos ms completos
Datos ms oportunos
Datos ms precisos
elaborado correctamente el diseo del Data Warehouse slo requiere que pocos aspectos
del modelo se cambien para convertirlo en un diseo de Data Warehouse, principalmente se
debe:
25
Las relaciones de integridad referencial deben ser cambiadas por otras fabricadas
Entre las reas de los temas de inters debe haber muchas tablas separadas, cada
una de las cuales es conectada por una llave comn.
Despus del diseo de datos, el siguiente paso es disear y construir las
interfaces entre el sistema de registro y el Data Warehouse, las cuales poblarn el Data
Warehouse en periodos de tiempo regulares. Las interfaces realizan una serie de actividades
vitales de modificacin de los datos antes de cargar el Data Warehouse:
Warehouse con el primer tema de inters, es importante que solo una fraccin del Data
Warehouse sea poblada inicialmente para asegurar que los inevitables cambios que
sobrevienen y que deben ser hechos puedan llevarse a cabo de manera fcil y rpida, lo que
garantiza la flexibilidad de la primera iteracin del Data Warehouse. Una vez que el usuario
final tiene acercamiento a los datos y proporciona retroalimentacin al arquitecto de datos,
entonces puede ser sano poblar cantidades mayores de datos.
Los procesos de poblacin y retroalimentacin continan indefinidamente,
mientras el Data Warehouse contina su proceso evolutivo incorporando cambios producto
de stos dos procesos. Sin embargo, no se debe olvidar que las actividades y asuntos del
26
3.
[Kimball95], en el cual este autor mostraba como usar el modelado dimensional para
disear Data Warehouses usables y efectivos. Sin embargo, la presentacin y explicacin
de una metodologa que utilice estas tcnicas para la construccin de completos Data Marts
y Data Warehouses aparece hasta en una publicacin posterior The Data Warehouse
Lifecycle Toolkit [Kimball98]. La expresin Ciclo de Vida se refiere a todos los pasos del
proceso completo de desarrollo de software: planeacin, diseo, codificacin, prueba,
implementacin y administracin, el ciclo de vida de Kimball es una metodologa paso a
paso para disear, desarrollar y desplegar Data Marts y Data Warehouses, y que es
27
enriquecido adems, por experiencias de otros coautores. Este libro aborda el proceso de
construccin de inicio a fin de forma iterativa y tambin se muestra la utilizacin de las
tcnicas del modelado dimensional.
Este es el ciclo de vida propuesto por Ralph Kimball:
28
organizacin para afrontar dicho proyecto. Tambin se debe elaborar el plan para el
proyecto, as como gestionar la puesta en marcha del mismo, definiendo y manteniendo su
alcance.
Obtencin de Requerimientos
Cada organizacin es nica en si misma, cada vez que se inicia un Data
Warehouse, es imposible conocer en avance los requerimientos de tal instrumento de apoyo
a la toma de decisiones, por tanto se debe de hacer uso de entrevistas o sesiones con
facilitador para lograr obtener datos de la informacin necesaria en la empresa para poder
definir de manera correcta el contenido y utilizacin del Data Warehouse.
3.2.
29
30
Dimensiones: Los atributos textuales que describen los objetos y que tienen una
alta correlacin entre ellos, son organizados dentro de las dimensiones.
31
Mtodo de Diseo de cuatro pasos para disear una tabla de hechos individual
El diseo lgico detallado de un esquema dimensional es dirigido por los
siguientes cuatro pasos [Kimball98, p 194]:
1. Escoger el Data Mart: En las primera implementaciones es aconsejable mantener la
situacin lo ms simple posible por lo que es una adecuada decisin escoger una
nica fuente de datos para el Data Mart.
2. Declarar la Granularidad de la tabla de Hechos: Consiste en una clara definicin
de que se considera una tabla de hechos en el diseo dimensional propuesto, que
estilo de tabla de datos se utilizara: transacciones individuales, snapshots de alto
nivel o elementos individuales de documentos de control como facturas.
3. Escoger las Dimensiones: Seleccionar de todas las dimensiones posibles aquellas
con la menor granularidad que tomen un valor nico en el contexto de un conjunto
dado de medidas del negocio.
4. Escoger los Hechos: Los hechos deben ser siempre especficos a la granularidad de
la tabla de hechos. No se deben mezclar hechos de otros perodos de tiempo u otras
agregaciones para hacer los clculos convenientes.
Construccin de Modelos Dimensionales
Aqu Kimball expone que el conjunto de los modelos dimensionales
constituyen el diseo lgico del Data Warehouse, pero es necesario decidir que modelo, es
decir que Data Mart, se construir primero.
Segn Kimball se debe comenzar con un enfoque de planeacin de arriba-abajo
al que llama Matriz de Arquitectura del Data Warehouse, en la cual se nombran todos los
Data Marts que sea posible construir junto con las dimensiones implicadas por dichos Data
Marts y luego se relacionan ambos para determinar las dimensiones que son utilizadas por
ms de un Data Mart y que deben ser conformadas para asegurar un Bus de Data
Warehouse.
En la siguiente etapa, una vez que ya se han identificado los Data Marts y sus
dimensiones asociadas, se procede con los diseos fsico y lgico detallados de las tablas
individuales, se utiliza el mtodo de cuatro pasos para disear cada tabla de hechos.
32
Elementos crticos de las polticas del negocio: implican decisin acerca de cmo
manejar determinadas situaciones
3.3.
Arquitectura
Una arquitectura bien definida agrega valor al proyecto, al mejorar la
33
Datos (qu)
Requerimientos de
Negocio y Auditoria
Modelos de
arquitectura y
Documentos
Modelos detallados y
Especificaciones
Implementacin
Creacin de la BD,
ndices, etc.
Documentar
El Modelo Fsico y
Lgico
Tcnica (cmo)
Back room
Front room
Formas de anlisis de
los datos
Servicios para que los
usuarios utilicen la
informacin
Especificaciones de
reportes. Usuarios
posibles. Frecuencia
Construir el ambiente
de reportes y anlisis.
Documentar
Infraestructura
(donde)
Hardware y software
necesario
Fuente-Destino de
datos. Capacidad de
almacenamiento
Interaccin con las
capacidades y
utilidades del sistema.
Instalar y probar los
componentes nuevos
de la infraestructura
Dirigidos por los Metadatos: los metadatos proveen parmetros e informacin (un
conjunto de informacin de control acerca del Data Warehouse, su contenido,
34
cuarto de mquinas del Data Warehouse [Kimball98, p335]. Su principal asunto es resolver
los problemas especficos de la migracin de datos del punto A al punto B, con las
transformaciones apropiadas y en el momento justo. En la arquitectura del Back Room se
debe analizar los aspectos relativos a: los sitios donde se almacenan los datos (sistemas
fuente, rea de conciliacin de datos, servidores de presentacin), los servicios que
proporcionara (extraccin, transformacin, carga, control del trabajo de conciliacin) y la
administracin de los activos del back room (respaldo y recuperacin, archivo, seguridad de
la extraccin y carga y servicios futuros).
El front room es lo que los usuarios finales miran y utilizan para trabajar da a
da. Es la cara del Data Warehouse [Kimball98, p373]. Su principal asunto es construir una
capa intermedia entre los usuarios y la informacin que permita esconder algunas de las
complejidades propias de la plataforma tcnica y que les ayude a encontrar lo que buscan.
En la arquitectura del Front Room se debe analizar los aspectos relativos a:
1. Los sitios donde se almacenan los datos: herramientas de acceso a los almacenes de
datos, almacenes de datos para reporte estndar como los Data Mart personales,
sistemas de carga a otras aplicaciones.
2. Los servicios que proporcionara para el acceso de datos: navegacin, acceso y
seguridad, monitoreo activo, administracin de consultas, localizacin de consultas,
reportes estndar, servicios de acceso futuro, servicios de escritorio, modelacin de
aplicaciones y Data mining, implicaciones web y enfoques para la arquitectura de
herramientas de escritorio.
Arquitectura de Infraestructura y Metadatos
El rea de arquitectura de infraestructura se refiere a las plataformas que
soportan los datos y procesos. Es la planta fsica del Data Warehouse y provee los
cimientos para todos los elementos de la arquitectura ya descritos. La Infraestructura
incluye el hardware, la red y funciones de bajo nivel que los componentes de ms alto nivel
35
no contemplan. Los metadatos son de un tipo distinto pero proveen el mismo tipo de capa
base de soporte para las herramientas del back room y del front room [Kimball98, p411].
Para definir correctamente este componente en la arquitectura del Data
Warehouse, siempre se debe tomar en consideracin: los requerimientos del negocio, los
cuales dictaminan la direccin del Warehouse, la evolucin que la infraestructura sufrir en
la puesta en marcha del proyecto y evolucin, los factores de la infraestructura del back
room (tamao de datos, volatilidad, cantidad de usuarios, hardware, sistema operativo entre
otros), factores de infraestructura del front room (consideraciones de los servidores de
aplicacin, del escritorio), factores de redes y conectividad (ancho de banda, acceso remoto,
gateways, transferencia de archivos, conectividad de la base de datos).
En el aspecto relativo a los metadatos los puntos claves en los que pueden ser
agrupados son: metadatos de los sistemas fuente, metadatos de conciliacin de datos,
metadatos del DBMS, metadatos del front room. Finalmente, debe existir un catlogo de
metadatos, lo cual es una herramienta que permita catalogar y darles seguimiento a todos
los metadatos.
3.4.
Implementacin
Antes de iniciar la implementacin es importante decidir que hechos deben ser
agregados con respecto a que dimensiones con el objetivo de mejorar el desempeo general
del Data Warehouse, para ello es necesario que:
Cada agregacin en cada nivel distinto sea guardado en su propia tabla de hechos,
separados del resto de los datos atmicos.
Siempre que sea posible las dimensiones adjuntas a las tablas de hechos deben ser
versiones reducidas de las dimensiones asociadas con las tablas de hechos base.
Las tablas base de hechos atmicos y sus tablas de hechos agregadas deben ser
relacionadas como una familia de esquemas (permite que el navegador conozca que
tablas estn relacionadas entre si).
Se debe forzar a todas las rutinas SQL creadas por cualquier herramienta de usuario
final para acceso a los datos o de aplicacin, se refieran exclusivamente a la tabla de
hechos base y sus dimensiones de tamao completo.
Otro elemento que debe ser completado es el diseo fsico.
36
Plan:
1. Crear un esquema de alto nivel, muy consolidado, del flujo de fuente a destino.
2. Probar, escoger e implementar la herramienta de consolidacin de datos.
3. Drill down por cada tabla destino, bosquejar grficamente cualquier
reestructuracin o transformacin de datos compleja y el proceso de generacin
de claves arbitrarias. Desarrollar la secuencia preliminar de trabajo.
Carga de Dimensiones:
4. Construir y probar la carga de una tabla de dimensin esttica.
5. Construir y probar el proceso de cambio lento para una dimensin.
6. Construir y probar la carga de las dimensiones faltantes.
37
Despliegue y Crecimiento
Un despliegue exitoso de un Data Warehouse requiere planeacin consistente y
38
39
gestionar adecuadamente las operaciones del Data Warehouse, medir y proyectar su xito y
comunicarse constantemente con los usuarios para establecer un flujo de retroalimentacin.
Finalmente, es importante sentar las bases para el crecimiento y evolucin del
Data Warehouse en donde el aspecto clave es manejar el crecimiento y evolucin de forma
iterativa utilizando el Ciclo de Vida propuesto, y establecer las oportunidades de
crecimiento y evolucin en orden por nivel prioridad.
II.
40
anlisis cualitativo de las metodologas abordaron, para determinar cual o cuales elementos
de una o de todas las metodologas mejor cumplen el objetivo de servir de gua a noveles en
Data Warehousing, y que les apoye en la definicin y desarrollo de un proyecto de Data
Warehouse.
Es necesario recalcar que un enfoque exitoso para la construccin de un Data
Warehouse debe contemplar mucho ms que el proceso de diseo, pues el diseo es slo
una parte del todo, an cuando el diseo mismo se encuentre en el ncleo del desarrollo.
Las situaciones que se deben contemplar y resolver envuelven la arquitectura de datos del
Data Warehouse, la cultura organizacional, la calidad de datos, integracin de datos y
dems, con tantas variables en juego es imperativo reconocer que no existe un nico
mtodo aplicable a toda empresa u organizacin pues cada una es nica, si no ms bien
conocer y comprender cuales son las filosofas y metodologas que han sido ms exitosas y
tratar de utilizarlas y adaptarlas a las circunstancias especficas que se afrontan,
combinando sus mejores puntos, enseanzas y prcticas en un todo cohesivo, en lugar de
enfocarse en una sola de ellas.
Para que una metodologa tenga xito debe reunir ciertos elementos. La
metodologa para una iniciativa de Data Warehouse debe resolver el amplio alcance
arquitectnico y funcional del Data Warehouse. La estrategia de Data Warehouse que se
elija se debe enfocar en producir un marco de trabajo conceptual de soluciones integradas
para las distintas capas de la arquitectura, mediante la exploracin de los requerimientos de
la arquitectura de datos, la arquitectura de metadatos, los procesos del back-end
(extraccin, transformacin y aplicacin) y las aplicaciones del front-end (DSS), as como
la infraestructura de tecnologa. El enfoque de la estrategia ser amplio, no profundo, ya
que esto depende de la situacin en cada empresa. El objetivo es asegurar que la
arquitectura de informacin entregue valor de negocio inmediatamente a los encargados de
realizar las decisiones que dirigen el negocio y que coloque al negocio en posicin para
xitos futuros. Se culmina con la entrega de una arquitectura conceptual consolidada y los
planes para una estrategia de emisiones en etapas. Para que una estrategia de Data
Warehouse sea alineada con la estrategia de un negocio, la metodologa debe explorar todos
los aspectos de la estrategia del negocio.
41
A.
Barry Devlin
El primer trabajo publicado en el tema de Data Warehouse, pertenece a Barry
Devlin, como se dijo en el Marco Terico. La metodologa expuesta por l, es una gua para
implementar y construir un Data Warehouse que incluye el anlisis racional del negocio
que debe ser hecho, la arquitectura tcnica con la que se debe contar y el proceso de
implementacin completo. Esta metodologa provee una fundacin terica excelente para
disear un ambiente integral de Inteligencia de Negocio (cualquier informacin que
pertenece a la historia, estado actual o proyecciones futuras de una organizacin). Devlin
estructur su punto de vista como una arquitectura comprensiva al integrar el Data
Warehouse al desarrollo de los sistemas de informacin y considerarlos como un todo. Para
Devlin el Warehouse es parte del diseo de sistemas a nivel corporativo, lo cual es un
enfoque muy apropiado e innovador.
En su visin, la base de datos del Data Warehouse es parte de una solucin ms
grande, no un final en s mismo. El Data Warehouse es un activo estratgico desarrollado
para servir los intereses de la comunidad de negocios entera. El Data Warehouse es una
coleccin de datos que ser usada por los usuarios de negocio para suplir la mayor parte de
las necesidades de acceso y anlisis de informacin. El Warehouse tambin ser un
vehculo para incrementar la calidad y disponibilidad de los datos conforme a una
naturaleza diversa de necesidades y usuarios, esto permite luego ingresar datos integrados y
de calidad en el ciclo de retroalimentacin de la informacin y para que puedan ser usados
por otros sistemas corporativos.
En su enfoque, Devlin separa claramente los distintos componentes de una
arquitectura eficaz y adecuada para la realizacin de un proyecto de Data Warehouse, que
deben de estructurarse y trabajar en conjunto para asegurar el xito del proyecto. Adems,
l proporciona un nmero de tcnicas, sugerencias y tips de cmo implementar y disear el
ambiente de Inteligencia de Negocio.
42
43
B.
William Inmon
La definicin de Data Warehouse de Inmon ha puesto en claro una buena
44
cercano del proyecto que le puedan poner en peligro, debido a que se conoce con antelacin
y bastante exactitud la estructura que presentarn los principales ncleos del desarrollo, lo
cual permite enfocar los esfuerzos del desarrollo actual para ser compatible con los
subsiguientes.
Inmon es defensor de utilizar el modelo relacional para el ambiente en el que se
implementar el Data Warehouse Corporativo, asegura que esta es la alternativa ms
adecuada para que el almacn central sea ms eficiente sin afectar a los usurarios finales ya
que la frecuencia de acceso de los mismos es muy escasa en este nivel. Mientras, aplicar al
esquema estrella o modelado dimensional a la aplicacin Front End que llama Data Mart, y
que es donde realmente tiene lugar el acceso de los usuarios en su Arquitectura.
Inmon ciertamente coincide en que el modelado dimensional est bien para los
Data Mart, pero hace nfasis en que estos deben ser dependientes del Data Warehouse
Corporativo; sin embargo est muy convencido que un diseo basado en Diagramas
Entidad Relacin es mucho ms apropiado para el Data Warehouse central de mayor
magnitud. Segn Inmon y aqu tambin coincide Devlin, la estructura ideal que se busca
para un Data Warehouse, porque proporciona la manera ms efectiva de colectar,
almacenar y diseminar la Informacin, es muy probablemente:
45
C.
Ralph Kimball
Kimball difiere de los otros autores abordados en enfoque: El Data Warehouse
no es nada ms que la unin de todos los Data Marts que lo constituyen [K, p19]. En el
mundo de Kimball el Data Mart es el Data Warehouse, esto se afirma en el sentido de que
Kimball expone que al construir los Data Marts ya se est construyendo el Data Warehouse
de una manera incremental. Un Data Mart es un subconjunto de datos organizados, como
en el Data Warehouse, para el soporte a la toma de decisiones, pero que slo representa la
visin de un departamento o individuo, por este motivo Kimball es frecuentemente
asociado con esfuerzos departamentales y no corporativos.
En la actualidad la mayora de los proyectos de Data Warehouse implementan
el modelo de Data Marts de Kimball en lugar del esquema de Data Warehouse empresarial
propuesto por Bill Inmon o de la arquitectura en tres capas de Devlin, esto obedece a
motivos de tiempo, costo y el riesgo de fracaso asociados con el desarrollo de los dos
ltimos [Lee02]. A esta tendencia general se le ha identificado como la aproximacin que
46
47
48
excelente para representar las vistas de las personal que son de pensamientos similares,
pero diferentes grupos de personas querrn su propia estrella que represente sus propias
vistas. El esquema estrella se forma alrededor de los requerimientos de usuarios y porque
estos requerimientos varan de un tipo de usuarios a los otros no es de sorprender que
diferentes estrellas sean ptimas para diferentes tipos de usuarios.
El problema real es cuando existen mltiples ambientes independientes de
esquemas estrella, los mismos datos detallados aparecen en cada estrella. No existe
reconciliacin de datos y las nuevas estrellas requieren la misma cantidad de trabajo para la
creacin que las antiguas estrellas. Como resultado:
Las uniones crecen innecesariamente grandes cuando cada estrella necesita datos
detallados que otra estrella ya ha obtenido.
Los resultados de cada estrella son inconsistentes con el resultado obtenido de cada
otra estrella y la habilidad de reconciliar las diferencias no es aparente.
No existen bases para construir nuevas estrellas porque cada una es construida
independientemente.
La interfase para soportar las aplicaciones que alimentan las estrellas se vuelve
inmanejable.
Se genera una gran cantidad de trabajo extra al construir cada parte en comparacin
al enfoque de Data Warehouse Corporativo.
Una vez establecido el anlisis sobre cada una de las metodologas estudiadas
D.
Sntesis
Las filosofas de Inmon y Kimball difieren principalmente en escala, Data
Warehouse Corporativo versus Data Warehouse por incrementos de Data Marts. Devlin es
coincidente con Inmon en colocar los Data Marts como una capa aparte del Data
Warehouse central, pero introduce otra capa intermedia, la capa de datos reconciliados en
su arquitectura del Data Warehouse.
Sin embargo, la diferencia real entre ellos se encuentra en el enfoque con el que
se modela la Vista Corporativa. Todos coinciden en que es necesario al iniciar el proyecto
analizar el modelo de datos empresarial con el que cuenta la empresa. A partir de aqu:
49
Los otros autores realizan modelado Entidad Relacin sobre todo el conjunto de
datos empresariales durante la primera iteracin del proyecto, de modo que se
reconozca que datos son meramente operativos y cuales son de soporte a la toma de
decisiones, se identifican las reas de inters y se procede a una reorganizacin de
los datos para acomodarlos a las exigencias del Data Warehouse. En cada etapa se
implementa solo un rea de inters. En las siguientes iteraciones, de ser necesario,
solo ajustan el modelo inicial.
El fracaso que sufren algunas organizaciones al utilizar la metodologa de
Kimball se deriva de que obvian la visin corporativa del Data Warehouse. La ventaja del
enfoque corporativo es que con un buen diseo para el Data Warehouse empresarial se
puede prevenir de los esfuerzos de duplicaciones y sincronizacin, que suelen aparecer en
el enfoque de incrementos por Data Marts propuesto por Kimball.
III.
50
CONTEXTO NICARAGENSE
La tecnologa de Data Warehousing no es nueva en el Mercado, pues se
No. DE EMPRESAS
No. EMPLEADOS
Grande
160
100 o ms
Mediana
712
[21-100]
Pequea
4,526
[ 6 - 20 ]
51
52
IV.
53
ESTUDIO DE FACTIBILIDAD
El estudio de Factibilidad consta de cuatro apartados de factibilidad: Tcnica,
Adems de todo esto se deber seguir cumpliendo con las actividades diarias para
que el Negocio siga funcionando.
Como vemos no se puede trivializar el estudio de factibilidad operativa, pues
este permite poder reducir el margen de riesgo del proyecto y asegurar su xito dentro de la
organizacin.
La Factibilidad Econmico-Financiera del proyecto es una evaluacin del
costo de desarrollo sopesado con los ingresos netos o beneficios obtenidos del producto
desarrollado, en este caso del Data Warehouse. La justificacin econmica incluye una
amplia gama de aspectos a tener en cuenta como son el anlisis de costo-beneficios, las
estrategias de ingresos de la empresa a largo plazo, costo de recursos necesarios para el
desarrollo y crecimiento potencial del mercado.
54
A.
Factibilidad Tcnica
En primer lugar se proceder a calcular la capacidad y a establecer el perfil
tcnico de los dispositivos y perifricos en funcin de los datos y aplicaciones que sern
procesados por la futura instalacin. Tambin se necesita determinar que aplicaciones son
necesarias para el desarrollo del proyecto de Data Warehouse.
1.
Elemento
Cnt Consideraciones
Tamao y organizacin de
la memoria
Escalabilidad
Hardware
Servidor
Tecnologa Procesador
Cantidad de procesadores
Velocidad de procesador
Cantidad de Discos
Tiempo medio acceso a disco
Capacidad de almacenamiento en
discos
Tipo (Fijos o removibles)
CDs y Unidades de CDs
Unidades de Tape Backup
Requerimientos
1.0 GB memoria o mayor
Escalable en memoria,
procesadores y disco duro
RISC(*) o CISC
2 o ms
550 MHz o superior
6 discos en RAID 0+1 (*)
3 discos en RAID 0
SCSI 3 (*) 10krpm
100 GB en conjunto
Hot Swap Plug
Unidad de CD-ROM
Presente(*)
Categora
Elemento
Cnt Consideraciones
Impresora
UPS
Catlogo de
Metadatos
Sistema
Operativo
DBMS
Software
Modelador de
Datos
Herramienta
ETL
Ofimtica
Herramienta
de Acceso
a Datos
Procesamiento en lotes de
programas de aplicacin
Multiprocesador
Multiusuario
Multitareas
Tecnologa (RDBMS, MDBMS)
Open System
Lenguaje de Consulta
Caractersticas de Data
Warehouse
Soporte de esquema estrella
Uso de metadatos
Tipo de modelado (Dimensional o
ERD)
Funcionalidades
Soporte de plataformas
Estandarizacin
Procesamiento de textos
Hojas de Clculo
Software para modelar
OLAP
Reportes
Data Mining
EIS
Productos hbiles para Web
55
Requerimientos
Lser
12 ppm o superior
2000 watts
Control administrativo
Informacin personal
Informacin administrativa
Calificacin de contenido
Indispensable
Indispensable
Presente
Indispensable
RDBMS (*), MDBMS
Preferido pero no indispensable
Compatible con estndar SQL92
Juego de Instrucciones de DW
Soporte para particiones que
contengan datos fuertemente
relacionados
Indispensable
Siempre que sea posible
ERD
DM(*)
Extraccin, deduplicacin,
duplicacin
Microsoft Windows, Linux
Indispensable
Indispensable
Opcional
HOLAP (*), MOLAP, ROLAP
Acceso a base de datos
No requerido
No requerido
Opcional
2.
Opciones Disponibles
Una vez determinados los requerimientos tcnicos se proceder a evaluar
56
Impresora
Catlogo de Metadatos
DBMS
Herramientas ETL
Modelador de Datos
Herramientas de Acceso a Datos
Ofimtica Suites
Sistema Operativo
(en dependencia del DBMS)
Opciones
Dell Power Edge 2500
Compaq Proliant ML-350
Hewlet-Packard Netserver TC4100
Hewlet-Packard LaserJet 1200N
Epson LA LQ-2180
Computer Associates Platinum Repository
Metadata Management Corporation Design Bank
IBM DB2
Microsoft SQL Server 7.0
Oracle9i Enterprise Edition
Informatica Power Mart Designer
IBM Warehouse Manager
Oracle Warehouse Builder
Oracle Designer/2000
Logic Works ERWin
Microsoft Access, Excel
Crystal Decisions Crystal Reports
Microsoft Office 2000
StarOffice 6.0
Microsoft Windows 2000 Server
Red Hat Linux 8.1
57
Opcin A
Hewlett Packard Netserver TC4100
Opcin B
Compaq Proliant ML-350
Impresora
Catalogo de
Metadatos
DBMS
Modelador de
Datos
Herramientas de
Acceso a Datos
Ofimtica Suites
Sistema Operativo
(depende del DBMS)
Debido a que los costos del proyecto de data Warehouse podran resultar ser
muy elevados para esta institucin en su etapa inicial y dado que sta se encuentra en un
momento de renovacin de su plataforma tecnolgica, se ha suprimido la Herramienta de
ETL (Extraction, Transformation, Load) del cuadro anterior y compensar su funcionalidad
con algunas caractersticas propias del DBMS escogido. Es posible adems, prescindir del
Catlogo de Metadatos y utilizar la caracterstica de metadatos propia de SQL Server 2000
con objetivos de la disminucin de costos.
Por lo tanto, no se consideraran ambas herramientas en el apartado de
Factibilidad Econmica- Financiera.
B.
Factibilidad Operativa
El Data Warehouse tendr un profundo impacto en el funcionamiento de la
Contar con una fuente confiable de informacin que presenta una visin consistente
de los datos e informacin de la empresa y su entorno.
58
Alcance y Oportunidad
Todo esto implica cambios organizacionales importantes en el esquema de
trabajo. Estos cambios ocurrirn principalmente en los niveles donde se efecta la toma de
decisiones: la media y alta gerencia. Sin embargo, a pesar de las ventajas que presenta la
introduccin de un entorno analtico para quienes hagan uso del mismo, la curva de
aprendizaje y la resistencia al cambio son factores a considerar.
La empresa objetivo se encuentra en un proceso de cambio tecnolgico en la
que se incluye poner a disposicin del personal tecnologa que le facilite el desarrollo de
sus funciones, como la migracin de sistemas transaccionales a una plataforma ms
adecuada y la introduccin de ordenadores del tipo Handheld para personal operativo y
gerentes de todas las escalas y a todo el personal de tecnologa de informacin. En este
marco el Data Warehouse se convierte en la secuencia ideal, al brindar soporte a la toma de
decisiones. Las condiciones presentadas por el personal en las circunstancias mencionadas,
permite afirmar que el personal de la organizacin presenta poca resistencia al cambio y
que asimilarn de forma natural el nuevo entorno, si se establece un esquema de
capacitacin adecuado como se ha hecho en las otras ocasiones, lo cual trae consigo
adems una drstica disminucin en la curva de aprendizaje.
El alcance del Data Warehouse ser organizacional. En cuanto al personal que
conforma la media y alta gerencia, quienes harn mayor uso del Data Warehouse, el nivel
de preparacin medio es muy alto. Ellos constituyen una base de recursos humanos que
tiene inters en explotar las ventajas que brinda el Data Warehouse. La estructura
organizativa de la empresa no se ver afectada, exceptuando que la gestin de informacin
ser rpida y efectiva y el personal dispondr de mayor tiempo para realizar otras
funciones, lo que aumentar el nivel de rendimiento y productividad del personal as como
la calidad del trabajo realizado.
59
Dotacin
El personal necesario para construir un Data Warehouse, no se puede establecer
con exactitud y antelacin al desarrollo del proyecto, pues existen muchas circunstancias
que no es posible anticipar y que pueden ocurrir y necesitar de la intervencin de personal
ajeno al equipo base del proyecto que se encargar de desarrollar y dar mantenimiento al
Data Warehouse. No obstante, es posible hacer una buena estimacin del grupo de recursos
humanos que intervendrn y conformarn el equipo base, y las funciones que cumplirn.
Los datos proporcionados a continuacin son una descripcin de las funciones bsicas que
se deben desempear, para construir un Data Warehouse.
Funciones
Analista de Negocios
Arquitecto Tcnico
Instructor
DBA - Administrador de la
Base de Datos
Director de Proyecto
Desarrollador de Reportes
Desarrollador de rutinas ETL
Soporte Tcnico
El organigrama del grupo base del proyecto Data Warehouse es como sigue:
60
Director de
proyecto
Arquitecto
Tcnico
Analista de
Negocios
DBA del
Warehouse
Desarrollador
de Rutinas
ETL
Desarrollador
de Reportes
Instructor
61
C.
Factibilidad Econmico-Financiera
Para efectuar el estudio de Factibilidad econmico-financiera resulta
62
1.
Cuantificacin de la inversin
Todos los costos que aparecen en el presente apartado son expresados en
Dlares Estadounidenses (US, $), por motivos del deslizamiento de la moneda nacional con
respecto al mismo. Adems de los costos de hardware y software que representan el grueso
de la inversin en el proyecto, ser necesario conocer los siguientes costos
complementarios:
Dotacin: Son los recursos humanos que intervendrn como grupo base en el
desarrollo del proyecto de Data Warehouse, es preciso detallar el sueldo que
percibirn, para la totalidad de puestos y vacantes, se puede establecer por proyecto
o por periodo de tiempo.
Cant
(unit)
Tiempo
(mes)
Sueldo
(mes)
Costo Total
Analista de Negocios
1.50
$600.00
$900.00
Arquitecto Tcnico
2.50
$600.00
$1,500.00
Instructor
0.50
$450.00
$225.00
DBA
1.50
$800.00
$1,200.00
Desarrollador de Reportes
1.50
$500.00
$1,500.00
2.00
$600.00
$2,400.00
Director de proyecto
4.75
$900.00
$4,275.00
Soporte Tcnico
0.50
$450.00
$225.00
TOTAL
$12,225.00
63
Nombre Tarea
Definicin del Proyecto
Planeacin y Administracin del proyecto
Definicin de los Requerimientos del usuario
Modelado Dimensional
Anlisis de las fuentes de Datos
Diseo de la Arquitectura Tcnica
Seleccin de Productos
Instalacin de Productos
Diseo fsico de la Base de Datos
Implementacin fsica de la Base de Datos
Diseo y Desarrollo de la preparacin de datos
Poblacin y Validacin de Datos
Ajustes de Desempeo
Especificacin de las aplicaciones de usuario final
Desarrollo de las aplicaciones de usuario final
Prueba del sistema completo
Duracin
5 das
140 das
6 das
22 das
10 das
18 das
10 das
12 das
21 das
30 das
40 das
18 das
16 das
5 das
33 das
3 das
Total das
140 das
Elementos Fsicos: Existen requerimientos para el desarrollo del proyecto que son
de carcter fsico y forman parte de la infraestructura que servir de soporte al Data
Warehouse, su consideracin en la factibilidad econmica-financiera ayuda a
precisar los costos totales del desarrollo del proyecto. Los elementos en la categora
disponible significa que existen a la disposicin dentro de la empresa y no deben ser
adquiridos.
Tabla IV-7.- Costos de Infraestructura
Concepto
Mobiliario
Instalacin
elctrica
Elemento
Cant
(unit)
Disponible
(S/N)
Costo
Unitario
Costo Total
$180.00
$180.00
$20.00
$20.00
Regulador de tensin
$60.00
$60.00
Ramal trifsico
$15.00
$15.00
Puesta a tierra
(Jabalinas de cobre)
$8.00
$8.00
TOTAL
$283.00
64
A estos costos se debern agregar los que tiene el estudio tcnico: Costo de
Hardware, Software, ms Cargos por instalacin y Servicio Tcnico.
Tabla IV-8.- Costos Hardware y Software
Elemento
Cant
Disponible
Valor Unit
Total
(S/N)
DBMS
Modelador de Datos
Herramienta de Acceso a Datos
Sistema Operativo
Ofimtica
Cargos por instalacin
Servidor Hewlett Packard
Servidor Compaq
Impresoras
5
1
1
5
1
1
1
1
2
N
S
S
N
S
N
N
N
N
$188.48
$2,900.00
$468.00
$33.00
$130.00
$100.00
$9,923.00
$7,931.55
$747.00
$942.40
$2,900.00
$468.00
$165.00
$130.00
$100.00
$9,923.00
$7,931.55
$747.00
2.
Anlisis Comparativo
En primer lugar se establecer el monto de inversin inicial, que incluye gastos
por nica vez, y luego, el cargo mensual del nuevo centro de costos.
El cargo inicial del proyecto para que este pueda ser puesto en marcha, est
compuesto por los conceptos de Dotacin de Personal, Hardware, Software, Mobiliario,
Instalacin Elctrica y Sistema de Seguridad, los costos de elementos fsicos y hardware
considerados para los elementos que estn disponibles en la empresa se sustituyen por valor
cero ($0.00) para el anlisis comparativo, en el caso del software se establece valor nulo
para el software ya licenciado, as el costo total de adquisicin al que ascienden las
opciones A y B aparecen a continuacin:
65
Opcin A
Dotacin de Personal
Hardware
Software
Mobiliario
Instalacin Elctrica
TOTAL
Opcin B
$11,725.00
$10,670.00
$1,107.40
$40.00
$60.00
$11,725.00
$8,678.55
$1,107.40
$40.00
$60.00
$23,602.40
$21,610.95
Los costos mensuales estimados, estn dados por los conceptos de suministros
para los equipos y del personal de mantenimiento y estos estn en relacin directa con el
uso que se haga del Data Warehouse, un estimado de dichos costos aparece en la siguiente
tabla:
Tabla IV-10.- Costos mensuales del proyecto
Concepto
Suministros
Personal de Mantenimiento
TOTAL
3.
Valor total
$30.00
$400.00
$430.00
66
pero experiencias similares alrededor del mundo aseguran que si un data Warehouse es bien
implementado y se encuentra en explotacin el retorno a la inversin es halagador.
El costo total estimado para la primera fase de este proyecto es de $23,602.40
para la primera opcin, y de $21,610.95 para la segunda, pero los beneficios obtenidos
indudablemente justifican tal inversin dado que la organizacin funcionar de una manera
ms eficaz y gil, produciendo un alto retorno a la inversin.
En este estudio se han ahorrado las consideraciones sobre la seguridad fsica de
los equipos de cmputo que albergarn al Data Warehouse, debido a que se encuentra fuera
de los objetivos y alcance de este estudio. Se da por sentado que al ser el Data Warehouse
un activo estratgico de una organizacin las medidas para su proteccin sern igual o
incluso ms meticulosas y cuidadosas que las que se tomen para proteger el entorno
transaccional. Las medidas que apliquen en cada empresa estarn en dependencia directa de
su situacin organizacional.
Para el caso de la empresa objetivo, la localizacin fsica del Data Warehouse
ser en las instalaciones del centro de cmputo de la empresa, el cual fue previamente
acondicionado con las condiciones y polticas de seguridad que amerita el entorno
67
tecnolgico operativo de la financiera, motivo por el que no se considera como parte de los
costos del proyecto los costos de seguridad fsica.
Consideraciones sobre la Contratacin de un Servicio Externo de Computacin
La opcin de outsourcing para la elaboracin de un proyecto de DW para la
empresa en cuestin no presenta una ventaja en costo beneficio, debido al alto costo de los
profesionales expertos en la tecnologa de Data Warehousing, los cuales tendran que ser
reclutados en el exterior. Esto trae consigo adems de costos de desarrollo, problemas con
el mantenimiento.
En cambio es posible contratar al profesional que desempear el rol de
Director de Proyecto para que gue y coordine al grupo base conformado de recursos
humanos pertenecientes a la empresa, los cuales tienen la ventaja de conocer ya la situacin
y contexto de la organizacin. Adems, se evita la problemtica con el mantenimiento.
D.
Factibilidad Legal
Se deben considerar conceptos legales externos a la institucin, como parte de
la factibilidad de un proyecto, para ello se toman en cuenta las leyes vigentes en este
momento en el pas que pueden afectar el desarrollo de un proyecto de Data Warehouse,
por lo que es necesaria su consideracin. Las leyes a discutir son:
La ley de Derechos de Autor
Ley de Derechos de Autor aprobada por la Asamblea Nacional de la Repblica
de Nicaragua y publicada por el diario oficial La Gaceta en su edicin del treinta y uno
de Agosto de mil novecientos noventa y nueve.
El marco legal de esta ley afecta directamente al proyecto ya implica la
utilizacin de recursos de informticos de Software como parte integrante del proceso de
desarrollo del Data Warehouse, los cuales estn protegidos por la ley de derechos de autor y
derechos de propiedad.
El corolario, de lo expuesto en la ley se traduce en disposiciones para la
adquisicin y legalizacin de todo producto informtico que deba utilizarse y que se
encuentre protegido por la Ley de Derechos de Autor para no ser ilegal o sujeto de duda.
68
las
creaciones
originales
derivados
literarios,
artsticos,
cientficos
independientemente de su gnero, mrito, forma actual o futura tales como [...], programas
de cmputo, sean stos programas fuentes o programas objetos y cualquiera que sea su
modo o forma de expresin.
Capitulo VI se expresa otra regulacin importante de ser tomada en cuenta: La
Transmisin de Derechos Patrimoniales, en el arto.52 expresa que cuando se trate de una
obra realizada por un actor por cuenta de persona natural o jurdica en el marco de un
contrato de trabajo y de su empleo, salvo disposicin en contrario del contrato, el primer
titular de los derechos morales y patrimoniales ser el autor, pero los derechos
patrimoniales sobre dicha obra se considerarn transmitidos al empleador en la medida
justificada por las actividades habituales del empleador en el momento de creacin de la
obra.
La Ley de Derechos de Autor obliga a todo aquel que haga uso de programas de
cmputo a adquirir las debidas licencias, para no infringir dicha ley, ni ser objeto de multas
por su desobediencia.
El presente proyecto requiere de la adquisicin de diversos programas de
cmputo para su desarrollo. En la mayora de los casos ya se cuenta con la licencia
requerida para dichos programas de cmputo, pues fueron previamente adquiridos por la
institucin, pero en algunos otros se debern adquirir durante el desarrollo.
Conclusin:
69
Otras Consideraciones:
Sigilo Bancario
Daos a Terceros
E.
atractiva desde el punto de vista de desempeo versus monto invertido, sin embargo la
opcin B es una alternativa un poco ms econmica, sin que ocurra una disminucin muy
significativa en el desempeo.
La opcin de outsourcing para este proyecto debe ser estudiada con cuidado,
para no elevar significativamente el monto total a invertir en el proyecto. Es importante,
para asegurar el xito del proyecto definir un adecuado programa de capacitacin para el
personal de la institucin que intervendr en el mismo.
V.
70
71
La gua entonces, est estructurada en etapas ms que en pasos, pues los pasos
pueden variar en cada proyecto, pero no as las etapas que este involucra.
1.
2.
3.
4.
en una institucin financiera de tamao mediano que opera en el mbito nacional, bajo la
modalidad de un proyecto piloto para la introduccin de una plataforma analtica que
brinde ventajas competitivas a la organizacin. El desarrollo mencionado servir entonces
para propsitos ilustrativos de cada etapa de la gua.
En el entorno operativo de dicha institucin financiera, en la cual se desarrolla
el proyecto piloto que servir de ejemplificacin, se presentan ciertas condiciones
organizaciones que influye y determinan en cierta medida los ejemplos que se detallan para
ilustrar la gua. Con miras a lograr la adecuada comprensin de los ejemplos presentados se
debe considerar los siguientes elementos:
1. La institucin financiera consta de ms de una sucursal. Todas las sucursales son
totalmente operativas.
2. El principal rubro de operacin de la financiera lo constituyen los crditos otorgados
a los clientes. Los clientes disponen de una variedad de productos financieros entre
los cuales pueden escoger el que mejor les convenga a sus intereses.
3. Todo crdito gestionado est a cargo de un analista de crdito que realiza los
trmites que la empresa requiera e interacta directamente con el cliente.
4. La plataforma tecnolgica operativa est compuesta por Microsoft Windows 2000
Server como Sistema Operativo de Servidores y Microsoft Windows XP en las
estaciones de trabajo, Microsoft SQL Server 2000 es el Sistema para Gestin de
Bases de Datos, una aplicacin que consta de siete mdulos desarrollada con Visual
Fox Pro 7.0 denominada LFS como sistema transaccional y una aplicacin en
Clipper encargada de administrar la planilla.
72
A.
como un Data Warehouse, al iniciarlo hay que establecer slidas bases tericas que
permitan vislumbrar un plan de accin efectivo y que minimice el riesgo de fracaso y
dominar, adems los elementos y herramientas que intervendrn en el desarrollo de dicho
proyecto.
El desarrollo de un Data Warehouse no debe ser iniciado mientras no se tenga
suficiente dominio sobre la filosofa detrs del proyecto, la forma en la que se puede
realizar y cuales son los objetivos que se pretende alcanzar, este es el mapa que dirige el
camino del proyecto. Para un Data Warehouse es prioritario reconocer las necesidades
analticas que tiene una organizacin y establecer los objetivos que se persiguen al
desarrollar un Data Warehouse en la organizacin en la que se desarrolle. Este es el
primer paso a seguir, el anlisis y la comprensin del nuevo entorno, el entorno analtico.
Esta etapa se debe cubrir con miras a cumplir los siguientes enunciados:
1. Entender las principales diferencias entre un Data Warehouse y un sistema
transaccional.
2. Establecer y delimitar la diferencia entre un Data Warehouse Corporativo y los Data
Marts, asimilar el objetivo de los distintos enfoques y su aplicacin a la situacin de
la empresa.
3. Reconocer que patrones han sido exitosos en la industria y los errores que se han
cometido.
4. Identificar y comprender las distintas herramientas a utilizar en las distintas etapas
del desarrollo, asimilar las tcnicas de modelado utilizadas en el Data Warehouse o
en los Data Marts y otros instrumentos.
5. Identificar y establecer qu es lo que los directores de la organizacin esperan
obtener con la implementacin del proyecto.
6. Determinar la viabilidad del proyecto mediante la realizacin de un Estudio de
Factibilidad.
73
74
B.
75
concepcin lo que lo convierte en un recurso valioso para detallar los distintos elementos
que componen la arquitectura de un Data Warehouse.
Esta arquitectura y sus resultados pueden, sin embargo, ser alcanzados
utilizando algunas tcnicas muy apropiadas apuntadas por los otros autores.
Resultados de la Arquitectura
De los elementos podemos destacar como principales resultados de la
aplicacin de la arquitectura de Data Warehouse los siguientes entregables, previamente
abordados con mayor detalle:
1. El modelo de datos fuente.
2. El modelo de datos conceptual Data Warehouse.
3. Arquitectura tecnolgica Data Warehouse.
4. Estndares y procedimientos para desarrollo y mantenimiento del Data Warehouse.
5. El plan de implementacin incremental para el Data Warehouse.
6. Definicin a distintos niveles de los componentes del Data Warehouse.
Los modelos de datos proveen una estructura para identificar, nombrar,
describir y asociar los componentes de una base de datos. En general se necesitan modelos
de datos para los datos fuente como para los datos seleccionados para existir en el Data
Warehouse y la estructura que estos presentarn en el nuevo entorno.
El primer entregable de esta etapa consiste en el establecimiento del modelo de
datos fuente, en este aspecto Inmon introduce el anlisis al Diagrama Entidad Relacin de
la empresa y a los distintos elementos del desarrollo de sistemas transaccionales para
identificar elementos de inters del proyecto de Data Warehouse.
Para los propsitos de desarrollo del proyecto en mencin, esto es muy
adecuado y como resultado de su ejecucin se pudo comprobar que el estudio inicial de
modelo de datos de la organizacin permite que se obtenga el dominio necesario del mismo
para poder desenvolverse con soltura en las etapas sucesivas del mismo.
El modelo de datos de una organizacin puede estar ms o menos normalizado
y en ocasiones presentar cierto grado de redundancia o derivacin de datos con el objetivo
de suplir ciertas necesidades de informacin. Es aconsejable identificar estos aspectos para
76
seleccionar solamente los datos originales ya que estos son ms fiables que los derivados y
son una buena pista para reconocer informacin importante para la empresa.
En la Ilustracin V-1 se puede apreciar una muestra del Modelo de Datos del
Sistema Transaccional de la financiera sobre la que se aplic la gua y en la cual se
distingue claramente que el modelo no est normalizado. Aqu cabe hacer un sealamiento
sobre la presencia de llaves inteligentes (el campo ccodcta es compuesto) y sobre los
nombres de campos nada descriptivos (csececo significa sector econmico), propios de los
sistemas transaccionales, pues facilitan la programacin de aplicaciones, pero que impide
deducir el significado de los datos contenidos en el campo.
77
78
79
Promociones de Mercadeo
Circunstancia
Productividad
Modo Pago
X
X
Cobranzas
Embargos
Quejas
X
X
X
X
Cuenta LM
Rentabilidad
Garanta
**Mora
Fuente Finan
**Colocaciones
Convenio
Tasas
Sucursal
Hora
Producto
Fecha_Final
Cliente
Fecha_Vencimiento
**Recuperaciones
Analista
Data Mart
Fecha
80
Ao
Calendario
Trimestre
Fiscal
Trimestre
Calendario
Ao
Fiscal
Mes
Calendario
Semana
Fiscal
Semana
Calendario
Tipo de Da
Da de
Semana
Da
Festivo
81
en un diagrama de entidades que presentar cada uno de los campos que contiene cada tabla
de hecho o dimensin, el nombre lgico que recibirn y las llaves primarias de cada tabla.
El siguiente paso es transformar el Diagrama de Entidades al diseo fsico que
le corresponde, este diagrama adems mostrar las caractersticas de los campos en
dependencia del tipo de dato que debe albergar (tipos de datos y longitud, por ejemplo).
En la ejecucin de este nuevo procedimiento, se hizo uso de la herramienta
Oracle / Designer 2000. Esta eleccin obedece a las bondades de la aplicacin de permitir
pasar de una definicin de alta abstraccin como un Diagrama de Entidades, hasta el script
de definicin para la generacin de la Base de Datos, segn la plataforma destino que se
haya elegido, sin ms entrada de datos que la necesaria para realizar el diagrama de entidad,
en el que tambin se indica que tipo de datos y longitud contendr el campo. Designer
tambin permite el trabajo en equipo, donde dos o ms diseadores pueden estar trabajando
sobre las mismas entidades y elementos sin corromper el diseo. Su salida grfica es
sencilla y muy descriptiva, lo que facilita la interpretacin de los diagramas.
La Ilustracin V-3 muestra una parte del diagrama de entidades para la
financiera ejemplo, se pueden observar algunas dimensiones importantes como Cliente,
Analista, Producto y una tabla de hechos, la tabla de Abonos de Crditos que se encuentra
en el extremo izquierdo.
Como se muestra claramente en la Ilustracin V-3, el diseo del Data
Warehouse dista mucho del diseo del sistema transaccional y como ejemplo puedo
nombrar las tablas de Cliente_Dim y Abono_Credito_Fact, que corresponden a una
dimensin y una tabla de hechos respectivamente.
82
83
se observ que dada la situacin particular del pas en donde la moneda nacional se desliza
de manera diaria en comparacin con el dlar, era necesario indicar de forma separada el
monto abonado en este concepto y que no se incluya en ninguno de los otros conceptos, ya
que de lo contrario no se podra conocer el impacto, que para la empresa tiene una poltica
monetaria de pas como sta y tambin se podra dar la impresin que el total recuperado es
mucho mayor que las cantidades desembolsadas a los clientes originalmente.
Leyenda:
Obligatorio
Opcional
789 Numrico
A Carcter
31
Fecha
84
85
C.
sistemas de aplicacin, dichos datos son extrados de las restricciones y lmites impuestos
por las aplicaciones que los originaron, luego deben ser estandarizados e integrados para
proveer una perspectiva de informacin que traspasa los procesos la cual es esencial para el
anlisis de utilidades.
Una vez que se tiene en su lugar el modelo de datos del Data Warehouse es
necesario poblar su estructura con sus datos respectivos, pero para lograr que los datos del
sistema transaccional se acomoden y quepan en el entorno analtico y se conviertan en
informacin, es necesario que dichos datos sufran procesos de transformacin que los
reconcilien, limpien y enriquezcan ya sea dividindolos en algunos casos, fusionndolos en
otros, adicionndolos, o derivndolos y que posteriormente estn listos para que cumplan
apropiadamente su nuevo rol como base para la toma de decisiones.
Con estos requerimientos plenamente identificados se toma en cuenta adems la
situacin empresarial nicaragense, cabe destacar que las condiciones ms comunes, de los
sistemas organizacionales, consiste en implementaciones que abarcan distintos DBMS y/o
distintos lenguajes de programacin, otro aspecto es que la tecnologa de informacin
predominante es moderna, con apenas un poco ms de una dcada de antigedad o menos
en la mayora de los casos.
La etapa del Enriquecimiento de Datos como se le ha designado en la gua debe
proveer mecanismos para realizar la migracin de datos desde los sistemas fuente, que
pueden residir en distintas plataformas y transformarlos hasta que estn en condiciones de
poblar el Data Warehouse, para servir de ayuda en la toma de decisiones. Esta es la etapa
ms tardada y que ms esfuerzos necesita, en lo relativo a la cantidad de trabajo por
86
87
fuentes de datos externas que sean necesarias incluir para desarrollar la informacin
pertinente en el Data Warehouse. La tabla de correspondencia completa aparece tambin en
el Anexo G.
Tabla V-2 Correspondencia Fuente Destino
Tabla Destino
Columna Destino
Fecha_Clave
Tipo de
Datos
Integer
Tabla
Fuente
Credkar
Campo
Fuente
Dfecsis
Abono_Credito_Facts
Abono_Credito_Facts
Fecha_Vence_Clave
Integer
Credkar
Dfecpro
Abono_Credito_Facts
Hora_Clave
Integer
Cjgdlog
Dfectrx
Abono_Credito_Facts
Analista_Clave
Integer
Credkar
Ccodcta
Abono_Credito_Facts
Cliente_Clave
Integer
Abono_Credito_Facts
Sucursal_Clave
Integer
Credkar
cremcre
Credkar
ccodcta ,
ccodcli
Ccodcta
Abono_Credito_Facts
Convenio_Clave
Integer
Abono_Credito_Facts
Producto_Clave
Integer
Credkar
cremcre
Credkar
cremcre
Abono_Credito_Facts
Circunstancia_Clave
Integer
Abono_Credito_Facts
Monto_Total_Abono
Numeric(82)
Credkar
cremcre
Credkar
ccodcta
ccodgru
ccodcta
ccodpro,
cdescre
csececo
Ccodcta
Abono_Credito_Facts
Principal_Abono
Numeric(82)
Credkar
Nmonto
Abono_Credito_Facts
Interes_Abono
Numeric(72)
Credkar
Nmonto
Abono_Credito_Facts
Servicios_Abono
Numeric(72)
Credkar
Nmonto
Abono_Credito_Facts
Interes_Mora
Numeric(72)
Credkar
Nmonto
Abono_Credito_Facts
Dias_Mora
Integer
Credkar
Abono_Credito_Facts
No_Recibo_Caja
Varchar(12)
Credkar
dfecpro
dfecsis
Cnrodoc
Abono_Credito_Facts
No_Credito
Varchar(12)
Credkar
Ccodcta
Abono_Credito_Facts
No_Cuota
Integer
Credkar
Cnrocuo
Abono_Credito_Facts
Monto_Total_Cuota
Numeric(72)
credppg,
credgas
ncapita ncappag +
intere
nintpag
Nmonto
88
89
90
Cuando el rea de Preparacin de Datos est inmersa en una capa del Data
Warehouse, como propone Devlin, el rea de almacenamiento permanente requerida puede
disminuir, si los datos son desechados luego de la carga. Sin embargo, hay que apreciar que
sobre esta capa existe la capa de datos derivados, anloga a los Data Marts dependientes de
Inmon, lo que efectivamente aumenta de forma considerable los requerimientos de
almacenamiento para albergar simultneamente ambas capas, se aumenta el tiempo de
desarrollo del proyecto, lo que tambin provoca una elevacin en los costos y entra en
contradiccin con el objetivo de la gua de adaptarse al contexto nicaragense en el que las
empresas medianas y grandes se veran en dificultad para disponer de recursos suficiente
para el mantenimiento de ambas capas paralelamente.
El ODS de Inmon requiere un esfuerzo similar al de desarrollar un Data
Warehouse para su construccin, pero no es una plataforma para el anlisis sino de
monitoreo, valga hacer la salvedad que luego que se desarrolla un ODS, la construccin de
un Data Warehouse, es mucho ms sencilla pues ya se cuenta con una plataforma de datos
de calidad. Si se utiliza un razonamiento anlogo al aplicado a la propuesta de Devlin, se
aprecia que la introduccin de una nueva plataforma para el ODS, sin embargo, podra
tener un costo restrictivo para el proyecto.
Inmon aparte de la proposicin del ODS deja abierto el criterio sobre la forma
en la que se deben preparar o reconciliar los datos al igual que Kimball.
En la presente gua de ambas propuestas se consolid una proposicin atractiva
en la que se disminuye el costo de desarrollo, la redundancia y la necesidad de
almacenamiento, considerando siempre el objetivo de la gua de mantenerse en el marco
empresarial nicaragense. El rea de preparacin de Datos, ser una Base de Datos de
transicin que albergar los datos que estn en proceso de transformacin mientras las
rutinas de ETL hacen su trabajo, hasta que stos no sean depositados en su destino final
dentro del Data Warehouse, y que una vez completada la carga de datos, es limpiada de
contenido, dejando solamente su estructura, a menos que alguna consideracin propia de
cada proyecto indique que stos deben permanecer. Siempre se reservar cierto espacio
dispuesto para contener los datos en el momento en que se estn llevando a cabo las
transformaciones, para posteriormente ser liberado. No se considera una capa ms del Data
Warehouse sino un espacio pre-formateado que sirve de apoyo para que los datos se
91
depositen mientras siguen su camino al Data Warehouse, que podra estar conformado de
Data Marts y no en dos capas.
En el Anexo F aparece la definicin del rea de Preparacin de Datos del
proyecto que se utiliza de ejemplo.
Pasando ahora a la siguiente resulta de esta etapa, las rutinas de Extraccin de
Datos, deben ser diseadas siguiendo los estndares definidos en la arquitectura, con el
objetivo de minimizar el esfuerzo necesario para implementar los distintos pasos de la ETL
al Data Warehouse y que la ETL sea lo ms eficiente posible. Este aspecto es
fundamentalmente importante cuando existen varias personas trabajando en el desarrollo de
las rutinas de ETL para que los distintos componentes se unan y funcionen de manera
apropiada. Aunque sta no es la parte ms difcil si consume mucho tiempo y recursos para
definir las rutinas siguiendo los patrones ya establecido y el nivel de detalle suficiente.
D.
probabilidad de xito si se construye mediante incrementos, que permitan que los usuarios
tengan prontamente a su disposicin un subconjunto del Data Warehouse completo y se
inicie la retroalimentacin y ajustes al desarrollo. Por supuesto, que no se debe
menospreciar los beneficios que esta modularidad implica para las finanzas de un proyecto.
Las tres metodologas abordadas, presentan aproximaciones distintas de
construccin en incrementos.
Inmon, por ejemplo, coloca primero todo el diseo del Data Warehouse en su
lugar y luego indica la eleccin de subconjuntos del Data Warehouse Corporativo para
implementar, sin embargo los usuarios solo comienzan a explotar el desarrollo del Data
Warehouse, hasta que aparecen los Data Marts dependientes y eso ser hasta que se
complete la construccin del Data Warehouse corporativo. Devlin presenta una propuesta
parecida.
92
93
94
Cada icono representa una conexin con una Base de Datos o una tarea del
DTS. Las tareas pueden ser tan sencillas como la ejecucin de una sentencia SQL o ms
complejas como transformaciones de registros con base a criterios especificados con los
lenguajes de sripting que soporta.
Para que los usuarios inicien la explotacin del Data Warehouse, ste debe
contener los datos de la compaa. A pesar de todo el cuidado y dedicacin que se haya
puesto en las etapas anteriores siempre habr que hacer algunos ajustes cuando llegue el
momento final en que se realiza la poblacin completa por primera vez y todas las piezas
pasen a ocupar su lugar respectivo y a interactuar con las dems. Luego habr que
monitorear persistentemente la carga del Data Warehouse y sus componentes para que esta
se est realizando libre de errores, adems de verificar su desempeo con el objetivo de
hacer ajustes de mantenimiento y de optimizacin de procesos y de la base de datos del
Data Warehouse.
95
96
proyecto depende de que tan bien y til sean las herramientas de acceso a datos, para que se
obtenga el mayor beneficio posible del la informacin contenida en el Data Warehouse. Es
necesario mencionar que las herramientas a elegir deben ser configurables hasta el punto
que se puedan adaptar adecuadamente al ambiente de la organizacin y tratar de disminuir
al mnimo posible la curva de aprendizaje y sin perder de vista un adecuado balance costo beneficio. En esta parte se incluye la instalacin de las herramientas en el ambiente del
usuario y su preparacin para el uso.
Para poner la carga de prueba en manos de los usuarios y determinar el xito
del proyecto piloto desarrollado en la financiera, se utiliz como herramienta de acceso a
datos un servicio propio de SQL Server 2000, cuyo nombre es OLAP Server, el cual brinda
la posibilidad de gestionar multidimensionalmente cubos de datos de n-dimensiones a partir
de la informacin obtenida del Data Mart. La definicin de los cubos, indica se realicen y
almacenen los clculos de agregacin para cada posible combinacin de hechosdimensin
que conforman el cubo.
Una vez creados los cubos, estos pueden proporcionar su informacin para ser
analizada a las aplicaciones cliente que as lo requieran, como los cubos fueron construidos
con el Servidor OLAP de SQL Server 2000 pueden consultarse utilizando una simple hoja
de clculo de la aplicacin Excel que viene incluida en la Suite Office de Microsoft. Excel
utiliza para hacer consultas al cubo fuente, una tabla dinmica que tenga como origen de
datos el cubo previamente definido y procesado. En la Ilustracin V-6 se puede apreciar un
reporte elaborado de la forma anteriormente descrita.
97
98
99
CONCLUSIONES
Con esta gua se demuestran los elementos esenciales del desarrollo de un Data
Warehouse con el propsito de que sirva de partida a los noveles en la materia y darle
sentido a las numerosas metodologas disponibles.
Existen muchas estrategias de Data Warehouse contradictorias y similares a la
vez que han tenido xitos en diferentes ambientes empresariales que dificultan el
aprendizaje y dominio de esta tecnologa a los noveles en la materia. Adaptar y conciliar las
metodologas de Data Warehousing ms difundidas en el mercado tiene un alto sentido,
pues permite la creacin de un marco de trabajo que engloba elementos cuya aplicacin
adecuada ha demostrado asegurar la realizacin y utilidad de un proyecto de Data
Warehouse.
El desarrollo de un proyecto de Data Warehouse introduce un nuevo entorno en
el cual es posible obtener informacin vital para la empresa casi instantneamente lo que
habilita la toma de decisiones que mejoren el desempeo de la compaa y los rditos que
sta obtiene. Adems, pone al descubierto problemticas en los sistemas transaccionales
que son origen de debilidades y que deben ser solucionados. Un Data Warehouse es parte
de los sistemas de informacin corporativos.
La forma que cada organizacin y equipo elija para implementar las etapas de
la gua y la utilizacin o no de las herramientas presentadas es decisin de los responsables
de cada proyecto de Data Warehouse y estar en dependencia de lo que ms le convenga a
los intereses de la organizacin.
Se debe propiciar el desarrollo de proyectos del tipo de Data Warehouse como
una herramienta para hacer ms competitivas las empresas nicaragenses en crecimiento,
sin embargo la implementacin de un entorno analtico debe ser cuidadosamente analizado
para no correr el riesgo de realizar una alta inversin y no generar beneficios para la
organizacin. No hay que olvidar que la justificacin de una empresa para la inversin en la
construccin de un Data Warehouse, es que el Data Warehouse suplir la necesidad de
informacin estratgica que tiene la empresa y no precisamente del tamao que sta
presenta.
100
101
RECOMENDACIONES
Las recomendaciones sirven de base para que futuros trabajos que tomen como
referencia el presente estudio monogrfico, estn en mejores condiciones de poder
realizarse con xito. Esto deriva del hecho de que se cuenta con la ventaja de aprovechar
recomendaciones basadas en la experiencia, que sirvan para evitar cometer errores graves
como menospreciar tpicos importantes que afecten considerablemente el proyecto, lo cual
sin duda es valioso y se encarga de complementar las conclusiones a las que se lleg con el
desarrollo.
De la realizacin del presente estudio monogrfico se desprendes las siguientes
recomendaciones:
1.
2.
3.
4.
5.
102
6.
INDICE DE ILUSTRACIONES
Ilustracin I-1 Diferencias entre Sistemas Operacionales y Data Warehouse...................... 4
Ilustracin I-2. Arquitectura de tres capas............................................................................. 8
Ilustracin I-3. Estructura BII. ............................................................................................. 12
Ilustracin I-4. Estructura BIG ............................................................................................ 14
Ilustracin I-5. Metodologa Data Warehouse de Inmon..................................................... 23
Ilustracin I-6 Ciclo de Vida Dimensional para implementar un Data Warehouse............ 27
Ilustracin IV-1 Organigrama.............................................................................................. 60
Ilustracin V-1 Modelo de Datos de una Financiera........................................................... 76
Ilustracin V-2- Dimensin Fecha ....................................................................................... 80
Ilustracin V-3 Diagrama de Entidades............................................................................... 82
Ilustracin V-4 Diseo fsico de la base de datos del Data Warehouse .............................. 83
Ilustracin V-5 Paquete DTS de carga a una tabla de hechos ............................................ 94
Ilustracin V-6 Informe de Colocaciones............................................................................. 97
INDICE DE TABLAS
Tabla I-1.- Diferencias entre Data Warehouse y las Bases de Datos Estndar .................... 5
Tabla I-2. Marco de Trabajo de la Arquitectura.................................................................. 33
Tabla III-1 Empresas en Nicaragua ..................................................................................... 50
Tabla IV-1 Requerimientos de Data Warehouse .................................................................. 54
Tabla IV-2 Alternativas de Adquisicin ............................................................................... 56
Tabla IV-3.- Opciones recomendadas .................................................................................. 57
Tabla IV-4.- Dotacin de Personal ...................................................................................... 59
Tabla IV-5.- Costos de Personal .......................................................................................... 62
Tabla IV-6-. Cronograma ..................................................................................................... 63
Tabla IV-7.- Costos de Infraestructura ................................................................................ 63
Tabla IV-8.- Costos Hardware y Software ........................................................................... 64
Tabla IV-9.- Costos Comparativos de opciones de compra................................................. 65
Tabla IV-10.- Costos mensuales del proyecto ...................................................................... 65
Tabla V-1 Matriz de Data Marts .......................................................................................... 79
Tabla V-2 Correspondencia Fuente Destino........................................................................ 87
ANEXO B: BIBLIOGRAFA
Bibliografa
[Devlin88]
[Devlin97]
[Geiger00]
[Humphries99]
[INEI97]
[Inmon92]
[Inmon296]
[Kimball98]
Kimball, Ralph, et. al. The Data Warehouse Lifecycle Toolkit, John
Wiley & Sons, 1998
[Mattison96]
[Porter85]
[SAS01]
[Simon01]
Cotizaciones de Equipos
Fecha:
30/08/2002
Ciudad: Managua
Pas:
Nicaragua
CODIGO: 354
CODIGO
DESCRIPCION
Total
P3549A
$2,338.28
$2,338.28
1
3
3
$1,350.00
$180.00
$570.00
$1,350.00
$540.00
$1,710.00
$736.17
$736.17
1
1
$619.00
$180.00
$619.00
$180.00
1
$1,272.00
1
$335.00
1
$64.00
1
$100.00
SUB TOTAL
$1,272.00
$335.00
$64.00
Procesador Pentium III DE 1.4 Ghz con capacidad de dos (2) procesadores
Memoria Cache L2: 512 kb en cada procesador
256 MB memoria RAM PC-133MHZ ECC SDRAM DIMM EXPANDIBLE A 4 GB
P3559A
D8266A
P4620A
P3410A
HP NetRAID 1M Controller
Tarjeta Controladora de Red Inteligente WAKE ON LAN, FAST
Ethernet de 10/100 Mbps Tarjeta de Red Incluida
Interfases: 2 serial, 1 paralelo, 1 Grafico, 1 puerto de Mouse PS/2
3.5" 1.44MB Unidad de Disco Flexible
6 Slots de Expansin PCI (4- 32 Bits, 2- 64 Bits)
HP NetServer Navigator, Symantec PC ANYWHERE
Conforme con SNMP, DMI e IPMI, incluye Top Tool de HP administracin
HP Mini DIN Mouse
HP NetServer Keyboard
Fuentes de Poder de 350Watts
P2535A
D8899A
C1556D
C7474A
C7434A
INST
$9,144.45
Plaza de compras, colonia C.A, P.O. BOX #2820, Managua, 3505-026, Nic.
Tel.(505) 278-8000 Ext: 150
e-mail:eddy.perez@corporacin.teran.com.ni
IGV
TOTAL
$1,371.67
$10,516.12
Cotizaciones de Equipos
Net Solutions
COTIZACION No 1321
No FAX:
CANT.
PRECIO
US $
TOTAL
US $
3,609.00
3,609.00
745.00
2,235.00
1,053.00
1,053.00
Condiciones :
Forma de Pago : 100% al aprobar cotizacin
Tiempo de Entrega : 10 das laborales
Oferta vlida por 15 das.
Sub Total US $
IGV 15%
Total
6,897.00
1,034.55
7,931.55
Cotizaciones de Equipos
CANT.
1
ESPECIFICACIONES TECNICAS
PRECIO
U$ 8,400.00
ESPECIFICACIONES DE LA PROPUESTA:
Este equipo estar disponible en nuestras instalaciones luego de 18 das a partir de la fecha en que se
reciba la orden de compra.
Esta oferta es vlida por 30 das.
La Garanta de Calidad por desperfectos de fbrica es de TRES aos.
ANEXO D: ENTREVISTAS
Entrevistas
Diseo de las Entrevistas
Gerencia General:
1. Cules son los objetivos de su organizacin? Cules son sus metas de
negocio de mayor prioridad? Qu est tratando de alcanzar?
2. Cules son sus mtricas de xito (indicadores)? Qu tan frecuente mide
sus factores clave de xito? Qu tipo de decisiones son las que usted
toma frecuentemente? Cmo sabe que est haciendo lo correcto?
3. Qu funciones y departamentos dentro de la organizacin son los
cruciales para asegurar que estos factores clave de xito sean alcanzados?
Qu rol juegan ellos? Cmo trabajan en conjunto para asegurar el xito?
4. Cules son las cuestiones (elementos) claves del negocio que usted debe
enfrentar en este momento? Qu impide que usted alcance dichos
objetivos? Cul es el impacto en la organizacin?
5. Cmo identifica problemas/excepciones o reconoce que va en direccin
hacia los problemas?
6. Qu visualiza como oportunidades adicionales de utilidades que no son
aprovechadas en este momento?
7. Dnde se sitan en el uso de tecnologa de informacin en comparacin
con la competencia?Se encuentra en la capacidad de responder
rpidamente a las condiciones del mercado y asegurar la productividad de
su staff?
8. Qu papel juegan los anlisis de datos en decisiones que deben hacer los
gerentes para dirigir el negocio?
9. Qu informacin necesita responder para mantener su puesto? Cul es
la 1er, 2da, 3ra... pregunta relativa a crditos/ganancias que usted debe
responder en su rea de trabajo?
10. Qu informacin clave se requiere para hacer o soportar las decisiones
que usted toma en el proceso de alcanzar las metas y sobreponerse a los
obstculos? Cmo obtiene esta informacin en este momento?
11. Cules son los reportes que ms le ayudan a hacer su trabajo? Qu
datos en el reporte son importantes? Cmo usa esta informacin? Si el
reporte fuera dinmico, que sera distinto en l?
Entrevistas
12. Qu preguntas le han quedado sin responder simplemente porque usted
sabe que no hay respuesta disponible? Existe alguna otra informacin
faltante que crea puede tener un impacto significativo en ayudarle a
alcanzar sus metas?
13. Qu tan difcil es en este momento conseguir esa informacin? Cmo
debera presentarse, de que forma? Qu tan frecuente la necesita: Diario,
Semanal, Mensual, Anual?
14. Qu capacidades analticas le gustara tener?
15. Qu oportunidades existen para mejorar dramticamente el negocio,
basado en un mejor acceso a la informacin? Cul es el impacto
financiero?
16. Qu debe alcanzar este proyecto para ser considerado exitoso? El criterio
debe ser mesurable.
Entrevistas
Gerencias de Crdito, Finanzas y Mercadeo:
1. Qu tipo de decisiones son las que usted toma frecuentemente?
2. Qu informacin necesita responder para mantener su puesto?
3. Cules son los indicadores que debe monitorear constantemente?
4. Si tuviera abundancia de informacin sobre su rea, que hara con ella?
5. Qu tan difcil es en este momento conseguir esa informacin?
6. Qu preguntas le han quedado sin responder simplemente porque usted
sabe que no hay respuesta disponible?
7. Qu tan frecuente necesita esta informacin: Diario, Semanal, Mensual,
Anual?Cmo debera presentarse esta informacin, de que forma?
8. Cul es la 1er, 2da, 3ra... pregunta relativa a crditos/ganancias que usted
debe responder en su rea de trabajo?
9. Cules son los reportes que ms le ayudan a hacer su trabajo?
10. Con quienes discute y analiza la informacin de su rea?
11. Cmo se organiza y funciona su departamento?Cmo fluye la
informacin en su depto?
12. Cmo le ayuda el sistema actual a desempear su trabajo y a la toma de
decisiones?
13. Cules son las metas de su rea? Cules son las prioridades de su
rea?
14. A que le llamara factor crtico de xito en su departamento?
15. Cmo ayuda la informacin de su rea al desempeo de la empresa?
Entrevistas
Gerencia de Sistemas:
1. Cules son las caractersticas de los sistemas actuales?
2. Haga una breve Descripcin de la plataforma tecnolgica con la que
cuentan
3. Cunto tiempo de informacin se tiene en lnea?
4. Qu tan estable es el modelo de datos de la organizacin?
5. Quines son los responsables de los mdulos de los sistemas
transaccionales?
6. Quines estn a cargo de los cambios en el sistema transacciones?
7. Existe algn tipo de documentacin sobre los sistemas que utiliza la
organizacin? Diccionario de Datos, Manuales Tcnico y de Usuario, por
ejemplo
8. Cules son los sistemas heredados o antiguos con los que se cuenta?
9. Existen datos histricos almacenados fuera de lnea? Cunto tiempo de
datos?
10. Dnde guardan el histrico?
11. Quin conoce la estructura de los datos del sistema transaccional? Estn
limpios?
12. Cules herramientas de usuario final para reportes y anlisis tiene la
empresa?
Entrevistas
Resultados de las Entrevistas
Objetivos
Prioridades
Factor crtico de
xito
Decisiones ms
frecuentes
Informacin
Clave
Indicadores
Disponibilidad
de informacin
Reportes de uso
ms frecuente
Gerencia General
Proveer servicios financieros innovativos, giles y ajustados a las
necesidades del mercado
Participar del veinticinco por ciento del mercado financiero en los
prximos cinco aos
Contar con una cartera de estipulada a mediano plazo.
Capitalizar cierto monto sobre las acciones.
Correcta seleccin de Clientes
Disminuir riesgos en la operacin financiera
Disponer de Recursos Humanos adecuados
Identificacin de riesgos y dificultades
Anlisis de problemas de la institucin
Coordinacin de las reas y sucursales de la empresa
Rendimiento de Capital
Rendimiento de Equidad
Determinar soluciones posibles a los problemas de la empresa
Aprobar estrategias y solicitudes presentadas por los directivos de
departamentos y sucursales
Anlisis del rendimiento sobre desembolsos
Anlisis de disponibilidad: Capacidad de pago de cuota, cobertura
promedio de las garantas
Lquidez
Rendimiento financiero
Costos financieros
Gastos Administrativos
Calidad de los activos y Comprobacin de activos
Productividad por analista
Recursos lquidos
Relacin de cantidad total por pasivo total
Estructura de la cartera por moneda contra el pasivo por moneda
Calidad de Cartera
Mora
Calidad de Cartera
Gastos Administrativos
Rentabilidad sobre capital
Productividad de Clientes por analistas
La informacin no esta accesible
Existen datos bsicos pero deben realizar clculos sobre ellos si se
quiere disponer de agregados.
Los datos tienen poco significado pues no estn relacionados para
la toma de decisiones.
Informes de Mora
Para cobranza
Resumen de contaminada
Informes de Colocaciones:
Entrevistas
Informacin
faltante
Frecuencia de
uso de
informacin
Forma de
presentacin
preferida
Interaccin con
dems
dependencias
Desempeo del
sistema actual
en la toma de
decisiones
Por fecha
Por actividad econmica
Por analista
Informes de Recuperaciones
Para cobranza
Por analista
Resumen de recuperaciones
Pagos recibidos
Informe de Saldos de Cartera
Calidad de Cartera
Informe de Liquidez
Contabilidad
Clasificacin de mora por:
Edad
Sexo
rea geogrfica
Garantas
Actividad Econmica
Inventario
Volumen de Venta
Sucursal -Analista
Clasificacin de la Cartera Activa por:
rea geogrfica
Producto
Monto
Calificacin del Sistema
Sector Econmico
Sexo
Sucursal Analista
Cruce entre las Clasificaciones anteriores
Semanal
Mensual
Reportes
Grficos
Gerencia Financiera
Gerencia de Crdito
Gerencia de Mercadeo
Gerencia de Sistemas
Recursos Humanos
Los reportes brindan datos crudos, que luego deben ser
procesados para poder realizar los informes gerenciales y otra
documentacin para monitorear el desempeo y tomar decisiones.
Entrevistas
Objetivos
Prioridades
Factor crtico de
xito
Decisiones ms
frecuentes
Informacin
Clave
Indicadores
Disponibilidad
de informacin
Reportes de uso
ms frecuente
Informacin
faltante
Gerencia Financiera
Obtener fondos necesarios para incrementar la Cartera y mantener
liquidez.
Liquidez mayor o igual al un porcentaje establecido en relacin con
la cartera bruta.
Registro contable de las operaciones.
Control Interno enfocado al control del efectivo
Mantener el flujo de recursos necesarios para las operaciones de la
institucin.
Garantizar procedimientos que regulen y controlen las operaciones
de caja, tesorera y contabilidad.
Cumplimiento de metas establecidas en presupuestos
Gestin de Recursos
Liquidez
Rentabilidad de la institucin
Autorizacin de traslados de fondos a sucursales
Gestin de desembolsos a entidades fuentes de financiamiento.
Venta o compra de devisas extranjeras
Estado de Liquidez
Estados Financieros
Estado de la Gestin de Recursos
Rentabilidad de Colocacin
Costo de Pasivos
Calce de plazos y calce de monedas
Gastos Administrativos
Saldos de Caja por cada Oficina
Nivel de Recuperacin
Nivel de Colocacin
Pagos de obligaciones
Gastos Administrativos reales
Comparacin ejecucin real contra el presupuesto
Es obtenida de las sucursales existentes.
Tambin por gestin de la Gerencia de Sistemas en donde se
encuentra la Base de Datos Central.
Datos de algunos crditos que se perdieron o corrompieron en la
migracin al sistema actual.
Estados Financieros
Plan de Negocios:
Direccin del volumen de colocacin / Recuperacin
Presupuesto de colocacin / Recuperacin
Gastos administrativos
Estados de Resultados Anual
Disponibilidades
Obligaciones
Reportes de cartera por fuentes de fondos :
Colocaciones
Recuperaciones
Mora
Entrevistas
Frecuencia de
uso de
informacin
Forma de
presentacin
preferida
Interaccin con
dems
dependencias
Desempeo del
sistema actual
en la toma de
decisiones
Informacin del
departamento
que ayuda al
mejor
desempeo de
la empresa
Entrevistas
Objetivos
Prioridades
Factor crtico de
xito
Decisiones ms
frecuentes
Informacin
Clave
Indicadores
Disponibilidad
de informacin
Reportes de uso
ms frecuente
Informacin
faltante
Gerencia de Crdito:
Asegurar una cartera de Calidad
Garantizar nivel de Calidad de los Clientes
Desarrollar productos atractivos al mercado
Desarrollar una metodologa crediticia eficiente y consistente
Cumplir con las metas de la empresa
Mantener niveles saludables de Saldos de Cartera
Asegurar una Cartera Sana
Mantener una Cartera Sana
Aprobacin de Crdito: revisin de expedientes
Medidas de contencin para clientes Morosos
Gestin del Manual de Crditos
Gestin de Procedimientos de Crdito
Contratacin / Despidos
Nivel de Colocacin
Nivel de Recuperacin
Calidad de Cartera
Concentracin de mora
Productividad de los analistas
Productividad de las Sucursales
Tiempo de Procesamiento de Solicitud
Mora
Colocacin
Recuperacin
Productividad
Margen de Ganancia por Productividad
Se dispone de informacin elemental. Otra informacin se puede
conseguir a travs de la Gerencia de Sistemas.
Informe de Mora
Informe de Colocaciones
Informe de Recuperaciones
Informe de Saldos de Cartera
Reporte de Mora por Calificacin del Sistema
Clasificacin de Clientes por tamao de su negocio
Nivel de Ingreso de los Clientes
Distribucin Geogrfica de los Crditos
Consolidados Anuales
Clasificacin de la Cartera Activa por:
rea geogrfica
Producto - Monto
Calificacin del Sistema
Sector Econmico
Sucursal Analista
Sexo
Cruce de Clasificaciones
Entrevistas
Frecuencia de
uso de
informacin
Forma de
presentacin
preferida
Interaccin con
dems
dependencias
Desempeo del
sistema actual
en la toma de
decisiones
Informacin del
departamento
que ayuda al
mejor
desempeo de la
empresa
Diario
Mensual(consolidado)
Reportes
Gerencia General
Gerencia Financiera
Gerencia de Mercadeo
Gerencias de Sucursales
Ayuda a resolver necesidades de informacin en un 70%
Informe de consolidado se debe hacer manual
ndice de Colocacin
ndice de Recuperacin
Saldos de Cartera
Entrevistas
Objetivos
Prioridades
Factor crtico de
xito
Decisiones ms
frecuentes
Informacin
Clave
Indicadores
Disponibilidad
de informacin
Reportes de uso
ms frecuente
Informacin
faltante
Gerencia de Mercadeo
Gestionar el crecimiento de los Clientes Nuevos
Asegurar el mantenimiento de la Cartera Vigente
Identificar oportunidades de Mercado
Determinar campaas de inversin publicitaria
Satisfacer las necesidades de los Clientes
Ayudar a conseguir metas de colocacin
Mejorar el nivel de satisfaccin de nuestros clientes
Gestin de Publicidad
Gestin de Atencin al Cliente
Visitas a Clientes Potenciales
Investigar Quejas
Tiempo de gestin de solicitud de Crdito
Cantidad de dinero reembolsado
Motivos de no renovacin de crditos
Clientes que cancelan en el perodo
Revolvencias de los crditos
Rentabilidad de la Publicidad
Crecimiento de nuevos crditos
Crecimiento de clientes nuevos
Bajas de clientes
Nivel de satisfaccin de los clientes actuales
Mantenimiento de la Cartera Vigente
Informacin sobre algunos tpicos importantes existe pero se debe
obtener manualmente a partir de varios reportes y sobre otros no
existe ni un dato
Clientes actuales
Clientes inactivos
Crditos Otorgados por actividad econmica y por analistas,
Crditos repetitivos y nuevos
Proyeccin de Reembolso
Saldos de Cartera
Tiempo de gestin de solicitud de crdito de inicio a fin
Control de quejas
ndice de renovacin de Clientes
Factor de retorno a la inversin publicitaria
Fichas de perfil personal de los clientes
Clasificacin de la Cartera Activa por:
Sucursal Analista
Zona
Producto Monto
Fechas de solicitud, evaluacin, desembolso
Cruce de Clasificaciones
Revolvencias de Lneas de crdito:
Cantidad de Revolvencias por cliente
Resumen de Revolvencias
Entrevistas
Frecuencia de
uso de
informacin
Forma de
presentacin
preferida
Interaccin con
dems
dependencias
Desempeo del
sistema actual
en la toma de
decisiones
Informacin del
departamento
que ayuda al
mejor
desempeo de la
empresa
Semanal
Mensual (consolidado)
Reportes
Gerencia General
Gerencia de Crdito
Gerencia de Sistemas
Ayuda a resolver necesidades de informacin en un 60%.
Informe de renovacin de clientes en un perodo se elabora manual.
Contiene a los clientes que no han renovado en un perodo
determinado con sus correspondientes niveles de mora de cada
crdito.
Actualmente existe un reporte de renovacin pero es incorrecto, ya
que para algunos clientes asume la mora promedio de todos los
crditos
Datos sobre publicidad no se reflejan en ningn informe
Manifestacin de factores y puntos crticos en la gestin de la
empresa hacia los clientes
Pautas de inversin en Publicidad
Establecimiento de oportunidades de ampliacin de mercado
Entrevistas
Sistema Actual
Cantidad de
Informacin en
lnea
Estado de la
informacin
fuera de lnea
Evolucin del
modelo de Datos
Mdulos del
sistema
transaccional
Documentacin
Recursos
Disponibles
Gerencia de Sistemas:
Sistema de Gestin de Crdito (LFS) consta de los mdulos: Crdito,
Clientes, Reportes, Caja, Contabilidad
Sistema de Planilla
Bases de Datos Distribuida entre las sucursales y fuera de lnea.
Existe una Base de Datos central que se actualiza en modo BATCH
LFS: 2 aos
Informix: 3 aos
Almacenado en forma de respaldos en CD y Disco Duro. Los datos
se deben montar en la base de Datos para accederlos
Los datos presentan cierta inconsistencia. La calidad de los datos no
es ptima
El Modelo de Datos (MD) de la organizacin es dinmico, cambia
adaptndolo a nuevos requerimientos de la empresa.
El MD an no se ha consolidado de forma estable.
Clientes
Reportes
Caja
Crdito
Ahorro
Contabilidad
Presupuesto
LFS:
Manual Tcnico (80%): ERD, Diccionario de Datos del mdulo
clientes
Manual de usuario: No existe
Informix:
Manual Tcnico
Manual de Usuario
Sistemas Operativos: Windows 98, Windows 2000 Server,
Windows XP, Linux Suse 7.0
DBMS: SQL Server 7.0
Programacin: VFP 7.0, Visual Studio 6.0, Clipper(planilla)
Ofimtica: MS-Oficce 97, 2000, XP, Crystal Reports
Requerimientos Software
SOFTWARE UTILIZADO
Categora
Software
Funcionalidades Requeridas
Licencia
Automatizador
de ETL
Data Transformation
Services de
Microsoft SQL Server
2000
Adquirida de
agente
autorizado
CASE
Platinum
Erwin/ERX 3.5
DBMS
Microsoft
SQL Server 2000
Service Pack 2
Herramienta
de Acceso
a Datos
Microsoft
Analysis Services
2000
Capacidad de:
Extraccin de datos almacenados en diversas
plataformas.
Deduplicacin de datos redundantes.
Duplicacin de Datos.
Estandarizacin.
Transformaciones por tabla, columnas, registros,
campos.
Programacin de la ejecucin de tareas
automatizadas.
Registro de operaciones efectuadas (logs).
Realizacin de Ingeniera en Reversa a partir de
bases de datos almacenadas en SQL Server 2000.
Presentacin de modelos relaciones o
multidimensionales.
Soporte de distintas metodologas de
diagramacin.
Capacidad de exportar a otros repositorios.
Tecnologa Relacional.
Capacidad de interactuar con Base de Datos
multidimensionales.
Lenguaje de Consulta Compatible con estndar
SQL 92.
Administracin de integridad referencial .
Registro de operaciones efectuadas (logs).
Capacidad de realizar respaldos de la
informacin.
Juego de Instrucciones para Data Warehouse.
Soporte para particiones que contengan datos
fuertemente relacionados.
Soporte de esquema estrella .
Soporte de roles de usuarios.
Uso de metadatos y repositorio de metadatos.
Plataforma OLAP con soporte para HOLAP
MOLAP, ROLAP
Gestin de cubos de datos multidimensionales
Servir de fuente de datos para consulta de otras
aplicaciones.
Capacidad de utilizacin de metadatos.
Realizacin y almacenamiento de agregados para
mejorar consultas.
Capacidad de procesamiento en lotes
Soporte para Data Mining y para Executive
Information Systems.
Soporte para productos con habilidades Web.
Acceso a Base de Datos SQL Server 2000.
Licencia de
perodo de
evaluacin
Adquirida de
agente
autorizado
Adquirida de
agente
autorizado
Requerimientos Software
Categora
Software
Funcionalidades Requeridas
Licencia
Modelador de
Datos
Oracle
Designer / 2000 2.0
Oracle
TecnologyN
etwork,
licencia de
perodo de
evaluacin
Ofimtica
Microsoft
Sistema
Operativo
Microsoft Windows
2000 Server.
Adquirida de
agente
autorizado
Adquirida de
agente
autorizado
Modelos Dimensionales
Tabla de Contenido
DIMENSIONES DE LOS DATA MART
DETALLE DE LAS DIMENSIONES
DIMENSIN FECHA
DIMENSIN CLIENTE
DIMENSIN PRODUCTO
DIMENSIN TASAS
DIMENSIN SUCURSAL
DIMENSIN ANALISTA
DIMENSIN MODO DE PAGO
DETALLE DE LOS HECHOS
CRDITOS _ GESTIONADOS
CRDITOS_ABONADOS HECHOS
PROYECCIN_RECUPERACIN HECHOS
NIVEL 2: GRANO SEMANAL
PRESUPUESTO_RECUPERACIN HECHOS
CREDITOS_ABONADOS_SEMANALES HECHOS
Modelos Dimensionales
Fech
Condicion
Fecha
Vencimient
Fecha
Final
Estado
Analista
Hora
Grupos
de
Convenio
Client
Cuentas
Product
Fuente
Financiamien
Tasas
Formas
Descripcin de la Dimensin
Contiene todos los atributos asociados con la fecha en que la actividad ocurri.
Contiene todos los atributos asociados con la fecha en que vence el plazo de
pago del monto otorgado o de la cuota actual
Contiene todos los atributos asociados con un final o fecha de resolucin (fin de
contrato de crdito, fecha cancelacin de deuda)
Contiene todos los atributos acerca de la hora en que una actividad ocurri.
Representa a ambas personas naturales o jurdicas y todos que son clientes y los
atributos asociados a ellos.
Contiene informacin acerca de productos y servicios que se ofrecen.
Describe las tasas de interes usado para los creditos de los clientes.
Describe las diferentes modalidades de frecuencia y moneda entre los que un
Modelos Dimensionales
Nombre Dimensin
Fuentes
Financiamiento
Cuentas LM
Convenio
Analista
Condicion
Estado
Descripcin de la Dimensin
cliente puede elegir para pagar
Caractersticas de compaas de las que se obtienen recursos liquidos para la
institucin
Numeros de cuentas del libro mayor utilizadas para seguimientos financieros y
reportes.
El Grupo de instituciones que han firmado convenios de pago con la empresa.
Describe a los analistas individuales de la compaa.
Describe la condicion en la que se encuentra un credito segn los pagos
realizados.
Describes el estado del credito que gestiona un cliente.
Modelos Dimensionales
Ao
Calendario
Trimestr
Fiscal
Trimestre
Calendar
io
Ao
Fiscal
Mes
Calendario
Semana
Fiscal
Semana
Calendario
Tipo de Da
Da de
Semana
Da
Festivo
Descripcin de Atributos
El Da especifico que una actividad tuvo lugar.
El nombre especifico del Da.
Identifica que este da es Festivo.
Indica si este Da es o no un Da Semana
El dia que finaliza la Semana, siempre es un Sabado.
FS significa Fin de Semana.
El mes Calendario.
El Trimestre Calendario.
El Ao Calendario.
La Semana que representa el Calendario de la
empresa. Notar que la F en El valor del dato indica
que este es un periodo de tiempo fiscal.
El periodo fiscal comprendido de 4 o 5 Semanas.
Notar que la F en El valor del dato indica que este es
un periodo de tiempo fiscal.
El grupo de 3 meses fiscales.
El grupo de 52 Semanas fiscales / 12 meses fiscales
que comprende el ao financiero.
Valores de Muestra
06/04/2001;6/05/2001
Lunes; Martes
Dia Madre; Navidad
Fin de Sem; Da de S
FS 06/06/2001;
FS 06/13/2001
Enero,2001;
2001Q1; 2001Q4
2001
F Semana 1 2001;
F Semana 46 2001
F Enero, 2001;
F Febrero, 2001
F 2001Q1; F2001Q2
F 2001; F 1999
Modelos Dimensionales
Dimensin Cliente
Perfil de
Casa
Grupo Industrial
Cobro a
Departamento
Casa
Industria
Cobro a
Ciudad
Direccin
de Cobro
Nivel Educacin
del Cliente
Perfil demogrfico.
del Cliente
Sucursal
asignada a Cliente
Fecha de Nac.
del Cliente
Fecha de 1er
Servicio
Sexo Cliente
Cliente
Tipo de Cliente
Pas Domicilio
Cliente
Direccin
Domicilio Cliente
Sucursal
Asignada cliente
Clasificacin
Cliente
Localidad
Cliente
Identificador
Cliente
Departamento
Domicilio Cliente
Ciudad Domicilio
cliente
Calificacin
Cliente
Modelos Dimensionales
Dimensin Cliente Descripciones de Atributos
Nombre de los
Atributos
Identificador Cliente
Sucursal asignada al
Cliente
Direccin de domicilio
del Cliente
Ciudad de domicilio
del Cliente
Departamento de
domicilio del Cliente
Pais de domicilio del
Cliente
Cliente
Tipo de Cliente
Sexo Cliente
Fecha de Nacimiento
del Cliente
Perfil Demogrfico del
Cliente
Actividad Econmica
Casa
Nivel de Educacin del
Cliente
Direccin de Cobro
Cobro a Ciudad
Cobro a Departamento
Industria
Grupo Industrial
Fecha de Primer
Servicio
Clasificacin Cliente
Calificacin Cliente
Atributo Descripcin
Valores de muestra
02-000405-1;
08-000010-3
Matagalpa, Leon, Rio
Blanco
Casa Pellas Santa Ana
3c al Sur, Santa Ana,
Distrito IV
Sbaco
Profesional Soltero,
Padre de Familia
Farmacia, Elaboracin
de Bebida, Ferretera
Matagalpa
Nicaragua
Talleres Rapidito.;
Susana Bez
Natural; Jurdico
Femenino, Masculino
07/03/1960
1000; 2000
Secundaria;
Universidad; Maestria
Casa Pellas Santa Ana
3c al Sur, Santa Ana,
Distrito IV
Sbaco
Matagalpa
Taller Mecnico.;
Farmacia
Salud, Hidrulica
1/04/1989
Nuevo,
Repetitivo
AAA; B
Modelos Dimensionales
Dimensin Producto
Categora de
Productos
Clase de
Productos
Sector
Econmico
Destino
Producto/
Servicio
Descripcin de Atributos
Describe el producto individual o servicio
ofrecido, que un Cliente adquiri
Indica el sector econmico que mejor se ajusta
al perfil del producto que solicita el cliente
Clase de producto
Categora Producto
Valores de Muestra
Ordinario, Ra-Fl, Lnea de
Crdito, Personal
Industria, comercio,
personal, servicio, agrcola,
ganadero e hipotecario
Credicompu, Capital de
Trabajo, Activo Fijo
Productos para la micro
empresa. Productos
familiares
Crdito, Ahorro
Modelos Dimensionales
Dimensin Tasas
Tipo de
Comisin
Trminos de la
Comisin
Trminos de
Servicios
Fecha Inicio
Comisin
Fecha Final
Comisin
Trminos
Tipo de
de
Servicios
Servicios
Fecha Inicio
Servicios
Tasa Servicios.
Tasa Comisin
Fecha Final
Tasa Comisin
Servicios
Fecha Inicio
Inters
Fecha Inicio
Interes Moratorio
Fecha Final
Inters
Fecha Final
Interes Moratorio
Trminos del
Inters
Trminos del
Interes Moratorio
Tasa Inters
Moratorio
Tasa Inters
Sector
Econmico
Lmite
Superior
Lmite
Inferior
Identificador
Tasas
Extensin Lm
Superior
Modelos Dimensionales
Dimensin Tasas Descripciones de Atributos
Nombre de Atributos
Identificador de Tasa
Limite inferior
Limite superior
Extensin de limite
superior
Sector Econmico
Tasa de Inters
Fecha Inicio Inters
Fecha Final Inters
Trminos del Inters
Tasa de comisin
Tipo de Comisin
Fecha Inicio Comisin
Fecha Final Comisin
Trminos de la
Comisin
Tasa de Servicios
Tipo de Servicios
Fecha Inicio Servicios
Fecha Final Inters
Trminos de los
Servicios
Tasa de Inters
Moratorio
Fecha Inicio Inters
Moratorio
Fecha Final Inters
Moratorio
Descripcin de Atributos
Describe de manera unica una coleccin de
informacin de las tasas que se le asignan al producto
solicitado por el cliente.
Indica cual es el monto que se fija como lmite
inferior para aplicarle la tasa actual
Indica cual es el monto que se fija como lmite
superior para aplicarle la tasa actual
Describe la extensin en el monto del lmite superior
que es posible utilizar en algunos crditos especiales
Indica el sector econmico que se le asocia a una tasa
individual
Indica el inters aplicado en la tasa actual definido de
forma porcentual y en valores diarios
La Fecha en que este tipo de inters se puso a la
disposicin de los clientes
La Fecha en que este tipo de inters ya no estuvo
disponible para los clientes.
Indica los trminos o condiciones especiales que
tambin pueden aplicar a este inters.
Indica la comisin definida de forma porcentual que se
aplica sobre cada desembolso al utilizar la tasa actual
Forma en la que se determina ser pagada la
comisin
La Fecha en que este tipo de comisin se puso a la
disposicin de los clientes
La Fecha en que este tipo de comisin ya no estuvo
disponible para los clientes.
Indica los trminos o condiciones especiales que
pueden aplicarse a esta comisin.
Indica la tasa de servicios expresada en valor
porcentual que se aplica de forma anual en la tasa
actual
Forma en la que se determina sern pagados los
servicios
La Fecha en que este tipo de servicios se puso a la
disposicin de los clientes
La Fecha en que este tipo de servicios ya no estuvo
disponible para los clientes.
Indica los trminos o condiciones especiales que
tambin pueden aplicar a este servicio.
Indica el inters moratorio aplicado en la tasa actual
definido de forma porcentual y en valores diarios
La fecha en que este tipo de inters moratorio se puso
a la disposicin de los clientes
La fecha en que este tipo de inters moratorio ya no
estuvo disponible para los clientes.
Valores de Muestra
001; 002
10,000
50,000
10,000
Ganadera;
Comercio
0.0833 %;
0.0667 %
04/15/1996
3/26/1997
Plazo mnimo 1 ao
3.5 %;
Deducida;
Financiada
04/15/1996
3/26/1997
Nunca puede ser
financiada
1.5 %
6.0 %
Financiados,
Al vencimiento
04/15/1996
3/26/1997
Pagar al final del
periodo
0.0833 %;
0.0667 %
04/15/1996
3/26/1997
Modelos Dimensionales
Dimensin Sucursal
Departamento de
la Sucursal
Direccin
Sucursal
Ciudad de la
Sucursal
Gerente.
Sucursal
Sucursal
Cantidad de
Empleados
Descripcin de Atributos
Representa las oficinas sucursales que la
organizacin tiene en distintas localidades del
pas
Indica quien fungia en el cargo de gerente y
diriga la sucursal .
La direccin de localidad para esta sucursal.
Valores de Muestra
Managua, Ivan
Montenegro
Managua
Managua
10, 7, 12
Modelos Dimensionales
Dimensin Analista
Direccin
Analista
Fecha Actual
de contratacin
Departamento del
Analista
Fecha Original
de contratacin
Ciudad del
Analista
Nivel de Educ
del Analista
Fecha de Nac.
Analista
Estado de
Empleo
Empleado
Sexo
Analista
Descripcin de Atributos
Representa a los individuos contratados por Findesa.
Analistas podr ser visto por el nmero de Analista,
Nombre, cdula y nmero de INSS.
El status de los individuos contratados.
Valores de Muestra
Carla Chvez,
Braudilio Urey
Secundaria,
Licenciatura, Maestra
09/15/1996
08/01/2001
Casa Pellas Santa Ana
3c al Sur, Santa Ana,
Distrito IV
Managua
Managua
Modelos Dimensionales
Forma
de pago
Modalidad
de pago
Dimensin Modo de Pago Descripcin de Atributos
Nombre de los
Atributos
Modalidad de Pago
Periodo de pago
Frecuencia de pago
Cantidad de cuotas
Moneda de pago
Descripcin de Atributos
Valores de Muestra
Modo 1
Modo 2
Fecha Fija
Perodo Fijo
Semanal, Catorcenal,
Quincenal, Mensual,
Bimensual, Trimestral,
Semestral, Anual,
Vencimiento
12, 24
Crdobas, Dlares
Modelos Dimensionales
Fuente de
Financiamiento
Fecha
Fecha
Vecimiento
Da
Identificador
Fuente
Da
Fecha Final
Estado
Da
Estado
Analista
Garanta
Identificador
Garanta
Identificador
Analista
Crditos
Gestionados
Cliente
Modo
de Pago
Identificador
Cliente
Modalidad
de Pago
Sucursal
Tasas
No Sucursal
Identificado
r
Producto
Producto/Servicio
Convenio
Identificador
Convenio
Descripcin Hecho
Representa el nmero actual del crdito
Monto total que pagar el cliente producto del financiamiento otorgado
Monto total aprobado para ser financiado en un crdito especfico
Cantidad total que se deduce en concepto de comisin
Cantidad total que se cobra en concepto de servicios.
Cantidad total que se cobra en concepto de mantenimiento del Valor
Cantidad total que se paga en concepto de cargos legales: Pagars,
Contratos, Inscripciones
Monto que se devenga en concepto de intereses por el crdito otorgado
Monto que el cliente acumul en concepto de intereses moratorios
durante la vida del crdito
Monto total que el cliente ha pagado como multa por pagos tardos
El total de das de plazo para la cancelacin del crdito.
Indica el monto que abonara a su deuda el cliente cada vez
Indica el monto en que se valora la garanta presentada por el cliente
RAD
N/A
Sum
Sum
Sum
Sum
Sum
Sum
Sum
Sum
Sum
N/A
N/A
Sum
Modelos Dimensionales
Crditos_Abonados Hechos
Modo
de Pago
Fecha_
Vencimiento
Modalidad
de Pago
Da
Condicin
Fecha
Da
Hora
Minuto
Condicin
Fuente de
Financiamiento
Analista
Crditos
Abonados
Identificador
Fuente
Identificador
Analista
Tasas
Cliente
Identificador
Tasas
Identificador
Cliente
Producto
Producto/Servicio
Sucursal
Convenio
No Sucursal
Identificador
Convenio
Descripcin Hecho
Representa el nmero actual del recibo de caja que respalda el
pago hecho por el cliente
Representa el nmero actual del crdito
Representa el nmero de desembolso que se paga acualmente
Indica el numero actual de la cuota que se paga
Indica si el abono actual cancela el desembolso hecho
Indica el total que el cliente abono a esta cuota en el da actual
Indica el monto total que el cliente debe pagar en esta cuota.
Monto que se abona al principal del crdito
Monto que se abona a los intereses del crdito
Monto que se abona a los servicios del crdito
Monto que se abona a la Comisin del crdito
Monto que se paga en concepto de mantenimiento del valor
Cantidad de das en que ha incurrido en mora esta cuota, contados
despus de la fecha de vencimiento de la cuota que paga
Cantidad pagada en concepto de interes moratorio
Cantidad pagada en concepto de multa por pago tardo
Indica el instrumento monetario con el que se efectan pagos
(Efectivo, Cheque personal, Cheque gerencia)
RAD
N/A
N/A
N/A
N/A
Sum
Sum
Sum
Sum
Sum
Sum
Sum
N/A
Sum
Sum
Modelos Dimensionales
Proyeccin_Recuperacin hechos
Fecha_
Vencimiento
Fuente de
Financiamiento
Da Vence
Analista
Identificador
Fuente
Identificador
Analista
Convenio
Cliente
Identificador
Convenio
Proyeccin
Recuperacin
Modo
de Pago
Identificador
Cliente
Cliente
Sucursal
No Sucursal
Modalidad
Pago
Tasas
Inters
Producto
Producto/Servicio
Descripcin Hecho
Representa el nmero del crdito que debe ser abonado
Indica el numero desembolso de la cuota que se paga
Indica el numero actual de la cuota que se paga
Indica si la cuota actual cancela el desembolso hecho
Indica el monto total que el cliente debe pagar de cuota.
Indica el monto total que el cliente debe pagar en esta cuota.
Monto que debe ser recuperado en concepto de principal del crdito
Monto que debe ser recuperado en concepto de intereses del crdito
Monto que debe ser recuperado en concepto de servicios del crdito
Monto que debe ser recuperado en concepto de comisin del crdito
Monto que se paga en concepto de mantenimiento del valor
RAD
N/A
N/A
N/A
N/A
Sum
Sum
Sum
Sum
Sum
Sum
Sum
Modelos Dimensionales
Presupuesto
Recuperacin
Sucursal
Analista
No Sucursal
Identificador
Analista
Descripcin Hecho
Representa el valor que se presupuest a ser recuperado para
determinada semana del ao
Indica el valor que se proyecta a recuperar para dicha semana
del ao (agregado semanal de la estrella proyeccin)
Indica el monto real que se recuper en dicha semana
RAD
sum
sum
sum
Modelos Dimensionales
Creditos_Abonados_Semanales Hechos
Modo
de Pago
Fecha
Semana
moneda
Circusntancia
Cirecunstancia
Fuente de
Financiamiento
Analista
Crditos
Abonados
Identificador
Fuente
Identificador
Analista
Tasas
Identificador
Tasas
Producto
Producto/Servicio
Sucursal
Convenio
No Sucursal
Identificador
Convenio
RAD
sum
Sum
Sum
Sum
Sum
Sum
Sum
Sum
Sum
Columna Destino
Tipo de
Datos
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Clave
Cod_Cliente
Direccion_Dom_Cliente
Id_Domicilio_Cliente
Barrio_Dom_Cliente_ Descr
Distrito_Dom_Cliente
Sucursal_Asignada
Ciudad_Dom_Cliente
Depto_Dom_Cliente
Pais_Dom_Cliente
Id_Cliente
Nombre_Cliente
Tipo_Cliente
Integer
Varchar
Varchar
Integer
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Cliente_Dims
Fecha_Primer_Servicio
Direccion_Cobro_Cliente
Barrio_Cobro_Cliente
Distrito_Cobro_Cliente
Ciudad_Cobro_Cliente
Depto_Cobro_Cliente
Calificacion_Cliente
Clasificacion_Cliente
Sexo_Cliente
Fecha_Nacimiento_ Cliente
Demog_Cliente
Activ_Econo_Cliente
Educacion_Cliente
Casa_Cliente
Industria
Grupo_Industria
Datetime
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Datetime
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Sucursal_Dims
Sucursal_Dims
Sucursal_Dims
Sucursal_Dims
Sucursal_Dims
Sucursal_Dims
Sucursal_Dims
Sucursal_Dims
Sucursal_Dims
Sucursal_Dims
Sucursal_Clave
Id_Sucursal
Nombre_Sucursal
Direccion_Sucursal
Barrio_Sucursal
Distrito_Sucursal
Ciudad_Sucursal
Depto_Sucursal
Gerente_Sucursal
Cant_Empl_Sucursal
Integer
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Integer
Hora_Dims
Hora_Dims
Hora_Dims
Hora_Dims
Hora_Clave
Minuto
Hora
Bandera_Am_Pm
Integer
Integer
Integer
Varchar
Analista_Dims
Analista_Dims
Analista_Dims
Analista_Dims
Analista_Dims
Analista_Dims
Analista_Clave
Id_Analista
Nombre_Analista
Estado_Analista
Sexo_Analista
Fecha_Nac_Analista
Integer
Varchar
Varchar
Varchar
Varchar
Datetime
Long Tabla /
Archivo
Fuente
Campo
Fuente
9 climide
60 climide
climide
40 climide
5 climide
20 climide
40 climide
40 climide
25 climide
17 climide
100 climide
3 climide
ccodcli
cdirdom
ccoddom
cdirdom
60
40
5
40
20
3
10
9
20
30
12
5
20
20
climide
climide
climide
climide
climide
climide
climide
climide
climide
climide
climide
climide
climide
climide
climide
climide
ccodofi
cdirdom
ccodofi
cnudoci
cnomcli
cclaper
dregist
ccalcli
cclaci
csexo
dnacimi
cestciv
2
20
60
35
4
20
35
60
tabtofi
tabtofi
ccodofi
ccodofi
tabtofi
tabtofi
ccodofi
ccodofi
cjgdlog
cjgdlog
2 cjgdlog
chortrx
chortrx
chortrx
4 Tabtusu
60 Tabtusu
20 Tabtusu
9
ccodana
cnomana
Columna Destino
Tipo de
Datos
Analista_Dims
Analista_Dims
Analista_Dims
Varchar
Datetime
Datetime
Analista_Dims
Analista_Dims
Analista_Dims
Analista_Dims
Analista_Dims
Educacion_Analista
Fecha_Orig_Contr_ Analista
Fecha_Actual_Contr_
Analista
Direccion_Dom_ Analista
Barrio_Dom_Analista
Distrito_Dom_Analista
Ciudad_Dom_Analista
Departamento_Analista
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Dims
Fecha_Clave
Dia
No_Dia_En_Mes_Calendar
No_Dia_En_Anio_Calendar
No_Dia_En_Mes_Fiscal
No_Dia_En_Anio_Fiscal
Dia_De_Semana
Festivo_Bandera
Tipo_De_Dia
Semana_Calendar
No_Semana_Calendar
Mes_Calendar
No_Mes_Calendar
Trimestre_Calendar
No_Trimestre_Calendar
Anio_Calendar
Semana_Fiscal
No_Semana_Fiscal
Mes_Fiscal
No_Mes_Fiscal
Trimestre_Fiscal
No_Trimestre_Fiscal
Anio_Fiscal
Integer
Datetime
Integer
Integer
Integer
Integer
Varchar
Varchar
Varchar
Datetime
Varchar
Varchar
Integer
Varchar
Integer
Integer
Varchar
Integer
Varchar
Integer
Varchar
Integer
Integer
Modo_Pago_Dims
Modo_Pago_Dims
Modo_Pago_Dims
Modo_Pago_Dims
Modo_Pago_Dims
Modo_Pago_Dims
Modo_Pago_Dims
Modo_Pago_Dims
Modo_Pago_Clave
Modo_Pago
Id_Periodo_Pago
Periodo_Pago
Id_Frecuencia_Pago
Descr_Frecuencia_Pago
Id_Moneda_Pago
Moneda_Pago
Integer
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
7
2
12
2
15
1
9
credscs
credscs
credscs
credscs
credscs
credscs
ctipper
ctipper
cdiasug
cdiasug
cmoneda
cmoneda
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Dims
Producto_Clave
Id_Producto
Descr_Producto
Descr_Producto_Larga
Id_Sector_Econo
Descr_Sector_Econo
Id_Destino
Descr_Destino
Id_Clase_Producto
Descr_Clase_Producto
Id_Categoria_Producto
Descr_Categoria_Producto
Integer
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
Varchar
2
12
60
2
30
2
30
2
60
2
60
cremcre
cremcre
cremcre
cremcre
cremcre
cremcre
cremcre
cremcre
cremcre
cremcre
cremcre
ccodprd
ccodprd
ccodprd
csececo
csececo
cdescre
cdescre
Varchar
Varchar
Varchar
Varchar
Varchar
Long Tabla /
Archivo
Fuente
12
Campo
Fuente
60
40
5
40
40
10
2
2
4
16
7
13
18
9
Columna Destino
Tipo de
Datos
Long Tabla /
Archivo
Fuente
credkar
credkar
Abono_Credito_Facts
Abono_Credito_Facts
Fecha_Clave
Fecha_Vence_Clave
Integer
Integer
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Hora_Clave
Analista_Clave
Cliente_Clave
Sucursal_Clave
Convenio_Clave
Producto_Clave
Integer
Integer
Integer
Integer
Integer
Integer
cjgdlog
credkar
credkar
credkar
credkar
credkar
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Tasas_Clave
Modo_Pago_Clave
Fuente_Finan_Clave
Circunstancia_Clave
Monto_Total_Abono
Principal_Abono
Interes_Abono
Servicios_Abono
Interes_Mora
Dias_Mora
Integer
Integer
Integer
Integer
Numeric
Numeric
Numeric
Numeric
Numeric
Integer
credkar
credkar
credkar
credkar
credkar
credkar
credkar
credkar
credkar
credkar
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
Abono_Credito_Facts
No_Recibo_Caja
No_Credito
No_Cuota
Monto_Total_Cuota
Varchar
Varchar
Integer
Numeric
10
12
Abono_Credito_Facts
Abono_Final
Varchar
82
82
72
72
72
72
Campo
Fuente
dfecsis
dfecpro
dfectrx
ccodcta
ccodcta
ccodcta
ccodcta
ccodcta
ccodcta
ccodcta
ccodcta
ccodcta
nmonto
nmonto
nmonto
nmonto
nmonto
dfecpro dfecsis
credkar
cnrodoc
credkar
ccodcta
credkar
cnrocuo
credppg,c ncapitaredgas
ncappag
+intere nintpag
credppg
Gestion_Credito_Facts Fecha_Clave
Gestion_Credito_Facts Fecha_Vence_Clave
Integer
Integer
credkar
credkar
dfecsis
dfecpro
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Integer
Integer
Integer
Integer
Integer
credppg
cremcre
cremcre
cremcre
cremcre
dfecven
ccodana
ccodcli
ccodcta
ccodgru
Gestion_Credito_Facts Producto_Clave
Integer
cremcre
ccodpro,
cdescre,
csececo
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Gestion_Credito_Facts
Integer
Integer
Integer
Integer
Integer
Numeric
Numeric
Numeric
Numeric
Numeric
Numeric
Numeric
Numeric
Numeric
Integer
cremcre
credscs
cremcre
credkar
cremcre
Fecha_Final_Clave
Analista_Clave
Cliente_Clave
Sucursal_Clave
Convenio_Clave
Tasas_Clave
Modo_Pago_Clave
Garantia_Clave
Estado_Clave
Fuente_Finan_Clave
Monto_Total_Credito
Principal
Comision
Servicios
Mtto_Valor
Cargos_Legales
Intereses
Intereses_Mora
Recargos
Plazo_Dias
17.2
14.2
8.2
8.2
6.2
6.2
8.2
7.2
8.2
cremcre
cremcre
cremcre
cremcre
cremcre
cremcre
cremcre
ccodcta
ccodcta
ccodcta
cfuefin
nmonapr
Columna Destino
Tipo de
Datos
Long Tabla /
Archivo
Fuente
10.2 cremcre
19.2 cremcre
12 cremcre
Campo
Fuente
Gestion_Credito_Facts Cuota
Gestion_Credito_Facts Monto_Garantia
Gestion_Credito_Facts No_Credito
Numeric
Numeric
Varchar
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Integer
Integer
Integer
Integer
Integer
dfecven
ccodana
ccodcli
ccodcta
ccodgru
Proyeccion_Recu_Facts Producto_Clave
Integer
ccodpro,
cdescre,
csececo
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Integer
Integer
Integer
Numeric
Numeric
10.2 credppg
10.2 credppg
Proyeccion_Recu_Facts Servicios
Numeric
8.2 credgas
Proyeccion_Recu_Facts Intereses
Numeric
8.2 credppg
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Proyeccion_Recu_Facts
Numeric
Varchar
Integer
Integer
6.2 credppg
12 credppg
credppg
credppg
Fecha_Vence_Clave
Analista_Clave
Cliente_Clave
Sucursal_Clave
Convenio_Clave
Tasas_Clave
Modo_Pago_Clave
Fuente_Finan_Clave
Monto_Cuota
Principal
Mtto_Valor
No_Credito
No_Cuota
Cuota_Final
ccodcta
ccodcta
ccodcta
ncapitancappag
nmongasnmopag
intere nintpag
para ctipgas = 02
ccodcta
cnrocuo
igual que en abono
Rutinas ETL
Rutinas ETL
Figura 2- Paquete DTS del proceso de transformacin de datos para la tabla Abono_Credito_Facts
Rutinas ETL
En la figura 3 se aprecia que cierta informacin del Data Mart debe ser poblada a partir de
datos almacenados en tablas auxiliares que pertenecen al sistema transaccional, pero que no
eran administradas por un Sistema Gestor de Bases de Datos, por lo que se necesitaba que
la herramienta ETL contar con conectores que pudieran acceder a dicha fuente. Este es un
elemento importante a la hora de elegir una herramienta de automatizacin de la ETL, la
herramienta seleccionada debe ser capaz de obtener los datos necesarios a partir de todas
las fuentes de Datos que se requieran, de lo contrario, se perdera mucha flexibilidad en el
tratamiento que se le diera a los datos.
Rutinas ETL
En la figura 4 se aprecia una muestra del cdigo que define las transformaciones que sobre
los registros de una tabla realiza una tarea que pertenece a un determinado paquete. En el
paquete de la figura, en concordancia con lo previamente definido en la tabla de
correspondencia se obtiene el valor que guardaran los campos ciudad y departamento de la
dimensin Clientes, sobre la base de la direccin de domicilio del Cliente.
Rutinas ETL
Reportes Obtenibles
Edad
Toda Edad
Datos
Moneda Credito
Principal Abono
Principal Cor
Genero
Cliente
Demog Cliente
CORDOBAS
DOLARES
CORDOBAS
DOLARES
CASADO
DIVORCIADO
SOLTERO
UNION LIBRE
VIUDO
NO ESPECIFICA
8351305.81
4809182.55
79893.52
2891173.05
391393.74
178048.32
1614.63
390228.39
243297.36
5055.33
113303.4
9247.41
19324.89
--
8351305.81
4809182.55
79893.52
2891173.05
391393.74
178048.32
1614.63
5652027.79
3524759.83
73262.67
1640226.92
133902.77
279875.6
--
CASADO
DIVORCIADO
SOLTERO
UNION LIBRE
VIUDO
NO ESPECIFICA
8816323.18
6332986.36
35595.58
1960477.17
460562.52
22436.62
4264.93
457045.11
355905.58
3817.09
83449.66
10111.85
366.18
3394.75
8816323.18
6332986.36
35595.58
1960477.17
460562.52
22436.62
4264.93
6621769.47
5157248.67
55076.2
1208361.27
146624.09
5313.37
49145.87
17167628.99
847273.5
17167628.99
12273797.26
FEMENINO
MASCULINO
Total general
Reportes Obtenibles
Reportes Obtenibles
Reportes Obtenibles
Toda Moneda
NOVIEMBRE
Id Estado
Datos
Vigente
Cancelado
Sucursal
Creditos
Principal_cor
Creditos
Principal_cor
Managua
242
C$ 3,928,566.20
54 C$ 1,162,109.79
Leon
174
C$ 3,237,359.26
36
C$ 661,592.13
Matagalpa
82
C$ 2,833,788.55
52
C$ 546,753.97
Rio blanco
179
C$ 5,099,335.45
50
C$ 822,634.16
Masaya
56
C$ 1,415,076.96
42
C$ 389,976.23
Esteli
76
C$ 1,926,296.23
29
C$ 504,324.85
Rivas
101
C$ 1,896,087.74
49
C$ 530,600.58
Sebaco
45
C$ 1,950,734.72
22
C$ 706,829.25
Chinandega
108
C$ 2,485,051.60
17
C$ 306,834.62
Ivan Montenegro
115
C$ 2,945,076.26
24
C$ 251,490.12
Total general
1178
C$ 27,717,372.97
375 C$ 5,883,145.70
ANEXO I: GLOSARIO
GLOSARIO
Agregacin: Actividad de combinar datos desde mltiples tablas para formar una unidad
de informacin ms compleja, necesitada frecuentemente para responder consultas del
Data Warehouse en forma ms rpida y fcil.
Atributos: Conjunto de campos de las tablas de una base de datos transaccional o analtica
que definen la informacin que se almacena en una tabla en particular
Base de datos multidimensional: Base de datos diseada para procesamiento analtico
on-line (OLAP). Estructurada como un hipercubo con un eje por dimensin.
Data Mart: Conjunto de hechos y datos organizados para soporte a la toma de decisiones
basados en la necesidad de un rea o departamento especfico. y sus datos no tienen porque
tener las mismas fuentes que los de otro DataMart
Data Mining: La extraccin de informacin predecible escondida en grandes bases de
datos para el anlisis de los datos con el objetivo de descubrir relaciones, patrones, o
asociaciones desconocidas.
Data Warehouse: Sistema de Base de Datos que almacena una gran cantidad de datos
transaccionales integrados y enriquecidos para ser usados para anlisis por usuarios
especializados (encargados de tomar decisiones en la empresa).
Dato: Es la representacin computarizada de la informacin en todo negocio. Existen
muchas variedades de datos que se pueden almacenar en las computadoras. Los datos que
deben ser incluidos en el Data Warehouse son aquellos datos comprensibles y consistentes
en si mismos que son necesarios para manejar el negocio como un todo y en sus partes
individuales (indicadores).
Datos anormales: Datos que resultan de errores (por Ej. Errores en el ingreso de datos
durante la carga) o que representan eventos inusuales.
Datos Derivados: Datos que resultan luego de efectuar operaciones de transformacin
sobre un conjunto dado de datos origen, con el objetivo de ser de mayor significado para el
proceso de toma de decisiones.
Datos Peridicos: Conjunto de datos generados o extrados con cierta periodicidad a partir
de los sistemas transaccionales para alimentar el entorno analtico de la organizacin
DBMS (Data Base Management System): Sistema Relacional que se encarga del control
y seguridad de los datos organizados en tablas proveyndoles de un entorno en que las
aplicaciones clientes pueden realizar sus operaciones sin poner en riesgo la estructura de
datos del modelo. Adems realiza control de integridad y presenta la capacidad de realizar
consultas a los datos almacenados.