Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE CIENCIAS
ESCUELA DE COMPUTACIÓN
CENTRO DE INVESTIGACIÓN DE SISTEMAS DE INFORMACIÓN
1
ACTA
Leído como fue, dicho trabajo por cada uno de los miembros del jurado, se fijó el día
27 de Octubre de 2011 a la 10:00am, para que sus autores lo defendieran en forma
pública, lo que hicieron en el Aula PB3 de la Escuela de Computación, mediante una
presentación oral de su contenido, luego de lo cual respondieron las preguntas
formuladas. Finalizadas la defensa pública del Trabajo Especial de Grado, el jurado
decidió aprobarlo.
FECHA: 27-10-2011
2
AGRADECIMIENTOS
Andrés Castrillo.
Agradezco primero que todo a Dios por TODO, sin el no hubiéramos podido
culminar ninguna de las diferentes etapas de la carrera.
A mi familia, que me han apoyado siempre, sin importar en que parte del mundo
estuvieran, estuvieron ahí para darme consejos.
A la profesora Brenda López que nos guió durante el desarrollo de este trabajo, pero
sobretodo al grupo completo de Tian, que en todo momento nos dieron su apoyo
tanto para el uso de sus espacios como para darnos consejos, así no fuera en hora
de oficina, estuvieron ahí horas extras o vía Skype para ayudarnos en los problemas
que nos fueron surgiendo durante la realización del trabajo.
Quiero agradecer a todos mis amigos que me acompañaron durante la carrera,
empezamos muchos, terminamos pocos, pero igual siempre estuvimos juntos y
seguimos en contacto aunque por diversas circunstancias ya no estemos todos
sentados en el mismo lugar hablando y echando broma, espero que pronto nos
reunamos nuevamente.
Quiero agradecerle a Diana, que durante toda la carrera ha estado conmigo para
apoyarme en las diferentes materias, estudiando y haciendo proyectos juntos,
logrando que ambos alcanzáramos esta meta, de verdad que le deseo una vida muy
feliz con Jamie ahora que se van a casar.
Y por último pero no menos importante, le agradezco enormemente a la Universidad
Central de Venezuela, que gracias a sus métodos propios y únicos, nos ha dado las
herramientas necesarias para que nos formáramos como profesionales capaces de
enfrentar y superar diferentes retos.
Este Trabajo Especial de Grado está dedicado a José Rafael Castrillo Cabrera,
Yolanda Mendoza, Lucila Flores y Marco Antonio Briceño, mis cuatro abuelos que
en todo momento han estado conmigo presencial y espiritualmente.
3
Diana Dugarte.
Agradezco principalmente a Dios por permitirme una vez más alcanzar mis metas y
por no dejarme sola.
Agradezco a mi Familia por su acostumbrado apoyo, especialmente a mi hermana
María Fernanda por su compañía en todo momento y por sus sabios consejos.
Agradezco a la Familia Hernández-Jaramillo, quienes siempre me brindaron una
mano amiga en todo momento, especialmente a mi futuro esposo Jamie Hernández
por su apoyo incondicional.
Agradezco al grupo Tian por el tiempo y espacios prestados para el desarrollo
profesional durante mi etapa final de la carrera, muchas gracias por todo el apoyo.
Agradezco a nuestra tutora Brenda López por todo su apoyo y por todo el
conocimiento que nos brindo para nuestro desarrollo profesional.
Agradezco al Profesor Franky Uzcategui por sus sabios consejos y por toda la
ayuda prestada.
Agradezco especialmente a Andrés por su paciencia y su amistad durante todo este
tiempo y que espero se siga manteniendo sin importar los caminos próximos a
tomar.
Agradezco a todos mis amigos quienes con su compañía alegraron este camino
académico y lo hicieron gratificante.
Y por último a nuestra casa de estudios la Universidad Central de Venezuela, en
especial a la Facultad de Ciencias y sus integrantes quienes colaboraron en mi
desarrollo académico y profesional.
Este trabajo especial de grado está dedicado especialmente a Decidaira Jaramillo.
4
RESUMEN
PALABRAS CLAVES:
Inteligencia de Negocio, Almacén de Datos, Sector Salud, Indicadores de Gestión,
Metodología Ralph Kimball.
5
ÍNDICE
INTRODUCCIÓN .......................................................................................... 13
CAPÍTULO 1: PROBLEMA DE INVESTIGACIÓN. ....................................... 15
1.1- Planteamiento del problema............................................................... 15
1.2.- Solución planteada ............................................................................ 16
1.3.- Objetivos ........................................................................................... 18
1.3.1.- General ....................................................................................... 18
1.3.2.- Específicos ................................................................................. 18
1.4. Justificación e importancia ................................................................. 19
1.5.- Alcance ............................................................................................. 19
CAPÍTULO 2: MARCO CONCEPTUAL. ....................................................... 20
2.1.- Procesamiento de Transacciones en Línea (OLTP) vs Procesamiento
Analítico en Línea (OLAP) ......................................................................... 20
2.1.1.- On-Line Transaction Processing ................................................ 20
2.1.2.- On-Line Analytical Processing .................................................... 21
2.1.3.- OLTP vs. OLAP .......................................................................... 21
2.2.- Inteligencia de Negocio ..................................................................... 22
2.2.1.- Arquitectura de una solución BI. ................................................. 23
2.2.2.- Características de una solución BI ............................................. 26
2.2.3.- Beneficios de BI .......................................................................... 26
2.3.-Almacén de Datos (Datawarehouse) ................................................. 28
2.3.1.- Características de un Almacén de datos .................................... 28
2.3.2.- Bodegas de Datos (Datamarts) .................................................. 30
2.3.3.- Bodegas de Datos Vs Almacén de datos ................................... 31
2.4.- Modelo Dimensional .......................................................................... 32
2.4.1.- Hecho ......................................................................................... 32
2.4.2.- Dimensión................................................................................... 32
2.4.3.- Jerarquía .................................................................................... 33
2.4.4.- Cubo ........................................................................................... 33
2.4.5.- Celda .......................................................................................... 34
2.4.6.- Tabla de Hechos (FactTable) ..................................................... 34
6
2.4.7.- Tabla Dimensión ......................................................................... 35
2.4.8.- Tipos de esquemas .................................................................... 36
2.5.- Indicadores de gestión de ventas en el Sector Salud ....................... 39
2.5.1.- Empresas del sector salud ......................................................... 39
2.5.2.- Unidades de Atención................................................................. 40
2.5.3.- Conceptos Facturables ............................................................... 42
2.5.4.- Protocolos................................................................................... 43
2.5.5.- Presupuestos clínicos ................................................................. 43
2.5.6.- Responsable de pago ................................................................. 43
2.5.7.- Proceso de Atención al Paciente ................................................ 44
2.5.8.- Indicadores de gestión................................................................ 46
2.6.- Herramientas de BI .......................................................................... 47
2.6.1. - Oracle Business Intelligence Suite ............................................ 48
CAPÍTULO 3: MARCO METODOLÓGICO. .................................................. 55
3.1.- Metodología de Ralph Kimball - Ciclo de Vida del Modelo de Negocio.
.................................................................................................................. 55
3.1.1.- Planificación del proyecto. .......................................................... 55
3.1.2.- Definición de los requerimientos del negocio. ............................ 57
3.1.3.- Diseño técnico de la arquitectura. .............................................. 57
3.1.4.- Selección de productos e instalación.......................................... 59
3.1.5.- Diseño del Modelo Dimensional. ................................................ 59
3.1.6.- Diseño Físico. ............................................................................. 63
3.1.7.- Diseño y construcción de procesos ETC. ................................... 63
3.1.8.- Especificación y desarrollo de aplicaciones analíticas................ 63
3.1.9.- Integración y despliegue. ............................................................ 64
3.1.10.- Mantenimiento y crecimiento. ................................................... 64
CAPÍTULO 4: MARCO APLICATIVO ............................................................ 66
4.1.- Planificación del proyecto.................................................................. 66
4.2.- Definición de los requerimientos del negocio. ................................... 66
4.3.- Diseño de la arquitectura. ................................................................. 69
4.4.- Selección de productos e instalación. ............................................... 70
4.5.- Diseño del Modelo Dimensional ........................................................ 71
4.5.4.- Modelo Entidad Relación – Base de Datos intermedia: .............. 79
7
4.6.- Diseño Físico. ................................................................................... 81
4.7.- Diseño y construcción de procesos ETC........................................... 88
4.7.1.- Proceso ETC de la fuente a la base de datos Intermedia........... 88
4.7.2.- Proceso ETC de la base de datos intermedia al almacén de datos
............................................................................................................... 89
4.8.- Especificación y desarrollo de aplicaciones analíticas ...................... 93
4.9.- Integración y despliegue ................................................................... 94
4.10.- Cuadros Analíticos .......................................................................... 98
4.11.- Mantenimiento y crecimiento ......................................................... 107
CONCLUSIONES ....................................................................................... 108
RECOMENDACIONES ............................................................................... 110
REFERENCIAS BIBLIOGRÁFICAS............................................................ 111
ANEXOS ..................................................................................................... 114
8
ÍNDICE DE FIGURAS
Figura 1. Arquitectura de la solución BI .................................................................. 16
Figura 2. Arquitectura de una Solución BI ............................................................... 23
Figura 3. Proceso ETL ............................................................................................ 24
Figura 4. Características de un almacén de datos .................................................. 29
Figura 5. Representación de una Bodega de Datos ................................................ 30
Figura 6. Ejemplo de representación lógica de una jerarquía ................................. 33
Figura 7. Ejemplo de una representación lógica de un Cubo .................................. 34
Figura 8. Tabla de Hechos ...................................................................................... 35
Figura 9. Tabla Dimensión ...................................................................................... 35
Figura 10. Diagrama en estrella del Hecho Ventas ................................................. 36
Figura 11. Esquema en copo de nieve.................................................................... 37
Figura 12. Esquema Constelación .......................................................................... 38
Figura 13. Proceso de Admisión/Cargas/Facturación ............................................. 45
Figura 14 Oracle BI Enterprise Edition Vs Oracle BI Standard Edition One ............ 49
Figura 15. Componentes de Oracle BI Standard EditionOne. ................................. 49
Figura16. Oracle Database Standard Edition One . ¡Error! Marcador no definido.50
Figura 17. Oracle Warehouse Builder ..................................................................... 51
Figura18. Oracle Business Intelligence Server ...... ¡Error! Marcador no definido.52
Figura 19. Business Intelligence Interactive Dashboards ...................................... 53
Figura 20. Oracle Business Intelligence Answers ................................................... 54
Figura 21. Oracle Business Intelligence Publisher .................................................. 54
Figura 22. Ciclo de Vida del Modelo de Negocio por Kimball. ................................. 55
Figura 23. Diseño Técnico de la Arquitectura ......................................................... 69
Figura 24. Ejemplo de proceso de identificación de granularidad ........................... 71
Figura 25. Ejemplo de identificación de dimensiones .............................................. 72
Figura 26. Relaciones jerárquicas identificadas ...................................................... 73
Figura 27. Representación gráfica del hecho ventas con sus dimensiones............. 74
Figura 28. Representación gráfica del hecho Presupuesto con sus dimensiones y
atributos.................................................................................................................. 75
Figura 29. Hecho Ventas ........................................................................................ 76
9
Figura 30. Hecho Presupuesto ............................................................................... 76
Figura 31. Representación del modelo dimensional ................................................ 77
Figura 32. Modelo Dimensional extendido .............................................................. 78
Figura 33. Modelo entidad relación de la base de datos intermedia ........................ 81
Figura 34. Estructuras de la base de datos intermedia implementadas .................. 81
Figura 35. Asistente de creación de dimensiones ................................................... 82
Figura 36. Asignación de atributos con el asistente ................................................ 83
Figura 37. Definición de jerarquías con el asistente ................................................ 83
Figura 38. Definiendo los atributos por jerarquías ................................................... 84
Figura 39. Asistente de creación de cubos ............................................................. 85
Figura 40. Definiendo las dimensiones para el cubo ............................................... 86
Figura 41. Definiendo las medidas y atributos del cubo .......................................... 87
Figura 42. Diagrama del proceso ETC de la base de datos intermedia................... 88
Figura 43. Centro de diseño OWB 10g ................................................................... 89
Figura 44. ETC de la dimensión Cliente .................................................................. 90
Figura 45. ETC de la dimensión Producto .............................................................. 90
Figura 46. ETC de la dimensión Localidad.............................................................. 91
Figura 47. ETC de la dimensión Diagnostico .......................................................... 91
Figura 48. ETC para el cubo de Ventas .................................................................. 92
Figura 49. ETC para el cubo de Presupuesto ......................................................... 93
Figura 50. Oracle BI Administration Tool ................................................................ 95
Figura 51. Capa Física............................................................................................ 96
Figura 52. Capa del Modelo de Negocio y mapeo .................................................. 97
Figura 53. Capa de presentación ............................................................................ 98
Figura 54. Resumen de indicadores ....................................................................... 99
Figura 55. Indicador referente al análisis de las ventas por unidad de atención .... 100
Figura 56. Indicador referente al análisis detallado de las ventas por unidad de
atención ................................................................................................................ 100
Figura 57. Indicador referente a las ventas por tipo de cliente. ............................. 101
Figura 58. Indicador referente a las ventas por tipo cliente Seguro....................... 101
Figura 59. Indicador referente a las ventas por tipo de cliente Autopagante. ........ 102
Figura 60. Indicador referente a las ventas por concepto facturable ..................... 102
Figura 61. Indicador referente a la desviación porcentual de las ventas por mes . 103
10
Figura 62. Indicador referente a los Top 10 por concepto facturable..................... 103
Figura 63. Indicador referente al Top 10 por tipo Cliente ...................................... 104
Figura 64. Indicador referente a la diferencia entre Facturado y Presupuestado .. 105
Figura 65. Indicador referente a la cantidad de Presupuestos por Unidad de
Atención ............................................................................................................... 106
Figura 66. Indicador referente al monto facturado Vs su costo ............................. 106
11
ÍNDICE DE TABLAS
12
INTRODUCCIÓN
Algunas empresas hoy día cuentan con mecanismos básicos para la elaboración de
indicadores y análisis estadísticos de los datos. En la mayoría de los casos son
cargados manualmente en hojas de cálculo por empleados de la empresa y que
pueden contener errores debido al factor humano.
Es por eso que el objetivo de este Trabajo Especial de Grado consiste en el diseño
y construcción de una solución de inteligencia de negocio para obtener indicadores
de gestión relevantes en las empresas del sector salud con el fin de dar apoyo a la
toma de decisiones estratégicas en el área de ventas.
Este documento está compuesto por unos capítulos los cuales describen el
problema planteado, conceptos necesarios dentro del desarrollo de la solución de
inteligencia de negocio, así como también la metodología usada y la descripción de
su implementación. A continuación se describe de forma general estos capítulos.
13
Capítulo 1: Define el problema de investigación así como los objetivos generales y
específicos a cumplir en este Trabajo Especial de Grado. Se explica la solución y
arquitectura implementada para alcanzar los objetivos planteados.
Capítulo 2: Describe los conceptos mínimos necesarios para entender los procesos
involucrados en el análisis, diseño y construcción de una solución de inteligencia de
negocio. Adicionalmente, define conceptos relacionados con el área de ventas el
sector salud y herramientas tecnológicas que apoyan a la construcción de la
solución de Inteligencia de Negocio (BI por sus siglas en ingles que significa
Business Intelligence) .
14
CAPÍTULO 1: PROBLEMA DE INVESTIGACIÓN.
Usualmente los reportes que se utilizan para el apoyo a la toma de decisiones son
realizados por el departamento de informática y son cargados en hojas de cálculo,
retardando el proceso de generación de información gerencial. Además el proceso
de análisis y estudio de los indicadores de gestión, es manual y es posible encontrar
errores de transcripción o mala utilización de alguna fórmula.
Las herramientas que algunas empresas del sector salud utilizan no permiten una
representación gráfica lo suficientemente flexible como para hacer comparaciones,
elaborar consultas a la medida y hacer estudios predictivos de los resultados de los
análisis rápidamente.
15
1.2.- Solución planteada
Dada la situación actual y problemas que presentan las empresas del sector salud,
se propuso la construcción de una solución de Inteligencia de Negocio para obtener
un conjunto de indicadores de gestión relevantes y necesarios para dar soporte a la
toma de decisiones gerenciales y estratégicas, en empresas del sector salud.
Debido a que cada empresa del sector salud maneja sus procesos diarios de formas
diferentes, se plantea un área intermedia encargada de centralizar los datos
referentes al área de ventas, con la finalidad de estandarizar los datos provenientes
de las distintas fuentes de datos para posteriormente ser almacenados en el
almacén de datos. Esta base de datos intermedia es una base de datos relacional
que sigue un modelo de ventas genérico.
16
En la solución se tienen dos procesos ETC: el primero es el encargado de extraer,
transformar y cargar los datos fuentes a la base de datos intermedia, y el segundo
es el encargado de la extracción, transformación y carga de los datos de la base de
datos intermedia al almacén de datos. Con los datos cargados en el almacén de
datos, estos están disponibles para el análisis mediante el uso de las herramientas
de explotación y publicación.
Por último las consultas y cuadro de mando que permiten visualizar los indicadores
de gestión del área de ventas para las empresas del sector salud.
17
1.3.- Objetivos
A continuación se presentan los objetivos que se desean alcanzar con el trabajo
especial de grado.
1.3.1.- General
Desarrollar una solución de Inteligencia de Negocio (comúnmente conocida como BI
por sus siglas en ingles de Business Intelligence) orientada a la gestión de ventas
de empresas del sector salud, con el fin de apoyar la toma de decisiones precisas y
a tiempo.
1.3.2.- Específicos
A continuación se describirán los objetivos específicos:
Estudiar el área de negocio, para recopilar y definir los requerimientos del
área de ventas de empresas del sector salud.
Definir un conjunto de indicadores de gestión del área de ventas necesarios
para la toma de decisiones.
Diseñar el modelo entidad relación de la base de datos intermedia.
Diseñar el modelo dimensional que soporte los indicadores de gestión
propuestos utilizando la metodología de Ralph Kimball.
Construir la base de datos intermedia en base al modelo entidad relación de
ventas.
Construir el almacén de datos.
Diseñar, construir y ejecutar los procesos de extracción, transformación y
carga (ETC), desde los datos fuentes a la base de datos intermedia.
Diseñar, construir y ejecutar los procesos de extracción, transformación y
carga (ETC), desde la base de datos intermedia al almacén de datos.
Diseñar, desarrollar y desplegar las consultas analíticas y los cuadros de
mandos asociados a los indicadores de gestión correspondientes a la
solución de BI.
Realizar pruebas para validar la efectividad de la solución.
18
1.4. Justificación e importancia
Las empresas del sector salud cuentan con una gran cantidad de datos
provenientes de los procesos diarios los cuales almacenan usualmente en sistemas
transaccionales. Actualmente para dar soporte a las decisiones gerenciales, algunas
de estas empresas hacen uso de los datos directamente de los sistemas
transaccionales lo que ocasiona una mala utilización de los recursos, tanto de los
equipos como del personal, ya que deben solicitarle al departamento de sistema que
elaboren los distintos reportes que necesiten. Es por esto que se plantea esta
solución para las empresas del sector salud en el área de ventas que permita la
obtención de un conjunto de indicadores de gestión claves del área de ventas para
así dar soporte a las decisiones gerenciales.
1.5.- Alcance
La solución de BI a desarrollar tomará en consideración un conjunto de indicadores
propios del área de gestión de ventas de empresas del sector salud (estos
indicadores están identificados y explicados en el marco aplicativo), utilizando los
datos un área intermedia como base para el llenado del almacén de datos y
siguiendo la metodología de Kimball para su construcción. Finalmente, utilizando las
herramientas propias de Oracle Business Intelligence Standard Edition One para
crear la solución.
19
CAPÍTULO 2: MARCO CONCEPTUAL.
20
2.1.2.- On-Line Analytical Processing
OLAP son tecnologías para el análisis de grandes volúmenes de datos con el fin de
generar información útil para el usuario. Son usados frecuentemente para la toma
de decisiones en las empresas a través de la manipulación de los datos
corporativos.
OLTP OLAP
Comúnmente no integradas Debe ser integrada
Cada tema de negocios puede Toda la información referente a un
tener información en diferentes tema, tiene una única fuente
Integración
sistemas
Diferentes plataformas de Posee un solo servidor lógico
hardware warehouse
21
Los usuarios son los que Los usuarios solo realizan
Acceso y Manipulación
de datos por parte de
insertan, actualizan y borran los consultas
datos
usuarios
22
toma de decisiones. Es por esto, que BI se basa más en la creatividad y habilidad
de utilizar los datos de la empresa, que en la tecnología que se aplique.
Fuentes de datos: son los datos que se obtienen de los procesos diarios y
que se requieren para el análisis del negocio, estos pueden ser extraídos de
diferentes lugares: de procedencia externa a la organización o pueden ser
los mismos datos arrojados por los procesos operacionales de la
organización.
Proceso de Extracción, Transformación y Carga (ETL o ETC): consiste
en la extracción de los datos provenientes de las distintas fuentes
disponibles, la adaptación de los mismos según un formato o estándar
requerido para su almacenamiento y la carga en otro repositorio de
almacenamiento.
En la Figura 3 se muestra un esquema de un proceso ETC.
23
Figura 3. Proceso ETL (Inmon, 1999)
24
ser capaz de especificar cuáles son los valores correctos para cada campo,
para así asegurar que solo se estará trabajando con datos confiables y
consistentes.
Carga: Es el proceso mediante el cual, se almacenan los datos obtenidos en
la fase anterior. Este proceso también puede incluir la tarea de mantener
índices y restricciones de integridad.
Existen básicamente tres tipos de carga, las cuales son (Ponniah, 2001):
- Carga Inicial: el almacén de datos se encuentra vacío por ser la
primera vez que se cargaran los datos, así que se almacenan todos
los datos en sus respectivas tablas
- Carga Incremental: carga de datos a medida que van ocurriendo
cambios en los mismos y dentro de los tiempos de carga planificado
- Refrescamiento total (Full refresh): se borra el contenido de todas o
de ciertas tablas y son cargadas nuevamente con datos más
recientes.
Dado que el proceso de carga toma una buena cantidad de tiempo, y que
además, durante la tarea de carga no se puede tener en uso el almacén de
datos, se debe programar un horario donde se pueda realizar esta tarea sin
interferir con los usuarios. Quizás en algunos ambientes será conveniente
realizar pequeñas cargas en cortos periodos de tiempo, aminorando así el
tiempo que demore los grandes volúmenes de carga, pero quizás en otros
casos, será mejor realizar las cargas en periodos de tiempo más largos, para
así interrumpir lo menos posible a los usuarios
Área de almacenes de datos: en esta área se almacenan los datos
producto de los procesos ETC y que se requieren para el análisis. Pueden
ser almacenados en diversos tipos de repositorio, pero comúnmente se
almacenan en un área conocida como almacén de datos, o en diversos
almacenes de datos independientes, conocidos como bodegas de datos,
esto por las características que poseen para el almacenamiento masivo de
datos y su fácil acceso a ellos.
Herramientas de acceso: Se encarga de hacer posible la comunicación de
manera fácil y entendible para el usuario con los datos. Las herramientas de
acceso también son conocidas como área de presentación, en el cual se
25
encuentran las diferentes herramientas que hacen de interfaz entre el cliente
y el conjunto de datos, y pueden ser tan simples como una herramienta de
consulta ad hoc o tan complejas como la minería de datos sofisticadas o
aplicaciones de modelado.
2.2.3.- Beneficios de BI
Los beneficios de una solución BI se pueden ver reflejados en (Roy, 2005):
26
en detalle y desarrollar informes productivos que arrojen información y conocimiento
sobre el negocio
Brinda una Visión unificada y compartida de los datos. Es frecuente que en una
empresa exista una gran cantidad de fuentes de datos, como lo son: bases de
datos, bodega de datos o hasta sencillas hojas de cálculo. Con una buena
aplicación de una solución BI, se logra integrar todos estos datos bajo un mismo
formato, agregarles un contexto (metadata) para así obtener información y luego
conocimiento a partir de ellos. Además, otro beneficio es el acceso rápido a estos en
cualquier momento. (Juliet, 2010)
Ayuda a incrementar los ingresos y disminuye costos. Las empresas con una
buena aplicación de soluciones BI, alcanzan niveles de prestaciones económicas
más elevadas. Son capaces de modificar sus ofertas y niveles de servicios, para
ajustarse mejor a las necesidades de sus clientes.
27
2.3.-Almacén de Datos (Datawarehouse)
Según (Inmon, 1999) “Un Datawarehouse es una colección de datos integrados, no
volátiles, orientados a temas y cambiantes en el tiempo, que son usados para la
toma de decisiones estratégicas”.
1
Cuando se dice centralizar los datos nos referimos a agrupar los datos en un mismo sistema, es importante
mencionar que existen Almacenes de Datos centralizados y distribuidos, pero ambos cumplen con la misma función
a groso modo, sólo que son dos formas de implementación diferentes.
28
Temático: sólo los datos necesarios para el proceso de generación del
conocimiento del negocio se integran. Los datos se organizan por áreas
temáticas (Ventas, RRHH, Finanzas, entre otros) para facilitar su acceso y
entendimiento por parte de los usuarios finales.
Histórico: En un almacén de datos se almacenan fotografías del estado del
sistema transaccional correspondiente a un período de tiempo determinado.
Cada vez que se hace una carga de esta información, los datos anteriores
no son eliminados, se mantienen en el tiempo para así permitir
comparaciones y generar más conocimiento sobre el negocio.
No volátil: Los datos permanecen en el tiempo, es decir, no son eliminados
ni sustituidos. La actualización del almacén de datos incorpora los últimos
valores obtenidos desde el sistema transaccional, incrementando el
contenido del almacén de datos.
29
2.3.2.- Bodegas de Datos (Datamarts)
Una bodega de datos es una forma simple de un almacén de datos que se centra en
un área temática (o área funcional), tales como ventas, finanzas o mercadeo. Las
bodegas son a menudo construidas y controladas por un solo departamento dentro
de una organización, dado su enfoque de un solo tema, obtienen por lo general los
datos de sólo unas pocas fuentes, la fuente puede ser de un sistema transaccional,
un almacén de datos central o de datos externos. Una bodega de datos es mucho
más pequeña y más flexible que un almacén de datos, dado que posee menor
volumen de datos (Todman, 2001). En la Figura 5 se muestra un ejemplo de bodega
de datos dentro de una organización
Las Bodegas de Datos poseen las mismas características que poseen los
almacenes de datos: integración, temáticos, históricos y no volatilidad. Son
comúnmente usados bajo la premisa o estrategia de “divide y vencerás” para
ámbitos muy genéricos de un almacén de datos, que ocurre generalmente cuando el
almacén tiende a crecer muy rápidamente y los distintos departamentos requieren
solo de una porción de los datos contenidos en él.
30
2.3.3.- Bodegas de Datos Vs Almacén de datos
No existe una diferencia en cuanto a implementación o componentes entre las
Bodegas de Datos y los almacenes de datos. Al momento de establecer una
comparación se toman aspectos como el alcance, la orientación a temas, las
fuentes de datos que usan y el tiempo de implementación.
31
2.4.- Modelo Dimensional
El modelo dimensional, es una técnica aplicada en el diseño lógico de almacenes
de datos, utilizada para modelar la información en base a indicadores de negocio
que podrán ser analizados desde diferentes perspectivas o dimensiones de análisis.
(Ponniah, 2001).
Los elementos que conforman al modelo dimensional son los siguientes: hecho,
dimensión, jerarquías, cubo, celda, así como tablas de dimensión y hecho. (Kimball
& Ross, 2002).
2.4.1.- Hecho
El hecho es el resultado medible por parte de la organización y es el punto central
para la toma de decisiones. Algunos ejemplos de hechos son: cantidad vendida,
costo abonado, costo vs ganancia, entre otros. Es esencial que el hecho posea
aspectos dinámicos con el fin de poder observar la evolución a través del tiempo del
mismo (Kimball & Ross, 2002).
2.4.2.- Dimensión
Según (Wrembler & Koncilia, 2007), una dimensión es: “una propiedad del hecho,
que posee un dominio finito y describe una de las vías de análisis. El conjunto de
dimensiones de un hecho determina el nivel de detalle de los datos. Gráficamente,
las dimensiones son representadas por una caja que posee su nombre y atributos,
además de estar unidas al hecho”.
32
2.4.3.- Jerarquía
Una jerarquía define la posición relativa de un atributo con respecto a otros
pertenecientes a la misma dimensión. Representados bajo una relación de tipo
jerárquica o bien conocida como forma de árbol, donde los atributos serán
progresivamente más detallados si se recorre de manera descendente el árbol hasta
llegar a las hojas, quienes son los que tienen mayor nivel de detalle. (Moliner López,
2005),
Son muy esenciales, porque sin ellas los reportes estarían sobrecargados con
demasiados detalles, haciendo más difícil, o casi imposible, identificar los problemas
y oportunidades dentro del almacén de datos.
2.4.4.- Cubo
Un cubo es una representación compleja generada por la intersección de las
dimensiones enfocadas en el hecho a medir. Siendo también denominado
Hipercubo, ya que depende del número de dimensiones asociadas al hecho, esta
estructura permite visualizar de mejor manera el Modelo Dimensional. (Kimball &
Ross, 2002).
En la Figura 7 se muestra una representación del cubo.
33
Figura 7. Ejemplo de una representación lógica de un Cubo (Kimball & Ross,
2002)
2.4.5.- Celda
Representa la posición formada por la intersección de cada uno de los elementos de
las dimensiones que forman el cubo. La celda puede contener cantidades nulas, uno
o varios datos. (Inmon, 1999)
Generalmente una tabla de hechos posee una clave primaria, definida por un
conjunto de claves foráneas. En un modelo dimensional, toda tabla que exprese una
relación de muchos a muchos debe ser la tabla de hechos. Las demás tablas son
denominadas tablas dimensión.
34
Figura 8. Tabla de Hechos (Pérez, 1999)
35
2.4.8.- Tipos de esquemas
Para soportar un esquema multidimensional, existen varios esquemas, los más
comunes son el tipo estrella, copo de nieve y constelación, los cuales se describirán
a continuación. (Royo, 2003)
Esquema en estrella
Existe una sola tabla de hechos la cual está relacionada a cada tabla dimensión.
Las dimensiones son enlazadas al hecho mediante la relación de clave foránea. La
clave primaria en la tabla de hechos está compuesta de una relación de claves
primarias de las dimensiones. Una representación de este tipo de esquema se
muestra en la Figura 10.
36
Esquema copo de nieve (snowflake)
El problema es que, para extraer datos de las tablas en este esquema, en ocasiones
hay que vincular muchas tablas en las sentencias SQL que puede llegar a ser muy
complejo y difícil para mantener. En la Figura 11 se puede observar un ejemplo del
esquema copo de nieve.
37
Esquema Constelación
El beneficio principal de este tipo de esquema es que se tendrá un mejor uso del
espacio de almacenamiento evitando la redundancia de dimensiones, ya que
pueden ser compartidas, aunque los hechos posean granularidades diferentes. En
la Figura 12 se muestra un ejemplo de este tipo de esquema.
38
2.5.- Indicadores de gestión de ventas en el Sector Salud
La identificación de los indicadores de gestión permiten el análisis y estudio la
situación y posibles tendencias de cambio generadas por las ventas producidas en
las empresas de salud, por lo tanto se definen a continuación los conceptos básicos
relacionados al área de ventas y posibles indicadores de gestión que apoyen a la
toma de decisiones de ésta área temática.
2.5.1.1.- Empresas
Según (RAE, 2010) “Unidad de organización dedicada a actividades industriales,
mercantiles o de prestación de servicios con fines lucrativos”.
2.5.1.2.- Sector
2.5.1.3.- Salud.
Según (RAE, 2010) “Estado en que el ser orgánico ejerce normalmente todas sus
funciones”.
Dado estas definiciones, se puede definir el sector salud como, las organizaciones o
instituciones dedicadas a prestar servicios y productos, con fines lucrativos, en el
área de la salud.
39
2.5.2.- Unidades de Atención
Las unidades de atención son áreas o unidades asistenciales donde se atienden a
los pacientes según el cuadro clínico que posea.
Las unidades de atención más comunes son:
Emergencia
Unidad asistencial encargada de atender a los pacientes que ingresan con alguna
dolencia de carácter de emergencia. En esta área los pacientes son atendidos lo
antes posibles el mismo día de su ingreso, y en caso de alguna complicación,
pueden ser trasladados a otra unidad de atención.
Hospitalización
Cirugía
2
Se entiende por intensivista, un profesional médico que tiene una especialidad en atención al
paciente crítico y las competencias profesionales para desarrollarla.
40
Ambulatorio
Es una unidad de atención donde se presta atención médica a los pacientes sin
necesidad de ser admitidos en hospitalización. El paciente ingresa a la institución,
lleva a cabo el procedimiento correspondiente o tratamiento, y regresar a su hogar
el mismo día.
Neonatología
Los servicios auxiliares son entes que prestan servicios de apoyo clínico a los
pacientes a través de estudios, citas y consultas médicas. Estos servicios se pueden
solicitar a través de la central de citas o por solicitud del médico tratante (en caso de
que el paciente se encuentre en alguna unidad de atención). Existen dos tipos de
servicios auxiliares: internos y externos. Los servicios externos son empresas
subcontratadas por la institución para ofrecer sus servicios dentro de las
instalaciones de la misma.
Entre los diversos servicios auxiliares que ofrecen las instituciones de salud se
encuentran:
- Banco de sangre - Terapia respiratoria
- Cardiología - Perinatología
- Densitometría ósea - Gastroenterología
- Ecosonografía - Nutrición
- Laboratorio - Hemodinamia
- Medicina nuclear - Anestesiología
- Rayos X
- Tomografía
41
2.5.3.- Conceptos Facturables
En el proceso de ventas de una institución de salud, los conceptos facturables
vienen dados por un conjunto de servicios, materiales y medicamentos, estudios y
honorarios médicos, que son cargados a los pacientes durante su estadía en la
institución.
42
Honorarios médicos y/o procedimientos especiales
Corresponde a los gastos generados por cada estudio que el paciente se realiza en
los diversos servicios auxiliares de la institución. Estos estudios pueden ser: punción
lumbar, eco cardiograma, electrocardiograma, drenaje de absceso, hemodiálisis y
así entre otros.
2.5.4.- Protocolos
Es una agrupación de conceptos (gastos hoteleros, materiales y medicamentos,
estudios y honorarios médicos) necesarios para la realización de un procedimiento
médico o quirúrgico. Algunos protocolos que se pueden mencionar son: cesárea,
punción lumbar, apendicitis por laparoscopia, entre otros.
Los presupuestos tienen un periodo de validez y estos varían según las políticas de
las instituciones de salud.
43
modalidad de pago es seguro significa que los gastos están avalados por alguna
compañía de seguro o administradora de riesgo.
Es importante resaltar que generalmente las instituciones poseen convenios con las
compañías de seguro y administradoras de riesgo, por lo cual se cuenta con una
serie de baremos para los diferentes conceptos facturables, sin embargo pueden
existir conceptos facturables que no se encuentren tabulados como por ejemplo
materiales y medicamentos cuyos costos podrían variar según el precio actual del
inventario.
Una vez que el paciente es atendido y sus condiciones de salud por la cual ingresó
son estables o superadas, recibe de parte del médico tratante el alta médica, y es
44
entonces cuando las enfermeras informan a los auditores que el paciente ya está
listo para egresar.
45
2.5.8.- Indicadores de gestión
Los indicadores de gestión son parámetros que nos permiten medir y comparar a lo
largo del tiempo resultados obtenidos en un periodo de gestión. Cada indicador
mide o clasifica un aspecto del negocio (por ejemplo eficiencia, eficacia y calidad) y
gracias a estos se puede construir un indicador que refleje lo que se pretende medir
(Salgueiro Anabitarte, 2001).
Además, los indicadores de gestión están relacionados con el modo en que las
organizaciones generan los servicios o productos, ya que el valor del indicador es el
resultado de su medición y constituye un valor de comparación.
En el contexto del área de ventas del sector salud y tomando en cuenta que por
medio de los indicadores se permite el análisis y estudio del negocio, así como las
tendencias de cambio generadas por las ventas, las empresas de salud pueden
46
medir y ser más competitivas con respecto a la ventas de sus servicios y productos
ofrecidos, además de optimizarlos y así poder competir en este mercado. En el
siguiente apartado se muestra una lista de posibles indicadores para el área de
ventas del sector salud.
Ventas por productos y servicios ofrecidos en un período de tiempo.
Desviación de ventas en un periodo de tiempo.
Comparación del costo de los productos y servicios vendidos contra el precio
de venta.
Cantidad de productos vendidos por mes.
2.6.- Herramientas de BI
Son sistemas compuestos por un conjunto de aplicaciones para crear soluciones de
BI que permiten consultar y manejar grandes volúmenes de datos para facilitar la
toma de decisiones.
47
2.6.1. - Oracle Business Intelligence Suite
Oracle Business Intelligence Suite es una plataforma para crear soluciones de BI, la
cual ofrece una infraestructura de BI unificada e integrada que incluye un conjunto
completo de productos, que abarcan: construcción de datamarts o datawarehouse,
consultas y análisis, creación de reportes, capacidad de análisis para dispositivos
móviles, dashboards y tecnología de portal, integración con Microsoft Office, flujo de
trabajo inteligente, alertas en tiempo real, Business Activity Monitoring (BAM), etc.
Oracle Business Intelligence Suite forma parte de los productos de Oracle Fusion
Middleware y posee tres ediciones (Lambertini & Cortés, 2009):
Oracle Business Intelligence Suite Enterprise Edition, integra la tecnología de
análisis de negocios de Siebel con la tecnología de BI y middleware
existente de Oracle para ofrecer una infraestructura y herramientas de BI a
toda la empresa.
Oracle Business Intelligence Suite Standard Edition, ofrece una
infraestructura y herramientas integradas previamente de BI para un entorno
Oracle. Esta herramienta es conocida como Discoverer.
Oracle Business Intelligence Suite Standard Edition One, es un producto
especialmente diseñado para la construcción de soluciones de BI a
pequeñas y medianas empresas.
48
Figura 14 Oracle BI Enterprise Edition Vs Oracle BI Standard Edition One
(Oracle)
49
• Oracle Database Standard Edition One.Está diseñado para su despliegue en
entornos de pequeñas y medianas empresas, es fácil de instalar y configurar. Puede
ayudar a manejar los datos, y permite a las aplicaciones tomar ventaja sobre el
rendimiento, disponibilidad, seguridad y fiabilidad proporcionada por la Base de
Datos Oracle. Oracle Database 10g Standard Edition One también proporciona
compatibilidad completa con otras ediciones superiores de la base de datos,
soportando así la incrementabilidad. Un ejemplo del administrador de Oracle
Database standard Edition One se muestra en la Figura 16.
50
Gestión de metadatos.
A nivel de negocio de integración de datos de aplicaciones ERP.
Integración con herramientas de BI de Oracle para la elaboración de
informes.
51
Análisis Microsoft, Microsoft Office Excel, Base de datos IBM DB/2,
TeradataWarehouse, Fuentes ODBC, Archivos ASCII, XML, entre otros. En la
Figura 18 se muestra el funcionamiento del servidor de BI.
52
Figura 19. Business Intelligence Interactive Dashboards (Oracle)
53
Figura 20. Oracle Business Intelligence Answers (Oracle)
54
CAPÍTULO 3: MARCO METODOLÓGICO.
El desarrollo de una solución BI puede llegar a ser complicado e incluso puede fallar
su implementación sino se siguen una serie de pasos y lineamientos, es por esto
que este capítulo está dedicado a la definición de la metodología para la
construcción de una solución de inteligencia de negocio según (Kimball & Ross,
2002), la cual es una de las más usadas por su nivel de detalle, y por su relativa
facilidad de implementación y adaptación a la organización.
Figura 22. Ciclo de Vida del Modelo de Negocio por Kimball. (Kimball & Ross,
2002)
55
En el caso de la definición, existen factores identificados por el autor, que
diferencian a los proyectos fallidos de los que han logrado seguir en pie. Estos
factores son:
Poseer un aliado empresarial comprometido con el proyecto, su papel
principal será de conciliador entre el proyecto y la organización. Esta
persona, debe ser un líder políticamente astuto que pueda convencer a
sus compañeros para que estos también apoyen la solución.
La existencia de una fuerte motivación organizacional por la construcción
del almacén de datos.
La factibilidad y disponibilidad los de datos.
Uso de tecnologías de información. Algunas organizaciones no usan
tecnología de información para realizar sus labores cotidianas y desean
adentrarse en este tipo de proyectos, dedicándole así más atención en
mantener y manejar los mismos objetivos.
La preparación de la cultura actual hacia el nuevo enfoque.
Justificación.
56
3.1.2.- Definición de los requerimientos del negocio.
La definición de los requerimientos está constituida por la definición de las
necesidades del negocio que se desean medir, así como el planteamiento de cómo
recolectar los requerimientos, la recolección de documentos y el seguimiento de los
mismos
Todo almacén de datos posee una arquitectura técnica, y por esto (Kimball & Ross,
2002) ha identificado una serie de pasos a seguir, que ayudarán a conseguir los
objetivos deseados en esta etapa.
57
El segundo punto es la recolección de requerimientos de la arquitectura, donde se
debe identificar las implicaciones arquitectónicas asociadas con las necesidades
críticas del negocio.
58
En caso de una revisión, la documentación debe ser actualizada y puesta en
práctica de inmediato en el proceso de selección de productos.
Definir del nivel de granularidad. Una vez que en el paso anterior se determina el
proceso del negocio, el paso siguiente es determinar la granularidad, es decir, el
nivel de detalle al que se desea almacenar información del proceso a modelar. Para
la determinación del nivel de granularidad se debe responder a la pregunta “¿Cuál
59
es el nivel de detalle con que deseo medir? o ¿Cómo se representaría una fila en la
tabla de hechos?”. Ejemplos: Si nuestro negocio consiste en ventas de productos a
clientes y al realizar estas ventas se genera una factura por cliente, debemos decidir
que queremos almacenar, si el monto total de la factura o el detalle de los montos
por productos.
Los atributos de la tabla de dimensiones juegan un rol vital dentro del almacén de
datos, puesto que son la fuente de las restricciones de búsqueda y campos de los
reportes. El poder del almacén de datos es directamente proporcional a la calidad
de la profundidad lograda por los atributos de las dimensiones.
Las tablas de dimensiones son los puntos de entrada en la tabla de hechos. Sí los
atributos de las dimensiones son robustos entonces las capacidades analíticas
también lo serán. Los mejores atributos son textuales y discretos, deben estar
identificados por palabras reales, no abreviaturas. Los atributos típicos de una
dimensión producto por ejemplo incluyen una breve descripción compuesta máximo
por 30 o 50 caracteres, una marca, un nombre de categoría, tipo de empaque,
tamaño y otras características del producto.
60
costo puede cambiar tan a menudo que finalmente se decida que es más como un
hecho medible.
Se usa el término hecho para representar la medida del negocio. Ejemplo: Estar en
un mercado observando los productos que son vendidos y anotar la cantidad
vendida y el monto en dinero vendido por cada día de cada producto en esa tienda.
Una medición se realiza entonces, con la intersección de todas las dimensiones
(día, producto y tienda). Esta lista de dimensiones define el grano de la tabla de
hecho y el nivel de alcance de la medida.
Una fila en la tabla de hecho corresponde a una medida por lo tanto todas las
medidas en la tabla de hecho debe tener el mismo nivel de granularidad.
El hecho más usable en una tabla de hechos son los numéricos y los sumarizables.
Es teóricamente posible para un hecho medible ser textual. Sin embargo, esto se
presenta raramente. En la mayoría de los casos, una medida textuales una
descripción de algo y se extrae de una lista de valores discretos.
Todas las tablas de hechos tienen dos o más claves foráneas, que conectan con las
tablas dimensión a través de sus claves primarias. Por ejemplo, una clave de
61
producto en la tabla de hecho siempre coincidirá con un producto específico de la
dimensión producto. Cuando todas las claves foráneas de la tabla de hecho hacen
referencia a sus respectivas claves primeras en las dimensiones correspondientes,
entonces se dice que las tablas satisfacen la integridad referencial. Se accede al
hecho como tal a través de la intersección de las dimensiones combinadas.
La tabla de hecho por sí misma tiene su propia clave primaria formada por un
subconjunto de claves foráneas. Esta clave es comúnmente llamada clave
compuesta o clave concatenada. Cada tabla de hecho en un modelo dimensional
tiene una clave compuesta, por lo que, cada tabla que contenga una clave
compuesta es una tabla de hecho. Las tablas de hechos expresan relaciones de
muchos a muchos entre dimensiones en los modelos dimensionales
Una vez que se tienen definidas las tablas de hechos y dimensión, se deben
relacionar a través de las claves primarias y foráneas correspondientes.
Existe una relación natural entre los modelos dimensionales y los normalizados. La
clave es entender que la relación se encuentra en el desglose del modelo entidad
relación dentro de los múltiples esquemas dimensionales posibles de modelar
62
Finalmente se realiza la documentación en esta fase que debe contener los
nombres de las tablas y columnas, las definiciones y normas de cálculo, ya sea para
el hecho o para un atributo de alguna dimensión. Adicionalmente, debe contener
ciertos estándares con respecto a las convenciones de nomenclaturas para la
identificación de los elementos.
63
establecer estándares de diseño como características del menú y la apariencia del
entorno.
64
- Capacitación de los usuarios: se debe capacitar a los usuarios para que
realicen un buen uso del sistema y así, se logre mantener una calidad
estable en los datos.
65
CAPÍTULO 4: MARCO APLICATIVO
En este capítulo presenta cómo la metodología de Ralph Kimball fue aplicada para
el desarrollo de una solución de inteligencia de negocio en el área de ventas de
instituciones del sector salud. Se explican aspectos propios de la arquitectura de la
solución planteada como la base de datos intermedia, diseño y construcción del
almacén de datos, elaboración de procesos ETC y diseño y construcción de las
consultas analíticas para el despliegue de los indicadores de gestión relevantes en
el área de ventas en el sector salud.
A continuación se describe con detalle los procesos que se realizaron en cada una
de ellas para llevar a cabo la solución.
Para lograr este objetivo se investigaron una serie de indicadores relacionados con
las ventas y se discutieron acerca de los posibles indicadores que podrían requerir,
se listaron los que se podían utilizar para las empresas del sector salud.
66
Posteriormente, se produjo una fase de selección y se establecieron las fórmulas
que podían resolver dichas consultas, la unidad de medida correspondiente y una
breve descripción tal y como se muestran en las siguientes tablas, donde la tabla 3
posee indicadores de medición y tabla 4 posee indicadores de comparación,
permitiendo identificar la dimensionalidad de cada indicador y así especificar los
diferentes grados de detalle dentro de cada concepto del negocio propuesto.
Nombre Formula Unidad Glosario
67
Donde i es un responsable seguro
68
Nombre Fórmula Unidad Glosario
ETC ETC
69
que sigue un modelo de ventas dentro de las empresas del sector salud, basándose
en un modelo de ventas genérico. Esta base de datos está construida con una base
de datos Oracle.
70
4.5.- Diseño del Modelo Dimensional
El análisis de los requisitos analíticos de los usuarios para este tipo de solución,
requiere un enfoque diferente al usado en los sistemas operacionales, por lo tanto
para el diseño del modelo dimensional, se desarrolló siguiendo los siguientes pasos
propuestos por Kimball:
71
respuesta a esta interrogante se tomó cada indicador y se señaló bajo que
perspectiva se deseaba ver el hecho a medir. Se puede observar un ejemplo del
proceso realizado en la Figura 25.
1- Productos 1.- Tipo Cliente 1.- Unidad de 1.- Diagnostico 1.- Día
2- Clasificación 2.- Cliente atención 2.- Mes
productos 3.- Año
3- Tipo producto 4.- Fecha
Así mismo, se identificó que existían relaciones jerárquicas entre ciertos atributos de
las dimensiones, las cuales fueron representadas como se muestra en la siguiente
Figura 26. Relaciones jerárquicas identificadas
72
Figura 26. Relaciones jerárquicas identificadas
Finalmente se les asignó un nombre a cada dimensión, los cuales fueron localidad,
diagnóstico, tiempo ventas, tiempo presupuesto, producto y cliente. Cabe destacar,
que se crearon dos dimensiones referentes a las fechas ya que dependiendo del
nivel de granularidad, el tiempo puede ser visto como la fecha de elaboración de la
factura o como la fecha en que se realizó un presupuesto.
73
Y por último, los clientes quienes son los responsables de los pagos de las facturas,
y que puede ser categorizado por tipo cliente (Autopagante o Seguro) y finalmente
su descripción. Ejemplo: Seguros Mercantil pertenece al tipo cliente Seguro y Pedro
Pérez pertenece al tipo cliente Autopagante.
Con los hechos y las dimensiones definidas, se puede observar en las Figura 27 y
28 una representación gráfica de los hechos con sus dimensiones y sus atributos.
Figura 27. Representación gráfica del hecho ventas con sus dimensiones
74
Figura 28. Representación gráfica del hecho Presupuesto con sus
dimensiones y atributos
4.5.3.- Determinar el hecho: Teniendo definidas las dimensiones con sus atributos,
jerarquías y conociendo la existencia de dos niveles de granularidad, el paso
siguiente es la definición de las tablas hechos, donde se determinó que para el nivel
de granularidad correspondiente al detalle de los productos vendidos, los siguientes
elementos medibles: Monto, Cantidad y Costo, denominado hecho “Ventas” como
se muestra en la siguiente Figura 29. Además, se definieron los siguientes atributos
en el hecho:
Nro_caso, que se refiere al número de caso de una factura,
Nro_factura que es el identificador de cada factura,
Paciente, el nombre del paciente de un caso
Diagnóstico de ingreso y de egreso, que son los diagnósticos que se
les dio al paciente
75
Tabla Hecho Atributos
Ventas id_Producto(PK),
id_Cliente(PK),
id_localidad(PK),
id_Tiempo(PK),
nro_caso,
nro_factura,
paciente,
diagnostico_ing
diangostico_eg,
Precio,
Costo,Cantidad
Para nivel de granularidad referente al monto total de las facturas, cantidad y monto
de presupuestos, se denominó “Presupuesto vs Facturado”, y se identificaron los
siguientes elementos medibles, como se muestra en la Figura 30.
Presupuesto id_Diagnóstico(PK),
Vs Facturado id_Cliente(PK),
id_localidad(PK),
id_Tiempo(PK),
nro_Factura,
paquete,
rompio_paquete,
Precio_Presupuesto,
Precio_Factura
Cantidad_Presupuesto
Figura 30. Hecho Presupuesto
Además como se puede observar en la figura anterior existen una serie de atributos
que significan lo siguiente:
Nro_factura: factura que se le realizó un presupuesto
Paquete: se refiere a que si el prespuesto que se le realizó tiene un previo
acuerdo con la compañía de seguro sobre el monto a pagar por la factura.
Rompio_paquete: se refiere a que si durante el proceso de facturación se
rompió el acuerdo con la compañía de seguro por haber excedido el monto
de la facturación con respecto al del presupuesto.
76
soporte a la solución de inteligencia de negocio propuesta. El modelo dimensional
se muestra en la siguiente Figura 31.
77
Figura 32. Modelo Dimensional extendido
78
4.5.4.- Modelo Entidad Relación – Base de Datos intermedia: Debido a que
cada empresa del sector salud maneja sus procesos diarios de formas diferentes, se
hizo uso de un área intermedia encargada de centralizar los datos referentes al área
de ventas, para así estandarizar los datos provenientes de las distintas fuentes de
datos y que serán almacenados posteriormente en el almacén de datos.
Tabla Atributos
Tipo_cliente Cod_tipocliente
Descripcion
Cliente Cod_cliente
Descripcion
Cod_tipocliente
Unidad_atencion Cod_unidad
Descripcion
Factura Nro_factura
Nro_caso
Cod_unidad
Monto
Fecha_emision
Ci_rif_responsable
Estado
Cod_cliente
Nombre_paciente
Sexo_paciente
Diagnostico_ingreso
Diagnostico_egreso
Cod_presupuesto
Cod_diagnostico_presupuesto
Precio_presupuesto
79
Paquete
Rompio_paquete
Fecha_presupuesto
Cantidad_presupuesto
Detalle_factura Nro_factura
Cod_producto
Cod_detalle
Cod_unidad
Cantidad
Precio
Costo
Producto Cod_producto
Descripción
Cod_clasif
Clasificacion_producto Cod_clasif
Descripción
Cod_tipoproducto
Tipo_producto Cod_tipoproducto
descripcion
Diagnostico Cod_diagnostico
Descripción
Cod_tipo_historia
Tipo_historia Cod_tipo_historia
Descripción
80
Figura 33. Modelo entidad relación de la base de datos intermedia
81
Una vez creada la base de datos intermedia, el siguiente paso fue la creación de las
estructuras del almacén de datos: dimensiones y cubos. Para la creación de estas
estructuras se utilizó la herramienta Oracle Warehouse Builder 10g (OWB), la cual
provee un asistente para la creación de las mismas como se puede ver en la Figura
35
82
Figura 36. Asignación de atributos con el asistente
83
Seguido a esto, cada nivel jerárquico de la dimensión tiene una estructura
compuesta por los atributos antes definidos para la dimensión como se muestra en
la Figura 38. En cada nivel jerárquico se puede elegir que atributos tendrá cada nivel
jerárquico de la dimensión.
Una vez creada todas las dimensiones utilizando la herramienta OWB a través de
los pasos antes descritos, se pasó a construir los cubos. Para ello la herramienta
cuenta también con un asistente para la creación de cubos el cual se puede
observar en la Figura 39.
84
Figura 39. Asistente de creación de cubos
85
Figura 40. Definiendo las dimensiones para el cubo
Luego de seleccionar las dimensiones, se indicó que medidas tendría cada cubo,
para ello el asistente cuenta con una interfaz como se observa en la Figura 41,
donde se escribió el nombre de la medida y su tipo de datos.
86
Figura 41. Definiendo las medidas y atributos del cubo
Una vez realizado este proceso para cada uno de los cubos, el modelo dimensional
estuvo completo, con sus seis dimensiones y dos cubos formando una constelación.
3
El término Dimensión Degenerada, hace referencia a un campo que será utilizado como
criterio de análisis y que es almacenado en la tabla de hechos.
87
4.7.- Diseño y construcción de procesos ETC
Dada la existencia de una base de datos intermedia por las necesidades y
beneficios antes descritos, fue necesario un proceso de ETC para extraer y cargar
los datos de las fuentes a la base de datos intermedia. También fue necesario otro
proceso de ETC para obtener y cargar los datos de la base de datos intermedia al
almacén de datos. Estos procesos de ETC se explican a continuación.
Para ayudar a ilustrar este proceso ETC se puede observar en la Figura 42. La
empresa del sector salud cuenta con una base de datos en SQL Server 2005 la cual
almacena sus procesos diarios, entre los cuales están los procesos de ventas.
88
Para extraer los datos de la fuente hacia la base de datos intermedia, se creó un
procedimiento almacenado que se conectó a través de un servicio heterogéneo con
la fuente de datos para extraer y transformar los datos y así poder adaptarlos a la
estructura de la base de datos intermedia para luego cargarlos en ella.
89
provee la herramienta OWB llamado “Joiner”, para luego hacer corresponder los
atributos de dicha intersección con la dimensión Cliente. En la siguiente Figura 44
se muestra el resultado de este proceso.
90
Para dimensión localidad sólo hizo falta realizar las correspondencias directas de los
atributos de la tabla Unidad_Atencion con los atributos de la dimensión Localidad,
esto gracias a como está diseñada la base de datos intermedia. En la Figura 46 se
puede ver esta correspondencia
91
de representar el tiempo, si en forma de calendario o en forma fiscal. También se
especifica el año de inicio y la cantidad de años que se desea generar. Para el caso
de estudio, se decidió crear la dimensión tiempo y tiempo presupuesto como
calendario, así la herramienta creó las dimensiones con la jerarquía año, trimestre,
mes y día, además de sus atributos.
92
y así estuvieran en el formato que el cubo maneja. En la Figura 49 se muestra el
ETC del cubo de presupuesto.
Con los procesos ETC de las dimensiones y de los cubos construidos, se pasó al
despliegue de los mismos para poblar las tablas, utilizando el centro de control de
Oracle Warehouse Builder.
Para los cubos se realizó un proceso similar, se crearon y se desplegaron las tablas
para luego desplegar e iniciar las correspondientes que poblaron ambos cubos.
93
Los tableros de mando están compuestos por un conjunto de páginas, donde se
representan los indicadores, en cada una de ellas se pueden representar uno o más
indicadores con diferentes formatos.
94
Figura 50. Oracle BI Administration Tool
95
Figura 51. Capa Física
Dentro de la capa del Modelo de Negocio y mapeo, el objetivo de esta capa fue
captar cómo piensan los usuarios acerca del negocio utilizando su propio
vocabulario, para esto se definió el modelo de negocio especificando las
dimensiones, jerarquías y atributos de cada uno de los componentes y se
renombraron alguno de los atributos, además de eliminar los que no eran
significativos para los usuarios finales. En la Figura 52, se muestra la capa del
Modelo de Negocio y mapeo.
96
Figura 52. Capa del Modelo de Negocio y mapeo
En la capa de Presentación, se encuentran los datos que ven los usuarios con la
aplicación analítica, el Oracle BI Answer. En esta capa se pueden reorganizar los
datos como renombrarlos para hacerlos más entendibles para el usuario final. En
este caso se dejaron los datos como los ubicados en la capa anterior, como se
muestra en la Figura 53.
97
Figura 53. Capa de presentación
Durante la elaboración de las tres capas con el Oracle BI Administration Tool, los
datos esta deshabilitados para realización de consultas a través de las herramientas
analíticas, es por esto que al final de la definición de las tres capas se realizó un
proceso de habilitación de los datos.
98
Business Intelligence Interactive Dashboards. En las figuras siguientes, podemos
observar algunos ejemplos de nuestros indicadores representados en el cuadro de
mando.
En la Figura 54, se muestra un ejemplo del cuadro de mando que contiene todos los
indicadores resaltantes de la solución de negocio propuesta y es usado como
cuadro resumen.
El siguiente cuadro de mando Figura 55, se muestran las ventas por unidad de
atención en un periodo de tiempo , donde se evidencio que la unidad de atención
que posee más ventas a su cargo es la unidad de Quirófano.
99
Figura 55. Indicador referente al análisis de las ventas por unidad de atención
En la siguiente Figura 56, se muestra un análisis detallado de las ventas por unidad
de atención y tipo de producto facturado por cada diagnostico registrado en un
periodo de tiempo.
Figura 56. Indicador referente al análisis detallado de las ventas por unidad de
atención
100
La figura 57 muestra las ventas por tipo de cliente, evidenciando que los
responsables Seguro son los que más generan ventas a la empresa de salud.
Siguiendo con el análisis de las ventas por tipo cliente, la figura 58 muestra el
detalle de los tipos de cliente Seguro
Figura 58. Indicador referente a las ventas por tipo cliente Seguro
101
Así mismo se realizó el siguiente cuadro de mando para el análisis por tipo Cliente
Autopagante, como se muestra en la figura 59.
Figura 59. Indicador referente a las ventas por tipo de cliente Autopagante.
El siguiente cuando de mando figura 60, se muestran las ventas por tipo producto
en un periodo de tiempo.
102
En la figura 61 se muestra la desviación porcentual de las ventas realizadas por
mes, donde el mayor registro de ventas se realizo en el mes de marzo.
Figura 61. Indicador referente a la desviación porcentual de las ventas por mes
103
Así mismo se realizó el siguiente cuadro de mando Figura 63, para determinar los
10 primeros clientes, autopagante y seguro con los mayores montos generados por
la venta en un periodo de tiempo.
104
Figura 64. Indicador referente a la diferencia entre Facturado y Presupuestado
La figura 65 muestra el cuadro de mando realizado para ilustrar el detalle de
cantidad de presupuestos realizados por unidad de atención en un periodo de
tiempo, con el cual se determino que la mayor cantidad de presupuestos se realiza
en el mes de enero.
105
Figura 65. Indicador referente a la cantidad de Presupuestos por Unidad de
Atención
106
4.11.- Mantenimiento y crecimiento
Una vez terminado el desarrollo completo, se tomaron en cuenta los siguientes
puntos:
- Soporte: Los procesos de ETC se deben programar según las necesidades
de cada institución de salud, en este sentido, se recomienda que se escoja
un momento en que las fuentes de datos no estén siendo muy utilizadas
para no entorpecer los procesos diarios de las empresas del sector salud.
Además, la periodicidad de la ejecución de estos procesos depende de las
necesidades de cada institución de salud.
107
CONCLUSIONES
Se logró definir una lista de indicadores de gestión genéricos para el área de ventas
de las empresas de salud. Así mismo, se diseñó e implementó un modelo relacional
del área de ventas correspondiente a las empresas del sector salud, el cual permite,
sin importar la fuente de datos que manejen las empresas del sector salud, modelar
los procesos de ventas, convirtiendo la solución propuesta en una solución de
inteligencia de negocio genérica y no particular para una empresa del sector salud.
108
Se realizaron pruebas para validar los valores que estas consultas arrojaron a través
de un caso de estudio, dichas pruebas arrojaron resultados positivos validando así
la solución de inteligencia de negocio.
109
RECOMENDACIONES
110
REFERENCIAS BIBLIOGRÁFICAS
de Pablos, C., López Hermoso, J. J., Martín Romo, S., & Medina, S. (2004).
Informática y comunicaciones en la empresa. Madrid: ESIC Editorial.
Kimball, R., & Ross, M. (2002). The Data Warehouse Toolkit. Wiley.
111
http://www.oracle.com/global/lad/corporate/press/2006_mar/presentacion_nu
eva_bi-suite.html
Moss, L. T., & Atre, S. (2003). Business intellingence roadmap. The Complete
Project Lifecyvle for Decision-Support Applications. Boston: Addison - Wesley
Information Technology Series.
Planeaux & Alvin. (2007). Oracle Business Intelligence Standard Edition One.
Oracle.
SCN Education B.V. (Eds). (2001). Data Warehousing. The Ultimate Guide to
Building Corporate Business Intelligence. Lengerich: Vieweg.
112
Todman, C. (2001). Designing a Data warehousing. Hewlett-Packard
Professional Books.
Tsai, J. (2007). Oracle Business Intelligence Standard Edition One Tutorial
Release 10g (10.1.3.2.1). Oracle.
Whitten, J., Bentley, L., & Barlow, V. (1997). Análisis y diseño de Sistemas de
Información. Madrid: McGraw-Hill.
Wrembler, R., & Koncilia, C. (2007). Data Warehouses and OLAP. Concepts,
architectures and solutions. IGI Global.
113
ANEXOS
Anexo 1. Creación del Servicio Heterogéneo
1. Lo primero es definir el DNS de SQL Server. En el panel de control, icono de
ODBC.
2. En la pestaña de DNS de Sistema oprimir el botón Agregar.
3. Escoger el controlador para SQL Server.
4. Colocarle el nombre, en nuestro caso fue ORACLE_SQL y escoger como
servidor “local”. Continuar con el asistente para la creación del ODBC hasta
el final hasta que confirme la creación del mismo.
5. Se modifica el archivo init asignando los valores OFF a los parámetros
referentes a la conexión y traza.
6. Luego se modifica el listener.ora con los parámetros que identifican al objeto
odbc
7. Se modifica el tnsname, colocando la referencia de la conexión por odbc:
8. Luego crear el DB Link desde oracle de la siguiente manera:
create database link ORACLE_SQL
connect to sa identified by using 'ORACLE_SQL ';
9. Por último probar la conexion hacienda una consulta sencilla como:
Select * from factura@oracle_sql;
114
Anexo 2. Tabla comparativa de herramientas para la construcción de
soluciones de inteligencia de negocio
Herramienta de
MicroStrategy Administrator.
construccion de Pentaho Data Integration
MicroStrategy Intelligence Oracle warehouse Builder
InfoSphere Warehouse
Datawarehouse / data Kettle
Server.
marts
Sistema de mensajes de Soportado en la versión
Cognos 8 Planning MicroStrategy Movil
Alerta Enterprise con Oracle BI Delivers
115