Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tipo de artculo: Artculo original Temtica: Soluciones Informticas Recibido: 4/12/2012 | Aceptado: 25/01/2013 | Publicado: 15/02/2013
Datamart para la Unidad Central de Cooperacin Mdica Data Mart for the Central Unit of Medical Cooperation
Leydis Hidalgo Lpez 1*
1* Universidad de las Ciencias Informticas, Carretera a San Antonio de los Baos, km 2 , Torrens, Boyeros, La Habana, Cuba. CP.: 19370 lhlopez@uci.cu
Resumen: La colaboracin mdica es una premisa fundamental del sistema nacional de salud cubano. Su informacin es procesada por la Unidad Central de Cooperacin Mdica (UCCM), que mantiene un registro actualizado de los colaboradores y misiones en el exterior. De ah la necesidad de almacenar grandes volmenes de informacin para la toma de decisiones. En funcin de esta necesidad se crea el producto Datamart para contener la informacin consolidada del proyecto Colaboracin Mdica. Durante su desarrollo se utiliza como gua la metodologa Hefesto que consta de cuatro fases, destacndose; el proceso de Extraccin, Transformacin y Carga (ETL) para dar paso al procesamiento analtico en lnea, se utilizan adems herramientas de software libre. El Datamart brinda fcil acceso
a los datos y permite que exista una fuente nica de informacin relevante para la toma de decisiones. Los directivos pueden obtener una representacin grfica para una mejor comprensin y estudio en el momento de tomar decisiones.
Palabras clave: Datamart, cooperacin mdica, toma de decisiones, almacn de datos, Abstract: The medical collaboration is a fundamental premise of the Cuban health system. Its information is
processed by the Central Unit of Medical Cooperation (Spanish, UCCM) that maintains an up-to-date registration of the collaborators and missions abroad. Hence the need to store big volumes of information for decision-making. It is traced as objective to develop a datamart that contains the consolidated information of the Medical Collaboration project. For their constructionist is used as a guide the Hefesto methodology that consists of four phases, standing out; the process of Extraction, Transformation and it Loads (ETL) to open the way for online analytical processing, using for this free software tools. The datamart will provide easy access to the data and allow that there is an unique source of relevant information to making decisions. The directive will be able to obtain a graphical representation for a better understanding and study when making decisions.
Keywords: Datamart, Medical cooperation, making decisions, Data warehouse.
39
Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343
Introduccin
La colaboracin mdica cubana es una premisa fundamental del sistema nacional de salud y ocupa un lugar priorizado dentro de la poltica de sus convicciones humanistas (Ramos, 2009). Actualmente su informacin es procesada por la Unidad Central de Cooperacin Mdica (UCCM), que cuenta con un proyecto realizado en la Universidad de las Ciencias Informticas para mantener un registro actualizado de los colaboradores y misiones mdicas en el exterior y enviar informacin detallada y consolidada a los niveles superiores del MINSAP, al Ministerio de Relaciones Exteriores (MINREX) y al Consejo de Estado. La informacin se encuentra almacenada en una base de datos relacional sobre el sistema gestor MySQL, lo cual le permite almacenar todos los datos relacionados con los colaboradores mdicos cubanos y sus respectivas misiones en los distintos pases. El requisito fundamental de este almacenamiento es conservar toda la informacin relevante sobre los colaboradores y misiones mdicas por un perodo de tiempo indefinido, lo cual provoca una carga intensa de la base de datos operacional y dificulta una respuesta rpida al cliente. En Junio del 2009 se present una tesis elaborada en la Universidad de las Ciencias informticas cuyo tema es el de Implementacin de un Datawarehouse para el Control de Recurso Humano de la salud. La misma apoy a los directivos del Observatorio Nacional de los Recursos Humanos (RRHH) de la salud en la toma de decisiones con relacin a las actividades de colaboracin mdica y la docencia en la formacin posgraduada, donde se combinaron algunos datos del proyecto Colaboracin y Docencia Mdica para obtener un control de los colaboradores y su formacin docente. Este almacn de datos no abarc toda la informacin relevante para la UCCM, solamente lo relacionado con los RRHH de la salud (Cueto, y otros, 2009). De ah la necesidad de contar con un sistema que permita extraer y filtrar una mayor cantidad de datos para transformarlos, integrarlos y almacenarlos con el fin de poder acceder a la informacin para dar soporte en el proceso de toma de decisiones de los directivos de la UCCM y reducir el tiempo de consultas largas y complejas. Adems, poder convertir los datos en informacin homognea, de mayor calidad, y que se mantenga en el tiempo. Por lo antes planteado se defini como objetivo de la investigacin: desarrollar un datamart que contenga la informacin consolidada del proyecto Colaboracin Mdica.
Materiales y mtodos
Mediante los estudios realizados se escoge la metodologa Hefesto como gua para la construccin del datamart. Su idea est fundamentada en una amplia investigacin, comparacin de metodologas existentes y experiencias propias en procesos de confeccin de almacenes de datos (Bernabeu, 2007).
40
Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343
Total de colaboradores que han cumplido misin por pases en un perodo de tiempo.
Indicador
Perspectivas
Cantidad de colaboradores por tipo de misin en un determinado pas en un perodo. Indicador Perspectivas
Una vez identificados los indicadores y perspectivas se procede a la confeccin del modelo conceptual de datos del datamart proporcionando una idea precisa y clara del alcance del almacn.
41
Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343
datos esperados, con los componentes (Selecciona/Renombra) e (Insertar/Actualizar) se cargan los datos en el datamart.
El proceso de carga es similar para las 6 dimensiones restantes. Para la carga de datos de la tabla de Hechos, que tiene como objetivo relacionar todas las dimensiones del almacn, se realiza una bsqueda en la base de datos de colaboracin mdica para a travs de sentencias SQL extraer los indicadores comunes y relacionar los datos entre todas las dimensiones y unirlos mediante la realizacin de un producto cartesiano, contando con la fecha de carga de los datos. A continuacin de la carga de la tabla de Hechos se crea un trabajo (job), mediante el mismo se ejecutan todas las cargas de las dimensiones del almacn. Para iniciar este proceso se utiliza el componente (Start) el cual da comienzo a la extraccin, transformacin y carga por la dimensin fecha_carga. Se culmina con la tabla de Hechos que cuenta para el manejo de errores en cualquier etapa, con el componente (Dummy) que informa de errores mediante el componente (DisplayMsgboxInfo) al usuario (Figura 2).
42
Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343
Fecha_carga Ao Mes Da
Luego de establecer las jerarquas de cada una de las dimensiones se elaboran las medidas o indicadores en busca de las respuestas de lo que desean conocer los directivos de la UCCM. Para ello se utilizan las consultas MDX (multidimensional expressions o expresiones multidimensionales) que se ejecutan sobre el datamart para obtener los indicadores que contribuirn a la toma de decisiones. Desde la base de datos db_datamart se cargan las dimensiones y la tabla de hechos para calcular las medidas. Luego, se utiliza la herramienta Workbench para disear el cubo de datos o Cubo_datamart (Figura 3) donde se agregan las medidas y formulan las consultas para obtener el total de colaboradores, misiones, importe y desertores, adems del porciento de misiones en dependencia de las necesidades de los directivos de la UCCM. El cubo es almacenado en un archivo XML para que sea cargado en la herramienta Mondrian y realizar el procesamiento analtico en lnea.
43
Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343
Figura 3.Cubo multidimensional que contiene las dimensiones, jerarquas de los atributos y medidas.
Resultados y discusin
El cliente Jpivot estar disponible a travs de la web, donde se muestra un men con las opciones necesarias para obtener la informacin desde diferentes perspectivas, ejemplo filtrar la informacin segn los campos que deseen los directivos (Figura 4), ajustar la visin de los datos, el filtro de visualizacin y aadir o quitar campos. Los resultados sern mostrados mediante grficos (Figura 5) y tablas que podrn ser exportados en formato PDF o EXCEL. Entre las respuestas a las preguntas de los directivos se obtuvieron: Cantidad de colaboradores con ms de 5 aos de misin en un determinado pas. Por ciento de colaboradores femeninas que cumplieron misin en un pas en un perodo de tiempo. Cantidad de pases con ms de tres aos de misin (pases en los cuales Cuba tiene cooperantes hace ms de tres aos). Se desea conocer el total de colaboradores por rea geogrfica que obtuvieron evaluacin satisfactoria en la misin en un determinado perodo de tiempo. Importe total por nmina congelada de los colaboradores en X misin en un perodo de 5 aos. Total de tipos de pasaportes confeccionados en un perodo de tiempo. Total de desertores por pases en X misin en un perodo de tiempo determinado.
44
Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343
45
Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343
Un datamart es una versin especial de almacn de datos con el objetivo de responder a un determinado anlisis, funcin o necesidad y con una poblacin de usuarios especfica. La diferencia entre un datawarehouse y un datamart es su alcance. El datamart est pensado para cubrir las necesidades de un grupo de trabajo o de un determinado departamento dentro de la organizacin. Es el almacn natural para los datos departamentales. En cambio, el mbito del datawarehouse es la organizacin en su conjunto. (Curto, 2007) En sntesis los datamarts son pequeos datawarehouses centrados en un tema o un rea de negocio especfico dentro de una organizacin. (Bernabeu, 2009) La informacin que se necesita para la toma de decisiones en la UCCM se encuentra orientada a un nico tema; el de los colaboradores y sus respectivas misiones mdicas, por tanto no es necesario la creacin de un datawarehouse pues con un datamart se tiene fcil acceso a los datos que se necesitan frecuentemente, crea una vista colectiva para grupos de usuarios, mejora el tiempo de respuesta del usuario final, se destaca por una definicin de requerimientos ms fcil y rpida, se simplifica el desarrollo de todo el mecanismo de su base de datos y con ello baja substancialmente todo el coste del proyecto, as como su duracin.
Datamarts existentes
La mayora de las empresas del mundo ya cuentan de una manera u otra con diferentes datamarts, esto se debe a que tienen la necesidad constante de consumir informacin y hacer un mejor uso de los datos ante un mercado ms competitivo. Una de estas empresas es Petroecuador que cuenta con un datamart que les proporciona a los directivos informacin de los volmenes y precios de embarques de crudo y productos para la exportacin e importacin, almacenndose histricamente para permitir el anlisis de tendencias y proyecciones brindando una mejor toma de decisiones al momento de disear las estrategias de produccin.
General Mills de Venezuela C.A. es una empresa trasnacional dedicada a la manufactura de conservas alimenticias
para el consumo humano. Todos los das se lleva a cabo un proceso automatizado de extraccin de datos desde el sistema principal, los cuales despus de analizados, procesados y transformados llenan las tablas de la base de datos del datamart, esto les permite desarrollar reportes sobre precios, descuentos y promociones vigentes adems del vencimiento de productos terminados (Microsoft, 2004).
Cantv Corporacin se beneficia de un datamart de clientes PYME (pequea y mediana empresa) otorgndole a
corto plazo informacin valiosa que no se encontraba disponible en otro sistema acerca de los clientes, permitiendo establecer prioridades a la hora de la carga de datos de sus diferentes filiales estandarizando los datos de los mismos y actualizndolos de acuerdo a sus prioridades. (Vsquez, 2002) Las empresas cubanas en la poca actual tambin necesitan obtener de una forma cada vez ms rpida la informacin necesaria para tomar decisiones, tal es el caso de la Empresa de Proyectos de Arquitectura e Ingeniera (EMPAI) de Matanzas que posee un datamart para el control de la informacin relevante del proceso de negocio de Gestin del Capital Humano para elevar la efectividad de la organizacin. (Hidalgo-Gato, 2007) Con el datamart para la UCCM los directivos dispondrn de una herramienta que les permitir: Tener el control de la cantidad de los colaboradores cumpliendo o que han cumplido misin en cualquier parte del mundo. Obtener una representacin de los resultados en forma de tabla, grfica, PDF y Excel. Enviar informacin detallada y consolidada a los niveles superiores; MINSAP, MINREX y al Consejo de Estado de forma rpida.
46
Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343
Conclusiones
A partir de los resultados obtenidos se arrib a la siguiente conclusin: Con el diseo e implementacin del datamart para la UCCM se permite almacenar grandes volmenes de informacin relevante solucionando los problemas ms comunes que afronta la organizacin actual: el procesamiento de gran cmulo de datos, as como la extraccin de la informacin de colaboracin mdica desde mltiples fuentes para transformarla en el formato deseado, lo que agiliza las consultas requeridas por los directivos de la UCCM para la toma de decisiones. Con el objetivo de mejorar el uso del datamart para la UCCM se recomienda aplicar tcnicas de minera de datos, que les permita a los directivos de la UCCM: analizar factores de influencia en determinados procesos, predecir, estimar variables o comportamientos futuros de los colaboradores y misiones, adems de obtener secuencias de eventos que provoquen comportamientos especficos para una mejor toma de decisiones.
Referencias
BERNABEU, RICARDO DARO. Data Warehousing: Investigacin y sistematizacin de conceptosHefesto: Metodologa propia para la construccin de un Data Warehouse. Argentina: s.n., 2007. CUETO, ARIAGNA RAMN Y DAZ GARCA, JOANNIS. Implementacin de un Data Warehouse para el control del Recurso Humano de la Salud. La Habana. 2009. CURTO, JOSEP. Data Warehousing, Data Warehouse y Datamart. 2007. Disponible en: http://informationmanagement.wordpress.com/2007/10/07/data-warehousing-data-warehouse-ydatamart/. CUETO, ARIAGNA RAMN Y DAZ GARCA, JOANNIS. Implementacin de un Data Warehouse para el control del Recurso Humano de la Salud. La Habana. 2009. CURTO, JOSEP. Data Warehousing, Data Warehouse y Datamart. 2007. Disponible en: http://informationmanagement.wordpress.com/2007/10/07/data-warehousing-data-warehouse-ydatamart/. DATAPRIX KNOWLEDGE IS THE GOAL. Arquitectura del data warehousing. 07 de 2009. Disponible en: http://www.dataprix.com/es/arquitectura-del-data-warehouse. HIDALGO-GATO, GISEL GONZLEZ. Data Mart de Gestin Econmico - Financiera de la Empresa de Proyectos de Arquitectura e Ingeniera (EMPAI). 2007. Disponible en: http://monografias.umcc.cu/monos/2007/informatica/m07258.pdf. KAFATI, ELIZABETH GUTIRREZ. La plataforma Pentaho Open Source Business Intelligence. 2010. Disponible en: http://egkafati.bligoo.com/content/view/219538/La_plataforma_Pentaho_Open_Source_Business_Intellig ence.html. MICROSOFT. Microsoft. casos de xito. http://www.microsoft.com/venezuela/casosdeexito/generalmills.aspx. 2004. Disponible en:
47
Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343
RAMOS, ARIEL DELGADO. Informatizacin en el Sistema Nacional de Salud de Cuba. 2009. Disponible en: http://informatica2009.sld.cu/conferencias/informatizacion-en-el-sistema-nacional-de-salud-de-cuba. VARIOS. La empresa multidimensional: OLAP. La revista de tecnologa y estrategia de negocio en Internet. 2002. Disponible en: http://www.idg.es/iWorld/articulo.asp?id=143456. VSQUEZ, ALVARO ENRIQUE TRAK. UCAB. Tesis digitalizadas. Elaboracin de un Data Mart de clientes PYME, a las unidades de mercadeo de CANTV Corporacin. 2002. Disponible en: http://biblioteca2.ucab.edu.ve/anexos/biblioteca/marc/texto/AAP7826_1.pdf.
48