Está en la página 1de 10

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol.

6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

Tipo de artculo: Artculo original Temtica: Soluciones Informticas Recibido: 4/12/2012 | Aceptado: 25/01/2013 | Publicado: 15/02/2013

Datamart para la Unidad Central de Cooperacin Mdica Data Mart for the Central Unit of Medical Cooperation
Leydis Hidalgo Lpez 1*
1* Universidad de las Ciencias Informticas, Carretera a San Antonio de los Baos, km 2 , Torrens, Boyeros, La Habana, Cuba. CP.: 19370 lhlopez@uci.cu

Resumen: La colaboracin mdica es una premisa fundamental del sistema nacional de salud cubano. Su informacin es procesada por la Unidad Central de Cooperacin Mdica (UCCM), que mantiene un registro actualizado de los colaboradores y misiones en el exterior. De ah la necesidad de almacenar grandes volmenes de informacin para la toma de decisiones. En funcin de esta necesidad se crea el producto Datamart para contener la informacin consolidada del proyecto Colaboracin Mdica. Durante su desarrollo se utiliza como gua la metodologa Hefesto que consta de cuatro fases, destacndose; el proceso de Extraccin, Transformacin y Carga (ETL) para dar paso al procesamiento analtico en lnea, se utilizan adems herramientas de software libre. El Datamart brinda fcil acceso

a los datos y permite que exista una fuente nica de informacin relevante para la toma de decisiones. Los directivos pueden obtener una representacin grfica para una mejor comprensin y estudio en el momento de tomar decisiones.
Palabras clave: Datamart, cooperacin mdica, toma de decisiones, almacn de datos, Abstract: The medical collaboration is a fundamental premise of the Cuban health system. Its information is

processed by the Central Unit of Medical Cooperation (Spanish, UCCM) that maintains an up-to-date registration of the collaborators and missions abroad. Hence the need to store big volumes of information for decision-making. It is traced as objective to develop a datamart that contains the consolidated information of the Medical Collaboration project. For their constructionist is used as a guide the Hefesto methodology that consists of four phases, standing out; the process of Extraction, Transformation and it Loads (ETL) to open the way for online analytical processing, using for this free software tools. The datamart will provide easy access to the data and allow that there is an unique source of relevant information to making decisions. The directive will be able to obtain a graphical representation for a better understanding and study when making decisions.
Keywords: Datamart, Medical cooperation, making decisions, Data warehouse.

39

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

Introduccin
La colaboracin mdica cubana es una premisa fundamental del sistema nacional de salud y ocupa un lugar priorizado dentro de la poltica de sus convicciones humanistas (Ramos, 2009). Actualmente su informacin es procesada por la Unidad Central de Cooperacin Mdica (UCCM), que cuenta con un proyecto realizado en la Universidad de las Ciencias Informticas para mantener un registro actualizado de los colaboradores y misiones mdicas en el exterior y enviar informacin detallada y consolidada a los niveles superiores del MINSAP, al Ministerio de Relaciones Exteriores (MINREX) y al Consejo de Estado. La informacin se encuentra almacenada en una base de datos relacional sobre el sistema gestor MySQL, lo cual le permite almacenar todos los datos relacionados con los colaboradores mdicos cubanos y sus respectivas misiones en los distintos pases. El requisito fundamental de este almacenamiento es conservar toda la informacin relevante sobre los colaboradores y misiones mdicas por un perodo de tiempo indefinido, lo cual provoca una carga intensa de la base de datos operacional y dificulta una respuesta rpida al cliente. En Junio del 2009 se present una tesis elaborada en la Universidad de las Ciencias informticas cuyo tema es el de Implementacin de un Datawarehouse para el Control de Recurso Humano de la salud. La misma apoy a los directivos del Observatorio Nacional de los Recursos Humanos (RRHH) de la salud en la toma de decisiones con relacin a las actividades de colaboracin mdica y la docencia en la formacin posgraduada, donde se combinaron algunos datos del proyecto Colaboracin y Docencia Mdica para obtener un control de los colaboradores y su formacin docente. Este almacn de datos no abarc toda la informacin relevante para la UCCM, solamente lo relacionado con los RRHH de la salud (Cueto, y otros, 2009). De ah la necesidad de contar con un sistema que permita extraer y filtrar una mayor cantidad de datos para transformarlos, integrarlos y almacenarlos con el fin de poder acceder a la informacin para dar soporte en el proceso de toma de decisiones de los directivos de la UCCM y reducir el tiempo de consultas largas y complejas. Adems, poder convertir los datos en informacin homognea, de mayor calidad, y que se mantenga en el tiempo. Por lo antes planteado se defini como objetivo de la investigacin: desarrollar un datamart que contenga la informacin consolidada del proyecto Colaboracin Mdica.

Materiales y mtodos
Mediante los estudios realizados se escoge la metodologa Hefesto como gua para la construccin del datamart. Su idea est fundamentada en una amplia investigacin, comparacin de metodologas existentes y experiencias propias en procesos de confeccin de almacenes de datos (Bernabeu, 2007).

Paso1. Anlisis de los requerimientos


Para recolectar las necesidades de informacin y obtener las preguntas claves del negocio se realiz una entrevista a los directivos de la UCCM donde expresaban la necesidad de que se les facilitara el trabajo con algunos reportes e informacin de importancia histrica que les era difcil manejar. A partir de ah salieron a relucir sus necesidades reales, los resultados que esperaban y los reportes que consideraban ms importantes para su trabajo en el centro. Ejemplos de los resultados que se obtuvieron de la entrevista: Se desea conocer el total de colaboradores que han cumplido misin por pases en un perodo por aos. Se desea conocer la cantidad de colaboradores por tipo de misin en un determinado pas en un ao. Se identificaron los indicadores y perspectivas de anlisis:

40

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

Total de colaboradores que han cumplido misin por pases en un perodo de tiempo.

Indicador

Perspectivas

Cantidad de colaboradores por tipo de misin en un determinado pas en un perodo. Indicador Perspectivas

Una vez identificados los indicadores y perspectivas se procede a la confeccin del modelo conceptual de datos del datamart proporcionando una idea precisa y clara del alcance del almacn.

Paso 2. Anlisis de los OLTP (On Line Transaction Processing)


El objetivo de realizar este paso es indagar sobre los OLTP disponibles de colaboracin mdica para poder identificar la correspondencia entre el modelo conceptual y las fuentes de datos. Luego de haberse recolectado toda la informacin, los directivos de la UCCM presentaron los campos principales y de inters de cada perspectiva seleccionada de la base de datos de colaboracin mdica que ayudaran a consultar los indicadores, los resultados se exponen en la representacin del modelo conceptual con cada uno de los campos o atributos elegidos para cada perspectiva.

Paso 3. Modelo Lgico de la estructura del Datamart


En este paso se confecciona el modelo lgico de la estructura del datamart donde se representa el diseo de las dimensiones y tabla de hechos con sus atributos asociados.

Paso 4. Proceso de Extraccin, Transformacin y Carga (ETL)


Luego de creado el almacn que soportar las dimensiones que contienen los datos y despus de su extraccin y posterior transformacin desde los sistemas operacionales que se deseen integrar mediante el proceso ETL, se carga con los datos previstos anteriormente. Para llevar a cabo el soporte de esta tarea se emple la herramienta: Suite Pentaho, Kettle. (Kafati, 2010) En el caso de la carga de la dimensin colaborador (Figura 1), se extraen los atributos mediante el componente (Tabla colaborador) utilizando sentencias SQL. Aunque no todos se encuentran en la base de datos colaboracin sino en un repositorio de servicios informatizados de la salud perteneciente a SOFTEL y para obtenerlos se consume el servicio registro de ubicacin que se almacena en un archivo XML. Con el componente (Entrada/XML) se especifica el archivo XML obtenido, agrupndolos en una misma tupla con el componente (Juntar Filas). Los datos sern transformados utilizando el componente (Script Transformacin) para que lleguen a la base de datos en el formato deseado y luego con el componente (Filtrar filas) se obtienen las filas con los

41

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

datos esperados, con los componentes (Selecciona/Renombra) e (Insertar/Actualizar) se cargan los datos en el datamart.

Figura 1. Carga de la dimensin colaborador.

El proceso de carga es similar para las 6 dimensiones restantes. Para la carga de datos de la tabla de Hechos, que tiene como objetivo relacionar todas las dimensiones del almacn, se realiza una bsqueda en la base de datos de colaboracin mdica para a travs de sentencias SQL extraer los indicadores comunes y relacionar los datos entre todas las dimensiones y unirlos mediante la realizacin de un producto cartesiano, contando con la fecha de carga de los datos. A continuacin de la carga de la tabla de Hechos se crea un trabajo (job), mediante el mismo se ejecutan todas las cargas de las dimensiones del almacn. Para iniciar este proceso se utiliza el componente (Start) el cual da comienzo a la extraccin, transformacin y carga por la dimensin fecha_carga. Se culmina con la tabla de Hechos que cuenta para el manejo de errores en cualquier etapa, con el componente (Dummy) que informa de errores mediante el componente (DisplayMsgboxInfo) al usuario (Figura 2).

Figura 2. Ejecucin del trabajo.

42

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

Proceso Analtico en Lnea


Determinar la jerarqua de cada una de las tablas de dimensiones resulta de gran importancia para organizar los niveles dentro de una dimensin ya sea de un nivel general a uno especfico o viceversa (Varios, 2002).

Ejemplo en las dimensiones:

Colaborador Tipo_colaborador Tipo_profesional Provincia Sexo CI

Fecha_carga Ao Mes Da

Luego de establecer las jerarquas de cada una de las dimensiones se elaboran las medidas o indicadores en busca de las respuestas de lo que desean conocer los directivos de la UCCM. Para ello se utilizan las consultas MDX (multidimensional expressions o expresiones multidimensionales) que se ejecutan sobre el datamart para obtener los indicadores que contribuirn a la toma de decisiones. Desde la base de datos db_datamart se cargan las dimensiones y la tabla de hechos para calcular las medidas. Luego, se utiliza la herramienta Workbench para disear el cubo de datos o Cubo_datamart (Figura 3) donde se agregan las medidas y formulan las consultas para obtener el total de colaboradores, misiones, importe y desertores, adems del porciento de misiones en dependencia de las necesidades de los directivos de la UCCM. El cubo es almacenado en un archivo XML para que sea cargado en la herramienta Mondrian y realizar el procesamiento analtico en lnea.

43

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

Figura 3.Cubo multidimensional que contiene las dimensiones, jerarquas de los atributos y medidas.

Resultados y discusin
El cliente Jpivot estar disponible a travs de la web, donde se muestra un men con las opciones necesarias para obtener la informacin desde diferentes perspectivas, ejemplo filtrar la informacin segn los campos que deseen los directivos (Figura 4), ajustar la visin de los datos, el filtro de visualizacin y aadir o quitar campos. Los resultados sern mostrados mediante grficos (Figura 5) y tablas que podrn ser exportados en formato PDF o EXCEL. Entre las respuestas a las preguntas de los directivos se obtuvieron: Cantidad de colaboradores con ms de 5 aos de misin en un determinado pas. Por ciento de colaboradores femeninas que cumplieron misin en un pas en un perodo de tiempo. Cantidad de pases con ms de tres aos de misin (pases en los cuales Cuba tiene cooperantes hace ms de tres aos). Se desea conocer el total de colaboradores por rea geogrfica que obtuvieron evaluacin satisfactoria en la misin en un determinado perodo de tiempo. Importe total por nmina congelada de los colaboradores en X misin en un perodo de 5 aos. Total de tipos de pasaportes confeccionados en un perodo de tiempo. Total de desertores por pases en X misin en un perodo de tiempo determinado.

44

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

Figura 4. Dimensin colaborador con las medidas e indicadores segn el filtrado.

Figura 5. Informacin grfica.

Por qu un Datamart y no un Datawarehouse?


El Datawarehouse posibilita la extraccin de datos de sistemas operacionales y fuentes externas, permite la integracin y homogenizacin de los datos de toda la empresa, provee informacin que ha sido transformada y sumarizada, para que ayude en el proceso de toma de decisiones estratgicas y tcticas. (Bernabeu, 2007)

45

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

Un datamart es una versin especial de almacn de datos con el objetivo de responder a un determinado anlisis, funcin o necesidad y con una poblacin de usuarios especfica. La diferencia entre un datawarehouse y un datamart es su alcance. El datamart est pensado para cubrir las necesidades de un grupo de trabajo o de un determinado departamento dentro de la organizacin. Es el almacn natural para los datos departamentales. En cambio, el mbito del datawarehouse es la organizacin en su conjunto. (Curto, 2007) En sntesis los datamarts son pequeos datawarehouses centrados en un tema o un rea de negocio especfico dentro de una organizacin. (Bernabeu, 2009) La informacin que se necesita para la toma de decisiones en la UCCM se encuentra orientada a un nico tema; el de los colaboradores y sus respectivas misiones mdicas, por tanto no es necesario la creacin de un datawarehouse pues con un datamart se tiene fcil acceso a los datos que se necesitan frecuentemente, crea una vista colectiva para grupos de usuarios, mejora el tiempo de respuesta del usuario final, se destaca por una definicin de requerimientos ms fcil y rpida, se simplifica el desarrollo de todo el mecanismo de su base de datos y con ello baja substancialmente todo el coste del proyecto, as como su duracin.

Datamarts existentes
La mayora de las empresas del mundo ya cuentan de una manera u otra con diferentes datamarts, esto se debe a que tienen la necesidad constante de consumir informacin y hacer un mejor uso de los datos ante un mercado ms competitivo. Una de estas empresas es Petroecuador que cuenta con un datamart que les proporciona a los directivos informacin de los volmenes y precios de embarques de crudo y productos para la exportacin e importacin, almacenndose histricamente para permitir el anlisis de tendencias y proyecciones brindando una mejor toma de decisiones al momento de disear las estrategias de produccin.

General Mills de Venezuela C.A. es una empresa trasnacional dedicada a la manufactura de conservas alimenticias
para el consumo humano. Todos los das se lleva a cabo un proceso automatizado de extraccin de datos desde el sistema principal, los cuales despus de analizados, procesados y transformados llenan las tablas de la base de datos del datamart, esto les permite desarrollar reportes sobre precios, descuentos y promociones vigentes adems del vencimiento de productos terminados (Microsoft, 2004).

Cantv Corporacin se beneficia de un datamart de clientes PYME (pequea y mediana empresa) otorgndole a
corto plazo informacin valiosa que no se encontraba disponible en otro sistema acerca de los clientes, permitiendo establecer prioridades a la hora de la carga de datos de sus diferentes filiales estandarizando los datos de los mismos y actualizndolos de acuerdo a sus prioridades. (Vsquez, 2002) Las empresas cubanas en la poca actual tambin necesitan obtener de una forma cada vez ms rpida la informacin necesaria para tomar decisiones, tal es el caso de la Empresa de Proyectos de Arquitectura e Ingeniera (EMPAI) de Matanzas que posee un datamart para el control de la informacin relevante del proceso de negocio de Gestin del Capital Humano para elevar la efectividad de la organizacin. (Hidalgo-Gato, 2007) Con el datamart para la UCCM los directivos dispondrn de una herramienta que les permitir: Tener el control de la cantidad de los colaboradores cumpliendo o que han cumplido misin en cualquier parte del mundo. Obtener una representacin de los resultados en forma de tabla, grfica, PDF y Excel. Enviar informacin detallada y consolidada a los niveles superiores; MINSAP, MINREX y al Consejo de Estado de forma rpida.

46

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

Almacenar y analizar la informacin histrica de la UCCM.

Conclusiones
A partir de los resultados obtenidos se arrib a la siguiente conclusin: Con el diseo e implementacin del datamart para la UCCM se permite almacenar grandes volmenes de informacin relevante solucionando los problemas ms comunes que afronta la organizacin actual: el procesamiento de gran cmulo de datos, as como la extraccin de la informacin de colaboracin mdica desde mltiples fuentes para transformarla en el formato deseado, lo que agiliza las consultas requeridas por los directivos de la UCCM para la toma de decisiones. Con el objetivo de mejorar el uso del datamart para la UCCM se recomienda aplicar tcnicas de minera de datos, que les permita a los directivos de la UCCM: analizar factores de influencia en determinados procesos, predecir, estimar variables o comportamientos futuros de los colaboradores y misiones, adems de obtener secuencias de eventos que provoquen comportamientos especficos para una mejor toma de decisiones.

Referencias
BERNABEU, RICARDO DARO. Data Warehousing: Investigacin y sistematizacin de conceptosHefesto: Metodologa propia para la construccin de un Data Warehouse. Argentina: s.n., 2007. CUETO, ARIAGNA RAMN Y DAZ GARCA, JOANNIS. Implementacin de un Data Warehouse para el control del Recurso Humano de la Salud. La Habana. 2009. CURTO, JOSEP. Data Warehousing, Data Warehouse y Datamart. 2007. Disponible en: http://informationmanagement.wordpress.com/2007/10/07/data-warehousing-data-warehouse-ydatamart/. CUETO, ARIAGNA RAMN Y DAZ GARCA, JOANNIS. Implementacin de un Data Warehouse para el control del Recurso Humano de la Salud. La Habana. 2009. CURTO, JOSEP. Data Warehousing, Data Warehouse y Datamart. 2007. Disponible en: http://informationmanagement.wordpress.com/2007/10/07/data-warehousing-data-warehouse-ydatamart/. DATAPRIX KNOWLEDGE IS THE GOAL. Arquitectura del data warehousing. 07 de 2009. Disponible en: http://www.dataprix.com/es/arquitectura-del-data-warehouse. HIDALGO-GATO, GISEL GONZLEZ. Data Mart de Gestin Econmico - Financiera de la Empresa de Proyectos de Arquitectura e Ingeniera (EMPAI). 2007. Disponible en: http://monografias.umcc.cu/monos/2007/informatica/m07258.pdf. KAFATI, ELIZABETH GUTIRREZ. La plataforma Pentaho Open Source Business Intelligence. 2010. Disponible en: http://egkafati.bligoo.com/content/view/219538/La_plataforma_Pentaho_Open_Source_Business_Intellig ence.html. MICROSOFT. Microsoft. casos de xito. http://www.microsoft.com/venezuela/casosdeexito/generalmills.aspx. 2004. Disponible en:

47

Serie Cientfica de la Universidad de las Ciencias Informticas http://publicaciones.uci.cu/index.php/SC | seriecientifica@uci.cu No. 2, Vol. 6, Ao: 2013 ISSN: 2306-2495 | RNPS: 2343

RAMOS, ARIEL DELGADO. Informatizacin en el Sistema Nacional de Salud de Cuba. 2009. Disponible en: http://informatica2009.sld.cu/conferencias/informatizacion-en-el-sistema-nacional-de-salud-de-cuba. VARIOS. La empresa multidimensional: OLAP. La revista de tecnologa y estrategia de negocio en Internet. 2002. Disponible en: http://www.idg.es/iWorld/articulo.asp?id=143456. VSQUEZ, ALVARO ENRIQUE TRAK. UCAB. Tesis digitalizadas. Elaboracin de un Data Mart de clientes PYME, a las unidades de mercadeo de CANTV Corporacin. 2002. Disponible en: http://biblioteca2.ucab.edu.ve/anexos/biblioteca/marc/texto/AAP7826_1.pdf.

48

También podría gustarte