Está en la página 1de 2

Procesamiento del Lenguaje Natural, Revista n 45, septiembre 2010, pp 329-330

recibido 01-05-10 revisado 18-05-10 aceptado 20-05-10

TEcnologas del Lenguaje aplicadas al MOdelado de SIStemas de Informacin (TeLMoSis)


Language Technologies applied to Information System Modeling
Antonio Molina,Lidia Moreno,Natividad Prieto, Juan Snchez, David Buitrago Departamento de Sistemas Informticos y Computacin Universidad Politcnica de Valencia {amolina,lmoreno,nprieto,jsanchez}@dsic.upv.es dabuiar@gmail.com Isabel Daz Escuela de Economa Departamento de Mtodos Cuantitativos Universidad Central Caracas- Venezuela idiaz@cantv.net

Resumen: El objetivo principal del proyecto es integrar los avances logrados hasta el momento en Tecnologas del Lenguaje Humano (TLH), principalmente por las aproximaciones de anlisis semntico, y las estrategias de modelado de Sistemas de Informacin (SI). Esta integracin se orientar al desarrollo de mtodos, tcnicas y herramientas que permitan derivar automticamente modelos estructurales y dinmicos de software a partir de textos escritos en lenguaje natural. Palabras clave: lenguaje natural, rol semntico, sistemas de informacin Abstract: The main objective of this project is to combine advances in Human Language Technologies (HLT), particularly semantic analysis, with information system modeling, The work will be focus on developing methods, techniques and tools that allow us to automatically derive structural and dynamic software models from requirements written on natural language. Keywords: natural language, semantic role, information systems

Datos del proyecto

lenguaje natural. Para ello se propusieron varias lneas de actuacin: i. Estudio y desarrollo de un sistema de anotacin de roles semnticos. Estudio y anlisis comparativo de los recursos y sistemas de anotacin de roles desarrollados principalmente para el ingls y el castellano, tanto para dominios generales como especficos. Experimentar con las herramientas de anlisis y anotacin disponibles. La eficiencia de un sistema de anotacin de roles depende de la calidad de los procesos previos de anlisis. Por ello, se hace necesaria la adaptacin y mejora de herramientas desarrolladas previamente, como etiquetadores morfosintcticos, analizadores sintcticos, reconocedores de entidades nombradas o herramientas de desambiguacin de sentidos de las palabras. Desarrollo de herramientas propias para la anotacin de roles semnticos mediante

El proyecto Telmosis (Tecnologas del Lenguaje Aplicadas al Modelado de Sistemas de Informacin) est financiado por el Vicerrectorado de Investigacin, Desarrollo e Innovacin de la Universidad Politcnica de Valencia (PAID-06-08-3294). Tambin forma parte del proyecto Enterprise 2.0: Tcnicas de Comprensin de textos aplicadas a las necesidades de la Empresa 2.0 (CICYT TIN2009-13391-C04-03) financiado por el Ministerio de Ciencia e Innovacin.

Descripcin del proyecto

El objetivo del proyecto es integrar los avances logrados hasta el momento por las aproximaciones de anlisis semntico y las estrategias de modelado, para el desarrollo de mtodos, tcnicas y herramientas que permitan derivar automticamente modelos estructurales y dinmicos de software a partir de textos escritos en

ISSN 1135-5948

2010 Sociedad Espaola para el Procesamiento del Lenguaje Natural

Antonio Molina, Lidia Moreno, Natividad Prieto, Juan Sanchez, Isabel Daz, David Buitrago

tcnicas de aprendizaje automtico, principalmente para el castellano. ii. Realizar un anlisis comparativo de aproximaciones (mtodos, tcnicas y herramientas) que utilizan TLH para la deduccin (semi)automtica de modelos de sistemas de informacin a partir de textos de especificacin de requisitos. Se trata de establecer una slida base de conocimiento sobre le estado actual de las herramientas desarrolladas para deducir, de forma automtica, modelos de sistemas de informacin. Evaluando aspectos tales como la estrategia conceptual y tecnolgica de TLH utilizada por estas herramientas para obtener informacin de los textos de especificacin de requisitos; la estrategia conceptual y tecnolgica aplicada para obtener los modelos a partir de la informacin conseguida con los recursos de TLH. Este estudio facilitar: Establecer una caracterizacin de las herramientas en trminos de sus fortalezas y debilidades. Establecer las caractersticas deseables de las herramientas de este tipo segn se concibe actualmente el modelado de sistemas y de los avances de TLH en los ltimos aos. Esto permitir elaborar la especificacin de los requisitos (funcionales y no funcionales) que deben satisfacer estas herramientas, insumo fundamental para el posterior diseo e implementacin de TeLMoSis. iii. Construir un prototipo de la herramienta TeLMoSis que permita la deduccin automtica de modelos de sistemas a partir de textos escritos en lenguaje natural. Disear los patrones sintctico-semnticos para la transformacin de especificaciones de requisitos en modelos conceptuales. Desarrollar el prototipo de una herramienta de ayuda al modelado conceptual que permita obtener un modelo inicial a partir de una especificacin de requisitos expresada en lenguaje natural. Esta herramienta integrar las herramientas de TLH desarrolladas y/o adaptadas y la implementacin de los patrones de traduccin diseados. Esta herramienta deber ser independiente del dominio y de la lengua. Para la construccin de este

prototipo se seguirn los procesos del ciclo de vida de desarrollo de software y se documentar utilizando, en lo posible, estndares de especificacin (por ejemplo: el Unified Modeling Language UML y el Object Constraint Language OCL).

Estado actual del proyecto

Inicialmente se ha conseguido desarrollar un corpus de un caso de estudio constituido por un conjunto de Casos de Uso y sus correspondientes Diagramas de Interaccin. De este corpus se han extrado una 500 frases en castellano y en ingls con el fin de anotarlas con roles semnticos siguiendo la aproximacin de PropBank. Se han realizado diversos experimentos de anotacin de roles para la versin inglesa utilizando los etiquetadores de Dan Roth y de Paloma Moreda. Como resultado de ese trabajo se ha obtenido el corpus de frases referido anteriormente etiquetado con roles semnticos. Tambin se han realizado aproximaciones de etiquetado para el castellano con unos resultados muy preliminares. Por otra parte, se ha conseguido acotar las caractersticas de la herramienta a desarrollar para deducir, de forma automtica, modelos de sistemas de informacin. Se han diseado los patrones sintctico-semnticos para la transformacin de especificaciones de requisitos en modelos conceptuales que en estos momentos se encuentra en fase de implementacin.

330

También podría gustarte