Está en la página 1de 1

Las Categorías Semánticas de la Aplicación

La función de las categorías semánticas es no hacer depender la gramática de las palabras


utilizadas para expresar las consultas en lenguaje natural, es decir, independizar, en cierta medida
el léxico de los modelos gramaticales utilizados para la comprensión. Con ello reducimos la
necesidad de muchos datos para entrenar las gramáticas, facilitamos la incorporación de nuevos
términos del castellano que sirven para expresar una misma idea, reducimos la perplejidad de las
gramáticas al mismo tiempo que aumentamos la cobertura. Las categorías utilizadas podrían
definirse como semánticas más que sintácticas, estando directamente relacionadas con la
ontología de la aplicación. Además,

El diccionario de categorías sintáctico-semánticas pretende asociar a cada posible palabra del


lenguaje natural de entrada, un significado, es decir, un conjunto de rasgos semánticos implícitos
en la definición de su categoría. Pueden existir distintas palabras del lenguaje natural asociadas a
una misma categoría o clase de equivalencia semántica. Este mecanismo nos permite no tratar
directamente, durante el proceso de comprensión con las palabras de la frase de entrada, sino con
las clases semánticas a las que pertenecen. Además, problemas de cobertura a nivel de lengua
natural, es decir, no inclusión en el diccionario de algunos términos, puede ser solucionado
fácilmente, sin más que incluir las nuevas entradas y categorizándolas adecuadamente. Si el
conjunto de categorías perteneciente al Modelo del Dominio está bien determinado, no será
necesario realizar ningún cambio en el resto del sistema.

Las categorías seleccionadas, a partir del corpus de entrenamiento utilizado, pueden


encontrarse en el Apéndice 5.5. Algunas entradas en el diccionario (palabras) pueden tener
asociadas varias categorías semánticas, lo que plantea un primer problema: la ambigüedad
semántica. En el Capítulo 6 se observa el porcentaje de categorías ambiguas y su índice o nivel de
ambigüedad.

Este primer problema ha sido solucionado, construyendo un grafo de categorías semánticas


asociado a la frase de entrada (lenguaje natural), en el que el número de ramas en cada punto del
grafo depende de dicha ambigüedad. A mayor ambigüedad, mayor será el grafo, es decir, mayor
perplejidad presentará y mayor probabilidad de error tendrá el decodificador conceptual al
segmentar la frase.

También podría gustarte