Está en la página 1de 39

Boletín de

Vigilancia
Tecnológica

Programa de
Procesamiento Excelencia en
del Lenguaje Contenidos
Natural Digitales y
Economía Digital

Actualizado a
Septiembre de 2015
Índice
General
1. Introducción

2. Aplicaciones del Procesamiento del


Lenguaje Natural

3. Futuro del Procesamiento del Lenguaje


Natural

4. Agentes clave

5. Patentes

6. Iniciativas de interés

7. Fuentes de información
1. Introducción
La información es el recurso más importante que poseemos los seres humanos. Gran parte de esta
información se comunica, almacena y maneja en forma de lenguaje natural, en sus diferentes formas.

En la actualidad, podemos obtener grandes volúmenes de información en forma escrita, ya sea de manera
impresa o electrónica. Los ordenadores son una herramienta indispensable para el procesamiento de la
información plasmada en los textos, ya que son capaces de manejar grandes volúmenes de datos. Sin
embargo, un ordenador no puede hacer todo lo que las personas normalmente hacemos con el texto, por
ejemplo, responder preguntas basándose en la información proporcionada, hacer inferencias lógicas sobre
su contenido, o elaborar un resumen de esta información.

El esfuerzo que la Ciencia invierte hoy en día para contrarrestar esta situación se denomina procesamiento
de lenguaje natural, procesamiento de texto, tecnologías de lenguaje o lingüística computacional. El lenguaje
humano es complejo, multiforme y rico en expresiones, pero a la vez puede ser ambiguo y requerir
interpretación de acuerdo al contexto, al momento y la intención del hablante. El lenguaje formal o artificial,
por el contrario, se diseña con una finalidad concreta, es restringido en su sintaxis y en su semántica, por ello
es más preciso, con menos espacio para la libre interpretación y libre del contexto.

El Procesamiento del Lenguaje Natural (PLN) es una rama muy importante de la Inteligencia Artificial y una
de las más antiguas. Las primeras traducciones automáticas se iniciaron en la década de los 40 con la II
Guerra mundial. Sin embargo, como consecuencia de la escasa potencia de los ordenadores los intentos
fracasaron, pero a pesar de ello, a partir de la década del 60 el procesamiento de lenguaje natural resurgió
nuevamente.

Lenguaje natural vs Lenguaje Artificial

Lenguaje Natural Lenguaje Artificial

 Medio principal para la comunicación  Se compone de símbolos y fórmulas, con el objetivo


humana. de formalizar la programación de ordenadores o
representar simbólicamente el conocimiento
 Gran poder expresivo. científico.

 Para conseguir un alto grado de  Las palabras y oraciones están perfectamente


comprensión del lenguaje natural es definidas, una palabra mantiene el mismo
necesario que los algoritmos posean un significado prescindiendo del contexto o su uso.
completo conocimiento del idioma; desde
los caracteres de una palabra hasta el  Propiedades:
contexto del diálogo. o Se desarrollan a partir de una teoría
preestablecida.
 Propiedades: o Componente semántico mínimo.
o Han sido desarrollados por o Posibilidad de incrementar el componente
enriquecimiento progresivo previo a semántico de acuerdo con la teoría a formalizar.
cualquier teoría. o La sintaxis produce oraciones no ambiguas.
o La importancia de su carácter o Los números tienen un rol importante.
expresivo se debe a la riqueza del o Poseen una completa formalización,
componente semántico (polisemia). posibilitando la construcción computacional.
o Existe dificultad o imposibilidad de una
formalización completa.

4
Niveles del Procesamiento de Lenguaje Natural
El Procesamiento de Lenguaje Natural (PLN) tiene por objetivo habilitar a los ordenadores para que
entiendan el texto, procesándolo por su sentido. Para llevar a cabo esta tarea, un sistema de procesamiento
de lenguaje natural necesita conocer la estructura del lenguaje, la cual se analiza normalmente en 4 niveles:

1. Nivel Morfológico::Se estudia cómo se construyen las palabras. Detecta las relaciones que se
establece entre las unidades mínimas que forman una palabra (sufijos, prefijos) y la relación con el
léxico, siendo éste un conjunto de información sobre cada palabra que el sistema utiliza para el
procesamiento.

A continuación se muestra un ejemplo de análisis morfológico para la oración “Un gato negro caza un ratón
blanco”:

2. Nivel Sintáctico: Se estudia cómo combinar las palabras para formar oraciones. Su función es
asignar etiquetas a cada uno de los componentes que aparecen en la oración a analizar, de manera
que se sepa cómo se combinan las palabras y forman estructuras gramaticales correctas.

Existen dos enfoques para describir formalmente la gramaticalidad de las oraciones: los constituyentes y las
dependencias:

a) El enfoque de constituyentes consiste en analizar la oración mediante un proceso de segmentación y


clasificación, obteniendo como resultado un árbol como el siguiente:

5
b) El enfoque de dependencias consiste en el establecimiento de la relación entre pares de palabras, una
de ellas tiene el rol de rectora y la otra el rol de dependiente o subordinada, obteniendo como resultado
una estructura jerárquica, el árbol de dependencias, donde la única palabra que no tiene rectora es la
raíz del árbol, tal y como se muestra a continuación:

3. Nivel Semántico: Se estudia el significado de las oraciones, representándolo de manera formal.

Existen varias formas de representación formal semántica de las oraciones, tales como las siguientes:
 Lógica de primer orden
 Redes semánticas
 Grafos conceptuales

4. Nivel Pragmático: Se estudia cómo el contexto afecta a la interpretación de las oraciones.

Ésta es la cadena de análisis ideal con los cuatro niveles, que sin embargo no se corresponde con la
realidad, dado que la mayoría de los sistemas no van más allá del análisis sintáctico.

6
2. Aplicaciones del Procesamiento
del Lenguaje Natural
Las principales aplicaciones prácticas del Procesamiento de Lenguaje Natural (PLN) son las siguientes:
 Minería de datos

 Sistemas de búsqueda de respuestas

 Corrección ortográfica

 Síntesis de voz

 Sistemas de diálogo

 Reconocimiento de voz

 Análisis de sentimientos

 Generación de resúmenes automáticos

 Traducción automática

 Recuperación y extracción de información

A continuación se presenta un breve detalle de cada una de estas aplicaciones:

1 Minería de datos
La minería de datos es la extracción no trivial de información que reside de manera implícita en los datos. En
este concepto se engloba un conjunto de técnicas encaminadas a la extracción de conocimiento procesable,
implícito en las bases de datos. Las bases de la minería de datos se encuentran en la inteligencia artificial y
en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda
la solución a problemas de predicción, clasificación y segmentación.

La minería de datos proporciona potentes herramientas para descubrir patrones ocultos y relaciones en
datos estructurados. Este proceso asume que los datos se encuentran almacenados en un formato
estructurado. Por ello, su pre-procesamiento consiste en la limpieza y normalización de los datos, y la
generación de numerosos enlaces entre las tablas de las bases de datos.

La minería de datos usa técnicas y metodologías de Recuperación de Información, Extracción de Información


y corpus procesados con técnicas de lingüística computacional.

8
2 Sistemas de búsqueda de respuesta
En Internet existe infinidad de documentos que contienen todo tipo de información, falsa y verdadera. La
información no se encuentra bien distribuida en la red y encontrarla se hace difícil. Los buscadores
tradicionales aún no entienden completamente qué necesita el usuario a pesar de haberse incorporado
técnicas como el reconocimiento semántico. Mediante la implementación de las técnicas semánticas las
búsquedas de información en Internet hoy en día son superiores a las de tres años atrás, de manera tal que
el buscador parece comprender más de lo que el usuario “humano” necesita.

Los sistemas de búsqueda de respuesta son sistemas diseñados para formular una pregunta en lenguaje
natural y proporcionar una respuesta. De esta manera los usuarios no tienen que navegar y leer una o varias
páginas de resultados de búsqueda.

Estos sistemas se construyen sobre motores de búsqueda y requieren contenido como fuente para descubrir
las respuestas. Deben tener métodos para entender las preguntas del usuario y determinar el tipo de
respuesta que debe dar, generar una búsqueda significativa de la consulta, y finalmente calificar los
resultados obtenidos.

De estos tres problemas el más difícil de enfrentar es determinar el tipo de respuesta. Para hacerlo se
realizan tres pasos: entrenamiento, fragmentación y determinación del tipo de respuesta.

Para construir un sistema de respuestas se necesita aplicar técnicas como: Recuperación de Información,
Extracción de Información con algoritmos de reconocimiento de entidades y etiquetado, comparación de
secuencias de caracteres, etc.

3 Corrección ortográfica
La corrección ortográfica es una de las aplicaciones del procesamiento de lenguaje natural de mayor uso
cotidiano. La aplicación está continuamente analizando el texto, y avisa de los errores normalmente
subrayando la palabra en rojo.

Los primeros correctores ortográficos eran muy simples: contaban con un corpus léxico del idioma a
analizar, y si una palabra no estaba en el mismo, era considerada como errónea. Con el tiempo, los
algoritmos fueron evolucionando y aparecieron los primeros correctores ortográficos que mostraban
sugerencias cercanas a la palabra mal escrita. Los siguientes avances fueron encaminados a encontrar
errores sintácticos y/o de concordancia de género y número.

Actualmente, los correctores automáticos han dado un salto más allá de los procesadores de texto, de tal
forma que podemos encontrarlos en multitud de aplicaciones: los navegadores web incorporan un corrector
para los contenidos introducidos por el usuario, los propios sitios web de edición de blogs, contenidos wiki y
los clientes de mensajería instantánea hacen uso de esta tecnología.

9
4 Síntesis de voz
La síntesis de voz tiene como objetivo transformar, de forma automática, cualquier texto en una locución
auditiva lo más semejante posible al habla de un humano. A un sistema capaz de producir dicha salida se le
conoce como sintetizador de voz o Text-To-Speech (TTS).

Un sistema de TTS recibe como entrada una cadena de texto en un idioma determinado, la analiza y
procesa, dando como resultado una salida auditiva que contiene una locución verbal que representa al texto
de entrada.

Durante la etapa de análisis se realizan multitud de operaciones: la normalización del texto, la pronunciación
o el cálculo de la prosodia (velocidad, tono, duración, etc.). A la hora de generar la salida auditiva, se necesita
un modelo de lenguaje y de información fonética del mismo.

Estos sistemas son muy utilizados en los sistemas de avisos automáticos de aeropuertos, estaciones de
autobuses y ferrocarriles, sistemas telefónicos de atención al cliente, dispositivos móviles y GPS, etc. Fuera
del ámbito comercial, se emplean en aplicaciones educativas y en los sistemas para personas con
discapacidades visuales.

5 Sistemas de diálogo
Los sistemas de diálogo persiguen el objetivo de que un humano pueda conversar con un sistema
informático con la misma naturalidad con la que conversa con otro humano.

Entre los problemas que debe tratar el propio gestor del diálogo se encuentran: el contexto del discurso, el
tipo de estrategia de diálogo (colaborativa, proactiva, ...), la elipsis, las construcciones anafóricas, etc.

Desarrollar un sistema de diálogo robusto y eficaz puede considerarse una de las tareas más complejas
dentro del procesamiento de lenguaje natural. Esta dificultad se debe fundamentalmente a dos factores. En
primer lugar, es una de las tareas más jóvenes y por tanto con menos años de investigación y experiencia a
sus espaldas. En segundo lugar, un gestor de diálogo por sí solo no tiene utilidad práctica; necesita
integrarse con otros módulos típicos como el reconocedor de voz, el sistema Text-To-Speech (TTS), o el de
generación de lenguaje natural. En definitiva, el éxito de un sistema de diálogo no depende sólo del módulo
que gestiona el diálogo en sí, sino de la perfecta armonía entre sus componentes. Los sistemas de diálogo
han proliferado mucho en los últimos años. Cada vez es más fácil encontrarlos en forma de asistentes
virtuales en distintos portales web con una misión orientativa de cara al usuario. Probablemente
encontremos en los próximos años nuevos asistentes dedicados a tareas más complejas: gestionar una cita
médica, comprar billetes de tren o avión, tienda virtual, etc.

10
6 Reconocimiento de voz
El reconocimiento de voz puede definirse como el proceso inverso a la síntesis de voz. Este sistema recibe
como entrada una locución de audio y genera como salida una cadena de texto que transcribe dicha
locución.

Los sistemas comerciales de reconocimiento de voz están siendo muy utilizados en aplicaciones telefónicas:
agencias de viajes, reserva de billetes/entradas, atención al cliente, información, etc. En los últimos años, se
han incorporado también a los dispositivos móviles, entornos domóticos, teleasistencia y vehículos militares.

Se trata de una disciplina relativamente joven respecto al resto, si bien su tecnología todavía se encuentra
en intenso desarrollo.

Hoy día suelen emplearse en dominios cerrados, ya que existen dificultades al enfrentarse a dominios
abiertos, habla espontánea o ruido ambiental.

7 Análisis de sentimientos
El análisis de sentimientos en textos es la identificación y extracción de información subjetiva. También
denominado “minería de opiniones”, este proceso involucra el uso de herramientas de procesamiento de
lenguaje natural y software de análisis de textos para automatizar el proceso.

La forma básica de análisis es una clasificación polarizada de sentimientos que asigna calificaciones en un
rango de -10 a 10, basadas en el aprendizaje para evaluar emociones positivas y negativas en corpus
etiquetados de entrenamiento.

Las técnicas avanzadas analizan gramaticalmente y descomponen la oración. Se usan reglas gramaticales
para extraer inferencias. El motor de reglas se aplica varias veces para transformar el texto etiquetado en
oraciones que definen la asociación entre una palabra y una parte del habla con un sentimiento calificado.
Para la implementación se utilizan herramientas para etiquetar y una base de datos con claves y frases con
evaluaciones de polaridad de emociones. Esta información proviene de fuentes etiquetadas o por
aprendizaje en corpus.

Existen actualmente dos fuentes de datos disponibles : HDCUS y elWordNet-Affect. También existen librerías
de código abierto como Gate, Balie, Mallet.

Uno de los grandes campos de aplicación es en la web. Las empresas bucean en estos medios para estudiar
el mercado, obtener ideas para lanzar nuevos productos o recoger feedback sobre los clientes en base a sus
comentarios.

11
8 Generación de resúmenes automáticos
La generación automática de resúmenes consiste en crear una versión más reducida de un texto donde se
condense la información más importante. Normalmente estas aplicaciones realizan un análisis iterativo del
texto de entrada de forma que van remarcando las partes que se consideren relevantes.

El resumen vendrá determinado por aspectos tales como el tipo del documento (noticia, ensayo, etc.), el
estilo de redacción del texto, su longitud o incluso el tipo de expresiones utilizadas.

Existen dos formas de generar los resúmenes:


 Por extracción: Consiste en extraer literalmente las partes más relevantes del documento, como
pueden ser los extractos que muestran los buscadores, donde marcan el contexto en el que aparecen
las palabras que buscamos. Estos pequeños fragmentos del texto original (snippets) se obtienen por
extracción.

 Por abstracción: Consiste en parafrasear el texto original en unas pocas líneas, es decir, realizar una
explicación no literal para hacerlo más claro, conciso e inteligible.

Generalmente, los humanos realizan resúmenes de tipo abstractivo, mientras que la mayoría de las
herramientas comerciales generan resúmenes de forma extractiva.

Un problema común es la existencia de múltiples documentos sobre un mismo tema, en este caso se habla
de resúmenes a nivel de colecciones de documentos, que agrupan o separan los documentos por tópicos y
destacan las similitudes y diferencias de la información contenida en ellos. Los contenidos se relacionan
entre ellos en un sentido semántico: cubren el mismo tópico, tienen similares categorías semánticas o
conceptos estrechamente relacionados.

Las herramientas comerciales para la generación de resúmenes automáticos se pueden instalar en equipos
propios o ejecutar de manera online en Internet. Algunas de las herramientas instalables son Copernic
Summarizer y Microsoft Office Word, mientras que entre las herramientas online se encuentran Svhoong
Summarizer, Pertinence Summarizer, Tool4noobs Summarizer y Open Text Summarizer.

12
9 Traducción automática
La traducción automática consiste en convertir un texto de un idioma a otro manteniendo el significado,
por medio de un ordenador y sin intervención humana. Se trata de la disciplina que más ha contribuido en
el desarrollo de la lingüística computacional, al ser la tarea que da origen al procesamiento del lenguaje
natural como tal.

El proceso que rige el funcionamiento de la traducción automática es el siguiente: dado un texto de


entrada escrito en un idioma origen, se analiza, se procesa, y finalmente se genera el mismo texto en el
idioma destino.

Las herramientas actuales consiguen un alto grado de fiabilidad, si bien todavía no puede prescindirse
totalmente de la posterior revisión humana. Es posible conseguir mejores resultados pero rescindiendo la
traducción a dominios limitados.

Los sistemas de traducción automática se pueden clasificar de la siguiente manera:


 Sistemas de traducción directa: Podrían equipararse con grandes diccionarios. Realizan la traducción
casi palabra por palabra, ya que la información sintáctica que poseen es mínima. Por ello, los
resultados que ofrecen suelen ser bastante pobres.

 Sistemas de transferencia: Contienen grandes léxicos bilingües, además de un amplio conocimiento


sintáctico y semántico de los idiomas. Esto permite traducir palabras de una lengua a otra teniendo
en cuenta el contexto morfológico, sintáctico y semántico de la frase. También pueden llevar a cabo
la transferencia estructural, es decir, los cambios en el orden de elementos y en la estructura de la
frase para adecuarse a cada lengua.

 Sistemas interlingua: Estos sistemas conocen todas las características y todas las distinciones de
todos los idiomas. Para realizar una traducción, se usa un analizador para convertir el texto en
idioma fuente al interlingua, y un generador que convierte el texto interlingua al idioma destino.
Estos sistemas están en fase de laboratorio o se utilizan para aplicaciones muy restringidas, debido
a los problemas prácticos que presentan el diseño y la implementación de una interlingua eficaz.

 Sistemas estadísticos: La traducción automática estadística consiste en calcular las distintas


probabilidades de que cierta cadena de texto en el lenguaje destino sea la traducción de la misma
cadena en el lenguaje origen, maximizando la probabilidad de todos los pares de cadenas origen-
destino. Para el cálculo de dichas probabilidades, se realiza una fase de entrenamiento previo con
textos ya traducidos y supervisados por un humano. Un ejemplo es el traductor de Google, el cual
realiza un reconocimiento léxico, comparación con reglas sintáctica según la probabilidad de
aparición y finalmente hace una correspondencia entre parejas de palabras en los dos idiomas.

A pesar de los avances tecnológicos, existen diversos retos en la traducción, especialmente entre
lenguajes con distinto orden de palabras y una morfología compleja. La investigación en esta área se dirige
a la exploración de métodos de aprendizaje avanzado en modelos estadísticos de traducción, modelos
sintácticos y sus representaciones, datos paralelos para entrenamiento de modelos estadísticos,
integración de traducción del habla con otras aplicaciones como reconocimiento de voz y traducción
automática.

13
10 Recuperación y extracción de información
La recuperación de información es el proceso de encontrar en un repositorio grande de datos, material
(usualmente documentos) de naturaleza no estructurada (usualmente texto) o semiestructurada (páginas
Web, por ejemplo), que satisfaga una necesidad de información. Los datos no estructurados no tienen un
esquema claro, no están listos para procesar y son lo opuesto a los datos con un esquema estructurados
como los que se encuentran en bases de datos. Los datos semiestructurados están en documentos
esquema estructurados, con marcas explícitas como el código HTML.

La información encontrada debe ser pertinente y relevante: La relevancia es la medida de cómo una
pregunta se ajusta a un documento, mientras que la pertinencia es la medida de cómo un documento se
ajusta a una necesidad informativa.

Una de las primeras aplicaciones prácticas de los sistemas de recuperación de información fueron los
catálogos digitales, muy utilizados en organismos con gran cantidad de documentos como las
Administraciones Públicas o las bibliotecas. Éstas permitían a los usuarios realizar búsquedas rápidas sobre
criterios típicos como título, autor o año de publicación. Estas aplicaciones obtuvieron una gran aceptación;
sin embargo, estos sistemas obtendrían el impulso definitivo con el auge de Internet. Buscadores como
Yahoo! o Google representan un gran avance, especialmente en el modo en que nos han facilitado el acceso
a las distintas fuentes de conocimiento, siendo la primera opción a la que se acude para las necesidades de
información.

La tarea de recuperación se lleva a cabo, en general, separando varios procesos:


 Análisis y normalización: Selección de los términos que mejor representan el contenido de los
documentos (y consultas), y transformación de los términos seleccionados con el objetivo de
reducirlos a formas canónicas, que faciliten las correspondencias posteriores en el proceso de
búsqueda. Los términos pueden ser palabras, frases, n-gramas, u otras unidades.

 Cálculo de pesos: Asignación a cada uno de los términos de un valor numérico (peso) que representa
su importancia a la hora de representar el contenido de un documento.

 Indexación: Creación de un índice que facilite el acceso a los documentos que contengan los términos
que los representan.

 Búsqueda: Proceso basado en el cálculo de correspondencias y semejanzas entre la representación


de la consulta y la de cada documento. Para obtener representaciones compatibles y así permitir
comparar consultas con documentos, el texto de cada consulta deberá ser analizado de la misma
manera que el de los documentos.

Una vez que se ha logrado acceso a los contenidos buscados y se tiene control sobre los datos, en muchas
aplicaciones se hace necesario el siguiente proceso que es el de extracción de la información, que consiste
en la obtención de las partes que interesan en el texto para pasarlas a un formato de base de datos, es
decir, a un formato estructurado.

En general, los sistemas de extracción de información son útiles si la información a ser extraída está
especificada explícitamente; el documento puede resumirse con un número pequeño de plantillas; o la
información que se necesita está incluida completamente en el texto.

14
3. Futuro del Procesamiento del
Lenguaje Natural
Desde sus orígenes, la investigación en Procesamiento del Lenguaje Natural (PLN), ha
estado fuertemente guiada por una tendencia hacia el tratamiento de la lengua inglesa.
Sin embargo, cada vez más, los grupos de investigación españoles desarrollan sus
investigaciones para el español.

Los principales problemas detectados para el procesamiento del lenguaje natural son los
siguientes:

Ambigüedad Separación entre Recepción de la


palabras información

El lenguaje natural es En la lengua hablada no se Los diferentes tipos de


inherentemente ambiguo. Por suelen hacer pausas entre acentos, errores de
ejemplo, una misma palabra palabra y palabra. Además, en la mecanografiado, expresiones
puede tener varios significados, y lengua escrita existen idiomas sin no gramaticales, etc., crean un
la selección del apropiado se debe separación entre las palabras (p. problema en la recepción de la
deducir a partir del contexto. ej. chino mandarín). información.

Por ello, las principales líneas de investigación en el área de Procesamiento del Lenguaje
Natural son las siguientes:

Sistemas de compresión del lenguaje para diálogo; Traducción Análisis léxico-morfológico:


automática; Sistemas de apoyo a la traducción; Reconocimiento categorización gramatical (POS tagging).
y comprensión de textos; Búsqueda y recuperación de
Anotación semántica de palabras
información textual; Adquisición y representación del
(resolución de la ambigüedad léxica).
conocimiento; Detección de temas y dominios;
Sistemas de pregunta-respuesta; Extracción Modelos estadísticos del lenguaje.
de información; Elaboración automática y
semiautomática de documentos y
resúmenes; Resolución de fenómenos Tratamiento Tratamiento
lingüísticos: elipsis, anáfora, ambigüedad
estructural; Corrección de textos;
pragmático morfológico
Sistemas de ayuda al aprendizaje.

Tratamiento Tratamiento
semántico sintáctico
Análisis semánticos robustos. Gramáticas para el
Categorización semántica y clasificación reconocimiento del Lenguaje.
de textos. Análisis sintáctico robusto.
Construcción de ontologías lingüísticas. Análisis sintáctico superficial
(chunkers).

Fuente: Libro Blanco de las Tecnologías del Habla

16
4. Agentes Clave
Red Temática en Tecnologías del Habla

La Red Temática en Tecnologías del Habla se creó en el año 2001, con el propósito de agrupar a todos los
agentes en el ámbito español relacionados con las Tecnologías del Habla.

Se trata de un foro común donde los investigadores en Tecnología del Habla pueden aunar esfuerzos y
compartir experiencias, con el fin de:

 Fomentar la investigación en Tecnologías del Habla, atrayendo a nuevos jóvenes investigadores a


este campo, a través de las siguientes actividades:
o Ampliación del Centro Investigador y Docente virtual con nuevos recursos (material docente,
herramientas software y bases de datos), orientados a facilitar la incorporación de nuevos
investigadores en este campo.
o Generación de material bibliográfico de apoyo.
o Facilitar el intercambio de estudiantes de doctorado entre diferentes centros de investigación
mediante la concesión de becas.
o Definir ayudas para la asistencia a cursos organizados por algunos de los centros de
investigación, o la asistencia a congresos internacionales de reconocido prestigio donde los
estudiantes pueden publicar sus trabajos de investigación.
o Organizar premios para los mejores trabajos de investigación y tesis doctorales realizados en
Tecnologías del Habla.

 Atraer inversiones para investigación de las empresas hacia las Tecnologías del Habla, mediante la
búsqueda de nuevas aplicaciones que ofrezcan nuevas posibilidades de negocio, a través de las
siguientes actividades:
o Financiación para la realización de prototipos y demostraciones que permitan mostrar a las
empresas estas nuevas aplicaciones y el potencial de investigación en Tecnologías del Habla.
o Foros de debate en los que intervengan investigadores y directivos de las empresas interesadas.

 Avanzar en la creación de lazos de colaboración e integración de los miembros de la Red para


mantener el liderazgo de España en la investigación del Castellano, y potenciar también los idiomas
co-oficiales como el Catalán, Euskera y Gallego, a través de las siguientes actividades:
o Organización de las Jornadas Nacionales en Tecnologías del Habla, siendo un punto de
encuentro en el que los investigadores comparten los resultados de la investigación,
potenciando el networking y las líneas de trabajo conjunto.
o Creación de consorcios multidisciplinares para la solicitud de proyectos tanto nacionales como
europeos, mediante la creación de sesiones concretas dentro de las Jornadas en Tecnologías
del Habla.
o Promover la movilidad de recursos humanos, y el desarrollo y la difusión de recursos materiales
de interés común entre los miembros de la red.
o Mejorar la coordinación entre las infraestructuras científico-tecnológicas y las necesidades del
mercado relacionado con las Tecnologías del Habla, evitando esfuerzos redundantes.
o Facilitar las relaciones con otras "redes temáticas“ y sociedades que existen en otros países.

18
Sociedad Española para el
Procesamiento del Lenguaje Natural

Asociación científica sin ánimo de lucro, formada por socios numerarios e instituciones, creada en el
año 1984, con el objeto de promover y difundir todo tipo de actividades referentes a la enseñanza,
investigación y desarrollo en el ámbito del procesamiento del lenguaje natural, tanto a nivel nacional
como internacional.

Los objetivos de la Sociedad son:


 Establecer canales de intercambio de información y materiales científicos.
 Organización de seminarios, simposios y conferencias.
 Promoción de publicaciones.
 Colaboración con otras instituciones relacionadas con su campo de actuación.

Entre las actividades más destacadas figuran las siguientes:


 Celebración de un Congreso anual que sirve de punto de encuentro para los distintos grupos
de investigación que trabajan en el área del procesamiento del lenguaje natural.
 Edición de una revista con garantiza unos criterios estables de calidad y periodicidad.
 Página web con información sobre el procesamiento del lenguaje natural.
 Información de actualidad y espacio de discusión para los socios.

La revista "Procesamiento del Lenguaje Natural" es un foro de publicación de artículos científico-


técnicos en el ámbito, tanto para la comunidad científica nacional e internacional como para las
empresas del sector, que permite presentar nuevos trabajos, comunicar resultados, discutir
problemas y obstáculos encontrados durante su trayectoria investigadora. Cuenta con el sello de
calidad de la Fundación Española para Ciencia y Tecnología (FECyT), el cual la certifica como revista
de excelencia, y por lo tanto, incluida en el Repositorio de Revistas Científicas españolas.

Las áreas temáticas tratadas son las siguientes:


 Modelos lingüísticos,  Generación textual monolingüe y  Procesamiento de lenguaje
matemáticos y psicolingüísticos multilingüe. natural para lenguas con
del lenguaje.  Traducción automática. recursos limitados.
 Lingüística de corpus.  Reconocimiento y síntesis del  Aplicaciones industriales del
 Desarrollo de recursos y habla. procesamiento de lenguaje
herramientas lingüísticas.  Extracción y recuperación de natural.
 Gramáticas y formalismos para el información monolingüe,  Sistemas de diálogo.
análisis morfológico y sintáctico. multilingüe y multimodal.  Análisis de sentimientos y
 Semántica, pragmática y  Sistemas de búsqueda de opiniones.
discurso. respuestas.  Minería de texto.
 Lexicografía y terminología  Análisis automático del contenido  Evaluación de sistemas de
computacional textual. procesamiento de lenguaje
 Resolución de la ambigüedad  Resumen automático. natural.
léxica.  Procesamiento de lenguaje  Implicación textual y paráfrasis.
 Aprendizaje automático en natural para la generación de
procesamiento de lenguaje recursos educativos.
natural.
19
Grupos de Investigación

Además de entidades aglutinadoras de conocimiento, tales como la Red Temática en Tecnologías del Habla
y la Sociedad Española para el Procesamiento del Lenguaje Natural, cabe destacar los principales grupos de
investigación en este campo a nivel nacional.

La investigación en traducción automática es muy activa, tanto por el número de grupos que se dedican a
este tema como por la actividad en cuanto a congresos, talleres y asociaciones específicas sobre el mismo.
La Unión Europea mantiene un sistema de financiación de nuevos proyectos relacionados con las
tecnologías del lenguaje, y en particular con la traducción automática, que ha permitido que universidades y
empresas compartan sus conocimientos y combinen sus intereses académicos y comerciales, para
desarrollar y comercializar nuevos productos de traducción automática.

A continuación se presentan gráficamente los principales grupos de investigación a nivel nacional en el


ámbito del procesamiento del lenguaje natural:

 PR & Speech Technologies. Universidad del País Vasco  CLiC, Centre de llenguatge i Computació. Universidad de Barcelona
 Grupo de Tratamiento del Habla AhoLab. Universidad del  Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP)
País Vasco/ Euskal Herriko Unibertsitatea Universitat Politècnica de Catalunya
 Grupo de Investigación en Procesamiento Digital de la Señal
 Grupo IXA. Universidad del País Vasco (GPDS). Enginyeria i Arquitectura La Salle. Universitat Ramon Llull
 Dpto. de Física Aplicada Universidad de
 Grupo SPPB. Universidad de Barcelona
Santiago
 Grupo de Tratamiento de Señal. Escola Universitària Politècnica de
Mataró
 Grupo de Teoría de la Señal. Universidad
de Vigo  Grupo de Tecnologías de las Comunicaciones. Universidad
 Seminario de Lingüística Informática. de Zaragoza
Universidad de Vigo
 Aprendizaje Computacional, Reconocimiento Automático y Traducción
Automática. Universidad Jaume I
 Grupo ECA-SIMM. Universidad de Valladolid  Grupo de Percepción del Habla.
 Grupo PRHLT (Pattern Recognition and Human Language Technology Group. Grupo
 Grupo de Aplicaciones del Procesado de Señales: de Reconocimiento de Formas y Tecnología del Lenguaje de la Universitat Politècnica
Área Procesamiento del Lenguaje Natural. de València).
Universidad Politécnica de Madrid.  Grupo de Procesamiento del Lenguaje Natural. Universidad Politécnica de Valencia.
 Grupo de Procesado de Voz y Señales (subgrupo del grupo de investigación de Programación Lógica e Ingeniería del
Biomédicas- Universidad Politécnica de Madrid. Software).
 Grupo de Procesamiento de Lenguaje Natural de  Grupo Reconocimiento de Formas e Inteligencia Artificial. Subárea Diálogo.
la UNED. Universidad Politécnica de Valencia.
 Grupo SINTONIA: Área Habla-Voz. Universidad
 Grupo de Procesamiento del Lenguaje y Sistemas de Información. Universidad de Alicante.
Carlos III de Madrid.
 Grupo de Tecnología del Habla, Dpto. Ingeniería  Grupo de Investigación: Señales, Telemática y Comunicaciones
Electrónica, Universidad Politécnica de Madrid
 Telefónica I+D, División de Tecnología del Habla.  Grupo de Neurociencia Cognitiva de
 Tecnologías del Habla y Procesado Multimedia. Lenguaje. Universidad de La Laguna
 Grupo SINAI. Universidad de Jaén
Universidad Carlos III de Madrid.
 Unidad de Psicolingüística Aplicada. Universidad
 Grupo de Modelización y Simulación en
Complutense de Madrid.
Psicología. Universidad de Málaga

 Grupo ITALICA. Universidad de Sevilla.


 Grupo Julietta. Universidad de Sevilla.  Grupo de Estructuras de Datos y
 IBM Voice Technology Development -Spain Group Lingüística Computacional. Universidad
de Las Palmas de Gran Canaria.

Fuente: Elaboración propia basada en el Libro Blanco de las Tecnologías del Habla

20
Empresas

A nivel privado, las principales empresas relacionadas con el ámbito del procesamiento del lenguaje
natural son las que se presentan a continuación:

Verbio

Spin-off de la Universidad Politécnica de Cataluña, que apuesta por la automatización de los sistemas de
atención al cliente y por dotar de inteligencia y personalidad a cada uno de los contactos con sus usuarios.

La capacidad de sus soluciones de entender a los usuarios en lenguaje natural y comunicarse con ellos de
forma empática, permiten ofrecer servicios de valor añadido y gran sofisticación, mediante el uso de portales
o asistentes virtuales.

En base a su propia tecnología han desarrollado varias soluciones que se complementan entre ellas para
ajustarse a las necesidades de sus clientes:
 Portal de Voz
 Speech & Text Analytics
 Biometría
 Transcripción y Subtitulación
 Text to Speech
 Speech Recognition

Indisys

Empresa, recientemente adquirida por Intel, dedicada a desarrollar agentes inteligentes que permiten
mantener conversaciones flexibles en múltiples modalidades, idiomas, canales, dispositivos y plataformas.

Tiene por objetivo potenciar la experiencia de los usuarios, a la vez que se reducen costes a nivel
empresarial, con servicios de atención basados en la Inteligencia Artificial y las tecnologías de reconocimiento
de voz y lenguaje natural.

Su software utiliza procesamiento del lenguaje natural y gestión del diálogo, para poder traducir las palabras
del usuario a un lenguaje que la máquina pueda comprender y así decidir cuál es la mejor respuesta.

Otro de sus puntos fuertes es la gestión del diálogo, permitiendo que sus asistentes puedan mantener el hilo
de la conversación, al tener en cuenta el contexto de la misma.

21
Nuance

Empresa especializada en el desarrollo de software de voz para reconocer y emular la voz humana.

Diseñan y proporcionan tecnologías que unen de forma intuitiva al ser humano con la máquina y con el
almacén global de conocimientos, ayudando a las empresas y consumidores a trabajar de forma inteligente.

Su producto estrella es Dragon, el software de reconocimiento de voz más vendido del mundo, que permite
dictar documentos, realizar búsquedas en Internet o enviar correo electrónico, de forma rápida y precisa, con
sólo utilizar la voz.

Agnitio

Líder del mercado mundial en productos de identificación de voz. Es utilizado por las organizaciones
gubernamentales para prevenir el delito, identificar a los criminales y aportar pruebas en los tribunales.

El motor de reconocimiento de Agnitio es capaz de filtrar las características de la voz, así como las huellas
del tracto vocal en ondas de sonido.

Sus clientes utilizan los motores de identificación de voz para autenticar los clientes, identificar a los
defraudadores y proporcionar de una manera simple la identidad en múltiples aplicaciones.

Agnitio fue fundada en 2004 como una spin-off de un grupo de investigación universitario. Su equipo está
formado por expertos en tecnologías de reconocimiento que colaboran con universidades, institutos de
investigación y socios de negocios en todo el mundo. Su sede se encuentra en Madrid, con filiales en EE.UU y
Canadá.

22
Daedalus

Empresa española especializada en extraer automáticamente el significado de todo tipo de contenidos


multimedia. Aplica tecnologías semánticas, de procesamiento del lenguaje, reconocimiento de voz, y análisis
de datos y texto que ayudan a sus clientes a:

 Analizar y evaluar el impacto de lo que se dice en todo tipo de medios sociales y tradicionales (redes,
blogs, prensa, radio, TV).

 Extraer elementos de significado y contexto de todo tipo de contenidos y conversaciones sociales, para
permitir una publicidad más enfocada y eficaz.

 Enriquecer y personalizar toda clase de contenidos multimedia y multiidioma para combinarlos,,


distribuirlos y monetizarlos.

 Extraer información de documentos financieros y contenido generado por los usuarios, para mejorar la
toma de decisiones de gestión de riesgos e inversión.

 Integrar y recuperar información de repositorios heterogéneos.

Voice Base

Empresa que ha desarrollado una aplicación capaz de pasar un audio a texto, con la posibilidad de editarlo
fácilmente desde la web.

Se trata de una aplicación gratuita y online, por lo que no es necesaria su descarga. Únicamente es
necesario subir cualquier audio a dicha aplicación online, y ésta lo transcribirá inmediatamente a texto.
Ofrece un editor de texto para corregir cualquier error en su transcripción.

23
5. Patentes
Patentes a nivel nacional
La siguiente tabla muestra información de las patentes registradas en España relacionadas con el ámbito
del Procesamiento del Lenguaje Natural, en concreto se detalla el nombre de la patente, número de
publicación, solicitante, y una breve descripción de la misma:

Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Método para la utilización de lenguaje natural como interfaz para los Retevisión Movil,
ES2261053 A1
terminales móviles S.A.

Descripción

Método para la utilización de lenguaje natural como interfaz para los terminales móviles, con el objetivo de interactuar
con aplicaciones instaladas en él, así como aplicaciones remotas, facilitando el uso de servicios de telefonía móvil
mediante la voz.

La aplicación del método requiere la instalación en el terminal de una aplicación software que utiliza el propio hardware
del terminal para capturar, preprocesar y codificar el audio a enviar al servidor.

Este método está destinado a facilitar el acceso a las aplicaciones, tanto locales como remotas, a cualquier tipo de
usuario

Nombre de la patente Nº de publicación Solicitante

Sistema de consulta de lenguaje natural para acceder a un sistema de


ES2236483 T3 Voice-insight
información

Descripción

Sistema de interacción para permitir a un usuario de un sistema de información interactuar con el mismo, a través de un
sistema de reconocimiento que permite la interacción por medio de frases generadas por dicho usuario, y procesadas por
el sistema de reconocimiento.

El sistema de interacción comprende al menos un módulo de dominio, donde se definen unas estructuras de frases que
están construidas sobre la base de las clases de objetos, clases de atributos y clases de acciones que son comunes al
dominio de aplicación considerado, con el fin de definir una gramática de frases que están previstas para ser generadas
por el usuario para interactuar con el sistema de información.

Nombre de la patente Nº de publicación Solicitante

Interfaz de usuario interactivo de red que utiliza reconocimiento de voz y One Voice
ES2235508 T3
tratamiento de lenguaje natural Technologies Inc.

Descripción

Un método para interactuar con un objeto de red, que funciona de la siguiente manera: Se recibe una interacción relativa
a un objeto de red desde un usuario; se determina si una tabla de objetos de red está asociada con dicho objeto de red;
se obtiene la tabla de objetos de red asociada si es que existe, se especifican una o más acciones asociadas con dicho
objeto de red; se actualiza un primer archivo de gramática con gramática relativa a dicho objeto de red; se busca el
primer archivo de gramática para otra interacción relativa a un objeto de red recibido desde un usuario; se busca un
segundo archivo de gramática si la correspondencia de frase no es encontrada en el primer archivo gramatical; se busca
una base de datos del lenguaje natural para representar dichas frases y se advierte al usuario de una clarificación en el
objeto de red si no se ha encontrado una correspondencia de entrada en la base de datos de lenguaje natural.
25
Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Interfaz de usuario interactiva que emplea reconocimiento de voz y One Voice


ES2235520 T3
tratamiento de lenguaje natural Technologies Inc.

Descripción

Un método para interactuar con un ordenador utilizando pronunciaciones, comprendiendo el método los pasos de:

 Buscar en un primer fichero de gramática una frase de coincidencia para dicha pronunciación

 Buscar en un segundo fichero de gramática una frase de coincidencia si dicha frase de coincidencia no ha sido
encontrada en dicho primer fichero de gramática

 Buscar en una base de datos de procesamiento de lenguaje natural, una entrada de coincidencia para dicha frase
de coincidencia, representando las entradas frases que son conocidas por la base de datos NLP

 Realizar una acción asociada con dicha entrada de coincidencia si dicha entrada de coincidencia es encontrada en
dicha base de datos

Nombre de la patente Nº de publicación Solicitante

Traducción de formas de palabras relacionadas para la indexación y


ES2168267 T3 Xerox Corporation
recuperación de texto en estado finito

Descripción

Resuelve una serie de problemas a la hora de utilizar radicales (indicadores canónicos de significados de palabras) en la
recuperación de textos completos de documentos en lenguaje natural y por tanto permite mejorar la rellamada sin que
por ello sufra la precisión. Utiliza distintos modelos de traductores finitos (fsts) para codificar de manera precisa una serie
de modos deseados para mapear hacia adelante y hacia atrás entre palabras y radicales, teniendo en cuenta tanto los
aspectos sistemáticos del sistema de reglas morfológicas de una lengua como las irregularidades de palabra por palabra
que ocurren. La invención contempla al sistema de recuperación de información como una base de datos y un procesador
para responder a las consultas del usuario, para consultar la base de datos y para obtener respuestas correctas, si existen,
así como métodos para la formación de la nueva base de datos.

Nombre de la patente Nº de publicación Solicitante

Aparato y Métodos de Servicios de Telecomunicaciones ES2317317 T3 Intellprop Limited

Descripción

Aparato de servicios de telecomunicaciones para ser usado con una red de telecomunicaciones móviles, comprendiendo el
aparato unos medios para recibir un primer mensaje de texto desde un teléfono móvil, unos medios para procesar el
primer mensaje de texto recibido con el fin de determinar una dirección de red a partir del primer mensaje de texto
procesado, y unos medios para enviar la dirección de red determinada como segundo mensaje de texto hacia dicho
teléfono móvil o hacia otro teléfono móvil, caracterizado porque los medios de procesado del primer mensaje de texto
recibido comprenden un motor capaz de interpretar lenguaje natural que se puede hacer funcionar, en el caso de que no
se pueda determinar una dirección de red adecuada, para entrar en un diálogo con un usuario de dicho teléfono móvil.

26
Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Dispositivo de tratamiento de datos con definición formal ES2389363 T3 Progilys

Descripción

Dispositivo de tratamiento de datos, que comprende:

 una unidad de tratamiento capaz de interaccionar con una base de datos, comprendiendo la base de datos unas
tablas de datos

 una interfaz gráfica de usuario establecida para permitir a un usuario introducir una expresión matemática

 un editor de expresión matemática capaz de establecer una representación informática de trabajo de una
expresión matemática en interacción con la interfaz gráfica de usuario,

 un diccionario de símbolos el cual, comprende información sobre la estructura de tablas de la base de datos

 un editor de condiciones dispuesto para producir una expresión de condición, siendo la expresión de condición
utilizable en combinación con los metadatos para seleccionar un subconjunto de datos de la base de datos

 un generador de consultas dispuesto para tratar la representación informática de trabajo para producir una
secuencia de código que ejecuta la expresión matemática de acuerdo con las reglas del lenguaje natural

Nombre de la patente Nº de publicación Solicitante

Universidad Carlos Iii


Método de Generación de Patrones Semánticos No Disponible
De Madrid

Descripción

La presente invención está relacionada con los métodos de reconocimiento de lenguaje natural. Se encuadra con aquellos
métodos para la generación de patrones semánticos que posibilitan la organización de la información. Incluye las etapas
de: determinar la categoría gramatical de cada término de un texto, agrupar en grupos las categorías gramaticales,
contabilizar la frecuencia de aparición de cada grupo, establecer un candidato a patrón si la frecuencia de aparición de
un grupo es suficientemente alta, determinar la categoría semántica del candidato a patrón con una taxonomía
predefinida, identificar un patrón cuando el candidato a patrón tenga una categoría semántica asociada.

Nombre de la patente Nº de publicación Solicitante

Procesador de Textos ES2285736 T3 Walker, Randall C.

Descripción

Método para mejorar la presentación de texto a partir de un texto de lenguaje natural legible por máquina basándose en
parámetros específicos del lector, incluyendo como mínimo las dimensiones del campo de visión, que comprende: analizar
sintácticamente de dicho texto signos de puntuación y categorías gramaticales para extraer atributos específicos del
texto; almacenar dichos atributos específicos del texto en relación con las categorías gramaticales para producir un texto
enriquecido; aplicar reglas de terminación primarias seguidas por reglas de terminación secundarias a dicho texto
enriquecido; aplicar reglas de terminación secundaria hasta que se alcanza un determinado límite; aplicar reglas de
desplazamiento horizontal de segmentos de texto a dichos segmentos de texto para determinar un desplazamiento
horizontal para cada segmento de texto; y visualizar dicho texto mejorado mediante una presentación en cascada de
segmentos de texto en líneas descendentes y a lo ancho del dispositivo de visualización.

27
Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Matsushita Electric
Dispositivo de Control Remoto Basado en la Palabra ES2251942 T3
Industrial Co., Ltd.

Descripción

Sistema de mando a distancia que comprende: una caja manual dotada de una interfaz de comunicación por medio de la
cual las instrucciones de mando son transmitidas a un componente remoto; una pantalla de visualización dispuesta en
dicha caja; un micrófono que sirve para recibir mensajes orales de entrada; un sistema analizador de voz acoplado a dicho
micrófono para procesar dichos mensajes orales de entrada ; un fichero de datos históricos de diálogos utilizado para
registrar las conversaciones que han tenido lugar en el conjunto del sistema; una memoria que contiene los datos de
perfiles de usuarios; un administrador de diálogos conectado a dicho sistema analizador de voz , a dicha memoria de datos
de perfiles de usuarios, y a dicha pantalla de visualización para transmitir instrucciones de mando y para presentar la
información en la pantalla de visualización; y un analizador sintáctico de lenguaje natural en comunicación de datos con
dicho sistema analizador de voz

Nombre de la patente Nº de publicación Solicitante

Teliasonera Finland
Provisión de servicios en una red de comunicaciones ES2403014 T3
Oyj

Descripción

Un procedimiento para proporcionar una amplia diversidad de servicios diferentes y combinaciones arbitrarias de servicios
en una red de comunicaciones con al menos un servidor de aplicación que almacena las aplicaciones del servicio,
asignándose a cada una de las aplicaciones de servicio una operación por la cual se arranca la aplicación del servicio, y
terminales de usuario para suministrar peticiones 5 de servicio en lenguaje natural, incluyendo el procedimiento las
etapas de:

 dar una petición de servicio del usuario en lenguaje natural

 interpretar la petición del servicio del usuario y generar una descripción del servicio de formato genérico,
incluyendo la descripción del servicio, los nombres de las funcionalidades que se necesitan para cumplir la petición
de servicio del usuario y los parámetros que requieran dichas funcionalidades.

 recibir la descripción del servicio de formato genérico,

 dividir la descripción del servicio de formato genérico en uno o más elementos, incluyendo un elemento un nombre
de dicha funcionalidad como un tipo y los valores de los parámetros asociados,

 analizar los elementos y examinar el tipo de los elementos y mapear dicho tipo a una entidad, indicando las
entidades las llamadas de servicio a realizar y los parámetros relativos a las llamadas de servicio para implementar
las funcionalidades especificadas en la descripción de servicio de formato genérico

 usar dichas entidades para utilizar dichas aplicaciones de servicio

28
Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Método para Normalizar Caja ES2316474 T3 Hapax Limited

Descripción

Un método para diferenciar automáticamente distinciones significativas de distinciones no significativas de caja alta y
caja baja en una serie de tipos de palabras de entrada de un texto en lenguaje natural por medio de un ordenador,
caracterizado por los pasos de: asignar un tipo de palabra de entrada a uno de una serie de grupos locales separados (LG1,
LG2, LG3, LG4) en base a la caja y a la posición de las letras que constituyan el tipo de palabra de entrada; asignar dicho
tipo de palabra de entrada a uno de una serie de grupos globales separados (GG1, GG2, GG3, GG4) en base a qué
variantes de caja de grupos locales de los tipos de palabras de entrada estén asignados; y normalizar las cajas para dicho
tipo de palabra de entrada de acuerdo con reglas predeterminadas asociadas con el grupo global al que esté asignado
dicho tipo de palabra de entrada.

Nombre de la patente Nº de publicación Solicitante

Uribe-Etxebarria
Método y Aparato para procesar Consultas Continuas No disponible
Jimenez, Xabier

Descripción

Un método para procesar consultas continuas en lenguaje natural recibidas desde un equipo de cliente conectado a un
segundo servidor de aplicación de consultas continuas a través de un primer servidor de aplicación y de una red de
telecomunicaciones; que comprende las etapas de recepción en una unidad de procesamiento de lenguaje natural de
primeros datos de texto ordenados de acuerdo a normas lingüísticas del lenguaje natural de una consulta realizada, para
suministrar segundos datos de texto en un lenguaje intermedio basados en los primeros datos de texto de lenguaje
natural; generación en una unidad de diálogo de terceros datos de texto en lenguaje natural ordenados de acuerdo a
normas lingüísticas del lenguaje natural de un mensaje de respuesta, en función de los segundos datos de texto del
lenguaje intermedio recibidos desde unidad de procesamiento, y emisión del mensaje de respuesta al equipo de cliente a
través de un primer servidor de aplicación y de una red de telecomunicaciones.

Nombre de la patente Nº de publicación Solicitante

Giannetti, Françoise
Pasaporte Intemporal de Identificación ES2475092 T3
Née Rouzaud

Descripción

Procedimiento de realización de un artículo funerario para la identificación y la perpetuación del recuerdo de un difunto,
caracterizado porque comprende esencialmente las etapas que consisten en tomar un elemento en material inalterable
elegido entre las cerámicas cocidas, el vidrio, la piedra, el acero inoxidable, de unas placas primera y segunda en
material inalterable elegido entre las cerámicas cocidas, el vidrio, la piedra, el acero inoxidable, y:

 marcar el citado elemento en material inalterable con un código único

 atribuir el citado código único a un difunto y recoger los datos de identificación del citado difunto

 disponer el citado elemento previamente marcado con el citado código único con los restos o las cenizas

 marcar las citadas placas primera y segunda con el citado código único y marcar la segunda placa con los citados
datos de identificación en lenguaje natural

 ensamblar las citadas placas así marcadas con la ayuda de un medio de fijación, para formar un dispositivo de
identificación y de memoria
29
Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Infogation
Sistema de Navegación Móvil ES2346631 T3
Corporation

Descripción

Un método para suministrar un recorrido óptimo utilizando información en tiempo real para un sistema de navegación que
comprende un cliente y un servidor, dicho servidor está acoplado a una red de ordenador, dicho método comprende los
pasos de:

 Establecer una conexión inalámbrica entre el cliente y el servidor

 Transmitir designaciones de inicio y fin de recorrido desde el cliente al servidor

 Acceder a información en tiempo real por parte del servidor, la información en tiempo real representa condiciones
actuales relevantes del recorrido propuesto

 Calcular el recorrido óptimo por el servidor, basado en información en tiempo real y dichas designaciones de inicio
y fin del recorrido

 Dar formato al recorrido óptimo en una descripción genérica en lenguaje natural que va a ser utilizada con una
base de datos local de mapas del cliente con el cliente

 Descargar dicha descripción genérica en lenguaje natural al cliente

 Reconstruir el recorrido óptimo por el cliente, a partir de la descripción genérica en lenguaje natural

 Usar la base de datos local de mapas del cliente

 Exhibir dicho recorrido óptimo en un sistema de representación visual acoplado al cliente

Nombre de la patente Nº de publicación Solicitante

The Trustees Of
Columbia University
Sistema y Método para Extracción y Codificación de Lenguaje Medico ES2218670 T3
In The City Of New
York

Descripción

En un tratamiento informatizado de datos médicos/clínicos en lenguaje natural que comprende un análisis y una
regularización de la frase, se refiere a parámetros cuyo valor puede precisarse por el usuario. Así, un sistema
informatizado puede volverse polivalente, especialmente para el tratamiento de datos de salida en varios campos. este
sistema tiene, además de un mecanismo de análisis y de regularización, un preprocesador, filtros de salida y un
mecanismo de codificación

30
Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante

Koninklijke Philips
Sistema de Introducción de Información y Visualización ES2133355 T3
Electronics N.V.

Descripción

Para operar aparatos de usuarios, el usuario con frecuencia tiene que dar entrada a instrucciones operativas complicadas
(por ejemplo la programación de una grabadora de video). Con objeto de dar entrada a un gran número de datos sin una
instrucción, en una forma sencilla para el usuario, el aparato comprende medios para formar sentencias en fases y para
representarlas en un lenguaje natural. En cada fase, los datos a los que ya se ha dado entrada se reproducen, y los
próximos datos a dar entrada se identifican. De esta forma la comunicación con el usuario tiene lugar en un lenguaje
natural, sin que el usuario tenga necesidad de dar entrada a este lenguaje.

Nombre de la patente Nº de publicación Solicitante

Universitat
Método Mejorado de Agrupamiento Espectral por Ordenador y Usos del
No Disponible Politècnica De
mismo
Catalunya

Descripción

Método mejorado de agrupamiento espectral por ordenador y usos del mismo. El método usa un algoritmo de
agrupamiento para dividir datos en una pluralidad de grupos de muestra de modo que las muestras en cada grupo o
agrupamiento tienen similitud máxima entre las mismas y similitud mínima con las muestras en otros agrupamientos,
usando el método implementado de agrupamiento espectral por ordenador al menos dos criterios de similitud o vistas de
datos diferentes para definir al menos dos matrices de similitud y aplicar el algoritmo de agrupamiento a los datos para
cada uno de dichos al menos dos criterios de similitud diferentes y además integrar simultáneamente información relativa
a dicha pluralidad de matrices de similitud a partir de varias vistas de datos en los grupos de muestra resultantes. Los usos
del método mejorado de agrupamiento espectral por ordenador para análisis de procesamiento de señal biomédica, para
análisis de agrupamiento génico, para análisis de visión por máquina, para procesamiento de lenguaje natural y para
análisis de cesta de compra.

Nombre de la patente Nº de publicación Solicitante

Sistema de Anotación Automática de Datos de Adiestramiento para un Microsoft


ES2368213 T3
Sistema de Comprensión del Lenguaje Natural Corporation

Descripción

Procedimiento para la generación de datos de adiestramiento anotados para adiestrar un sistema de comprensión del
lenguaje natural, NLU, que incorpora uno o más modelos, comprendiendo el procedimiento:

 La generación de una anotación propuesta con el sistema NLU para cada unidad de datos de adiestramiento no
anotados

 La presentación de las anotaciones propuestas para la verificación o la corrección de usuario para obtener una
anotación confirmada por un usuario

 El adiestramiento del sistema NLU con la anotación confirmada por un usuario

31
Procesamiento del Lenguaje Natural

Nombre de la patente Nº de publicación Solicitante


Matsushita Electric
Método y Aparato Analizador del Lenguaje Natural ES2228408 T3
Industrial Co., Ltd.
Descripción
Método de análisis sintáctico de lengua oral implementada en un ordenador para procesar una frase de entrada, que
comprende las fases de:

a) Facilitar una pluralidad de gramáticas indicativas de temas predeterminados

b) Generar una pluralidad de conjuntos de árboles de directorios de análisis sintáctico, relacionada con dicha frase
de entrada utilizando dichas gramáticas

c) Asociar etiquetas con palabras de dicha frase de entrada utilizando dichos conjuntos de árboles de directorios de
análisis sintáctico generados

d) Generar valoraciones de dichas etiquetas basadas en los atributos de dichos conjuntos de árboles de directorios de
análisis sintáctico

e) Seleccionar etiquetas para su uso como representación analizada sintácticamente de dicha frase de entrada,
basándose en dicha valoración generada

Fuente: Elaboración propia basada en la información extraída de la Oficina Española de Patentes y Marcas

32
Patentes a nivel internacional
Según la Global Patent Search Network, existen actualmente 9.355 patentes sobre
Procesamiento del Lenguaje Natural registradas en todo el mundo. La primera de ellas
data del año 1986. El siguiente gráfico muestra el número de patentes que han sido
publicadas anualmente hasta el año 2012:

Patentes registradas a nivel mundial


1.400

1.200

1.000

800

600

400

200

0
1989

1996

2003

2010
1986
1987
1988

1990
1991
1992
1993
1994
1995

1997
1998
1999
2000
2001
2002

2004
2005
2006
2007
2008
2009

2011
2012
Fuente: Elaboración propia basada en la información extraída de Global Patent Search Network

A continuación destacamos a los investigadores internacionales que más patentes han


publicado en este ámbito:
TOP 10 Investigadores
5%
6%
6% 25%
6%
6%

7%
19%
8%
12%

Paul Rapps Silver Brucker Gangtianzhizhi Ikeda Navigation


Li Secondary One Far in True Angle Wildly True Shiyutianyang
Leaf Jianfa Tensioning Yong
Fuente: Elaboración propia basada en la información extraída de Global Patent Search Network

33
6. Iniciativas de Interés
Hospital Quirón y Universidad
Apple - Siri
Politécnica de Madrid
El Grupo de Aplicaciones del Procesado de Siri es una aplicación con funciones de
Señales de la Universidad Politécnica de asistente personal para iOS.
Madrid y el Grupo Quirón, trabajan en la
aplicación de técnicas de análisis de voz para la Esta aplicación utiliza procesamiento del
detección de la apnea del sueño. lenguaje natural para responder preguntas,
hacer recomendaciones y realizar acciones,
La investigación está impulsada por el mediante la delegación de solicitudes hacia un
neumólogo José Alcázar Ramírez, y el conjunto de servicios web que ha ido
investigador Luis Hernández Gómez, del Grupo aumentando con el tiempo.
de Aplicaciones del Procesado de Señales.
Entre las cualidades destacadas, Siri es capaz
Para ello, se han recabado grabaciones de voz de adaptarse con el paso del tiempo a las
para analizar la relación entre los preferencias individuales de cada usuario,
condicionantes clínicos del síndrome de personalizando las búsquedas web y la
apneas-hipopneas del sueño (SAHS), y los realización de algunas tareas.
rasgos observados en el proceso de
caracterización del habla de estos pacientes. Siri ofrece interacción conversacional con otras
aplicaciones, tales como los recordatorios,
La experiencia del grupo GAPS en el campo de consulta con el estado del tiempo, la bolsa, el
las tecnologías del habla ha permitido abordar servicio de mensajería, el correo electrónico,
esta labor, adaptando algunas de las técnicas calendario, contactos, notas, música, reloj,
de clasificación utilizadas en el reconocimiento navegador web, Wolfram Alpha y los mapas.
automático del habla y del locutor, al problema
específico de caracterización y clasificación de Es un producto surgido del Centro de
locutores para la detección del SAHS. Inteligencia Artificial de SRI International,
nacido como una rama del proyecto CALO, un
Los resultados obtenidos resultan muy proyecto financiado por DARPA, descrito como
alentadores. Actualmente, en los trabajos "el mayor proyecto de inteligencia artificial
participa el Hospital Quirón de Málaga, pero se creado a la fecha". Las áreas técnicas en las
pretende extender a todos los Hospitales que hace foco primario el proyecto Siri son:
Quirón de España, para demostrar la posible Interfaz Conversacional, Reconocimiento de
influencia del acento local en la Contexto Personal, y Delegación de Servicios.
sensibilidad/especificidad de la prueba.

Instituciones de distintos países se han


interesado por el trabajo desarrollado, tales
como el grupo de Ingeniería Biomédica de la
Universidad Ben-Gurion (Israel), equipos de la
Universidad de Aviñón (Francia), o el Instituto
Superior Politécnico José Antonio Echeverría
(Cuba).

35
Perldoop

El Centro Singular de Investigación en


Tecnologías de la Información (Citius), de la
Universidad de Santiago de Compostela, ha
creado un software libre que acelera el
procesamiento de textos y documentos
publicados en la web.

Su nombre es Perldoop, y permite el análisis de


los datos de una forma sencilla y eficiente. La
IBM Watson
herramienta adapta aplicaciones del ámbito del
procesamiento de textos y documentos a Watson es un sistema informático de
modelos de computación, lo que reduce los inteligencia artificial que es capaz de responder
tiempos de ejecución y permite trabajar con a preguntas formuladas en lenguaje natural,
grandes volúmenes de datos. desarrollado por la corporación estadounidense
IBM. Forma parte del proyecto del equipo de
Su propuesta se ha basado en el diseño de un investigación DeepQA.
sistema que permite transformar el software
usado para el procesamiento del lenguaje El sistema responde a las preguntas gracias a
natural en una solución compatible con las una base de datos almacenada localmente. La
tecnologías Big Data. información contenida en esa base de datos
proviene de multitud de fuentes, incluyendo
Con sólo introducir unas etiquetas en la enciclopedias, diccionarios, tesauros, artículos
aplicación original, esta herramienta de de noticias y obras literarias, al igual que bases
traducción permite al programador convertir de datos externos, taxonomías, y ontologías,
automáticamente todo su código en código específicamente DBpedia, WordNet, y Yago.
Java adaptado a MapReduce (modelo de
programación utilizado por Google para dar La corporación lo describe como "una aplicación
soporte a la computación paralela sobre de tecnologías avanzadas diseñadas para el
grandes colecciones de datos), habilitándolo así procesamiento de lenguajes naturales, la
para su ejecución en un clúster, es decir, recuperación de información, la representación
permitiendo su ejecución simultánea en del conocimiento, el razonamiento automático,
múltiples cores o nodos de computación. y el aprendizaje automático al campo abierto de
búsquedas de respuestas.
Otra característica es que los resultados se han
hecho públicos bajo una licencia de software El objetivo para Watson es permitir que las
libre, con el objetivo de que esté a disposición computadoras comiencen a interactuar de
del mayor número posible de usuarios y forma natural con humanos a través de una
profesionales. amplia gama de aplicaciones y procesos,
comprendiendo las preguntas de los seres
humanos, y dando respuestas que los seres
humanos pueden comprender y justificar.

IBM y Nuance Communications Inc. se han


unido para explotar las capacidades de Watson
como sistema de apoyo para decisiones clínicas
para ayudar al diagnóstico y tratamiento médico
de pacientes.

36
7. Fuentes de información
Fuentes de información
A continuación se presentan las principales fuentes de información utilizadas para el
desarrollo del presente documento:
• Aplicaciones de Procesamiento de Lenguaje Natural, Hernández M. Gómez J. Escuela Politécnica
nacional, Facultad de Ingeniería en Sistemas Quito, Ecuador, Universidad de Alicante, Departamento de
Lenguajes y Sistemas Informáticos, Alicante, España
• The Bhiopharmaceutical Challenge, Efficient Innvation, IBM Software. IBM Solutions
• IBM Watson Explorer, Explore, analyze and interpret information for better business outcomes, IBM
Software
• Aplicación de tecnologías de Procesamiento de lenguaje natural y tecnología semántica en Brand Rain
y Anpro 21, Oscar Trabazos, Silvia Suarez, Remei Bori y Oriol Flo
• Diseño e implementación de un sistemas para el análisis y categorización en Twitter mediante técnicas
de clasificación automática de textos, Universidad Carlos III de Madrid, Escuela Politécnica Superior de
Ingeniería Técnica de Telecomunicación: Telemática, Samuel Alcázar Jaén, Luis Sánchez Fernández,
María Luz Congosto Martínez
• Evaluación de las herramientas comerciales y métodos del estado del arte para la generación de
resúmenes extractivos individuales, Griselda Areli Matías Mendoza, Yulia Ledeneva, Rene Arnulfo
García- Hernández, Grigori Sidorov, Universidad Autónoma del Estado de México, Unidad Académica
Profesional Tianguistenco, Laboratorio de lenguaje natural y procesamiento de texto, Centro de
investigación en computación, Instituto Politécnico Nacional de México
• Generador de los grafos conceptuales a partir del texto en español, Centro de investigación en
computación, Instituto Politécnico Nacional de México, Macario Hernández Cruz
• Procesamiento del lenguaje Natural en recuperación de la información, Paula Andrea Benavides
Cañón, Sandra Rodríguez Correa, Universidad de la Salle, Colombia, Sistemas de Información y
Documentación
• Libro Blanco de las Tecnologías del Habla, Antonio Rubio Ayuso, Inmaculada Hernáez Rioja
• Procesamiento de Lenguaje Natural Robusto, Andrés T. Hohendahl, Laboratorio de Estereología y
Mecánica Inteligente, Facultad de Ingeniería, UBA, IIBM (Instituto de Ingeniería Bio Médica), Facultad
de Ingeniería, UBA.
• Procesamiento del lenguaje natural, F. J. Martín Mateos, J. L. Ruiz Reina, Dpto. Ciencias de la
Computación e Inteligencia Artificial, Universidad de Sevilla
• TESIS DOCTORAL Adquisición y representación del conocimiento mediante procesamiento del lenguaje
natural, Milagros FERNÁNDEZ GAVILANES, Dr. Manuel VILARES FERRO, Dr. Éric VILLEMONTE DE LA
CLERGERIE, Universidad de Coruña
• Técnicas de Procesamiento del Lenguaje Natural en la Recuperación de Información, Pablo GAMALLO
OTERO y Marcos GARCÍA GONZÁLEZ, Centro de Investigación sobre Tecnoloxías da Lingua (CITIUS)
Universidade de Santiago de Compostela
• Optimización Global de Coherencia en la desambiguación de las palabras, Sulema Torres Ramos,
Instituto Politécnico Nacional, Centro de Investigación en Computación, Laboratorio de lenguaje natural
• Nuance • Agnitio • Daedalus
• Verbio • Indisys • Voicebase

38
Como complemento al trabajo de análisis e investigación, se ha contado con la visión de
los siguientes expertos en la materia:
• Alfonso Hernández Gómez, Profesor Titular de Universidad integrado en el Departamento de señales,
sistemas y radiocomunicaciones de la Universidad Politécnica de Madrid, Grupo de Procesado de
señales (GAPS)
• L. Alfonso Ureña López, Presidente de la Sociedad Española para el Procesamiento del Lenguaje
Natural ( SEPLN) y Profesor de la Universidad de la Jaén
• José Manuel Pardo Muñoz, Jefe de Grupo de GTH Speech Techonology Group
• Juan Ignacio Godino Llorente, Catedrático de Universidad Politécnica de Madrid, Director Proyecto de
I+D+i: Plataforma existente Medivoz
• Paloma Martínez Fernández, Profesora Titular del Departamento de Informática de la Universidad
Carlos III de Madrid y responsable del Grupo de Bases de Datos Avanzadas
• Sinuhé Arroyo, CEO & Founder en Taiger
• José Alcázar, Jefe de servicio de Neumología en Hospital Quirón
• Rubén San Segundo, Profesor asociado en el Departamento de Ingeniería Electrónica (DIE) de la ETSIT,
UPM
• Javier Ortega-Garcia, fundador y co-director del Grupo de Reconocimiento Biométrico - ATVS de la
Universidad Autónoma de Madrid
• Joaquín Gonzalez-Rodriguez, fundador y co-director del Grupo de Reconocimiento Biométrico - ATVS de
la Universidad Autónoma de Madrid

39

También podría gustarte