Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Vigilancia
Tecnológica
Programa de
Procesamiento Excelencia en
del Lenguaje Contenidos
Natural Digitales y
Economía Digital
Actualizado a
Septiembre de 2015
Índice
General
1. Introducción
4. Agentes clave
5. Patentes
6. Iniciativas de interés
7. Fuentes de información
1. Introducción
La información es el recurso más importante que poseemos los seres humanos. Gran parte de esta
información se comunica, almacena y maneja en forma de lenguaje natural, en sus diferentes formas.
En la actualidad, podemos obtener grandes volúmenes de información en forma escrita, ya sea de manera
impresa o electrónica. Los ordenadores son una herramienta indispensable para el procesamiento de la
información plasmada en los textos, ya que son capaces de manejar grandes volúmenes de datos. Sin
embargo, un ordenador no puede hacer todo lo que las personas normalmente hacemos con el texto, por
ejemplo, responder preguntas basándose en la información proporcionada, hacer inferencias lógicas sobre
su contenido, o elaborar un resumen de esta información.
El esfuerzo que la Ciencia invierte hoy en día para contrarrestar esta situación se denomina procesamiento
de lenguaje natural, procesamiento de texto, tecnologías de lenguaje o lingüística computacional. El lenguaje
humano es complejo, multiforme y rico en expresiones, pero a la vez puede ser ambiguo y requerir
interpretación de acuerdo al contexto, al momento y la intención del hablante. El lenguaje formal o artificial,
por el contrario, se diseña con una finalidad concreta, es restringido en su sintaxis y en su semántica, por ello
es más preciso, con menos espacio para la libre interpretación y libre del contexto.
El Procesamiento del Lenguaje Natural (PLN) es una rama muy importante de la Inteligencia Artificial y una
de las más antiguas. Las primeras traducciones automáticas se iniciaron en la década de los 40 con la II
Guerra mundial. Sin embargo, como consecuencia de la escasa potencia de los ordenadores los intentos
fracasaron, pero a pesar de ello, a partir de la década del 60 el procesamiento de lenguaje natural resurgió
nuevamente.
4
Niveles del Procesamiento de Lenguaje Natural
El Procesamiento de Lenguaje Natural (PLN) tiene por objetivo habilitar a los ordenadores para que
entiendan el texto, procesándolo por su sentido. Para llevar a cabo esta tarea, un sistema de procesamiento
de lenguaje natural necesita conocer la estructura del lenguaje, la cual se analiza normalmente en 4 niveles:
1. Nivel Morfológico::Se estudia cómo se construyen las palabras. Detecta las relaciones que se
establece entre las unidades mínimas que forman una palabra (sufijos, prefijos) y la relación con el
léxico, siendo éste un conjunto de información sobre cada palabra que el sistema utiliza para el
procesamiento.
A continuación se muestra un ejemplo de análisis morfológico para la oración “Un gato negro caza un ratón
blanco”:
2. Nivel Sintáctico: Se estudia cómo combinar las palabras para formar oraciones. Su función es
asignar etiquetas a cada uno de los componentes que aparecen en la oración a analizar, de manera
que se sepa cómo se combinan las palabras y forman estructuras gramaticales correctas.
Existen dos enfoques para describir formalmente la gramaticalidad de las oraciones: los constituyentes y las
dependencias:
5
b) El enfoque de dependencias consiste en el establecimiento de la relación entre pares de palabras, una
de ellas tiene el rol de rectora y la otra el rol de dependiente o subordinada, obteniendo como resultado
una estructura jerárquica, el árbol de dependencias, donde la única palabra que no tiene rectora es la
raíz del árbol, tal y como se muestra a continuación:
Existen varias formas de representación formal semántica de las oraciones, tales como las siguientes:
Lógica de primer orden
Redes semánticas
Grafos conceptuales
Ésta es la cadena de análisis ideal con los cuatro niveles, que sin embargo no se corresponde con la
realidad, dado que la mayoría de los sistemas no van más allá del análisis sintáctico.
6
2. Aplicaciones del Procesamiento
del Lenguaje Natural
Las principales aplicaciones prácticas del Procesamiento de Lenguaje Natural (PLN) son las siguientes:
Minería de datos
Corrección ortográfica
Síntesis de voz
Sistemas de diálogo
Reconocimiento de voz
Análisis de sentimientos
Traducción automática
1 Minería de datos
La minería de datos es la extracción no trivial de información que reside de manera implícita en los datos. En
este concepto se engloba un conjunto de técnicas encaminadas a la extracción de conocimiento procesable,
implícito en las bases de datos. Las bases de la minería de datos se encuentran en la inteligencia artificial y
en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda
la solución a problemas de predicción, clasificación y segmentación.
La minería de datos proporciona potentes herramientas para descubrir patrones ocultos y relaciones en
datos estructurados. Este proceso asume que los datos se encuentran almacenados en un formato
estructurado. Por ello, su pre-procesamiento consiste en la limpieza y normalización de los datos, y la
generación de numerosos enlaces entre las tablas de las bases de datos.
8
2 Sistemas de búsqueda de respuesta
En Internet existe infinidad de documentos que contienen todo tipo de información, falsa y verdadera. La
información no se encuentra bien distribuida en la red y encontrarla se hace difícil. Los buscadores
tradicionales aún no entienden completamente qué necesita el usuario a pesar de haberse incorporado
técnicas como el reconocimiento semántico. Mediante la implementación de las técnicas semánticas las
búsquedas de información en Internet hoy en día son superiores a las de tres años atrás, de manera tal que
el buscador parece comprender más de lo que el usuario “humano” necesita.
Los sistemas de búsqueda de respuesta son sistemas diseñados para formular una pregunta en lenguaje
natural y proporcionar una respuesta. De esta manera los usuarios no tienen que navegar y leer una o varias
páginas de resultados de búsqueda.
Estos sistemas se construyen sobre motores de búsqueda y requieren contenido como fuente para descubrir
las respuestas. Deben tener métodos para entender las preguntas del usuario y determinar el tipo de
respuesta que debe dar, generar una búsqueda significativa de la consulta, y finalmente calificar los
resultados obtenidos.
De estos tres problemas el más difícil de enfrentar es determinar el tipo de respuesta. Para hacerlo se
realizan tres pasos: entrenamiento, fragmentación y determinación del tipo de respuesta.
Para construir un sistema de respuestas se necesita aplicar técnicas como: Recuperación de Información,
Extracción de Información con algoritmos de reconocimiento de entidades y etiquetado, comparación de
secuencias de caracteres, etc.
3 Corrección ortográfica
La corrección ortográfica es una de las aplicaciones del procesamiento de lenguaje natural de mayor uso
cotidiano. La aplicación está continuamente analizando el texto, y avisa de los errores normalmente
subrayando la palabra en rojo.
Los primeros correctores ortográficos eran muy simples: contaban con un corpus léxico del idioma a
analizar, y si una palabra no estaba en el mismo, era considerada como errónea. Con el tiempo, los
algoritmos fueron evolucionando y aparecieron los primeros correctores ortográficos que mostraban
sugerencias cercanas a la palabra mal escrita. Los siguientes avances fueron encaminados a encontrar
errores sintácticos y/o de concordancia de género y número.
Actualmente, los correctores automáticos han dado un salto más allá de los procesadores de texto, de tal
forma que podemos encontrarlos en multitud de aplicaciones: los navegadores web incorporan un corrector
para los contenidos introducidos por el usuario, los propios sitios web de edición de blogs, contenidos wiki y
los clientes de mensajería instantánea hacen uso de esta tecnología.
9
4 Síntesis de voz
La síntesis de voz tiene como objetivo transformar, de forma automática, cualquier texto en una locución
auditiva lo más semejante posible al habla de un humano. A un sistema capaz de producir dicha salida se le
conoce como sintetizador de voz o Text-To-Speech (TTS).
Un sistema de TTS recibe como entrada una cadena de texto en un idioma determinado, la analiza y
procesa, dando como resultado una salida auditiva que contiene una locución verbal que representa al texto
de entrada.
Durante la etapa de análisis se realizan multitud de operaciones: la normalización del texto, la pronunciación
o el cálculo de la prosodia (velocidad, tono, duración, etc.). A la hora de generar la salida auditiva, se necesita
un modelo de lenguaje y de información fonética del mismo.
Estos sistemas son muy utilizados en los sistemas de avisos automáticos de aeropuertos, estaciones de
autobuses y ferrocarriles, sistemas telefónicos de atención al cliente, dispositivos móviles y GPS, etc. Fuera
del ámbito comercial, se emplean en aplicaciones educativas y en los sistemas para personas con
discapacidades visuales.
5 Sistemas de diálogo
Los sistemas de diálogo persiguen el objetivo de que un humano pueda conversar con un sistema
informático con la misma naturalidad con la que conversa con otro humano.
Entre los problemas que debe tratar el propio gestor del diálogo se encuentran: el contexto del discurso, el
tipo de estrategia de diálogo (colaborativa, proactiva, ...), la elipsis, las construcciones anafóricas, etc.
Desarrollar un sistema de diálogo robusto y eficaz puede considerarse una de las tareas más complejas
dentro del procesamiento de lenguaje natural. Esta dificultad se debe fundamentalmente a dos factores. En
primer lugar, es una de las tareas más jóvenes y por tanto con menos años de investigación y experiencia a
sus espaldas. En segundo lugar, un gestor de diálogo por sí solo no tiene utilidad práctica; necesita
integrarse con otros módulos típicos como el reconocedor de voz, el sistema Text-To-Speech (TTS), o el de
generación de lenguaje natural. En definitiva, el éxito de un sistema de diálogo no depende sólo del módulo
que gestiona el diálogo en sí, sino de la perfecta armonía entre sus componentes. Los sistemas de diálogo
han proliferado mucho en los últimos años. Cada vez es más fácil encontrarlos en forma de asistentes
virtuales en distintos portales web con una misión orientativa de cara al usuario. Probablemente
encontremos en los próximos años nuevos asistentes dedicados a tareas más complejas: gestionar una cita
médica, comprar billetes de tren o avión, tienda virtual, etc.
10
6 Reconocimiento de voz
El reconocimiento de voz puede definirse como el proceso inverso a la síntesis de voz. Este sistema recibe
como entrada una locución de audio y genera como salida una cadena de texto que transcribe dicha
locución.
Los sistemas comerciales de reconocimiento de voz están siendo muy utilizados en aplicaciones telefónicas:
agencias de viajes, reserva de billetes/entradas, atención al cliente, información, etc. En los últimos años, se
han incorporado también a los dispositivos móviles, entornos domóticos, teleasistencia y vehículos militares.
Se trata de una disciplina relativamente joven respecto al resto, si bien su tecnología todavía se encuentra
en intenso desarrollo.
Hoy día suelen emplearse en dominios cerrados, ya que existen dificultades al enfrentarse a dominios
abiertos, habla espontánea o ruido ambiental.
7 Análisis de sentimientos
El análisis de sentimientos en textos es la identificación y extracción de información subjetiva. También
denominado “minería de opiniones”, este proceso involucra el uso de herramientas de procesamiento de
lenguaje natural y software de análisis de textos para automatizar el proceso.
La forma básica de análisis es una clasificación polarizada de sentimientos que asigna calificaciones en un
rango de -10 a 10, basadas en el aprendizaje para evaluar emociones positivas y negativas en corpus
etiquetados de entrenamiento.
Las técnicas avanzadas analizan gramaticalmente y descomponen la oración. Se usan reglas gramaticales
para extraer inferencias. El motor de reglas se aplica varias veces para transformar el texto etiquetado en
oraciones que definen la asociación entre una palabra y una parte del habla con un sentimiento calificado.
Para la implementación se utilizan herramientas para etiquetar y una base de datos con claves y frases con
evaluaciones de polaridad de emociones. Esta información proviene de fuentes etiquetadas o por
aprendizaje en corpus.
Existen actualmente dos fuentes de datos disponibles : HDCUS y elWordNet-Affect. También existen librerías
de código abierto como Gate, Balie, Mallet.
Uno de los grandes campos de aplicación es en la web. Las empresas bucean en estos medios para estudiar
el mercado, obtener ideas para lanzar nuevos productos o recoger feedback sobre los clientes en base a sus
comentarios.
11
8 Generación de resúmenes automáticos
La generación automática de resúmenes consiste en crear una versión más reducida de un texto donde se
condense la información más importante. Normalmente estas aplicaciones realizan un análisis iterativo del
texto de entrada de forma que van remarcando las partes que se consideren relevantes.
El resumen vendrá determinado por aspectos tales como el tipo del documento (noticia, ensayo, etc.), el
estilo de redacción del texto, su longitud o incluso el tipo de expresiones utilizadas.
Por abstracción: Consiste en parafrasear el texto original en unas pocas líneas, es decir, realizar una
explicación no literal para hacerlo más claro, conciso e inteligible.
Generalmente, los humanos realizan resúmenes de tipo abstractivo, mientras que la mayoría de las
herramientas comerciales generan resúmenes de forma extractiva.
Un problema común es la existencia de múltiples documentos sobre un mismo tema, en este caso se habla
de resúmenes a nivel de colecciones de documentos, que agrupan o separan los documentos por tópicos y
destacan las similitudes y diferencias de la información contenida en ellos. Los contenidos se relacionan
entre ellos en un sentido semántico: cubren el mismo tópico, tienen similares categorías semánticas o
conceptos estrechamente relacionados.
Las herramientas comerciales para la generación de resúmenes automáticos se pueden instalar en equipos
propios o ejecutar de manera online en Internet. Algunas de las herramientas instalables son Copernic
Summarizer y Microsoft Office Word, mientras que entre las herramientas online se encuentran Svhoong
Summarizer, Pertinence Summarizer, Tool4noobs Summarizer y Open Text Summarizer.
12
9 Traducción automática
La traducción automática consiste en convertir un texto de un idioma a otro manteniendo el significado,
por medio de un ordenador y sin intervención humana. Se trata de la disciplina que más ha contribuido en
el desarrollo de la lingüística computacional, al ser la tarea que da origen al procesamiento del lenguaje
natural como tal.
Las herramientas actuales consiguen un alto grado de fiabilidad, si bien todavía no puede prescindirse
totalmente de la posterior revisión humana. Es posible conseguir mejores resultados pero rescindiendo la
traducción a dominios limitados.
Sistemas interlingua: Estos sistemas conocen todas las características y todas las distinciones de
todos los idiomas. Para realizar una traducción, se usa un analizador para convertir el texto en
idioma fuente al interlingua, y un generador que convierte el texto interlingua al idioma destino.
Estos sistemas están en fase de laboratorio o se utilizan para aplicaciones muy restringidas, debido
a los problemas prácticos que presentan el diseño y la implementación de una interlingua eficaz.
A pesar de los avances tecnológicos, existen diversos retos en la traducción, especialmente entre
lenguajes con distinto orden de palabras y una morfología compleja. La investigación en esta área se dirige
a la exploración de métodos de aprendizaje avanzado en modelos estadísticos de traducción, modelos
sintácticos y sus representaciones, datos paralelos para entrenamiento de modelos estadísticos,
integración de traducción del habla con otras aplicaciones como reconocimiento de voz y traducción
automática.
13
10 Recuperación y extracción de información
La recuperación de información es el proceso de encontrar en un repositorio grande de datos, material
(usualmente documentos) de naturaleza no estructurada (usualmente texto) o semiestructurada (páginas
Web, por ejemplo), que satisfaga una necesidad de información. Los datos no estructurados no tienen un
esquema claro, no están listos para procesar y son lo opuesto a los datos con un esquema estructurados
como los que se encuentran en bases de datos. Los datos semiestructurados están en documentos
esquema estructurados, con marcas explícitas como el código HTML.
La información encontrada debe ser pertinente y relevante: La relevancia es la medida de cómo una
pregunta se ajusta a un documento, mientras que la pertinencia es la medida de cómo un documento se
ajusta a una necesidad informativa.
Una de las primeras aplicaciones prácticas de los sistemas de recuperación de información fueron los
catálogos digitales, muy utilizados en organismos con gran cantidad de documentos como las
Administraciones Públicas o las bibliotecas. Éstas permitían a los usuarios realizar búsquedas rápidas sobre
criterios típicos como título, autor o año de publicación. Estas aplicaciones obtuvieron una gran aceptación;
sin embargo, estos sistemas obtendrían el impulso definitivo con el auge de Internet. Buscadores como
Yahoo! o Google representan un gran avance, especialmente en el modo en que nos han facilitado el acceso
a las distintas fuentes de conocimiento, siendo la primera opción a la que se acude para las necesidades de
información.
Cálculo de pesos: Asignación a cada uno de los términos de un valor numérico (peso) que representa
su importancia a la hora de representar el contenido de un documento.
Indexación: Creación de un índice que facilite el acceso a los documentos que contengan los términos
que los representan.
Una vez que se ha logrado acceso a los contenidos buscados y se tiene control sobre los datos, en muchas
aplicaciones se hace necesario el siguiente proceso que es el de extracción de la información, que consiste
en la obtención de las partes que interesan en el texto para pasarlas a un formato de base de datos, es
decir, a un formato estructurado.
En general, los sistemas de extracción de información son útiles si la información a ser extraída está
especificada explícitamente; el documento puede resumirse con un número pequeño de plantillas; o la
información que se necesita está incluida completamente en el texto.
14
3. Futuro del Procesamiento del
Lenguaje Natural
Desde sus orígenes, la investigación en Procesamiento del Lenguaje Natural (PLN), ha
estado fuertemente guiada por una tendencia hacia el tratamiento de la lengua inglesa.
Sin embargo, cada vez más, los grupos de investigación españoles desarrollan sus
investigaciones para el español.
Los principales problemas detectados para el procesamiento del lenguaje natural son los
siguientes:
Por ello, las principales líneas de investigación en el área de Procesamiento del Lenguaje
Natural son las siguientes:
Tratamiento Tratamiento
semántico sintáctico
Análisis semánticos robustos. Gramáticas para el
Categorización semántica y clasificación reconocimiento del Lenguaje.
de textos. Análisis sintáctico robusto.
Construcción de ontologías lingüísticas. Análisis sintáctico superficial
(chunkers).
16
4. Agentes Clave
Red Temática en Tecnologías del Habla
La Red Temática en Tecnologías del Habla se creó en el año 2001, con el propósito de agrupar a todos los
agentes en el ámbito español relacionados con las Tecnologías del Habla.
Se trata de un foro común donde los investigadores en Tecnología del Habla pueden aunar esfuerzos y
compartir experiencias, con el fin de:
Atraer inversiones para investigación de las empresas hacia las Tecnologías del Habla, mediante la
búsqueda de nuevas aplicaciones que ofrezcan nuevas posibilidades de negocio, a través de las
siguientes actividades:
o Financiación para la realización de prototipos y demostraciones que permitan mostrar a las
empresas estas nuevas aplicaciones y el potencial de investigación en Tecnologías del Habla.
o Foros de debate en los que intervengan investigadores y directivos de las empresas interesadas.
18
Sociedad Española para el
Procesamiento del Lenguaje Natural
Asociación científica sin ánimo de lucro, formada por socios numerarios e instituciones, creada en el
año 1984, con el objeto de promover y difundir todo tipo de actividades referentes a la enseñanza,
investigación y desarrollo en el ámbito del procesamiento del lenguaje natural, tanto a nivel nacional
como internacional.
Además de entidades aglutinadoras de conocimiento, tales como la Red Temática en Tecnologías del Habla
y la Sociedad Española para el Procesamiento del Lenguaje Natural, cabe destacar los principales grupos de
investigación en este campo a nivel nacional.
La investigación en traducción automática es muy activa, tanto por el número de grupos que se dedican a
este tema como por la actividad en cuanto a congresos, talleres y asociaciones específicas sobre el mismo.
La Unión Europea mantiene un sistema de financiación de nuevos proyectos relacionados con las
tecnologías del lenguaje, y en particular con la traducción automática, que ha permitido que universidades y
empresas compartan sus conocimientos y combinen sus intereses académicos y comerciales, para
desarrollar y comercializar nuevos productos de traducción automática.
PR & Speech Technologies. Universidad del País Vasco CLiC, Centre de llenguatge i Computació. Universidad de Barcelona
Grupo de Tratamiento del Habla AhoLab. Universidad del Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP)
País Vasco/ Euskal Herriko Unibertsitatea Universitat Politècnica de Catalunya
Grupo de Investigación en Procesamiento Digital de la Señal
Grupo IXA. Universidad del País Vasco (GPDS). Enginyeria i Arquitectura La Salle. Universitat Ramon Llull
Dpto. de Física Aplicada Universidad de
Grupo SPPB. Universidad de Barcelona
Santiago
Grupo de Tratamiento de Señal. Escola Universitària Politècnica de
Mataró
Grupo de Teoría de la Señal. Universidad
de Vigo Grupo de Tecnologías de las Comunicaciones. Universidad
Seminario de Lingüística Informática. de Zaragoza
Universidad de Vigo
Aprendizaje Computacional, Reconocimiento Automático y Traducción
Automática. Universidad Jaume I
Grupo ECA-SIMM. Universidad de Valladolid Grupo de Percepción del Habla.
Grupo PRHLT (Pattern Recognition and Human Language Technology Group. Grupo
Grupo de Aplicaciones del Procesado de Señales: de Reconocimiento de Formas y Tecnología del Lenguaje de la Universitat Politècnica
Área Procesamiento del Lenguaje Natural. de València).
Universidad Politécnica de Madrid. Grupo de Procesamiento del Lenguaje Natural. Universidad Politécnica de Valencia.
Grupo de Procesado de Voz y Señales (subgrupo del grupo de investigación de Programación Lógica e Ingeniería del
Biomédicas- Universidad Politécnica de Madrid. Software).
Grupo de Procesamiento de Lenguaje Natural de Grupo Reconocimiento de Formas e Inteligencia Artificial. Subárea Diálogo.
la UNED. Universidad Politécnica de Valencia.
Grupo SINTONIA: Área Habla-Voz. Universidad
Grupo de Procesamiento del Lenguaje y Sistemas de Información. Universidad de Alicante.
Carlos III de Madrid.
Grupo de Tecnología del Habla, Dpto. Ingeniería Grupo de Investigación: Señales, Telemática y Comunicaciones
Electrónica, Universidad Politécnica de Madrid
Telefónica I+D, División de Tecnología del Habla. Grupo de Neurociencia Cognitiva de
Tecnologías del Habla y Procesado Multimedia. Lenguaje. Universidad de La Laguna
Grupo SINAI. Universidad de Jaén
Universidad Carlos III de Madrid.
Unidad de Psicolingüística Aplicada. Universidad
Grupo de Modelización y Simulación en
Complutense de Madrid.
Psicología. Universidad de Málaga
Fuente: Elaboración propia basada en el Libro Blanco de las Tecnologías del Habla
20
Empresas
A nivel privado, las principales empresas relacionadas con el ámbito del procesamiento del lenguaje
natural son las que se presentan a continuación:
Verbio
Spin-off de la Universidad Politécnica de Cataluña, que apuesta por la automatización de los sistemas de
atención al cliente y por dotar de inteligencia y personalidad a cada uno de los contactos con sus usuarios.
La capacidad de sus soluciones de entender a los usuarios en lenguaje natural y comunicarse con ellos de
forma empática, permiten ofrecer servicios de valor añadido y gran sofisticación, mediante el uso de portales
o asistentes virtuales.
En base a su propia tecnología han desarrollado varias soluciones que se complementan entre ellas para
ajustarse a las necesidades de sus clientes:
Portal de Voz
Speech & Text Analytics
Biometría
Transcripción y Subtitulación
Text to Speech
Speech Recognition
Indisys
Empresa, recientemente adquirida por Intel, dedicada a desarrollar agentes inteligentes que permiten
mantener conversaciones flexibles en múltiples modalidades, idiomas, canales, dispositivos y plataformas.
Tiene por objetivo potenciar la experiencia de los usuarios, a la vez que se reducen costes a nivel
empresarial, con servicios de atención basados en la Inteligencia Artificial y las tecnologías de reconocimiento
de voz y lenguaje natural.
Su software utiliza procesamiento del lenguaje natural y gestión del diálogo, para poder traducir las palabras
del usuario a un lenguaje que la máquina pueda comprender y así decidir cuál es la mejor respuesta.
Otro de sus puntos fuertes es la gestión del diálogo, permitiendo que sus asistentes puedan mantener el hilo
de la conversación, al tener en cuenta el contexto de la misma.
21
Nuance
Empresa especializada en el desarrollo de software de voz para reconocer y emular la voz humana.
Diseñan y proporcionan tecnologías que unen de forma intuitiva al ser humano con la máquina y con el
almacén global de conocimientos, ayudando a las empresas y consumidores a trabajar de forma inteligente.
Su producto estrella es Dragon, el software de reconocimiento de voz más vendido del mundo, que permite
dictar documentos, realizar búsquedas en Internet o enviar correo electrónico, de forma rápida y precisa, con
sólo utilizar la voz.
Agnitio
Líder del mercado mundial en productos de identificación de voz. Es utilizado por las organizaciones
gubernamentales para prevenir el delito, identificar a los criminales y aportar pruebas en los tribunales.
El motor de reconocimiento de Agnitio es capaz de filtrar las características de la voz, así como las huellas
del tracto vocal en ondas de sonido.
Sus clientes utilizan los motores de identificación de voz para autenticar los clientes, identificar a los
defraudadores y proporcionar de una manera simple la identidad en múltiples aplicaciones.
Agnitio fue fundada en 2004 como una spin-off de un grupo de investigación universitario. Su equipo está
formado por expertos en tecnologías de reconocimiento que colaboran con universidades, institutos de
investigación y socios de negocios en todo el mundo. Su sede se encuentra en Madrid, con filiales en EE.UU y
Canadá.
22
Daedalus
Analizar y evaluar el impacto de lo que se dice en todo tipo de medios sociales y tradicionales (redes,
blogs, prensa, radio, TV).
Extraer elementos de significado y contexto de todo tipo de contenidos y conversaciones sociales, para
permitir una publicidad más enfocada y eficaz.
Extraer información de documentos financieros y contenido generado por los usuarios, para mejorar la
toma de decisiones de gestión de riesgos e inversión.
Voice Base
Empresa que ha desarrollado una aplicación capaz de pasar un audio a texto, con la posibilidad de editarlo
fácilmente desde la web.
Se trata de una aplicación gratuita y online, por lo que no es necesaria su descarga. Únicamente es
necesario subir cualquier audio a dicha aplicación online, y ésta lo transcribirá inmediatamente a texto.
Ofrece un editor de texto para corregir cualquier error en su transcripción.
23
5. Patentes
Patentes a nivel nacional
La siguiente tabla muestra información de las patentes registradas en España relacionadas con el ámbito
del Procesamiento del Lenguaje Natural, en concreto se detalla el nombre de la patente, número de
publicación, solicitante, y una breve descripción de la misma:
Método para la utilización de lenguaje natural como interfaz para los Retevisión Movil,
ES2261053 A1
terminales móviles S.A.
Descripción
Método para la utilización de lenguaje natural como interfaz para los terminales móviles, con el objetivo de interactuar
con aplicaciones instaladas en él, así como aplicaciones remotas, facilitando el uso de servicios de telefonía móvil
mediante la voz.
La aplicación del método requiere la instalación en el terminal de una aplicación software que utiliza el propio hardware
del terminal para capturar, preprocesar y codificar el audio a enviar al servidor.
Este método está destinado a facilitar el acceso a las aplicaciones, tanto locales como remotas, a cualquier tipo de
usuario
Descripción
Sistema de interacción para permitir a un usuario de un sistema de información interactuar con el mismo, a través de un
sistema de reconocimiento que permite la interacción por medio de frases generadas por dicho usuario, y procesadas por
el sistema de reconocimiento.
El sistema de interacción comprende al menos un módulo de dominio, donde se definen unas estructuras de frases que
están construidas sobre la base de las clases de objetos, clases de atributos y clases de acciones que son comunes al
dominio de aplicación considerado, con el fin de definir una gramática de frases que están previstas para ser generadas
por el usuario para interactuar con el sistema de información.
Interfaz de usuario interactivo de red que utiliza reconocimiento de voz y One Voice
ES2235508 T3
tratamiento de lenguaje natural Technologies Inc.
Descripción
Un método para interactuar con un objeto de red, que funciona de la siguiente manera: Se recibe una interacción relativa
a un objeto de red desde un usuario; se determina si una tabla de objetos de red está asociada con dicho objeto de red;
se obtiene la tabla de objetos de red asociada si es que existe, se especifican una o más acciones asociadas con dicho
objeto de red; se actualiza un primer archivo de gramática con gramática relativa a dicho objeto de red; se busca el
primer archivo de gramática para otra interacción relativa a un objeto de red recibido desde un usuario; se busca un
segundo archivo de gramática si la correspondencia de frase no es encontrada en el primer archivo gramatical; se busca
una base de datos del lenguaje natural para representar dichas frases y se advierte al usuario de una clarificación en el
objeto de red si no se ha encontrado una correspondencia de entrada en la base de datos de lenguaje natural.
25
Procesamiento del Lenguaje Natural
Descripción
Un método para interactuar con un ordenador utilizando pronunciaciones, comprendiendo el método los pasos de:
Buscar en un primer fichero de gramática una frase de coincidencia para dicha pronunciación
Buscar en un segundo fichero de gramática una frase de coincidencia si dicha frase de coincidencia no ha sido
encontrada en dicho primer fichero de gramática
Buscar en una base de datos de procesamiento de lenguaje natural, una entrada de coincidencia para dicha frase
de coincidencia, representando las entradas frases que son conocidas por la base de datos NLP
Realizar una acción asociada con dicha entrada de coincidencia si dicha entrada de coincidencia es encontrada en
dicha base de datos
Descripción
Resuelve una serie de problemas a la hora de utilizar radicales (indicadores canónicos de significados de palabras) en la
recuperación de textos completos de documentos en lenguaje natural y por tanto permite mejorar la rellamada sin que
por ello sufra la precisión. Utiliza distintos modelos de traductores finitos (fsts) para codificar de manera precisa una serie
de modos deseados para mapear hacia adelante y hacia atrás entre palabras y radicales, teniendo en cuenta tanto los
aspectos sistemáticos del sistema de reglas morfológicas de una lengua como las irregularidades de palabra por palabra
que ocurren. La invención contempla al sistema de recuperación de información como una base de datos y un procesador
para responder a las consultas del usuario, para consultar la base de datos y para obtener respuestas correctas, si existen,
así como métodos para la formación de la nueva base de datos.
Descripción
Aparato de servicios de telecomunicaciones para ser usado con una red de telecomunicaciones móviles, comprendiendo el
aparato unos medios para recibir un primer mensaje de texto desde un teléfono móvil, unos medios para procesar el
primer mensaje de texto recibido con el fin de determinar una dirección de red a partir del primer mensaje de texto
procesado, y unos medios para enviar la dirección de red determinada como segundo mensaje de texto hacia dicho
teléfono móvil o hacia otro teléfono móvil, caracterizado porque los medios de procesado del primer mensaje de texto
recibido comprenden un motor capaz de interpretar lenguaje natural que se puede hacer funcionar, en el caso de que no
se pueda determinar una dirección de red adecuada, para entrar en un diálogo con un usuario de dicho teléfono móvil.
26
Procesamiento del Lenguaje Natural
Descripción
una unidad de tratamiento capaz de interaccionar con una base de datos, comprendiendo la base de datos unas
tablas de datos
una interfaz gráfica de usuario establecida para permitir a un usuario introducir una expresión matemática
un editor de expresión matemática capaz de establecer una representación informática de trabajo de una
expresión matemática en interacción con la interfaz gráfica de usuario,
un diccionario de símbolos el cual, comprende información sobre la estructura de tablas de la base de datos
un editor de condiciones dispuesto para producir una expresión de condición, siendo la expresión de condición
utilizable en combinación con los metadatos para seleccionar un subconjunto de datos de la base de datos
un generador de consultas dispuesto para tratar la representación informática de trabajo para producir una
secuencia de código que ejecuta la expresión matemática de acuerdo con las reglas del lenguaje natural
Descripción
La presente invención está relacionada con los métodos de reconocimiento de lenguaje natural. Se encuadra con aquellos
métodos para la generación de patrones semánticos que posibilitan la organización de la información. Incluye las etapas
de: determinar la categoría gramatical de cada término de un texto, agrupar en grupos las categorías gramaticales,
contabilizar la frecuencia de aparición de cada grupo, establecer un candidato a patrón si la frecuencia de aparición de
un grupo es suficientemente alta, determinar la categoría semántica del candidato a patrón con una taxonomía
predefinida, identificar un patrón cuando el candidato a patrón tenga una categoría semántica asociada.
Descripción
Método para mejorar la presentación de texto a partir de un texto de lenguaje natural legible por máquina basándose en
parámetros específicos del lector, incluyendo como mínimo las dimensiones del campo de visión, que comprende: analizar
sintácticamente de dicho texto signos de puntuación y categorías gramaticales para extraer atributos específicos del
texto; almacenar dichos atributos específicos del texto en relación con las categorías gramaticales para producir un texto
enriquecido; aplicar reglas de terminación primarias seguidas por reglas de terminación secundarias a dicho texto
enriquecido; aplicar reglas de terminación secundaria hasta que se alcanza un determinado límite; aplicar reglas de
desplazamiento horizontal de segmentos de texto a dichos segmentos de texto para determinar un desplazamiento
horizontal para cada segmento de texto; y visualizar dicho texto mejorado mediante una presentación en cascada de
segmentos de texto en líneas descendentes y a lo ancho del dispositivo de visualización.
27
Procesamiento del Lenguaje Natural
Matsushita Electric
Dispositivo de Control Remoto Basado en la Palabra ES2251942 T3
Industrial Co., Ltd.
Descripción
Sistema de mando a distancia que comprende: una caja manual dotada de una interfaz de comunicación por medio de la
cual las instrucciones de mando son transmitidas a un componente remoto; una pantalla de visualización dispuesta en
dicha caja; un micrófono que sirve para recibir mensajes orales de entrada; un sistema analizador de voz acoplado a dicho
micrófono para procesar dichos mensajes orales de entrada ; un fichero de datos históricos de diálogos utilizado para
registrar las conversaciones que han tenido lugar en el conjunto del sistema; una memoria que contiene los datos de
perfiles de usuarios; un administrador de diálogos conectado a dicho sistema analizador de voz , a dicha memoria de datos
de perfiles de usuarios, y a dicha pantalla de visualización para transmitir instrucciones de mando y para presentar la
información en la pantalla de visualización; y un analizador sintáctico de lenguaje natural en comunicación de datos con
dicho sistema analizador de voz
Teliasonera Finland
Provisión de servicios en una red de comunicaciones ES2403014 T3
Oyj
Descripción
Un procedimiento para proporcionar una amplia diversidad de servicios diferentes y combinaciones arbitrarias de servicios
en una red de comunicaciones con al menos un servidor de aplicación que almacena las aplicaciones del servicio,
asignándose a cada una de las aplicaciones de servicio una operación por la cual se arranca la aplicación del servicio, y
terminales de usuario para suministrar peticiones 5 de servicio en lenguaje natural, incluyendo el procedimiento las
etapas de:
interpretar la petición del servicio del usuario y generar una descripción del servicio de formato genérico,
incluyendo la descripción del servicio, los nombres de las funcionalidades que se necesitan para cumplir la petición
de servicio del usuario y los parámetros que requieran dichas funcionalidades.
dividir la descripción del servicio de formato genérico en uno o más elementos, incluyendo un elemento un nombre
de dicha funcionalidad como un tipo y los valores de los parámetros asociados,
analizar los elementos y examinar el tipo de los elementos y mapear dicho tipo a una entidad, indicando las
entidades las llamadas de servicio a realizar y los parámetros relativos a las llamadas de servicio para implementar
las funcionalidades especificadas en la descripción de servicio de formato genérico
28
Procesamiento del Lenguaje Natural
Descripción
Un método para diferenciar automáticamente distinciones significativas de distinciones no significativas de caja alta y
caja baja en una serie de tipos de palabras de entrada de un texto en lenguaje natural por medio de un ordenador,
caracterizado por los pasos de: asignar un tipo de palabra de entrada a uno de una serie de grupos locales separados (LG1,
LG2, LG3, LG4) en base a la caja y a la posición de las letras que constituyan el tipo de palabra de entrada; asignar dicho
tipo de palabra de entrada a uno de una serie de grupos globales separados (GG1, GG2, GG3, GG4) en base a qué
variantes de caja de grupos locales de los tipos de palabras de entrada estén asignados; y normalizar las cajas para dicho
tipo de palabra de entrada de acuerdo con reglas predeterminadas asociadas con el grupo global al que esté asignado
dicho tipo de palabra de entrada.
Uribe-Etxebarria
Método y Aparato para procesar Consultas Continuas No disponible
Jimenez, Xabier
Descripción
Un método para procesar consultas continuas en lenguaje natural recibidas desde un equipo de cliente conectado a un
segundo servidor de aplicación de consultas continuas a través de un primer servidor de aplicación y de una red de
telecomunicaciones; que comprende las etapas de recepción en una unidad de procesamiento de lenguaje natural de
primeros datos de texto ordenados de acuerdo a normas lingüísticas del lenguaje natural de una consulta realizada, para
suministrar segundos datos de texto en un lenguaje intermedio basados en los primeros datos de texto de lenguaje
natural; generación en una unidad de diálogo de terceros datos de texto en lenguaje natural ordenados de acuerdo a
normas lingüísticas del lenguaje natural de un mensaje de respuesta, en función de los segundos datos de texto del
lenguaje intermedio recibidos desde unidad de procesamiento, y emisión del mensaje de respuesta al equipo de cliente a
través de un primer servidor de aplicación y de una red de telecomunicaciones.
Giannetti, Françoise
Pasaporte Intemporal de Identificación ES2475092 T3
Née Rouzaud
Descripción
Procedimiento de realización de un artículo funerario para la identificación y la perpetuación del recuerdo de un difunto,
caracterizado porque comprende esencialmente las etapas que consisten en tomar un elemento en material inalterable
elegido entre las cerámicas cocidas, el vidrio, la piedra, el acero inoxidable, de unas placas primera y segunda en
material inalterable elegido entre las cerámicas cocidas, el vidrio, la piedra, el acero inoxidable, y:
atribuir el citado código único a un difunto y recoger los datos de identificación del citado difunto
disponer el citado elemento previamente marcado con el citado código único con los restos o las cenizas
marcar las citadas placas primera y segunda con el citado código único y marcar la segunda placa con los citados
datos de identificación en lenguaje natural
ensamblar las citadas placas así marcadas con la ayuda de un medio de fijación, para formar un dispositivo de
identificación y de memoria
29
Procesamiento del Lenguaje Natural
Infogation
Sistema de Navegación Móvil ES2346631 T3
Corporation
Descripción
Un método para suministrar un recorrido óptimo utilizando información en tiempo real para un sistema de navegación que
comprende un cliente y un servidor, dicho servidor está acoplado a una red de ordenador, dicho método comprende los
pasos de:
Acceder a información en tiempo real por parte del servidor, la información en tiempo real representa condiciones
actuales relevantes del recorrido propuesto
Calcular el recorrido óptimo por el servidor, basado en información en tiempo real y dichas designaciones de inicio
y fin del recorrido
Dar formato al recorrido óptimo en una descripción genérica en lenguaje natural que va a ser utilizada con una
base de datos local de mapas del cliente con el cliente
Reconstruir el recorrido óptimo por el cliente, a partir de la descripción genérica en lenguaje natural
The Trustees Of
Columbia University
Sistema y Método para Extracción y Codificación de Lenguaje Medico ES2218670 T3
In The City Of New
York
Descripción
En un tratamiento informatizado de datos médicos/clínicos en lenguaje natural que comprende un análisis y una
regularización de la frase, se refiere a parámetros cuyo valor puede precisarse por el usuario. Así, un sistema
informatizado puede volverse polivalente, especialmente para el tratamiento de datos de salida en varios campos. este
sistema tiene, además de un mecanismo de análisis y de regularización, un preprocesador, filtros de salida y un
mecanismo de codificación
30
Procesamiento del Lenguaje Natural
Koninklijke Philips
Sistema de Introducción de Información y Visualización ES2133355 T3
Electronics N.V.
Descripción
Para operar aparatos de usuarios, el usuario con frecuencia tiene que dar entrada a instrucciones operativas complicadas
(por ejemplo la programación de una grabadora de video). Con objeto de dar entrada a un gran número de datos sin una
instrucción, en una forma sencilla para el usuario, el aparato comprende medios para formar sentencias en fases y para
representarlas en un lenguaje natural. En cada fase, los datos a los que ya se ha dado entrada se reproducen, y los
próximos datos a dar entrada se identifican. De esta forma la comunicación con el usuario tiene lugar en un lenguaje
natural, sin que el usuario tenga necesidad de dar entrada a este lenguaje.
Universitat
Método Mejorado de Agrupamiento Espectral por Ordenador y Usos del
No Disponible Politècnica De
mismo
Catalunya
Descripción
Método mejorado de agrupamiento espectral por ordenador y usos del mismo. El método usa un algoritmo de
agrupamiento para dividir datos en una pluralidad de grupos de muestra de modo que las muestras en cada grupo o
agrupamiento tienen similitud máxima entre las mismas y similitud mínima con las muestras en otros agrupamientos,
usando el método implementado de agrupamiento espectral por ordenador al menos dos criterios de similitud o vistas de
datos diferentes para definir al menos dos matrices de similitud y aplicar el algoritmo de agrupamiento a los datos para
cada uno de dichos al menos dos criterios de similitud diferentes y además integrar simultáneamente información relativa
a dicha pluralidad de matrices de similitud a partir de varias vistas de datos en los grupos de muestra resultantes. Los usos
del método mejorado de agrupamiento espectral por ordenador para análisis de procesamiento de señal biomédica, para
análisis de agrupamiento génico, para análisis de visión por máquina, para procesamiento de lenguaje natural y para
análisis de cesta de compra.
Descripción
Procedimiento para la generación de datos de adiestramiento anotados para adiestrar un sistema de comprensión del
lenguaje natural, NLU, que incorpora uno o más modelos, comprendiendo el procedimiento:
La generación de una anotación propuesta con el sistema NLU para cada unidad de datos de adiestramiento no
anotados
La presentación de las anotaciones propuestas para la verificación o la corrección de usuario para obtener una
anotación confirmada por un usuario
31
Procesamiento del Lenguaje Natural
b) Generar una pluralidad de conjuntos de árboles de directorios de análisis sintáctico, relacionada con dicha frase
de entrada utilizando dichas gramáticas
c) Asociar etiquetas con palabras de dicha frase de entrada utilizando dichos conjuntos de árboles de directorios de
análisis sintáctico generados
d) Generar valoraciones de dichas etiquetas basadas en los atributos de dichos conjuntos de árboles de directorios de
análisis sintáctico
e) Seleccionar etiquetas para su uso como representación analizada sintácticamente de dicha frase de entrada,
basándose en dicha valoración generada
Fuente: Elaboración propia basada en la información extraída de la Oficina Española de Patentes y Marcas
32
Patentes a nivel internacional
Según la Global Patent Search Network, existen actualmente 9.355 patentes sobre
Procesamiento del Lenguaje Natural registradas en todo el mundo. La primera de ellas
data del año 1986. El siguiente gráfico muestra el número de patentes que han sido
publicadas anualmente hasta el año 2012:
1.200
1.000
800
600
400
200
0
1989
1996
2003
2010
1986
1987
1988
1990
1991
1992
1993
1994
1995
1997
1998
1999
2000
2001
2002
2004
2005
2006
2007
2008
2009
2011
2012
Fuente: Elaboración propia basada en la información extraída de Global Patent Search Network
7%
19%
8%
12%
33
6. Iniciativas de Interés
Hospital Quirón y Universidad
Apple - Siri
Politécnica de Madrid
El Grupo de Aplicaciones del Procesado de Siri es una aplicación con funciones de
Señales de la Universidad Politécnica de asistente personal para iOS.
Madrid y el Grupo Quirón, trabajan en la
aplicación de técnicas de análisis de voz para la Esta aplicación utiliza procesamiento del
detección de la apnea del sueño. lenguaje natural para responder preguntas,
hacer recomendaciones y realizar acciones,
La investigación está impulsada por el mediante la delegación de solicitudes hacia un
neumólogo José Alcázar Ramírez, y el conjunto de servicios web que ha ido
investigador Luis Hernández Gómez, del Grupo aumentando con el tiempo.
de Aplicaciones del Procesado de Señales.
Entre las cualidades destacadas, Siri es capaz
Para ello, se han recabado grabaciones de voz de adaptarse con el paso del tiempo a las
para analizar la relación entre los preferencias individuales de cada usuario,
condicionantes clínicos del síndrome de personalizando las búsquedas web y la
apneas-hipopneas del sueño (SAHS), y los realización de algunas tareas.
rasgos observados en el proceso de
caracterización del habla de estos pacientes. Siri ofrece interacción conversacional con otras
aplicaciones, tales como los recordatorios,
La experiencia del grupo GAPS en el campo de consulta con el estado del tiempo, la bolsa, el
las tecnologías del habla ha permitido abordar servicio de mensajería, el correo electrónico,
esta labor, adaptando algunas de las técnicas calendario, contactos, notas, música, reloj,
de clasificación utilizadas en el reconocimiento navegador web, Wolfram Alpha y los mapas.
automático del habla y del locutor, al problema
específico de caracterización y clasificación de Es un producto surgido del Centro de
locutores para la detección del SAHS. Inteligencia Artificial de SRI International,
nacido como una rama del proyecto CALO, un
Los resultados obtenidos resultan muy proyecto financiado por DARPA, descrito como
alentadores. Actualmente, en los trabajos "el mayor proyecto de inteligencia artificial
participa el Hospital Quirón de Málaga, pero se creado a la fecha". Las áreas técnicas en las
pretende extender a todos los Hospitales que hace foco primario el proyecto Siri son:
Quirón de España, para demostrar la posible Interfaz Conversacional, Reconocimiento de
influencia del acento local en la Contexto Personal, y Delegación de Servicios.
sensibilidad/especificidad de la prueba.
35
Perldoop
36
7. Fuentes de información
Fuentes de información
A continuación se presentan las principales fuentes de información utilizadas para el
desarrollo del presente documento:
• Aplicaciones de Procesamiento de Lenguaje Natural, Hernández M. Gómez J. Escuela Politécnica
nacional, Facultad de Ingeniería en Sistemas Quito, Ecuador, Universidad de Alicante, Departamento de
Lenguajes y Sistemas Informáticos, Alicante, España
• The Bhiopharmaceutical Challenge, Efficient Innvation, IBM Software. IBM Solutions
• IBM Watson Explorer, Explore, analyze and interpret information for better business outcomes, IBM
Software
• Aplicación de tecnologías de Procesamiento de lenguaje natural y tecnología semántica en Brand Rain
y Anpro 21, Oscar Trabazos, Silvia Suarez, Remei Bori y Oriol Flo
• Diseño e implementación de un sistemas para el análisis y categorización en Twitter mediante técnicas
de clasificación automática de textos, Universidad Carlos III de Madrid, Escuela Politécnica Superior de
Ingeniería Técnica de Telecomunicación: Telemática, Samuel Alcázar Jaén, Luis Sánchez Fernández,
María Luz Congosto Martínez
• Evaluación de las herramientas comerciales y métodos del estado del arte para la generación de
resúmenes extractivos individuales, Griselda Areli Matías Mendoza, Yulia Ledeneva, Rene Arnulfo
García- Hernández, Grigori Sidorov, Universidad Autónoma del Estado de México, Unidad Académica
Profesional Tianguistenco, Laboratorio de lenguaje natural y procesamiento de texto, Centro de
investigación en computación, Instituto Politécnico Nacional de México
• Generador de los grafos conceptuales a partir del texto en español, Centro de investigación en
computación, Instituto Politécnico Nacional de México, Macario Hernández Cruz
• Procesamiento del lenguaje Natural en recuperación de la información, Paula Andrea Benavides
Cañón, Sandra Rodríguez Correa, Universidad de la Salle, Colombia, Sistemas de Información y
Documentación
• Libro Blanco de las Tecnologías del Habla, Antonio Rubio Ayuso, Inmaculada Hernáez Rioja
• Procesamiento de Lenguaje Natural Robusto, Andrés T. Hohendahl, Laboratorio de Estereología y
Mecánica Inteligente, Facultad de Ingeniería, UBA, IIBM (Instituto de Ingeniería Bio Médica), Facultad
de Ingeniería, UBA.
• Procesamiento del lenguaje natural, F. J. Martín Mateos, J. L. Ruiz Reina, Dpto. Ciencias de la
Computación e Inteligencia Artificial, Universidad de Sevilla
• TESIS DOCTORAL Adquisición y representación del conocimiento mediante procesamiento del lenguaje
natural, Milagros FERNÁNDEZ GAVILANES, Dr. Manuel VILARES FERRO, Dr. Éric VILLEMONTE DE LA
CLERGERIE, Universidad de Coruña
• Técnicas de Procesamiento del Lenguaje Natural en la Recuperación de Información, Pablo GAMALLO
OTERO y Marcos GARCÍA GONZÁLEZ, Centro de Investigación sobre Tecnoloxías da Lingua (CITIUS)
Universidade de Santiago de Compostela
• Optimización Global de Coherencia en la desambiguación de las palabras, Sulema Torres Ramos,
Instituto Politécnico Nacional, Centro de Investigación en Computación, Laboratorio de lenguaje natural
• Nuance • Agnitio • Daedalus
• Verbio • Indisys • Voicebase
38
Como complemento al trabajo de análisis e investigación, se ha contado con la visión de
los siguientes expertos en la materia:
• Alfonso Hernández Gómez, Profesor Titular de Universidad integrado en el Departamento de señales,
sistemas y radiocomunicaciones de la Universidad Politécnica de Madrid, Grupo de Procesado de
señales (GAPS)
• L. Alfonso Ureña López, Presidente de la Sociedad Española para el Procesamiento del Lenguaje
Natural ( SEPLN) y Profesor de la Universidad de la Jaén
• José Manuel Pardo Muñoz, Jefe de Grupo de GTH Speech Techonology Group
• Juan Ignacio Godino Llorente, Catedrático de Universidad Politécnica de Madrid, Director Proyecto de
I+D+i: Plataforma existente Medivoz
• Paloma Martínez Fernández, Profesora Titular del Departamento de Informática de la Universidad
Carlos III de Madrid y responsable del Grupo de Bases de Datos Avanzadas
• Sinuhé Arroyo, CEO & Founder en Taiger
• José Alcázar, Jefe de servicio de Neumología en Hospital Quirón
• Rubén San Segundo, Profesor asociado en el Departamento de Ingeniería Electrónica (DIE) de la ETSIT,
UPM
• Javier Ortega-Garcia, fundador y co-director del Grupo de Reconocimiento Biométrico - ATVS de la
Universidad Autónoma de Madrid
• Joaquín Gonzalez-Rodriguez, fundador y co-director del Grupo de Reconocimiento Biométrico - ATVS de
la Universidad Autónoma de Madrid
39