Está en la página 1de 11

MIT Research

El aprendizaje de mquinas a travs del lenguaje


EVENTO - 1 3 DE FEBRERO DE 2012 Centro de Innovacin BBVA Ms informacin sobre MIT Research

MIT Research: Aprendizaje de mquinas a travs del lenguaje | 2

Tabla de contenido

Introduccin Razonamiento basado en el sentido comn para los servicios financieros Supuestos de negociacin en las interfaces de lenguaje natural Ms informacin

3 4 8 11

MIT Research: Aprendizaje de mquinas a travs del lenguaje | 3

Introduccin
Henry Lieberman, a la izquierda, Dustin Smith, en el centro, y David Zafrilla a la derecha, minutos antes del inicio del MIT Research: El aprendizaje de las mquinas a travs del lenguaje.

En una interfaz interactiva, es posible que el software deje de ser una simple herramienta y se convierta en un autntico ayudante del usuario? El grupo de software del MIT investiga un nuevo paradigma que puede dar respuesta a este objetivo. Aunque no sea necesariamente tan inteligente como un asistente humano, el software puede aprender de la interaccin con el usuario y anticiparse de forma proactiva a sus necesidades. Las aplicaciones de estos sistemas abarcan mltiples campos, desde la edicin grfica y de texto a la navegacin web, el comercio electrnico o la visualizacin de informacin. Para explicar estos avances, Henry Lieberman , cientfico de Investigacin en el Media Lab del MIT , y Dustin Smith , investigador del laboratorio de Medios, protagonizaron el 13 de febrero una sesin especial sobre inteligencia artificial en el Centro de Innovacin BBVA , dedicada al aprendizaje de las mquinas a travs del lenguaje.

MIT Research: Aprendizaje de mquinas a travs del lenguaje | 4

Razonamiento basado en el sentido comn para los servicios financieros


Henry Lieberman, reconocido cientfico e investigador, durante su exposicin sobre inteligencia artificial y el aprendizaje de las mquinas en Madrid

Henry Lieberman @medialab es cientfico de investigacin en el Media Lab del MIT desde 1987. Sus intereses de investivacin se centran en la interseccin de la inteligencia artificial y la interfaz humana. Actual director del Laboratorio de Software, anteriormente fue investigador en el Laboratorio de Inteligencia Artificial del MIT y escribi el primer mapa de bits y grficos en color para los sistemas de Logo. En la nueva economa, las transacciones online se han convertido en un servicio ms, en especial para la industria financiera. La forma en la que estos servicios financieros se adapten a la vida de los clientes ser clave para su xito a largo plazo. Para poder tomar decisiones inteligentes, los clientes se interesan no solo por las

MIT Research: Aprendizaje de mquinas a travs del lenguaje | 5

opciones a su disposicin, sino que les preocupan las consecuencias de cada accin y, sobre todo, qu sucede cuando algo falla. La relacin banco-cliente se mueve entre dos tipos de objetivos. Por un lado, el cliente tiene una meta vital (por ejemplo, ahorrar la mayor cantidad posible de dinero para pagar antes su prstamo hipotecario). Por otro lado, el banco le ofrece funciones (depsitos, desgravaciones fiscales, prstamos personales) La misin de la entidad financiera debe ser aunar y combinar las metas del cliente con sus productos. Cuando el proceso de eleccin tiene lugar en un sistema automatizado, actualmente se coloca gran parte de la carga directamente en el cliente. Las herramientas de software pueden actuar, no obstante, como asistentes que aconsejen y guen al cliente en la toma de decisiones. El objetivo es reproducir con el software la capacidad de anticipacin que ofrecen los asesores en una sucursal o en un sistema de atencin telefnica. Un buen ejemplo de reaccin anticipatoria es el sistema de voz Siri incorporado en el iPhone 4S. Aunque el grado de fiabilidad an no sea del 100%, se acerca a las intenciones del usuario, un factor clave. Introducir sentido comn en el funcionamiento de los ordenadores es un viejo sueo de la inteligencia artificial. El objetivo es que las mquinas puedan razonar y tomar decisiones en nuestra vida diaria. Los primeros experimentos en este mbito se enfrentaron a importantes obstculos, como la inmensidad del conocimiento humano que habra que abarcar para reproducir este sentido comn, o la poca fiabilidad de parte de este conocimiento debido a la vaguedad de las sentencias, las excepciones, las paradojas lgicas y otros problemas lingsticos. El uso del sentido comn puede mejorar los resultados en la interaccin hombre-mquina por muchos motivos. En primer lugar, el usuario espera una respuesta directa. Si le satisface, seguir utilizando la herramienta; si la respuesta sigue siendo imprecisa despus de varios intentos, dejar de utilizar el sistema por completo. Por otro lado, el sistema debe ser rpido en su respuesta para mantener la

El objetivo es reproducir con el software la anticipacin que ofrecen los asesores en una sucursal o en un sistema de atencin telefnica. Un ejemplo de reaccin es el sistema de voz Siri incorporado en el iPhone 4S.

MIT Research: Aprendizaje de mquinas a travs del lenguaje | 6

sensacin de interactividad (no ms de unos pocos segundos). El grupo de software del MIT ha estado explorando en los ltimos aos el campo de los agentes de interfaz inteligentes. Un agente de interfaz es un programa de inteligencia artificial vinculado a una aplicacin interactiva convencional (editor grfico o de texto, navegador web), que observa las interacciones del usuario y es capaz de operar la interfaz como desea el usuario. La misin del agente puede ser proporcionar ayuda, asistencia, consejos, automatizacin de tareas comunes, adaptacin o personalizacin de la interfaz. La experiencia de los investigadores del MIT con estos agentes de interfaz es que pueden utilizar el conocimiento de sentido comn mucho ms eficazmente de lo que pueden hacer las tradicionales aplicaciones de pregunta-respuesta. Estas nuevas aplicaciones han sido construidas utilizando el conocimiento de Open Mind Common Sense (OMCS), una base de conocimiento de sentido comn que tiene actualmente ms de un milln de afirmaciones del lenguaje natural, construidas a partir de las contribuciones de 20.000 personas a travs de la comunidad web. En este corpus de OMCS se incluyen diversos vnculos de relacin de tipo taxonmico, mernimo (palabra cuyo significado constituye una parte del significado total de otra palabra), temporal, espacial, causal, funcional, etc. En el reconocimiento del discurso oral se ha avanzado mucho, as como en las aplicaciones de texto predictivo. Uno de los aspectos ms complicados es que el conocimiento expresado a menudo en frases simples es, sin embargo, dependiente de un contexto al que no se hace alusin. Por ello, contextualizar el conocimiento y aadir elementos explcitos en cada frase es vital para dotar de sentido a la respuesta. En el caso de las transacciones bancarias, no cubrir las expectativas del cliente puede suponer la destruccin de la relacin con la entidad. Por este motivo, se intenta acercar la programacin al

Introducir sentido comn en el funcionamiento de los ordenadores es un viejo sueo de la inteligencia artificial. El objetivo es que las mquinas puedan razonar y tomar decisiones en nuestra vida diaria.

MIT Research: Aprendizaje de mquinas a travs del lenguaje | 7

comportamiento del usuario final, luchando contra la tradicional desconexin entre las partes. Un camino interesante en este sentido es la integracin de plataformas y aplicaciones (telfono mvil, PC de casa, cloud). Hoy por hoy, los datos deben ser transferidos expresamente por el usuario de un entorno a otro. Pero el usuario no tiene por qu ser un experto sobre las condiciones de cada caso, por lo que lo lgico es facilitarles su intervencin. Los actuales desarrollos en los smartphones son un buen ejemplo. El usuario espera de su entidad rapidez y mltiples opciones sobre las que tomar l la decisin. Por ejemplo, si su tarjeta de crdito ha sido rechazada al intentar comprar un billete de avin, el sistema le puede sugerir distintas opciones y ser el cliente el que elija la ms adecuada a su situacin: solventar el retraso en el pago de la tarjeta, pagar con la American Express en lugar de VISA, pagar en metlico, cancelar el vuelo o coger un tren hasta su destino. La contribucin explcita del usuario resulta muy cara en una interfaz, por lo que el conocimiento de sentido comn puede actuar como un amplificador de esta contribucin, reuniendo hechos y conceptos que amplen el alcance de la aplicacin. El Media Lab del MIT ha sistematizado las bases de conocimiento y el desarrollo de mtodos de razonamiento para el conocimiento del sentido comn, aplicado al conocimiento general de las personas y a las situaciones de la vida cotidiana, a travs de frases sencillas como se necesita un prstamo para comprar una casa. La clave es el vnculo entre el conocimiento de la vida y el conocimiento de los propios servicios financieros. Por ejemplo, Un prstamo de inters variable es ms caro que un prstamo de inters fijo. Las interfaces basadas en iconos y mens ya no bastan. La solucin ahora es construir interfaces orientadas a objetivos, en las que la funcionalidad sea muy rica y su uso resulte muy sencillo. Este tipo de interfaces precisan la incorporacin del conocimiento de sentido comn para hacer que nuestros ordenadores, telfonos mviles y todo tipo de dispositivos sean mucho ms eficientes de lo que lo son hoy al responder a las demandas de los usuarios.

El grupo de software del MIT ha explorado el campo de los agentes de interfaz inteligentes: usan el conocimiento de sentido comn con ms eficacia que las tradicionales aplicaciones de pregunta-respuesta.

MIT Research: Aprendizaje de mquinas a travs del lenguaje | 8

Supuestos de negociacin en las interfaces de lenguaje natural


El joven investigador del MIT Dustin Smith, en un momento de su intervencin en el Centro de Innovacin BBVA

Dustin Smith @medialab es estudiante de doctorado en el Laboratorio de Medios. Investiga las relaciones entre la planificacin y el procesamiento del lenguaje natural, con Henry Lieberman y Marvin Minsky como asesores.Su objetivo a largo plazo es lograr que los ordenadores entiendan ingls con una capacidad funcional similar a las personas. La investigacin que desarrolla Dustin Smith abarca diversas reas acadmicas: la lectura ptica y la comprensin de la historia, las estructuras de eventos y la semntica lxica, el etiquetado de roles semnticos, el aprendizaje de relaciones estadsticas, minera de secuencias, el reconocimiento de eventos y la extraccin, planificacin, plan de reconocimiento, la metacognicin y el auto-modelado. Qu es una interfaz natural? Aquella que tiene en cuenta al usuario y la informacin que es importante para l. Siri -asistente de voz del iPhone- y otras interfaces de este tipo reflejan un futuro donde

MIT Research: Aprendizaje de mquinas a travs del lenguaje | 9

En el caso de las transacciones bancarias, no cubrir las expectativas del cliente puede suponer la destruccin de la relacin con la entidad. Por ello, se intenta acercar la programacin al comportamiento del usuario final.

la gente podr interactuar con los ordenadores usando lenguajes naturales. Este tipo de interfaces dan una gran flexibilidad a los usuarios en la toma de decisiones. http://vimeo.com/30119388 Sin embargo, lo que una persona opta por decir y cmo lo dice depende de la informacin que cree que comparte con la audiencia. Es difcil para la gente usar interfaces de lenguaje natural, ya que los usuarios tienen dificultades para predecir qu informacin se comparte con el equipo y cmo la interfaz va a interpretar su texto. Pueden existir (y a menudo, existen) discrepancias en la creencia mutua.

Y es especialmente difcil para la pragmtica de los supuestos, ya que muchas veces debe ir ms all de la informacin contenida en la superficie que figura en el texto. Los problemas de incomprensin pueden venir de la vaguedad e imprecisin de la informacin, de la prdida de parte de los datos, de la ambigedad Si el cliente, por ejemplo, especifica en una interfaz que quiere invertir dinero y el sistema le responde Cul es tu tolerancia al riesgo?, puede producirse una falta de entendimiento si no comparten los mismos conceptos. Lo mismo ocurre con la vaguedad de un aseveracin: el cliente plantea necesito un prstamo para una casa de 300.000 , y el sistema responde cunto dinero necesitas exactamente?; una pregunta para la que el cliente seguramente no tendr respuesta exacta. Las creencias mutuas son conceptos representados en nuestra mente. Si un grupo de personas cree mutuamente algo, cada individuo lo creer. En la construccin de interfaces inteligentes, la flexibilidad es clave. Si el usuario humano no sabe el concepto, la mquina debe tener capacidad para enserselo (mediante analogas, por ejemplo).

MIT Research: Aprendizaje de mquinas a travs del lenguaje | 10

Si es la interfaz la que carece de un concepto, debe permitir que sea el usuario el que navegue y ample el conjunto de referentes. Las interfaces de lenguaje natural y la manipulacin directa son complementarias, no tienen por qu excluir una a la otra.
Henry Lieberman y Dustin Smith, en el Palacio de Santa Brbara, sede del Centro de Innovacin BBVA en Madrid

Siempre que sea posible, lo comn debe ser la posibilidad que aparezca por defecto y, adems, el sistema debe estar preparado para revisar los supuestos a la luz de cualquier nueva informacin. Para combatir la ambigedad lxica y la polisemia, el contexto es clave, ya que las composiciones sintcticas y semnticas estn limitadas por las situaciones en las que se producen. En el Laboratorio de Medios han construido una interfaz de calendario que permite a los usuarios comunicar en ingls descripciones de los eventos e interactuar con los supuestos que hizo el equipo al tratar de comprenderle. Los fallos de comunicacin son oportunidades para reconocer y modificar los supuestos. Permiten a los usuarios interactuar con representaciones visuales del significado del texto, revisar qu supuestos se aplicaron y sugerir o modificar los supuestos existentes. La manipulacin directa ampliando y combinando informacines por tanto complementaria a las interfaces de lenguaje natural. Debemos esperar fallos de comunicacin y ser capaces de revisar rpidamente los supuestos para adaptarlos al nuevo contexto.

la web
y en nuestros canales...

ms en
twitter facebook youtube

flickr

slideshare

linkedin

storify

Ms informacin

Ms informacin