producen colectivamente un modelo de mquina-aprendizaje sin agregacin de datos.
El aprendizaje automtico, en el que los ordenadores aprendan nuevas habilidades mediante la bsqueda de patrones en los datos de entrenamiento, es la base de la mayora de los recientes avances en la inteligencia artificial, los sistemas de reconocimiento de voz a los coches de auto-estacionamiento. Es tambin la tcnica que los robots autnomos suelen utilizar para construir modelos de sus entornos. Ese tipo de construccin de modelos se complica, sin embargo, en los casos en los que grupos de robots trabajan como equipo. Los robots pueden haber reunido informacin que, colectivamente, se producen un buen modelo, pero que, de forma individual, es casi intil. Si las restricciones sobre el poder, la comunicacin, o la computacin significa que los robots no pueden poner en comn sus datos en un solo lugar, cmo van a construir colectivamente un modelo? En la incertidumbre en conferencia de Inteligencia Artificial en julio, los investigadores del Laboratorio del MIT para la informacin y la toma de Sistemas respondern esa pregunta.Presentan un algoritmo en el que los agentes distribuidos - como robots que exploran un edificio - recoger datos y analizarlos de forma independiente. Las parejas de agentes, como los robots que pasan el uno al otro en el pasillo, a continuacin, analiza el intercambio. En experimentos con varios conjuntos de datos diferentes, algoritmo distribuido de los investigadores en realidad super a un algoritmo estndar que funciona en los datos agregados en un solo lugar. "Un solo equipo tiene un problema de optimizacin muy difcil de resolver con el fin de aprender un modelo a partir de un nico lote gigante de los datos, y puede quedar atrapado en malas soluciones", dice Trevor Campbell, un estudiante graduado en la aeronutica y astronutica en el MIT, que escribi el nuevo papel con su asesor, Jonathan Cmo, el Richard Cockburn Maclaurin profesor de Aeronutica y Astronutica. "Si trozos ms pequeos de datos son primero procesados por los robots individuales y luego se combinan, el modelo final es menos probable que se atascan en una mala solucin." Campbell dice que la obra fue motivada por preguntas sobre la colaboracin robot. Pero tambin podra tener implicaciones para los grandes datos, ya que permitira a los servidores distribuidos de combinar los resultados de su anlisis de los datos, sin agregacin de los datos en una ubicacin central. "Este procedimiento es completamente slida a casi cualquier red que se pueda imaginar", dice Campbell. "Es en gran medida un algoritmo de aprendizaje flexible para redes descentralizadas." Problema a juego Para tener una idea del problema Campbell y cmo resolver, imaginar un equipo de robots que exploran un edificio de oficinas desconocido. Si su algoritmo de aprendizaje es lo suficientemente general, ellos no tienen ninguna nocin previa de qu es una silla o una mesa, por no hablar de una sala de conferencias o una oficina. Pero podran determinar, por ejemplo, que algunas habitaciones contienen un pequeo nmero de objetos en forma de silla-junto con aproximadamente el mismo nmero de objetos en forma de tabla, mientras que otras habitaciones contienen un gran nmero de objetos en forma de silla-junto con una sola tabla- objeto en forma. Con el tiempo, cada robot va a construir su propio catlogo de tipos de habitaciones y sus contenidos. Pero imprecisiones suelen colarse: Un robot, por ejemplo, podra suceder a encontrar una sala de conferencias en la que algn viajero ha dejado una maleta y la conclusin de que las maletas son caractersticas habituales de las salas de conferencias.Otro podra entrar en una cocina, mientras que la cafetera est oscurecida por la puerta de la nevera abierta y dejar la cafetera fuera su inventario de artculos de cocina. Idealmente, cuando dos robots encuentran entre s, se compararan sus catlogos, reforzando las observaciones mutuas y corregir omisiones o generalizaciones. El problema es que no saben cmo hacer coincidir categoras. Tampoco conoce la etiqueta de "cocina" o "sala de conferencias"; slo tienen etiquetas como "habitacin 1" y "sala 3", cada uno asociado a diferentes listas de caractersticas distintivas. Pero la habitacin de un robot 1 podra ser la habitacin de otro robot 3. Con Campbell y el algoritmo de Cmo, los robots tratan para que coincida con las categoras sobre la base de elementos de lista compartidos. Esto se ve obligada a llevar a errores: Un robot, por ejemplo, podra haber deducido que los sumideros y botes de basura a pedal estn distinguiendo caractersticas de baos, otra que se estn distinguiendo caractersticas de las cocinas. Pero hacen todo lo posible, la combinacin de las listas que ellos piensan que corresponde. Cuando uno de esos robots cumple otro robot, realiza el mismo procedimiento, haciendo coincidir las listas lo mejor que pueda. Pero aqu est el paso crucial: A continuacin, se retira cada una de las listas de origen independiente y revanchas a los dems, repitiendo este proceso hasta que no hay resultados de reordenamiento. Lo hace de nuevo con cada nuevo robot que encuentra, construyendo gradualmente modelos cada vez ms precisos. Para Imponer Este procedimiento relativamente sencillo resulta de un anlisis matemtico muy sofisticado, que los investigadores presentes en su papel. "La forma en que los sistemas informticos aprenden estos modelos complejos en estos das es que se postula un modelo ms simple y luego lo utiliza para aproximarse a lo que se obtendra si fueron capaces de hacer frente a todos los matices y complejidades locos", dice Campbell. "Lo que nuestro algoritmo no es una especie de reintroducir artificialmente la estructura, despus de que haya resuelto el problema ms fcil, y luego usar esa estructura artificial para combinar los modelos correctamente." En una aplicacin real, los robots probablemente no acaba de estar clasificando habitaciones de acuerdo a los objetos que contienen: Tambin estaran clasificando los objetos mismos, y probablemente sus usos. Pero procedimiento Campbell y How generaliza a otros problemas de aprendizaje igual de bien. El ejemplo de habitaciones clasificar de acuerdo con el contenido, por otra parte, tiene una estructura similar a un problema clsico en el procesamiento del lenguaje natural llamado modelado tema , en el que un equipo intenta utilizar la frecuencia relativa de las palabras para clasificar documentos de acuerdo al tema. Sera tremendamente prctico para almacenar todos los documentos en la Web en un solo lugar, por lo que un algoritmo de aprendizaje de mquina tradicional podra proporcionar un sistema de clasificacin uniforme para todos ellos. Pero Campbell y el algoritmo de Cmo se entiende que los servidores dispersos podran batir lejos en los documentos en sus propios rincones de la Web y an producir un modelo de tema colectivo. "La computacin distribuida jugar un papel crtico en el despliegue de mltiples agentes autnomos, como los mltiples vehculos terrestres y areos autnomos", dice Lawrence Carin, profesor de ingeniera elctrica e informtica y vicerrectora de investigacin de la Universidad de Duke. "El mtodo variacional distribuido propuesto en este trabajo es computacionalmente eficiente y prctico. Una de las claves para ello es una tcnica para el manejo de la ruptura de simetras que se manifiestan en la inferencia bayesiana. La solucin a este problema es muy novedoso y es probable que se deje sentir en el futuro por otros investigadores ".