RNA-AP: Redes Neurales Artificiales con Aprendizaje Profundo
Juan C. Vázquez1, Leticia Constable1
Depto. de Ingeniería en Sistemas de Información / Facultad Regional Córdoba / Universidad
Tecnológica Nacional 1 {jcjvazquez, leticiaconstable}@gmail.com
RESUMEN pales de Argentina y Brasil. En estos proyec-
tos se han utilizado redes neurales artificiales Este proyecto se adentrará en las técnicas de de perceptrones multicapa con entrenamiento aprendizaje profundo (Deep Learning) de por retropropagación de errores, con aplica- redes neurales artificiales, que en los últimos ciones a las ciencias sociales, a los negocios y años ha producido importantes avances en la a la ingeniería de software. Inteligencia Artificial a nivel mundial. El aprendizaje profundo ha tenido alto y positivo 1. INTRODUCCIÓN impacto en aplicaciones de reconocimiento de La Inteligencia Artificial como rama de imágenes, pero también ha tenido resonantes estudio dentro de la Informática, ha buscado fracasos debido a que no se entiende con desde sus orígenes lograr un comportamiento claridad su funcionamiento interno. El inteligente de las computadoras mediante gran proyecto intentará, por un lado obtener el cantidad de métodos y técnicas que pueden conocimiento necesario para desarrollar englobarse básicamente en dos estrategias software de experimentación y aplicación, y principales: por otro, entender la teoría subyacente, el por a) El llamado enfoque simbólico, intenta qué esta técnica funciona mejor que las emular la forma en la cual se cree que las anteriores, cuáles son sus bondades y personas piensan, utilizando diversas ver- limitaciones, en qué campos es aplicable y en siones de la Lógica (proposicional, de pre- cuáles no, y en lo posible, hacer algún aporte dicados, rebatible, modal, temporal, difusa, significativo a la teoría. etc.) para especificar hechos y relaciones Palabras clave: redes neurales artificiales, causales entre ellos, que representen la aprendizaje profundo, aplicaciones. realidad en un dominio determinado. Lue- go, a través procesos de inferencia con rí- CONTEXTO gida justificación formal, que usen razo- El proyecto es parte del recientemente con- namiento deductivo (monótono o no monó- formado Grupo GA2LA (Grupo de Investiga- tono) y/o inductivo, se puede interrogar al ción, Desarrollo y Transferencia en Aprendi- modelo del mundo así generado, para ob- zaje Automático, Lenguajes y Autómatas) de tener respuestas inteligentes a los proble- la Facultad Córdoba de la UTN. mas planteados. Básicamente este abordaje Desde el año 2004, en el Laboratorio de In- supone que la inteligencia surge de exten- vestigación de Software del Departamento de sas bases de conocimiento y razonamientos Ingeniería en Sistemas de Información, sede que las utilizan. Los sistemas expertos son de GA2LA, se ha desarrollado una secuencia productos típicos generados por este enfo- de proyectos sobre redes neurales artificiales que. que han generado productos y aplicaciones b) La segunda estrategia suele denominarse que han sido transferidos (muchos de ellos en enfoque sub-simbólico; aquí se engloban cooperación con investigadores de CONI- gran cantidad de teorías, modelos, técnicas CET) a numerosos centros de investigación y herramientas que emulan la forma en que en diversas locaciones en América Latina, a la naturaleza ha resuelto a lo largo de mi- empresas comerciales y a gobiernos munici- lenios los problemas naturales, ya sea si- mulando su método de selección natural de dos capas de neuronas del tipo McCu- (computación evolucionaria, autómatas ce- lloch-Pitts, que se desempeña como clasi- lulares, programación evolutiva, algorit- ficadora de patrones simples. mos genéticos y otros) o modelando ma- 2) La segunda comienza en 1982 con las re- temática y computacionalmente sus solu- des autoasociativas de Hopfield, utilizando ciones más relevantes (sistemas conexio- aprendizaje hebbiano, y por la propuesta de nistas, sistemas inmunológicos, estrategias un algoritmo general de aprendizaje (Ru- de enjambre, etc.). melhart-1986) sobre redes multicapa de Una de las ventajas del enfoque simbólico es perceptrones con propagación unidireccio- que puede explicar cómo arriba a sus nal: la retropropagación de errores (back- conclusiones, lo que en algunos dominios propagation en inglés); intensa actividad como la medicina es de fundamental de investigación y desarrollo siguen a estas importancia para que los usuarios adopten propuestas, generándose gran cantidad de como buenas las soluciones logradas y modelos distintos de neuronas, arquitectu- confíen en ellas. ras de conexionado y métodos de funcio- Dentro del enfoque sub-simbólico, destacan namiento, con aplicaciones más o menos los sistemas conexionistas que emulan la destacadas. arquitectura del sistema nervioso de los 3) La tercera ola, en la cual la comunidad IA animales, y en particular, de su órgano considera que actualmente nos encontra- principal: el cerebro; una inmensa cantidad de mos, surge de estudios realizados por Hin- unidades simples de procesamiento de señales ton y su equipo publicados en 2006 en la (las neuronas) intrincadamente conectadas revista Science, sobre una jerarquía de re- enviándose mensajes y colaborando para presentaciones de datos (desde las de más soportar el pensamiento. Cabe aclarar aquí, bajo nivel morfológico, hasta abstracciones que los modelos matemáticos de las redes de mayores niveles) logradas a través de neuronales que componen el cerebro y sus autocodificadores, que aportan luz sobre partes, son una metáfora muy simplificada del cómo están haciendo su trabajo las RNA complicadísimo mecanismo biológico real, el durante un proceso de reconocimiento de cual aún no termina de comprenderse por imágenes, y que mejoran el comportamien- completo. Se piensa bajo este esquema, que la to del algoritmo de retropropagación de inteligencia es una característica emergente errores enormemente. Estos hallazgos dan de esta complejidad extrema puesta a nacimiento al aprendizaje profundo (Deep funcionar. Learning en inglés), que se consolida como Los modelos de redes neurales artificiales tecnología emergente en el campo de las (RNA) y las técnicas asociadas, se engloban redes neurales artificiales con una serie de actualmente en lo que ha dado en llamarse trabajos del mismo Hinton (hoy en Goo- aprendizaje automático (machine-learning en gle) y de LeCun (hoy en Facebook) que les inglés) e intervienen en muchos dispositivos y valen numerosos premios en competicio- procesos usuales de la sociedad moderna nes de IA a nivel mundial, desde finales de (búsquedas de Internet, teléfonos inteligentes, 2010. traducción automática de lenguaje escrito y A partir de aquí los avances en los últimos hablado, filtrado de contenidos en redes pocos años son tan rápidos, y los éxitos sociales, reconocimiento de imágenes y su obtenidos en igualar capacidades reservadas clasificación, por nombrar solo algunos). hasta ahora solo a los humanos son tan El interés por las RNA en la Inteligencia impresionantes, que empresas como Google, Artificial, ha pasado históricamente por tres Microsoft, Facebook y otras han iniciado etapas distintas: programas de investigación a gran escala y 1) La primera ola inicia en a fines de la déca- desarrollo de aplicaciones, bajo este nuevo da de 1950 con la presentación del “per- paradigma de aprendizaje profundo. Incluso ceptron” por Rosenblat, un modelo de red hace no mucho, Google ha hecho de dominio público una librería de software (Tensor- Brasil para su aplicación. También los Flow), para implementar redes neurales con proyectos sirvieron de base para la concreción aprendizaje profundo. de tesis de grado de becarios alumnos, para la En la Facultad Córdoba de la UTN, iniciamos introducción a la investigación de becarios en 2004 un proyecto sobre el estudio de graduados, y se generaron ideas sobre tesis de relaciones que suponíamos debían existir especialidad, maestría y doctorado, algunas de entre el funcionamiento del algoritmo de las cuales ya finalizaron exitosamente y otras aprendizaje por retropropagación de errores que aún están en desarrollo. en redes neurales multicapa de perceptrones, Todo esto se concretó “montados en la y la evolución espacio-temporal de los segunda ola” de interés de la Inteligencia autómatas celulares unidimensionales; Artificial sobre las redes neurales artificiales. también se ensayaron redes de Hopfield siguiendo la evolución de los patrones de 2. LINEAS DE INVESTIGACIÓN Y activación de sus elementos durante su DESARROLLO reconocimiento de caracteres. El proyecto El grupo GA2LAtiene como ejes para su fun- 25/E078 tuvo moderado éxito, como resulta cionamiento líneas de investigación, a saber: del informe técnico presentado en 2005, ya que se encontró la relación buscada sólo • Autómatas y Lenguajes Formales durante el entrenamiento de un tipo particular • Procesamiento de Lenguaje Natural de problemas de conversión de números entre bases numéricas, bajo una codificación de las • Aprendizaje Automático seis ideadas, de la evolución sufrida por los El proyecto presentado aquí en enmarca en la pesos sinápticos durante el aprendizaje de la tercera línea de I+D. red. El conocimiento logrado durante este 3. RESULTADOS proyecto y el software desarrollado, propició OBTENIDOS / ESPERADOS la generación de una línea de investigación que se consolidó con el desarrollo de nuevos A la luz de los avances y éxitos de las nuevas proyectos siguiendo los temas planteados técnicas de aprendizaje profundo ya (proyectos 25/E128 y 25/E174) y sobre comentadas, en el presente proyecto queremos nuevas temáticas y aplicaciones de las RNA y indagar sobre los conceptos y herramientas de técnicas asociadas (prevención de que están dando lugar a la tercera ola de incendios forestales en la provincia de interés sobre las RNA, lograr conocimiento Córdoba, cálculo del índice de riesgo para la teórico-práctico sobre el tema y desarrollar salud de la vivienda urbana, determinación de software que lo implemente, con distintos implicaciones textuales dentro de documentos objetivos a saber: escritos, y otros). a) Académicos: la temática es interesante por Asimismo se establecieron convenios de sí misma y está relacionada directamente cooperación con el Instituto de Investiga- con las cátedras de Inteligencia Artificial ciones Geo-Históricas de CONICET, con de la carrera de Ingeniería en Sistemas de grupos de otras universidades y con centros Información y con la de Análisis Numérico de I+D; se desarrollaron entrenadores de y Cálculo Avanzado de la carrera de Inge- redes neuronales y redes ya entrenadas para niería Industrial; además se relaciona indi- su aplicación en ciencias sociales y en la rectamente con temáticas de las cátedras de industria local de software, desarrollos que Sintaxis y Semántica del Lenguaje, de Ma- fueron documentados, se obtuvo sobre ellos temática Discreta y de Análisis Matemáti- derechos de autor y se transfirieron a co. Los integrantes del equipo de investi- empresas, centros de investigación en gación propuesto participamos en algunas Argentina, Brasil, Paraguay, Cuba, Colombia de estas cátedras. y a gobiernos municipales de Argentina y b) Investigación: se pretende actualizar el co- nocimiento que ya tenemos sobre redes neurales y entender los fundamentos de las zarlo, de ser posible, para el caso particu- técnicas agrupadas en el aprendizaje pro- lar de la metodología DRVS del IIGHI- fundo, y la forma de aplicarlos. UNNE-CONICET y desarrollar un módu- c) Transferencias: en anteriores proyectos se lo de producción RVS con las redes ya en- han desarrollado productos de redes neura- trenadas, para actualizar las transferencias les artificiales tradicionales, que han sido realizadas. transferidos; los usuarios están actualmente solicitando actualizaciones, modificaciones y capacitación sobre estos productos para 4. FORMACIÓN DE RECURSOS producir mejoras, internacionalizarlos y HUMANOS adaptarlos a nuevas aplicaciones reales. Por otro lado, otros proyectos actualmente Se prevé tener durante el transcurso del en desarrollo en nuestra unidad académica proyecto becarios alumnos de grado, prácticas que usan redes neurales tradicionales (diri- supervisadas de alumnos de la carrera de gidos por anteriores becarios e integrantes Ingeniería en Sistemas de Información y de nuestros anteriores proyectos), colabo- eventualmente becarios graduados. Sobre los rarán con el presente y serán también re- becarios alumnos, se hará un seguimiento de ceptores de estos nuevos conocimientos y su desempeño académico tratando de herramientas desarrolladas. apoyarlos en su carrera y asegurando que el Con estos objetivos en mente, el proyecto in- proyecto no influya negativamente sobre la tentará: misma. • Obtener conocimiento sobre las técnicas El proyecto será ofrecido a la Maestría en de aprendizaje profundo: sobre sus fun- Ingeniería en Sistemas de Información de la damentos, sobre qué tipos de arquitecturas Facultad Córdoba de UTN y al Doctorado en de redes neurales son aplicables, qué mo- Ingeniería en Sistemas de Información, para delos de neuronas y funciones de activa- servir de asiento de posibles tesis. El profesor ción utilizan, para qué tipo de tareas son Juan Giró, integrante consultor del proyecto, útiles y para cuales no lo son, y cómo fun- es docente de la Maestría citada. cionan los algoritmos de aprendizaje por Se prevé para todos los integrantes, efectuar retropropagación de errores en cascadas capacitación interna respecto de los temas de autocodificadores u otros modelos su- bajo investigación y se procurarán becas para geridos para su implementación. los mismos, para que anualmente puedan • Identificar y comprender el significado de acceder al menos a un curso de posgrado. la jerarquía de representaciones de datos Es intención del proyecto, generar ideas para que obtiene el aprendizaje profundo, cómo una nueva tesis de doctorado en Ingeniería en funciona el proceso de extracción de ca- Sistemas de Información que tiene racterísticas no supervisada de los datos intenciones de desarrollar la Ing. Constable. (desde las de más bajo nivel en las prime- Por otro lado, se prevé que la temática de ras capas de las redes, hasta las abstrac- investigación impulse la culminación de la ciones de más alto nivel en las superiores) tesis doctoral en curso del Ing. Arcidiácono que sustentan esa jerarquía y la forma de sobre reconocimiento de imágenes visualizarlas. (Reconocimiento e Identificación de Patrones • Desarrollar software que implemente el Morfológicos de Fibra Textil mediante un aprendizaje profundo para problemas di- algoritmo de Memoria Jerárquica Temporal) señados de testeo y establecer cómo de- y de la tesis de maestría, también en curso, del terminar su efectividad y la de sus posi- Esp. Ing. Gualpa sobre ingeniería de software bles alternativas, para comparación. (La planificación de entregas (release • Generar software de entrenamiento de re- planning) en proyectos de desarrollo y des neurales artificiales con aprendizaje mantenimiento de software, soportada por profundo de propósito general y especiali- métodos cuantitativos multicriterio para la 11. Tang J., Deng C. y Huang G., Extreme toma de decisiones). Machine Learning for Multilayer Perceptron, IEEE Transaction on Neural 5. BIBLIOGRAFÍA Network and Learning Systems, Vol. 27, Nr. 4, pp. 809-821, April-2016, IEEE. 1. Anderson J. (2007), Redes Neurales, Alfaomega Grupo Editor, D.F., México. 12. Vázquez, J.C. (2009), Unificación de Modelos Evolutivos, Congreso de 2. Araujo B. (2006), Aprendizaje Automático: Inteligencia Computacional Aplicada, conceptos básicos y avanzados, Pearson, Universidad de Palermo, Buenos Aires, Madrid, España. Argentina. 3. Del Brío M., Sanz Molina A. (2006), 13. Castillo, J., Cardenas, M., Medel, R., Redes Neuronales y Sistemas Borrosos, Casco, O., Navarro, M. & Gutierrez, S. Ra-Ma., Zaragoza, España. “SISTEMA PARA PREDICCIÓN DE 4. Deolalikar V. (2002), A Two-Layer INCENDIOS APLICADO A LA PRO- Paradigm Capable of Forming Arbitrary VINCIA DE CÓRDOBA”. (2016). XVII Decision Regions in Input Space, IEEE Workshop de Investigadores en Ciencias Transactions on Neural Network, Vol. 13, de la Computación, WICC 2016, Entre #1, pp. 15-21. Ríos, Argentina. 5. Hinton G., Salakhutdinov R. (2006), 14. Juan C. Vázquez, Julio Javier Castillo, Reducing the Dimensionality of Data with Marina E. Cardenas, María del Carmen Neural Network, Science, Vol. 313, pp. Rojas. “Modelo Computacional empleando 504-507.} Redes Neuronales Artificiales para la esti- mación del Riesgo para la Salud de la Vi- 6. Krizhevsky A., Sutskever I., Hinton G. vienda Urbana”. WICC 2011 – (2017), ImageNet Classification with Deep XIII Workshop de Investigadores en Cien- Convolutional Neural Network, cias de la Computación. Mayo de 2011. Communications of ACM, June 2017, Vol. Fecha: 5 Y 6 DE MAYO DE 2011 Rosa- 60 – Nr 6 – pp. 84-90, U.S.A. rio, SANTA FE, ARGENTINA. 7. LeCun Y., Bengio Y., Hinton G. (2015), Deep Learning, Nature, Vol. 521, pp. 436- 444. 8. LeCun Y., Botton L., Genevieve B., Müller K. (1998), Efficient BackProp, en Neural Network: tricks of the trade, Springer, Berlin, Germany. 9. Rojas, Meichtry, Ciuffolini, Vazquez, Castillo (2008), Repensando de manera holÍstica el riesgo de la vivienda urbana precaria para la salud: un análisis del enfoque de la vulnerabilidad sociodemográfica, Revista Salud Colectiva, Vol. 4 / Nro. 2, Buenos Aires, Universidad Nacional de Lanús y Asociación Civil Salud Colectiva Centro de Estudios para la Salud. 10. Rumelhart D. y McClelland J. (1986), Parallel Distributed Processing, Vol. 1: Foundations, MIT Press.