Está en la página 1de 5

RNA-AP: Redes Neurales Artificiales con Aprendizaje Profundo

Juan C. Vázquez1, Leticia Constable1

Depto. de Ingeniería en Sistemas de Información / Facultad Regional Córdoba / Universidad


Tecnológica Nacional
1
{jcjvazquez, leticiaconstable}@gmail.com

RESUMEN pales de Argentina y Brasil. En estos proyec-


tos se han utilizado redes neurales artificiales
Este proyecto se adentrará en las técnicas de de perceptrones multicapa con entrenamiento
aprendizaje profundo (Deep Learning) de por retropropagación de errores, con aplica-
redes neurales artificiales, que en los últimos ciones a las ciencias sociales, a los negocios y
años ha producido importantes avances en la a la ingeniería de software.
Inteligencia Artificial a nivel mundial. El
aprendizaje profundo ha tenido alto y positivo 1. INTRODUCCIÓN
impacto en aplicaciones de reconocimiento de La Inteligencia Artificial como rama de
imágenes, pero también ha tenido resonantes estudio dentro de la Informática, ha buscado
fracasos debido a que no se entiende con desde sus orígenes lograr un comportamiento
claridad su funcionamiento interno. El inteligente de las computadoras mediante gran
proyecto intentará, por un lado obtener el cantidad de métodos y técnicas que pueden
conocimiento necesario para desarrollar englobarse básicamente en dos estrategias
software de experimentación y aplicación, y principales:
por otro, entender la teoría subyacente, el por a) El llamado enfoque simbólico, intenta
qué esta técnica funciona mejor que las emular la forma en la cual se cree que las
anteriores, cuáles son sus bondades y personas piensan, utilizando diversas ver-
limitaciones, en qué campos es aplicable y en siones de la Lógica (proposicional, de pre-
cuáles no, y en lo posible, hacer algún aporte dicados, rebatible, modal, temporal, difusa,
significativo a la teoría. etc.) para especificar hechos y relaciones
Palabras clave: redes neurales artificiales, causales entre ellos, que representen la
aprendizaje profundo, aplicaciones. realidad en un dominio determinado. Lue-
go, a través procesos de inferencia con rí-
CONTEXTO gida justificación formal, que usen razo-
El proyecto es parte del recientemente con- namiento deductivo (monótono o no monó-
formado Grupo GA2LA (Grupo de Investiga- tono) y/o inductivo, se puede interrogar al
ción, Desarrollo y Transferencia en Aprendi- modelo del mundo así generado, para ob-
zaje Automático, Lenguajes y Autómatas) de tener respuestas inteligentes a los proble-
la Facultad Córdoba de la UTN. mas planteados. Básicamente este abordaje
Desde el año 2004, en el Laboratorio de In- supone que la inteligencia surge de exten-
vestigación de Software del Departamento de sas bases de conocimiento y razonamientos
Ingeniería en Sistemas de Información, sede que las utilizan. Los sistemas expertos son
de GA2LA, se ha desarrollado una secuencia productos típicos generados por este enfo-
de proyectos sobre redes neurales artificiales que.
que han generado productos y aplicaciones b) La segunda estrategia suele denominarse
que han sido transferidos (muchos de ellos en enfoque sub-simbólico; aquí se engloban
cooperación con investigadores de CONI- gran cantidad de teorías, modelos, técnicas
CET) a numerosos centros de investigación y herramientas que emulan la forma en que
en diversas locaciones en América Latina, a la naturaleza ha resuelto a lo largo de mi-
empresas comerciales y a gobiernos munici- lenios los problemas naturales, ya sea si-
mulando su método de selección natural de dos capas de neuronas del tipo McCu-
(computación evolucionaria, autómatas ce- lloch-Pitts, que se desempeña como clasi-
lulares, programación evolutiva, algorit- ficadora de patrones simples.
mos genéticos y otros) o modelando ma- 2) La segunda comienza en 1982 con las re-
temática y computacionalmente sus solu- des autoasociativas de Hopfield, utilizando
ciones más relevantes (sistemas conexio- aprendizaje hebbiano, y por la propuesta de
nistas, sistemas inmunológicos, estrategias un algoritmo general de aprendizaje (Ru-
de enjambre, etc.). melhart-1986) sobre redes multicapa de
Una de las ventajas del enfoque simbólico es perceptrones con propagación unidireccio-
que puede explicar cómo arriba a sus nal: la retropropagación de errores (back-
conclusiones, lo que en algunos dominios propagation en inglés); intensa actividad
como la medicina es de fundamental de investigación y desarrollo siguen a estas
importancia para que los usuarios adopten propuestas, generándose gran cantidad de
como buenas las soluciones logradas y modelos distintos de neuronas, arquitectu-
confíen en ellas. ras de conexionado y métodos de funcio-
Dentro del enfoque sub-simbólico, destacan namiento, con aplicaciones más o menos
los sistemas conexionistas que emulan la destacadas.
arquitectura del sistema nervioso de los 3) La tercera ola, en la cual la comunidad IA
animales, y en particular, de su órgano considera que actualmente nos encontra-
principal: el cerebro; una inmensa cantidad de mos, surge de estudios realizados por Hin-
unidades simples de procesamiento de señales ton y su equipo publicados en 2006 en la
(las neuronas) intrincadamente conectadas revista Science, sobre una jerarquía de re-
enviándose mensajes y colaborando para presentaciones de datos (desde las de más
soportar el pensamiento. Cabe aclarar aquí, bajo nivel morfológico, hasta abstracciones
que los modelos matemáticos de las redes de mayores niveles) logradas a través de
neuronales que componen el cerebro y sus autocodificadores, que aportan luz sobre
partes, son una metáfora muy simplificada del cómo están haciendo su trabajo las RNA
complicadísimo mecanismo biológico real, el durante un proceso de reconocimiento de
cual aún no termina de comprenderse por imágenes, y que mejoran el comportamien-
completo. Se piensa bajo este esquema, que la to del algoritmo de retropropagación de
inteligencia es una característica emergente errores enormemente. Estos hallazgos dan
de esta complejidad extrema puesta a nacimiento al aprendizaje profundo (Deep
funcionar. Learning en inglés), que se consolida como
Los modelos de redes neurales artificiales tecnología emergente en el campo de las
(RNA) y las técnicas asociadas, se engloban redes neurales artificiales con una serie de
actualmente en lo que ha dado en llamarse trabajos del mismo Hinton (hoy en Goo-
aprendizaje automático (machine-learning en gle) y de LeCun (hoy en Facebook) que les
inglés) e intervienen en muchos dispositivos y valen numerosos premios en competicio-
procesos usuales de la sociedad moderna nes de IA a nivel mundial, desde finales de
(búsquedas de Internet, teléfonos inteligentes, 2010.
traducción automática de lenguaje escrito y A partir de aquí los avances en los últimos
hablado, filtrado de contenidos en redes pocos años son tan rápidos, y los éxitos
sociales, reconocimiento de imágenes y su obtenidos en igualar capacidades reservadas
clasificación, por nombrar solo algunos). hasta ahora solo a los humanos son tan
El interés por las RNA en la Inteligencia impresionantes, que empresas como Google,
Artificial, ha pasado históricamente por tres Microsoft, Facebook y otras han iniciado
etapas distintas: programas de investigación a gran escala y
1) La primera ola inicia en a fines de la déca- desarrollo de aplicaciones, bajo este nuevo
da de 1950 con la presentación del “per- paradigma de aprendizaje profundo. Incluso
ceptron” por Rosenblat, un modelo de red hace no mucho, Google ha hecho de dominio
público una librería de software (Tensor- Brasil para su aplicación. También los
Flow), para implementar redes neurales con proyectos sirvieron de base para la concreción
aprendizaje profundo. de tesis de grado de becarios alumnos, para la
En la Facultad Córdoba de la UTN, iniciamos introducción a la investigación de becarios
en 2004 un proyecto sobre el estudio de graduados, y se generaron ideas sobre tesis de
relaciones que suponíamos debían existir especialidad, maestría y doctorado, algunas de
entre el funcionamiento del algoritmo de las cuales ya finalizaron exitosamente y otras
aprendizaje por retropropagación de errores que aún están en desarrollo.
en redes neurales multicapa de perceptrones, Todo esto se concretó “montados en la
y la evolución espacio-temporal de los segunda ola” de interés de la Inteligencia
autómatas celulares unidimensionales; Artificial sobre las redes neurales artificiales.
también se ensayaron redes de Hopfield
siguiendo la evolución de los patrones de 2. LINEAS DE INVESTIGACIÓN Y
activación de sus elementos durante su DESARROLLO
reconocimiento de caracteres. El proyecto El grupo GA2LAtiene como ejes para su fun-
25/E078 tuvo moderado éxito, como resulta cionamiento líneas de investigación, a saber:
del informe técnico presentado en 2005, ya
que se encontró la relación buscada sólo • Autómatas y Lenguajes Formales
durante el entrenamiento de un tipo particular • Procesamiento de Lenguaje Natural
de problemas de conversión de números entre
bases numéricas, bajo una codificación de las • Aprendizaje Automático
seis ideadas, de la evolución sufrida por los El proyecto presentado aquí en enmarca en la
pesos sinápticos durante el aprendizaje de la tercera línea de I+D.
red.
El conocimiento logrado durante este 3. RESULTADOS
proyecto y el software desarrollado, propició OBTENIDOS / ESPERADOS
la generación de una línea de investigación
que se consolidó con el desarrollo de nuevos A la luz de los avances y éxitos de las nuevas
proyectos siguiendo los temas planteados técnicas de aprendizaje profundo ya
(proyectos 25/E128 y 25/E174) y sobre comentadas, en el presente proyecto queremos
nuevas temáticas y aplicaciones de las RNA y indagar sobre los conceptos y herramientas
de técnicas asociadas (prevención de que están dando lugar a la tercera ola de
incendios forestales en la provincia de interés sobre las RNA, lograr conocimiento
Córdoba, cálculo del índice de riesgo para la teórico-práctico sobre el tema y desarrollar
salud de la vivienda urbana, determinación de software que lo implemente, con distintos
implicaciones textuales dentro de documentos objetivos a saber:
escritos, y otros). a) Académicos: la temática es interesante por
Asimismo se establecieron convenios de sí misma y está relacionada directamente
cooperación con el Instituto de Investiga- con las cátedras de Inteligencia Artificial
ciones Geo-Históricas de CONICET, con de la carrera de Ingeniería en Sistemas de
grupos de otras universidades y con centros Información y con la de Análisis Numérico
de I+D; se desarrollaron entrenadores de y Cálculo Avanzado de la carrera de Inge-
redes neuronales y redes ya entrenadas para niería Industrial; además se relaciona indi-
su aplicación en ciencias sociales y en la rectamente con temáticas de las cátedras de
industria local de software, desarrollos que Sintaxis y Semántica del Lenguaje, de Ma-
fueron documentados, se obtuvo sobre ellos temática Discreta y de Análisis Matemáti-
derechos de autor y se transfirieron a co. Los integrantes del equipo de investi-
empresas, centros de investigación en gación propuesto participamos en algunas
Argentina, Brasil, Paraguay, Cuba, Colombia de estas cátedras.
y a gobiernos municipales de Argentina y b) Investigación: se pretende actualizar el co-
nocimiento que ya tenemos sobre redes
neurales y entender los fundamentos de las zarlo, de ser posible, para el caso particu-
técnicas agrupadas en el aprendizaje pro- lar de la metodología DRVS del IIGHI-
fundo, y la forma de aplicarlos. UNNE-CONICET y desarrollar un módu-
c) Transferencias: en anteriores proyectos se lo de producción RVS con las redes ya en-
han desarrollado productos de redes neura- trenadas, para actualizar las transferencias
les artificiales tradicionales, que han sido realizadas.
transferidos; los usuarios están actualmente
solicitando actualizaciones, modificaciones
y capacitación sobre estos productos para 4. FORMACIÓN DE RECURSOS
producir mejoras, internacionalizarlos y HUMANOS
adaptarlos a nuevas aplicaciones reales.
Por otro lado, otros proyectos actualmente Se prevé tener durante el transcurso del
en desarrollo en nuestra unidad académica proyecto becarios alumnos de grado, prácticas
que usan redes neurales tradicionales (diri- supervisadas de alumnos de la carrera de
gidos por anteriores becarios e integrantes Ingeniería en Sistemas de Información y
de nuestros anteriores proyectos), colabo- eventualmente becarios graduados. Sobre los
rarán con el presente y serán también re- becarios alumnos, se hará un seguimiento de
ceptores de estos nuevos conocimientos y su desempeño académico tratando de
herramientas desarrolladas. apoyarlos en su carrera y asegurando que el
Con estos objetivos en mente, el proyecto in- proyecto no influya negativamente sobre la
tentará: misma.
• Obtener conocimiento sobre las técnicas El proyecto será ofrecido a la Maestría en
de aprendizaje profundo: sobre sus fun- Ingeniería en Sistemas de Información de la
damentos, sobre qué tipos de arquitecturas Facultad Córdoba de UTN y al Doctorado en
de redes neurales son aplicables, qué mo- Ingeniería en Sistemas de Información, para
delos de neuronas y funciones de activa- servir de asiento de posibles tesis. El profesor
ción utilizan, para qué tipo de tareas son Juan Giró, integrante consultor del proyecto,
útiles y para cuales no lo son, y cómo fun- es docente de la Maestría citada.
cionan los algoritmos de aprendizaje por Se prevé para todos los integrantes, efectuar
retropropagación de errores en cascadas capacitación interna respecto de los temas
de autocodificadores u otros modelos su- bajo investigación y se procurarán becas para
geridos para su implementación. los mismos, para que anualmente puedan
• Identificar y comprender el significado de acceder al menos a un curso de posgrado.
la jerarquía de representaciones de datos Es intención del proyecto, generar ideas para
que obtiene el aprendizaje profundo, cómo una nueva tesis de doctorado en Ingeniería en
funciona el proceso de extracción de ca- Sistemas de Información que tiene
racterísticas no supervisada de los datos intenciones de desarrollar la Ing. Constable.
(desde las de más bajo nivel en las prime- Por otro lado, se prevé que la temática de
ras capas de las redes, hasta las abstrac- investigación impulse la culminación de la
ciones de más alto nivel en las superiores) tesis doctoral en curso del Ing. Arcidiácono
que sustentan esa jerarquía y la forma de sobre reconocimiento de imágenes
visualizarlas. (Reconocimiento e Identificación de Patrones
• Desarrollar software que implemente el Morfológicos de Fibra Textil mediante un
aprendizaje profundo para problemas di- algoritmo de Memoria Jerárquica Temporal)
señados de testeo y establecer cómo de- y de la tesis de maestría, también en curso, del
terminar su efectividad y la de sus posi- Esp. Ing. Gualpa sobre ingeniería de software
bles alternativas, para comparación. (La planificación de entregas (release
• Generar software de entrenamiento de re- planning) en proyectos de desarrollo y
des neurales artificiales con aprendizaje mantenimiento de software, soportada por
profundo de propósito general y especiali-
métodos cuantitativos multicriterio para la 11. Tang J., Deng C. y Huang G., Extreme
toma de decisiones). Machine Learning for Multilayer
Perceptron, IEEE Transaction on Neural
5. BIBLIOGRAFÍA Network and Learning Systems, Vol. 27,
Nr. 4, pp. 809-821, April-2016, IEEE.
1. Anderson J. (2007), Redes Neurales,
Alfaomega Grupo Editor, D.F., México. 12. Vázquez, J.C. (2009), Unificación de
Modelos Evolutivos, Congreso de
2. Araujo B. (2006), Aprendizaje Automático: Inteligencia Computacional Aplicada,
conceptos básicos y avanzados, Pearson, Universidad de Palermo, Buenos Aires,
Madrid, España. Argentina.
3. Del Brío M., Sanz Molina A. (2006), 13. Castillo, J., Cardenas, M., Medel, R.,
Redes Neuronales y Sistemas Borrosos, Casco, O., Navarro, M. & Gutierrez, S.
Ra-Ma., Zaragoza, España. “SISTEMA PARA PREDICCIÓN DE
4. Deolalikar V. (2002), A Two-Layer INCENDIOS APLICADO A LA PRO-
Paradigm Capable of Forming Arbitrary VINCIA DE CÓRDOBA”. (2016). XVII
Decision Regions in Input Space, IEEE Workshop de Investigadores en Ciencias
Transactions on Neural Network, Vol. 13, de la Computación, WICC 2016, Entre
#1, pp. 15-21. Ríos, Argentina.
5. Hinton G., Salakhutdinov R. (2006), 14. Juan C. Vázquez, Julio Javier Castillo,
Reducing the Dimensionality of Data with Marina E. Cardenas, María del Carmen
Neural Network, Science, Vol. 313, pp. Rojas. “Modelo Computacional empleando
504-507.} Redes Neuronales Artificiales para la esti-
mación del Riesgo para la Salud de la Vi-
6. Krizhevsky A., Sutskever I., Hinton G. vienda Urbana”. WICC 2011 –
(2017), ImageNet Classification with Deep XIII Workshop de Investigadores en Cien-
Convolutional Neural Network, cias de la Computación. Mayo de 2011.
Communications of ACM, June 2017, Vol. Fecha: 5 Y 6 DE MAYO DE 2011 Rosa-
60 – Nr 6 – pp. 84-90, U.S.A. rio, SANTA FE, ARGENTINA.
7. LeCun Y., Bengio Y., Hinton G. (2015),
Deep Learning, Nature, Vol. 521, pp. 436-
444.
8. LeCun Y., Botton L., Genevieve B.,
Müller K. (1998), Efficient BackProp, en
Neural Network: tricks of the trade,
Springer, Berlin, Germany.
9. Rojas, Meichtry, Ciuffolini, Vazquez,
Castillo (2008), Repensando de manera
holÍstica el riesgo de la vivienda urbana
precaria para la salud: un análisis del
enfoque de la vulnerabilidad
sociodemográfica, Revista Salud
Colectiva, Vol. 4 / Nro. 2, Buenos Aires,
Universidad Nacional de Lanús y
Asociación Civil Salud Colectiva Centro
de Estudios para la Salud.
10. Rumelhart D. y McClelland J. (1986),
Parallel Distributed Processing, Vol. 1:
Foundations, MIT Press.

También podría gustarte