Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Convo Luci On
Convo Luci On
neuronas corresponden a campos receptivos de una manera muy similar a las neuronas
en la corteza visual primaria (V1) de un cerebro biológico. Este tipo de red es una
variación de un perceptron multicapa, sin embargo, debido a que su aplicación es
realizada en matrices bidimensionales, son muy efectivas para tareas de visión
artificial, como en la clasificación y segmentación de imágenes, entre otras
aplicaciones.1
Índice
1 Historia
2 Fundamentos Biológicos
3 Arquitectura
3.1 Neuronas convolucionales
3.2 Neuronas de Reducción de Muestreo
3.3 Neuronas de Clasificación
4 Aplicaciones
5 Enlaces externos
6 Bibliografía
Historia
Los fundamentos de las redes neuronales convolucionales se basan en el
Neocognitron, introducido por Kunihiko Fukushima en 1980.2 Este modelo fue más
tarde mejorado por Yann LeCun et al. en 19983 al introducir un método de
aprendizaje basado en la propagación hacia atrás para poder entrenar el sistema
correctamente. En el año 2012, fueron refinadas por Dan Ciresan y otros, y fueron
implementadas para una unidad de procesamiento gráfico (GPU) consiguiendo así
resultados impresionantes.4
Fundamentos Biológicos
El trabajo realizado por Hubel y Wiesel en 19596 jugó un papel importante en la
comprensión sobre cómo funciona la corteza visual, particularmente las células
responsables de la selectividad de orientación y detección de bordes en los
estímulos visuales dentro de la corteza visual primaria V1. Dos tipos de células
principales fueron identificadas aquí, teniendo éstas campos receptivos alargados,
con lo cual tienen una mejor respuesta a los estímulos visuales alargados como las
líneas y los bordes. Estas se denominan células simples y células complejas.
Las células complejas operan de una manera similar. Como las células simples, éstas
tienen una orientación particular sobre la cual son sensibles. Sin embargo, éstas
no tienen sensibilidad a la posición. Por ello, un estímulo visual necesita llegar
únicamente en la orientación correcta para que esta célula sea activada.
Otro punto importante sobre las células en la corteza visual es la estructura que
éstas forman. A lo largo de la jerarquía de la corteza, comenzando por la región V1
de la corteza visual, luego siguiendo a las regiones V2, V4 e IT, se encuentra que
la complejidad de los estímulos ideales incrementa cada vez más. Al mismo tiempo,
las activaciones de las células se hacen menos sensibles a la posición y tamaño de
los estímulos iniciales. Esto sucede como resultado de las células activando y
propagando sus propios estímulos a otras células conectadas a esta jerarquía,
principalmente gracias a la alternación entre células simples y complejas.
Arquitectura
Las redes neuronales convolucionales consisten en múltiples capas de filtros
convolucionales de una o más dimensiones. Después de cada capa, por lo general se
añade una función para realizar un mapeo causal no-lineal.
Neuronas convolucionales
En la fase de extracción de características, las neuronas sencillas de un
perceptron son reemplazadas por procesadores en matriz que realizan una operación
sobre los datos de imagen 2D que pasan por ellas, en lugar de un único valor
numérico. La salida de cada neurona convolucional se calcula como:
Neuronas de Clasificación
Después de una o más fases de extracción de características, los datos finalmente
llegan a la fase de clasificación. Para entonces, los datos han sido depurados
hasta una serie de características únicas para la imagen de entrada, y es ahora la
labor de esta última fase el poder clasificar estas características hacia una
etiqueta u otra, según los objetivos de entrenamiento.
Aplicaciones
Dado a la naturaleza de las convoluciones dentro de las redes neuronales
convolucionales, estas son aptas para poder aprender a clasificar todo tipo de
datos donde estos estén distribuidos de una forma continua a lo largo del mapa de
entrada, y a su vez sean estadísticamente similares en cualquier lugar del mapa de
entrada. Por esta razón, son especialmente eficaces para clasificar imágenes, por
ejemplo para el auto-etiquetado de imágenes.
Sin embargo, las redes neuronales convolucionales también pueden ser aplicadas para
la clasificación de series de tiempo o señales de audio utilizando convoluciones en
1D, así como para la clasificación de datos volumétricos usando convoluciones en
3D.