Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En 1959, un modelo biológico propuesto por dos laureados de los Premios Nobel,
David H. Hubel y Torsten Wiesel, estaba basado en su descubrimiento de dos tipos de
células en la corteza visual primaria: células simples y células complejas.12
El primer reporte sobre redes funcionales multicapas fue publicado en 1965 por
Ivakhnenko y Lapa, y se conoce como el método de agrupamiento para el manejo de
datos.131415
Las redes neuronales, tal como se utilizan en la inteligencia artificial, han sido
consideradas tradicionalmente como modelos simplificados de procesamiento neuronal
en el cerebro, a pesar de que la relación entre este modelo y la arquitectura
biológica del cerebro se debate; no está claro en qué medida las redes neuronales
artificiales reflejan el funcionamiento cerebral.
Máquinas de soporte vectorial y otros métodos mucho más simples, tales como los
clasificadores lineales, alcanzaron gradualmente popularidad en el aprendizaje
automático. No obstante, el uso de redes neuronales ha cambiado algunos campos,
tales como la predicción de las estructuras de las proteínas.1819
Para vencer este problema, Schmidhuber adoptaba una jerarquía multicapa de redes
(1992) pre entrenados, una capa a la vez, por aprendizaje no supervisado, y
refinado por propagación hacia atrás.26 Behnke (2003) contaba solamente con el
signo del gradiente (Rprop)27 tratándose de problemas tales como la reconstrucción
de imágenes y la localización de caras.
Entre 2009 y 2012, las redes neuronales recurrentes y redes neuronales profundas
feedforward desarrollados en el grupo de investigación de Jürgen Schmidhuber en el
laboratorio suizo de IA IDSIA han ganado ocho concursos internacionales de
reconocimiento de patrones y aprendizaje automático. Por ejemplo, la memoria bi-
direccional y multidimensional de largo a corto plazo (LSTM) de Alex Graves ha
ganado tres competiciones en el reconocimiento de escritura conectada en
Conferencia Internacional sobre Análisis de documentos y Reconocimiento (ICDAR) del
2009, sin ningún conocimiento previo acerca de los tres idiomas diferentes que se
pueden aprender.
Modelos
Los modelos de redes neuronales en la inteligencia artificial se refieren
generalmente a las redes neuronales artificiales (RNA); estos son modelos
matemáticos esencialmente simples que definen una función f:X→Y o una distribución
más X o ambos X e Y. Pero a veces los modelos también están íntimamente asociadas
con un algoritmo de aprendizaje en particular o regla de aprendizaje. Un uso común
de la frase "modelo ANN" es en realidad la definición de una clase de tales
funciones (donde los miembros de la clase se obtiene variando parámetros, los pesos
de conexión, o específicos de la arquitectura, tales como el número de neuronas o
su conectividad).
Función de red
La palabra red en el término "red neuronal artificial" se refiere a las
interconexiones entre las neuronas en las diferentes capas de cada sistema. Un
sistema ejemplar tiene tres capas. La primera capa tiene neuronas de entrada que
envían datos a través de las sinapsis a la segunda capa de neuronas, y luego a
través de más sinapsis a la tercera capa de neuronas de salida. Los sistemas más
complejos tendrán más capas, algunos aumentando las de entrada y de salida de
neuronas. Las sinapsis almacenan parámetros llamados "pesos" que manipulan los
datos en los cálculos.
Esta cifra representa una descomposición de tales {\displaystyle f}f, Con las
dependencias entre las variables indicadas por las flechas. Estos pueden ser
interpretados de dos maneras.