Warren McCulloch Walter Pitts

Por

FRANCISCO MARÍN MIRA

Introducción (I) 
   



1899: Nacimiento de Warren Sturgis McCulloch 1923: Nacimiento de Walter Pitts 1927: McCulloch: Doctorado en psicología. 1943: Se propone uno de los primeros modelos matemáticos de la neurona McCullochMcCulloch-Pitts. ´A logical calculus of the ideas immanent in nervous activityµ activityµ 1947: McCullch-Pitts. ´How we know universals: the McCullch´How perception of visual and auditory formsµ 1949: Donald Hebb propone una de las primeras reglas de aprendizaje

autolos basados en la Teoría de Resonancia Adaptativa (ART) de Grossberg y Carpenter. Gaudiano y Grossberg.Introducción (II)       1956: Se acuña el término de Inteligencia Artificial 1957: Frank Rosenblatt presentó el Perceptrón Años 60: modelos basados en el Perceptrón: Adaline y Madaline 1969: Mueren McCulloch y Pitts 1969: Back propagation Posteriormente. otros modelos permiten un aprendizaje no supervisado (mapa auto-organizativo de Kohonen. entre otros) . o los modelos de control motor de Bullock.

. mediante una regla de aprendizaje. Cada entrada está afectada por un coeficiente. denominado peso. A logical calculus of the ideas immanent in nervous activity:    una Máquina de Turing podría ser implementada en una red finita de neuronas formales 1947: aproximaciones para diseñar ´redes nerviosasµ para reconocer entradas visuales Las redes neuronales actuales se basan en el modelo de neurona descrito en este artículo     Cada neurona consta de un conjunto de entradas y una sola salida.A. proponiendo la definición de la neurona Con estas ideas nace la cibernética y más tarde el término Inteligencia Artificial McCulloch y Pitts. La cantidad calculada como la suma del producto de cada entrada multiplicada por su respectivo peso se denomina activación de la neurona Una de las primeras arquitecturas neuronales donde se aplica es el Perceptrón Los pesos de las neuronas se modifican sometiendo a la red a un entrenamiento.Introducción (III)    McCulloch y Pitts impulsaron el nacimiento de la I.

salidas. De aquí nacería.La Inteligencia Artificial  Se puede decir que la Inteligencia Artificial empezó a surgir en 1943 cuando Warren McCulloch y Walter Pitts propusieron un modelo de neurona del cerebro humano y animal. Norbert Wiener elaboró con estas ideas junto con otras. lo que se llamó ´cibernéticaµ. Más adelante. una abstracción que proporcionó una animal. sobre los años 50. Podríamos situar el origen de los modelos conexionistas con la definición de la neurona formal dada por McCulloch y Pitts en 1943 como un dispositivo binario con varias entradas y salidas. representación simbólica de la actividad cerebral. la cibernéticaµ. dentro del mismo campo.   . Inteligencia Artificial.

McCulloch (I)      Warren Sturgis McCulloch ( 1899 .1969 ) Nació en Orange. . Neurofisiólogo y Cibernético Estudió en Yale (filosofía y psicología hasta 1921) y en Columbia (psicología. New Jersey el 16 de Noviembre de 1899. graduado en 1923). Recibiendo su doctorado en 1927 en Nueva York.

´Bulletin Biophysicsµ. donde la neurona es la unidad base lógica del cerebro. En el artículo de 1943 demostraron que una Máquina de Turing podría ser implementada en una red finita de neuronas formales. ambos en el ´Bulletin of Mathematical Biophysicsµ.  .McCulloch (II)  Recordado por su trabajo con Dusser de Barenne (en Yale) y después con Walter Pitts (en Illinois) que posibilitó la fundación de ciertas teorías de la inteligencia en un número de artículos clásicos. En el artículo de 1947 ofrecieron aproximaciones para diseñar ´redes nerviosasµ para reconocer entradas visuales a pesar de los cambios de orientación o de tamaño. incluyendo ´A logical calculus of the ideas immanent in nervous activityµ (1943) y ´How we know universals: the perception of visual and auditory formsµ (1947).

Su equipo examinó el sistema visual de la rana. en consideración con el artículo de 1947. en vez de únicamente transmitir la imagen. organizada e interpretada.McCulloch (III)  Desde 1952 trabajó en el Laboratorio de Investigación de Electrónica del MIT (Instituto de Tecnología de Massachusetts). en cierto sentido. principalmente en modelado de Redes Neuronales. descubriendo que el ojo proporciona al cerebro información que es.   . McCulloch fue miembro de la American Society for Cybernetics y su primer presidente desde 1967 al 1968.

McCulloch (IV)  Conoció a Alan Turing. que discrepó con él llegando a llamarle charlatán.   . Murió en Cambridge en 1969. A parte de sus contribuciones a la ciencia. Conneticut. escribió poesía (sonetos) y diseñó edificios y un embalse para su granja de Old Lyme. Warren McCulloch tiene un notable rango de intereses y talentos.

Pitts (I)       Walter Pitts ( 1923 . Aprendió por su cuenta lógica y matemáticas y era capaz de leer en numerosos lenguajes. Aparentemente escapó de su casa a los 15 años. . Matemático que trabajó en el campo de la psicología cognitiva.1969 ) Nació en Detroit el 23 de Abril de 1923. incluyendo Griego y Latin.

Russell se mostró agradecido y le invitó a estudiar en el Reino Unido. Acudió a clases de la Universidad de Chicago. Pitts decidió estudiar lógica. Aunque esta oferta fue aparentemente rechazada. Obtuvo un trabajo en la universidad gracias a un filósofo alemán (Rudolf Carnap) al que le presentó su propio libro de lógica lleno de correcciones.   .Pitts (II)  Con 12 años pasó tres dias en una biblioteca leyendo ´Principia Mathematicaµ y mandó una carta a Bertrand Russell indicandole lo que él consideraba problemas serios en la primera mitad del primer volumen. sin inscribirse como estudiante. Pitts por ese tiempo no tenía hogar ni ningún ingreso.

Jerome Lettvin. parte del Proyecto de Energía Atómica.Pitts (III)     Más tarde Warren McCulloch llegó a la Universidad y.. que seguía sin hogar. McCulloch y Pitts trabajaban juntos. como la describida por Leibniz. Esto llevó a su determinante artículo de redes neuronales ´A Logical Calculus of Ideas Immanent in Nervous Activityµ. le presentó a Norbert Wiener en el MIT. En 1943. En 1944 Pitts fue contratado por Kellex Corp. . fue tan bien que Pitts se trasladó a Boston para trabajar con Wiener. a principios de 1942. Pitts estaba familiarizado con el trabajo en informática de Gottfried Leibniz y consideraron la cuestión de si el sistema nervioso podía ser considerado un tipo de maquina de computación universal. invitó a Pitts. en el que estuvieron discutiendo el trabajo de Wiener. Su primer encuentro. con el que Pitts obtuvo una gran amistad en la universidad. quien había perdido a su ´mano derechaµ. a vivir con su familia.

  . Pitts también es descrito como un excéntrico. Un grupo fue estrablecido con Pitts. Pitts escribió una larga tesis de las propiedades de las redes neuronales conectadas en tres dimensiones. Lettvin le describió como el genio del grupo. Lettvin. Rechazó todas las ofertas de graduados avanzados o posiciones oficiales en el MIT ya que tendría que firmar con su nombre. McCulloch y Pat Wall.Pitts (IV)  En 1951 Wiener convenció a Jerry Wiesner para contratar algunos científicos del sistema nervioso. negando que su nombre se hiciese público.

a cuenta de su mujer que odiaba a McCulloch.   . El modelo matemático de una neurona se llama actualmente la neurona de McCulloch-Pitts.Pitts (V)  Wiener inesperadamente se puso en contra de McCulloch. La formulación teórica de la actividad McCullochneuronal del cerebro es el legado permanente de Walter Pitts y Warren McCullch a las ciencias cognitivas. un aislamiento social del que nunca se recuperaría. Pitts quemó el manuscrito sobre las redes tridimensionales y prestó poco más interés en el trabajo. La única excepción fué una colaboración con Robert Gesteland que produjo un artículo sobre el olfato. y separó las relaciones con cualquiera que estubiese relacionado con él. Esto empujó a Pitts a un ´suicidio cognitivoµ. Pitts murió en 1969. incluido Pitts.

La salida Sj de la neurona es una función de la activación de ésta.La Neurona McCulloch-Pitts (I) McCulloch McCulloch y Pitts propusieron en 1943 uno de los primeros modelos matemáticos de una neurona.    . y el subíndice j que se trata de la neurona j. del que se basan las redes neuronales actuales. El subíndice i refleja que el peso afecta a la entrada i. Cada entrada i está afectada por un coeficiente que se denomina peso y que se representa por wij. La cantidad calculada como la suma del producto de cada entrada multiplicada por su respectivo peso se denomina activación de la neurona xj. Si. En este modelo. Es decir: xj = Si*wij + Qj Sj = f(xj) Donde el término Qj es un valor umbral y f(xj) es una función de la activación de la neurona. y una sola salida Sj. cada neurona consta de un conjunto de entradas.

La Neurona McCulloch-Pitts (II) McCulloch-  Una de las primeras arquitecturas neuronales donde se aplica es el Perceptrón. y sigmoidea. salida de tipo binaria. lineal con umbral. . Esta es una función de umbral. y existen otras de tipo lineal puro. entre otras. que utiliza la siguiente función de salida: Sj=0 Sj=1 si xj < h si xj>=h donde la constante h se denomina umbral.

En la práctica. de forma que la variación de éstos origina distintas salidas para la misma entrada a la neurona. En definitiva. aprendizaje. Estas reglas son ecuaciones expresadas en función de las entradas y salidas de las neuronas y describen la forma de variación de los pesos.   . son el instrumento empleado por las neuronas para adaptarse a la información que se le presenta.La Neurona McCulloch-Pitts (III) McCulloch En este modelo tan sencillo puede verse que la activación de la neurona depende del valor que tomen los pesos y las entradas. los pesos de las neuronas se modifican sometiendo a la red a un entrenamiento. La red es capaz de retener y asociar el conocimiento a través de la adaptación de los pesos de las neuronas siguiendo una regla de aprendizaje. se «educa». Esta es la característica que diferencia a una red neuronal de una máquina algorítmica clásica: una red neuronal no se programa. permitiendo que la red realice una función determinada.

 .La Neurona McCulloch-Pitts (IV) McCulloch El aprendizaje de una red se puede producir de tres formas:  Aprendizaje supervisado: consiste en introducir una serie de patrones de supervisado: entrada a la red y a su vez mostrar la salida que se quiere tener. Aprendizaje autosupervisado: la propia red corrige los errores en la autosupervisado: interpretación empleando una realimentación.    Una de las primeras reglas de aprendizaje fue propuesta por Donald Hebb en 1949. Aprendizaje no supervisado: se presentan los patrones de entrada a la red supervisado: y ésta los clasifica en categorías según sus rasgos más sobresalientes. Esta se basa en un hecho biológico constatado: cuando dos neuronas se activan simultáneamente su conexión se refuerza. La red es capaz de ajustar los pesos de las neuronas de forma que a la presentación posterior de esos patrones de entrada la red responde con salida memorizada.

Sin embargo. en su libro The Organization of Behavior. Investigadores ilustres de esta época son Jackson. Donald Hebb presentaba su conocida regla Behavior. en 1949. de aprendizaje. los verdaderos avances en neurología se produjeron a partir de la segunda mitad del siglo XIX.  Fue en 1943 cuando Warren McCulloch y Walter Pitts propusieron el clásico modelo de neurona en el que se basan las redes neuronales actuales.Historia Redes Neuronales (I)  Partiendo de que las redes neuronales se fundamentan en el sistema nervioso humano deberíamos remontarnos a los tiempos de Galeno en los que ya se tenía un conocimiento considerable de éste. . Seis años después. Ramón y Cajal y Golgi entre otros.

de operación. la red «es capaz» de responder adecuadamente cuando se le vuelven a presentar los patrones de entrada. La principal aportación del Perceptron es que la adaptación de los pesos se realiza teniendo en cuenta el error entre la salida que da la red y la salida que se desea. se realiza en dos fases: una primera en la que se presentan las entradas y la salidas deseadas. por tratarse de una red supervisada.   . en esta fase la red aprende la salida que debe dar para cada entrada. neuronal con aprendizaje supervisado cuya regla de aprendizaje era una modificación de la propuesta por Hebb. El Perceptron trabaja con patrones de entrada binarios. una red Perceptron. Se crearon grandes expectativas sobre sus aplicaciones. Frank Rosenblatt presentó el Perceptron. que posteriormente se tornaron en gran decepción cuando en 1969 Minsky y Papert demostraron las grandes limitaciones de esta red.Historia Redes Neuronales (II)  En 1957. y su funcionamiento. En la fase siguiente.

calculado como la diferencia entre la salida deseada y la dada por la red. Madaline.Historia Redes Neuronales (III)  En los años 60 se propusieron otros dos modelos. la regla de aprendizaje hace que la variación de los pesos se produzca en la dirección y sentido contrario del vector gradiente del error. basados en el Perceptron de Rosenblatt denominados Adaline y Madaline. la regla de aprendizaje empleada es distinta. A esta regla de aprendizaje se la denomina Delta. al igual que en el Perceptron. En estos. también supervisados. Así. Sin embargo. Se define una función error para cada neurona que da cuenta del error cometido para cada valor posible de los pesos cuando se presenta una entrada a la neurona.   . la adaptación de los pesos se realiza teniendo en cuenta el error.

La solución del problema consiste en añadir capas intermedias de neuronas. La diferencia entre ambas constituye un error que se propaga hacia atrás desde la capa de salida hasta la de entrada permitiendo así la adaptación de los pesos de las neuronas intermedias mediante una regla de aprendizaje Delta. La contribución de Minsky y Papert fue la de demostrar que una red del tipo Perceptron no es capaz de aprender todas las posibles combinaciones entre entradas y salidas. En éste se compara la salida real con la salida deseada. Posteriormente se han desarrollado otros modelos que permiten un aprendizaje no supervisado como el mapa auto-organizativo de Kohonen. Sin embargo.Historia Redes Neuronales (IV)  La era moderna de las redes neuronales artificiales surge con la técnica de aprendizaje de propagación hacia atrás o Back Propagation. Gaudiano y Grossberg. o los modelos de control motor de Bullock. entre otros. introduciendo de esta forma el problema de cómo enseñar a estas capas intermedias. Propagation. Aquí es donde tiene importancia el algoritmo de propagación hacia atrás. los basados en la autoTeoría de Resonancia Adaptativa (ART) de Grossberg y Carpenter. también tiene sus limitaciones.     .

Talking Nets: An Oral History of Neural Networks.edu/MITECS/Entry/lettvin1) . Anderson and Edward Rosenfeld. MA. Walter. MIT Encyclopedia of Cognitive Science. Warren S. Edited by James A. The interview with Jerome Lettvin discusses Walter Pitts. 1998. (1965).Referencias (I)     http://www.wikipedia. Cambridge. Mind.mit.org McCulloch. Pitts. (http://cognet. Embodiments of Mind. MIT Press.

(1990). Lehr. pp. IEEE Transactions Perceptronon Neural Networks.A. E. 1998. Large margin classification using the perceptron algorithm. The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain. Perceptron-based learning algorithms. Y." Proc. In Proceedings of the 11th Annual Conference on Computational Learning Theory (COLT' 98). no 9. "30 years of Adaptive Neural Networks: Peceptron. 179-191. Psychological Review.Referencias (II) PERCEPTRÓN:       Freund. 2. 386-408. M.. 1415-1442. Gallant. 6. 12.. . vol 78. Cornell Aeronautical Laboratory. IEEE. v65. vol. I. Madaline. MA: MIT Press) Novikoff. 386Minsky M L and Papert S A 1969 Perceptrons (Cambridge. 615-622. B. B. and Schapire. A. pp. no. pp. (1962). 1. R. 179Rosenblatt. No. 1415(1990). S. Symposium on the Mathematical Theory of Automata. ACM Press. IEEE. and Backpropagation. Polytechnic Institute of 615Brooklyn. On convergence proofs on perceptrons. Widrow. Frank (1958).

Physiol. Jerome Lettvin and Walter Pitts. Activity. 1960. Warren McCulloch. 19401959 Humberto Maturana. Warren McCulloch.Referencias (III)  Introducción a las redes neuronales artificiales. 1955. 9:127Howland. Jerome Lettvin. Humberto Maturana. Bulletin of Mathematical Biophysics 5:115-133. 18:1Wall. interaction. 43:129--175 Robert Gesteland.html) PUBLICACIONES: PUBLICACIONES:        Warren McCulloch and Walter Pitts. 4:29Jerome Lettvin. Anatomy and physiology of vision in the frog.. 181.es/login/login/13/redesn.gui. 5:115Warren McCulloch and Walter Pitts. 1955. Warren McCulloch. Reflex inhibition by dorsal root interaction. forms. and Walter Pitts. Journal of Neurophysiology 18:1-17. Chemical Transmission in the Nose of the Frog. J. 1947. What the Frog's Eye Tells the Frog's Brain. fibres. A Logical Calculus of Ideas Immanent in Nervous Activity. P. Jerome Lettvin and Walter Pitts. artificiales. Proceedings of the Institute of Radic Engineers 47: 1940Brain. 1959. Effects of strychnine with special reference to spinal afferent fibres. 4:29-40. D. 43:129--175 frog. Journal of General Physiology. Epilepsia Series 3. (www. and P. 525-529. and Walter Pitts. Warren McCulloch. 525- .. Wall. 1965. D. Frog. R. Alfredo Catalina Gallego.uva. On how we know universals: The perception of auditory and visual forms. Bulletin of Mathematical Biophysics 9:127-147. Walter Pitts. Jerome Lettvin. 1943.

Sign up to vote on this title
UsefulNot useful