Está en la página 1de 20

1

Mayol, J. (2013) El conductismo como teoría del Aprendizaje. En Corbo


Zabatel, E. y Mayol, J. (comps.) Teorías del aprendizaje. Una introducción a
algunos de sus problemas fundamentales, Buenos Aires, Editorial Mnemosyne.
2

CAPÍTULO 2

EL CONDUCTISMO COMO TEORÍA DEL APRENDIZAJE│ Juan de


la Cruz

Introducción

En el presente capítulo presentaremos los postulados


básicos del conductismo como teoría y programa de investigación
científica del aprendizaje. Para ello, vamos a retomar los
conceptos expuestos en el capítulo 2 del libro anterior, en donde
ya hemos hecho un desarrollo de los conceptos fundamentales
que atañen a esta escuela psicológica, refundada en EEUU por
Watson1. Tendremos en cuenta que el conductismo representa un
intento deplantear una novedosa psicología científica,
extrayéndola del campo de la filosofía, lo cual conminaba a la
joven ciencia a reducirse a una especulaciónfilosófica acerca del
sujeto que piensa. Esto significaba para él poner a la psicología
de pie, y ubicarla entre las demás ciencias positivistas en auge en
ese momento histórico del comienzo de siglo pasado. El punto de
partida de Watson es que el objeto de la psicología es la conducta
observable.

1
John Broadus Watson (1878-1959) funda el behavorismo (behavior:
conducta en inglés) a principios del siglo pasado. Postula su manifiesto
conductista en una serie de conferencias realizadas en la Universidad de
Columbia en 1913, en las cuales señala que el hombre debe ser considerado
como una especie más de las muchas especies del orden animal, y que por ello
hay que estudiarlo como un organismo que reacciona ante los estímulos del
mundo físico. Proclama la renuncia a la difícil tarea de conocer la mente o la
conciencia, como fenómeno inasible del organismo, cometido que delega a la
filosofía.
3

“... el concepto de conciencia no es preciso, ni siquiera


utilizable. (...) nadie ha palpado nunca un alma, o la ha visto en
un tubo de ensayo, o ha entrado de alguna manera en relación
con ella, como puede hacerlo con los otros objetos de su
experiencia diaria.” (Watson, 1925).
Watson proponíadiferenciarse, con este cambio científico
que promovía para esta nueva ciencia, de otras psicologías como
la Psicología de la Conciencia de Wundt, que intentaba producir
conocimiento científico a partir del método introspectivo,
procedimiento que para Watson era inaceptable por carecer de
toda rigurosidad.Los criterios de cientificidad con que se
construía el edificio del conductismo como ciencia de la
conducta, eran extraídos de las ciencias físicas y naturales:La
conducta observable esun hechoobjetivo, que puede conocerse
científicamente a partir del diseño experimental, lo que significa
que puede determinarse la causa material de la conducta como
respuesta a partir de los estímulos del ambiente que la causan.
Esta concepción psicológica tiene un fundamento epistemológico
empirista, como veremos enseguida, lo que implica una mirada
mecanicista y asociacionista del comportamiento humano. Una
mirada de este tipo supone que las respuestas, explicadas por el
postulado asociacionista que presentamos más abajo, pueden
sumarse conformando la conducta como una suma de respuestas
simples, molecularmente organizadas. La concepción de sujeto de
esta importante teoría ya ha sido desarrollada en el capítulo 2 del
libro anterior al que ya nos referimos, constituyendo lo que se ha
dado en llamar el problema de la “caja negra” en el conductismo:
la idea de que no es necesario estudiar o inferir lo que ocurre
adentro de la mente porque es metodológicamente imposible,
como planteaba Watson; o bien, porque lo que creemos percibir
como la mente no es sino el cuerpo mirado desde dentro, como
postulaba Skinner. A estas dos posiciones acerca de la necesidad
de no meterse con lo que ocurre adentro de la persona, o en su
mente, se las distingue como el conductismo metodológico de
Watson, que postula la inconveniencia metodológica de incluir la
mente como objeto de estudio, y el conductismo radical de
4

Skinner, que postula la inexistencia del fenómeno mental como


tal. Estos postulados positivistas que inauguran quizás el proyecto
más ambicioso que haya tenido la psicología, ubican al
conductismo como explicación completa de la dinámica del
aprendizaje, un intento programático de explicar todos los
cambios de la conducta de todos los organismosa partir de las
leyes del condicionamiento “clásico” y “operante” que
explicaremos más abajo.

Marco teórico

El conductismo como programa de investigación


científica (Pozo, 1989) es una corriente amplia y diversa dentro
de la cual conviven diferentes “afluentes”, y que consta de una
serie de principios fundamentales. Podemos ordenarlos en dos
grupos para su consideración teórica: hay principios excluyentes
del marco (A y B), y otros principios accesorios, que pueden ir
variando (1, 2, 3 y 4), según las distintas formas o modelos que
esta amplia corriente psicológica contiene.

A) El asociacionismo es una concepción filosófica del


conocimiento y del aprendizaje, cuyo origen documentado se
remonta a Aristóteles, y posteriormente se actualiza en lo que
suele llamarse “empirismo inglés”, a través de la figura del
filósofo David Hume (1711-1776). Este principio general señala
que el conocimiento humano está constituido exclusivamente por
asociaciones, relaciones entre impresiones (percepción) e ideas
(pensamiento). Todo lo que hay en la mente tiene origen externo,
e ingresa a través de la percepción. El conocimiento se alcanza
mediante la asociación de ideas, según los principios de
semejanza (taza y vaso), de contigüidad espacial (taza y plato),
contigüidad temporal (rayo y trueno) y de causalidad (cerrojo y
apertura de la puerta). Esto se concibe en el conductismo 2 como

2
Lo cual supone una aplicación muy particular del principio asociacionista de la
filosofía clásica, en la medida que la relación percepción/idea tiene poco que ver
con la relación estímulo/respuesta.
5

el principio de correspondencia entre los estímulos y las


respuestas, y es parte del núcleo central de su programa de
investigación científica, y de su teoría psicológica concomitante.
Todos los conductistas, con diversos matices, adoptan esto como
constructo fundamental para la explicación del aprendizaje, tanto
de la conducta animal como humana.

B) El otro axioma es el principio de equipotencialidad:


principio metodológico por el cual las leyes del aprendizaje se
postulan igualmente para todos los ambientes, especies e
individuos. Es decir, la única manera de aprender es por la ley de
asociación. Presupone que los estímulos y respuestas son
equivalentes en todos los individuos, en cualquier momento de su
desarrollo y para todos los contenidos a ser aprendidos. También
afirma la universalidad filogenética de los mecanismos
asociativos: habría una continuidad en los modos de aprendizaje
de todos los organismos (aprende igual una paloma que una
persona).
Hay también otros postulados que se encuentran en lo
que podríamos llamar el “cinturón protector” (Pozo, 1989), en la
periferia del “núcleo” teórico (A y B). Estas ideas no serán
compartidas necesariamente por todas las versiones del programa
de investigación conductista, aunque son características clásicas
del modelo:
1. El ambientalismo extremo: expresa el desinterés por cualquier
factor interno en el aprendizaje, como la determinación genética,
madurativa, o cualquier aspecto mental que no tenga un origen
ambiental, como las intenciones de la persona, lo que piensa, sus
deseos, etc., factores internos que quedan ocultos en lo que
hemos llamado la “caja negra” del conductismo, donde se
encierra cualquier factor que no sea observable a simple vista.
2. El reduccionismo “antimentalista”: es la negación absoluta y
de partida de la posibilidad de estudiar los estados y procesos
mentales; por lo cual rechaza también al método introspectivo,
que es uno de los modos de abordar estos procesos internos. No
6

es siempre la negación de la propia existencia de la mente, sino


en general de su abordaje, por la simple razón que no es accesible
a sus principios metodológicos de aproximación al fenómeno: la
observación.
3. Otro rasgo accesorio del programa conductista es la idea del
sujeto pasivo, o sea la imposibilidad del sujeto de causar o
modular voluntariamente las respuestas, o cualquier modo de
operar mentalmente sobre el medio que nos determina: el libre
albedrio y la voluntad no serían sino ilusiones humanas dentro de
esta perspectiva.
4. Finalmente, el rasgo que más conocemos, comoteoría del
aprendizaje E-R. Teoría que deriva de algunos principios de la
escuela rusa, la psicología reflexológica encarnada por Bechterev,
pero sobre todo generada a partir de retomar de un modo muy
particular los principios sustentados por Iván Pavlov (1848-
1936).
Dada la importancia fundacional de este último autor, nos
detendremos un momento en él, dado que Pavlov es el creador de
la escuela conductista. Este fisiólogo desarrolló el modelo del
arco reflejo y su condicionamiento, pero lo usó como
metodología o técnica para estudiar la actividad nerviosa superior
(que era su objeto de estudio), o sea dentro de su análisis
neurofisiológico (Azcoaga, 1979). La idea elementalista y
asociacionista que proponía metodológicamente era recortar las
unidades mínimas (el estímulo y la respuesta más simple) para
estudiar su relación: cómo un elemento determina a otro
causalmente. El experimento clásico fue la respuesta salival de
los perros, que originariamente ocurre en contacto del alimento
sobre la lengua; es decir, que el alimento es el estímulo
incondicionado3 a la respuesta incondicionada de salivación. Pero

3
Los estímulos incondicionados son los que en cada especie causan respuestas
incondicionadas de partida, y se encuentran en el programa genético de cada
especie. Hay también estímulos neutros, que no están previamente conectados a
respuestas. Las respuestasemocionales incondicionadas son para Watson el
7

Pavlov advierte que si concomitantemente se hace sonar una


campana cada vez que se le presenta al perro la comida, luego de
cierto número de repeticiones, el sonido de la campana sin la
presentación del alimento provocará la respuesta (la salivación).
Esta respuesta se denomina ahora “respuesta condicionada”.
Decimos que está condicionada porque es una respuesta a un
estimulo condicionado (el sonido de la campana) que no ocurre
espontáneamente en la respuesta natural del perro, sino que ha
sido condicionada por su asociación contingente con la comida.

Los grandes desarrollos teóricos conductistas:


El condicionamiento clásico (Watson) y el operante (Skinner)

Si postulamos teóricamente y probamos que el


aprendizaje está basado en una relación observable entre un
estímulo del ambiente y lo que le sigue siempre, una respuesta
del organismo, estamos conformando una relación sujeta a leyes
científicas de causalidad: las leyes de condicionamiento “clásico”
y “operante”. Esta idea extraída del modelo del arco reflejo
estudiado por Pavlov, sufre una transformación importante en la
creación del conductismo estadounidense como escuela
psicológica, dado que se orienta a un objeto de estudio diferente a
los intereses neurofisiológicos de Pavlov. El objeto de estudio
watsoniano es la conducta “respondiente”: la respuesta que es
efecto directo de un estímuloantecedente y que está presente en el
ambiente del sujeto. Skinner, en cambio, estudia la conducta o la
respuesta “operante”, que es la respuesta que tiene como efecto
generar un estímulo, operar sobre el medio por una recompensa.
Esta respuesta operante sólo es emitida por el sujeto ante la
presencia de un indicio específico presente en el ambiente.
Explicaremos esto con más detalle abajo.

miedo, la ira y el júbilo o alegría, causados por sus correspondientes estímulos


incondicionados: sonido intenso y agudo o falta de sustentación para el miedo,
retención de las extremidades para la ira, y el suave contacto por ejemplo en las
mejillas para la alegría.
8

El condicionamiento “clásico” como mecanismo explicativo


del aprendizaje

La psicología conductista “... se propone como meta el


que dado el estímulo, se pueda predecir la respuesta; o, viendo
qué reacción tiene lugar, inferir cuál es el estímulo que la ha
provocado.” (Watson, 1925). Este autor describió un principio de
condicionamiento en su histórico experimento de aprendizaje
humano, el “condicionamiento de reacciones emocionales”
(Watson y Reyner, en Gardner 1988). El canónico experimento se
hizo con un niño de once meses, Albert, quien como es normal
para su edad, no tenía ningún temor a las ratas4. El niño, ante la
presentación de uno de estos pequeños mamíferos,
espontáneamente quería tomarlo como si fuese un juguete y lo
perseguía sonriendo. El experimento consistió en lo siguiente: se
colocaba al niño delante del roedor y cada vez que Albert lograba
acercársele, el experimentador producía a sus espaldas un sonido
agudo y muy intenso, impactando dos barras de metal entre sí,
sonido que naturalmente5 lo asustaba. Luego de repetir esta
secuencia algunas veces, se produjo lo que el investigador quería
demostrar: la simple cercanía de la rata hacía que el niño se
asustara y se alejara de ella rompiendo en llanto. Para Watson,
Albert había “aprendido” a temer a las ratas.En términos
conductistas el bebé aprendió, dado que el miedo como respuesta
ante la visión de una rata no está programada genéticamente, no
nacemos con ese miedo. El estímulo condicionado
artificialmente, la presencia de la rata, se asocia a una respuesta
como el miedo, que en realidad es producida por el sonido del
impacto entre las dos barras de hierro, formando una relación
nueva, que antes no existía entre la visión del roedor y la
respuesta emocional condicionada.

4
No hay una reacción genéticamente determinada para los humanos, es un
estímulo neutro.
5
Por ser el sonido intenso y agudo un estímulo innato, incondicionado para los
humanos que provoca miedo, llanto o huída.
9

Se llama condicionamiento clásico o watsoniano a la


relación entre el estímulo condicionado artificialmente, la visión
de la rata, a la respuesta de miedo. Pero esto no debe hacernos
perder de vista otra relación, la de los dos estímulos utilizados:
el incondicionado, (sonido agudo) y el condicionado (la visión
de la rata, que antes era un estímulo neutro), ese sonido se
aparea a esa visión, y ésta luego sustituye al estímulo
originalmente innato en la producción de la respuesta. El
condicionamiento clásico supone entonces también, una
relación de sustitución entre los dos estímulos, en la producción
de la misma respuesta.
Cuando este proceso de asociación entre estímulo y
respuesta ocurre de modo tal que la respuesta (miedo) asociada al
estímulo condicionado (rata) se “desplaza” también a otros
estímulos (tapados de piel, peluches, perros, etc.), se dice que se
ha generalizado la respuesta condicionada. El proceso opuesto a
la generalización es la discriminación del estímulo, en el cual la
respuesta aparece sólo ante un estímulo específico.
De los resultados de estas primeras investigaciones
deriva el poderoso principio de la conducta “respondiente”
watsoniana. De acuerdo a su concepción era posible condicionar
a todos los organismos, por ejemplo personas, para que hicieran
cualquier cosa que el investigador (o un maestro, un político, etc.)
quisiese, con sólo disponer de un modo particular los estímulos
del medio circundante.
“Denme una docena de niños sanos y bien formados y
permítanme cuidarlos de acuerdo con mi entorno y me
comprometo a escoger uno al azar y lo entrenaré para
convertirlo en la clase deespecialista que yo prefiera: médico,
abogado, artista, hombre de negocios y hasta mendigo o ladrón,
haciendo caso omiso de sus gustos, talentos, tendencias,
capacidades, vocaciones y razas de sus antepasados.”(Watson,
1961).
La conducta es por lo tanto en esta teoría una función del
ambiente. El ambiente, o los estímulos que lo componen, es la
clave en el aprendizaje del niño. Los innumerables y pétreos
10

rituales de la vida escolar llevan incorporado este secular


mandato conductista, que refleja en su inexorable permanencia su
valioso poder formativo:

El condicionamiento “operante” como mecanismo explicativo


del aprendizaje

La evolución del conductismo cobra impulso por las


ingeniosas ideas introducidas por Skinner 6 sobre el modelo inicial
de Watson. El papel del ambiente como causa general de la
conducta de los organismos se desarrolla y complejiza de modo
notable. Si bien el ambiente no pierde su valor primordial,
determinante, se agrega un nuevo y diferente proceso de
condicionamiento, dado que el organismo también opera sobre el
medio que lo estimula. Hay una interacción recíproca entre los
estímulos y las respuestas, entre el sujeto y el ambiente, de modo
tal que las respuestas del sujeto son a la vez estímulos para otros
organismos en la interacción. En una clase, por ejemplo, no sólo
el docente condicionaría con estímulos las respuestas de los
alumnos, sino que esas respuestas de ellos son estímulos que
condicionan la conducta del docente.
El mecanismo específico de asociación entre estímulo y
respuesta en el condicionamiento operantes kinneriano, es
distinto al del condicionamiento clásico formulado anteriormente
por Watson. En el condicionamiento operante no hay una
asociación de apareamiento entre dos tipos de estímulos y el
relevo de uno por otro, sino que hay una relación asociativa entre
la respuesta operante del sujeto y el estímulo que aparece -a

6
Burrhus Frederic Skinner (1904/1990) nace en Pensilvania, EE.UU. Concurre a
la Universidad de Harvard donde se gradúa en psicología (1930) y culmina el
doctorado un año después. Trabajó en la Universidad de Minnesota, Indiana y
Harvard. Sentó las bases psicológicas para la llamada “enseñanza programada”.
Desarrollo sus principios del análisis de la conducta y sostuvo que era
indispensable una tecnología para el cambio de la conducta. Atacó la costumbre
contemporánea de utilizar el castigo para cambiar la conducta y sugirió que el
uso de las recompensas y refuerzos positivos de la conducta correcta era más
atractivo desde el punto de vista social, y pedagógicamente más eficaz.
11

diferencia de Watson- posteriormente a la respuesta. Esta


relación asociativa tiene la característica particular de que es la
consecuencia de la respuesta del sujeto sobre el medio lo que
condiciona la propia aparición de su conducta la próxima vez
que se encuentre en igual situación. Además se plantean ciertas
condiciones de producción de las respuestas de este “sujeto de la
conducta operante”, como la presencia obligada de un indicio, de
cierto estímulo discriminativo o clave en el ambiente. El
organismo emite la respuesta sólo ante este estímulo clave, pero
sin que este estímulo determineo cause dicha conducta, como
ocurre en el condicionamiento clásico. Estos elementos
configuran un proceso de condicionamiento que supone una
lógica diferente a la de Watson, en la medida que no es el
estímulo inicial el que causa o comienza la secuencia de la
conducta condicionada, sino que es la conducta operante del
organismo que responde selectivamente ante el estímulo clave, la
que inicia la secuencia asociativa (no es un condicionamiento
respondiente). Esta diferencia supone además que ha cambiado la
unidad de análisis de la conducta. Watson estudia la conducta
observable como aquello que ocurre entre estímulo y respuesta,
de allí el mote a la teoría “modelo E - R”. Y Skinner agrega otro
elemento en lo que llamará las contingencias de reforzamiento: el
estímulo clave, resultando una unidad de análisis que puede
representarse como E - R - E. La conducta operante o
instrumental de Skinner es lo que ocurre entre la presentación del
estímulo clave y el estímulo reforzador, como enseguida
veremos.
Imaginemos cualquier ejemplo de interacción en un salón
de clases con alumnos. Los niños responden de un modo
específico cuando escuchan las preguntas que el docente les
formula (estímulo clave), e intentan responder a ella expresado su
parecer (conducta operante). Luego de esta respuesta particular
ante la pregunta del docente, y si la respuesta es acertada, el
docente felicita al niño por ejemplo con un “¡muy bien!”
(estímulo reforzador). Estamos ante un caso más de lo que
Skinner llamaría una respuesta operante: ante determinado
12

estímulo clave (pregunta del docente), la conducta opera sobre el


medio ambiente produciendo consecuencias, por ejemplo, que lo
feliciten o lo pongan una buena nota. Es decir, la respuesta del
alumno como conducta operante justamente opera sobre la
persona que lo felicita, dado que el docente no lo hace si esa
conducta acertada no aparece. Se comprueba estadísticamente (lo
cual es una explicación determinista más morigerada) que esa
felicitación que llamaremos estímulo reforzador7 eleva la tasa de
probabilidad de que se repita la misma respuesta o aumente, en
una ocasión futura y ante la presencia del mismo estímulo clave.
El principio que rige esa respuesta específica (operante)
es denominado por Skinner condicionamiento operante. Es una
relación de contingencia muy particular entre tres términos: el
estímulo clave, la respuesta (operante) y el estímulo reforzador.
La clave del proceso que postula Skinner es que la propia
conducta -responder acertadamente- incide sobre los estímulos
que vendrán luego –por ejemplo la recompensa- y en ese sentido,
opera sobre el medio. Opera sobre aquello que opera sobre sí, un
modo instrumental de procurarseestímulos (por ejemplo
felicitaciones o buenas notas), como es hacer algo para recibir
recompensa o evitar un castigo. Desde un punto de vista
funcional, la respuesta acertadadel estudiantees lo que causa
también la conducta del docente de felicitar, es decir, él también
está condicionado, se opera también sobre él.
Este proceso puede entenderse en oposición a la conducta
“respondiente” watsoniana, que supone un sujeto más pasivo o
controlado directamente por el estímulo presente en el medio
ambiente: El proceso de condicionamiento “clásico” comienza
con el estímulo, y se condiciona la respuesta a dicho estímulo
condicionado. En el condicionamiento operante la respuesta es la
que inicia la secuencia condicionada, dado que esta secuencia

7
Reforzador: Estímulo que al presentarse en una situación (reforzador positivo)o
al aumentar, o bien, al desaparecer o disminuir (reforzador negativo), aumenta
la posibilidad de una nueva aparición de esa respuesta en una próxima situación
similar. O lo que es lo mismo, el reforzador es el estímulo que refuerza la
conducta en un sentido positivo (aplicándolo) o negativo (extrayéndolo).
13

está controlada por la consecuencia que tiene esta conducta sobre


el medio, por el hecho de que genera la recompensa, y no está
causada por el estímulo ante el cual se emite la respuesta
(estímulo discriminativo o clave). En el ejemplo, la respuesta
acertada del alumno no está determinada por la pregunta del
docente, sino por la felicitación que aparece luego de la
respuesta.
“Aunque el condicionamiento del tipo S (clásico) explica
tales comportamientos como reacciones emocionales
condicionadas, casi todas las conductas son emitidas en
presencia de estímulos, antes que provocados automáticamente
por ellos. Las respuestas son controladas por sus consecuencias,
no por los estímulos que las anteceden.” (Schunk, 1997).
De modo tal que podemos observar cómo ante un estímulo clave,
se produce una respuesta aparentemente “voluntaria” 8, la cual
puede ser reforzada de manera positiva o negativa provocando
que la conducta operante se fortalezca. También puede ocurrir el
proceso llamado extinción operante: cuando deja de aplicarse un
estímulo reforzador satisfactor9, la respuesta operante ocurre cada
vez con menos frecuencia. Esta extinción de la respuesta
operante, sin embargo, se produce mucho más lentamente que el
proceso original que generó la respuesta operante.

El refuerzo y el castigo como procesos

El refuerzo y el castigo son dos procesos dentro del


análisis funcional de la conducta que hace Skinner: El refuerzo es
el proceso que aumenta la tasa de probabilidad de que se repita

8
La conducta tradicionalmente llamada voluntaria en psicología es para el
conductismo producto de un mecanismo seleccionado naturalmente, y no
supone para Skinner la determinación de la conducta por una mente que planea
y decide la acción, esto sería una ilusión, para los conductistas, de los que no
ven las leyes naturales y universales de condicionamiento. En el capítulo 2 del
libro anterior se ha explicado esta perspectiva de Skinner a partir también de su
literatura.
9
O cuando deja de quitarse uno aversivo, en ambos casos constituye lo que más
abajo llamaremos “castigo negativo”.
14

una conductao aumente en circunstancias similares, o ante el


mismo estímulo clave; y el castigo es el proceso que tiende a
desaparecer o disminuir la tasa de repetición de una respuesta
operante específica ante un estimulo clave o discriminativo. El
procesode “refuerzo” o “reforzamiento” necesita como un
elemento, dentro delatotalidad del proceso, al estímulo que
llamamos “reforzador”, pero no son lo mismo. El refuerzo o
reforzamiento es todo el proceso, y el reforzador es sólo un
elemento dentro de ese proceso, como también lo es el estímulo
discriminativo. En el ejemplo que acabamos de ver, el refuerzo o
reforzamiento como proceso es la contingencia de los tres
términos, como una totalidad que aumenta la conducta: la
pregunta, la respuesta y el premio. En cambio el reforzador es
sólo el premio, es decir la felicitación.

Las dos modalidades del proceso de refuerzo o reforzamiento

Refuerzo positivo: Este tipo de proceso de refuerzo es


provocado por la aparición o aplicación de reforzadores
satisfactores10, seguidamente (de modo contingente) a una
conducta específica, de modo tal que estos estímulos reforzadores
aumentan la probabilidad de que esa conducta vuelva a ocurrir
en el futuro, siempre ante la presencia –también contingente- del
mismo estímulo clave.
Refuerzo negativo: Es el tipo de refuerzo que también
aumenta la probabilidad de que se manifieste la conducta, en este
caso, como consecuencia de la disminución o la extracción de la
situación de un estímulo “aversivo”, en este caso un reforzador
negativo11. Por ejemplo, una alumna de violín a la que se le
obliga concurrir a sus clases y permanecer en ellas durante dos
horas, se la deja ir antes si ejecuta el ejercicio perfectamente.
Entendiendo que para la alumna permanecer en la clase es
aversivo, de modo tal que ante la situación de estar en la casa del

10
Es el reforzador que aumenta la conducta al aplicárselo a la conducta
operante.
11
Aquel que aumenta esa conducta al extraérselo de la situación o disminuirlo.
15

profesor de música, y ante la mirada evaluadora del mismo


(estímulo discriminativo), ella ejecuta correctamente la partitura
(conducta operante) para poder salir antes (extrayendo el
reforzador negativo “quedarse hasta el final”). Se extrae la
presencia de un estímulo o una situación insatisfactoria para ella.

Las dos modalidades del proceso de castigo

Los dos modos del proceso de castigo tienen el mismo


efecto: debilitar, disminuir o intentar suprimir una respuesta
operante. Consiste en presentar un estímulo reforzador aversivo
o bien retirar un estímulo reforzador satisfactor, un“premio”,
inmediatamente después de la conducta que se quiere remover,
disminuyendo la probabilidad de repetición de dicha conducta
en el futuro. El castigo fue desaconsejado por Skinner, dado que
suprime temporalmente pero no elimina la respuesta indeseable,
en la medida que empieza a faltar el reforzador específico (la
aplicación de un estímulo aversivo o la suspensión de uno
apetecible) la conducta tiende a reaparecer progresivamente. Un
ejemplo de esto sería cuando un niño no quiere hacer la tarea
escolar (conducta operante) sentado ante el cuaderno de clase en
la mesa de su casa (estímulo discriminativo), y se lo castiga por
ello gritándole, (estímulo reforzador aversivo) o negándole ver
televisión (estímulo reforzador satisfactor). Si se deja de
castigar esa conducta inapropiada para sus padres, la conducta
tenderá a reaparecer nuevamente.

Implicancias del conductismo como teoría general del


aprendizaje para las aplicaciones educativas

El conductismo es un programa de investigación que


intentó construir una teoría general del aprendizaje, a partir de los
principios básicos del cambio conductual observable que ya
hemos visto. Su aplicación a la práctica educativa es directa: la
enseñanza es la disposición ordenada, organizada y secuenciada
de estímulos reforzadores o contingencias de reforzamiento. El
16

moldeamiento de los hábitos a partir de un programa de


reforzamiento es el proceso de condicionamiento de habilidades
específicas que debe organizar el docente, y que constituye la
base científica de la acción educativa para el conductismo. Este
proceso consiste en hilvanar secuencialmente y de modo
progresivo diferentes respuestas que son partes componentes de
una habilidad o un hábito complejo. Es una delicada artesanía,
que se observa “en crudo” en el entrenamiento de las fieras de un
circo, como también en la constitución “ingenieril” de la postura
corporal y el modo de avanzar haciendo un tipo específico de
pasos en el tango. Si queremos hacer pasar un león a través de un
aro en llamas, no tenemos más que ir reforzando positivamente
las diferentes acciones que esta compleja habilidad integra.
Primero reforzamos el mirar el aro, luego su acercamiento, luego
le mostramos un pedazo de cebo a través del aro y se lo damos si
pasa por éste, luego encendemos el aro, etcétera.Los programas
de refuerzo desarrollados por los conductistas son pautas o reglas
que determinan la forma y el momento en que la emisión de una
respuesta va a ir seguida de un reforzador. Constituyen una
sistematización del régimen de estímulos reforzadores a partir de
los principios de condicionamiento investigados por el
conductismo, y orientado a optimizar el cambio programado de la
conducta. Son utilizados (aunque no siempre concientemente) en
el ámbito educativo, clínico y por supuesto cotidianamente.
Estos programas de reforzamiento se dividen en
continuos e intermitentes: Los programas de refuerzo continuo
suponen reforzar todas las respuestas operantes del tipo de la
requerida o planificada previamente, cosa que en general no
ocurre cotidianamente ni en el ámbito educativo. Los programas
de refuerzo intermitente suponen no reforzar todas las respuestas
sino algunas (es lo más común). Un ejemplo de esto es lo que
ocurre en la escuela, en la que se castigan las conductas
alimentarias dentro del aula, pero no es así en el recreo.
17

Los programas de reforzamiento intermitente 12 se dividen


a su vez en términos del tiempo o el númerode respuestas
necesarias para aplicar el reforzador: programas de intervalo y
programas de razón. Este tipo de programas, los intermitentes,
son más resistentes a la extinción de la respuesta operante, dado
que el organismo sigue emitiendo la conducta al no poder
predecir el tiempo o el número de respuestas para conseguir el
reforzador. Los programas de intervalo además se dividen en
fijos y variables:
Programa de intervalo fijo: Luego de la aplicación de un
reforzador, tiene que transcurrir un intervalo fijo de tiempo, antes
de que se aplique otro. Una vez pasado este intervalo
seráreforzadala primera respuestaoperante buscada que aparezca.
De este modo el organismoobtiene un reforzador cuando ejecuta
la respuesta correcta, pero solamente luego de haber transcurrido
el tiempo estipulado, independientemente del número de
respuestas dadas en el intervalo de tiempo designado. Un ejemplo
de esto es el salario, que aparece en un lapso de días fijo, siempre
y cuando sostengamos la conducta de ir a trabajar en tiempo y
forma luego de cumplida la quincena o el mes.
Programa de intervalo variable: El intervalo de tiempo
en la administración del reforzador de la conducta operante
deseada puede ser cambiante. Esto sirve para que el organismo no
termine emitiendo la conducta únicamente cada intervalo de
tiempo fijo o predecible. Un ejemplo de esto es la “prueba
sorpresa”, que puede condicionar el estudio constante, en la
medida que el alumno no puede predecir cuándo será evaluado.
En los programas de razón se refuerza cada vez que
ocurre un número x de repuestas, también pueden ser fijos o
variables, según se refuerce tras un número estipulado de
respuestas o ese número no está determinado:
Programa de razón fija: El sujeto es reforzado después
de cada cierta cantidad de respuestas. Por ejemplo, cuando se le

12
También los continuos.
18

da a un vendedor cierta suma o premio cada x número de ventas


exitosas.
Programa de razón variable: Se refuerza un promedio de
respuestas, por ejemplo a las 3 respuestas, luego a las 9, luego a
las 5 y luego a las 7, de modo tal que se esté reforzando en un
promedio de 6, pero nunca son el mismo número. Así el
organismo produce respuestas sin poder predecir cuánto tendrá
que “trabajar” para recibir su reforzador.

Vamos a presentar todos estos ítems en un cuadro sinóptico:

Continuos

Programas de De intervalo fijo o variable


reforzamiento
Intermitentes

De razón fija o variable

El conductismo dejó, además de una extensa


investigación, una tecnología (como los programas de
reforzamiento o “la máquina de Skinner” 13) y un conjunto de
principios teórico-prácticos que fundamentan gran parte de las
bases materialistas y mecanicistas de nuestra disciplina. No pudo
explicar todo14, pero sin tener en cuenta las aplicaciones clínicas
y sociológicas del modelo, representa el primer intento serio de la
ciencia de construir una teoría general del aprendizaje y de la
enseñanza, como ámbito de aplicación de la psicología. El vigor
del conductismo como ideario y como teoría se actualiza aún hoy
dentro de la cultura, tanto cotidiana como académica, como un

13
Especie de computador mecánico que Skinner diseño para el estudio
independiente de los alumnos, lo que según él optimizaría el aprendizaje
ahorrando recursos. Una versión “primitiva” de lo que son ahora los programas
informatizados de aprendizaje.
14
Al principio el programa avanzó con éxito sobre las respuestas simples, pero
donde tuvo que explicar respuestas más complejas, como la respuesta verbal, las
limitaciones de su modelo terminaron su imperio como teoría del aprendizaje.
19

modo de pensar la psicología, el aprendizaje y la educación.


Tanto los programas curriculares como las planificaciones
educativas se estructuran a partir de criterios implícitos de la
psicología clásica europea: la secuenciación y gradación de los
contenidos, la impronta transmisiva de los maestros, el
disciplinamiento de los cuerpos en los pupitres. En resumidas
cuentas, la idea general de la instrucción moderna. Esto se
desarrolla sistemáticamente en la “instrucción programada” de
Skinner: trabajar a partir de lo que el alumno ya hace,
explicitando los objetivos de aprendizaje en términos de acciones
observables, y mediante el arte de ir forjando gradualmente el
hábito, a partir de la operación táctica de los reforzadores.
Promover la enseñanza autónoma15 también forma parte del
acervo skinneriano, a través de la manipulación individual de los
materiales, características de una lógica tecnocrática que llegó
hasta la construcción de un dispositivo didáctico como la
“máquina Skinner”. El conductismo se actualiza y sobre todo
pervive, como sentido común e inconciente de padres y maestros,
en la práctica cotidiana y repetida donde permanece incólume, no
justamente por su irrelevancia para el aprendizaje o por lo vetusto
o anticuado del dispositivo. Es porque dentro de su dominio de
fenómenos naturales o biológicos, el conductismo “funciona”, es
una herramienta que sigue rígida y mecánicamente dando los
mismos resultados, con la fidelidad de todo proceso automático, de
toda inercia biológica, física y química. Esto revela el tipo de
“matrimonio” que hay entre el conductismo y la fisiología humana:
“El análisis comportamental reconoce la importancia de
la investigación fisiológica. Eventualmente se verá que lo que un
organismo hace se debe a lo que él es; por ahora, él se comporta,
y algún día el fisiólogo nos dará todos los detalles.” (Skinner,
1988).
No es posible arrojar por la ventana al conductismo, o
darle la espalda, desde una práctica educativa responsable.

15
No se refiere Skinner a la autonomía lograda por la participación en la
actividad conjunta orientada por un docente, en términos de Vigotsky, sinó de la
autonomía de la propia enseñanza, del estudio independiente.
20

Infelizmente para los oportunistas y los idealistas, no puede


obviarse el arco reflejo y el hábito condicionado, como no puede
obviarse la ley de gravedad de Newton o la hidráulica de Pascal.
No es posible prescindir de la dinámica biológica del cuerpo que
nos soporta materialmente. El conductismo como instrumento
“psicológico” solo puede utilizarse16, como se usa toda teoría que
recorta y explica algún aspecto del fenómeno complejo del
aprendizaje, evitando la práctica educativa ingenua, y en todo
caso, de cara a los designios que nuestra pedagogía oriente.

Bibliografía

Azcoaga, J. (1979). Aprendizaje fisiológico y aprendizaje


pedagógico. Buenos Aires, El Ateneo.
Gardner R. (1988).La nueva ciencia de la mente. Buenos Aires,
Paidós.
Pozo, J. (1989).Teorías cognitivas del aprendizaje. Madrid,
Morata.
Skinner, B. (1969).Ciencia y conducta humana.
Barcelona,Fontanella.
_________ (1970).Tecnología de la enseñanza. Madrid, Labor.
_________ (1972).Psicología de la Educación. Madrid, Morata.
_________ (1988).Sobre el conductismo. Buenos Aires,Fontanella.
Schunk, D. (1997).Teorías del aprendizaje. México, Prentice Hall
Hispanoamericana.
Watson, J. (l961).El conductismo. Buenos Aires, Paidós.

16
Rigurosamente uno actuaría aun sin saberlo de modo conductista, porque
condicionar y ser condicionado es inevitable, el problema se plantea en el nivel
de la conciencia y el dominio del fenómeno.

También podría gustarte