Está en la página 1de 50

!

"
#
$
%
&
'

)
&
*
+
)
,
-
#

.

/
.
0

!
"
#
$
%
!
"
#
&

1
'
,
-
#
"
#
2
3
4

5
&
"

4
1
6
&
7
5
,
8
4
9
&

!"#$%&"'$( *"%" *%+,#&,"( - $(#./&0
!"#$%#&' )$%*+'& ,'"%-&*.
/"'&0#$01 231&$1 435


()*+ $,
-./01-1./2314/(.
.5462/(4

2


-:;<=;>?:
1 Concept os bsi cos en el Condi ci onami ent o Operant e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1 Definicin del Condicionamiento Operante .................................................................................... 4
1.2 El proceso de condicionamiento operante: Variables terminolgicas ............................................ 5
2 Paradi gmas en el condi ci onami ent o operant e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1 Paradigmas bsicos del Condicionamiento Operante ................................................................... 7
2.2 Leyes bsicas del condicionamiento operante .............................................................................. 8
2.2.1 Leyes generales del aprendizaje de Thorndike ........................................................... 8
2.2.2 Leyes generales del condicionamiento operante ........................................................ 9
2.3 Diferencias condicionamiento clsico y operante .......................................................................... 9
3 El condi ci onami ent o apet i t i vo: el ref uerzo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.1 El concepto de refuerzo y los tipos de refuerzos ......................................................................... 11
3.2 Programas de reforzamiento ....................................................................................................... 11
3.2.1 Programas de Razn ................................................................................................. 12
3.2.2 Programas de Intervalo ............................................................................................. 13
3.3 Teoras del refuerzo ..................................................................................................................... 15
4 El ref uerzo secundari o y casos especi al es de condi ci onami ent o . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.1 El refuerzo secundario ................................................................................................................. 16
4.2 Casos especiales de condicionamiento de recompensa ............................................................. 17
4.2.1 La conducta supersticiosa ......................................................................................... 17
4.2.2 El condicionamiento operante verbal ........................................................................ 18
4.2.3 El condicionamiento instrumental autonmico .......................................................... 18
5 El condi ci onami ent o aversi vo: el cast i go . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
5.1 El castigo ..................................................................................................................................... 19
5.2 Tipos de castigos ......................................................................................................................... 19
5.3 La eficacia del castigo .................................................................................................................. 20
5.4 Factores que determinan la eficacia de un castigo. ..................................................................... 21
5.5 Problemas del castigo .................................................................................................................. 22
5.5.1 Inconvenientes del castigo: ....................................................................................... 22
5.5.2 Algunos efectos indeseables del castigo: .................................................................. 22
5.6 Algunos comentarios sobre la aplicacin del castigo .................................................................. 23
6 Fact ores det ermi nant es del condi ci onami ent o operant e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
6.1 Factores determinantes en el condicionamiento de recompensa ................................................ 24
3

6.1.1 La magnitud de la recompensa determina la fuerza del condicionamiento ............... 24
6.1.2 Efectos de contraste: la importancia de la experiencia pasada. ............................... 25
6.1.3 La demora de la recompensa. ................................................................................... 26
6.2 Factores que influyen en el condicionamiento de escape ........................................................... 26
6.3 Factores que influyen en el condicionamiento de evitacin ......................................................... 27
7 Adqui si ci n y ext i nci n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
7.1 La adquisicin .............................................................................................................................. 27
7.1.1 El registro acumulativo .............................................................................................. 27
7.1.2 El moldeamiento ........................................................................................................ 27
7.2 La extincin .................................................................................................................................. 28
7.2.1 El proceso de extincin ............................................................................................. 29
7.2.2 La resistencia a la extincin ...................................................................................... 30
8 General i zaci n y di scri mi naci n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
8.1 La generalizacin ......................................................................................................................... 32
8.2 El aprendizaje discriminativo ....................................................................................................... 33
9 Apl i caci ones educat i vas de l as t cni cas operant es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
9.1 Diseo y aplicacin de programas de condicionamiento en la intervencin escolar ................... 36
9.1.1 Identificacin realista del problema ........................................................................... 37
9.1.2 Determinar las personas que intervendrn en el programa conductual .................... 37
9.1.3 Eleccin de las metas-objetivo .................................................................................. 38
9.1.4 Observacin de la conducta ...................................................................................... 38
9.1.5 Identificacin de reforzadores ................................................................................... 39
9.1.6 Diseo del procedimiento de refuerzo ....................................................................... 39
9.1.7 Planificacin y aplicacin del programa de intervencin ........................................... 40
9.1.8 Evaluacin de la intervencin .................................................................................... 40
9.2 Mtodos de eliminacin, adquisicin e incremento de la conducta ............................................. 41
9.2.1 La adquisicin de una conducta nueva ..................................................................... 41
9.2.2 La reduccin de una conducta .................................................................................. 42
9.2.3 Ampliacin y mantenimiento de la conducta ............................................................. 45
9.3 La economa de fichas ................................................................................................................. 46
9.3.1 Introduccin terica ................................................................................................... 46
9.3.2 Un ejemplo de aplicacin de un programa de economa de fichas ........................... 47
REFERENCIAS .................................................................................................................................... 48

4

1 1 Co n c e p t o s b s i c o s e n e l Co n d i c i o n a mi e n t o Co n c e p t o s b s i c o s e n e l Co n d i c i o n a mi e n t o
Op e r a n t e Op e r a n t e
El condicionamiento instrumental es un proceso de aprendizaje que se desarrolla cambiando la
probabilidad de una respuesta por medio de la manipulacin de sus consecuencias. Una respuesta
instrumental se define simplemente como una respuesta que conduce a una meta.
Al condicionamiento instrumental tambin se le llama condicionamiento operante o condicionamiento
skinneriano. La expresin operante se utiliza porque las respuestas instrumentales son manipulaciones
sobre el medio ambiente. El trmino skinneriano otorga crdito al trabajo de B.F. Skinner, investigador que
fue pionero de los muchos principios del condicionamiento instrumental. Nosotros aqu utilizaremos los
trminos de forma indistinta y sinnima, an conscientes de que algunos autores establecen claras
diferencias entre los trminos operante e instrumental.
1. 1 1. 1 Def i ni c i Def i ni c i n del Co n del Co ndi c i onami ent o Oper ant e ndi c i onami ent o Oper ant e
"E.L. Thorndike, de la Universidad de Columbia, fue el principal innovador en el campo del
condicionamiento instrumental. En su experimento ms importante, descrito en 1898, coloc a unos gatos
hambrientos en una caja-problema acerrojada cuya puerta se abra en cuanto se golpeaba un pestillo
situado dentro de la jaula, permitiendo as al gato acceder a la comida que se encontraba junto a la caja.
Cuando Thorndike introdujo por primera vez a los gatos en la jaula, stos se agitaban desordenadamente
de una lado para otro, como buscando la forma de escapar. Sin embargo, despus de cierto tiempo los
gatos golpeaban inevitablemente el pestillo, y se les permita comer tras abandonar la caja. A medida que
se repeta esta situacin, la conducta de los gatos fue hacindose ms eficaz, necesitando cada vez
menos tiempo para golpear el pestillo en los siguientes ensayos. Evidentemente, los gatos haban
aprendido una respuesta (golpear el pestillo), tal como lo demuestra el hecho de que la ejecutaban
inmediatamente despus de volver a ser colocados en la jaula. A este tipo de aprendizaje se le denomina
condicionamiento instrumental porque la conducta del animal es "instrumental" para obtener la
consecuencia deseada (la comida)" (Tarpy, 1983, pp.63-64)
Segn Thorndike en este proceso de aprendizaje operaran las siguientes fases:
[1. Existencia de un motivo o motivacin: el hambre del animal
[2. Un problema a resolver para satisfacer ese motivo: alcanzar la comida fuera (de la caja) para
satisfacer el hambre
[3. Ensayo - error: un tanteo que concluye finalmente con la resolucin casual del problema -golpear
el pestillo, salir de la caja-.
[4. Seleccin de las respuestas vlidas (seguidas por el xito -se abre la puerta y se alcanza la
comida-) y eliminacin de las no vlidas (seguidas por el no xito).
[5. Consolidacin del aprendizaje, por conexin de la respuesta correcta con la recompensa a que
conduce (conseguir la comida, tras golpear el pestillo).
La operacin bsica que define el condicionamiento instrumental es que la conducta del sujeto
5

determina el resultado que de ella se sigue. La consecuencia recompensante es contingente con respecto
a la respuesta realizada por el sujeto; por lo tanto, los eventos no son independientes de la conducta del
sujeto como ocurra en el condicionamiento pavloviano. Se le llama operante por oposicin al
Condicionamiento Clsico en el que la conducta era respondiente. Ahora se trata de una conducta activa y
no pasiva como en el Condicionamiento Clsico, tambin se le llama condicionamiento instrumental
porque la persona o animal es el instrumento que cambia en cierto modo su entorno. La conducta aqu es
voluntaria y no refleja e involuntaria como en el Condicionamiento Clsico, como ya hemos indiciado (ver
en Captulo 3 la comparacin entre Condicionamiento Clsico y Operante o Instrumental).
Una respuesta que produce una consecuencia recompensante ser aprendida, es decir se har cada
vez ms frecuente o probable con un entrenamiento prolongado. Este proceso constituye la fase de
adquisicin del aprendizaje. Si la respuesta deja de producir la recompensa, la conducta disminuye
consecuentemente en vigor y probabilidad. A este proceso se le denomina extincin. Por consiguiente,
estos dos trminos significan aqu lo mismo que en el Condicionamiento Clsico.
La Cont ri buci n de Ski nner
En 1938 B.F. Skinner realiz una extensa investigacin sobre la influencia del reforzamiento en la
conducta. Su trabajo mostr que el reforzamiento tiene un efecto importante sobre nuestras acciones. El
concepto de Contingencia es central en su teora. Para Skinner una contingencia es la relacin establecida
entre la conducta y el reforzamiento. Segn Skinner, el ambiente determina las contingencias y las
personas deben realizar la conducta apropiada para obtener el reforzador.
Skinner rechaz las explicaciones internas sobre el reforzamiento tales como las establecidas por
Thorndike, para el cual un reforzador era un estado de satisfaccin para un individuo. Por el contrario,
Skinner propuso que un evento era reforzante si incrementaba la frecuencia de la conducta que lo
produca, es decir, defina el reforzador por su grado de influencia sobre la conducta futura del sujeto. En
resumen para Skinner, cualquier acontecimiento que incremente la probabilidad de la conducta es un
reforzador.
La razn de que Skinner definiera el reforzamiento en trminos de su efecto sobre la conducta, es
que un acontecimiento puede ser reforzante para una persona y no para otra. As pues, en lugar de utilizar
nuestras propias creencias sobre lo que resulta satisfactorio para un organismo, debemos seleccionar un
refuerzo basndonos en los efectos que produce sobre la conducta de un determinado organismo o
individuo.
1. 2 1. 2 El pr oc es o de c ondi c i onami ent o oper ant e: Var i abl es El pr oc es o de c ondi c i onami ent o oper ant e: Var i abl es
t er mi nol gi c as t er mi nol gi c as
En este apartado haremos mencin en primer lugar a la terminologa utilizada en el contexto del
Condicionamiento Operante, ya que no siempre posee un significado equivalente a la utilizada en el
Condicionamiento Clsico.
[1. Est mul os evocadores: son eventos ambientales que preceden regularmente al
comportamiento, van siempre antes de la respuesta. Evocan, como su nombre indica, las
respuestas respondientes (clsicas) las cuales son fijas y estereotipadas (Ardila, 1982).
[2. Est mul o di scri mi nat i vo (condi ci onado): Aunque en el condicionamiento clsico hay
invariablemente un EC explcito, en el CO no ocurre necesariamente lo mismo. No es necesario
que en la situacin estimular est presente una clave (luz o sonido) que se destaque de las
dems. Puede actuar como EC todo el medio, por ejemplo a los gatos de Thorndike no se les
presentaron ni sonidos ni luces. Sin embargo puede presentarse una clave explcita, a la que se
denomina estmulo discriminativo (ED). Esta clave discriminativa nicamente puede indicar
6

cuando est o no disponible el reforzamiento. Por otra parte, el EI no sigue necesariamente al ED,
como en el CC, sino que sigue al ED slo si el sujeto responde.
[3. Est mul o Ref orzant e. (i ncondi ci onado): Al igual que en el CC se utiliza un EI como
reforzador (por ejemplo la comida), pero se presenta nicamente despus de que se ha realizado
la respuesta deseada (se dara la comida despus de que el nio se hubiese lavado las manos),
es decir, son eventos que van despus de la respuesta. Un reforzador puede ser cualquier evento
que haga aumentar la probabilidad de una respuesta. El reforzamiento consiste en la
presentacin de un EI (o en la retirada de un EI nocivo) despus de la respuesta correcta (Tarpy,
1983).
[4. Est mul os neut ral es: Son aquellos que no producen cambios en el comportamiento, sea que
precedan, acompaen o vayan despus de la respuesta.
[5. Respuest a I ncondi ci onada: En el Condicionamiento Instrumental, la RI no guarda semejanza
alguna con la RC. Es decir, aunque cada EI suscite una RI como en el CC (la comida provoca
salivacin), sta no siempre desempea un papel importante en el proceso de condicionamiento
instrumental. En el condicionamiento instrumental los EIs suscitan RIs, pero stas no tienen
generalmente ninguna relacin con la respuesta instrumental que se somete a prueba.
[6. La Respuest a Condi ci onada: En el CO la RC es la respuesta evocada por el ED (o por el
conjunto de estmulos en general, si no se ha identificado ningn ED explcito), y que va seguida
por el reforzador. Normalmente, es una respuesta voluntaria y motora, como apretar una palanca.
Sin embargo, la RC puede ser cualquier Respuesta seleccionada como correcta, incluidas
respuestas viscerales como cambios en el ritmo cardaco o en la presin sangunea. Adems la
RC raramente se asemeja a la RI. Es una respuesta arbitraria y adquirida que puede ser
fortalecida mediante reforzamiento tanto positivo como negativo. Por ejemplo, todo lo que
consiguen los domadores de los animales ha sido aprendido mediante el C.O.
El proceso de condi ci onami ent o operant e
En un CO hay un medio compuesto de numerosos estmulos (a los que denominamos E1... En -ver
esquema adjunto-). En la fase A, ningn estmulo suscita una respuesta refleja observable, como hace el
EI en el caso del CC. En cambio, se realizan muchas respuestas diferentes (a las que denominamos, R1...
Rn), hasta que una de ellas es seguida por la recompensa. Tras suficientes repeticiones de esta
secuencia, se establece una respuesta condicionada (fase B), de forma que la posterior presentacin del
mismo complejo de estmulos evocar esa respuesta.
!"#$
!" #"
!$ #$ #!%&'(!)*+
!, #,
" - -
- -
!) #)
!"
!$
!, #$ #!%&'(!)*+
% -
-
-
!)
&'()*+*'(,-*.(/' *(1/23-.(/,4

7

2 2 Pa r a d i g ma s e n e l Pa r a d i g ma s e n e l c o n d i c i o n a mi e n t o o p e r a n t e c o n d i c i o n a mi e n t o o p e r a n t e
2. 1 2. 1 Par adi gmas b Par adi gmas b s i c os del Condi c i onami ent o Oper ant e s i c os del Condi c i onami ent o Oper ant e

Hay cuatro tipos de experimentos de condicionamiento operante. En dos de estos casos, el
reforzador otorgado por la respuesta es positivo, un estmulo apetitivo como el agua o la comida. En los
otros dos casos se emplea un EI negativo o aversivo, como una descarga elctrica. En cada una de estas
dos condiciones, hay un caso que consiste en presentar el EI, y otro consiste en interrumpirlo o impedir su
aparicin (Tarpy, 1983).
!"#$%&"'() #)(*+,$
$%+(+-'
"(#)&"
".+*)#+-'
!"#$%&'(
)*+, .*/012314
5(6&%&'(
)*+, 789:;14
&
<
5
&
.
"

(

"
=
&
<
&
!
$

"
=

"
6
%
>
<
?
=
(
5
@
(
.
?
7
"


"
=

"
6
%
>
<
?
=
(
!"#$ &' '()*+,-$ .'/$.012)'
3
/
'
4
)
$

&
'

-
1

.
'
(
#
,
'
(
)
1

(
$
5
.
'

'
-

'
(
)
*
+
,
-
$

.
'
/
$
.
0
1
2
)
'
=8/ 0A1B28 B:C8/ DE/:08/ ;* 78F;:0:8F19:*FB8 (C*21FB*

El Condi ci onami ent o Operant e de recompensa
El entrenamiento de recompensa, es la forma ms usual de condicionamiento instrumental. Cualquier
procedimiento de ensayo y error en que el sujeto reciba un reforzamiento positivo por realizar la respuesta
correcta, es un caso de entrenamiento de recompensa (Tarpy, 1983) (ver Captulo 4).
El Condi ci onami ent o Operant e de escape-evi t aci n
En este caso, la respuesta especificada es instrumental para terminar con un estmulo aversivo o
para impedir su aparicin. A menudo, en el condicionamiento de evitacin un ED precede al estmulo
aversivo, indicando su prxima aparicin (Tarpy, 1983).
El cast i go
La tercera situacin de condicionamiento instrumental es el castigo, que tiene lugar cuando la
respuesta del sujeto produce un estmulo aversivo. Es una situacin semejante al entrenamiento de
recompensa, excepto en que la consecuencia es negativa. En general, el castigo tiene por efecto la
supresin de la respuesta respecto a la cual ha sido contingente el estmulo aversivo, aunque existen
excepciones a esta regla. Igual que en el entrenamiento de recompensa, pueden presentarse estmulos
discriminativos especficos (ver Captulo 5) (Tarpy, 1983).
8

Ent renami ent o de omi si n
El entrenamiento de omisin ha recibido mucha menos atencin que los dems paradigmas. Se le
define como una situacin en la que la respuesta impide la presentacin de un EI positivo o apetitivo, esto
es, que el reforzamiento positivo es contingente respecto a no responder. El efecto general del
entrenamiento de omisin es la supresin de la respuesta criterio o en otras palabras, un aumento de la no
respuesta
El trmino de entrenamiento de omisin se usa muy poco. En cambio, el perodo de tiempo durante el
que no est disponible la recompensa recibe ms a menudo el nombre de perodo de tiempo-fuera. Por
ejemplo, Thomas (1968) ense a unas palomas a picotear un pequeo disco de plstico para conseguir
comida. Al principio, despus de la quincuagsima respuesta segua un perodo de "tiempo-fuera" de
treinta segundos; se apagaban las luces de la caja experimental y no se recompensaban las respuestas.
Despus de varias sesiones se redujo a 25 el nmero de picotazos requeridos para producir un perodo de
tiempo-fuera, luego a diez y finalmente a dos (cada dos respuestas). Thomas hall que cuanto menor era
el nmero de respuestas requeridas para producir el tiempo-fuera, mayor era la supresin de las
respuestas.
La extincin constituira en realidad un procedimiento de omisin, con la nica diferencia de que no se
incluiran perodos durante los que un ED indica que el reforzamiento est disponible. La extincin, igual
que los procedimientos de tiempo-fuera, suprime la conducta (ver Captulo 7) (Tarpy, 1983).
2. 2 2. 2 Ley es b Ley es b s i c as del c ondi c i onami s i c as del c ondi c i onami ent o oper ant e ent o oper ant e
2 . 2 . 1 2 . 2 . 1 L e y e s L e y e s g e n e r a l e s d e l a p r e n d i z a j e d e Th o r n d i k e g e n e r a l e s d e l a p r e n d i z a j e d e Th o r n d i k e
Thorndike formul una serie de Leyes generales del aprendizaje que si bien algunas pueden ser
discutibles no cabe duda de que aportaron bastante al tema del aprendizaje.
Leyes pri mari as:
[1. Ley del ef ect o: afirma que cuando una respuesta es reforzada (es decir, seguida por un estado
de cosas satisfactorio que el animal no hace nada por evitar, sino que al contrario, intenta
obtener) se hace ms fuerte, en el sentido de que tender a repetirse en el futuro. La idea
principal es que las respuestas que han sido recompensadas, se repetirn (Tarpy, 1983).
[2. Ley de l a di sposi ci n: esta ley propone que un sujeto debe estar motivado, para formar una
asociacin o realizar un hbito previamente establecido. (En algunos manuales la llaman
predisposicin. Esta ley sostiene que la satisfaccin y la molestia, dependen del estado del
organismo en el momento en que acta.)
[3. Ley del ej erci ci o: Thorndike sostuvo que el uso de las conexiones fortalece las conductas y que
su desuso las debilita. Es decir, que el aprendizaje se afianza por la prctica, que tender a
fortalecer la conexin entre un estmulo y una respuesta apropiada.
Leyes secundari as:
[1. Ley de l a preparaci n: el aprendizaje depende en parte de las experiencias previas. Por ello el
aprendizaje no es igual en todas las personas.
[2. Ley de respuest a ml t i pl e: esta ley sostiene que cuando una persona en situacin de
aprendizaje se enfrenta a un problema, y la primera respuesta no produce un estado de cosas
satisfactorio, la persona intentar otras respuestas. Si perdemos las llaves las buscaremos por
distintos sitios hasta que las encontremos. As, una situacin puede conducir a varias respuestas
hasta que, tras unos intentos, la respuesta correcta de la solucin, se consiga por ensayo y error.
El xito, consolidar la respuesta que lo alcanz. Volviendo al ejemplo anterior, si encontramos
9

las llaves sobre el escritorio, despus de haberlas buscado por toda la casa, volveremos a
buscarlas all cuando las perdamos de nuevo.
[3. Ley de l a prepot enci a de l os el ement os: designa la capacidad demostrada por el sujeto que
aprende para responder slo a los aspectos importantes de una situacin. Es decir, en el
aprendizaje se seleccionan los elementos que consideramos ms importantes de la situacin ante
la que hay que responder en lugar de responder de forma inespecfica.
2 . 2 . 2 2 . 2 . 2 L e y e s g e n e r a l e s d e l c o n d i c i o n a mi e n t o o p e r a n t e L e y e s g e n e r a l e s d e l c o n d i c i o n a mi e n t o o p e r a n t e
En lneas ms generales, las leyes del condicionamiento operante son similares a las leyes bsicas
del condicionamiento clsico; sin embargo, Pinillos (1980) seala algunas diferencias:
a) Adqui si ci n:
Proceso por el cual un organismo hace que una respuesta sea parte de su radio de comportamiento.
La adquisicin es ms fcil de conseguir en el condicionamiento operante, es ms sensible al incremento
del refuerzo y del nivel impulsivo.
b) Ext i nci n:
Proceso por el cual desaparece o se debilita en un organismo una respuesta que antes era parte de
su radio de comportamiento. En el condicionamiento operante las respuestas son ms resistentes a la
extincin (ver Captulo 7).
c) La di scri mi naci n.
En el condicionamiento operante el animal deja de responder a aquellos estmulos que devienen
diferentes al EC.
d) La general i zaci n:
En el condicionamiento operante el animal responde a estmulos parecidos al EC o estmulo
discriminativo de base (ver Captulo 8 para una mayor descripcin de estos dos ltimos principios).
2. 3 2. 3 Di f er enc i as c ondi c i onami ent o c l Di f er enc i as c ondi c i onami ent o c l s i c o y oper ant e s i c o y oper ant e
En la literatura tradicional, el "condicionamiento clsico", respondiente o pavloviano, se opone al
condicionamiento operante, instrumental o skinneriano. Aunque las diferencias entre ambos son muy
controvertidas, Miller (1969) demostr inequvocamente que la distincin entre condicionamiento clsico y
operante no era clara ni exacta, y que no sabemos si hay dos procesos diferentes o uno solo. No obstante
la tendencia actual es la de buscar ms confluencias que diferencias (Tarpy, 1983). Lo que parece claro es
que pese a existir una serie de diferencias existe al menos una interaccin y una sola pacin entre ambas
formas o tcnicas de aprendizaje. Cimble (1961) indic que era imposible realizar experimentos de
condicionamiento instrumental sin que el condicionamiento clsico tomase parte.
Segn Litiga (1977) existiran principalmente dos diferencias entre el condicionamiento instrumental y
el clsico: la voluntariedad de la respuesta y la posibilidad de identificar los estmulos en cada situacin.
Respuest a vol unt ari a
El condicionamiento instrumental, en general, se relaciona con las respuestas voluntarias y que son
emitidas por el organismo. Por el contrario, el condicionamiento clsico se relaciona con las respuestas
que son involuntarias o provocadas en el organismo. El primero no ejerce presin sobre la respuesta,
mientras que la respuesta de inters en el condicionamiento clsico es forzada por los estmulos
incondicionados.
10

I dent i f i caci n del est mul o
En el condicionamiento clsico tanto el EC como el EI son fcilmente identificables, y la asociacin de
la RC con el EC puede ser estudiada fcilmente. Por el contrario, el condicionamiento instrumental no tiene
un EI identificable que obligue a una respuesta, ni un EC al cual la respuesta pueda referirse. La relacin
clave en el condicionamiento instrumental no es entre estmulos, sino ms bien entre la respuesta y el
refuerzo.
Sucintamente Ardila (1982) recoge 10 comparaciones entre el condicionamiento clsico y el
condicionamiento operante.

Cl si co Operant e
1) Aut ores Pavlov Skinner, Thorndike
2) Or genes de l a respuest a desencadenada por el estmulo emitida por el organismo
3) Procedi mi ent o El refuerzo se presenta siempre despus
del EC, cualquiera que sea el
comportamiento del sujeto
El refuerzo se presenta siempre slo si el
sujeto responde adecuadamente
4) Si st ema nervi oso Autnomo Central
5) Respuest as Viscerales Esquelticas
6) I nt enci onal i dad Involuntarias Voluntarias
7) Asoci aci n De estmulos (E-E) De estmulos-respuestas
8) Leyes De contigidad Del efecto
9) Respuest a
condi ci onada/ i ncondi conada
Iguales siempre Diferentes siempre
10) I nf l uenci a del ref uerzo parci al Disminuye la fuerza de la respuesta Aumenta la fuerza de la respuesta
Comparaci n ent re Condi ci onami ent o Cl si co y Condi ci onami ent o Operant e.

La mayora de las diferencias son muy discutibles, con excepcin de la influencia del refuerzo parcial
en la fuerza de la respuesta (Ardila, 1982). Posiblemente esta sea la razn de que se acepte la existencia
de dos tipos de aprendizaje.

11

3 3 El c o n d i c i o n a mi e n t o a p e t i t i v o : e l r e f u e r z o El c o n d i c i o n a mi e n t o a p e t i t i v o : e l r e f u e r z o
3. 1 3. 1 El El c onc ept o de r ef uer z o y l os t i pos de r ef uer z os c onc ept o de r ef uer z o y l os t i pos de r ef uer z os
Refuerzo es todo aquello que sirve para fortalecer o mantener. una conducta. Es decir, toda
estimulacin que incremente la probabilidad de que una respuesta se repita.
Existen dos tipos bsicos de refuerzo: positivo y negativo, cuya situacin en la matriz de
consecuencias se ha visto en el tema anterior.
! Los ref orzadores posi t i vos son estmulos que aumentan la probabilidad de una respuesta cuando
se presentan en una situacin (por ejemplo, la comida, el agua o el contacto sexual).
! Los ref orzadores negat i vos son estmulos desagradables, cuya supresin aumenta la probabilidad
de respuesta.
En cualquier caso el efecto de un refuerzo siempre es el mismo, un aumento de la probabilidad de la
respuesta(Papalia y Wendoks, 1987).
Otra clasificacin de los tipos de refuerzos responde a la de refuerzos primarios o secundarios.
o Los ref uerzos pri mari os son aquellos relacionados con las necesidades biolgicas del
organismo, es decir poseen un valor reforzante natural para los sujetos. Por ejemplo el agua,
el sexo, la comida, los shocks, etc. que estaran relacionados con la sed, la sexualidad, el
hambre, la evitacin del dolor, etc.
o Los ref uerzos secundari os son aprendidos, llegan a ser reforzantes por su asociacin con
los reforzadores primarios. Seran por ejemplo, el dinero, las notas, los elogios, etc.
3. 2 3. 2 Pr ogr amas de r ef or z ami ent o Pr ogr amas de r ef or z ami ent o
Por programas de reforzamiento entendemos la pauta que va a seguir la aplicacin del refuerzo.
Existen diversos tipos de programas para reforzar las conductas y de la utilizacin de uno u otro va a variar
la tasa de respuesta (Campos, 1988).
Existen dos categoras fundamentales, continuo y parcial. El reforzamiento parcial es tambin
conocido como refuerzo intermitente. El refuerzo no aparece siempre tras la respuesta correcta. En el
reforzamiento continuo el refuerzo aparece siempre por lo que los animales aprenden ms rpidamente,
aunque ser ms duradero y slido el aprendizaje obtenido bajo un reforzamiento parcial.
Hay cuatro programas bsicos de reforzamiento parcial, dos de estos programas se basan en las
respuestas del sujetos, es decir disponen la entrega del reforzamiento despus de realizado un
determinado nmero de respuestas (ya sea un nmero fijo o variables), son los llamados programas de
razn fija o variable
Los otros dos programas se basan en el tiempo, entregan la recompensa una vez transcurrido un
determinado periodo de tiempo, son los llamados programas de intervalo fijo o variable. (Tarpy, 1983,
Campos, 1988).
Se pueden hacer varios programas de condicionamiento instrumental utilizando las diversas variables
de que disponemos. Algunos programas pueden llegar a una extraordinaria complejidad. Con estos
programas se puede ver la forma mejor y ms estable de lograr un condicionamiento, y en qu caso se
produce una mejor RC. Es importante sealar que la respuesta condicionada se mide en el CO de la
misma manera que Condicionamiento Clsico.

12

o Resistencia a la extincin,
o nmero de respuestas producidas (la medida ms utilizada), y
o nmero de respuestas por tiempo.
o
!" $%&'%()(* +,
%,-.,%/& 0(%12(3
4, %(/56
728(
9(%2(:3,
4, 26;,%<(3&
728&
9(%2(:3,
=" $%&'%()(* +,
%,-.,%/&
1&6;26.&

3 . 2 . 1 3 . 2 . 1 Pr o g r a ma s d e Ra z Pr o g r a ma s d e Ra z n n
Como ya hemos comentado un reforzador puede administrarse en base al nmero de respuestas
emitidas, son los Programas de reforzamiento de razn, que pueden ser de dos tipos:
a) de Razn Fi j a (RF)
A las siglas RF se suele aadir un nmero, por ejemplo, RF-3 (lo que quiere decir que cada 3
respuestas se administra un refuerzo). En un programa de razn fija es necesario emitir un nmero de
respuestas determinado para obtener el reforzamiento. Es decir, el refuerzo se presenta despus de un
nmero fijo de respuestas.
Veamos un ejemplo: el nio que recibe un juguete de una empresa por cada cinco cupones de las
cajas de cereales.
Caract er st i cas:
[1. Los programas de razn fija producen una tasa de respuesta consistente, adems la tasa de
respuesta aumenta con los programas de RF altos.
[2. La respuesta se interrumpe temporalmente despus del reforzamiento. Esta pausa tras el
reforzamiento se denomina Pausa postreforzamiento. La pausa postreforzamiento no se observa
en todos los programas de razn fija. Cuanto mayor es el nmero de respuestas necesario para el
reforzamiento, ms probable es que se produzca una pausa tras el reforzamiento. La duracin de
la pausa tambin vara, siendo ms grande cuanto ms elevada es la razn del programa, y
tambin es ms grande dependiendo de la saciacin. Las respuestas son mayores y mejores
cuando la obtencin del refuerzo est cercana.
b) de Razn Vari abl e (RV)
En un programa de este tipo se obtiene el reforzamiento tras realizar un nmero medio de
respuestas, pero el nmero de respuestas exigido varia a lo largo del entrenamiento. En este caso el
13

nmero que sigue a las siglas RV nos indica que la razn media en reforzar es cada X respuestas (RV-3,
cada tres respuestas). No se pueden describir las pautas que sigue el programa. Una vez se reforzada
cada 1 respuesta, otras veces cada 4 etc. Es decir, el refuerzo no sigue una forma regular en su aparicin.
Unas veces aparece a las 10 respuestas, otras a las 7, etc. El animal no sabe cundo ser reforzada su
conducta.
Caract er st i cas
[1. Al igual que los programas de RF, los programas de razn variable producen una tasa de
respuesta constante. Adems cuanto ms elevado es el nmero medio de respuestas exigido
para el reforzamiento, mayor es la tasa de respuestas.
[2. Al contrario de lo que sucede en los programas de razn fija, la pausa postreforzamiento se
produce en los programas de razn variable slo ocasionalmente. Esta ausencia de pausa hace
que la tasa de respuesta sea ms elevada en un programa de RV que en uno de RF.
La alta tasa de respuestas que se produce en los programas de razn variable, puede explicar la
persistencia y vigor caractersticos de la conducta de juego. Es el que da mejores resultados. Un ejemplo
tpico seran las mquinas tragaperras americanas. Estas mquinas, estn programadas para dar el
premio tras un nmero medio de jugadas. Sin embargo, el nmero exacto de jugadas necesario para
obtener el reforzamiento es imprevisible. La conducta de las personas que juegan durante horas a las
mquinas tragaperras introduciendo dinero constantemente se produce porque las mquinas estn
programadas segn un programa de razn variable.
3 . 2 . 2 3 . 2 . 2 Pr o g r a ma s d e I n t e r v a l o Pr o g r a ma s d e I n t e r v a l o
El reforzamiento puede programarse tambin en base al tiempo: Programa de reforzamiento de
intervalo. En un programa de este tipo el reforzador est disponible durante un cierto perodo de tiempo
despus del ltimo reforzamiento. Cualquier conducta que se produzca durante el intervalo no es
reforzada; solamente se refuerza la primera respuesta emitida al final del intervalo.
Tambin hay dos clases de programas de intervalo: reforzamiento fijo y variable:
a) de I nt erval o Fi j o
En un programa de este tipo la aparicin del reforzador depende del paso del tiempo y de la ejecucin
de la respuesta apropiada. Se da el refuerzo a partir de la primera respuesta vlida siempre despus de un
tiempo que en todas las ocasiones es el mismo. Este modelo es el que menos tasa de respuestas produce.
IF-3 indicara que se da refuerzo cada 3 minutos.
Caract er st i cas
[1. El animal o persona dejan de responder despus de recibir el reforzamiento y luego aumentan
lentamente su respuesta conforme se aproxima el momento en el que est disponible
nuevamente el reforzamiento. Es decir, aumenta la tasa de respuesta cuando se acerca el
refuerzo. Fester y Skinner denominaron a este patrn de conductas caracterstico de un programa
de IF efecto de Festoneado. (Se distingue de los de Razn fija porque en stos, la tasa de
respuestas era constante).
[2. Dos variables influyen en la duracin de la pausa observada en estos programas:
o La capacidad para contener la respuesta hasta el final del intervalo aumenta con la
experiencia.
o La pausa es ms larga con programas de intervalo fijo ms grandes.
b) de I nt erval o Vari abl e
14

En un programa de este tipo hay un intervalo de tiempo medio entre los reforzadores disponibles. Sin
embargo, este intervalo de tiempo vara de un reforzador al siguiente. Es decir, el refuerzo aparece en un
intervalo de tiempo que vara cada vez. Imaginemos un programa de razn variable en donde el intervalo
medio es de 2 minutos, la rata tendra que esperar unas veces solamente un minuto entre los reforzadores
y otras veces 5 minutos.
Caract er st i cas
[1. La tasa de respuestas de estos programas es estable.
[2. La tasa de respuesta est determinada por la duracin del intervalo variable, la tasa de respuesta
es ms baja cuanto ms largo es el intervalo medio entre los reforzamientos.
[3. El efecto de festn caracterstico de los programas de intervalo fijo, no se produce en los de
intervalo variable. Da buenos resultados aunque menores que los de la razn variable. La razn
de que esto ocurra es de nuevo que la frecuencia del reforzamiento (su inmediatez) no tiene
relacin con la tasa de respuesta del sujeto. En resumen, el que mejores resultados da es el de
Razn Variable y el que peores resultados da es el intervalo fijo.
Segn Litiga (1977) cada uno de estos formatos bsicos de programas de refuerzo visto producira un
patrn de respuesta especfico o distintivo:
(a). El programa de razn f i j a dar a l ugar a expl osi ones de respuest as rel aci onadas
con el nmero requeri do de respuest as segui dos por pausas breves
i nmedi at ament e despus de sumi ni st rado el ref uerzo.
(b). El programa de i nt erval o f i j o dar a l ugar a una f al t a de respuest a o respuest a
muy l ent a durant e l a pri mera part e del i nt erval o. Cuando el i nt erval o se acerque
a su f i nal se dar una al t a t asa de respuest a.
(c). El programa de razn vari abl e dar l ugar a una t asa de respuest a al t a y
const ant e a medi da que el suj et o aprende que ms respuest a si gni f i ca ms
ref uerzos, pero el suj et o no ser capaz de det ermi nar el nmero de respuest as
necesari as para reci bi r cada ref uerzo.
(d). El programa de i nt erval o vari abl e da l ugar a una t asa de respuest a l ent a y
sost eni da (l a cant i dad de respuest a no es i mport ant e, pero se requi ere una
respuest a al f i nal de cada i nt erval o). El suj et o se "prot ege" cont ra l a posi bi l i dad
de pasar por al t o un i nt erval o medi ant e una ej ecuci n sost eni da.
Programas ms avanzados
Aparte de los mencionados existen una serie de programas que podemos denominar como
complejos y que se forman en gran parte de mezclar los intervalos fijos y variables con las razones fijas y
variables. Es decir, son combinaciones o variaciones de los programas bsicos. Estos incluyen los
programas mltiples, los programas compuestos y programas concurrentes (Litiga, 1977).
! Los programas mltiples: requieren que el sujeto satisfaga dos o ms programas independientes, los
cuales se presentan sucesivamente, cada uno en presencia de algn estmulo clave.
! Los programas compuestos: refuerzan una respuesta sencilla de acuerdo con los requerimientos de
dos o ms programas que operan al mismo tiempo.
! Los programas concurrentes refuerzan al sujeto cuando dos o ms respuestas son dadas para
satisfacer.
15

3. 3 3. 3 Teor Teor as del r ef uer z o as del r ef uer z o
El problema que se plantean los diferentes autores a la hora de elaborar las teoras del refuerzo es
Porqu los refuerzos influyen en el comportamiento? Hay varias teoras que intentan explicar cmo o por
qu la recompensa fortalece la conducta aprendida.
a) Teor a de l a reducci n del i mpul so o de l a necesi dad (Hul l , 1943)
Esta teora afirma que todo reforzador reduce alguna necesidad del organismo. Todos los organismo
necesitan ciertas sustancias para poder sobrevivir, como la comida, el agua, el oxgeno, etc., y sin ellas el
organismo padece (Campos, 1988).
Hull propuso como mecanismo primario de la recompensa, la reduccin de la necesidad o del
impulso. La teora afirma, esencialmente, que los estmulos que reducen el impulso (hambre, sed, xito,
dinero, consideracin, etc.) son reforzantes, y que consecuentemente producen un incremento de la fuerza
de la respuesta. El valor de un refuerzo vendra dado por la capacidad que ste tiene para reducir las
necesidades que hay en el organismo.
Aunque algunos resultados de experimentos parecen confirmar esta teora, la mayora de las
investigaciones demuestran que no puede explicar todo el fenmeno del reforzamiento (Sheffield y Roby,
1950; Kish, 1955; Eisengberger, 1972). Por ejemplo, una rata aprender a recorrer un laberinto en T para
obtener una solucin de sacarina, aunque tenga agua suficiente a su disposicin.
b) Teor a de l a reducci n de l a t ensi n
Esta teora sostiene que la reduccin de la tensin es un premio y que el incremento es un castigo
(Campos, 1988). El organismo tiene una determinada tensin antes de obtener el refuerzo (hambre, ganas
de fumar, sed, etc.) que tiene que eliminar. Al eliminarla, se produce una relajacin que acta como
refuerzo. Por ejemplo, si una rata tiene hambre est en tensin y si ingiere alimentos desaparece la
tensin, por lo tanto la comida es un reforzador porque reduce la tensin.
Esta teora tiene muchos y slidos resultados de experimentos que indican que no es vlida. Por
ejemplo, si se permite a una rata macho copular con una hembra y justo antes de la eyaculacin se retira,
esto incrementa la tensin. Sin embargo, la rata correr despus rpido por un laberinto en T con la
finalidad de poder estar nuevamente con una hembra.
c) Teor a de l a est i mul aci n cerebral de Ol ds y Mi l ner (1954)
Olds y Milner descubrieron que las ratas apretaban una palanca para recibir una descarga elctrica
suave en el cerebro medio. Las ratas apretaban la palanca miles de veces por hora durante perodos de
ms de doce horas para recibir estimulacin. Estos autores pensaron que los estmulos eran reforzadores
si estimulaban ciertas zonas del cerebro. En consecuencia, determinaron que hay zonas en el cerebro que
estimuladas elctricamente producen placer y que ste acta como refuerzo. A partir de ah surgi la idea
de que poda haber un elemento comn a todos los reforzadores: su capacidad de estimular ciertas reas
cerebrales. Olds las denomin centros del placer. Ya no se tratara aqu de satisfacer una necesidad o
relajar tensin, sino de conseguir un refuerzo que estimule un rea o zona de placer del cerebro.
d) Ref orzami ent o por expl oraci n
Butler (1953), Montgomery (1954), Montgomery y Segall (1955) demostraron que para que exista
reforzamiento no es necesaria la reduccin del impulso (tensin o necesidad), sino que el refuerzo se
consigue dejando al animal explorar el ambiente.
e) Teor a de l as respuest as consumat ori as
Esta teora afirma que lo que refuerza no son los estmulos (comida, agua, ...) sino el acto de comer y
16

beber (Campos, 1988).
f ) Teor a de Premack
Premack (1965) propone una teora de refuerzo distinta a todas las dems (Campos, 1988). Su teora
tiene un carcter emprico y no intenta decir por qu es eficaz el reforzamiento. Por el contrario, formula un
principio general que explica los cambios en la actuacin a partir slo de unas pocas suposiciones simples
(Tarpy, 1983). Segn este autor, todos los sucesos ambientales y conductuales pueden ordenarse en una
jerarqua de valores para un organismo dado. Por ejemplo, comer pasteles, ver la televisin, fumar,
conducir un coche, etc. Todos estos sucesos pueden ser colocados en una escala de valores para un
sujeto. La respuesta ms fuerte pude reforzar a la ms dbil. Por ejemplo, si para un muchacho el ver la
televisin tiene un valor superior a comer pasteles, sus padres pueden reforzarlo con la televisin si antes
come los pasteles (Campos, 1988).
g) Teor a de l a expect at i va (Bol l es, 1972)
Esta teora niega explcitamente que haya un mecanismo de reforzamiento subyacente al
aprendizaje. Bolles no pretende que el reforzamiento como procedimiento sea ineficaz, sino que niega que
el cambio de la conducta producido por el procedimiento de reforzamiento implique necesariamente un
proceso subyacente de reforzamiento (Campos, 1988).
Lo que Bolles propone es que los sujetos aprenden a esperar eventos y que realizan respuestas
instintivas basadas en esas expectativas. El sujeto acta porque tiene la expectativa de obtener un
determinado refuerzo. Este autor sugiere que se forman dos tipos de expectativas.
! La primera es una expectativa de comida, o algn otro evento biolgicamente importante, como una
descarga elctrica. La contingencia o correlacin entre esos eventos, corresponde a la correlacin
EC-EI en el Condicionamiento Clsico. As pues, esta teora afirma que en el transcurso de los
emparejamientos EC-EI el sujeto comienza a esperar el EI.
! La segunda se basa en la correlacin Respuesta-Recompensa; los sujetos aprenden a esperar
comida o por ejemplo, la evitacin de una descarga como consecuencia de su respuesta. Este tipo de
expectativa se basa en procedimientos instrumentales.
4 4 El r e f u e r z o s e c u n d a r i o y c a s o s e s p e c i a l e s d e El r e f u e r z o s e c u n d a r i o y c a s o s e s p e c i a l e s d e
c o n d i c i o n a mi e n t o c o n d i c i o n a mi e n t o
4. 1 4. 1 El r ef uer z o s ec undar i o El r ef uer z o s ec undar i o
Vimos ya en el Captulo 3 que una de las clasificaciones de los tipos de refuerzos haca referencia al
Refuerzo Primario frente al Refuerzo Secundario.
Un ref uerzo pri mari o es un estmulo con un valor reforzante natural (directo), es decir tiene
propiedades reforzantes innatas, acogiendo elementos bastante imprescindibles para la vida, por ejemplo,
el agua, la comida, etc.
17

Un ref uerzo secundari o es aquel que originalmente es neutro, pero que, al emparejarse
repetidamente con un reforzador primario, acaba por tener valor reforzante. De esta forma al presentarse
en posteriores ensayos la clave secundaria se observa que refuerza la conducta. Por ejemplo, si los padres
siempre dan de comer a un nio en una silla concreta, cuando ste tenga hambre intentar subirse a la
silla, o llorar para que lo suban. La silla se habr convertido en un reforzador secundario.
Ya hemos dicho que si un estmulo neutro (la silla) se empareja con un reforzamiento primario (la
comida), se convierte en reforzador secundario. Si emparejamos otro estmulo neutro (al subir al nio a la
silla le colocan un babero), este estmulo neutro se convertir tambin en un reforzador (reforzador
terciario). Cuanto ms nos alejemos de la fuente original (reforzamiento primario), menos fuerza tendrn
los reforzadores secundario, terciario, ....
Vari abl es que det ermi nan l a i nt ensi dad de un ref orzador secundari o:
a) La magnitud del reforzador primario emparejado con el reforzador secundario determina las
propiedades reforzantes de este ltimo. Es decir, un estmulo asociado con un reforzador grande
adquiere ms propiedades reforzantes que un estmulo asociado con un reforzador pequeo.
b) El nmero de emparejamientos entre el estmulo secundario y el reforzador primario afecta a la fuerza
del reforzador secundario. Cuanto mayor es el nmero de emparejamientos efectuados entre el
reforzador primario y el estmulo reforzante secundario, mayor es el poder reforzante de este ltimo.
c) El tiempo transcurrido entre la presentacin del estmulo reforzante secundario y el reforzador
primario afecta a la fuerza del reforzador secundario. Los resultados de los distintos experimentos
indican que el valor de un reforzador secundario disminuye conforme aumenta el intervalo entre el
reforzador secundario y el primario.
La influencia de estas variables no es sorprendente. Los reforzadores secundarios adquieren sus
propiedades reforzantes a travs del proceso de condicionamiento Pavloviano. Por consiguiente, se
extingue igual que la respuesta condicionada del Condicionamiento Clsico.
4. 2 4. 2 Cas os es pec i al es de c ondi c i onami ent o de r ec ompens a Cas os es pec i al es de c ondi c i onami ent o de r ec ompens a
4 . 2 . 1 4 . 2 . 1 L a c o n d u c t a L a c o n d u c t a s u p e r s t i c i o s a s u p e r s t i c i o s a
La conducta supersticiosa es un "patrn estereotipado de conducta 'ritual' que se produce durante el
intervalo entre los reforzamientos" (Klein, 1994, p. 584).
Segn Skinner (1961) es una conducta que surgira a menudo despus de un plan de refuerzo a
intervalos fijos, al haberse introducido previamente por azar, y que persiste durante cierto tiempo sin
necesidad de nuevos refuerzos. En este sentido se tratara de una conducta operante en el sentido del
condicionamiento operante. Con este trmino se expresa entre otras cosas, una excesiva resistencia a
desaparecer (Dorsch, 1985). En realidad, en palabras de Papalia y Wendoks (1987) "el comportamiento
supersticioso, sera aquel que ha sido fortalecido o debilitado al ser reforzado o castigado
accidentalmente". Los conceptos clave aqu seran azar o accidentalmente. Veamos dos ejemplos, uno
derivado de la investigacin y otro de la vida "real".
"Skinner (1953) dio a las palomas un poco de comida cada 15 segundos, sin tener en cuenta lo que
estuvieran haciendo. La primera vez que la paloma consigui comida, estaba haciendo algo aunque slo
fuera estar de pie. La paloma aparentemente relacion la actividad y la comida. La segunda vez que
consigui la comida estaba ms inclinada a hacer lo que hizo previamente que cualquier otra actividad.
Cuanto ms lo hiciera, tanto ms posible era que la accin fuera de nuevo reforzada, ya que la comida
segua llegando. Las palomas que han sido condicionadas de esta manera unas veces esperaban la
comida saltando de un pie al otro, otras volvindose bruscamente hacia un lado, otras inclinndose y
18

rascndose, otras dando la vuelta sobre s mismas, pavonendose o levantando la cabeza" (Papalia y
Wendoks, 1987).
Este caso es uno de los que mejor demuestran el efecto de la contingencia respuesta-reforzamiento.
Un mismo procedimiento produce el condicionamiento de respuestas muy diferentes en distintos sujetos,
debido simplemente a que las respuestas y la recompensa ocurren accidentalmente y en sucesin (Tarpy,
1983).
Veamos ahora este caso "real" descrito por Papalia y Wendoks (1987).
"Las cosas iban mal para Tony LaRussa, el manager del Chicago White Sox. Su equipo haba perdido
12 de 15 partidos jugados, su trabajo estaba en peligro y acababa de recibir una amenaza de muerte.
Puede que sta sea la razn por la cual se puso su chaqueta de entrenamiento a pesar de que haca una
noche calurosa y sofocante. Esa noche su equipo gan. Desde entonces Tony se pona su chaqueta cada
vez que el equipo jugaba, sin importarle qu tiempo haca. El White Sox gan nueve veces de los
siguientes once partidos jugados y LaRussa coment: 'No creo mucho en eso, pero nunca se sabe' (New
York Times, 1982, pg. B8)" (p. 179-180).
4 . 2 . 2 4 . 2 . 2 El c o n d i c i o n a mi e n t o o p e r a n t e v e r b a l El c o n d i c i o n a mi e n t o o p e r a n t e v e r b a l
En este caso "especial" de condicionamiento no se utiliza una recompensa convencional, como agua
o comida, y la respuesta condicionada (una respuesta verbal) parece aprenderse sin que el sujeto se d
cuenta (Das, 1969).
Thorndike (1932) emple la palabra "bien" y "mal" para reforzar las respuestas de sujetos humanos,
aunque el condicionamiento operante verbal se libra incluso con reforzadores ms sutiles. Por ejemplo en
un estudio de Greenspoon (1955), se pidi a los sujetos que dijesen palabras (y no oraciones). En un
grupo, el experimentador dijo "mm-hmm" despus de cada nombre en plural; al grupo de control no se le
dio ningn reforzamiento verbal. Greenspoon hall que la incidencia de los nombres en plural aumentaba
sistemticamente con el entrenamiento y que los sujetos no podan verbalizar la relacin entre la respuesta
y el reforzador contingente.
Investigaciones posteriores han demostrado que probablemente el sujeto s se da cuenta de esta
forma de condicionamiento, pero que su informe verbal no refleja bien su conducta estructurada; as, lo que
los sujetos dicen saber no siempre corresponde con la forma en que se comporta (Verplanck, 1962). No
obstante, el condicionamiento operante verbal es importante porque muestra cmo las contingencias de
reforzamiento modifican la compleja conducta verbal (Tarpy, 1983).
4 . 2 . 3 4 . 2 . 3 El c o n d i c i o n a mi e n t o i n s t r u me n t a l a u t o n El c o n d i c i o n a mi e n t o i n s t r u me n t a l a u t o n mi c o mi c o
Este tipo de condicionamiento se trata de un condicionamiento instrumental de respuestas viscerales.
Este condicionamiento visceral y glandular posee unas claras implicaciones para la comprensin y
tratamiento de los trastornos psicosomticos. De hecho, tcnicas recientemente establecidas en el
laboratorio estn utilizndose en medios clnicos (Tarpy, 1983).
La importancia de este tipo de condicionamiento radica en que hasta finales de los aos 60 se
pensaba que el sistema nervioso autnomo involuntario (latidos del corazn, presin arterial, contracciones
intestinales, etc.), slo era modificable mediante tcnicas de condicionamiento clsico, mientras que las
respuestas motoras, voluntarias, slo podan ser condicionadas instrumentalmente. Sin embargo, hay
cierta evidencia de que las tcnicas instrumentales pueden modificar incluso la conducta visceral interna
(Tarpy, 1983). Esta segn Pinillos (1980) ha sido una de las realizaciones ms impresionantes del
condicionamiento operante.
Son numerosas las investigaciones que han conseguido regular respuestas autonmicas por
aprendizaje operante. Se han estimulado ratas en el rea lmbica llamada del placer, utilizando un refuerzo
19

intracerebral directo (Rodrguez Delgado, 1954; Roberts y Miller, 1954; Olds y Milner, 1954); tambin se ha
logrado acelerar o retrasar los latidos del corazn de estas ratas (Miller), la formacin de orina, la
distensin o estrs de las paredes estomacales, la subida o bajada de la tensin arterial, e incluso que una
ratas aprendan a dilatar los vasos sanguneos de un odo.
En humanos, se ha conseguido entrenar a los sujetos en la relajacin/distensin muscular (Schultz,
1932, Jacobson, 1938), como medio de obtener un refuerzo: la distensin, el relax o algn sntoma
psicosomtico. Estas tcnicas se han modificado y perfeccionando haciendo las respuestas
electromiogrficas ms precisas. Toda una serie de hallazgos, hasta hoy en da, ha dado lugar a la
aparicin de una especialidad llamada Biofeedback (Bio-realimentacin) que tiene por objeto estudiar los
procesos de auto-informacin y auto-control que permiten al sujeto conocer y manipular una buena parte
de su propia actividad nerviosa, glandular, visceral y muscular.
5 5 El c o n d i c i o n a mi e n t o a v e r s i v o : e l c a s t i g o El c o n d i c i o n a mi e n t o a v e r s i v o : e l c a s t i g o
5. 1 5. 1 El c as t i go El c as t i go
El castigo es definido como un suceso que, cuando es administrado inmediatamente despus de una
respuesta, disminuye la probabilidad de que esta respuesta ocurra de nuevo. Como ya vimos en el
Captulo 2 el castigo es diferente del reforzamiento negativo. El castigo es administrado con el propsito
expreso de reducir la tendencia a comportarse de una determinada manera, y a menudo lo consigue.
Administrar descargas elctricas a un animal cada vez que aprieta una tecla har que deje de apretarla. Un
nio que es mordido por un perro al que trataba de acariciar, probablemente dejar de aproximarse a
animales extraos (Papalia y Wendoks, 1987).
Otras definiciones de castigo:
(a). Reduccin de la posibilidad de aparicin futura de una respuesta como resultado de la
aparicin inmediata de un estmulo aversivo sobre esa respuesta (Azrin y Holz, 1966).
(b). El castigo ocurre cuando una repuesta lleva a un estmulo aversivo o es seguida de l
(Wittig, 1977).
(c). Presentacin de un estmulo aversivo contingentemente sobre la ejecucin de una conducta
inapropiada (Klein, 1994).
5. 2 5. 2 Ti pos de c as t i gos Ti pos de c as t i gos
Fundamentalmente hay dos tipos de castigo:
(a). Cast i go posi t i vo: El castigo positivo se refiere a la utilizacin de un evento fsico o
psicolgicamente doloroso como castigo. Por ejemplo una azotaina o una reprimenda verbal son
ejemplos de castigos positivos.
(b). Cast i go negat i vo: en este tipo de castigo, el reforzamiento se pierde o no est disponible
como consecuencia de la realizacin de una conducta inapropiada. A veces se utiliza el trmino
Entrenamiento de Omisin en lugar del de castigo negativo. En este tipo de entrenamiento se
20

proporciona el reforzamiento cuando se produce la conducta apropiada. Sin embargo, la
realizacin de la conducta inapropiada hace que no se obtenga el reforzamiento o que se
produzca una prdida del mismo.
A su vez, dentro de lo que llamamos castigo negativo existiran dos categoras: el coste de respuesta
y el tiempo fuera:
! Cost e de respuest a: la respuesta no deseada hace que se retire o que no se
pueda obtener el reforzamiento. Por ejemplo, estarse quieto es incompatible con
hablar o levantarse en clase. Cuando se est quieto se recibe el refuerzo, pero no
cuando uno habla o se mueve. Por ejemplo, a una nia se le quitaban 50 pesetas de
su asignacin semanal cada vez que no llevaba las gafas puestas, logrndose
modificar de esta manera la conducta de no ponerse las gafas. (Klein, 1994).
! Ti empo f uera: consiste en un perodo de tiempo durante el cual el reforzamiento
no est disponible. Es decir, consistira no en no obtener un refuerzo, sino en
retirarlo cuando se hace una conducta inapropiada. Por ejemplo un chico al que se
le enva a su habitacin despus de comportarse mal es un ejemplo de
tiempo-fuera, o un soldado que es enviado al calabozo por ausentarse del cuartel
sera otro ejemplo.

Otras tipologas del castigo lo dividen en:
(a). Cast i go pri mari o: aquel que es directo, como por ejemplo un golpe.
(b). Cast i go secundari o: sera aquel que es aprendido por condicionamiento. No causa dao
directo. Por ejemplo, educamos al nio para que por 100 puntos pueda conseguir una
bicicleta, los puntos se le dan cuando el nio se porta bien, pero cuando el nio tiene una
conducta inapropiada se le quita puntos, este sera un castigo secundario, ya que no causa
dao directo.
(c). Cast i go soci al : cuando involucra situaciones sociales como ridculo, la risa (tribus), etc.
5. 3 5. 3 La ef i c ac i a del c as t i go La ef i c ac i a del c as t i go
El castigo, en algunas ocasiones, no parece ser tan efectivo como en principio se crea en algunas
ocasiones. En un principio, Thorndike (1898) pensaba que los eventos desagradables debilitaban las
conexiones E-R, ms tarde, en 1932, sugiri que los acontecimientos desagradables o castigos no
debilitaban las asociaciones E-R. Tras sus investigaciones concluy que el reforzamiento poda fortalecer
las conexiones E-R, pero que el castigo no poda debilitarlas.
Estes (1944) y Skinner (1953) supusieron, acertadamente que el castigo slo poda suprimir la
conducta temporalmente, con sus investigaciones concluyeron que el efecto supresor del castigo era slo
transitorio, por lo que afirmaron que el castigo es un tcnica ineficaz para eliminar la conducta no deseada
Por ejemplo, los ladrones que han ido a la crcel por sus delitos vuelven a robar otra vez tan pronto
como salen de la crcel. Un perro que ha sido azotado por coger comida de la mesa continuar
comindose la carne siempre que la encuentre, con tal de que su dueo no est al lado. Una adolescente
que ha sido castigada a permanecer en la casa por escabullirse para encontrarse con el novio, se
inventar cualquier modo ms ingenioso para salir de casa sin ser vista. Estes y Skinner sugirieron que
debera utilizarse la extincin en lugar del castigo para suprimir de forma permanente una respuesta
inapropiada. Sus conclusiones, ciertamente, entran en conflicto con la creencia de nuestra sociedad de
que el castigo es un mtodo efectivo para la supresin de conductas inapropiadas. Y es que la popularidad
del castigo en la sociedad parece demostrar que para mucha gente la idea de castigar un comportamiento
21

indeseable es ms natural que recompensar un comportamiento deseable, tanto en la educacin del nio
como en las relaciones en el trabajo o en la comunidad.
Esta idea general acerca de la efectividad/no efectividad del castigo fue recogida por otros
investigadores de la poca, por ejemplo, deca Salomon en su discurso presidencial a la American
Psychological Association en 1964, recogiendo el sentir de los investigadores y las gentes de la poca: "El
castigo es poco importante porque no debilita los hbitos, es un controlador de hbitos pobre, es
extraordinariamente cruel e innecesario y es algo que produce neurosis" (Solomon, 1964). Esa idea es en
parte cierta y en parte no. En todo caso el castigo puede ser efectivo (como luego veremos) y su
peligrosidad depende de cmo y bajo qu condiciones se aplique, condiciones que hay que conocer para
no potenciar los fracasos histricos del castigo o aplicarlo mal.
Los estudios que evaluaron el efecto del castigo sobre la conducta, durante los aos 50 y 60, indican
que bajo algunas condiciones el castigo puede suprimir permanentemente una conducta inapropiada. En
cambio, en otras ocasiones, el castigo no tiene efecto alguno sobre la conducta o slo la suprime
temporalmente. Sea como fuere, lo cierto es que el castigo constituye una de las partes ms importantes
de la Psicologa del Aprendizaje, aunque es necesario reconocer que de l se sabe poco y queda mucho
por investigar (Pinillos, 1980). Ciertamente no ha habido demasiados estudios respecto del castigo, en
comparacin con otros fenmenos y campos de estudio de la Psicologa y la Pedagoga. No se sabe muy
bien por qu el castigo suprime la conducta o tiene tantos efectos sobre ella. Faltan muchas teoras y otras
estn inacabadas desde los inicios de los trabajos de Thorndike.
5. 4 5. 4 Fac t or es que det er mi nan l a ef i c ac i a de un c as t i go. Fac t or es que det er mi nan l a ef i c ac i a de un c as t i go.
Existen una serie de factores que determinan la efectividad del castigo, hemos seleccionado entre
estos toda una serie de determinantes que nos parecen especialmente importantes: la intensidad del
castigo, su constancia, la contingencia temporal en su aplicacin, y el refuerzo de una respuesta
alternativa.
[1. I nt ensi dad del cast i go. A mayor intensidad, en condiciones normales, mayores posibilidades
de supresin de la conducta mediante el castigo. Hay pues una relacin directa entre la intensidad
del estmulo punitivo y la capacidad o grado de extincin de la respuesta mediante l. Ahora bien,
la intensidad del castigo debe de ser proporcional a tres factores por lo menos:
a) La conduct a a ext i ngui r: no se puede apl i car un cast i go f uert e a un
comport ami ent o poco i mport ant e.
b) La val oraci n subj et i va del que ha real i zado l a conduct a a ext i ngui r. Si l a
persona que est si endo cast i gada pi ensa que no ha hecho nada mal ,
i ncl uso un pequeo cast i go puede resul t ar para el l a de al t a i nt ensi dad.
c) El cont ext o: como se dec a ant eri orment e un cast i go pbl i co normal ment e
se vi venci a por el suj et o al que se l e apl i ca como ms i nt enso que un cast i go
en pri vado.
[2. Const anci a del cast i go. La investigacin indica que el castigo debe tambin administrarse
consistentemente para que elimine de forma eficaz la conducta inapropiada. Es decir, cuanto ms
constante sea el castigo a una persona o animal, ms efectivo ser. Los castigos irregulares
prolonga el comportamiento indeseado ms an que la falta de castigo (Papalia y Wendoks,
1987). Por ejemplo, si se desea eliminar la conducta de conducir bajo los efectos del alcohol, para
que el castigo de poner una multa tuviese xito, esta debera administrarse cada vez que una
persona conduce bajo los efectos del alcohol. Otro ejemplo sera el del padre que castiga a su hija
de cuatro aos de edad por decir palabrotas, la recompensa con una sonrisa en otra ocasin en
22

que repite lo mismo, y la ignora la tercera vez. Este padre est ayudando a consolidar esas
palabras en el vocabulario de su hija.
[3. La cont i ngenci a t emporal . Este principio es de suma importancia. Los resultados aqu son
concluyentes: un aumento en la demora entre la respuesta y el estmulo punitivo, hace disminuir
los efectos supresivos del castigo. Si el castigo ha de aplicarse, debe hacerse lo ms rpidamente
posible para que surta los efectos deseados. Es decir, el castigo debe ser inmediato para que sea
eficaz, y cuanto ms pequeo sea el intervalo de tiempo entre una comportamiento dado y su
castigo, ms efectivo ser ste. En el caso de nios de temprana edad a los que se castiga, si
se tarda tiempo en aplicar el castigo, hay que explicar porqu se castiga, ya que el nio puede
incluso haberse olvidado del motivo. Tambin est demostrado en el mundo de la delincuencia,
que la crcel u otro castigo, debe de ser aplicado lo ms rpidamente posible al delincuente, con
el fin de que surta efectos ms contundentes. Por otra parte, es muy til aplicar el castigo cuando
est comenzando la conducta que queremos debilitar y no cuando ya sta termin (Campbell y
Churcha, 1969). En muchas ocasiones los padres estn viendo que los nios estn haciendo algo
que no deben, dejan que acaben y luego les pegan.
[4. El ref uerzo de una respuest a al t ernat i va. A menudo, el castigo no funciona porque el animal
o la persona castigada se da cuenta de lo que no debera hacer, pero contina hacindolo porque
no sabe qu debera hacer en su lugar. Skinner en 1953, ya enfatiz la importancia de especificar
el tipo de comportamiento que evitar el castigo, que puede consistir en hacer algo diferente o
simplemente en no hacer nada. Una rata aprender rpidamente a tomar una ruta alternativa en
un laberinto, si adems de aplicarle una descarga elctrica por tomar la ruta equivocada, es
reforzada con comida al tomar la ruta acertada.
5. 5 5. 5 Pr obl emas del c as t i go Pr obl emas del c as t i go
Apuntan Papalia y Wendoks (1987) que aunque pudieran darse todas las condiciones que aumentan
la efectividad del castigo, tendramos que aceptar que es menos deseable que el refuerzo. Adems, en
muchas ocasiones el castigo trae efectos secundarios indeseables distintos a los que se pretenda con su
aplicacin. Veamos que inconvenientes y efectos indeseable puede acarrear el castigo.
5 . 5 . 1 5 . 5 . 1 I n c o n v e n i e n t e s d e l c a s t i g o : I n c o n v e n i e n t e s d e l c a s t i g o :
[1. No se aprende ninguna respuesta aceptable mediante el castigo. El refuerzo ayuda a realizar
nuevas asociaciones para ejecutar alguna accin nueva, el castigo no ensea a la gente qu ha
de hacer, slo le indica lo que no deberan hacer.
[2. Las recompensas sobre el comportamiento contrarrestan ampliamente el castigo que puedan
generar. Nos referimos al "que me quiten lo bailao". Se obtiene ms por cometer la falta de lo que
se sufre por el castigo. La adolescente quiere tan desesperadamente estar con su novio, que le
compensa arriesgarse a cualquier castigo que sus padres pueden imaginar.
[3. Lo que puede ser un castigo para algunos resulta reforzante para otros. Por ejemplo la azotaina
que se le da a Isabel cuando se porta mal puede ser reforzante, ya que obtiene ms atencin de
la que tena cuando se portaba bien. Si el castigo resulta recompensante, alienta el
comportamiento que se intenta extinguir.
5 . 5 . 2 5 . 5 . 2 Al g u n o s e f e c t o s i n d e s e a b l e s d e l c a s t i g o : Al g u n o s e f e c t o s i n d e s e a b l e s d e l c a s t i g o :
[1. Agresin inducida por el dolor. Los animales y las personas experimentan dolor cuando son
castigados. Esta respuesta de dolor puede producir una emocin de ira, la cual a su vez activa
una conducta de agresin. Es decir, puede producirse un aumento de conductas agresivas en los
23

seres humanos, sobre todo si el castigo se aplica incorrectamente y ante conductas fuertemente
motivadas. El castigo puede ser fuente importante de aparicin de comportamientos agresivos en
los individuos y los grupos de que se componen las distintas sociedades (Azrin y Holz, 1966).
Nios a los que se ha castigado mucho sin motivo luego suelen ser muy violentos (Klein, 1994).
[2. El modelado de la agresin. Un nio que ha sido azotado por su mal comportamiento puede dejar
de realizar la conducta inapropiada, puede volverse agresivo o quizs aprenda a imitar la
conducta agresiva de los padres en un intento por controlar las acciones de otras personas. Es
decir, los nios que han sido castigados con violencia, es probable que castiguen tambin
violentamente a sus propios hijos. La conducta que aprendemos, no mediante reforzamiento
explcito, sino a travs de la observacin de otras personas se denomina Modelado. Los distintos
estudios llevados a cabo han demostrado que los nios pueden imitar la conducta agresiva de un
modelo.
[3. El castigo puede conducir al escape o evitacin de las situaciones o agentes punitivos y adems
puede conducir a una generalizacin. Por ejemplo, si se castiga fuertemente a un nio en la
escuela, puede que ste no vaya a la misma, o generalice, de forma que tenga miedo tambin en
la clase de piano, o le tome mana a todo lo relacionado con los estudios. En este contexto se da
la denominada generalizacin negativa, por este motivo, y con la intencin de evitar que esto
ocurra, no se debe decir al nio eres malo o estpido, sino tal comportamiento tuyo es malo o
estpido (para evitar la generalizacin).
[4. El castigo puede desencadenar procesos ajenos a su funcin reductora de un comportamiento. El
castigo mal aplicado puede hacer que no se identifique la contingencia existente entre el castigo y
la conducta no deseada; de tal manera que los acontecimientos aversivos pueden ser percibidos
como independientes de la conducta y como consecuencia de ello, producir algunos estados
emocionales perturbadores o indeseables distintos a lo que se pretenda con su aplicacin
(Solomon, 1964). Por ejemplo en la escuela, puede dar lugar a estados emocionales
incompatibles con el aprendizaje (tensin, ansiedad, miedo, etc.).
[5. En resumen, todos estos datos vienen a poner claramente de manifiesto que el castigo afecta la
conducta de los individuos, que los principios que lo rigen son difciles de aplicar sin riesgo y que
los efectos secundarios del castigo son lo suficientemente importantes como para que la
aplicacin del castigo se haga slo en determinadas ocasiones y bajo un control riguroso de las
variables comentadas. En todo caso, antes de utilizar el castigo para modificar el comportamiento,
es necesario haber utilizado previamente otro tipo de procedimiento no aversivo, como el
reforzamiento de respuestas incompatibles, la extincin o el modelado.
5. 6 5. 6 Al gunos c oment ar i os s obr e l a apl i c ac i Al gunos c oment ar i os s obr e l a apl i c ac i n del c as t i go n del c as t i go
Aunque hay que decir que tradicionalmente el castigo y su estudio no han gozado de mucha
popularidad, se hace necesario algunas matizaciones respecto a su aplicacin:
[1. Solo hay dos formas importantes de aprender: o bien mediante la utilizacin del refuerzo o por la
utilizacin del castigo.
[2. El castigo existe en la vida cotidiana de los individuos. Existen las crceles, la pena de muerte, la
amputacin de miembros, etc. Los mismos dioses castigan a los hombres con infiernos y
maldiciones ("... el que ahorra vara odia a su hijo", dice la Biblia en Provervios, 13, 24.). La
naturaleza castiga constantemente a los hombres y animales: el que come lo que no hay que
comer luego tiene dolor o sufrimiento, etc. Los nios son habitualmente castigados en las
escuelas y en los hogares. Sabemos que entre el 84 y el 97% de los padres castigan a sus hijos,
etc..
24

[3. En Psicologa, Pedagoga y otras ciencias se ha aplicado el castigo pero solo con fines
teraputicos o educativos, buscndose siempre su mejor conocimiento, su correcta aplicacin y la
eliminacin de sus efectos negativos.
[4. Por otra parte, hay que reconocer que el castigo o la amenaza del mismo puede afectar a la
conducta de los individuos, para acabar con una conducta indeseable o peligrosa. Es
posiblemente el miedo el mecanismo profundo subyacente por el que el castigo repercute tanto
en la conducta de los sujetos. A veces es preferible el castigo a que le ocurra algo peligroso a un
nio. Por ejemplo, es preferible castigar con un grito, e incluso una palmada en la mano al nio
que va a meter los deditos en un enchufe.
[5. Finalmente, cuando se trata de interrumpir un acto persistente y no basta con el manejo del
refuerzo, puede ser til aplicar el castigo. Pero ste debe de emplearse dentro de un serio
programa de control de la conducta, elaborado por un especialista en el tema y en donde lo que
prime sea el refuerzo positivo y en ltimo extremo el castigo.
En definitiva, el castigo est presente con bastante frecuencia en cualquiera de los medios en que
habitualmente se desenvuelve la vida de los individuos. Es por ello por lo que la Psicologa estudiando el
castigo no hace ms que estar en consonancia con una realidad existente, con la que no necesariamente
se tiene que estar de acuerdo.
6 6 Fa c t o r e s d e t e r mi n a n t e s d e l c o n d i c i o n a mi e n t o Fa c t o r e s d e t e r mi n a n t e s d e l c o n d i c i o n a mi e n t o
o p e r a n t e o p e r a n t e
6. 1 6. 1 Fac t or es det er mi nant es en el c ondi c i onami ent o de Fac t or es det er mi nant es en el c ondi c i onami ent o de
r ec ompens a r ec ompens a
En el condicionamiento de recompensa influyen distintos factores, entre los que vamos a comentar:
la magnitud de la recompensa, los efectos de contraste, la demora del reforzamiento y el nivel del impulso
(Campos, 1988).
6 . 1 . 1 6 . 1 . 1 L a ma g n i t u d d e l a r e c o mp e n s a d e t e r mi n a L a ma g n i t u d d e l a r e c o mp e n s a d e t e r mi n a l a f u e r z a d e l l a f u e r z a d e l
c o n d i c i o n a mi e n t o c o n d i c i o n a mi e n t o
Muchos estudios han demostrado en diferentes situaciones, que cuanto ms grande es la magnitud
de la recompensa, mayor es la tasa de adquisicin de la respuesta instrumental (Hall, 1976). En un estudio
llevado a cabo por Crespi (1942) se demostr la influencia de la magnitud de la recompensa sobre la
adquisicin de la respuesta instrumental de recorrido, en un corredor recto, en ratas. Al llegar a la caja
meta, las ratas del estudio de Crespi reciban 1, 4, 16, 64 256 bolitas de comida. Crespi observ que los
animales recorran ms rpidamente el corredor cuando mayor era la magnitud de la recompensa.
Con respecto a la cuestin de la influencia de la magnitud de la respuesta en la nivel de ejecucin, la
evidencia indica que el nivel de ejecucin de la respuesta instrumental aumenta en funcin de la
magnitud de la recompensa (Conrad y Sidman, 1956; Hill y Wallace, 1967; Mellgren, 1972; Guttman,
25

Suttered y Brush, 1975).
Sin embargo, aunque podra parecer que la magnitud de la recompensa influye en el nivel de
condicionamiento, la evidencia indica que las diferencias de ejecucin reflejan diferencias motivacionales,
ms que de aprendizaje. Segn este punto de vista cuanto mayor es la magnitud de la recompensa, mayor
es la motivacin para obtener esa recompensa (Klein, 1994). En muchos estudios (Crespi, 1942; Zeaman,
1949), se ha observado un cambio rpido en la conducta al cambiar la magnitud de la recompensa, lo cual
indica que las diferencias de ejecucin asociadas con la magnitud de recompensa podran deberse a
diferencias motivacionales.
I nf l uenci a de l a magni t ud de l a recompensa en humanos.
Ya hemos visto como la magnitud de la recompensa influye tanto en la adquisicin como en la
ejecucin de una respuesta instrumental. La mayor parte de la experimentacin sobre la magnitud de la
recompensa ha utilizado animales como sujetos. Sin embargo, algunos estudios llevados a cabo con
humanos tambin han indicado que el valor de la recompensa afecta a la ejecucin de una respuesta
instrumental. Sin embargo, las diferencias en la magnitud de la recompensa no siempre se reflejan en las
diferencias conductuales.
La investigacin con nios pequeos (Hall, 1976) ha demostrado que la magnitud de la recompensa
influye en la adquisicin de una respuesta instrumental. En un estudio llevado a cabo en 1962 por Siegel y
Andrews, se encontr que los nios de 4 a 5 aos respondan correctamente ms a menudo en una tarea
cuando se les proporcionaba una recompensa grande (ej. un premio) que cuando se les daba una
recompensa pequea (ejemplo un botn). Por otra parte, tambin se ha demostrado que la magnitud de la
recompensa, influye en la conducta instrumental de sujetos adultos. Por ejemplo se ha demostrado que la
cantidad de dinero pagado por una ejecucin correcta influye en el nivel de conducta alcanzado (Atkinson,
1958).
6 . 1 . 2 6 . 1 . 2 Ef e c t o s d e c o n t r a s t e : l a i mp o r t a n c i a d e l a e x p e r i e n c i a p a s a d a . Ef e c t o s d e c o n t r a s t e : l a i mp o r t a n c i a d e l a e x p e r i e n c i a p a s a d a .
Si el sujeto recibe siempre una misma recompensa y de repente la magnitud de la recompensa baja,
el rendimiento baja hasta un nivel en que es ms bajo que si la recompensa hubiera sido siempre baja. A
este efecto se le denomina Efecto de depresin y se define como: "el proceso por el cual un cambio en la
magnitud de la recompensa de un valor alto a uno bajo produce un nivel de conducta instrumental por
debajo del que sera de esperar cuando la magnitud de la recompensa es siempre baja" (Klein, 1994,
p.168).
Sin embargo, si hay un cambio de una magnitud de recompensa baja a una elevada, normalmente se
produce un nivel de ejecucin superior al que sera de esperar cuando la recompensa es siempre alta. El
aumento en la ejecucin producido al cambiar la recompensa de baja a alta, se denomina Efecto de
elacin.
En 1949 Zeaman, sugiri cambiar los trminos de elacin y depresin por los efectos de contraste
positivo y contraste negativo, para indicar que el contexto concreto en el cual se experimenta un estmulo
puede producir efectos exagerados o reducidos de ese estmulo (Klein, 1994). Es decir, la experiencia con
una recompensa baja aumenta el efecto de una recompensa alta (efecto de contraste positivo), esto es,
una recompensa grande es ms eficaz de lo que sera normalmente debido a la experiencia previa con una
recompensa pequea. Por el contrario la experiencia exagera el efecto de una magnitud baja de
recompensa (efecto de contraste negativo), es decir, una recompensa pequea es menos efectiva de lo
que sera normalmente debido a la experiencia previa con una recompensa grande.
Desde el trabajo original de Crespi, muchos otros estudios han conseguido obtener sistemticamente
el efecto de contraste negativo. Sin embargo, la investigacin llevada a cabo durante los aos 60 parece
indicar que el efecto de contraste positivo es difcil de conseguir. Una posible interpretacin a esta dificultad
26

puede ser que quizs una magnitud de recompensa alta puede producir por s sola el mximo nivel de
respuesta y, por tanto, el cambio de una recompensa baja a una alta no puede aumentar la ejecucin de
los animales por encima del nivel mostrado cuando reciben siempre la recompensa alta. De hecho algunos
estudios realizados a finales de los aos 60 y principio de los 70 demostraron que puede producirse el
efecto de contraste positivo cuando los animales responden inicialmente por debajo del nivel mximo de
respuesta (Klein, 1994).
Una posible interpretacin al por qu se producen los efectos de contraste podra ser la emocin de
frustracin. Parece ser que la emocin de frustracin desempea un papel importante en el efecto de
contraste negativo. Segn esto, los animales forman durante los ensayos de adquisicin iniciales una
expectativa sobre el nivel de recompensa esperado. La presentacin durante la segunda fase de una
recompensa inferior a la esperada produce frustracin. Este estado de frustracin interfiere con la actividad
instrumental y ocasiona un nivel de respuesta ms bajo que el producido cuando la magnitud de
recompensa esperada es baja. Esta interpretacin ha estado apoyada por la observacin de que las
drogas que reducen ansiedad en humanos eliminan el efecto de contraste negativo (Ridgers y Gray, 1973;
Flaherty y Driscoll, 1980; Becker y Flaherty, 1982, 1983).
6 . 1 . 3 6 . 1 . 3 L a d e mo r a d e l a r e c o mp e n s a . L a d e mo r a d e l a r e c o mp e n s a .
La contigidad tiene un efecto importantsimo sobre la conducta instrumental, cuanto ms prximos
en el tiempo estn la respuesta y la recompensa, mayor es el condicionamiento de la respuesta
instrumental. En general, el efecto de demorar la recompensa es una disminucin de la actuacin, por lo
tanto, en la adquisicin de un hbito es peor un reforzamiento demorado que uno inmediato.
La recompensa puede llevar a la adquisicin de una respuesta instrumental si sigue inmediatamente
a la conducta, pero el aprendizaje instrumental se deteriora si se demora la recompensa. Cuanto ms
grande es la demora entre la respuesta y la recompensa, menor es el condicionamiento que se produce.
Son muchos los estudios que han investigado el efecto de la demora sobre la adquisicin de una conducta
instrumental. Sin embargo, ciertas variables pueden influir para rebajar la influencia que el efecto demora
pueda tener. Por ejemplo, la presencia de un reforzador secundario durante el intervalo puede fortalecer la
conducta instrumental y reducir el efecto demora. Por el contrario, cuando los estmulos asociados con la
recompensa no estn presentes durante el intervalo se produce poco condicionamiento incluso con una
demora muy breve.
En un estudio de Grice (1948), se encontr un efecto de demora muy pronunciado, es decir, se
produca poco condicionamiento con intervalos de demora tan breves como 1,2 segundos. Sin embargo,
Perin (1943) encontr niveles moderados de condicionamiento de la respuesta de presin de la palanca
incluso con una demora de 10 segundos. Qu pasaba? Los animales de Grice pasaban el intervalo de
demora en un ambiente no asociado con la recompensa. Por el contrario, las ratas del experimento de
Perin permanecieron en el contexto del condicionamiento (la caja operante) el cual se haba asociado con
el reforzamiento durante el intervalo entre la respuesta y el reforzador primario.
La importancia de la demora de la recompensa se ha demostrado tambin en estudios que han
utilizado nios como sujetos (Terrell y Ware, 1961; Hall, 1976). Estos estudios han demostrado de forma
sistemtica que cuanto ms grande es la demora entre la conducta instrumental y la recompensa, peor es
el condicionamiento de esa respuesta, es decir, los distintos resultados de los estudios llevados a cabo
indican que una demora entre la respuesta correcta y la recompensa interfiere con la adquisicin de la
respuesta (Klein, 1994).
6. 2 6. 2 Fac t or es que i nf l Fac t or es que i nf l uy en en el c ondi c i onami ent o de es c ape uy en en el c ondi c i onami ent o de es c ape
En el condicionamiento de escape el sujeto tiene que ejecutar una respuesta para liberarse de una
27

situacin nociva. Entre los principales factores que influyen en este tipo de condicionamiento estn: la
intensidad del estmulo nocivo, la demora de la terminacin de la descarga y la cantidad de reforzamiento.
a) La i nt ensi dad del est mul o noci vo. A mayor intensidad del estmulo nocivo mayor es el
aprendizaje.
b) Demora de l a t ermi naci n de l a descarga. Al aumentar la demora, disminuye la velocidad de
la respuesta.
c) Cant i dad de ref orzami ent o. A mayor reduccin del estmulo nocivo, independientemente del
nivel inicial de estmulo, mejor ejecucin.
6. 3 6. 3 Fac t or es que i nf l uy en en el c ondi c i onami ent o de Fac t or es que i nf l uy en en el c ondi c i onami ent o de
ev i t ac i ev i t ac i n n
El condicionamiento de evitacin, es similar al condicionamiento de escape, a excepcin de que en el
condicionamiento de evitacin existe una clave (llamada estmulo discriminativo o estmulo condicionado),
que indica al animal que va a aparecer un estmulo nocivo. Entre los distintos factores que influyen en el
condicionamiento de evitacin estaran (Campos, 1988):
a) I nt ensi dad del est mul o noci vo. Aunque los primeros estudios indicaban que a intensidades
ms altas en el estmulo nocivo, el aprendizaje de la evitacin es mejor. Sin embargo posteriormente se ha
demostrado que la actuacin y la evitacin son mejores con intensidades bajas.
b) I nt erval o ent re est mul os: (EC-EI). El intervalo entre el EC y el EI influye en el
condicionamiento de evitacin; en general el intervalo ptimo es ms largo que en el condicionamiento
clsico. Con intervalos ms largos los animales tienen ms oportunidades de realizar una respuesta de
evitacin.
c) I nt erval o ent re ensayos. La actuacin aumenta cuanto mayor es el intervalo entre los ensayos
hasta un punto, y con intervalos mayores decrece.
7 7 Ad q u i s i c i Ad q u i s i c i n y e x t i n c i n y e x t i n c i n n
7. 1 7. 1 La adqui s i c i La adqui s i c i n n
En la adquisicin de una respuesta instrumental son importantes varios factores, estos incluyen cmo
se inicia esa adquisicin, cmo se mide y cmo se extingue (Wittig, 1977).
7 . 1 . 1 7 . 1 . 1 El r e g i s t r o a c u mu l a t i v o El r e g i s t r o a c u mu l a t i v o
La forma ms comn de determinar si una respuesta instrumental u operante ha sido condicionada es
utilizar un registro acumulativo de esa respuesta. Este indica simplemente el nmero de respuestas
correctas que ha realizado el organismo en un determinado perodo de tiempo.
7 . 1 . 2 7 . 1 . 2 El mo l d e a mi e n t o El mo l d e a mi e n t o
En ocasiones nos planteamos la cuestin de si para recompensar a un nio por hacer lo que
28

queremos que haga hay que esperar a que lo haga bien, y nunca lo hace qu recompensamos?, se
queda sin aprender lo que queremos que haga?
La propuesta desde el condicionamiento operante es que se recompense cualquier esfuerzo, sin
importar que sea pequeo, siempre que vaya en la direccin correcta. A esto se denomina moldeamiento
(Papalia y Wendok, 1987).
El moldeamiento es una tcnica que se utiliza para acelerar la sesin de condicionamiento. El
objetivo del moldeamiento es ensear gradualmente la respuesta deseada mediante aproximaciones cada
vez ms cercanas a la respuesta correcta, hasta lograr finalmente la realizacin de la respuesta correcta
(Tarpy, 1983). Por ejemplo, cuando una nia o un nio comienzan a hablar, lo hacen mal, emiten sonidos
como, mam, mara...mata..., etc., la madre los va reforzando, hasta que logran decir "mam".
Skinner desarroll el procedimiento de moldeamiento, reforzamiento por aproximaciones sucesivas o
shaping para incrementar la tasa de aprendizaje de una conducta operante. Durante el moldeamiento, se
selecciona una conducta con una lnea base o frecuencia ms alta que la conducta deseada y se refuerza.
Cuando aumenta la frecuencia de esta conducta se cambia la contingencia y se refuerza otra conducta
ms parecida a la conducta final deseada (Klein, 1994).
Mol deami ent o de habi l i dades soci al es
Hay habilidades sociales que pueden ser dificultosas para algunas personas (hablar o entablar
conversaciones, abrir una puerta, ceder el asiento, pedir perdn, etc.). Para ensear estas habilidades se
utilizan tanto el reforzamiento (elogios) como el castigo (regaos), sin embargo, suele reforzarse la
conducta final. Debido a que se necesita mucha prctica para aprender habilidades sociales adecuadas,
muchas veces las personas experimentan frustracin y se dan por vencidos.
Para evitar esta frustracin se puede emplear la tcnica de moldeamiento, empezando por reforzar
una conducta que se realice fcilmente, para cambiar gradualmente las contingencias entrenando
conductas ms complejas. Reforzando sucesivamente conductas cada vez ms parecidas a la conducta
final deseada, se puede ensear rpidamente habilidades sociales (Klein, 1994).
7. 2 7. 2 La ex t i nc i n La ex t i nc i n
Una respuesta operante o instrumental puede extinguirse si el reforzador deja de presentarse tras la
respuesta. El fallo continuado de la respuesta operante o instrumental para producir el reforzamiento hace
que la fuerza de esa respuesta disminuya hasta que finalmente no se ejecuta (Klein, 1994). Por ejemplo,
un nio que cada vez que pasa con su madre al salir del colegio por la parada de golosinas y descubre que
con una rabieta consigue que su madre le compre golosinas. La contingencia entre golosina y rabieta hace
que el nio aprenda a tener un berrinche cada vez que desea una golosina, Si la madre, cansada de la
conducta molesta del nio, decide no acceder ms a los caprichos del nio, disminuir lentamente la
incidencia de la rabieta, hasta que el nio aprenda a portarse bien cuando se le niega la golosina.
En el ao 1938, Skinner observ que cuando se dejaba de reforzar a una rata tras realizar una
respuesta previamente adquirida se produca una extincin de esa respuesta. Cuando se interrumpe el
reforzamiento por primera vez, la tasa de respuesta es alta, pero el fracaso continuado de la respuesta
para producir el reforzamiento hace que la tasa disminuya hasta que la rata deje de presionar la palanca.
Durante la extincin, la respuesta que se produce es errtica, es decir, hay perodos con una alta tasa
de respuesta y momentos en los que no se produce la respuesta. La extincin de una conducta
previamente reforzada se ha observado en multitud de experimentos y tambin se ha comprobado en
sujetos humanos (Klein, 1994).
29

7 . 2 . 1 7 . 2 . 1 El p r o c e s o d e e x t i n c i El p r o c e s o d e e x t i n c i n n
Segn Hull (1943), la ausencia de recompensa durante la extincin inhibe un hbito instrumental
previamente reforzado. Una inhibicin reactiva transitoria (IR) suprime la respuesta debido a la fatiga
producida cuando la conducta no produce el reforzamiento. La conducta instrumental reaparece cuando la
fatiga se disipa. El incremento de la respuesta producido poco despus de la extincin se denomina
recuperacin espontnea. Es decir, al igual que en el condicionamiento clsico, los comportamientos
operantes que han sido extinguidos pueden ser recuperados.
Si la conducta contina sin ser reforzada se desarrolla una Inhibicin condicionada permanente (EIR).
Para Hull, la inhibicin condicionada de una respuesta se debe a que los estmulos ambientales presentes
durante la ejecucin de esa respuesta no reforzada se asocian al estado inhibitorio de no reforzamiento, de
tal manera que cuando esos estmulos se presentan nuevamente, se activa el estado inhibitorio y se
suprime la conducta instrumental. De este modo, el no reforzamiento continuado tambin hace que
desaparezca la recuperacin espontnea.
Por ejemplo, una rata atraviesa un corredor recto, pero no es reforzada. La ausencia de
recompensa provoca una inhibicin de la respuesta, la cual se asocia con el laberinto durante
el proceso de condicionamiento instrumental. Cuando se sita de nuevo la rata en el corredor
se produce la inhibicin como respuesta condicionada y la respuesta de carrera de la rata es
suprimida.
Sin embargo, la inhibicin no es el nico efecto que produce el no reforzamiento, ya que ste tiene
una serie de propiedades que veremos a continuacin.
a) Propi edades aversi vas de l a ausenci a de recompensa. Amsel (1958), sugiri que la
ausencia de recompensa produce un estado aversivo de frustracin. Los estmulos asociados con la
ausencia de recompensa pueden producir una respuesta condicionada de frustracin y, por lo tanto,
escapar de una situacin aversiva de este tipo, supone para el sujeto o animal un reforzante.
Autores como Adelman y Maatsch (1955) obtuvieron evidencia sobre las propiedades aversivas de la
frustracin y las propiedades reforzantes del escape de una situacin frustrante. Otros estudios tambin
han demostrado que los estmulos asociados con el no reforzamiento adquieren propiedades aversivas
para el sujeto o animal.
Dejar de reforzar una respuesta instrumental da lugar a una inhibicin de esa respuesta, as como a
la aparicin de una conducta de evitacin. Inicialmente la conducta de evitacin es una respuesta de
escape ante la frustracin producida por la ausencia de recompensa.
b) Act i vaci n de l a conduct a i nst rument al . Algunas veces la ausencia de recompensa produce
un aumento, en lugar de una disminucin, en la intensidad de la conducta instrumental. Esto es debido a
que las claves de frustracin se han condicionado a la conducta apetitiva en lugar de a la conducta de
evitacin.
La conducta de un animal en una tarea de alternancia simple muestra como la ausencia de
recompensa puede condicionarse para motivar una respuesta instrumental apetitiva. En una situacin de
este tipo (alternancia simple), se alternan ensayos reforzados y ensayos no reforzados. Algunos estudios
llevados a cabo con este procedimiento han demostrado que la intensidad de la respuesta puede aumentar
tras un ensayo no reforzado, pero disminuye generalmente despus de un ensayo reforzado.
Con respecto a la cuestin de por qu en una tarea de alternancia simple (secuencia de conducta
reforzada, conducta no reforzada, y as sucesivamente) la intensidad de la respuesta aumenta despus de
un ensayo no reforzado, pero disminuye despus de un ensayo reforzado, la teora de Capaldi (1966, 1967
y 1971) proporciona una explicacin a este proceso de condicionamiento. Segn este autor, al comienzo
de cada ensayo, el sujeto recuerda si en el ensayo anterior fue reforzado o no. Capaldi denomina ER a la
memoria de reforzamiento (es decir, el sujeto se acuerda de que ha sido reforzado), y denomina EN a la
30

memoria del no reforzamiento (es decir, el sujeto se acuerda de que no ha sido reforzado). Cuando la
recompensa sigue a un ensayo no reforzado, la memoria del no reforzamiento (EN) se asocia con la
respuesta instrumental produciendo un aumento de la respuesta tras el no reforzamiento.
En resumen, algunas veces la ausencia de reforzamiento produce un incremento en la intensidad de
la conducta instrumental. Capaldi considera que este incremento se debe a que se condiciona la memoria
de no reforzamiento (se condiciona esta memoria porque el sujeto sabe que la prxima vez va a ser
reforzado) para producir la conducta apetitiva.
7 . 2 . 2 7 . 2 . 2 L a r e s i s t e n c i a a l a e x t i n c i L a r e s i s t e n c i a a l a e x t i n c i n n
Hay tres factores que parecen contribuir significativamente a la resistencia a la extincin de una
respuesta instrumental, estos tres factores son:
[1. La magni t ud de l a recompensa reci bi da durant e l a adqui si ci n de una respuest a
i nst rument al . DAmato (1970) sugiri que el efecto de la magnitud de la recompensa recibida
durante la adquisicin sobre la resistencia a la extincin dependa de la cantidad de
entrenamiento:
o Si el nivel de entrenamiento durante la adquisicin es bajo, una recompensa grande produce
mayor resistencia a la extincin que una recompensa pequea.
o Si el entrenamiento es prolongado, se produce el efecto opuesto: una recompensa pequea
durante la adquisicin produce mayor resistencia a la extincin de la respuesta instrumental
que una recompensa grande.
[2. El ef ect o de l a demora de l a recompensa. El efecto de la demora de la recompensa sobre la
resistencia a la extincin depende de su consistencia.
o Si la demora de la recompensa durante la adquisicin es constante, no afecta a la resistencia
a la extincin.
o Si la demora de la recompensa es una demora variable, se incrementa la resistencia a la
extincin.
Con diferentes intervalos de demora se producen diferencias en la adquisicin final. Cuando se
comparan los efectos de una demora variable o constante de la recompensa durante la adquisicin, es
notorio que la demora variable afecta a la resistencia a la extincin. Varios investigadores han comprobado
una resistencia a la extincin mayor cuando la recompensa se demora en algunas ocasiones (y no de
forma continua) que cuando nunca se demora. Sin embargo, es necesario destacar que una demora
variable incrementa la resistencia de la respuesta a la extincin.
En resumen, la investigacin sobre el efecto de la demora de la recompensa indica que la resistencia
a la extincin aumenta cuando se demora la recompensa algunas veces durante la adquisicin. Sin
embargo, si la recompensa es siempre demorada no afecta a la resistencia a la extincin.
[3. El ef ect o del ref uerzo parci al . Resulta difcil extinguir una conducta cuando esta ha sido
reforzada de forma intermitente, es decir, la extincin se produce ms lentamente tras el
reforzamiento parcial que tras el reforzamiento continuo. La mayor resistencia a la extincin que
se produce con el reforzamiento intermitente se denomina Efecto del reforzamiento parcial (ERP).
Humphreys (1939) y Skinner (1938) fueron los primeros en describir esta mayor resistencia a la
extincin con el reforzamiento parcial que con el reforzamiento continuo. Tras estos dos autores pioneros,
muchos estudios han demostrado posteriormente el efecto del reforzamiento parcial, que constituye uno de
los fenmenos ms fiables en psicologa.
Weinstock (1954) encontr una relacin inversa entre la resistencia a la extincin y el porcentaje de
ensayos reforzados. Esto indica que al disminuir la probabilidad de que la respuesta sea reforzada durante
31

la adquisicin, aumenta la resistencia a la extincin. El efecto del reforzamiento parcial se ha demostrado
tambin en estudios llevados a cabo con sujetos humanos, en donde se ha comprobado que la resistencia
a la extincin era mayor cuanto ms bajo haba sido el porcentaje de respuestas reforzadas durante la
adquisicin. Por ejemplo, imaginemos a tres nios que son reforzados por tirar 100 veces de la palanca de
una mquina tragaperras. El primero de ellos, recibe una ficha 33 veces de las 100. El segundo recibe una
ficha 67 veces de las 100 (reforzamientos intermitentes) y el ltimo recibe 100 fichas, es decir, recibe una
cada vez que tira de la palanca (reforzamiento continuo). Durante la extincin, se deja jugar a los sujetos
con las mquinas tanto como deseen, sin recibir ninguna ficha. Comprobndose que el ltimo que
abandona la mquina es el que menos fichas haba recibido durante la adquisicin.
Sin embargo, hay que tener en cuenta que si el porcentaje de ensayos es demasiado bajo, el
aprendizaje ser mnimo y la extincin muy rpida. Los estudios que han empleado un porcentaje muy
pequeo o muy grande de ensayos reforzados han observado generalmente una relacin en forma de U
entre el porcentaje de respuestas reforzadas y la resistencia a la extincin. Es decir, un porcentaje bajo o
alto de reforzamiento produce una extincin ms rpida de la respuesta operante que cuando se refuerzan
solamente algunas de sus emisiones, en pocas palabras: hay que encontrar el trmino medio.
En resumen, una respuesta que no ha sido reforzada cada vez que se produjo, persiste ms tiempo
durante la extincin que una respuesta que ha sido siempre reforzada.
Capaldi sugiere que el nivel de resistencia a la extincin producida por el reforzamiento parcial
depende de dos factores secuenciales:
(a). La resistencia a la extincin es ms grande cuanto mayor es el nmero de ensayos de
condicionamiento efectuados durante la adquisicin, porque cuanto mayor es el nmero de
ensayos de condicionamiento, ms fuerte es la asociacin del refuerzo con la respuesta
instrumental.
(b). Cuando mayor es el nmero de ensayos consecutivos no reforzados antes de recibir la
recompensa, ms lenta es la extincin de la respuesta instrumental. La literatura demuestra
que la resistencia a la extincin es mayor cuanto ms grande es el nmero de ensayos no
reforzados.
Despus de todo esto deberamos plantearnos la importancia que tiene el efecto del reforzamiento
parcial. Segn Flaherty (1985), las observaciones de los animales en su medio natural indican que sus
intentos por conseguir metas deseadas, son algunas veces fructferos, pero otras veces no. Flaherty
considera que el ERP (efecto del reforzamiento parcial) es adaptativo porque motiva a los animales para
que no abandonen demasiado pronto, perdiendo la oportunidad de tener xito. Sin embargo, los animales
que reciben reforzamiento parcial no continan respondiendo sin recompensa de forma indefinida, una
observacin que indica que los animales no siempre persisten y, por lo tanto, experimentan
constantemente una frustracin continuada.
32

8 8 Ge n e r a l i z a c i Ge n e r a l i z a c i n y d i s c r i mi n a c i n y d i s c r i mi n a c i n n
8. 1 8. 1 La gener al i z ac i La gener al i z ac i n n
La generalizacin de estmulos puede definirse como el proceso por el cual los organismos realizan la
Respuesta al Estmulo Condicionado en respuesta a un estmulo nuevo -distinto del EC o ED originales-
que es similar al estmulo original del entrenamiento (Tarpy, 1983). Es un proceso mediante el cual los
animales o las personas responden del mismo modo ante estmulos similares. Por ejemplo, si el EC
original fue un sonido, el sujeto responder tambin a un nuevo sonido que difiera en tono o intensidad. La
generalizacin se produce frecuentemente en la vida real, aunque en ocasiones no es deseable. Por
ejemplo, los prejuicios raciales, tnicos, y religiosos son ejemplos de generalizaciones no deseables que
ocurren cuando alguien que ha tenido una experiencia desagradable con un miembro de un grupo racial,
tnico o religioso, generaliza su aversin a otros miembros de ese grupo.
En ocasiones, sin embargo, la generalizacin es adaptativa. Por ejemplo, si el estudiante lee un libro
que le gusta mucho, condiciona una respuesta emocional positiva hacia el libro. Ese estudiante
generalizar ms tarde su respuesta emocional positiva a otros libros de modo que estudiar ms. Esta
capacidad adaptativa de la generalizacin proporciona la base para responder adecuadamente a los
estmulos a los que no se ha sido expuesto anteriormente. La importancia de este capacidad es
especialmente evidente cuando los estmulos sealan peligros potenciales para el organismo.
Sin embargo, se producen diferentes cantidades de generalizacin. A veces respondemos por igual a
todos los estmulos que se parecen al estmulo asociado con el condicionamiento. Imaginemos una
persona que se pone enferma cuando sale a un viaje. Esa persona puede generalizar su experiencia
emocional negativa, y evitar salir nuevamente de viaje. En otras situaciones se observa menos
generalizacin conforme disminuye la semejanza con el Estmulo Condicionado. A una persona le muerde
un perro grande. Esto puede hacer que la persona no muestre un miedo intenso ante cualquier perro;
puede asustarse con los perros grandes, asustarse moderadamente con los perros medianos, y
escasamente o nada con los perros pequeos. En este caso observamos que cuanto ms grande es la
diferencia de tamao entre los perros, menor es la generalizacin del miedo que se produce.
Se han propuesto muchas teoras para explicar la generalizacin del estmulo. Vamos a ver la teora
de Lashey-Wade sobre la generalizacin del estmulo, ya que parece ser la que mejor explica porque
algunas veces se produce generalizacin y otras no.
Para Lashey y Wade (1946) los animales y las personas responden ante estmulos diferentes al del
entrenamiento debido a que no logran distinguir entre el estmulo presentado durante la prueba de
generalizacin y el estmulo condicionado. Por este motivo, para estos autores, la generalizacin del
estmulo se debe a una incapacidad para discriminar entre el estmulo de prueba y el de entrenamiento.
Estos autores crean que si los animales o las personas fuesen capaces de diferenciar entre el estmulo del
condicionamiento y otros estmulos no mostraran una respuesta generalizada ante estos otros estmulos,
es decir, no se dara la generalizacin.
Para estos autores la generalizacin constituye una incapacidad para discriminar, la discriminacin
impide la generalizacin y el fallo en la discriminacin da lugar a la generalizacin.
Varias lneas de evidencia apoyan esta teora:
(a). Cuando se utiliza un procedimiento de reforzamiento no diferencial (es decir, el animal no aprende
ante que estmulo se le est reforzando, porque se presenta el estmulo de condicionamiento durante
toda la sesin de entrenamiento, por ejemplo un ruido), se produce una generalizacin incluso ante
estmulos diferentes al del entrenamiento.
(b). El entrenamiento de discriminacin produce generalizacin solamente ante estmulos muy parecidos
33

al estmulo condicionado.
(c). Se produce generalizacin cuando el animal no puede diferenciar entre el estmulo entrenado y los
estmulos de la prueba de generalizacin.
(d). La experiencia perceptiva influye en la magnitud de la generalizacin. Para estos autores, el
aprendizaje perceptivo es indispensable para que el animal discrimine entre los diferentes estmulos y
generalice su respuesta a los que son similares. Por ejemplo, es muy difcil que un nio pequeo
discrimine entre los diferentes colores si no ha tenido experiencias perceptivas con ellos, es decir, los
desconoce. Los resultados de los diversos experimentos muestran que al aumentar la experiencia
perceptiva, los gradientes de generalizacin se vuelven ms agudos, es decir, el sujeto discrimina
mejor.
8. 2 8. 2 El apr endi z aj e di s c r i mi nat i v o El apr endi z aj e di s c r i mi nat i v o
Aunque la discriminacin se halla estrechamente relacionada con la generalizacin, constituye un
rea de estudio con derecho propio (Tarpy, 1983).
En ocasiones y durante el entrenamiento de condicionamiento el reforzamiento est disponible y se
produce contingentemente sobre la respuesta apropiada. Sin embargo, en otras situaciones no est
disponible y no se producir a pesar que se d la respuesta correcta. Para responder cuando el
reforzamiento est disponible y no cuando no lo est, tenemos que aprender a discriminar, es decir, no
slo tenemos que descubrir las condiciones que indican la disponibilidad del reforzamiento y responder
cuando se dan esas condiciones, sino que tambin tenemos que identificar las circunstancias que indican
la no disponibilidad del reforzamiento para no responder en esas ocasiones. En nuestra vida diaria, nos
enfrentamos frecuentemente a tareas de discriminacin. Por ejemplo, imagnate que has quedado con un
amigo en un aula especfica de la facultad. Cuando acudes a la facultad, no acudes a cualquier aula, sino
que te diriges al aula correcta, para conseguir de esta manera el reforzamiento (cita con el amigo).

Trminos a considerar:
E
D
= es un estmulo que seala que el reforzador est disponible.
E
A
= es un estmulo que indica que el reforzador no est disponible.
Debemos aprender a discriminar entre las condiciones que indican la disponibilidad del reforzamiento
(E
D
) y las condiciones que indican su no disponibilidad (E
A
) para interactuar de forma eficaz con nuestro
ambiente. Una incapacidad para discriminar har que no respondamos cuando el reforzamiento est
disponible o que respondamos cuando no lo est. En muchas ocasiones, una incapacidad para discriminar
ocasiona serios inconvenientes, y a veces puede producirse una conducta patolgica como consecuencia
de una incapacidad para discriminar.
El aprendizaje discriminativo implica descubrir no solamente si el reforzador est disponible o no, sino
tambin cundo puede ocurrir un acontecimiento aversivo. Por ejemplo, determinadas caras de tu madre te
indican que puede producirse una discusin, otras indican que est de buen humor.
Et apas en l a adqui si ci n de una di scri mi naci n
1) Los ani mal es o l as personas t i enen que di f erenci ar (o di st i ngui r) ent re el ED y el EA. En
ocasiones los fallos en el proceso de diferenciacin o discriminacin pueden ser fallos del sistema
perceptivo de la persona o el animal. Por ejemplo, una persona o animal que son ciegos para el color no
podrn distinguir entre dos colores diferentes. En ocasiones estos fallos del sistema perceptivo pueden ser
heredados.
En ocasiones tambin la capacidad para distinguir entre los estmulos discriminativos depende de la
experiencia perceptiva, ya que la ausencia de experiencia perceptiva puede dar lugar a una incapacidad
34

para discriminar. Por ejemplo, un nio que no conoce los colores (es decir, no ha tenido experiencia
perceptiva con ellos) puede verlos pero no puede diferenciarlos. La experiencia perceptiva es fundamental
para el aprendizaje discriminativo. Para Gibson (1969), el aprendizaje perceptivo, se produce como
resultado de la experiencia aunque no implica reforzamiento alguno, ms bien, est motivado por una
necesidad heredada de descubrir las caractersticas relevantes del ambiente que nos permitirn sobrevivir.
2) Los ani mal es o l as personas t i enen que at ender a l as di mensi ones rel evant es de l os
est mul os. El fenmeno que consiste en atender a un aspecto de una situacin mientras se ignoran otras
dimensiones se denomina "atencin selectiva". La atencin selectiva posee un claro significado adaptativo.
Si atendemos a demasiada informacin ambiental seremos incapaces de detectar los eventos realmente
importantes. Por este motivo, la limitacin en la cantidad de informacin procesada permite procesar esa
informacin ms eficazmente. Imagnate que ests estudiando, si atiendes a todos los estmulos del
ambiente (el ruido de la calle, los pasos de la vecina de arriba, la radio de tu hermano en el otro cuarto)
sers incapaz de estudiar. Entonces debes atender slo al libro que estas estudiando. Sin embargo, la
atencin selectiva te impedir el aprendizaje discriminativo. Lgicamente, si no atiendes a todos los
estmulos relevantes no puedes aprender los estmulos discriminativos y en consecuencia, no
interactuars adecuadamente con el ambiente. Para maximizar tu xito en un aprendizaje discriminativo
debes atender a la dimensin asociada con la recompensa, es decir, al ED.

La t eor a del f i l t ro de l a at enci n sel ect i va.
Para responder a la pregunta de por qu algunas personas son sensibles a cierta informacin
ambiental y ajena a otros eventos, Broadbent (1958) propuso una explicacin sobre la
atencin selectiva denominada del filtro selectivo. Segn este autor, los animales y las
personas poseen una capacidad de procesamiento de informacin limitada. Para que se
procese la informacin de una manera adecuada, parte de la informacin que llega a nuestros
receptores sensoriales no es procesada, se rechaza debido a que un filtro selectivo hace que
slo cierta informacin se procese, rechazando el resto. El filtro selectivo hace que la
informacin sea transmitida llegando al sistema nervioso central, solamente la informacin de
un canal a la vez que impide que otra informacin sea transmitida. Broadbent consideraba
que el filtro selectivo impide que se procese la informacin de los canales no atendidos. Sin
embargo, la evidencia indica que el filtro selectivo atena la intensidad de los mensajes no
atendidos en lugar de bloquear totalmente el procesamiento de la informacin de dos canales.
Debido a esa atenuacin de su intensidad, no se procesa la mayor parte de la informacin no
atendida, pero las personas pueden detectar la informacin importante aumentando su
sensibilidad hacia esa informacin. Imagnate, que ests en la cocina estudiando mientras tu
madre hace la comida y te habla constantemente. T ests atendiendo al libro, y no procesas
lo que tu madre te dice, es decir, no sabes lo que te est diciendo, pero de repente tu madre
pronuncia tu nombre, aumentando la intensidad de su voz, seguramente tu atencin se
apartar del libro y se volver hacia tu madre. Si la informacin que no procesas
(conversacin de tu madre) fuera bloqueada, tal y como defiende Broadbent no oiras ni
siquiera tu nombre, sin embargo, el hecho de que lo escuches es debido a que la
conversacin de tu madre simplemente est atenuada y en el momento en que algo despierta
tu curiosidad o atencin (tu nombre) puedes aumentar tu sensibilidad hacia la conversacin y
atenderla.

Procesami ent o de i nf ormaci n cont rol ado versus aut omt i co.
La investigacin reciente, est en contra de la teora del filtro de la atencin selectiva debido a
35

que las personas pueden procesar ms de una unidad de informacin al mismo tiempo.
Muchas personas pueden conducir sin ningn tipo de problema mientras mantienen una
conversacin con el compaero de al lado.
Para contestar a la pregunta de cmo pueden procesarse simultneamente dos unidades de
informacin diferente, Shiffrin y Schneider (1977) sugirieron que hay dos tipos diferentes de
procesamiento de informacin:
a) El procesamiento controlado. El procesamiento controlado requiere atencin y
generalmente slo permite atender a una unidad de informacin a un tiempo. El conductor
debe prestar atencin a la conversacin que mantiene con el compaero de al lado para
entenderla, la conversacin por lo tanto requiere un procesamiento controlado.
b) El procesamiento automtico. Requiere poca o ninguna atencin y se produce cuando una
persona participa en una actividad altamente practicada como conducir, coser, cortar dibujos,
pegar dibujos, etc.

3) Los est mul os di scri mi nat i vos t i enen que ganar cont rol sobre l a conduct a de l os suj et os.
La literatura indica que algunas modalidades de estmulos requieren control sobre la respuesta; otras
modalidades en cambio, no se utilizan porque los sujetos no pueden detectar cuando responder y cuando
no. Es decir, es posible que un animal o una persona no respondan ante estmulos de una modalidad
determinada an cuando esos estmulos:
a. estn relacionados con el reforzamiento,
b. se puedan diferenciar, o
c. el sujeto les preste atencin.
La dimensin del color controla la conducta de los primates, es decir, se les puede condicionar para
que aprietan una palanca utilizando estmulos de color, sin embargo, no discriminan las barras horizontales
y verticales, a no ser que se las asocie con otras claves (por ejemplo con el color), es decir, las barras
horizontales y verticales no influyen en la conducta de los monos.
Otros psiclogos han demostrado que cuando se asocia ms de una dimensin del estmulo con el
reforzamiento, una de las claves adquiere control sobre la respuesta mientras que las restantes no influyen
sobre la respuesta del animal. Si a un nio de 3 aos se le muestran distintas figuras geomtricas
(cuadrados, tringulos, crculos), y de distinto color (rojo, verde, naranja...) y se le pide que traiga el crculo
verde, posiblemente traer un circulo (de un color cualquiera) o una figura de color verde. Es decir habr
una dimensin estimular que adquirir control sobre la conducta, pero otra dimensin no influir. Sin
embargo, la investigacin demuestra que el sobreentrenamiento puede aumentar el nmero de elementos
del estmulo que controla la conducta. Por eso, cuando el nio crece y va siendo sobreentrenado llega a
ser capaz de adquirir la propiedad de discriminar los dos estmulos a la vez. Tambin ocurre que el nio
con la edad es ms capaz de ello, en parte tal vez por el efecto de la maduracin.

Deben resaltarse dos aspectos que influyen en la adquisicin de la respuesta de discriminacin: el
primero es que si la persona o el animal no muestran la conducta caracterstica de cada fase no pueden
aprender la conducta discriminativa. En segundo lugar, un animal o una persona puede diferenciar los
estmulos discriminativos mientras est atendiendo a sus dimensiones relevantes y aun as puede que no
aprenda a discriminar debido a que los estmulos discriminativos no adquieren control sobre su respuesta.
36

9 9 Ap l i c a c i o n e s e d u c a t i v a s d e l a s Ap l i c a c i o n e s e d u c a t i v a s d e l a s t c n i c a s t c n i c a s
o p e r a n t e s o p e r a n t e s
Como hemos visto a lo largo de los captulos precedentes el condicionamiento operante es un
procedimiento que nos permite crear, eliminar o modificar una conducta en mltiples contextos. A todos
nos puede resultar fcil pensar en situaciones escolares en que parece adecuado el intentar modificar
alguna de las conductas que presentan los estudiantes. As, en ocasiones nos encontramos con
comportamientos disruptivos que interfieren negativamente con la actividad acadmica del propio escolar o
con la de sus compaeros y, en otros casos, tambin podemos observar conductas que impiden el
adecuado desarrollo de las sesiones de trabajo y de las tareas del propio docente. En el lado opuesto,
nadie dudar de la necesidad de fomentar y potenciar comportamientos adecuados y positivos en el
contexto escolar, tales como el mantenimiento de la atencin, el uso de estrategias de estudio eficaces o el
facilitar pautas de interaccin entre los estudiantes.
En este captulo nos introduciremos, con la brevedad que exigen estas pginas, en la utilidad que el
condicionamiento operante puede tener en el contexto escolar. En este sentido, en trabajos especializados
en la temtica (p.e., Clemente y Gimeno, 1993) se seala que el conductismo, a pesar de su evidente
reduccionismo, fue sin duda la corriente terica y prctica que ms contribuy a afianzar el carcter
cientfico de la propia Psicologa, y a desarrollar el rol profesional del Psiclogo de la Educacin dotndole
de potentes herramientas de intervencin en los contextos instruccionales. De este modo, en primer lugar
analizaremos los pasos a seguir, as como las precauciones y consideraciones que debemos considerar a
la hora de disear e implementar un programa conductual. Seguidamente introduciremos las tcnicas y
procedimientos ms usuales para propiciar en el cambio conductual y, finalmente, concluiremos con una
serie de actividades que ayuden al lector a consolidar el material expuesto a lo largo del captulo.
9. 1 9. 1 Di s e Di s e o y apl i c ac i o y apl i c ac i n de pr ogr amas de c o n de pr ogr amas de c o ndi c i onami ent o ndi c i onami ent o
en l a i nt er v enc i en l a i nt er v enc i n es c ol ar n es c ol ar
Desde los aos 60 el condicionamiento operante ha estado siendo utilizado con xito en entornos los
escolares, constatado generalmente la obtencin de buenos resultados de estas tcnicas. Sin embargo,
tampoco han sido pocas las voces crticas que se han alzado contra estos procedimientos, especialmente
por razones que podemos situar en el mbito de la tica. Por este motivo antes de iniciar cualquier
procedimiento conductual debemos asegurarnos de que el cambio que deseamos producir no est
afectado por ningn tipo de prejuicios, y que el nico objetivo final de la intervencin es ayudar al
estudiante a aprender ms eficazmente, estar ms satisfecho consigo mismo y con su entorno y, por tanto,
incrementar su autoconfianza. As, no podemos olvidar que el planteamiento de cualquier intervencin
debe efectuarse desde acercamientos constructivos de la personalidad del sujeto y no aspirar, a travs de
la utilizacin de estas u otras tcnicas, a desarrollar individuos dciles que respondan a los deseos de los
adultos significativos en contra de su propio desarrollo personal.
Con el fin de garantizar una aplicacin tica de los programas debemos contar con la participacin
del estudiante, de los padres y de algn miembro de la institucin educativa durante todo el proceso de
intervencin, eligiendo conjuntamente tanto las conductas problemticas a erradicar o modificar como la
eleccin de las metas deseables a las que se aspira llegar con el programa conductual.
Destacada esta cuestin previa, a continuacin nos centraremos en plantear las fases que debemos
seguir a la hora de disear y aplicar un programa de intervencin conductual.
37

9 . 1 . 1 9 . 1 . 1 I d e n t i f i c a c i I d e n t i f i c a c i n r e a l i s t a d e l p r o b l e ma n r e a l i s t a d e l p r o b l e ma
Algunas veces los maestros, los padres o incluso los propios estudiantes, pueden considerar que
determinadas conductas son problemticas, cuando en realidad ese problema solo existe para la persona
que lo ve como tal. Esto se debe a que las personas frecuentemente nos trazamos a nosotros mismos -y
para los dems- metas inalcanzables, y vivimos la no consecucin de esas metas como un problema. En
estos casos la intervencin deber ir encaminada a conseguir que el sujeto marque unos objetivos
realistas.
Sulzer-Azoroff y Mayer (1983) indican que para que exista un problema real deben presentarse uno o
ms de los sucesos siguientes:
(a). Deben existir varias solicitudes independientes (padres, profesores, compaeros, familiares, etc.)
de asistencia para el mismo nio.
(b). Existe un funcionamiento diferente al de su grupo de iguales. Por ejemplo, un rendimiento
evidentemente inferior al de sus compaeros, problemas de interaccin con los pares, etc.
Problemas en los que es recomendable sean percibidos por varias fuentes como vimos
anteriormente.
(c). Se observen cambios espectaculares en la conducta de un individuo. Por ejemplo, una cada
brusca en el rendimiento acadmico, un deterioro evidente de las relaciones interpersonales, un
incremento sustancial de conductas disruptivas, etc.
Una vez se toma la decisin de la existencia de un problema real en la conducta del sujeto, este debe
ser definido adecuadamente y operacionalizado en conductas observables del sujeto.
9 . 1 . 2 9 . 1 . 2 De t e r mi n a r l a s p e r s o n a s q u e i n t e r v e n d r De t e r mi n a r l a s p e r s o n a s q u e i n t e r v e n d r n e n e l p r o g r a ma n e n e l p r o g r a ma
c o n d u c t u a l c o n d u c t u a l
Como hemos visto anteriormente son varios los individuos que deben intervenir en un programa de
cambio conductual, y nos solo por motivos de control tico, sino tambin para conseguir que el programa
sea realmente efectivo, ya que se necesita la colaboracin de las personas que rodean al estudiante en los
ambientes significativos para el mismo, con el fin de que observen su conducta, y apliquen los programas
de intervencin de forma consistente. Por ello son varias las personas que deben intervenir en el diseos,
aplicacin y durante la evaluacin continua que se realice durante el programa:
a) El est udi ant e
Como es lgico, no puede existir un programa de cambio conductual sino existe y colabora la persona
sobre la que queremos aplicarlo. Es vital en el desarrollo del programa que sea el propio sujeto el que
intervenga directamente en la seleccin de las metas, aunque estas deben estar mediadas por el analista
con el fin de que estas sean alcanzables. El estudiante debe sentirse libre a la hora de seleccionar las
metas, as como de retirarse del programa en cualquier momento. Puede darse el caso de que la persona
sobre la que va aplicarse el programa conductual no tenga capacidad para intervenir en esas decisiones,
por motivos de corta edad, incomunicacin, retraso mental profundo o problemas emocionales graves.
En estos casos, incluso algunos autores han recomendado con especial nfasis la intervencin de un
defensor que abogue por los intereses del sujeto, y que sea independiente del resto de los agentes
(Sulzer-Azaroff, .y Mayer; 1983)
b) Los agent es del cambi o.
Pueden ser los padres, maestros, el propio psiclogo, un especialista o terapeuta externo al mbito
escolar, etc. Estos sern los encargados de aplicar de forma consistente y sistemtica el programa
conductual, en alguno casos incluso el propio sujeto acta como agente del cambio autoadministrndose
38

total o parcialmente el programa de refuerzos.
c) Tambi n suel e ser necesari a l a col aboraci n de auxi l i ares.
Estos auxiliares observaran e informaran sobre la conducta del sujeto, a lo largo del programa en los
diferentes entornos. Estos pueden ser los propios compaeros, otros profesores o el personal no docente
del centro, etc.
d) Por l t i mo, el prof esi onal .
Este es el encargado de disear, implementar y evaluar el programa conductual. Dirigir las reuniones
conjuntas, vigilando la correcta definicin del problema y de las metas.
Como podemos observar los roles no son completamente estancos y una misma persona puede
asumir roles distintos en cada momento del programa.
9 . 1 . 3 9 . 1 . 3 El e c c i El e c c i n d e l a s me t a s n d e l a s me t a s - - o b j e t i v o o b j e t i v o
La meta final es la eliminacin, adquisicin o el fortalecimiento de una o algunas conductas del sujeto.
En el caso de que el programa tenga por objetivo la adquisicin o el fortalecimiento de conductas,
simplemente deberemos desarrollar algn programa de refuerzo. El caso de la supresin de conductas es
bastante ms comprometido, ya que no es recomendable la utilizacin de programas de castigo que
tengan como objetivo suprimir esa conducta, dado que puede producir efectos colaterales; no suele
generalizarse a otros contextos donde no exista el castigo y la conducta problemtica suele reaparecer una
vez retiramos el control punitivo. Por lo tanto, en estos casos es recomendable fomentar conductas
alternativas reforzantes para el sujeto y evitar en la medida los posibles efectos reforzantes de la conducta
problemtica.
Por otra parte, debemos estar seguros de que las metas elegidas no entran en conflicto con otras
conductas positivas del sujeto y de que, adems, son realmente deseables para l. Para ello es
determinante que sea el propio sujeto quien se marque las metas a conseguir. En el caso de metas
propuestas por otros agentes, aunque hayan sido aceptadas por el sujeto, debemos comprobar que stas
benefician realmente al estudiante y no slo a los otros agentes implicados en la intervencin.
A la hora de seleccionar las metas debemos tambin tener en cuenta el ambiente social en que se ha
de producir la conducta, con el fin de evitar que sta pueda entra en contradiccin o producir
confrontaciones en el medio social del sujeto.
La meta debe especificarse en objetivos conductuales observables en el sujeto. Esta especificacin
debe ser lo ms explcita posible tanto en trminos de las respuesta que se desea, dnde se desea, y con
qu intensidad y frecuencia debe darse. Para ello es conveniente fijar los criterios, que deberan cumplirse
para afirmar que la conducta objetivo ha sido realizada y por lo tanto debe reforzarse al sujeto. Es
adecuado que el objetivo del programa quede operacionalizado en varias conductas meta deseables por el
sujeto.
9 . 1 . 4 9 . 1 . 4 Ob s e r v a c i Ob s e r v a c i n d e l a c o n d u c t a n d e l a c o n d u c t a
Para poder determinar el xito de un programa debemos ser capaces de demostrar con datos
objetivos que se ha incrementado el nmero de conductas deseables y, en su caso, si se han eliminado o
reducido de forma importante las conductas problema. Para ello debemos hacer una medicin exacta,
objetiva y fiable del comportamiento del alumno, hecho que exige que las conductas a medir deben hayan
sido especificadas de manera exacta, objetiva y fiable. Debemos asegurarnos de que el sujeto sea
observado durante la mayor parte del tiempo posible para evitar que se produzcan conductas que no
queden registradas.
Las conductas medidas sern transcritas a un registro de datos conductuales, donde se determine el
39

nmero de conductas realizadas por unidad de tiempo. Normalmente se lleva un registro grfico por das
en que se representen los das y la frecuencia con que aparecido la conducta en cada uno de ellos. Es
conveniente poner en el mismo grfico las diversas conductas que estemos midiendo independientemente
de que sean conducta problema o meta, esto nos ayudara a ver rpidamente la evolucin del sujeto. Para
llevar de forma correcta este registro deberemos sumar las aportaciones de los agentes del cambio, y de
los auxiliares u otras personas que estn colaborando con el programa, con la precaucin de haber
adiestrado correctamente a todos ellos en la discriminacin correcta de las conductas que deben observar.
El registro debe iniciarse antes de la aplicacin del programa para poder contar con una lnea base,
este registro debe comprender al menos una semana, y la lnea que obtengamos nos servir de punto de
comparacin con los resultados una vez iniciado el programa conductual.
9 . 1 . 5 9 . 1 . 5 I d e n t i f i c a c i I d e n t i f i c a c i n d e r e f o r z a d o r e s n d e r e f o r z a d o r e s
Antes de aplicar cualquier programa conductual debemos seleccionar aquellos estmulos que puedan
actuar como reforzantes de las conductas que queremos promover. No debemos olvidar que lo que es
reforzante para un individuo puede no serlo para otro. En este punto s que es muy importante conocer
aquello por lo que el sujeto se siente realmente motivado, estos reforzadores podrn ser tangibles (p.e.,
caramelos, un juguete, un tebeo), sociales (p.e., alabanza de los padres, la aprobacin de los compaeros,
la atencin del docente), de actividad (p.e., una excursin, practicar un juego) y secundarios o
intercambiables por cualquiera de los anteriores (p.e., puntos para conseguir una bicicleta). Resulta
altamente positivo que los reforzadores surjan del dilogo con el estudiante y sea ste el que decida qu
tipo de refuerzos prefiere.
No solo debemos identificar los reforzadores positivos que deseemos implementar en nuestro
programa, sino que en el caso de que queramos eliminar alguna conducta indeseable debemos ser
capaces de identificar los reforzadores que mantienen esa conducta-problema para evitar fomentar su
aparicin. Como ejemplo tpico podemos destacar el nio que comete travesuras para atraer la atencin de
sus padres. En estos casos debemos conseguir que los padres no presten atencin al nio cuando cometa
una travesura, es decir, fomenten esta accin y, sin embargo, deben alabar y prestar atencin a su buen
comportamiento cuando este se produzca. La mejor manera de determinar qu reforzadores estn
manteniendo la conducta problemtica es la observacin del sujeto, analizando que pasa cuando emite las
conductas.
9 . 1 . 6 9 . 1 . 6 Di s e Di s e o d e l p r o c e d i mi e n t o d e r e f u e r z o o d e l p r o c e d i mi e n t o d e r e f u e r z o
Como hemos ido viendo a lo largo del libro existen en el condicionamiento operante una serie de
principios que debemos tener en cuenta a la hora de disear un programa de refuerzo.
a) I nmedi at ez del ref orzami ent o.
Ya que el reforzamiento inmediato es ms efectivo que el retrasado (Skinner, 1938). Esto puede ser
difcil de aplicar cuando utilicemos poderosos reforzadores como puede ser un viaje o una bicicleta, en
estos casos es conveniente presentar un reforzador condicionado como puede ser el decir " Muy bien si
sigues as iremos de viaje el prximo viernes', o instaurar un sistema de fichas, en donde un numero
predeterminado de fichas seria canjeable por una bicicleta. Aunque poco a poco los sujetos van
aprendiendo a tolerar retrasos en el reforzamiento cada vez ms largos. De hecho resulta deseable el ir
entrenando a la persona a aceptar retrasos en el refuerzo demorndolo progresivamente.
b) Det ermi naci n cl ara de l as condi ci ones que produci rn el ref orzami ent o.
Es necesario que el sujeto conozca de antemano las condiciones que deber cumplir para recibir el
reforzador.
40

c) Cant i dad de ref orzami ent o.
Esta depender del tipo de reforzadores que utilicemos, de la cantidad de esfuerzo necesario y de las
condiciones de privacin. Por ejemplo debemos tener en cuenta que los reforzadores comestibles pueden
producir saciedad rpidamente. No solo existe el problema de la saciedad sino que en algunos casos el
refuerzo puede ser tan dbil, una sonrisa, que pierda su capacidad reforzante.
d) Novedad.
No han sido pocos los trabajos que indican que cualquier organismo trabajara por experimentar un
estimulo novedoso. "Si todo permanece constante, los organismos preferiran colocarse a s mismos en
situaciones nuevas" (Millenson, 1967). Por tanto la novedad puede convertirse en un poderoso reforzador
si se utiliza de forma adecuada.
e) Muest reo del ref orzador.
Existen ciertos estmulos que pese a tener un alto potencial como reforzador, a veces, las reacciones
emocionales interfieren con la primera experiencia que tenga el individuo con l. Ayllon y Azrin (1963)
sugieren que "...antes de usar un suceso o estimulo como reforzador, se requiere un muestreo del
reforzador en la situacin en la que habr de usarse". Por ejemplo, en el caso de utilizar un cuento como
reforzador sera adecuado habrselo enseado previamente, y crear cierta expectativa. Si no hiciramos
esto quizs el cuento no servira como reforzador.
f ) Cont i ngenci as compet i t i vas.
Los sujetos se estn inmersos en un ambiente complejo, en el que constantemente estn siendo
reforzados y castigados, por lo tanto a la hora de realizar un programa de contingencias debemos tener en
cuenta todos los reforzadores que se producen en el ambiente del sujeto, especialmente los de aquellas
conductas que compiten con la conducta-meta esperada, ya que debemos encontrar reforzadores ms
poderosos que aquellos.
g) Programaci n.
A lo largo de los captulos anteriores hemos visto los diferentes programas de condicionamiento. Por
ejemplo en el caso de querer incrementar una conducta lo ms adecuado sera utilizar un reforzamiento
continuo, mas adelante iremos viendo que programa de refuerzo se debe utilizar en cada caso.
9 . 1 . 7 9 . 1 . 7 Pl a n i f i c a c i Pl a n i f i c a c i n y a p l i c a c i n y a p l i c a c i n d e l p r o g r a ma d e i n t e r v e n c i n d e l p r o g r a ma d e i n t e r v e n c i n n
Una vez hemos estudiado las variables que deben incidir en nuestro programa, debemos pasar a la
planificacin y aplicacin concreta de la intervencin. En la misma todas las funciones deben quedar
perfectamente asignadas, debidamente temporizadas, y con el material diseado en poder y conocimiento
de quien deba utilizarlo (Clemente y Gimeno, 1993). Esta planificacin ha de ser lo ms concreta posible,
quedando explicitadas todas las posibles situaciones que pueden darse, y como actuar ante cada una de
ellas.
Durante la aplicacin del programa debemos ir observando la conducta, haciendo un seguimiento de
los resultados, si las conductas metas progresan de forma adecuada, si aparecen efectos secundarios
durante la intervencin, etc. Si el sujeto no evolucionara de forma adecuada, o existieran problemas en la
aplicacin del programa deberemos realizar las adaptaciones oportunas, reformulando aquellas partes de
la intervencin que fuera necesario.
9 . 1 . 8 9 . 1 . 8 Ev a l u a c i Ev a l u a c i n d e l a i n t e r v e n c i n d e l a i n t e r v e n c i n n
Una vez hemos finalizado la aplicacin del programa de intervencin debemos comprobar en qu
41

grado se han satisfecho los objetivos del mismo, que coste en tiempo y dinero ha tenido, que beneficios ha
producido para el sujeto o su entorno, si se han producido algunas conductas inesperadas, o ha tenido
algn tipo de efecto negativo para el sujeto, etc.
La conclusin final de la intervencin debe basarse en la comparacin de las lneas base -o estado
inicial del problema antes de intervenir- con los niveles que presente el sujeto una vez finalizado el
programa de intervencin. Este anlisis debe ser extensivo en el tiempo, es decir, debemos comprobar
peridicamente el mantenimiento de los efectos de la intervencin una vez finalizado el programa. Por otra
parte, debe comprobarse si el sujeto generaliza la conducta intervenida de forma adecuada a otros
contextos.
9. 2 9. 2 Mt odos de el i mi nac i n, a Mt odos de el i mi nac i n, a dqui s i c i n e i nc r ement o de l a dqui s i c i n e i nc r ement o de l a
c onduc t a c onduc t a
9 . 2 . 1 9 . 2 . 1 L a a d q u i s i c i L a a d q u i s i c i n d e u n a c o n d u c t a n u e v a n d e u n a c o n d u c t a n u e v a
Las tcnicas de condicionamiento operante son especialmente efectivas cuando intentamos instaurar
una conducta nueva en el sujeto. Veamos los principales procedimientos usados para ello.
a) El mol deami ent o.
En esta tcnica es especialmente importante definir las caractersticas que la conducta meta debe
poseer, ya que al tratarse de una conducta que no existe en el repertorio del sujeto no podremos reforzar
su aparicin. Por lo tanto, lo primero que debemos conseguir es que se produzca la conducta o una
aproximacin.
El procedimiento para moldear una nueva conducta se inicia con una conducta tal y como existe en el
repertorio, e implica el reforzar leves cambios en ella a medida que se acerca gradualmente a la conducta
meta. As, se refuerzan de modo selectivo los elementos, o subconjuntos, de una conducta que se asemeja
a la deseada. (Sulzer-Azaroff y Mayer 1983)
Esta serie de reforzamientos a conductas cada vez ms parecidas a la conducta meta es lo que se ha
venido a denominar tcnicamente aproximaciones sucesivas. Por ejemplo en el caso de que queramos
ensear a un nio a dibujar un circulo, empezaremos aceptando prcticamente cualquier figura que se
cierre, y poco a poco iremos premiando figuras ms prximas a la deseada, hasta que el nio sea capaz de
realizar correctamente el circulo. El moldeamiento precisa de una cuidadosa observacin, para determinar
cul es el paso siguiente a ser reforzado, y durante cunto tiempo ser reforzada esa aproximacin.
Cuando la conducta meta haya sido moldeada figurara en el repertorio del sujeto, aunque tendr una
fuerza bastante baja, por lo tanto ser importante aplicar un programa de reforzamiento a la conducta
nueva con el fin de fortalecer la nueva conducta. Una vez este establecida con firmeza debern ser
diseados los procedimientos apropiados para su mantenimiento.
b) El encadenami ent o.
Cuando queremos ensear una tarea compleja, puede resultar adecuado dividirla en partes o
eslabones, con el fin de que el sujeto practique con conductas ms sencillas que ya posee en su repertorio.
Posteriormente los eslabones se irn uniendo en una cadena. El procedimiento por el cual se ensea al
sujeto a ejecutar la secuencia como una conducta unitaria es lo que se ha venido a denominar
encadenamiento, que funciona mejor si domina cada una de la subtareas que el sujeto debe utilizar. Si
esto no fuera as, sera necesario moldear la conducta antes de iniciar el encadenamiento.
A la hora de programar una cadena resulta prioritario la realizacin de un anlisis de tareas, que
subdivida adecuadamente la conducta meta que deseamos conseguir. El encadenamiento puede
42

producirse hacia atrs o hacia adelante segn el orden en que conectemos los distintos eslabones. En la
realizacin de una cadena cada conducta refuerza a la anterior, y sirve a su vez como estimulo que
ocasiona la conducta posterior.
El encadenamiento hacia atrs, cuando es posible, presenta una gran ventaja, ya que cada conducta
queda reforzada por la posterior que ha sido reforzada anteriormente. Imaginemos que queremos ensear
a un nio a quitarse los zapatos, al principio sera recomendable quitrselos y pedirle que los guarde, si lo
hace correctamente se aplicara el refuerzo. Con el tiempo la accin de guardar los zapatos se convertir
en un reforzador por s solo, ya que queda asociada al refuerzo. El siguiente paso sera dejar que el nio
se los quitara una vez desatados, los guardara y obtendra el refuerzo. Y as sucesivamente hasta que sea
capaz de realizar el solo todo la cadena. Como vemos cada eslabn queda reforzado por el siguiente, lo
que permite ir extendiendo la cadena hasta que las diferentes acciones quedan fundidas en una conducta
compleja.
Para conseguir el mantenimiento de esta conducta compleja, e incrementar la probabilidad de que
aparezca es necesario reforzarla cada vez que se ejecute completamente y en el orden apropiado.
9 . 2 . 2 9 . 2 . 2 L a r e d u c c i L a r e d u c c i n d e u n a c o n d u c t a n d e u n a c o n d u c t a
Debemos hacer hincapi, por motivos ticos y pragmticos, en una postura constructiva y no
centrarnos exclusivamente en la reduccin de conductas molestas. Desde el punto de vista tico, es ms
ventajoso para el sujeto el desarrollar nuevas conductas productivas que el eliminar conductas de su
repertorio. Desde una perspectiva pragmtica, el concentrarse en el desarrollo de una conducta nueva
tiende a generar conductas colaterales positivas (p.e., desarrollar autoevaluaciones ms positivas),
existiendo una mayor probabilidad de que el sujeto permanezca en la situacin y contine su progreso a lo
largo de la intervencin (Sulzer-Azaroff y Mayer 1983)
En este apartado presentamos los distintos procedimientos conductuales dirigidos a la reduccin de
conductas problemticas, ordenados de menor a mayor intrusividad. Dado que en algunas ocasiones nos
resultar inevitable el tomar la decisin de reducir ciertas conductas, deberemos considerar el utilizar la
tcnica menos intrusivas (ms naturales) que est a nuestra disposicin.
a) Ref orzami ent o di f erenci al de t asas baj as.
Es una tcnica poco intrusiva y por lo tanto recomendable si queremos acometer la tarea de reducir
una conducta pero no eliminarla totalmente.
Este tipo de programas consiste en premiar tasas bajas de una conducta. Por ejemplo, si queremos
eliminar los problemas de un nio que interrumpe constantemente la clase, podramos ir premindole por
la reduccin de esa conducta. Es una tcnica positiva, ya que el mensaje que recibe el sujeto es que su
conducta es apropiada aunque debe moderarla.
En este tipo de programas es necesario analizar detenidamente la lnea base, ya que la tasa a ser
reforzada debe ser fcilmente alcanzable para el sujeto, poco a poco se debe ir reduciendo esa tasa. Esta
tcnica requiere ms tiempo que otras ms intrusivas y no puede utilizarse en aquellas conductas que
tienen una baja frecuencia de aparicin, o en aquellas en las que ni siquiera podemos tolerar una tasa
baja, por ejemplo en el caso de agresiones muy violentas
b) Ref orzami ent o di f erenci al de ot ras conduct as.
Es un programa de reforzamiento en el que se premia cualquier conducta que no sea aquella que
deseamos eliminar. Por ejemplo podemos utilizar este programa para evitar que un nio se muerda las
uas, en este caso si durante un periodo de tiempo determinado, el nio no se ha mordido en ninguna
ocasin las uas, obtendra el reforzador.
Esta tcnica tambin es poco intrusiva y positiva, y suele eliminar rpidamente las conductas no
43

deseadas. Como en el caso anterior, al principio del programa debe ser fcil para el sujeto alcanzar el
reforzador, para ir incrementando poco a poco la dificultad. Es muy importante en este tipo de programas
que el sujeto no recibe refuerzo por esa conducta problemtica en otros contextos.
Uno de los principales problemas de este procedimiento es que al reforzar cualquier conducta, sera
posible hacerlo sobre otra conducta negativa. En estos casos deberamos incluir todas las conductas
negativas presentes dentro del programa, si fuera posible, o deberemos utilizar otro procedimiento
reductivo.
c) Ref orzami ent o de conduct as al t ernat i vas.
Este tipo de programas intenta favorecer una conducta positiva que es una alternativa a la conducta
indeseable. La conducta alternativa que se presenta debe competir con la indeseable, es decir si el sujeto
realiza esa conducta alternativa no puede realizar la otra. Por ejemplo, si un nio presenta un problema de
incomunicacin, le podemos premiar cada vez que habla con un compaero, ya que ambas conductas no
pueden coexistir.
Esta tcnica suele ser muy efectiva, y una vez que la conducta alternativa presenta una tasa alta es
difcil que la conducta problema vuelva a aparecer. Esta tcnica tambin resulta poco intrusiva, positiva y
constructiva para el sujeto.
La principal dificultad de este tipo de programas es seleccionar adecuadamente las conductas
alternativas. Es recomendable seleccionar una que ya pertenezca al repertorio del sujeto, y que tenga una
alta probabilidad de xito en el medio que debe producirse.
La principal desventaja de este tipo de procedimientos es que no acta de forma rpida, ya que
aunque se presente una tasa alta de la respuesta alternativa siempre hay tiempo para emitir la conducta
indeseable.
d) Cost o de Respuest a.
Este procedimiento conductual consiste en la eliminacin o retiro de un reforzador, o parte, al
producirse una conducta no deseada. El costo de respuesta es un procedimiento aversivo y por lo tanto
puede producir conductas de contracontrol entre los sujetos y aquellas personas que representan sus
intereses. Aunque de los procedimientos aversivos que veremos es el menos agresivo con el individuo.
Debemos tener cuidado de no utilizar sanciones excesivas, y vigilar la aparicin de conductas de escape
y/o agresin. Otra cuestin que debemos tener en cuenta a la hora de aplicar este tipo de programas es
que en los resultados experimentales se han encontrado fuertes diferencias individuales entre sujetos,
existiendo casos en que el programa no tuvo ningn xito.
Un ejemplo tpico de costo de respuesta seria el padre que impone una multa al nio cada vez que
dice una palabra soez. Para que el costo de respuesta se pueda producir es necesario que el estudiante
este expuesto a un refuerzo positivo. La principal diferencia con el castigo es que en este procedimiento al
aparecer la conducta no deseada se retira parte de un reforzador, y en el castigo lo que se realiza es la
presentacin de un estimulo aversivo.
El costo de respuesta reduce rpidamente las respuestas instrumentales simples, suprimiendo las
conductas problema (Reese, 1966). Aunque algunos estudios afirman que la conducta no deseada es
recuperada cuando se produce la supresin del programa de costo de respuesta.
Este sistema est muy ligado a los programas de economa de fichas, ya que en estos sistemas es
fcil eliminar una parte del reforzador, y pactara a priori el costo de cada respuesta indeseable. Adems es
necesario para su aplicacin que el sujeto haya acumulado una cantidad previa de reforzador, situacin
que suele darse a los inicios de programas de economa de fichas. Es importante que el sujeto conozca la
cantidad de reforzador que deber pagar si comete una conducta no deseada, y tambin porque conductas
puede recibir el reforzador, es vital para el xito del programa que el sujeto participe activamente en la
44

elaboracin del sistema de contingencias.
e) Ti empo f uera.
Es un procedimiento en el cual se pretende reducir la aparicin de conductas no deseadas, para ello
cada vez que se producen se retira, durante un periodo de tiempo, el acceso al refuerzo. Este
procedimiento es parecido al de costo de respuesta, pero en este caso no se retira parte del reforzador,
sino que se retira por completo durante un periodo de tiempo previamente predeterminado. Un ejemplo
habitual en nuestra sociedad de tiempo fuera es cuando un padre prohbe al nio, que se ha portado mal,
el salir a jugar con sus amigos.
Es importante conseguir que el sujeto no pueda disponer de ningn reforzador alternativo mientras
que est cumpliendo un tiempo fuera, ni siquiera deben darse en esos momentos ningn tipo de
explicacin al sujeto, ni tan siquiera para regaarle, simplemente se le informa que ha realizado una
conducta no deseable y que va a cumplir un tiempo fuera. Cuando el sujeto regrese no se har ningn
comentario, simplemente se incorpora a la tarea con normalidad.
Otra precaucin importante que debemos tomar en un programa de tiempo fuera es que la situacin
de la que se priva al sujeto sea realmente reforzante para l y no aversiva, ya que si no produciramos el
efecto contrario. Por ejemplo, algunos profesores podran pensar que el invitar a los estudiantes a
abandonar el aula ante una conducta inapropiada, se ajusta a las caractersticas del tiempo fuera. Pero,
realmente es reforzante para el sujeto permanecer en el aula, o puede encontrar reforzadores ms
sugerentes fuera de ella?
En algunos casos el sujeto puede resistirse de forma incontrolada a pasar el tiempo fuera, en estos
casos debemos seleccionar otra tcnica. Los estudios experimentales nos muestran que el tiempo fuera no
debe ser muy excesivo, ya que no a mayor duracin produce un mejor efecto, adems de poder aparecer
otro tipo de conductas no deseadas.
Como en el resto de las tcnicas es importante que el sujeto tenga claro que es lo que le costara el
tiempo fuera. As como promover conductas alternativas con el fin de mejorar la eficacia del programa. Y
no olvidemos que es una tcnica aversiva que debe ser utilizada con precaucin.
f ) Sobrecorrecci n.
Esta es una alternativa til donde el tiempo fuera (p.e., que pueda seguir realizando la conducta
problema fuera) y el costo de respuesta (p.e., en la realizacin de comportamientos muy repetitivos en que
el sujeto no disponga de suficiente reforzador para eliminarlos) tienen pocas oportunidades de xito.
La Sobrecorreccin es una tcnica aversiva, y basada en el castigo, aunque este no es muy intenso
ya que intenta evitar las reacciones negativas causadas por otros tipos de castigo. La Sobrecorreccin
tiene dos componentes bsico: "1 -Sobrecorregir los efectos ambientales de un acto inapropiado, y 2
-exigirle al alborotador que practique intensivamente formas demasiado correctas de conducta relevante"
(Fox y Azrin, 1973).
El primer componente se denomina sobrecorreccin restitutiva, y se usa cuando el alboroto ambiental
es el resultado de un acto inapropiado. Para ello el individuo debe restaurar el ambiente a un estado
mucho mejor que el anterior. Por ejemplo si un nio arroja algo al suelo debe pedrsele que recoja lo que
ha tirado y adems que limpie todo el suelo. El segundo componente es la sobrecorrecin de prctica
positiva, en este caso se exige al sujeto que practique repetidamente una conducta positiva. Al nio por
ejemplo que pinta en una mesa adems de pedirle que limpiara toda la mesa se le solicitara que limpiara
otras mesas del aula. Cuando el acto inapropiado no crea ningn alboroto en el ambiente no se aplicara el
primer componente aplicando solo la sobrecorrecin de prctica positiva.
Tanto la restitucin como la prctica positiva deben estar relacionadas con la conducta no deseada
del sujeto, ya que si no ser vivida como un castigo punitivo. Por tanto la eleccin de estas actividades se
45

constituye en la accin ms importante para el xito del programa.
La principal ventaja de la sobrecorreccin es que produce efectos muy rpidos y de larga duracin,
especialmente si el castigo se aplica de forma consistente e inmediata. Adems mientras el sujeto est
cumpliendo con el castigo debe eliminarse su acceso a cualquier reforzador.
La sobrecorrecin es un mtodo aversivo de castigo, aunque ms suave que este, por lo tanto debe
ser utilizado con extrema precaucin, y observando constantemente la aparicin de los posibles efectos
secundarios. Por todo ello es recomendable limitar la sobrecorrecin a conductas muy resistentes y
peligrosas.
g) El cast i go.
Se denomina as al procedimiento por el cual al sujeto se le presenta un estimulo aversivo de forma
contingente a una conducta, con el fin de reducir la tasa de aparicin de la misma de forma rpida.
Entre las consideraciones a destacar, sealaremos que para que el castigo sea eficaz es necesario
que se produzca una aplicacin consistente e inmediata del mismo ante la aparicin de la conducta a
erradicar. Adems, la intensidad del estimulo aversivo debe ser alta desde el inicio del programa, ya que
comenzar con niveles bajos de l estimulo aversivo e ir incrementndolos poco a poco reduce
drsticamente la efectividad del castigo, ya que el sujeto puede desarrollar una adaptacin al estimulo. Y,
un tercer aspecto a considerar, es la necesidad de eliminar cualquier refuerzo que el sujeto pudiera obtener
al realizar la conducta no deseada. Port ltimo, al igual que con el resto de tcnicas aversivas, sera
recomendable el fomentar alternativas conductuales que sean reforzadas.
Sin embargo, a la hora de plantearnos utilizar el castigo debemos considerar gran cantidad de
precauciones. En primer lugar debemos resaltar los aspectos ticos, morales y legales que pueden afectar
a este tipo de programas, respecto a esta cuestin deberemos tener en cuenta las precauciones
comentadas al principio de este captulo, y restringir su uso a situaciones extremas. El segundo gran grupo
de desventajas seria la posibilidad de que aparecieran conductas o efectos secundarios no deseados tales
como reacciones de escape, agresin, generalizacin, imitacin del castigo, reaccin de los camaradas, y
autoaseveraciones negativas.
9 . 2 . 3 9 . 2 . 3 Amp l i a c i Amp l i a c i n y ma n t e n i mi e n t o d e l a c o n d u c t a n y ma n t e n i mi e n t o d e l a c o n d u c t a
Una vez hemos conseguido instaurar ciertas conductas adecuadas en el sujeto, debemos intentar
que estas se produzcan en otros ambientes en los que esa conducta fuera adecuada (generalizacin), y
por otra parte evitar que la nuevas conductas se extingan y/o reaparezcan las anteriores.
a) El ent renami ent o en general i zaci n.
Es un fenmeno por el cual una conducta aprendida en ciertas situaciones de estimulo se produce
ante otras situaciones estimulares. Por lo tanto lo que intentamos con este tipo de entrenamiento es
conseguir que el sujeto traslade a otros contextos las nuevas conductas aprendidas. Con el fin de ser
breves, simplemente nombraremos los elementos ms importantes a tener en cuenta.
En primer lugar sera necesario introducir un programa de refuerzo intermitente, este tipo de refuerzo
mantendr la conducta por un lado y por otro ayudara a que se produzca la generalizacin. A continuacin
se entrenara a los sujetos a discriminar los elementos comunes de las diferentes situaciones en que sera
adecuada esa conducta, ya que si el sujeto no es consciente de esos estmulos discriminativos no podr
emitir la respuesta. Puede ser de gran ayuda para la generalizacin que durante el programa de
entrenamiento se han ido introduciendo poco a poco diversas situaciones de estimulo.
b) El mant eni mi ent o de l a conduct a.
Es el procedimiento por el cual intentamos consolidar la nueva conducta dentro del repertorio del
46

sujeto, incluso en ausencia de los reforzadores extrnsecos.
En el punto anterior ya vimos que el paso a un programa intermitente de reforzamiento contribua al
mantenimiento de una nueva conducta, esto podra deberse a dos cosas fundamentalmente, en primer
lugar a que las conductas reforzadas de forma intermitente son ms resistentes a la extincin, y en
segundo lugar favorecen la formacin de motivaciones intrnsecas, que actuaran como reforzadores
propios del sujeto.
9. 3 9. 3 La ec onom La ec onom a de f i c has a de f i c has
9 . 3 . 1 9 . 3 . 1 I n t r o d u c c i I n t r o d u c c i n t e n t e r i c a r i c a
Hemos decidido comentar este procedimiento por separado ya que resulta ms compleja y utiliza
varias de las tcnicas destacadas anteriormente. La economa de fichas ha demostrado su eficacia en
mltiples situaciones y contextos, y resulta recomendable cuando quieren modificarse grandes conjuntos
de respuestas, utilizando componentes intrusivos y positivos -estos ltimos, tal como indicamos con
anterioridad resultan especialmente atractivos-.
Una economa de fichas es un programa de reforzamiento complejo, en el cual se utilizan
reforzadores muy poderosos. Tras emitir la respuesta o conducta-meta, al sujeto se le proporciona
inmediatamente un nmero de fichas que podr canjear, tras obtener un volumen predeterminado con
anterioridad, por los reforzadores convenidos. As, en un programa de economa de fichas pueden coexistir
varios reforzadores tangibles o de actividad canjeables por distinto nmero de fichas (que son reforzadores
secundarios).
En este tipo de programas deben definirse con claridad las conductas-meta, tras las cuales se
conseguir un nmero especfico de fichas. As como las conductas no deseadas que provocaran una
prdida tambin determinada de las mismas. El nio debe conocer perfectamente estas reglas y haber
participado en su elaboracin. Las cantidades de fichas a entregar deben ser correctamente estimadas ya
que el numero ha de ser suficiente como para producir la conducta meta deseada, pero con la precaucin
de evitar la saciedad de los reforzadores tangibles. Otra ventaja de este tipo de programas es que permite
introducir rpidamente la novedad, modificando los reforzadores tangibles en caso de observar la
saciacin del sujeto, la prdida de efectividad o por la propia peticin del sujeto.
Al principio del programa, con el fin de que el sujeto adquiera las conductas deseables, la conducta
meta debe reforzarse -con un numero de fichas- de forma inmediata y consistente. Una vez las conductas
ya han sido adquiridas debemos ir introduciendo, de forma gradual, la intermitencia del reforzador, la
demora del mismo y la reduccin de la cantidad, con el fin de conseguir un mantenimiento de la conductas
deseadas una vez finalizado el programa.
En este tipo de programas, como en situaciones anteriores, tambin es fundamental mantener un
registro de la evolucin del sujeto, aunque en este caso resulta ms complejo, ya que debemos observar y
registrar varios aspectos complementarios:
(a). En primer lugar, y como en todos los casos anteriores, debemos registrar la emisin de las
conductas deseadas y de las no deseadas, con el fin de compararlas con las lneas base y
determinar la efectividad que est produciendo el programa.
(b). Registro de los gastos de fichas del sujeto, qu cantidad, cundo, y por qu objeto cambia el
sujeto sus fichas. Esto nos puede servir para introducir nuevos reforzadores en el sistema, o
para modificar el valor de alguno de los anteriores.
(c). Un registro de las fichas ganadas y bajo qu condiciones han sido ganadas, y otro en el caso
de las fichas perdidas.
Estos registros nos permitirn tener una idea exacta del funcionamiento y eficacia del programa, del
47

valor real de los reforzadores propuestos, de la adecuacin de las cantidades de fichas, etc. y as introducir
los cambios que fueran necesarios.
9 . 3 . 2 9 . 3 . 2 Un e j e mp l o d e a p l i c a c i Un e j e mp l o d e a p l i c a c i n d e u n p r o g r a ma d e e c o n o m n d e u n p r o g r a ma d e e c o n o m a d e f i c h a s a d e f i c h a s
Para ello utilizaremos la descripcin de un caso concreto: Carlos, un nio de quinto de EGB, que nos
ilustra cmo puede ser modificada la conducta a travs de la introduccin de un programa de economa de
fichas:
Carlos se haba constituido por mritos propios en el terror de sus compaeros, padres y profesores.
Carlos agreda a sus compaeros, desobedeca constantemente a sus padres e interrumpa de forma
constante las actividades escolares, habindose fugado de casa y del colegio en distintas ocasiones.
Adems, presentaba un enorme retraso escolar y pasaba la mayor parte del tiempo fuera del aula debido a
su conducta.
Dadas estas circunstancias el director del colegio, los padres y su profesora decidieron contar con el
psiclogo del centro para discutir cmo debera tratarse la conducta de Carlos. En primer lugar se trazaron
los objetivos generales que pretenda conseguir el programa, estos fueron concretados en dos:
[1. Conseguir que Carlos tuviera un rendimiento acadmico normal.
[2. Conseguir una conducta social adecuada.
Para ello se observaron y registraron, durante dos semanas, varias conductas no deseadas de
Carlos, as como si en alguna ocasin realizaba alguna conducta deseada. A continuacin, y contando con
Carlos, se operativizaron una serie de conductas concretas a fomentar, y que serian reforzadas a travs de
fichas.
En primer lugar se seleccionaron unos libros, de diferentes materias, con unidades didcticas que
Carlos debera realizar, y por cada una que presentara correctamente a la profesora, recibira 25 fichas.
Tambin se le dijo que cada vez que se le viera jugar durante diez minutos seguidos, sin agredir o molestar
a sus compaeros, recibira 10 fichas. Por la participacin correcta en clase, levantar la mano y esperar a
que le pregunten, 10 fichas, en cada clase que ejecute al menos una vez esa conducta, y una ficha ms
por cada vez que repitiera la conducta en esa clase. Debe quedar claro que eso no obliga a la profesora a
preguntarle a l, y que la recompensa se producir aunque no lo haga. Por ltimo, recibira una
bonificacin extra de 50 fichas si durante el da no haba agredido ninguna vez a sus compaeros.
Por el contrario , si no contesta al preguntarle, o es evidente que ha intentado engaar a la profesora,
le costara 15 fichas. Por levantarse sin permiso en una clase 5 fichas. Cualquier agresin a un compaero
le costara 25 fichas. Tambin seria castigadas la interrupcin repetida e injustificada de la clase, con 15
fichas en cada ocasin. Adems, en caso de producirse alguna de las situaciones anteriores, Carlos no
podra canjear ninguna ficha que tuviera acumulada en la dos horas siguientes
Adems se pidi a los padres que comprobaran los progresos de Carlos y animaran sus logros,
pudiendo bonificarle hasta con 50 fichas al da por su comportamiento en casa, que sera evaluado antes
de irse a dormir.
Se utilizaron diversos reforzadores tangibles que Carlos podra cambiar por sus fichas, segn sus
preferencias.
! 1 Conguito por 1 fichas. No ms de 10 en una hora, ni ms de 50 al da.
! Por cada 150 fichas podra ver una pelcula de video que el eligiese. No ms de una al da. Ni ms de
4 a la semana.
! Por cada 1000 fichas podra realizar una excursin. No ms de una al mes.
! Por 10.000 fichas conseguira una bicicleta.
Carlos se mostr muy ilusionado por las cosas que podra conseguir y estaba deseando empezar el
programa.
48

Durante los primeros das Carlos solo consegua los puntos necesarios para cambiar los conguitos, y
fue necesario reducir el tiempo de ausencia de cambio a una hora. Aunque poco a poco, aun consumiendo
todos los conguitos, fue almacenando puntos, que cambiaba por pelculas. Incluso en el primer mes tuvo
puntos suficientes para ir un da al campo con sus padres. Despus de este mes, los registros mostraron
una increble cambio en la conducta de Carlos, por un lado se haban reducido drsticamente las
agresiones a otros compaeros, y las interrupciones en clase eran escasas. Su participacin empezaba a
aparecer, y era capaz de realizar las cuatro unidades que se le pedan al da. Poco a poco la conducta de
Carlos se fue consolidando, hasta el punto de que solo agreda a sus compaeros si se le provocaba. En
cuyo caso perda las 15 fichas preceptivas, aunque esta agresin no contara para la bonificacin.
En el tercer meses del programa Carlos pidi un videojuego, cosa que fue utilizada como reforzador,
ya que en una reunin del psiclogo con los padres, y profesores decidieron que le costara 3500 fichas.
Hasta entonces haba conseguido acumular algo ms de 2200. Pues bien tardo solo 6 dais en conseguir la
cifra de 3500, ya que se neg a cambia ninguna ficha durante este periodo, y extremo su participacin en
el programa. Al final del curso acadmico, siete meses y medio despus del inicio del programa Carlos
haba conseguido la bicicleta, aprob todas sus asignaturas, a sus compaeros les gustaba jugar con l y
su profesora estaba satisfecha de su comportamiento en clase. Y sus padres informaron de que su
comportamiento en casa tambin haba variado, haba dejado de escaparse, no sola agredir a nadie y se
comportaba mucho mejor que antes.
En el curso siguiente se introdujo un programa intermitente, se le dejaron de entregar fichas, sino que
la profesora llevaba una contabilidad de la cual se le informaba diariamente. Se empezaron a introducir
reforzadores sociales, y se fueron modificando los reforzadores tangibles a las preferencias de Carlos.
REFERENCI AS REFERENCI AS
Ackerman, J. M. (1976). Tcnicas de condicionamiento operante en la escuela. Coleccin: Aula XXI. Educacin
abierta. Madrid. Santillana.
Adelman, H.M. y Maatsch, J.L. (1955) Resistance to extinction as a function of the type of response elicited by
frustration. Journal of Experimental Psychology, 50, 61-65.
Amsel, A. (1958) The role of frustrative nonreward in noncotinuous reward situations. Psychological Bulletin, 55,
102-119.
Ardila, R. (1982) Psicologa del Aprendizaje. Mxico: Siglo XXI
Atkinson, J.W. (1958) Motives in fantasy, action and society. Princeton, N.J.: Van Nostrand.
Ayllon, T. y Azrin, N. H. (1968).The token economy. Nueva York. Appleton.
Azrin, N.H. y Holz, W.C. (1961) Punishment during fixed-interval reinforcement. Journal of the Experimental
Analysis of Behavior, 4, 343-347.
Becker, H.C y Flaherty, C.F. (1982) Influence of ethanol on contrast in consummatory behavior.
Psychopharmacology, 77, 253-258.
Bolles, R.C. (1967) Theory of motivation. New York: Harper y Row.
Bolles, R.C. (1972) Reinforcement expectancy, and learning. Psychological Review, 77, 32-48.
Broadbent, D.E. (1958) Perception and communication. New York: Pergamon.
Butler, R.A. (1953) Discrimination learning by rhesus monkeys to visual exploration motivation. Journal of
Comparative and Physiological Psychology, 46, 95-98.
Campbell B.A. y Church, P.M. (1969) Punishment and aversive behavior. New York: Appleton-Century-Crofts.
Campos, A. (1988) Manual de Prcticas de Psicologa Bsica. Barcelona: Grupo Editor Universitario, S.L.
Capaldi, E.J. (1966) A sequential hypothesis o instrumental learning. En K.W. Spence y J.T. Spence (eds.). The
psychology of learning and motivation, vol. 1. New York: Academic Press.
Capaldi, E.J. (1967) Partial reinforcement: a hypothesis of sequential effects. Psychological Review, 73, 459-477.
Capaldi, E.J. (1971) Simultaneous shifts in reward magnitude and level of food deprivation. Psychonomic Science,
23, 357-359.
Cimble, G.A. (1961) Hilgard y Marquis. Condicionamiento y aprendizaje. Mxico: Trillas.
Clemente, A. y Gimeno, A. (1993). Modelos de Intervencion Psicoeducativa. En Clemente, A. (Dir.). Bases para la
intervencin Psicopedaggica en la prctica de la psicologa escolar. Valencia. Set i Set. 1993.
49

Conrad, D.G. y Sidman, M (1956) Sucrose concentration as reinforcement for level pressing by monkeys.
Psychological Reports, 2, 381-384.
Crespi, L.P. (1942) Quantitative variation of incentive and performance in the white rat. American Journal of
Psychology, 55, 467-517.
DAmato, M.R. (1970) Experimental psychology: Methodology, psychophysics, and learning. New York:
McGraw-Hill.
Das, J.P. (1969) Verbal conditioning and behavior. London: Pergamon Press, 1969.
Dorsh, F. (1985) Diccionario de Psicologa. Barcelona: Herder.
Eisengberger, R. (1972) Explanation of rewards that do not reduce tissue needs, Psychological Bulletin, 77,
319-339.
Erlanger, L.A. (1974) Social differences in parents use of physical punishment. En S.K. Steinmetz y M.A. Stresus
(Eds.) Violence in the family, 150-158. New York: Dodd Mead.
Estes, W.K. (1944) An experimental study of punishment. Psychological Monographs, 57, No. 263.
Flaherty, C.F. (1985) Animal learning and cognition. New York: Knoph.
Flaherty, C.F. y Driscoll, C. (1980) Amobarbital sodium reduces successive gustatory contrast.
Psychopharmacology, 69, 161-162.
Foxx, R. M. y Arin, N.H. (1973). The elimination of autistic self-stimulatory behavior by overcorrection. Journal of
Applied Behavior Analysis., 6, pg. 1-14.
Gibson, E.J. (1969) Perceptual learning and development. New York: Appleton.
Gonzlez Almendros, J.L. (1983). La habituacin a corto plazo y las consecuencias del E habituador. Estudios de
Psicologa, 14/15, 31-34.
Greenspoon, J. (1955). The reinforcing effect of two spoken sounds on the frequency of two responses. American
Journal of Psychology, 68, 409-416.
Grice, G.R. (1948) The relation of secondary reinforcement to delayed reward in visual discrimination learning.
Journal of Experimental Psychology, 38, 1-16.
Guttman, A., Suttered, J.R. y Brush, R. (1975) Positive and negative behavioral contrast in the rat. Journal of the
Experimental Analysis of Behavior, 23, 377-384.
Hall, J.F. (1976) Classical conditioning and instrumental learning: A contemporary approach. Philadelphia:
Lippincott.
Hill, W.F. y Wallace, W.P. (1967) Effects of magnitude a percentage of reward on subsequent patterns of runway
speed. Journal of Experimental Psychology, 65, 495-500.
Hull, C.L. (1943) Principles of behavior. New York: Appleton-Century-Crofts.
Jacobson, E. (1938) Progressive relaxation. Chicago: University of Chicago Press.
Kish, G.B. (1955) Learning when the onset of illumination is used as reinforcing stimulus. Journal of Comparative
and Physiological Psychology, 48, 261-264.
Klein, S.B.K. (1994) Aprendizaje: Principios y Aplicaciones. Madrid: McGraw-Hill.
Lashey, K.S. y Wade, M. (1946) The Pavlovian theory of generalization. Psychological Review, 53, 72-87.
Mellgren, R.L. (1972) Positive and negative contrast effects using delayed reinforcement. Learning and Motivation,
3, 185-193.
Millenson, J.R. (1967). Principles of behavior analysis. Nueva York. MacMillan.
Miller, N.E. (1969) Learning of visceral and glandular responses. Science, 163, 434-445.
Olds, M.E. Y Milner, P. (1954) Positive reinforcement produced by electrical stimulation of septal area and other
regions of rat brain. Journal of Comparative and Physiological Psychology, 47, 419-427.
Papalia, D.E. y Wendoks, S. (1987) Psicologa. Mxico: McGraw-Hill.
Perin, C.T. (1943) A quantitative investigation of the delay of reinforcement gradient. Journal of Experimental
Psychology, 32, 37-51.
Pinillos, J.L. (1980). Principios de Psicologa. Madrid: Alianza Editorial.
Premack, D. (1965) Reinforcement theory. En D. Levine (Ed) Nebraska Symposium on motivation. Lincoln,
Nebraska. University of Nebraska Press.
Reese, E. P. (1966).The analysis of human operant behavior. Dubuque: Brown.
Ridgers, A. y Gray, J.A. (1973) Influence of amylobarbitone on operant depression and elation effects in the rat.
Psychopharmacology, 32, 265-270.
Rodrguez Delgado, J.M. et al. (1954) Learning motivated by electrical stimulation of the brain. American Journal of
Physiology, 179, 587-593.
Schultz, J.H. (1932) Das autogene Training, Madrid: Ed. Ceintfico-Mdica.
Sheffield, V. F. y Roby, T.B. (1950) Reward value of a non nutritive sweet taste. Journal of Comparative and
Physiological Psychology, 43, 471-481.
50

Shiffrin, R.M. y Schneider, W. (1977) Controlled and automatic human information processing: II. Perceptual
learning, automatic attending, and a general theory. Psychological Review, 84, 127-196.
Siegel, S. y Andrews, J.M. (1962) Magnitude of reinforcement and choice behavior in children. Journal of
Experimental Psychology, 63, 337-341.
Skinner, B. F. (1938).The behavior of organism. Nueva York. Appleton.
Skinner, B.F. (1953) Science and human behavior. New York: Mcmillan.
Skinner, B.F. (1953) Science and human behavior. New York: McMillan.
Solomon, R.L. (1964) Punishment. American Psychologist, 19, 237-253.
Steiner, G. (1990) Aprender: Veinte escenarios de la vida diaria. Barcelona: Herder.
Sulzer-Azaroff, B. y Mayer, G. R. (1983). Procedimientos del anlisis conductual aplicado con nios y jvenes.
Mxico Trillas.
Tarpy, R.M. (1983) Principios Bsicos del Aprendizaje. Madrid: Debate.
Terrel, G. y Ware, R. (1961) Role of delay of reward in speed of size and form discrimination learning in childhood.
Child Development, 32, 409-415.
Thomas, J.R. (1968) Fixed-ratio punishment by time-out of concurrent variable-interval behavior. Journal of the
Experimental Analysis of Behavior, 11, 609-616.
Thorndike, E.L. (1898) Animal intelligence. An experimental study of the associative processes in animals.
Psychological Monographs, 2, n8.
Thorndike, E.L. (1898) Animal intelligence. An experimental study of the associative processes in animals.
Psychological Monographs, 2, n8.
Thorndike, E.L. (1932) Fundamentals of learning. New York: Teachers College, Columbia University.
Thorndike, E.L. (1932). The fundamentals of learning. New York: Teachers College.
Verplanck, W.S. (1962) Unaware of wheres awareness: some verbal operants-notates, monents and notants. En
C.W. Erikson (Ed.), Behavior and awareness. Durham: Duke University Press.
Weinstock, S (1954) Resistance to extinction of a running response following partial reinforcement under widely
spaced trials. Journal of Comparative and Physiological Psychology, 47, 318-322.
Whaley, D.L. y Malott, R.W. (1988) Psicologa del Comportamiento. Barcelona. Martnez Roca.
Wittig, A.F. (1977) Introduccin a la Psicologa: Teora y 618 problemas resueltos: Bogot: McGraw-Hill.
Zeaman, D. (1949) Response latency as a function of the amount of reinforcement. Journal of Experimental
Psychology, 39, 466-483.