Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción
Ya hemos visto en el ABC del condicionamiento operante como una conducta seguida de
un refuerzo se estabiliza o se hace más frecuente. Si en cierto momento se deja de
reforzar, la conducta tiende a extinguirse. ¿Cómo debo programar los refuerzos, en
cantidad y frecuencia, para que cuando deje de reforzar la conducta se siga repitiendo la
mayor cantidad de veces posible? Esa es la pregunta de los programas de reforzamiento,
es decir, cómo aumentar la resistencia a la extinción de las conductas cuando se dejan de
reforzar.
Refuerzo continuo
Eneste programa cada vez que la conducta se emite, una conducta se refuerza.
Picoteo, comida, picoteo, comida, picoteo, comida.
Te explico el grafico que sigue, vamos a usarlo para este y el resto de los programas. En el
eje vertical están la cantidad de conductas emitidas (que llamamos razón); en el
horizontal, el tiempo en minutos. Con un círculo rojo te marco donde están los refuerzos.
Con la flecha verde te indico el lugar de la conducta para la cual el refuerzo deja de
aplicarse.
Suponé que la paloma picotea 40 veces y 40 veces la reforzás. En la vez 41 que picotea no
le das comida. ¿Cuántas veces más pensás que siguió picoteando la paloma? La respuesta
es… una o dos y ya.
Por eso se dice que el refuerzo continuo tiene muy baja resistencia a la extinción. Es decir,
si una conducta se refuerza cada vez que se emite, cuando se deja de reforzar, se extingue
rápidamente.
40
(Cantidad acumulada)
Razón
30
20
10
10 20 30
Intervalo (tiempo en minutos)
Vas a un restaurante al que casi siempre que vas, te atienden bien. Una vez que te
atienden mal, ¡no vas más! O sino, siempre que prendés el interruptor de luz de la cocina,
se prende. Después de miles de veces de usarlo, lo movés y no prendé, probás dos, tres
veces más y ¡zás! a cambiar el foco, no seguís intentando muchas veces más. O venís
tomando mate por la bombilla sin ningún problema y, de pronto, de la nada se tapa.
Intentas tomar una o dos veces y si sigue tapado, entonces, dejas de tratar y a sacar la
bombilla y a ver qué pasa.
Razón fija
El siguiente programa de reforzamiento que te voy a explicar es la razón fija. Es igual que
el refuerzo continuo salvo que, en vez de reforzarse la conducta cada vez que se emite, se
refuerza cada cierto número fijo de conductas emitidas (“razón” significa “proporción” y
se refiere aquí a que cada cierto número de conductas se da cierto número de refuerzos.
Es decir, en este contexto, podemos entender a la palabra “razón” como “número de
conducta”).
Imaginemos que cada 10 veces que la paloma picotea, la refuerzo. Supongamos que lo
hago cuatro veces (en realidad, cuando Skinner investigaba con la ratas y las palomas,
usaba más cantidades de veces). ¿Qué ocurre cuando la dejo de reforzar? Gráfico:
40
(Cantidad acumulada)
Razón
30
20
10
10 20 30
Intervalo (tiempo en minutos)
¿Qué sucede desde el último refuerzo hasta la flechita? La conducta continua 10 veces o
un poco más y luego se extingue. Comparado con el refuerzo continuo, que cuando se
dejaba de reforzar la conducta seguía una o dos veces más, ahora, con la razón fija, ¡10
veces más! Por eso se dice que la razón fija tiene una baja resistencia a la extinción, no
muy baja como el continuo, solo baja.
Es decir, que si a tu hijo le das 50 pesos cada 10 veces que hace su cama, cuando le dejes
de pagar te va a hacer la cama 10 o 11 veces más ¡gratis! Si a una empleada doméstica le
pago cada vez que la llamo y viene y limpia, cuando le deje de pagar dejaría de venir
(refuerzo continuo). Pero si le paga cada 5 veces que viene, viene 5 veces desde la última
vez que le pagué, ¡negocio para un explotador!(Claro que las personas piensan que la
empleada venía porque tenía la expectativa que cumpliera con mi compromiso, pero
estamos en el conductismo y todos los contenidos mentales son epifenoménicos, no
tienen relación de causalidad. Para un conductista, no hay diferencia entre una paloma
que no piensa y un ser humano que sí, ya que se comportan exactamente igual. Hay que
esperar a la psicología cognitiva para que la conciencia juegue un rol en la psicología
empirista).
Picoteo…………………………picoteo……………..picoteo…….picoteo…picoteo
Si alguno trabajó en un call center, donde cada 10 clientes que le vendés un producto te
dan un bono, habrá notado que a medida que los tres primeros los haces tranquilo, un
poco más de pilas hasta el sexto, pero a los tres últimos le ponés todo el esfuerzo y
después, descanso, no hago nada. ¿No te pasó leyendo las hojas de un apunte largo, que
no te gusta, que a medida que te acercás al final del capítulo (refuerzo negativo, dejar de
leer lo que no me gusta) vas más rápido y al final del capítulo hacés una pausa?
Intervalo fijo
El intervalo fijo es parecido a la razón fija, la diferencia es que en vez de ser cada cierto
número fijo de conductas que se emite que se da un refuerzo, es cada cierto intervalo…
fijo.
Esto es, no cuento la cantidad de veces que la paloma picotea, sino con tal de que picotee
al menos una vez durante el intervalo, le doy el refuerzo, digamos, cada 5 minutos. El
gráfico es muy parecido, pero lo fijo ahora es el tiempo, en el eje horizontal, lo que
determina cuando le doy el refuerzo. Y la cantidad de conductas que se emitan entre cada
refuerzo no se tiene en cuenta.
40
(Cantidad acumulada)
Razón
30
20
10
10 20 30
Intervalo (tiempo en minutos)
Muy parecido a la razón fija, cuando se deja de reforzar sigue picoteando, y no un número
de veces, sino hasta que se cumpla el momento del refuerzo, que te indico con la flechita
verde. Picotea un poco más y la conducta se extingue. Es decir, picotea en este ejemplo
unos 5 minutos más, o poco más, y luego no picotea más. Además, inmediatamente
después del refuerzo hay una pausa en emisión de la conducta.
Así, los políticos que renuevan su banca cada 4 años, cuando renuevan su banca se relajan
y limitan sus acciones. Después del cierre contable de diciembre de una empresa, los
empleados no hacen nada. ¿A vos no te pasó que luego de entregar un TP frenaste de
estudiar un rato? En fin, diría el conductismo entre nosotros y las palomas no hay tanta
diferencia.
Intervalo variable
Sigamos con el intervalo variable. Es parecido al intervalo fijo, pero el intervalo es…
variable. En vez de ser como en el fijo, exactamente cada cierto intervalo varía.
Por ejemplo, consideremos que en vez de reforzar a la paloma una vez cada 5 minutos
exactos, se la refuerza a los 2 minutos o a los 7, tal vez a los 10 minutos, pero en torno de
50
(Cantidad acumulada) 40
Razón
30
20
10
10 20 30
Intervalo (tiempo en minutos)
Imaginate dos empresas: una, Relojería Suiza, paga a sus empleados por intervalo fijo, el 5
de cada mes. Otra, Prendas Milito, paga la quincena, luego pasa un mes y saldan media
deuda y luego a los 3 meses, y luego saldan un algo de la deuda a los 10 días… Nunca
podes predecir cuándo van a pagar. Después de que sus empleados trabajan dos años,
ambas empresas quiebran y dejan de pagar el 5 de enero. ¿Los empleados de cuál
empresa siguen trabajando por más tiempo? ¡Prendas Milito que los reforzó por intervalo
variable, y con el fijo, como la Relojería Suiza! El intervalo variable tiene alta resistencia a
la extinción, y la tasa de emisión de conducta es constante entre los refuerzos, por eso la
línea es recta, y no con curvas o escalonada.
50
40
(Cantidad acumulada)
Razón
30
20
10
10 20 30
Intervalo (tiempo en minutos)
Ese mecanismo lo usan las máquinas del casino o los juegos de azar, que generan tanta
adicción: no ganas siempre, solo a veces y solo sabes que si seguís jugando algún premio
va a llegar. Y si ganás, seguís jugando por el próximo premio. Y seguís y seguís. También
Cuando estás aburrido y haces scroll una aplicación del celular, Instagram o Reddit o
Facebook, de nuevo es razón variable: no sabés cuántas veces tenés que mirar lo que sale,
pero si seguís, cada cierto número variable de pantallas, aparece algo que te divierte… y
en parte el celular es tan altamente adictivo por eso. Algunas drogas funcionan así: no
siempre que las fumás (o tomás o inyectás) te producen un buen resultado, pero cuantas
más veces lo intentes, más chances de que sea así. Que las máquinas de los casinos y la
tecnología refuercen por razón variable, me parece, no es al azar, sino que fue
cuidadosamente diseñado por quienes las crearon.
Fijate que los programas de intervalo y razón variables, los impredecibles, generan
conductas más resistentes a la extinción que los predecibles. Será por eso que algunas
personas son adictas al riesgo.
Otro parámetro, como para verificar si se trata de intervalo fijo o variable, es la resistencia
da la extinción. Observá que la conducta se extinguió rápidamente, lo que indica una
resistencia de extinción baja o muy baja. Si hubiese sido variable, la resistencia a la
extinción hubiese sido alta y el texto hubiese dicho “Nadia siguió trabajando un par de
meses más, dudando si dejar de trabajar o no, esperando la respuesta de la dueña” o algo
así.
Sí, ¡ya sé! En el conductismo lo que la gente piensa o deja de pensar no es importante,
pero a los fines de redactar los ejercicios pongo sus pensamientos. El conductismo no dice
que la gente no piense, solo que lo que piensa no tiene importancia alguna, que lo que
Referencias bibliográfica
Myers, D. G. (1998).“El aprendizaje”. En Psicología. Buenos Aires: Med. Panamericana.