Está en la página 1de 7

Teoras del refuerzo

Thorndike y la ley del efecto


La primera teora sistmica del refuerzo fue brindada por Thorndike, pronto luego de su
descubrimiento de condicionamiento instrumental (Bower & Hilgard, 1981). De acuerdo a
Thorndike, un refuerzo positivo es un estmulo que produce estado satisfactorio de
asuntos, Sin embargo, Thorndike no fue a decirnos qu era satisfactorio. Por lo tanto, su
respuesta a la pregunta Qu hace a algo efectivo como reforzador? no era muy
iluminadora.
Uno puede determinar si un estmulo como una caricia en la cabeza de un perro era
satisfactorio viendo si un perro incrementa su respuesta que resulta en poder ser
alimentado. Sin embargo, esa evidencia no revela porqu una caricia en la cabeza es un
reforzador. Llamando a los reforzadores satisfactores, Thorndike puso una etiqueta a los
reforzadores pero no daba una explicacin de porqu algo era efectivo como reforzador.
Thorndike estaba ms seguro sobre la pregunta Cmo un reforzador produce un
incremento en la probabilidad de la respuesta reforzada?, su respuesta fue dada en la Ley
del efecto. Como coloqu en el captulo 7, de acuerdo a la ley del efecto, un reforzador
establece una asociacin o conexin entre la respuesta instrumental R y los estmulos S en
la presencia de la respuesta establecida. El reforzador produce una asociacin R- S. Ver
figura 9.1.
La ley del efecto explica como un reforzador incrementa la futura probabilidad de la
respuesta instrumental. Porque de la asociacin S R que es establecida por el refuerzo, los
estmulos S producen la respuesta instrumental R, en la manera en que una respuesta
elicitada es producida por sus estmulos elicitantes. El mecanismo bsico de la ley del
efecto fue considerado una explicacin razonable para la respuesta instrumental
incrementada y fue aceptado por los tericos del comportamiento durante los siguientes 50
aos. Sin embargo, retrospectivamente, la aceptacin generalizada de la ley del efecto es
bastante notable.
Aunque la ley del efecto predice una respuesta instrumental incrementada respondiendo en
el ambiente de entrenamiento, es un poco mgico ms que un proceso bien establecido.
Thorndike no dijo mucho acerca de como un reforzador despus de una respuesta
instrumental puede actuar retrospectivamente hasta lograr una asociacin entre la respuesta
y los estmulos en la presencia de cual la respuesta fue hecha. Esa parte de la ley del efecto
tuvo que ser tomada con fe.
Adems, la aceptacin general de la ley del efecto durante los siguientes 50 aos, nadie ha
llenado el vaco dejado por Thorndike. Los mecanismos donde un reforzador acta hacia
atrs en el tiempo para fortalecer una asociacin S-R que se mantenga especificada.
En resumen, Thorndike dio un poco ms que un nombre en respuesta a la pregunta: Qu
hace a algo efectivo como reforzador?, su respuesta a la pregunta, Cmo un reforzador
produce un incremento en la probabilidad de una respuesta reforzada? Fue exitosa en el
sentido que predeca los efectos del refuerzo. Pero la respuesta fue superficial porque
simplemente comenzaba con una asociacin S-R formada sin especificar exactamente como
lleg eso.
Hull y la teora de reduccin del impulso
El siguiente gran terico que consideraremos es Clark Hull. Hull acept que el mecanismo
de asociacin de la teora de la ley del efecto, se concentr en la pregunta que Thorndike
ignor (Qu hace a algo efectivo como reforzador?) Para responder esta pregunta, Hull us
el concepto de homeostasis.
Segn esto, el organismo busca un estado de estabilidad con respecto a los factores
biolgicos. Para sobrevivir, los organismos deben mantener un estado estable u ptimo
abasto de nutrientes. Cuando el sujeto ha sido privado de comida, tendr una necesidad de
comida. Se pensar tambin en un estado motivacional o estado de impulso de hambre, que
es la ingesta de comida. Para Hull, la comida es un reforzador porque reduce el impulso de
hambre. Para Hull, el reforzador es lo que reduce un estado de impulso. Por lo tanto, su
teora se llama la teora de la reduccin del impulso.
Reforzadores primarios
Los estmulos que son efectivos para reducir una necesidad biolgica sin entrenamiento
previo son llamados reforzadores primarios (comida, agua). Sin embargo, existen otros
estmulos que no son primarios y pueden servir de reforzadores.
Reforzadores secundarios y Manejos adquiridos
El refuerzo secundario es el que gana las propiedades reforzadoras mediante la asociacin
con un reforzador primario (el olor de la comida italiana puede ser un reforzador
secundario).
Hull tambin extendi su teora a los estados de impulso condicionados. Los estmulos que
son asociados con un estado de impulso provocan un impulso adquirido o condicionado.
Este concepto se ha usado mucho en motivacin. Un ejemplo se da si vas en una escalera
elctrica y te caes de ellas muy fuerte, es probable que te de miedo volver a subir en unas
escaleras elctricas. Este miedo condicionamiento es un impulso adquirido. De acuerdo con
Hull, reducir la intensidad del impulso adquirido ser reforzante. Por lo tanto, cualquier
respuesta que te permita escapar del miedo condicionado de las escaleras ser reforzante.
Alejarse de las escaleras en un centro comercial puede ser reforzante o usar un ascensor
porque reduce el miedo condicionado provocado por las escaleras.
Reforzamiento sensorial
A la teora de Hull le falta explicar algunas instancias del reforzamiento. Por ejemplo, los
investigadores han encontrado que las ratas mantenidas en la oscuridad presionarn una
palanca para prender una luz y que las ratas mantenidas en una cmara iluminada
presionar la palanca para producir periodos de oscuridad. Los chimpancs tendrn
respuestas instrumentales que son reforzadas por nada ms que la oportunidad de mirar un
tren elctrico de juguete moverse. Estos son ejemplos de reforzamiento sensorial. En
muchas situaciones, la estimulacin sensorial con ninguna relacin aparente a una
necesidad o impulso biolgico puede servir de reforzador.
El creciente peso de la evidencia de reforzamiento sensorial, junto con el xito de las
conceptualizaciones alternativas del refuerzo, llevaron al abandono de la teora de Hull. Las
teoras que emergieron fueron altamente creativas, envolviendo nuevas maneras de pensar
sobre el refuerzo instrumental.
Reforzadores como respuestas
El principio de Premack
Cul es la diferencia entre comer y presionar una palanca de respuesta en una normal caja
de Skinner?, En general que comer se puede hacer en cualquier lado, no hay lmites
mientras que presionar la palanca s. De acuerdo a Premack, la precondicin del refuerzo no
es un estado de impulso. Es en realidad, la existencia de dos respuestas que difieren en su
parecido de ocurrencia cuando un organismo tiene acceso libre a ambas actividades. Dadas
estas dos respuestas, Premack propuso que la respuesta que es ms probable que el sujeto
haga ser la reforzadora de la respuesta menos probable, esto es en general el principio de
Premack o tambin el principio diferencial de probabilidad.
No importa para Premack la respuesta instrumental o reforzadora o ser primario o
secundario, lo nico que se necesita es que una respuesta sea ms probable que la otra.
La revolucin de Premack
Los cientficos se comenzaron a emocionar por esta teora debido a su impacto en el
entendimiento del refuerzo. Se comenz a usar el principio para ambientes escolares,
hospitales, para el retraso mental y para correccionales.
Aplicaciones del principio de Premack
En la educacin, a los sujetos se les pide realizar nuevas conductas. La meta es lograr que
una respuesta de baja probabilidad aumente su probabilidad de suceder. El
condicionamiento instrumental es efectivo pero se debe buscar el correcto reforzador. No se
poda entonces privar a los chicos de su alimento o darles caramelos pues es un alimento
que no colabora con su desarrollo. Premack propuso una salida, lo nico que se deba hacer
era asegurarle al estudiante que si realizaba la tarea de menos probabilidad luego podra
realizar lo que sea que para l tenga mayor probabilidad (lo que ms disfrute).
As, se poda preparar un condicionamiento instrumental para cada estudiante.
Problemas tericos
El principio de Premack contina siendo usado en las escuelas. Pero presenta dos
problemas.
El primero tiene que ver con la manera de medir o calcular la probabilidad de respuestas.
Todos tenemos un sentido intuitivo de lo que significa decir que una respuesta es ms
probable que la otra pero asignar un nmero preciso es algo difcil. Tambin, la
probabilidad de una respuesta dada puede cambiar inesperadamente. Un joven puede
disfrutar de nadar una maana pero luego querer jugar videojuegos.
Hay maneras prcticas de pensar que esto se puede resolver. Por ejemplo, se puede utilizar
un sistema en el que a los sujetos se les da puntos por responder correctamente y luego
pueden cambiar los puntos por actividades que disfruten. Esto se llama economa de fichas,
si se utiliza, no habra porqu preocuparse porque solo se puede elegir una respuesta.
El segundo problema del principio de Premack es que es simplemente una frmula o regla
para identificar reforzadores. No nos habla de cmo trabajan los reforzadores, responde a la
pregunta qu hace a algo efectivo como un reforzador? Pero no responde a la pregunta
cmo un reforzador produce un incremento en la probabilidad de la respuesta reforzada?
La hiptesis de privacin de respuesta
Fue el siguiente gran paso en la teora, propuesta por Timberlake y Allison en 1974. La
hiptesis de privacin de respuesta fue creada para resolver los problemas del principio de
Premack.
Tmberlake y Allison, como Premack, pensaron en los reforzadores como respuestas ms
que estmulos. Su punto de comienzo fue pensar la diferencia entre una respuesta
instrumental y una respuesta reforzadora. Su respuesta fue que los participantes tienen
acceso libre a la respuesta instrumental pero son restringidos al realizar la respuesta
reforzadora. Timberlake y Allison sugirieron que estas restricciones (la de la rata cuando no
puede comer pellets libremente en una caja de Skinner) son lo que hacen que comer sea un
reforzador efectivo. Desde su punto de vista, el condicionamiento instrumental priva a los
participantes del acceso libre a la respuesta reforzadora.
Privacin de respuesta y la ley del efecto
Timberlake y Allison proponen la siguiente situacin, imagnense que ponen a una rata en
la caja de Skinner donde solo le pondrn comida una vez a la semana y ella podr observar
eso. Segn Thorndike, ese sera un estado satisfactorio donde la rata presionara la palanca
pero esto tiene poco sentido, lo que Timberlake y Allison proponen es que la rata
presionar solo una vez a la semana, cuando ya est la comida.
Segn la hiptesis de privacin de respuesta, lo que hace a la comida un reforzador no es
que satisface el hambre o que comer sea una respuesta de alta probabilidad. En realidad, es
para ellos un reforzador porque en el condicionamiento instrumental existen restricciones
para comer. Por ello, cuando no hay privacin de respuesta, la rata es libre a elegir, no
existir incremento en la respuesta de la rata.
Privacin de respuesta y la probabilidad de respuesta
La hiptesis de privacin de respuesta no hace un cmputo sobre las probabilidades de
respuesta, as evita el primer problema del principio de Premack. Para aplicar la privacin
de respuesta, se debe determinar la tasa de una respuesta durante una lnea de base cuando
no hay restricciones y luego limitar el acceso al reforzador.
Para Timberlake y Allison, incluso una respuesta de poca probabilidad puede ser un
reforzador si se priva la respuesta. Esta afirmacin ha sido confirmada de manera
experimental.
La privacin de respuesta y el locus de los efectos del refuerzo
Esta teora cambia el locus de la explicacin del refuerzo. En teoras anteriores, los
refuerzos eran explicados como factores fuera del condicionamiento instrumental, (el
impulso o la probabilidad de respuesta), con esta nueva teora, el usaban elementos de la
interaccin del sujeto con el procedimiento instrumenta (restricciones).
Pero la hiptesis de privacin de respuesta tampoco poda responder cmo puede un
reforzar incrementar la probabilidad de una respuesta reforzada. Por esto surge la teora de
la regulacin conductual.
La teora de la regulacin conductual
De muchas maneras la teora de la regulacin conductual se parece a la hiptesis de
privacin de respuesta. Ambas rechazan que los reforzadores sean tipos especficos de
respuestas o estmulos. La teora de la regulacin conductual acepta que los efectos del
refuerzo son determinados por como un procedimiento instrumental restringe las
actividades del organismo. De hecho, esta nueva teora responde as el segundo problema
del principio de Premack. (cmo puede un reforzar incrementar la probabilidad de una
respuesta reforzada).
La teora de la regulacin conductual tom el concepto de la homeostasis para llevarla a la
eleccin de respuesta. As, la homeostasis conductual busca un estado ptimo en el sistema.
El BLISS POINT conductual
Dentro de la regulacin conductual, se defendi que el organismo prefera repartir sus
actividades en un punto ptimo (donde pueda disfrutar ms), su llamado Bliss point
comportamental. Este trmino se refiere a cmo un organismo distribuye sus actividades en
la ausencia de restricciones en el procedimiento. Un ejemplo, una nia adolescente (KIM)
sola un da en su casa dedicar el tiempo que ella desee a las actividades que ella desee
hacer, su Bliss point ser la forma en que distribuya ptimamente su tiempo.
Imponer una contingencia instrumental
Los padres de Kim notaron que cuando estaba sola dedicaba una hora a hacer la tarea y
quieren aumentar ese tiempo. Podran lograrlo restringiendo el acceso al tiempo que pasa
escuchando msica. Podran crear una situacin donde Kim pueda escuchar un minuto de
msica por cada minuto que haya pasado haciendo tareas.
Antes de la contingencia instrumental, escuchar msica y hacer tareas eran actividades
independientes para Kim. Antes no exista relacin entra estas actividades y como no haba
restriccin, ella estableca su bliss point.
Pero ahora con esa peticin de los padres, se forma en la grfica 9.3 (VER LAS COPIAS)
un SCHEDULE LINE (lnea programada). Con esta restriccin, la adolescente debe
redistribuir sus actividades para que pueda lograr la restriccin, es un reto para el bliss
point. Esto es anlogo a como un manejo del impulso es un reto para la homeostasis
fisiolgica.
Estas contingencias obligan al sujeto a moverse de su bliss point y ubicarlo en otro lado
para poder disfrutar de sus actividades. Ya el sujeto no puede regresar al bliss point, as son
la mayora de casos, la contingencia instrumental restringe las opciones.
Respondiendo a las restricciones programadas
Existen varias posibilidades de responder a las restricciones. Si Kim piensa que hacer tareas
es mucho ms desagradable que perder la msica entonces dejar de escuchar msica pero
si Kim piensa que la idea de no escuchar msica es muy aversiva, comenzar a hacer tareas.
Por esto, siempre se debe tener en cuenta que no existan opciones sustitutas para el evento
que se ha restringido. Por ejemplo, si a Kim tambin le gusta mucho ver televisin entonces
probablemente no comienza a hacer ms tareas y no le importe la prdida de la msica.


Contribuciones de la regulacin conductual
Este modelo nos invita a pensar sobre como una contingencia instrumental puede tener
aplicaciones tan amplias sin conceptualizarlo demasiado. Nos ayuda a pensar en todas las
actividades posibles de un participante. Nos avisa que es difcil saber qu ser un reforzante
si no conocemos el ambiente del sujeto, las restricciones, sus actividades posibles y sus
sustitutos