Está en la página 1de 6

Teora del Refuerzo y Anlisis del Comportamiento

Mark A. Adams
University of Nevada, Reno

Las leyes empricas en el estudio de la conducta animal y humana han sido la bsqueda de
psiclogos analticos del comportamiento durante al menos un siglo. Una de las primeras leyes
tericas y empricas de la historia de la psicologa analtica del comportamiento es "la ley del
efecto", acreditada a E. L. Thorndike a principios del siglo XX. La psicologa conductual ha tenido
una gran historia desde la ley de efecto y diferentes direcciones para la ciencia de la conducta
humana han resultado. En este artculo, la hiptesis de privacin / desequilibrio de respuesta se
remonta a sus races conductuales en la ley de efecto. Se discute el refuerzo skinneriano y los
relatos tericos predictivos del refuerzo. Se concluye que el anlisis del comportamiento y la ciencia
del comportamiento humano pueden beneficiarse de las explicaciones tericas y empricas del
refuerzo, desarrollando an ms nuestra comprensin de las circunstancias de refuerzo.

Las leyes empricas en el estudio de la conducta animal y humana han sido la bsqueda de
psiclogos analticos del comportamiento durante al menos un siglo. Una de las primeras leyes
tericas y empricas de la historia de la psicologa analtico-conductual es "la ley del efecto". La ley
del efecto, descrita por E. L. Thorndike cerca del cambio de siglo, es parafraseada abajo
(Thorndike, 1911):

De varias respuestas hechas ante la misma situacin, aquellas que van acompaadas o seguidas de cerca por
la satisfaccin del animal tendrn, en igualdad de condiciones, una conexin ms firme con la situacin, de
modo que cuando se repita, ser ms probable que vuelvan a producirse; aquellas que se acompaan o
siguen de cerca por molestias al animal tendrn, en igualdad de condiciones, sus conexiones con esa
situacin reducidas, de modo que, cuando vuelva a repetirse, ser menos probable que ocurran (p.44).

Esta afirmacin de la ley de efecto aparece como una descripcin rudimentaria y engorrosa de
reforzadores y castigos (Skinner, 1938). Adems, los trminos utilizados son susceptibles de
interpretacin. Sin embargo, el resurgimiento de la ley de efecto servir como recordatorio de que
el evento de fortalecimiento (o debilitamiento) de una respuesta debe distinguirse de las
circunstancias bajo las cuales se produce el fortalecimiento (Hayes, Adams y Dixon, 1996,
Champion, 1960).

Thorndike fue ms all de la afirmacin de la ley de efecto citada anteriormente, al teorizar que
"los satisfactores y las molestias podan definirse independientemente de la situacin de
aprendizaje como estmulos a los que el organismo se aproxima y evita, respectivamente"
(Champion, 1960, p.12). Thorndike dedic un esfuerzo considerable a sugerir formas por las cuales
estos estados afectivos podan ser evaluados independientemente (Podsakoff, 1982). La
suposicin implcita de Thorndike de que "los satisfactores son fortalecedores y los irritantes son
debilitadores ha sido probada empricamente y demuestra tener una aplicacin ms limitada de la
que podra haber esperado" (Champion, 1960, p.12). En 1938, Muenzinger llev a cabo
experimentos en Colorado mostrando que la declaracin de Thorndike de los hechos es correcta,
pero incompleta (Muenzinger, 1938, p.217).

La Explicacin Aterica de Skinner del Refuerzo


Poco despus de la descripcin inicial e incompleta de refuerzo y castigo de Thorndike, un enfoque
enteramente aterico del refuerzo domin las actividades aplicadas, experimentales y acadmicas
de los analistas del comportamiento. Ms concretamente, la descripcin de B. F. Skinner de la ley
del efecto (Skinner, 1938):

La operacin de reforzamiento se define como la presentacin de un cierto tipo de estmulo en una relacin
temporal con un estmulo o una respuesta. Un estmulo reforzante se define como tal por su potencia para
producir el cambio resultante. No hay circularidad sobre esto; se encuentran algunos estmulos que
producen el cambio, otros que no, y se clasifican como reforzantes y no reforzantes en consecuencia. Un
estmulo puede poseer el poder de reforzar cuando se presenta por primera vez (cuando es por lo general el
estmulo de una respondiente incondicionada) o puede adquirir el poder a travs del condicionamiento
(p.62).

La explicacin de Skinner sobre el refuerzo, "la ley emprica del efecto", es puramente pragmtica
y una clasificacin post-hoc de los eventos observados. Dcadas de investigacin han revelado la
limitada utilidad del refuerzo conceptualizado de esta manera en obtener (o avanzar) el objetivo
cientfico de predecir los efectos del refuerzo a priori. Esto no descarta la utilidad
extremadamente valiosa del condicionamiento operante y la aplicacin del conductismo radical en
una amplia variedad de contextos. La intencin es sealar las limitaciones como una teora y para
predecir la ejecucin instrumental.

La ley emprica del efecto ha sido criticada como circular, lo que significa que no puede ser
falsificada o refutada por un experimento (Postman, 1947; Timberlake y Allison, 1974). Skinner era
consciente de esta crtica (o tal vez vio la potencial interpretacin circular), dada la cita referente
al refuerzo citada anteriormente. Para ilustrar la crtica de la circularidad, "si una consecuencia
particular se asocia con un aumento en la probabilidad de la respuesta instrumental, entonces es
un reforzador; de lo contrario no lo es" slo define un reforzador; no es una ley (Timberlake &
Allison, 1974, p.146).

Con base en estos hallazgos, parte de la comunidad analtica del comportamiento comenz a
buscar explicaciones alternativas del refuerzo, otros decidieron tratar problemas como la saciedad
y el hambre "como condiciones de contorno en la aplicacin de la ley emprica del efecto"
(Timberlake & Allison, 1974 , p. 147). Paul Meehl (1950) intent rescatar la ley emprica del efecto
(o al menos reconoci que la crtica de la circularidad sera acallada) introduciendo la "hiptesis
transituacional".

La Hiptesis Transituacional

La circularidad de la ley emprica del efecto (no falsable, experimentalmente refutada) podra ser
evitada si los estmulos identificados como reforzadores o castigos funcionaran para incrementar o
disminuir, respectivamente, la probabilidad de comportamiento (Meehl, 1950). Sin embargo, la
observacin de que la funcin del estmulo (como reforzador, estmulo neutro o castigador) puede
cambiar dependiendo de una multitud de variables, elimina la posibilidad de la funcin de
estmulo "transituacional". La simple observacin de que los alimentos no funcionarn como
refuerzo para una rata saciada ilumina estos estmulos transitorios. Timberlake y Allison (1974)
dicen, "este resultado es tan intuitivamente obvio que poco se ha hecho del mismo" (p.147). La
falta de reforzadores y castigos "transituacionales" cuando es aplicada por el laico es quizs la
demanda ms popular, pero infundada contra la tradicin analtica del comportamiento. Cuando
un "reforzador" no "funciona" para alguien, una reaccin comn es "el refuerzo no funciona". Esto
es obviamente una tergiversacin de los hechos, provocada por la confusin con respecto a la
definicin de refuerzo.

Aunque Meehl quiz no haya desarrollado una teora del refuerzo de larga data, abri la puerta a
otros enfoques para tratar con "la insuficiencia de la ley emprica del efecto como predictor de la
ejecucin instrumental" (Timberlake & Allison, 1974, p. 146). En defensa de Meehl, los
comportamientos primarios y los reforzadores discutidos en la literatura analtica del
comportamiento en ese momento eran la presin de palanca, el picoteo clave y las bolitas de
comida, respectivamente. Aunque Muenzinger (1938) seala que "los principios tericos de
conducta que queremos inventar deben ser los mismos para las ratas y los seres humanos"
(Muenzinger, 1938, p.215).

El Principio de Premack

La hiptesis de probabilidad-diferencial de David Premack (1959, 1965) es la progresin ms citada


en la bsqueda de leyes empricas que predigan la ejecucin instrumental. Probablemente el
cambio ms significativo en la hiptesis de Premack fue la salida radical de la metodologa tpica
en los anlisis experimentales del comportamiento. El cambio fue desde un enfoque de una
consecuencia de estmulo (reforzador, castigador) siguiendo un comportamiento, a un enfoque en
la probabilidad relativa de dos respuestas de refuerzo conocidas. En un intento de proporcionar un
marco emprico comprehensivo para explicar la ejecucin instrumental, Premack (1965, 1971) ha
sugerido que tanto la respuesta instrumental como el evento contingente se consideren en
trminos de sus caractersticas de comportamiento (Heth y Warren, 1978). "El enfoque de
Premack marca un cambio importante en la concepcin del refuerzo. En la visin tradicional, el
refuerzo es producido por un estmulo. En la visin de Premack, el refuerzo est relacionado con el
acceso a una respuesta "(Timberlake & Farmer-Dougan, 1991, p.381).

Premack se alej audazmente de las nociones tradicionales de refuerzo (estmulo-respuesta,


lineal) hacia una concepcin respuesta-respuesta de refuerzo. "Lo que es ms importante, sin
embargo, el enfoque de Premack predice resultados que violan las suposiciones del enfoque de
transituacionalidad" (Timberlake & Farmer-Dougan, 1991, p.381). Sin embargo, los investigadores
descubrieron rpidamente que la concepcin de Premack del refuerzo era tambin incompleta.
Eisenberger, Karpman y Trattner (1967) realizaron experimentos con resultados en conflicto con la
postulacin de Premack. Ellos encontraron que un comportamiento de menor probabilidad
tambin podra servir como una respuesta contingente (de refuerzo) si el comportamiento se
reduce (suprimido) por debajo de su nivel de lnea de base. Una concepcin relacionada de
refuerzo result de un "reanlisis y extensin de la investigacin de Premack" (Timberlake &
Farmer-Dougan, 1991, p.383), llamada hiptesis de privacin de respuesta (Timberlake & Allison,
1974).

Hiptesis de la Privacin de Respuesta

Utilizando el marco de hiptesis de probabilidad-diferencial, Timberlake y Allison (1974)


propusieron un "modelo adaptativo" de ejecucin instrumental, con el concepto central de
privacin de respuesta. "La condicin de privacin de respuesta est definida a ocurrir si el animal,
al realizar su cantidad de la respuesta instrumental de lnea de base, es incapaz de obtener acceso
a su cantidad de la respuesta contingente de base de lnea" (Timberlake & Allison, 1974, p.152).
Como apuntan Timberlake y Allison, "muchas de las contingencias que satisfacen la condicin de
privacin de respuesta tambin satisfacen la condicin de probabilidad-diferencial" (Timberlake &
Allison, 1974, p.152). Sin embargo, la principal diferencia entre las dos teoras de refuerzo es que
Premack supone que el refuerzo es el resultado de una diferencia de probabilidad entre dos
respuestas, Timberlake y Allison suponen que el refuerzo debe ser determinado por la condicin
de privacin de respuesta. Allison y Timberlake (1974) realizaron experimentos que demostraron
que la condicin de probabilidad-diferencial no era necesaria para la ejecucin instrumental (un
aumento en la respuesta instrumental por encima de la lnea de base) en los programas que
cumplan los requisitos de condicin de privacin de respuesta.

Hay dos suposiciones principales del modelo. En primer lugar, se supone que "la ejecucin
instrumental es el resultado del conflicto entre el comportamiento ocurrente libre del animal y las
restricciones de un programa" (Timberlake & Allison, 1974, p.150). El segundo supuesto del
modelo es "que la resolucin del conflicto entre los determinantes de la conducta libre y los
requerimientos del programa se basa en el equipamiento biolgico y las capacidades del animal
involucrado. Un resultado adaptativo no es necesariamente ms eficiente (rentable) en obtener
acceso a la respuesta contingente "(Timberlake y Allison, 1974, p.131). En resumen, si la situacin
de conflicto ocurre o puede ser arreglada por el cientfico o practicante, la ejecucin instrumental
(aumento de la respuesta instrumental relativa a la lnea de base) se predice. La cantidad de
aumento en la respuesta instrumental relativa a la lnea de base no se predice, slo aumenta (y
disminuye) en la respuesta instrumental.

Explicacin de Desequilibrio del Refuerzo

La iteracin ms reciente de Timberlake de la hiptesis de privacin de respuesta introduce el


"enfoque de desequilibrio" para incorporar condiciones de dos tipos. Los dos tipos son "dficit de
respuesta (denominado inicialmente privacin de respuesta) y exceso de respuesta" (Timberlake &
Farmer-Dougan, 1991, 383). Las condiciones de dficit de respuesta predicen aumento de la
ejecucin instrumental (refuerzo positivo) y las condiciones de exceso de respuesta predicen
disminucin de la respuesta instrumental (castigo, Timberlake, 1980).

Timberlake proporciona un argumento convincente para adoptar el enfoque de privacin de


respuesta / desequilibrio para predecir la ejecucin instrumental. "En suma, en relacin con el
modelo de probabilidad-diferencial, el enfoque de desequilibrio es tanto ms especfico como
menos limitado en su aplicacin. Las recompensas no se limitan a respuestas de probabilidad ms
altas, las unidades de medida no se limitan a la duracin y no se requiere denegacin de acceso a
largo plazo. Adems, se proporcionan reglas para la especificacin de los trminos del
programa"(Timberlake & Farmer-Dougan, 1991, 385). En este punto parece oportuno sealar que
no es la posicin del autor que el objetivo o el fin del anlisis del comportamiento necesariamente
debe ser la prediccin y el control de la ejecucin instrumental. Sin embargo, el autor ciertamente
valora la bsqueda de leyes empricas de prediccin y control del comportamiento a travs de
investigaciones acadmicas sobre la teora del refuerzo y la metodologa experimental.
CONCLUSIN

Casi 100 aos despus de la publicacin de Thorndike en 1911 sobre la ley del efecto, es evidente
que los estmulos identificados para funcionar como reforzadores (o castigos) en una situacin no
son transituacionales. Adems, las circunstancias en las que se utilizan los reforzadores pueden
potenciar, dificultar, invertir y / o cambiar el efecto de refuerzo de los reforzadores previamente
identificados. "Las respuestas, no importa cul sea su probabilidad, no tienen un valor absoluto o
pareado como reforzadores. Cualquier valor de refuerzo direccional debe comenzar con la
condicin de desequilibrio resultante del grado de conflicto entre la respuesta de lnea de base y
los requisitos del programa "(Timberlake y Farmer-Dougan, 1991, 384). Adems, no hay clases
nicas de reforzadores o castigos, conjuntos de estmulos o respuestas que tengan efectos de
refuerzo transituacionales. Tampoco hay combinaciones nicas de probabilidades de respuesta de
lnea de base que produzcan refuerzo "(Timberlake & Farmer-Dougan, 1991, 384).

La mayora de los comentarios proporcionados en esta traza histrica de la teora del refuerzo en
el anlisis del comportamiento, desde la ley del efecto al enfoque del desequilibrio del refuerzo,
son citas exactas o aproximaciones cercanas a las declaraciones hechas por muchos cientficos,
muchas veces antes. Sin embargo, su importacin parece casi ignorada en la mayora de las
actuales publicaciones experimentales, aplicadas y tericas en la psicologa analtica del
comportamiento. La evidencia de esta ignorancia se manifiesta en explicaciones del refuerzo sin
reconocer alternativas y aceptar sin cuestionamiento un acercamiento aterico al refuerzo tal
como fue conceptualizado por Skinner y otros tempranamente en la progresin de las
explicaciones conductuales del comportamiento psicolgico.

La proclamacin pblica y la evaluacin emprica de las teoras de refuerzo en el anlisis del


comportamiento son importantes por una variedad de razones. La razn principal en la instancia
actual es recordar a los analistas de la conducta el potencial de incrementar nuestro "anlisis
conceptual de las circunstancias del refuerzo" (Timberlake & Farmer-Dougan, 1991, p.379).
Adems, la revisin de las explicaciones tericas del refuerzo es un intento de resaltar su utilidad,
tanto en los contextos aplicados como en los bsicos. Independientemente de la opinin del lector
sobre el contenido del presente manuscrito y / o la meta de predecir la ejecucin instrumental, es
intencin del autor perpetuar la bsqueda de explicaciones tericas del refuerzo en la psicologa
conductual.

La utilidad aplicada de la aplicacin aterica de la ley del efecto, la hiptesis de probabilidad-


diferencial y el enfoque de privacin de respuesta / desequilibrio al refuerzo y al control de la
conducta se han establecido claramente y como se ha dicho anteriormente no ha sido un intento
de descontar estos tremendos logros. Sin embargo, he intentado hacer obvio a los analistas del
comportamiento que la capacidad de predecir el efecto del refuerzo de condiciones de
desequilibrio conducira a una comprensin ms completa de las circunstancias del refuerzo y es
razn sola para perseguir explicaciones predictivas, tericas, empricas del refuerzo. Los resultados
de estas investigaciones aportarn informacin adicional sobre una serie de aspectos centrales e
importantes de una conceptualizacin tanto terica como predictiva del refuerzo. Adems, es una
bsqueda digna de esfuerzo acadmico como el anlisis de la conducta sigue los esfuerzos para
avanzar en la ciencia psicolgica de la conducta.

También podría gustarte