El condicionamiento operante implica el establecimiento de
una asociación E-R entre la respuesta instrumental (operante) R
y los estímulos contextuales E que están presentes cuando la respuesta es reforzada; por esto el papel del reforzador es estampar la asociación E-R. Entonces la motivación se da en presencia de los estímulos contextuales presentes al momento de generar la asociación que reforzó la conducta Lo anterior implica que el condicionamiento operante no involucra aprendizaje sobre el reforzador (C) o la relación entre la respuesta y la consecuencia reforzante (asociación R- C) De esta ley se supone que el único papel del reforzador es fortalecer la asociación E-R. El reforzador no forma parte de esta asociación Así podemos entender la conducta habitual de la gente (automatismos, que corresponden al 45%) La idea de que la expectativa de la recompensa puede motivar la conducta instrumental no fue seriamente considerada sino hasta 40 años después del planteamiento de la ley del efecto. ¿Cómo podríamos captar la idea de que los sujetos aprenden a esperar el reforzador en el curso del condicionamiento instrumental? Se llega a esperar que suceda algo importante cuando se encuentra un estímulo que señala al evento importante o que le permite predecir que el evento ocurrir.(señales) El condicionamiento Clásico es el proceso básico del aprendizaje de señales. De ahí que una forma de mirar la expectativa de la recompensa es considerando la forma en que los procesos “pavlovianos” participan en el aprendizaje instrumental. la especificación de una respuesta instrumental asegura que el participante siempre experimentará ciertos estímulos distintivos (E) en conexión con la realización de la respuesta. Esos estímulos pueden incluir el lugar donde se realiza la respuesta, la textura del objeto que debe manipular el participante o bien señales visuales u olfativas distintivas. Cualquiera que sea el estímulo, el reforzamiento de la respuesta instrumental inevitablemente resultará en el emparejamiento de esos estímulos (E) con el reforzador o consecuencia de la respuesta (C). Dichos emparejamientos brindan el potencial para el condicionamiento clásico y el establecimiento de una asociación entre E y C. Esta asociación E-C es uno de los mecanismos de la expectativa de recompensa en el condicionamiento instrumental. Clark Hull propone que la respuesta instrumental se incrementa en el curso del condicionamiento instrumental por dos razones: La presencia de E llega a provocar directamente la respuesta instrumental por medio de la asociación E-R de Thorndike; la respuesta instrumental también llega a realizarse como reacción a una asociación E-C que crea la expectativa de la recompensa. La forma precisa con la cual la asociación E-C llega a motivar la conducta instrumental ha sido tema de muchos debates e investigaciones experimentales. Partimos de la idea de que existen 2 tipos de aprendizajes: Pavloviano (clásico) Operante (instrumental)
En el curso del Condicionamiento Operante, los estímulos en
cuya presencia se refuerza la respuesta operante, se asocian con la consecuencia de la respuesta (C); por medio de un Condicionamiento Clásico y esto resulta en una asociación E-C Rescorla y Solomon creyeron que la asociación E-C activa un estado emocional positivo o negativo, dependiendo de si el reforzador es un estímulo apetitivo o aversivo (comida o una descarga). De este modo, se estima que varios reforzadores apetitivos (como agua y comida) conducen a un estado emocional positivo común y que varios estímulos aversivos dan lugar a una emoción negativa común. Probar la idea de que una asociación E-C (y las expectativas o emociones de dicha asociación activa) puede motivar la conducta instrumental se consigue por medio de un diseño experimental diseñado por Everin y Robbins que implica 3 fases En una fase los sujetos son sometidos a un condicionamiento instrumental estándar (por ejemplo, la presión de palanca se refuerza con comida). En la siguiente fase son sometidos a un procedimiento puro de condicionamiento pavloviano (se saca la palanca de respuestas de la cámara experimental y se empareja un tono con comida). La fase crítica de transferencia ocurre en la tercera, en que se permite nuevamente a los sujetos realizar la respuesta instrumental de presionar la palanca, pero ahora se presenta periódicamente el EC pavloviano. Si la asociación pavloviana E-C motiva la conducta instrumental, entonces la tasa de presión de palanca debería incrementarse cuando se presenta el tono (EC). Esto determina cómo es que un EC pavloviano se transfiere para influir o motivar la conducta instrumental Los estímulos condicionados clásicamente no sólo provocan estados emocionales, sino también respuestas manifiestas. Un estímulo condicionado clásicamente puede influir en la conducta instrumental por medio de dichas respuestas Ni la asociación E-R ni la asociación E-C involucran una conexión directa entre la respuesta (R) y el reforzador o consecuencia (C), lo cual resulta contraintuitivo. Si le pregunta a alguien por qué realiza una respuesta instrumental, la respuesta probable sería que espera que la respuesta (R) tenga como resultado el reforzador (C). La intuición sugiere que la conducta instrumental implica asociaciones R-C. Aunque nuestras explicaciones informales de la conducta instrumental enfatizan las asociaciones R-C, dichas asociaciones no existen en los modelos de dos procesos. Aproximaciones al desarrollo de programas de conducta planificados Los análisis de la regulación conductual se basan en una visión del mundo radicalmente distinta. En lugar de considerar al condicionamiento instrumental en términos del reforzamiento de una respuesta en presencia de ciertos estímulos, la regulación conductual se enfoca en la manera en que los procedimientos de condicionamiento instrumental ponen limitaciones a las actividades de un organismo y ocasionan la redistribución de dichas actividades. En un inicio se consideraba que los reforzadores eran tipos especiales de estímulos. Por ejemplo, Thorndike describía a un reforzador como un estímulo que produce un estado satisfactorio de cosas Varios reforzadores, como la comida y el agua, provocan respuestas incondicionadas típicas de la especie, como masticar, lamer y tragar. La teoría de la respuesta consumatoria atribuye el reforzamiento a esas conductas típicas de la especie. las respuestas consumatorias típicas de la especie (comer, beber, etcétera) son en sí mismas la característica esencial de los reforzadores Sheffield, Roby y Campbell (1954) demostraron que la sacarina, un endulzante artificial, funcionaba como un reforzador eficaz aunque no tuviese valor nutritivo y consecuentemente no pudiese satisfacer una necesidad biológica. Las propiedades reforzantes de los endulzantes artificiales son el cimiento de la floreciente industria de la comida dietética. Sin embargo, además de su valor comercial estos productos también hicieron avanzar nuestras ideas acerca de la motivación instrumental La teoría de la respuesta consumatoria constituyó una innovación radical, pues cambió la búsqueda de los reforzadores de tipos especiales de estímulos a tipos especiales de respuestas. Se asumió que las respuestas reforzantes eran especiales debido a que implicaban la consumación o completamiento de una secuencia conductual instintiva. La teoría supuso que las respuestas consumatorias (como masticar y tragar) son fundamentalmente distintas de diversas respuestas instrumentales potenciales como correr, saltar o presionar una palanca Premack señalaba que las respuestas involucradas con los reforzadores de uso común implican actividades que es muy probable que realicen los animales. En un experimento con reforzamiento alimenticio, por lo general se priva de comida a los participantes que, en consecuencia, se muestran muy propensos a participar en la conducta alimenticia. En contraste, las respuestas instrumentales suelen ser actividades de baja probabilidad. Por ejemplo, la probabilidad de que una rata experimentalmente ingenua presione una palanca es mucho menor que la probabilidad de que coma esta diferencia en las probabilidades de las respuestas es crucial para el reforzamiento. El principio de Premack puede exponerse formalmente de la siguiente manera: Dadas dos respuestas de probabilidad distinta, A y B, la oportunidad para realizar la respuesta de alta probabilidad (A) después de la respuesta de baja probabilidad (B) tendrá como resultado el reforzamiento de la respuesta B. (B A refuerza B.) La oportunidad para realizar la respuesta de baja probabilidad (B) después de la respuesta de mayor probabilidad (A) no resultará en el reforzamiento de la respuesta A. (A B no refuerza A.) El principio de Premack se enfoca en la diferencia en la probabilidad de la respuesta instrumental y la respuesta reforzante. Por tanto, se conoce también como principio de probabilidad diferencial. Comer reforzará la presión de palanca, pues, por lo regular, comer es más probable que palanquear. Fuera de eso, la teoría de Premack niega que exista algo especial en un reforzador. Gran impacto en el diseño de los procedimientos de reforzamiento utilizados para ayudar a diversas poblaciones clínicas. En una aplicación inicial, Mitchell y Stoffelmayr (1973) estudiaron a dos pacientes hospitalizados con esquizofrenia crónica que rechazaban todos los reforzadores tangibles que se les ofrecían (dulces, cigarrillos, fruta, panecillos). Los otros pacientes del pabellón participaban en un proyecto de trabajo que implicaba retirar el alambre de cobre fuertemente enroscado en las bobinas. Si realizaban las respuestas requeridas de limpiar las bobinas, se les permitía sentarse por alrededor de 90 segundos y luego empezaba el siguiente ensayo Mientras estuvo en efecto la contingencia instrumental, ambos pacientes trabajaban a una tasa mucho mayor que los sujetos a quienes simplemente se les pidió que participaran en el proyecto de limpieza del cable. Las instrucciones normales y las amonestaciones para participar en el proyecto eran completamente ineficientes, pero aprovechar la única respuesta de alta probabilidad que tenían los participantes (sentarse) funcionó muy bien. Los dos participantes en este estudio no intervinieron en el proyecto de las bobinas y pasaban sentados la mayor parte de su tiempo Dado su limitado repertorio conductual, ¿qué podría constituir un reforzador eficaz? El principio de Premack sugería que la oportunidad de sentarse podría ser un buen reforzador para esos pacientes. Para probar esta idea, los investigadores sólo daban a los sujetos la oportunidad de sentarse si trabajaban un poco en la tarea de limpiar las bobinas Cada participante fue entrenado por separado. Al inicio de cada ensayo se les pedía o se les convencía de que se pusieran de pie, luego se les entregaba una pieza de cable El principio de Premack hizo avanzar nuestras ideas sobre el reforzamiento de manera importante, animó a pensar en los reforzadores como respuestas más que como estímulos y amplió considerablemente la variedad de actividades que los investigadores empezaron a usar como reforzadores. Con este principio, cualquier conducta puede funcionar como reforzador, siempre que fuese más probable que la respuesta instrumental 1. Adolescente guitarrero que no hace nada en casa 2. Niño que se pasa todo el día viendo Hora de Aventuras 3. Perro que muerde las pantuflas 4. Mujer histriónica que suele hacer dietas restrictivas 5. Hombre que se niega a hablar en público 6. Sujeto depresivo que se aísla