Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Definiciones.
Respuesta instrumental: respuesta que tiene interés para nosotros y que el organismo puede emitir o no, según
su voluntad.
Consecuencia: sigue a la respuesta instrumental, lo que el organismo quiere o no tener (EI).
Estímulo discriminativo: estímulo que indica que la respuesta instrumental va a ir seguida de la consecuencia.
Contingencia.
La contigüidad no constituye una condición suficiente para que se produzca el aprendizaje instrumental. Se
debe producir además una relación de contingencia adecuada para que el condicionamiento instrumental se
manifieste. La contingencia se determina a partir de la relación entre la respuesta y la consecuencia. La con-
tingencia respuesta-consecuencia será alta cuando la respuesta sea un buen predictor de la consecuencia.
Indefensión aprendida: se puede producir una contingencia cero entre la respuesta y la consecuencia,
produciéndose el efecto de la indefensión aprendida. Seligman y Mayer, y Overmier y Seligman plantearon
esta hipótesis, en la que los animales podemos percibir una contingencia llevándonos a aprender que no
podemos controlar las consecuencias del ambiente a través de nuestra respuesta. Otros autores han cues-
tionado esta hipótesis sugiriendo que el efecto de la indefensión se debe a que los animales aprendemos a
mantenernos inactivos durante la exposición a consecuencias incontrolables o a que este entrenamiento
produce un déficit atencional, reduciendo la atención que prestamos a nuestra conducta. Este fenómeno
demuestra que la contingencia es fundamental para que se produzca el aprendizaje así como la experiencia
previa de la contingencia ya que puede facilitar o dificultar la detección de contingencias futuras, modifi-
cando su capacidad para favorecerse el aprendizaje instrumental.
Competición asociativa.
Pearce y Hall (1979) compararon la frecuencia de respuesta en dos grupos de animales, en uno de ellos (gru-
po correlacionado) se presentó un sonido inmediatamente después de cada respuesta que fuera recompen-
sada, en el otro el sonido se presentó al azar (grupo no correlacionado). La frecuencia de respuesta fue ma-
yor en el grupo correlacionado, sugiriendo que la correlación sonido-consecuencia ensombreció la relación
entre la respuesta y la consecuencia, indicando que la competición asociativa también se puede encontrar en
el condicionamiento instrumental. Por lo tanto existe competitividad asociativa si presentamos otro estimulo
que aparezca antes d la consecuencia y dejamos de emitir respuesta.
Lo suponemos, por ahora solo ocurre en el condicionamiento clásico.
Naturaleza de la consecuencia en el condicionamiento instrumental.
El aprendizaje se puede producir en ausencia del EI que tenga fuerza biológica alta, pues lo mismo ocurre con el condicio-
namiento instrumental. El trabajo clásico de Tolman y Honzik (1930), mostraba que la respuesta instrumental que llevaba
a la salida del laberinto podía perderse en ausencia de una consecuencia relevante biológicamente, aunque esta si era
necesaria para que el resultado del aprendizaje se manifestara.
Uno de los factores que varían la importancia subjetiva de una determinada consecuencia para un sujeto se
ilustra con los experimentos de contraste, en los que se han encontrado que los efectos de la consecuencia
dependen de la cantidad y naturaleza de las consecuencias que el individuo haya experimentado previamente.
Así cuando se comienza administrando a los sujetos una consecuencia pobre, el incremento posterior produce
un aumento en la respuesta que se mantiene a niveles más altos que los de un sujeto que haya recibido siem-
pre la recompensa grande (contraste positivo), y ocurre al contrario también (contraste negativo).
Otro factor que determina la importancia subjetiva de la consecuencia son los fenómenos de habituación y
sensibilización, en términos generales el castigo intenso sensibiliza y aumenta la eficacia del castigo moderado
que se administre posteriormente, mientras que un castigo moderado lleva a que el sujeto se habitué a la con-
secuencia aversiva y lo inmuniza contra un castigo intenso posterior.
Fenómenos de contraste.
Contraste positivo: aumento en la respuesta instrumental como conse-
cuencia del paso de una consecuencia pobre a una consecuencia rica
comparado con un grupo de control que siempre ha sido entrenado con
la consecuencia rica.
Si trabajamos con una contigüidad y una contingencia alta entre la respuesta y una consecuencia que el sujeto
considere relevante se garantiza el éxito de nuestro procedimiento de condicionamiento instrumental.
Contenidos del aprendizaje instrumental.
En una situación de condicionamiento instrumental pueden encontrarse pruebas de que se han realizado hasta 4 tipos de
asociaciones distintas.
Asociación E-R.
Thorndike consideró que de las varias respuestas realizadas en la misma situación, aquellas
que van seguidas de la satisfacción del animal, se conectarán más fácilmente con la situación,
manteniendo las demás constantes (efecto de Thorndike). Se asume que el sujeto aprende a
emitir la respuesta en presencia del estímulo discriminativo.
Asociación E-C.
Prueba de transferencia. Se establece una asociación E-C si ante ese
estimulo la respuesta instrumental es recompensada y es la aparición de
ese estímulo a través de la asociación E-C lo que lleva a un organismo al
estado motivacional para que ejecute la respuesta instrumental.
Se diseñó un videojuego en el que los participantes tuvieron que defen-
der Andalucía de ataques aéreos y marítimos. Se estableció primero una
relación entre las dos respuestas instrumentales (2 teclas en un teclado
de ordenador) y 2 consecuencias diferentes (destrucción de los barcos y
de los aviones). Una vez aprendidas las relaciones R1-C1 y R2-C2, los
participantes tuvieron que aprender a predecir cuál de dos estímulos
diferentes predecía cada una de las consecuencias (A-C1 y B-C2). En la
prueba final se daba al participante la oportunidad de escoger entre las
dos respuestas instrumentales (R1 y R2) en presencia de cada uno de los
estímulos utilizados durante la fase de aprendizaje predictivo. La trasfe-
rencia se manifestó como una mayor respuesta en la tecla que coincidía
con el reforzador en el estímulo presente (R1 en A y R2 en B), que en la
otra. Este resultado solo se explica si el sujeto ha establecido una rela-
ción clave-consecuencia que favorece la respuesta asociada con la mis-
ma consecuencia.
Asociación R-C.
Colwill y Rescorla aplicaron la técnica de devaluación del reforzador: si una vez establecido el aprendizaje ins-
trumental, le quitamos el valor a motivacional a una de las consecuencias emparejándolo con algo desagrada-
ble, se seguirá respondiendo al estímulo de manera que se responde a la primera relación.
Entrenaron a un grupo de ratas a realizar 2 respuestas instrumentales diferentes, cada una seguida por una con-
secuencia distinta. Posteriormente devaluaron el valor motivacional de una de las consecuencias emparejándolo
con malestar gastrointestinal en el caso de la comida. Después se le dio la oportunidad a los sujetos de dar las
dos respuestas entrenadas previamente, pero encontraron que las ratas respondían mucho mejor en la respues-
ta que se había entrenado en el entrenamiento inicial con la consecuencia que había sido devaluada que en la
otra respuesta. En términos coloquiales, la relación R-C se demuestra porque las ratas dejaron de realizar la
respuesta que les proporcionaba una comida que ahora les resultaba desagradable, centrando su esfuerzo en la
respuesta que todavía les proporcionaba una consecuencia apetitosa.
Modelo de relación jerárquica E(R-C).
Los seres vivos establecemos una relación jerárquica en la que la asociación respuesta-consecuencia depende
de la presencia o ausencia del estímulo discriminativo. En muchas ocasiones este tipo de aprendizaje discrimina-
tivo es consecuencia de un entrenamiento directo del sujeto, bien por la intención del experimentador o por la
determinación del mismo ambiente.
Programas de reforzamiento.
Dentro del condicionamiento instrumental, el programa de reforzamiento es la regla o conjunto combinado
de reglas que determinan cuándo una respuesta del organismo va a ir seguida por una determinada conse-
cuencia. Esas reglas pueden venir determinadas por
la propia naturaleza: nº de veces que tengo que lanzar una caña para conseguir un pez.
por criterios artificiales: nº de monedas que tengo que introducir en una máquina tragaperras para con-
seguir un premio.
Programas de razón: el que una respuesta sea reforzada depende del nº de respuestas que dé el sujeto desde la
última vez que su respuesta fue reforzada (respuesta seguida por la consecuencia):
Programas de reforzamiento de razón fija (RF). El nº de respuestas entre reforzadores es siempre el mismo
(trabajo a destajo, siempre va a conseguir lo mismo después de cada x tareas realizadas). Se caracteriza por
una tasa de respuesta elevada, pausas predecibles inmediatamente después de la consecución del reforza-
dor. Este comportamiento se conoce como carrera de razón. Una vez consigan el primer reforzador, se toma-
ran un respiro que se conoce como pausa postrreforzamiento, cuya duración tendrá una relación directa con
el número de respuestas que requiera cada reforzador. Una vez comience a responder, la respuesta tenderá
a ser alta y constante pues cada respuesta que se emite lo coloca más cerca del siguiente reforzador.
Programas de reforzamiento de razón variable (RV). El nº de respuestas necesarias para obtener la conse-
cuencia varía de forma impredecible (máquinas tragaperras). la respuesta que va a ir seguida del premio es
impredecible, por lo que la tasa de respuesta que se observa es alta y constante, sin pausas predecibles.
Programas de intervalo: se refuerza la 1º respuesta que ocurra después de un intervalo de tiempo desde el
último reforzador.
Programas de reforzamiento de intervalo fijo (IF). El tiempo que ha de transcurrir desde la última respuesta
reforzada para poder obtener el reforzador es siempre el mismo (entrega de trabajo académico en un de-
terminado plazo). Igual que en programa de razón fija, se observa también una pausa postrreforzamiento
que va seguida por un incremento gradual en la tasa de respuesta alcanzando su máximo en el momento en
el que el reforzador debería estar disponible de nuevo.
Programas de reforzamiento de intervalo variable (IV). Se refuerza la primera respuesta que dé el organismo
después de transcurrido un tiempo impredecible desde que la última respuesta fue reforzada (realización de
controles de examen aleatorios).
Programas de reforzamiento diferencial de tasa baja (RDTB). El intervalo entre respuestas del sujeto tiene
que superar un determinado criterio para obtener el reforzamiento (tratamiento de reducción del consumo
diario de tabaco).
Programas de reforzamiento diferencial de tasa alta (RDTA). El intervalo entre respuestas del sujeto tiene
que ser inferior a un criterio determinado para que la respuesta vaya seguida por reforzamiento (bomba ma-
nual de agua).
Programas de reforzamiento encadenados.
Programas de reforzamiento simples que el sujeto tiene que completar para obtener el reforzamiento final
(montaje de un ventilador).
La ley de igualación (Herrnstein, 1970). Cuando los reforzadores son idénticos, las respuestas tienen dificultad
equivalente, el cambio de una respuesta a otra es fácil y rápido, y las dos alternativas de respuesta son inde-
pendientes (lo que haga con una alternativa no condiciona a la otra), la tasa relativa de respuesta en cada al-
ternativa iguala a la tasa relativa de reforzamiento en dicha alternativa de respuesta.