Está en la página 1de 3

Qué se aprende en la extinción?

Si como hemos visto la extinción no implica “desaprendizaje” y deja intacta


las asociaciones R-C y E-C, ¿por qué disminuye las respuestas en los
procedimientos de extinción?.

Asociaciones ER inhibitorias
Los investigadores han vuelto a considerar la relevancia de las asociaciones
E-R. En lugar de centrarse en las asociaciones excitatorias E-R, como hizo
originalmente Thorndike, han llegado a la conclusión de que la falta de
reforzamiento produce una asociación E-R inhibitoria: La falta de reforzamiento
de una respuesta en presencia de un estímulo específico, produce una
asociación E-R inhibitoria que sirve para suprimir esa respuesta siempre y
cuando el E esté presente. Esta hipótesis, predice que los efectos de la
extinción serán altamente específicos del contexto en el que la respuesta fue
extinguida.
La omisión de una recompensa esperada genera desilusión o frustración.
Estos efectos emocionales se presume que desempeñan un papel crítico en la
disminución conductual que se da en la extinción. La ausencia de recompensa
esperada desencadena una reacción frustrante aversiva incondicionada que
sirve para que se deje de responder durante el curso de la extinción mediante
el establecimiento de una asociación inhibitoria.
La afirmación de que la extinción implica el aprendizaje de una asociación
inhibitoria resulta controvertida frente a las teorías convencionales que
consideraban la inhibición condicionada y la extinción como fenómenos
diferentes.

Efectos paradójicos de la recompensa


Efecto de sobreentrenamiento en la extinción. Cuanto más entrenamiento con
reforzamiento se proporciona más fuerte es la expectativa de recompensa, y
más fuerte la frustración cuando se introduce la extinción. La disminución en la
respuesta se debe a los efectos frustrantes de la ausencia de recompensa, el
entrenamiento de reforzamiento más extenso produce una extinción más
rápida. Especialmente evidente cuando el entrenamiento incluye reforzamiento
continuo.
Ejemplo: Podríamos pensar que un entrenamiento más extenso crearía una
respuesta “más fuerte”, que sería más resistente a la extinción, pero sucede lo
contrario.
Efecto de magnitud del reforzamiento en la extinción: se refiere al hecho de
que la respuesta disminuye más rápido durante la extinción que sigue a un
reforzamiento con un reforzador mayor. Es más evidente cuando el
entrenamiento incluye reforzamiento continuo.
Ejemplo: Si consideramos dos posibilidades: en una, que se recibe 100€ al
mes; en la otra, 20€ al mes.
Si se deja de percibir la cantidad, es más aversiva si nos hemos
acostumbramos a 100 que a 20.
Efecto del reforzamiento parcial en la extinción: Es el efecto paradójico más
estudiado.
Un factor crítico que determina la magnitud de los efectos tanto conductuales
como emocionales de un procedimiento de extinción es el programa de
reforzamiento que opera antes de que se introduzca el procedimiento de
extinción. Pero la característica dominante del programa que determina los
efectos de la extinción es si la respuesta instrumental se reforzó cada vez que
ocurría (reforzamiento continuo) o sólo algunas veces (reforzamiento
intermitente o parcial). La extinción es mucho más lenta y produce menos
reacciones de frustración si estaba en activo un programa de reforzamiento
parcial antes de la introducción del procedimiento de extinción. Este fenómeno
se denomina el efecto de reforzamiento parcial en la extinción o ERPE,

Mecanismos del efecto del reforzamiento


parcial en la extinción
La explicación más evidente del ERPE es que la introducción de la extinción
es más fácil de detectar tras el reforzamiento continuo que tras el reforzamiento
parcial. La ausencia de reforzamiento es presumiblemente mucho más fácil de
detectar tras el reforzamiento continuo. Esta explicación del efecto del
reforzamiento parcial en la extinción se llama hipótesis de la discriminación.
El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la
ausencia de reforzador. El reforzamiento parcial favorece la persistencia de dos
formas diferentes.
Una explicación seria la teoría de la frustración, basada en que los sujetos
aprenden sobre los efectos emocionales de la ausencia de recompensa
durante el entrenamiento en reforzamiento parcial. La otra explicación, la teoría
secuencial, está basada en lo que los sujetos aprenden sobre la memoria de la
ausencia de recompensa.
Teoría de la frustración: Desarrollada por Abram Amsel, la persistencia en la
extinción es resultado del aprendizaje de algo paradójico, es decir, continuar
respondiendo cuando se espera no ser reforzado o ser frustrado. Asume que el
reforzamiento intermitente da como resultado aprender a responder a pesar de
esperar la ausencia de reforzamiento. Sin embargo, este aprendizaje requiere
considerable experiencia con reforzamiento intermitente.
El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Lo
recompensados animan a los sujetos a esperar reforzamiento y los no
recompensados les llevan a espera la ausencia de recompensa. Por tanto el
reforzamiento intermitente produce el aprendizaje de expectativas tanto de
recompensa como de no recompensa. La expectativa de recompensa alienta a
los sujetos a responder, y la anticipación de la ausencia de reforzamiento
desalienta la respuesta, al principio del entrenamiento los sujetos entran en
conflicto con lo que se ha de hacer. Sus expectativas motivan tendencias de
respuesta opuestas. Sin embargo a medida que el entrenamiento continua, el
conflicto se resuelva a favor de responder.
La resolución del conflicto ocurre debido a que el reforzamiento no es
predecible en el típico programa de reforzamiento parcial. Debido a estas
experiencias, la respuesta instrumental se condiciona a la expectativa de la
ausencia de recompensa. De acuerdo con la teoría de la frustración, esta es la
clave de la persistencia en responder durante la extinción. Con suficiente
entrenamiento, el reforzamiento intermitente da como resultado el aprendizaje
de realizar la respuesta instrumental como reacción a la expectativa de
ausencia de recompensa. Por el contrario no existe nada en la experiencia del
reforzamiento continuo que motive a los sujetos a responder cuando esperan
ausencia de recompensa. El reforzamiento continuo no produce persistencia en
la extinción.
Teoría secuencial; Capaldi, está formulada en términos de memoria. Asume
que los sujetos pueden recordar si fueron reforzados por realizar la respuesta
instrumental en el pasado reciente. Recuerdan los ensayos recientes tanto
recompensados como no recompensados.
Se asume además que durante el entrenamiento en reforzamiento
intermitente, la memoria de la ausencia de recompensa llega a ser una clave
para la realización de la respuesta instrumental, esto produce persistencia en le
extinción.
Considérese un ensayo: RNNRRNR. El sujeto es recompensado en el primer
ensayo, no recompensado en los dos siguientes, recompensado dos veces,
luego no reforzado y finalmente recompensado de nuevo. Con suficientes
experiencias de este tipo, el sujeto aprende a responder siempre y cuando
recuerde no haber sido reforzado en los ensayo precedentes. Este aprendizaje
provoca la persistencia de la respuesta instrumental en la extinción.
Desde que la dos teorías fueron propuestas se ha obtenido gran evidencia en
apoyo de cada teoría. Ambas representan dos formas diferentes en las que el
reforzamiento parcial puede influir sobre la respuesta durante la extinción. Los
mecanismos de memoria pueden contribuir en mayor medida cuando los
ensayos de entrenamiento no estén separados por largos intervalos entre
ensayos. El aprendizaje emocional descrito por la teoría de la frustración es
menos sensible a los intervalos entre ensayos y, por tanto, proporciona una
mejor explicación del ERPE cuando se utilizan ensayos ampliamente
espaciados.

También podría gustarte