Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Facultad de Psicología
Universidad de Salamanca
Dentro de los programas de razón, diferenciamos dos: el programa de razón continua, en la que
el refuerzo es proporcionado por el entrenador tras cada una de las respuestas del sujeto
experimental. Por otra parte, se encuentra el programa de razón parcial o intermitente, en el
que el refuerzo no se proporciona tras cada una de las respuestas, sino solo de algunas. Dentro
de este, a su vez, distinguimos dos: el primero, el reforzamiento de razón fija, en la que el
refuerzo se produce tras un número de respuestas concreto (por ejemplo, cada 5 veces que se
genera la conducta); y la segunda, el reforzamiento de razón variable, en la que el refuerzo se
proporciona tras un número de respuestas indeterminado (por ejemplo, una vez cada 3
respuestas, otra vez cada 7 respuestas…).
La extinción de una conducta se ralentiza cuando se recurre a los programas de refuerzo parcial,
dado que la recompensa es mucho menos predecible por parte del sujeto experimental. De esta
manera, para este sujeto, resultará más difícil para el sujeto determinar de manera clara cuándo
va a ser reforzado, por lo que la actuación por su parte será menos determinada al objetivo del
experimentador. Hay dos teorías que explican la causa del ERPE:
- Teoría de la frustración: consiste en que, tras el aprendizaje por parte del animal de anticipar
la recompensa, si esta se le retira esta recompensa por sorpresa, se va a dar lo que se denomina
el “fenómeno de la frustración”. Según Abram Amsel, esto produce un conflicto que se resuelve
a favor de llevar a cabo la respuesta, ya que el refuerzo no es predecible en el procedimiento de
refuerzo parcial. De esta manera se explica que recompensa se mantenga en el momento de la
extinción, ya que se asoció con una idea de ausencia de refuerzo. En cambio, cuando se somete
al sujeto experimental al procedimiento de refuerzo continuo, no hay nada que le motive a
responder en ausencia de recompensa. Todo esto quiere decir que el reforzamiento parcial hace
que el sujeto experimental aprenda a responder, incluso en ocasiones de ausencia de
recompensa.
- Teoría secuencial: esta teoría considera que el reforzamiento parcial genera que el sujeto
aprenda a responder cuando recuerda no haber sido reforzado en previos ensayos. Esta teoría
asume que los sujetos son capaces de recordar si fueron reforzados ante la emisión de una
determinada respuesta en un pasado reciente; y que, durante el entrenamiento de razón
variable, recordar que no fue recompensado puede ser fundamental, porque produce
persistencia en el proceso de extinción.
2. OBJETIVOS
El objetivo de este experimento es el análisis del efecto que tienen los diferentes programas de
razón sobre la conducta. A partir de este experimento, podremos comprobar los diferentes
efectos de los programas de reforzamiento, así como comprender en mayor profundidad dichos
procedimientos a través de un ejemplo claro, como es un estudio con un sujeto experimental,
que, en este caso es una rata.
3. MATERIALES
Para llevar a cabo el experimento ha sido necesario un ordenador con un sistema operativo
Windows 10 y el programa Sniffy Pro 3.0. Este programa de simulación emplea una cámara
operante con un suelo enrejado que consta de un comedero, un dispensador de agua y una
palanca que se sitúan en la pared de fondo, así como una luz, una campana y un altavoz, así
como los componentes utilizados en la cámara, que fueron el comedero, la palanca y el sonido.
4.2. PROCEDIMEINTO
El experimento se divide en dos partes. En la primer, la conducta instrumental objeto consistirá
en de presionar la palanca a través de un programa de reforzamiento continuo. En un principio
cada 5 repeticiones de la respuesta objetivo: cada vez que presionaba 5 veces la palanca, recibía
una bolita de comida. Poco a poco, se fue aumentando el número de respuestas requeridas a
17, 32, 46 y 74 repeticiones, sucesivamente; convirtiéndose, por tanto en un reforzamiento de
razón variable. Por último, se llevó a cabo el proceso de extinción a través de la omisión por
sorpresa del reforzador.
5. RESULTADOS
5.1. RESULTADOS DEL PROGRAMA DE RAZÓN FIJA
A. RAZÓN FIJA A 6 REPETICIONES (RF-6)
En las graficas que recogemos posteriormente, observamos que la fuerza de respuesta
instrumental es mayor que la fuerza de asociación entre la palanca y el sonido. Esto viene
indicado en la gráfica de las asociaciones operantes (figura 2).
Por otro lado, en la gráfica del registro acumulativo (figura 1) observamos que las conductas turn
y presión palanca, presentan una tasa más elevada.
Figura 1. Registro acumulativo RF-6
No obstante, debemos destacar que al sujeto le costó cierto esfuerzo identificar el proceso de
extinción al que estaba sometido, lo cual queda reflejado en el registro acumulativo (Figura 9),
en el que la rata seguía generando respuestas esperando el refuerzo. Finalmente, el sujeto acaba
omitiendo la respuesta objeto, por lo que el proceso de extinción concluye.
Figura 9. Gráfica del registro acumulativo en el programa de razón fija durante el proceso de extinción.
Figura 10. Gráfica de las asociaciones operantes en el programa de razón fija durante el proceso de extinción.
Figura 21. Gráfica del registro acumulativo en la razón variable durante el proceso de extinción
Figura 22. Gráfica de las asociaciones operantes en la razón variable durante el proceso de extinción
6. DISCUSIÓN
En lo relativo a la razón fija, el programa refuerza de manera continua al sujeto experimental, a
la vez que vamos aumentando progresivamente el número de repeticiones de la respuesta del
animal requeridas para proporcionarle el reforzador. De esta manera, observamos que, cuando
el animal se encuentra en la fase RF-6, se encuentra un poco confusa y esto hace que la pausa
sea más larga, ya que aún no ha entendido la asociación entre la respuesta objeto y el refuerzo
que se le proporciona. Sin embargo, a medida que avanza el estudio, la rata acaba
comprendiendo qué conducta es necesario que repita un número de veces determinado para
que se le proporcione el refuerzo, de manera que la tasa de respuesta se hace más estable. Este
proceso se va repitiendo en cada una de las fases del programa: las pausas eran cada vez más
largas y la carrera de razón, más rápida. Todo este proceso genera que el animal produzca un
patrón “pausa-carrera”, ya mencionado anteriormente en la fase de resultado.
Por otro lado, en cuanto al programa de razón variable, el sujeto es reforzado tras un número
de reproducciones de la conducta objeto indeterminado de forma concreta en todo el estudio.
Esto hace que se generen diferencias notables entre esta fase y la anterior. Esta diferencia reside
en que el aumento de respuestas va aumentando de forma variable, lo que hace que la tasa de
respuesta sea más elevado que en el caso de la razón fija. La explicación de esto reside en que
no existe un número fijo de respuestas que el animal debe realizar para recibir el refuerzo, por
lo que reproducirá continuamente la respuesta, ya que es la forma de asegurarse el refuerzo.
Esto genera un patrón de respuestas más estable, así como un proceso de extinción más lento,
pues el animal en este caso tiene una mayor esperanza de ser reforzada y eso constituye un
motivador para seguir realizando la conducta objeto, que es presionar la palanca.
7. REFERENCIAS
Domjan, M. (2010) Principios de aprendizaje y conducta (6º edición). “Programas simples de
reforzamiento intermitente: Programas de razón” (Pp. 187-191).