Está en la página 1de 9

Ana López García

Psicología del aprendizaje

Facultad de Psicología

Universidad de Salamanca

EXPERIMENTO 9. PROGRAMAS DE RAZÓN Y


EFECTO DE EXTINCIÓN
1. INTRODUCCIÓN
Los programas de razón son procedimientos consistentes en la presentación de un reforzador
cuando el sujeto ha realizado un número determinado de respuestas. Estas conductas, aquellas
que se refuerzan, son las denominadas conductas instrumentales objetivo, es decir, las que al
entrenador le interesa que se repitan.

Dentro de los programas de razón, diferenciamos dos: el programa de razón continua, en la que
el refuerzo es proporcionado por el entrenador tras cada una de las respuestas del sujeto
experimental. Por otra parte, se encuentra el programa de razón parcial o intermitente, en el
que el refuerzo no se proporciona tras cada una de las respuestas, sino solo de algunas. Dentro
de este, a su vez, distinguimos dos: el primero, el reforzamiento de razón fija, en la que el
refuerzo se produce tras un número de respuestas concreto (por ejemplo, cada 5 veces que se
genera la conducta); y la segunda, el reforzamiento de razón variable, en la que el refuerzo se
proporciona tras un número de respuestas indeterminado (por ejemplo, una vez cada 3
respuestas, otra vez cada 7 respuestas…).

La extinción de una conducta se ralentiza cuando se recurre a los programas de refuerzo parcial,
dado que la recompensa es mucho menos predecible por parte del sujeto experimental. De esta
manera, para este sujeto, resultará más difícil para el sujeto determinar de manera clara cuándo
va a ser reforzado, por lo que la actuación por su parte será menos determinada al objetivo del
experimentador. Hay dos teorías que explican la causa del ERPE:

- Teoría de la frustración: consiste en que, tras el aprendizaje por parte del animal de anticipar
la recompensa, si esta se le retira esta recompensa por sorpresa, se va a dar lo que se denomina
el “fenómeno de la frustración”. Según Abram Amsel, esto produce un conflicto que se resuelve
a favor de llevar a cabo la respuesta, ya que el refuerzo no es predecible en el procedimiento de
refuerzo parcial. De esta manera se explica que recompensa se mantenga en el momento de la
extinción, ya que se asoció con una idea de ausencia de refuerzo. En cambio, cuando se somete
al sujeto experimental al procedimiento de refuerzo continuo, no hay nada que le motive a
responder en ausencia de recompensa. Todo esto quiere decir que el reforzamiento parcial hace
que el sujeto experimental aprenda a responder, incluso en ocasiones de ausencia de
recompensa.

- Teoría secuencial: esta teoría considera que el reforzamiento parcial genera que el sujeto
aprenda a responder cuando recuerda no haber sido reforzado en previos ensayos. Esta teoría
asume que los sujetos son capaces de recordar si fueron reforzados ante la emisión de una
determinada respuesta en un pasado reciente; y que, durante el entrenamiento de razón
variable, recordar que no fue recompensado puede ser fundamental, porque produce
persistencia en el proceso de extinción.
2. OBJETIVOS
El objetivo de este experimento es el análisis del efecto que tienen los diferentes programas de
razón sobre la conducta. A partir de este experimento, podremos comprobar los diferentes
efectos de los programas de reforzamiento, así como comprender en mayor profundidad dichos
procedimientos a través de un ejemplo claro, como es un estudio con un sujeto experimental,
que, en este caso es una rata.

3. MATERIALES
Para llevar a cabo el experimento ha sido necesario un ordenador con un sistema operativo
Windows 10 y el programa Sniffy Pro 3.0. Este programa de simulación emplea una cámara
operante con un suelo enrejado que consta de un comedero, un dispensador de agua y una
palanca que se sitúan en la pared de fondo, así como una luz, una campana y un altavoz, así
como los componentes utilizados en la cámara, que fueron el comedero, la palanca y el sonido.

4. MÉTODO: SUJETO Y PROCEDIMIENTOS


4.1. SUJETO
El sujeto experimental fue una rata virtual formada por un conjunto de fotogramas de una rata
viva de la especie ratus norvegicius.

4.2. PROCEDIMEINTO
El experimento se divide en dos partes. En la primer, la conducta instrumental objeto consistirá
en de presionar la palanca a través de un programa de reforzamiento continuo. En un principio
cada 5 repeticiones de la respuesta objetivo: cada vez que presionaba 5 veces la palanca, recibía
una bolita de comida. Poco a poco, se fue aumentando el número de respuestas requeridas a
17, 32, 46 y 74 repeticiones, sucesivamente; convirtiéndose, por tanto en un reforzamiento de
razón variable. Por último, se llevó a cabo el proceso de extinción a través de la omisión por
sorpresa del reforzador.

En la segunda parte de este experimento, hemos recurrido al programa de reforzamiento


variable ya mencionado. Con este sujeto experimental se llevó a cabo un reforzamiento de razón
variable, de tipo intermitente. El primer paso tratará de dar el reforzador cada 4, 5 o 6
repeticiones de la conducta, variando, por tanto, el número de respuestas requeridas para
proporcionar el refuerzo. Los valores numéricos, que reflejan la media de las respuestas,
coinciden con los obtenidos en el procedimiento de razón fija (6, 17, 32, 46 y 74), y, al igual que
en el caso previo, el proceso acaba con una fase de extinción.

5. RESULTADOS
5.1. RESULTADOS DEL PROGRAMA DE RAZÓN FIJA
A. RAZÓN FIJA A 6 REPETICIONES (RF-6)
En las graficas que recogemos posteriormente, observamos que la fuerza de respuesta
instrumental es mayor que la fuerza de asociación entre la palanca y el sonido. Esto viene
indicado en la gráfica de las asociaciones operantes (figura 2).

Por otro lado, en la gráfica del registro acumulativo (figura 1) observamos que las conductas turn
y presión palanca, presentan una tasa más elevada.
Figura 1. Registro acumulativo RF-6

Figura 2. Asociaciones operantes RF-6

B. RAZÓN FIJA A 17 REPETICIONES (RF-17).


En este caso, el gráfico de asociaciones operantes (Figura 4) se presenta igual, puesto que en
estos procedimientos esperamos que las barras del gráfico alcancen, al menos, entre 75% y el
80% de su totalidad. Por otra parte, el gráfico del registro acumulativo (Figura 3) demuestra el
mismo patrón que el de asociaciones operantes. Sin embargo, hay que tener en cuenta el hecho
de que al sujeto experimental le hemos expuesto a distintas condiciones que en la fase anterior.
En esta, el sujeto ha sido reforzado cada 17 respuestas, lo que hace un total de 11 respuestas
más que antes. Además, apreciamos que la conducta de presionar la palanca obtiene una tasa
de respuesta superior.

Figura 3. Gráfico del registro acumulativo en el programa de razón fija (RF-17).

Figura 4. Gráfica de asociaciones operantes (RF-17).

C. RAZÓN FIJA A 32 REPETICIONES (RF-32)


En esta etapa se observa con claridad que las pausas que se dan posteriormente al
reforzamiento comienzan a ser más largas, al mismo tiempo que avanzamos en el programa de
razón fija y aumenta el número de repsuestas que se necesitan por parte del sujeto experimental
para que el investigador proporcione el refuerzo.
Figura 5. Gráfico del registro acumulativo (RF-32)

Figura 6. Gráfico de asociaciones operantes (RF-32)

D. RAZÓN FIJA A 46 REPETICIONES (RF-46)


Las pausas post-reforzamiento son cada vez más largas; y la tasa de velocidad en las respuestas
por parte del sujeto experimental es cada vez mayor así como muestran los siguientes graficos
(Figura 7 y Figura 8).

Figura 7. Gráfico del registro acumulativo

Figura 8. Gráfico de las asociaciones operantes

E. EXTINCIÓN DE LA RAZÓN FIJA


En esta fase hemos procedido al procedo de extinción, en el que hemos retirado de forma
sorpresiva del reforzador, en este caso la comida, así como el sonido que lo acompañaba. Tras
esto podemos observar claramente que ha disminuido la fuerza de la respuesta, puesto que ha
disminuido la fuerza de asociación respuesta-reforzador.

No obstante, debemos destacar que al sujeto le costó cierto esfuerzo identificar el proceso de
extinción al que estaba sometido, lo cual queda reflejado en el registro acumulativo (Figura 9),
en el que la rata seguía generando respuestas esperando el refuerzo. Finalmente, el sujeto acaba
omitiendo la respuesta objeto, por lo que el proceso de extinción concluye.

Figura 9. Gráfica del registro acumulativo en el programa de razón fija durante el proceso de extinción.

Figura 10. Gráfica de las asociaciones operantes en el programa de razón fija durante el proceso de extinción.

5.2. RESULTADOS DEL PROGRAMA DE RAZÓN VARIABLE


A. RAZÓN VARIABLE A 6 REPETICIONES (RV-6).
Los gráficos de esta etapa reflejan que la asociación de la respuesta “tirar de la palanca”, y su
consecuencia, “sonido”, es más elevada que la fuerza de la conducta instrumental. Sin embargo,
hay que destacar que en la gráfica de registro acumulativo (Figura 11), podemos encontrar un
patrón estable.

Figura 11. Gráfica del registro acumulativo (RV-6)


Figura 12. Gráfica de las asociaciones operantes (RV-6)

B. RAZÓN VARIABLE A 17 REPETICIONES (RV-17)


Los gráficos de esta etapa reflejan que el animal responde cada vez más rápido.

Figura 13. Gráfica del registro acumulado (RV-17).

Figura 14. Gráfica de las asociaciones operantes (RV-17).

C. RAZÓN VARIABLE A 32 REPETICIONES (RV-32)


Otra vez, a medida que procedemos en el desarrollo del experimento, el animal responde de
forma más rápida.

Figura 15. Gráfica del registro acumulado (RV-32)

Figura 16. Gráfico de asociaciones operantes (RV-32)

D. RAZÓN VARIABLE A 46 REPETICIONES (RV-46)


En estos gráficos (Figura 17 y Figura 18), se presenta que la conducta “turn” disminuye
ligeramente, al mismo tiempo que la consucta “presionar palanca” aumenta de forma casi
imperceptible. Además, también podrmos observar pequeñas pausas que se producen
posteriormente al reforamiento.
Figura 17. Gráfica del registro acumulativo (RV-46)

Figura 18. Gráfica de las asociaciones operantes (RV-46)

E. RAZÓN VARIABLE A 74 REPETICIONES (RV-74)


La respuesta de presión a la palanca continúa en aumento, por lo que la tasa de respuesta es
cada vez más alta. Esto se ve claramente en la gráfica del registro acumulativo (Figura 19), en la
que la conducta aparece cada vez con mayor frecuencia.

Figura 19. Gráfica del registro acumulativo (RV-74)

Figura 20. Gráfica de las asociaciones operantes (RV-74)

F. EXTINCIÓN DE LA RAZÓN VARIABLE


En esta fase, al igual que en la fase se esta misma naturaleza en la razón fija, el investigador cesa
en la proporción de la bolita de comida al animal en calidad de reforzador de su conducta, todo
ello de manera sorpresiva y en un intervalo de número de respuestas variable. A partir de este
momento, la tasa de respuesta por parte del animal disminuye, aunque con menor fuerza que
en el caso de la razón fija. Esto nos indica que la rata sigue teniendo la esperanza de ser
reforzada, lo que supone una motivación para que continúe llevando a cabo la respuesta
instrumental. Sin embargo, aunque en este caso la extinción sea menos eficaz, si para el tiempo
suficiente, la conducta termina por extinguirse.

Figura 21. Gráfica del registro acumulativo en la razón variable durante el proceso de extinción

Figura 22. Gráfica de las asociaciones operantes en la razón variable durante el proceso de extinción

6. DISCUSIÓN
En lo relativo a la razón fija, el programa refuerza de manera continua al sujeto experimental, a
la vez que vamos aumentando progresivamente el número de repeticiones de la respuesta del
animal requeridas para proporcionarle el reforzador. De esta manera, observamos que, cuando
el animal se encuentra en la fase RF-6, se encuentra un poco confusa y esto hace que la pausa
sea más larga, ya que aún no ha entendido la asociación entre la respuesta objeto y el refuerzo
que se le proporciona. Sin embargo, a medida que avanza el estudio, la rata acaba
comprendiendo qué conducta es necesario que repita un número de veces determinado para
que se le proporcione el refuerzo, de manera que la tasa de respuesta se hace más estable. Este
proceso se va repitiendo en cada una de las fases del programa: las pausas eran cada vez más
largas y la carrera de razón, más rápida. Todo este proceso genera que el animal produzca un
patrón “pausa-carrera”, ya mencionado anteriormente en la fase de resultado.

Por otro lado, en cuanto al programa de razón variable, el sujeto es reforzado tras un número
de reproducciones de la conducta objeto indeterminado de forma concreta en todo el estudio.
Esto hace que se generen diferencias notables entre esta fase y la anterior. Esta diferencia reside
en que el aumento de respuestas va aumentando de forma variable, lo que hace que la tasa de
respuesta sea más elevado que en el caso de la razón fija. La explicación de esto reside en que
no existe un número fijo de respuestas que el animal debe realizar para recibir el refuerzo, por
lo que reproducirá continuamente la respuesta, ya que es la forma de asegurarse el refuerzo.
Esto genera un patrón de respuestas más estable, así como un proceso de extinción más lento,
pues el animal en este caso tiene una mayor esperanza de ser reforzada y eso constituye un
motivador para seguir realizando la conducta objeto, que es presionar la palanca.
7. REFERENCIAS
Domjan, M. (2010) Principios de aprendizaje y conducta (6º edición). “Programas simples de
reforzamiento intermitente: Programas de razón” (Pp. 187-191).

También podría gustarte