Está en la página 1de 4

Programas de reforzamiento

Un programa de reforzamiento no es más que un procedimiento reglado a


través del cual es posible lograr el aprendizaje e incremento de la
probabilidad de realizar una conducta determinada en base a la asociación
de la realización de dicha conducta con una consecuencia vivida como
positiva.
Dicha consecuencia, la cual es algún tipo de estimulación que nos resulta
apetecible (y que puede o puede no ser una recompensa física), recibe el
nombre de reforzador, al permitir su presencia fomentar e incrementar la
realización de la conducta: la refuerza.

Programas simples de reforzamiento intermitente


Los programas simples son: Razón fija; Razón variable; Intervalo fijo;
y Intervalo variable.
Los programas de reforzamiento de tasas de respuesta son: RDA
(reforzamiento diferencial tasas altas) y RDB (reforzamiento diferencial
tasas bajas).
Hasta aquí incluyen una única respuesta y el reforzamiento de esa respuesta
no proporcionan una visión completa de la conducta.
Para el análisis de la conducta de elección se utilizan programas
concurrentes. En tanto que para la elección con compromiso se usan
programas concurrentes encadenados.
Un programa de reforzamiento es un programa o regla que determina cómo
y cuándo la ocurrencia de una respuesta irá seguida de un reforzador. Estos
programas se investigan normalmente en cajas de Skinner. Estudian muy
bien los factores que controlan el mantenimiento de la conducta y su
realización continuada. Zeiler denominó a estos programas “El gigante
durmiente” del análisis de la conducta.
Programas de razón de intervalo
El reforzamiento depende sólo del número de respuestas que el organismo
realiza. Se cuenta en número de respuestas ocurridas y entregar el
reforzador cada vez que se alcance el número requerido.
El reforzamiento continuo (RFC) sólo sucede en el laboratorio.
En el reforzamiento parcial o intermitente las respuestas se refuerzan sólo
alguna vez.
Razón fija: predictible (número predecible de respuestas para cada
refuerzo).
Cuando cada 10 respuestas “apretar una palanca” por cada reforzador RF
10. (pagar por el número de piezas que montan), etc..Es decir, un programa
de reforzamiento continuo es también un programa de razón fija. Es un
programa de reforzamiento continuo RFC (razón fija continua). Los
organismos sueles responder a una tasa constante, pero moderada, sólo se
dan pausas breves e impredecibles (una paloma, al principio picoteará más
para conseguir comida y luego lo hará más lentamente a medida que sacie
el apetito). Se da una tasa constante y alta una vez que la conducta se ha
iniciado, pero se puede tardar un tiempo antes de comenzar. Esta
característica de la respuesta se puede observar en un registro acumulativo
de la conducta: representa la forma de repetirse una respuesta a lo largo del
tiempo (número respuestas totales o acumuladas en un momento
determinado de tiempo). La pendiente de la linea trazada por este registro
representa la tasa de respuesta del sujeto. La tasa 0 de respuesta que se
observa justo después del reforzamiento se llama pausa posreforzamiento.
La longitud de esta pausa está controlada por el requerimiento de la razón
subsiguiente, por eso de llama también pausa pre-razón.
La carrera de la razón: es la tasa de respuesta alta y estable que completa
cada requerimiento de la razón. Si el requerimiento de la razón se
incremente un poco (de RF 120 a RF 150), la tasa de respuesta puede
permanecer igual durante la carrera de razón, Con aumentos considerables
ocurren pausas posreforzamiento más largas. Este efecto se llama tensión
de la razón por eso no hay que aumentar la razón requerida demasiado
rápido, puede desistir por completo.
En un programa intermitente de razón fija se da un patrón de respuestas
muy diferentes. No es probable pausas en medio de la acción de marcar un
número de teléfono.
Razón variable: impredecible mediante la variación del número de
respuestas requerido para el reforzamiento de una ocasión a la siguiente.
Sigue siendo de “razón” porque el reforzamiento depende del número de
respuestas que realiza el organismo. Este RV (aquí se utiliza el número
medio (la media) de respuestas requerido, al principio 13, luego 7, etc... por
eso RV 10). Como es impredecible las pausas son menos probables con
esos programas RV (hay una tasa claramente estable). Se pueden dar
pausas post reforzamiento pero son menos intensas.

Programas de reforzamientos Fijos


Los programas de reforzamiento fijo son aquellos en los que aunque el
sujeto no obtiene reforzador cada vez que hace la conducta, existe un
patrón respecto a cuándo va a obtenerse: la llegada del reforzador se da
siempre cuando se cumple X requisito.
En un programa de razón fija el número de respuestas requerido para que se
administre el reforzador es siempre el mismo, siempre se tiene que dar el
mismo número de respuestas para conseguir cada reforzador. Se
abrevia RF seguida de un número que indica el valor del número de
respuestas requerida, por ejemplo RF-50. El programa RF-1 sería lo que
antes hemos denominado reforzamiento continuo, puesto que sería
reforzada cada respuesta.

 Programas de reforzamiento variable


Los programas de reforzamiento variable son aquellos en los que el sujeto
no obtiene reforzador cada vez que hace la conducta sino que ello ocurre en
algunas ocasiones, y no existe un patrón preestablecido para que se
presente el reforzador: aunque está sujeto a la ocurrencia de la conducta,
puede aparecer de maneras muy diferentes y de manera aleatoria.
Un programa de razón variable requiere en cambio un número de
respuestas que varía de una ocasión a la siguiente, de manera irregular,
alrededor de un número promedio de respuestas por cada reforzador. Se
abrevia RV, de manera que en un programa RV-100 se conseguirá el
reforzador si en promedio se han emitido cien respuestas, en unas
ocasiones más y en otras menos, teniendo 100 como valor medio.

Programa mixto 
En un programa mixto se presentan dos o más programas básicos
alternándose al azar. El cambio de uno a otro de los programas es
independiente de la conducta del sujeto, depende de la duración de un
tiempo establecido con anterioridad por el experimentador. Si por ejemplo
cada componente dura diez minutos, durante los diez primeros puede estar
en funcionamiento un programa IF-60seg (le damos comida cuando dé una
respuesta después de transcurridos 60 seg desde el anterior reforzador)- Los
siguientes diez minutos va a funcionar el segundo programa, por ejemplo
RF-50 (reforzaremos cada vez que emita 50 respuestas consecutivas) y al
terminar sus 10 minutos, volverá a empezar el programa IF 60 seg... así
sucesivamente hasta un número de veces determinado también previamente
por el experimentador.