Está en la página 1de 4

SESIÓN 3: PROGRAMAS DE REFORZAMIENTO

PROGRAMAS DE REFORZAMIENTO
Los programas de reforzamiento son reglas que indican el momento y la forma en que la
aparición de la respuesta va a ir seguida de un reforzador. Estos programas influyen en
distintos aspectos del aprendizaje, como la rapidez con la que se aprende inicialmente la
respuesta, la frecuencia con la que se ejecuta la respuesta aprendida, la frecuencia con la que
se hacen las pausas después de los reforzamientos, o el tiempo que se sigue ejecutando la
respuesta una vez que el refuerzo deja de ser predecible o se suspende.
Existen dos tipos básicos de reforzamiento: el reforzamiento continuo y el reforzamiento
intermitente.

1. Reforzamiento Continuo
Reforzamos cada respuesta. Una operante que alcanza su tasa máxima, es mantenida en
toda su fuerza sólo si se la continúa reforzando. Las operantes obtenidas por este tipo de
reforzamiento se extinguen rápidamente cuando se descontinúa el reforzamiento. Como en
el caso de una paloma que recibe comida cada vez que picotea una tecla. Este tipo de
reforzamiento parece ser el modo más eficaz para condicionar inicialmente la conducta. Sin
embargo, cuando el refuerzo cesa (por ejemplo, cuando desconectamos la entrega de
alimento) la extinción también es rápida.

2. Reforzamiento Intermitente
La operante es reforzada ocasionalmente. Las operantes obtenidas mediante este tipo de
reforzamiento tardan mucho más en extinguirse. Como en el caso de una persona que
juega a las máquinas y recibe el refuerzo o premio cada varias jugadas. Este tipo de
programa produce un patrón más persistente de respuestas que un programa continuo
cuando el reforzamiento se vuelve impredecible o cesa. Una combinación de reforzamiento
intermitente y de refuerzo continuo es muy eficaz cuando se trata de enseñar a los sujetos
mediante condicionamiento operante: al principio se utiliza un reforzamiento continuo,
para que se adquiera la respuesta, y luego se pasa a un reforzamiento intermitente, para
que sea más difícil que se extinga.
El reforzamiento intermitente da lugar a los programas de reforzamiento, que pueden ser
de dos tipos: de razón (en función del número de respuestas) y de intervalo (en función del
tiempo). A su vez, cada uno de ellos admite dos tipos de administración: fija o variable.

2.1. Reforzamiento de razón:


Sólo reforzamos después de un número de respuestas. Se utiliza un contador.
Programa de Razón Fija: El número de respuestas requeridas para el reforzamiento
deben ser constante. Ejm: que paguen por la venta de cada 5 celulares. Cuando se
gráfica su curva muestra frecuentes pausas.

Programa de Razón Variable: El número de respuestas requeridas para el


reforzamiento deben ser variable. Nos proporciona una alta tasa de respuestas sin
pausas apreciables, su curva es más regular Ejm: juegos de azar (por eso son tan
adictivos).

2.2. Reforzamiento de intervalo:


La respuesta es reforzada después de cierto tiempo. Se utiliza un tomador de tiempo
(cronómetro). Generalmente producen menor tasa que los de razón.
Programa de intervalo Fijo: Se refuerza después que haya pasado un intervalo fijo de
tiempo a partir del último reforzamiento. Ocasiona que no haya respuestas
inmediatamente después del reforzamiento, pero la tasa aumenta gradualmente y
alcanza su máximo inmediatamente antes del próximo reforzamiento. Cuando se
gráfica no es constante.

Programa de intervalo Variable: Una respuesta es reforzada después de un intervalo


de tiempo que puede variar, por ejemplo, desde segundos, hasta horas, a partir del
último reforzamiento. La tasa es relativamente constante.

Referencias:
Domjan, M. (2007). Principios de Aprendizaje y Conducta. México: Editorial Thomson.
Schunk, D. (1997). Teorías del aprendizaje. México: Editorial Prentice Hall.
EJERCICIOS DE PROGRAMAS DE REFORZAMIENTO

1. Una respuesta se mantiene mediante reforzamiento continuo cuando _toda_ respuesta es


reforzada.
2. La disponibilidad del reforzamiento depende del transcurso del tiempo cuando se trata de
programas de intervalo.
3. La disponibilidad del reforzamiento depende del número de respuestas cuando se trata de
programas de razón.
4. Generalmente, los programas de intervalo producen una tasa menor que los de razón.
5. La extinción más rápida ocurre después del reforzamiento continuo.
6. Un vendedor puede lograr una venta en cada 30 visitas, como promedio. Las ventas
ocurren en un programa de razón fija.
7. Los vendedores están sujetos frecuentemente a programas de razón variable porque las
ventas dependen, a menudo, del número de visitas realizadas y porque no es posible
predecir que una visita determinada resultara en una venta.
8. La legendaria perseverancia de los vendedores puede ilustrar la resistencia a la extinción
creada por los programas de reforzamiento intermitente.
9. Jugar de apuesta llevado a extremos patológicos ilustra la alta tasa de respuesta producida
por programas de reforzamiento intermitente.
10.Una tasa de respuesta moderada sin pausas largas se produce mediante programas de
intervalo fijo.
11. Una pausa larga después del reforzamiento, seguida por una aceleración gradual, se
produce mediante un programa de razón fija.
12. El observador del radar que busca aviones no identificados debe producir “conducta de
mirar”. Esta conducta es reforzada por mirar los aviones. Dado que los aviones aparecen
irregularmente en el tiempo, su conducta de mirar está bajo un programa de razón
variable.
13. El observador del radar dejara de “mirar” si el tiempo promedio entre la aparición de los
aviones es demasiado largo; o sea, su conducta de mirar se extingue si no es reforzada
ocasionalmente.
14. En un programa de intervalo variable, a mayor tiempo `promedio del intervalo, menor tasa
de respuesta. Por ello, el observador de radar en un área con muchos aviones mostrará una
tasa de “mirar” más alto que otro en un área con pocos aviones.
15.Cuando el marido a veces es indiferente y a veces atento, la esposa puede continuar
mostrándose cariñosa o apasionada durante largos periodos aun cuando el permanezca
indiferente. Dado que la conducta de ella ha sido mantenida mediante reforzamiento
intermitente, muestra gran interés a su indiferencia
16. Cuando un marido que siempre ha respondido a las muestras de cariño de su esposa, de
repente se vuelve indiferente, los esfuerzos cariñosos de la esposa pueden extinguirse más
rápidamente que si él hubiera sido ocasionalmente indiferente en el pasado.
17.Cuando un encendedor de cigarrillos que ha funcionado muy consistentemente de repente
falla, a los pocos intentos cesamos de tratar de encenderlo. Esto es un ejemplo de conducta
rápida de una respuesta mantenida mediante el reforzamiento continuo.
18. Cuando el encendedor de cigarrillos enciende después de cuatro o cinco intentos como
promedio, la conducta de tratar de encender está siendo reforzada en un programa de
razón variable.
19. Para generar conductas persistentes y estables cambiamos el reforzamiento continuo por
el reforzamiento intermitente incrementado gradualmente el tamaño de intervalo o de la
razón.
20. La conducta producida por el reforzamiento intermitente es muy persistente, o sea, genera
considerable llegar a la extinción.

También podría gustarte