Tema 6

TEMA 6.
Programas de reforzamiento y conducta instrumental
¿Cada vez que ocurre la respuesta, el resultado es un reforzador?

En la vida real, esta contingencia no es tan perfecta.
- NO siempre se consigue una alta calificación en un examen a pesar de haber
estudiado mucho.
- NO siempre se puede tomar el autobús cada vez que se llega a la parada.
- El hecho de invitar a alguien a cenar NO siempre resulta agradable.
¿Cómo se controla la ocurrencia de una respuesta?

Con programas de reforzamiento. Un programa de reforzamiento es una regla que
determina cómo y cuándo la ocurrencia de una respuesta irá seguida de un reforzador.
La entrega del reforzador podrá depender de:
- Cierto número de respuestas.
- El paso del tiempo.
- La presencia de ciertos estímulos.
- La ocurrencia de otras respuestas del animal.
- Cualquier otra circunstancia.
Los programas de reforzamiento han demostrado su importancia entre los empresarios que
tienen que asegurar la continuidad del trabajo de sus empleados una vez que éstos lo han
aprendido. Incluso los profesores a menudo están interesados en alentar la ocurrencia de
respuestas ya aprendidas más que en enseñar otras nuevas. Muchos estudiantes que
fracasan en la escuela saben estudiar pero simplemente no lo hacen. Los programas de
reforzamiento pueden utilizarse para motivar que la conducta de estudio se dé de forma
más frecuente.
1.Programas simples de reforzamiento intermitente

1.1. Programas de razón
La característica definitoria de un programa de razón es que el reforzamiento depende solo
del número de respuestas que el organismo realiza. Este programa solo requiere contar el
número de respuestas que han ocurrido y entregar el reforzador cada vez que se alcance el
número requerido. Si este número es uno, cada ocurrencia de la respuesta instrumental
provocará la entrega del reforzador. Este tipo de programa se denomina reforzamiento
continuo (RFC).
El RFC no suele suceder fuera del laboratorio porque el mundo no es perfecto. Presionar
el botón de un ascensor normalmente lo activa, pero los ascensores a veces no funcionan,
por lo que no sucede nada cuando se presiona el botón. Otras formas de conducta
instrumental también pueden producir reforzamiento ocasional. Las situaciones en las que
la respuesta se refuerza solo alguna vez involucran un reforzamiento parcial o
intermitente.
➢ Razón fija (RF10): se dan siempre que que es necesario un número fijo de
respuestas para conseguir el reforzamiento.
- A una rata se le entrega un reforzador después de diez respuestas de presión de
palanca.
- Una persona que siempre tiene que visitar el mismo número de casas para
completar su ruta está trabajando mediante un programa de razón fija.
-Comprobar la asistencia a clase leyendo una lista.
Un programa de reforzamiento continuo constituye también un programa de razón fija.
Características de todos los programas de reforzamiento:

Tasas de respuestas:
- Registro acumulativo: proporciona una representación visual completa de cuándo y
con qué frecuencia responde el sujeto durante la sesión.
- Pausa posreforzamiento: es la tasa cero que se observa justo después del
reforzamiento.
- Carrera de razón: es la tasa de respuesta alta y estable que completa cada
requerimiento de la razón. Es decir, cuando se están dando las respuestas que
queremos se llama carrera de razón.
- Tensión de la razón: esto es, si el requerimiento de la razón sufre un incremento
súbito y significativo (RF 120 a RF 500), es probable que el animal realice una pausa
periódica cada vez que complete la razón requerida. En casos extremos, la tensión
de la razón puede ser tan grande que el animal deje completamente de responder
➢ Razón variable (RV): esto es un procedimiento en el que se necesita un número de

respuestas distinto para entregar la recompensa.
-Investigadores pueden entrenar a una paloma para conseguir la primera
recompensa con 10 respuestas, luego con 13 luego con 7…
- Una limpiadora sabe que en las habitaciones se necesitará limpieza pero no sabe
exactamente cuánta.
- Quienes juegan a las máquinas tragaperras nunca saben cuántas jugadas
producirán la combinación ganadora.
*tabla*
Comparación entre RF y RV:
Razón Pausas posreforzamiento Tasa de respuestas
RF Largas y prominentes antes Patrón pausa-carrera.

del reforzador Mayores tasas de
respuestas antes del
siguiente reforzador
RV Menos probables Menos estable
1.2. Programas de intervalo

En los programas de razón, el reforzamiento depende sólo del número de respuestas que el
organismo ha realizado. En los programas de intervalo, las respuestas son reforzadas solo
si ocurren cuando ha transcurrido una cierta cantidad de tiempo.
Fijo (IF) Variable (IV)

Una respuesta se refuerza solo si se da Las respuestas se refuerzan si se dan tras
después de que haya transcurrido un tiempo haber transcurrido un intervalo variable.
desde la última entrega del reforzador.
IF4 min
-Lavadora: una vez que pones un programa, -Mecánico: no sabe lo que se va a encontrar
habrá que esperar X tiempo para poder obtener cuando le dan un coche, es decir no sabe
la ropa, pero no solo esperar, sino que cuando cuánto tiempo va a emplear.
pasa ese tiempo realizar una respuesta que -Panadería: no sabe cuánto tiempo va a
sería abrir la puerta. estar detrás del mostrador, depende del
-Programación de exámenes: como sabemos tiempo que estén allí los clientes.
que los exámenes son al final, no empezamos a
estudiar hasta que se acerca la fecha.
Respuestas altas antes del siguiente reforzador, Tasas de respuesta constantes y estables
y pautas tras el reforzador (festón del intervalo
fijo) TIEMPO
Programas de intervalo: depende del tiempo (no de las respuestas)
IF-IV
Reforzador está disponible hasta que se realice la respuesta requerida
Espera limitada
El reforzador no está disponible de manera ilimitada.
Ej: en un restaurante sirven comida de dos a cuatro, si es más tarde ya sabemos que no
servirán comida.
Resumen:
*tabla*
1.3. Programas de reforzamiento de tasas de respuesta:

A pesar de que los programas de razón producen tasas de respuesta mayores que los
programas de intervalo comparables, ni uno ni otro requieren una tasa específica de
respuesta para conseguir el reforzamiento. Por el contrario los programas de tasas de
respuesta requiere una tasa particular de respuesta (una cierta cantidad de respuestas
en un periodo de tiempo)
- Reforzamiento diferencial de tasas altas (RDA): Una respuesta se refuerza sólo si
ocurre antes de un tiempo determinado desde la respuesta previa.
- Reforzamiento diferencial de tasas bajas (RDB): Una respuesta se refuerza sólo
si ocurre después de un tiempo determinado desde la respuesta previa.
ACTIVIDAD:
¿Razón o intervalo? ¿Fijo o variable?
1.Imagina que eres un directivo de una empresa. ¿Qué programa de reforzamiento
emplearías para que tus empleados trabajaran más?
Razón fija. Lo mejor es que haya un número de respuestas fijas
2. Imagina que eres un profesor y quieres que tus alumnos estudien de forma
constante (sin pausas) durante todo el curso. ¿Qué programa de reforzamiento
emplearías para poner los exámenes?
Intérvalo variable. Por ejemplo, examenes sorpresas
Las pausas en las variables son menos comunes que en las fijas.
2.Conducta de elección: programas concurrentes

Programas de reforzamiento descritos hasta el momento, incluyen una única respuesta y el
reforzamiento de esa respuesta. Los organismos ocupan su tiempo en una variedad de
actividades y están continuamente eligiendo entre posibles alternativas. ¿Debo ir a módulos
o estudiar?
¿Cómo medimos la conducta de elección?

Tradicionalmente laberinto T. Las aproximaciones recientes al estudio de la conducta de
elección utilizan cajas de Skinner equipadas con dos teclas o dos palancas. Son
programas de reforzamiento diferentes que funcionan al mismo tiempo (son
concurrentes). El sujeto es libre de elegir. Este tipo de procedimiento se denomina
programa concurrente.
¿Cómo medimos la distribución de la conducta entre dos respuestas alternativas?

¿Cómo podemos medir en el laboratorio a qué tecla o palanca responde más el
animal?
*tabla*
La conducta de elección de un individuo en un programa concurrente se refleja en la

distribución de su conducta entre dos respuestas alternativas. Esto se puede medir de
varias formas.
➔ Tasa relativa de respuesta
➔ Tasa relativa de reforzamiento.
*tabla*
Si está disponible el mismo programa de intervalo variable de reforzamiento para cada
alternativa de respuesta, la paloma picotea las dos teclas con la misma frecuencia. La tasa
relativa de respuestas para los picotazos de cada lado será 0’5 y la tasa relativa de
reforzamiento para cada alternativa de respuesta será 0’5 porque el sujeto obtiene
recompensas con la misma frecuencia en cada lado. Es decir, en un programa concurrente
IV60 seg IV 60 seg, tanto la tasa relativa de respuesta como la tasa relativa de
reforzamiento para cada alternativa es 0’5.
Tasa relativa de respuesta = Tasa relativa de reforzamiento

¿Se dará también esta igualdad si las dos alternativas de respuesta no son reforzadas
de acuerdo con el mismo programa? ¿Se darán tasas similares de respuesta y
reforzamiento?
¿Se dará también esta igualdad si las dos alternativas de respuesta no son reforzadas de
acuerdo con el mismo programa? → SÍ
Ley de la igualación. Herrnstein (1961)

Realizó un estudio sobre los efectos de varios programas concurrentes IV-IV. No había
restricción, podían picotear en el lado que quisieran las palomas. Se observó que si las
palomas obtenían una proporción mayor de reforzadores en la alternativa A, realizaban de
forma correspondiente una proporción mayor de respuestas en dicha alternativa. Por tanto,
la tasa relativa de respuesta en una alternativa se iguala con la tasa relativa de
reforzamiento en esa alternativa.
En otras palabras, aunque se usen diferentes programas (A y B), las tasas relativas de
respuesta de A se igualan con las tasas relativas de reforzamiento en A.
3. Elección de compromiso
Programas concurrentes:
La característica principal es que las dos alternativas están presentes y se pueden elegir o
alternar de una a otra.
- A veces podemos ir alternando: Periódico de deportes o periodo actualidad, canal
TVE1 o canal TVE2.
- Otras, elegir una alternativa hace que la otra no esté disponible: ¿Debería de ir a la
universidad y graduarme en psicología? ¿O empezar a trabajar a tiempo completo
sin un título universitario?
¿Beneficio pequeño a corto plazo o un beneficio más demorado, pero mayor?

Para tomar la decisión necesitas considerar metas a largo plazo.
- ¿Debería de ir a la universidad y graduarme en psicología? → Trabajo mejor pagado, pero
requiere inicialmente sacrificios económicos.
- ¿o empezar a trabajar a tiempo completo sin un título universitario? → Permitiría obtener
dinero más rápido, pero a largo plazo se podría no ganar tanto.
Las elecciones de la vida a veces requieren un beneficio pequeño a corto plazo frente a un
beneficio más demorado, pero mayor.
Esto requiere autocontrol (Esperar para conseguir un beneficio mayor pero más demorado
en lugar de elegir una recompensa pequeña a corto plazo)
AUTOCONTROL:
El autocontrol es a menudo cuestión de elegir una recompensa grande demorada sobre
una recompensa pequeña inmediata. Por ejemplo, el autocontrol en la comida implica
seleccionar la recompensa grande demorada de ser delgado sobre la recompensa pequeña
inmediata de comer un trozo de tarta.
Mayor autocontrol cuando está encadenado: elegir una recompensa mayor demorada a una
menor inmediata.
Te da mayor autocontrol no tener delante el pastel, y menor autocontrol tenerlo delante.
Consideraciones sobre el autocontrol:

- Elegir una recompensa mayor demorada a una menor inmediata
- El valor de un reforzador se reduce en función de cuánto tiempo se tiene que
esperar
- Adicción a drogas y riesgo de consecuencias más negativas
- ¿Puede entrenarse el autocontrol? → Sí

Tema 6

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tema 6

Cargado por

Copyright:

Formatos disponibles

TEMA 6.

Programas de reforzamiento y conducta instrumental

¿Cada vez que ocurre la respuesta, el resultado es un reforzador?

¿Cómo se controla la ocurrencia de una respuesta?

1.Programas simples de reforzamiento intermitente

Un programa de reforzamiento continuo constituye también un programa de razón fija.

Características de todos los programas de reforzamiento:

➢ Razón variable (RV): esto es un procedimiento en el que se necesita un número de

RF Largas y prominentes antes Patrón pausa-carrera.

RV Menos probables Menos estable

1.2. Programas de intervalo

Fijo (IF) Variable (IV)

1.3. Programas de reforzamiento de tasas de respuesta:

2.Conducta de elección: programas concurrentes

¿Cómo medimos la conducta de elección?

¿Cómo medimos la distribución de la conducta entre dos respuestas alternativas?

La conducta de elección de un individuo en un programa concurrente se refleja en la

Tasa relativa de respuesta = Tasa relativa de reforzamiento

Ley de la igualación. Herrnstein (1961)

¿Beneficio pequeño a corto plazo o un beneficio más demorado, pero mayor?

Consideraciones sobre el autocontrol:

También podría gustarte