Está en la página 1de 4

Aprendizaje_Tema_6

▼ INTRODUCCIÓN
• Un programa de reforzamiento determina cómo y cuándo una respuesta irá
seguida de un reforzador
• La investigación se ha interesado en el mantenimiento de la conducta (no cómo
se adquiere)
▼ PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE
▼ Programas de razón
• Reforzamiento continuo (RFC)
▼ Reforzamiento parcial o intermitente
▼ Razón fija (RF)
• Hay una relación fija entre el número de respuestas y el de
reforzadores que consigue
▼ Tasa constante y alta , aunque puede tardar un tiempo antes de
comenzar a responder
• Pausa poreforzamiento y carrera de la razón
• Si la razón sube mucho de golpe (p.e. de RF 120 a RF 500) la
pausa posreforzamiento se alarga mucho (tensión de la razón) y
puede llevar a no responder
• La pausa posreforzamiento podría llamarse pausa pre-razón
(reticencia a comenzar el trabajo)
▼ Razón variable (RV)
• Cantidad impredecible de esfuerzo para obtener un reforzador
• Tasa estable y menos pausa posreforzamiento
▼ Programas de intervalo
▼ Intervalo fijo (IF)
• El refuerzo vendrá tras la primera respuesta que ocurra después de un
intervalo fijo de tiempo (el intervalo indica cuándo está disponible el
reforzador, no cuándo se entrega: hace falta la respuesta)
• Implica una habilidad rudimentaria para medir el tiempo
▼ Intervalo variable
• Tasa más estable
• Programas de intervalo y espera limitada (frecuentes en la vida real)
▼ Comparación de los programas de razón e intervalo
• Activan diferentes sistemas neuroquímicos en el cerebro
▼ Diferencias en las tasas de respuestas
▼ Reynolds: dos programas RV e IV acoplado
• Las palomas en RV respondieron con una tasa mayor (figura 6.3)
• Raia... Resultados similares con sujetos universitarios jugando a un
videojuego
▼ Reforzamiento diferencial del tiempo interrespuesta
▼ ¿Por qué la tasa en los programas R es mayor que en I?
• El tiempo interrespuesta (TIR) es mayor en los I. En R se refuerzan los
TIR cortos
▼ Programas de reforzamiento de tasas de respuesta
▼ Reforzamiento diferencial de tasas altas (RDA)
• Sólo se refuerza una respuesta si ocurre antes de que haya pasado cierto
tiempo tras la respuesta anterior
▼ Reforzamiento diferencial de tasas bajas (RDB)
• Sólo se refuerza una respuesta si ocurre después de que haya pasado
cierto tiempo tras la respuesta anterior
▼ CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES
• ¿Qué es un programa concurrente? elección entre dos o más programas
▼ Medida de la conducta de elección
• Tasa relativa de respuesta de cada alternativa: RA/(RA+RB)
• Tasa relativa de reforzamiento de la respuesta: ra/(ra+rb)
▼ Ley de igualación
▼ Conceptos
• Las tasas relativas de respuesta se igualan con las tasas relativas de
reforzamiento
• Siempre hablamos de programas de intervalo: en los de razón, se escoge
siempre el mejor programa
• RA/(RA+RB) = ra/(ra+rb)
• RA/RB=ra/rb
▼ Infraigualación, supraigualación y sesgo
• La ley de igualación no es exacta
▼ Forma generalizada de la ley de igualación (Baum, 1974): RA/RB =
b(ra/rb)s
▼ s = sensibilizacióncon
• igualación perfecta: s es igual a 1
• Infraigualación: s es menor que 1: sensibilidad reducida a la tasa de
reforzamiento (se responde menos a A de lo que se debería)
• Supraigualación: s es mayor que 1(se responde más a A de lo que
se debería)
• Suele darse más la infraigualación que la supraigualación
• Está influido por muchas variables: especie animal, esfuerzo para
cambiar de alternativa...
• b = sesgo (preferencia por una alternativa sin motivo aparente)
▼ Valor del reforzador
• Demora, cantidad, palatabilidad (sabrosos) cuentan a la hora de elegir
alternativas
▼ Programas simples de reforzamiento
▼ Incluso las situaciones únicas pueden suponer una elección
• RA = k ra/(ra+ro) ro son los reforzadores asociados a las otras
respuestas
• k = Ra+Ro
• Cuando aumenta ro, disminuye RA
▼ Mecanismos de la ley de igualación
• Es una ley descriptiva, no explicativa. Lo siguiente son explicaciones
▼ Igualación y maximización de las tasas de reforzamiento
▼ Maximización molecular
• Los organismos eligen la alternativa con más probabilidades de ser
reforzada en ese momento
▼ Maximización molar
• Los organismos distribuyen sus respuestas para maximizar el
reforzamiento a la larga
• Se ha usado para explicar la elección de programas de razón (donde
no se suele cambiar de alternativa)
▼ Dificultades de esta explicación
• Programas IV-IV; no explica por qué se sigue un patrón de
respuesta (cercano a la ley de igualación) y no otro igualmente
efectivo
• Programas IV-RV: Los animales prefieren RV pero no tanto como
predice la explicación molar
▼ Mejoramiento
• Supone que los organismos hacen lo que creen mejor basándose en su
pasado reciente
• Cambian de alternativa para mejorar la tasa local de reforzamiento que
están recibiendo
▼ Tasa local: ra / tiempo dedicado a la opción A
• Siempre es mayor que la tasa global
• Ejemplo: IV1 - IV3 (en una hora, dedicando 30 min a cada una)
▼ ELECCIÓN CON COMPROMISO
▼ Programas concurrentes encadenados
▼ Dos fases
• Eslabón de elección
• Eslabón terminal (aquí está la oportunidad para el reforzamiento) y estará
comprometido en la opción elegida durante un tiempo (elección con
compromiso)
• Los sujetos prefieren la alternativa de razón variable
• El estímulo del eslabón terminal (la tecla, p.e.) se convierte en reforzador
condicionado con respecto a la elección inicial
▼ Estudios de autocontrol
▼ Experimento de Rachlin y Green (cuadro 6.7)
• Más reforzador sin demora o más reforzador demorado 4 segundos
▼ Dos procedimientos
▼ De elección directa
• las palomas pueden elegir las dos opciones
• no mostraban autocontrol
▼ Concurrente encadenado
• se demora un poco el componente terminal del programa desde que
las palomas eligen inicialmente
• Mostraban más autocontrol (elegían la recompensa grande
demorada)
▼ Explicaciones del autocontrol
▼ Función descontadora del valor (o función del decaimiento hiperbólico)
• V = M / (1 + KD) M es magnitud y D demora; K es la constante de
decaimiento
• Figura 6.8
▼ Función descontadora y adicción a las drogas
• Cuanto más acusada es la función descontadora de la demora para una
persona, menos autocontrol tendrá
• El abuso de drogas refleja elecciones implusivas: se descuenta el valor o
amenaza de las consecuencias a largo plazo
▼ Experimento: ¿cuánto valdrían 1000€ dentro de x tiempo?
• La función descontadora era más intensa para los adictos a la heroína
▼ ¿Puede entrenarse el autocontrol?
▼ Experimento: tres sesiones con niños a los que se les dan premios por
resolver problemas
• dar recompensas demoradas aumentó la preferencia por éstas en un
postest

También podría gustarte