Está en la página 1de 4

CONCEPTOS CLAVE TEMA 5

Reforzamiento continuo: te doy el premio cada vez que ejecutas la respuesta. Es menos resistente a la extinción por
el efecto de sobreentrenamiento: como te dan el reforzador cada vez, te das cuenta enseguida cuando empieza la
extinción porque dejan de dártelo.

Reforzamiento parcial o intermitente: no se da el permio en todas las respuestas. puede ser:

PROGRAMAS DE RAZON: el reforzador se da despues de un determinado número de respuestas. Cuanto antes


cumplas con el requisito de razón que te piden, antes consigues el premio.

Razon fija RF: siempre es el mismo número de Razon variable RV: el número que te piden varía en
respuestas torno a un promedio

PROGRAMAS DE INTERVALO: el reforzador se da en la primera respuesta que hay despues de un intervalo de


tiempo determinado. Antes de ese tiempo, el sujeto puede responder si quiere, pero el premio aún no está
disponible asi que no consigue nada

Intervalo fijo IF: siempre es el mismo tiempo el que Intervalo variable IV: el tiempo que pasa varía en torno
tiene que pasar a un promedio.
Los programas parciales son los más resistentes a la extinción, sigues haciendo las respuestas más tiempo, por si en
la siguiente te toca el premio. (como en las tragaperras)
Ejecución típica en los programas parciales:

RV: tasas de respuesta altas y estables. En los programas VARIABLES las tasas de respuesta son
IV: tasas de respuesta estables, aunque más bajas que muy estables, como cada vez te piden un requisito
en RV diferente, mantienes un ritmo constante.

RF: pausa postreforzamiento, y después un aumento Los programas fijos se caracterizan por una pausa
alto y estable de las respuestas (carrera de razón)postreforzamiento: el animal para justo despues de
conseguir el premio. Cuanto mayor es el requisito que
IF: pausa postreforzamiento y despues un aumento
piden, mayor es la pausa. Además viene determinada
progresivo de la tasa de respuesta según avanza el
por el programa que vás a empezar, no por el que has
tiempo (festoneado)
terminado (es como si descansas para prepararte)

 Siempre hay más respuestas en programas de razón que de intervalo.


 Eso pasa porque en los programas de razón la tasa de reforzamiento (los premios que consigues) depende
de tu tasa de respuesta (del nº de respuestas que das)
 Si el requisito de la razón es muy alto, puede que al bicho no le compense contestar. Si te pido trabajar
mucho y te pago todo, pues no contestas. Entonces hay que bajar el requisito o subir el premio. A esto se le
llama tensión de la razón.
 En programas de intervalo, el tiempo comienza a contar para el siguiente desde el momento en que
consigues el reforzador
 En los programas de intervalo, la tasa de respuesta no influye directamente en la tasa de reforzamiento. Por
muchas respuestas que tu des, hasta que no pase el tiempo que te marcan no hay premio.

TER es el tiempo entre respuestas. Puede ser largo, si las doy separadas, o corto si las doy seguidas.
Si quiero que tu des pocas respuestas puedo marcarte un tiempo determiando y reforzar solo las respuestas que
estén por encima de ese limíte, así consigo que las separes. A esto se le llama reforzamiento tasas bajas (RDB)
En cambio si quiero que des muchas respuestas, marco el tiempo y refuerzo solo las respuestas que se den antes de
ese limite, asi consigo que lo hagas seguido. Se llama reforzamiento tasas altas (RDA).
TER LARGO = RDB = pocas repuestas = relacionado con programas IV
TER CORTO = RDA = muchas respuestas = relacionado con programas de razón (sobre todo RV)
PROGRAMAS COMPUESTOS: pueden ser secuenciales o simultáneos.

PROGRAMAS SECUENCIALES: primero uno, luego otro


MIXTO: dos o más programas básicos que se alternan, al azar, cada cierto tiempo que fijamos de antemano. Es
independiente de la conducta del sujeto: si termina en ese tiempo los programas conseguirá premio, si no los
termina pues no consigue. Sea como sea, cuando llega el tiempo determinado el programa cambio.
MULTIPLE: es exactamente igual que el mixto, pero con un Ed (estimulo discriminativo) que anuncia el cambio de
programa. Habitualmente es una luz que se enciende y mantiene encendida en el 2º programa.
(el mixto y el múltiple también se llaman programas alternantes)
TÁNDEM: Aquí los programas siempre llevan el mismo orden, para empezar el 2º el sujeto tiene que terminar el 1º.
Es como un juego de pantallas, acabar la primera te da la opción de la segunda y asi todos los que sean. El
reforzador se consigue cuando se cumplen todos los programas, sean los que sean.
ENCADENADO: igual que el tandem pero con un Ed que anuncia el cambio de programa.

Esquema secuenciales SIN ED CON ED


ALTERNANTES MIXTO MULTIPLE
SECUENCIALES TANDEM ENCADENADO

PROGRAMAS SIMULTÁNEOS: a la vez


Programas concurrentes: tienen dos programas de reforzamiento a la vez funcionando en dos palancas, se puede
cambiar de uno a otro sin problema. El sujeto es el que elige cómo repartir las respuestas (se explica con conductas
de elección como la ley de igualación
Programas combinados: aquí hay un programa de razón y otro de intervalo, pueden funcionar de 3 formas:
 Programa alternativo: se refuerza cada vez que se cumple con un programa o con el otro.
 Programa conjuntivo: se refuerza cada vez que se cumple con ambos programas, da igual lo que tardes. Si
acabas uno primero, tienes que cumplir también con el otro para conseguir el premio.
 Programa entrelazado: un programa viene determinado por otro “tienes que acabar la razón en un tiempo
determinado” por ejemplo, 20 respuestas en 30 segundos.

CONDUCTA DE ELECCIÓN
LEY DE IGUALACIÓN
(ATENCIÓN: estos con conceptos clave para recordad a la hora de resolver las preguntas. Si no has estudiado la ley
de igualación, lo más probable es que todo esto te suene a chino. Aquí no hay explicaciones, pero hay otro pdf
maravilloso que explica todo esto. Cuando ya se ha estudiado esto son solo cosillas trampa que recordar)
La ley de igualación dice que se iguala la tasa relativa de respuestas (es decir, el porcentaje de respuestas que das)
en función de la tasa relativa de reforzamiento (es decir, el porcentaje de reforzadores que te da cada una) de cada
palanca. Si una palanca te da el 0’70 (70%) del premio, quiere decir que la otra te da el 0’30 (30%). Según la ley de
igualación, a la primera palanca le responderé un 0’70 y a la segunda un 0’30

En programas de razon, solo nos quedamos con la palanca más beneficiosa. La tasa de respuestas sería 1 (el 100%)
en esa, y 0 en la perjudicial.
En programas de intervalo es realmente dónde repartimos las respuestas. Si no nos dan la tasa de reforzamiento:
Si los intervalos son uno el triple del otro (30-90; 20-60; 5-15 etc.) las tasas son 0’75 (el más beneficioso) y 0’25.
Como el beneficioso me da el triple de reforzadores, se espera que le de el triple de respuestas que al otro.
Si los intervalos son uno el doble del otro (30-60;10-20; 5-10 etc.) las tasas son 0’66 (el más beneficioso) y 0’33.
Como el beneficioso me da el doble de reforzadores, se espera que le de el doble de respuestas que al otro.
Estos ejemplos, dónde las tasas de respuesta son iguales que las de reforzamiento, son de igualación
Se puede dar sobreigualación si se responde más tasa de respuesta que de reforamiento en la beneficiosa.
Se puede dar infraigualación si se responde menos tasa de respuesta que de reforamiento en la beneficiosa.
TRAMPA: en los datos del enunciado, pueden darnos la menos beneficiosa!!! Cuidado!!!!
Ejemplo:

Palanca A: IV30 Palanca B: IV90


Tasas de reforzamiento 0’75 0’25

Tasas de respuesta si hay IGUALACIÓN 0’75 0’25

Tasas de respuesta si hay SOBREIGUALACIÓN 0,85 0,15

Tasas de respuesta si hay INFRAIGUALACIÓN 0,60 0,40

Dar más respuestas a una palanca es necesariamente dar menos a otra, para saber cómo se llama lo que pasa
igualmente solo nos tenemos que fijar en la beneficiosa.
El término igualación temporal se refiere a lo mismo, pero con el concepto de que igualas el tiempo que pasas en
una de las opciones a los premios que consigues de ellas. Funciona igual, cuánta más tasa de reforzamiento más
tiempo dedicaras.

IMPULSIVIDAD Y AUTOCONTROL:
El comportamiento impulsivo es la preferencia por la elección del premio pequeño y inmediato. Es el
comportamiento típico en elecciones directas.
El comportamiento autocontrolado es la preferencia por la elección del premio grande y demorado. Es tipico en
elecciones de programas encadenados, dónde para conseguir ambos premios hay que esperar un poco. “ya que voy
a esperar, al menos es por el premio grande”
El valor del reforzador, viene determinado tanto por su magnitud como por su demora. Si aumenta la magnitud
aumenta su valor; pero si aumenta la demora disminuye su valor.
En un caso de programa concurrente en el que lo beneficioso es en principio una elección impulsiva, el añadir una
demora constante a la entrega de ambos reforzadores, hace que el comportamiento impulsivo se vuelva
autocontrolado.
NATURALEZA DE ASOCIACIÓN INSTRUMENTAL:
HULL Y THORNDIKE: son defensores del esquema E-R, en el que el estímulo ambiental elicita la respuesta.
Hull introduce el concepto de motivación, imprescindible para que se ejecute una conducta. La motivación viene
dada por una necesidad biológica, y dicha necesidad se verá reducida al conseguir el reforzador
TOLMAN: Defiende la asociación E-E. Lo relevante es que distingue aprendizaje de ejecución: tu puedes saber algo
pero no querer o tener que hacerlo. Los reforzadores no son necesarios para el aprendizaje pero si para la ejecución.
SKINNER: Le da un poco igual la asociación que se de, lo que importa es que el estímulo ambiental es una señal para
hacer la conducta, siendo moduladores entre respuestas y reforzadores.

TEORÍA DE PROBABILIDAD DIFERENCIAL DE PREMACK:


Una actividad favorita puede reforzar a otra menos favorita. ¿cuál es la favorita? La que tiene más probabilidad de
ocurrencia (vamos, la que más haces libremente). Para que una actividad sirva de reforzador:
 Tiene que ser la favorita (puede que cambie de una a otra, usamos la favorita en cada momento)
 Debe estar restringida

TEORÍA DE LA PRIVACIÓN DE RESPUESTA


Para que una actividad refuerce a otra basta con que esté restringida, sea o no la favorita. El punto de bienestar es
el nivel al que en libertad haces una actividad, si yo te lo restrinjo por debajo de ese nivel, tu vas a esforzarte para
recuperarlo.
En la hipotesis de privación de respuesta la relación entre la tasa de respuesta y la tasa de reforzamiento tiene forma
bitónica, de U invertida.

También podría gustarte