Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Fijo IF RF
Variable IV RV
1
• Razón Variable (RV): Similar al de RF, excepto que el número
específico de respuestas requeridas para obtener el reforzamiento
varía de una recompensa a otra. Un programa de RV viene definido
por el número medio de respuestas requeridas.
- Características:
1) Da lugar a una tasa media global de respuestas superior a la
de los otros programas básicos, aunque algunas veces son
comparables a los de RF.
2) La tasa de respuestas suele ser muy estable (no sabe las
respuestas que ha de dar, reduciendo así las pausas post-
reforzamiento). Ejemplo: juegos de azar.
2
1) la aceleración de la tasa es más acusada cuando reciben
entrenamiento prolongado (su impresión de la longitud del intervalo
mejora su experiencia)
2) Si reciben señales externas que les ayudan a determinar el
paso del tiempo (una luz que aumenta de intensidad a lo largo del
periodo de IF), muestran una aceleración aún más pronunciada
de la tasa durante el intervalo).
3
àProgramas de intervalo y espera limitada: En los programas normales de
intervalo, una vez que el reforzador está disponible, permanece disponible
hasta que se realice la primera respuesta, no importa cuánto tiempo lleve.
En los programas de intervalo fuera de laboratorio los reforzadores están
disponibles sólo durante periodos limitados (comida restaurante se dispone
de un tiempo límite para encargarla-espera limitada).
2) En los programas de RV: correlación directa entre la tasa de respuestas y
la tasa de reforzamientos. En los programas de IV: no existe ninguna relación
entre la tasa de respuestas y la tasa de reforzamientos (Baum 1989 explicación
molar).
posterior a la última respuesta. Fomenta la respuesta rápida (ejemplo 12
respuestas/minuto). La ejecución de este programa es más fácil que RDB.
6
àPrograma mixto: se presentan dos o más programas básicos alternándose
al azar. El cambio de uno a otro de los programas es independiente de la
conducta del sujeto en experimentación. Depende, sin embargo, de la duración
de un tiempo establecido con anterioridad (ejemplo: cada programa 10 m-
primero- IF 60-seg (bola de comida-presión palanca), segundo-RF y así
sucesivamente).
2. CONDUCTA DE ELECCIÓN
2.1.- La ley de igualación: afirma que la tasa relativa de respuesta entre dos
alternativas de respuestas concurrentes es igual a la tasa (frecuencia) relativa
de reforzamiento asociada con cada una de dichas alternativas de respuesta, y
quedó expresada matemáticamente por la Ecuación:
8
à
Nótese que
En el caso de la demora del reforzador los valores se
corresponden con la inversa del valor de la demora, pues los reforzadores son
más preferidos cuanto más inmediatos (menos demorados)
àCuando se tiene que elegir con programas de razón diferentes (un programa
concurrente RF-RF o uno RV-RV), los sujetos tienden a elegir la alternativa de
respuesta que tiene una razón más baja (maximización: elegir en exclusiva
la alternativa más favorable). Cumple la ley de igualación (el único en
programas concurrentes que la cumple).
9
2.3. Igualación temporal: también igualan el tiempo de estancia en las
alternativas de respuesta con la tasa relativa de reforzamiento en dichas
alternativas de respuesta.
- Ra y Rb tasa respuestas a y b
- Fa y Fb tasa reforzamiento a-b
- Sa y Sb sesgos alternativ. a-b
10
3) Una vez conocido el valor de los sesgos relativos, se deben variar
los factores de reforzamiento asociados con las alternativas de
respuesta (doble reforzamiento en una alternativa y comprobar si la
eligen el doble).
s > 1 (supraigualación)
s = 1 (igualación)
s < 1 (infraigualación)
11
* (R y F, respuestas y frecuencias de reforzamiento; K constante,
sesgos de las respuestas; s: exponente que regula la sensibilidad
del sujeto hacia los dos programas a y b). Es más frecuente la
infraigualación (s<1)
12
2.6. impulsividad y autocontrol: la elección con compromiso
13
- Entrenamiento en autocontrol (Rachlin y Green 1972): autocontrol con
palomas. Varios procedimientos minimizan la conducta impulsiva:1)
Utilizar una recompensa con demora señalada no se devalúa tanto como una
recompensa no señalada. 2) Desarrollar autoinstrucciones relativas a las
estrategias de respuesta. 3) Efectuar conductas de distracción durante el
periodo de demora. 4) Cambiar los valores de la demora de forma gradual. 5)
Realizar respuestas esforzadas antes de la prueba autocontrol. 6) Establecer
compromisos al comienzo de la secuencia para evitar una elección.
14
- Va (valor de un reforzador a que tuviese
una magnitud Ma y una demora Da; K
constante-tasa de descuento de la demora)
15
3. LA NATURALEZA DE LA ASOCIACIÓN EN EL APRENDIZAJE
INSTRUMENTAL
respuesta correcta)à
GE aprenden a efectuar la respuesta correcta
más rápidamente que otros animales de control que no habían tenido
la oportunidad de recorrer el laberinto en primera instancia.
El
reforzador no es necesario para el aprendizaje, pero es
imprescindible para que posteriormente se ejecute la respuesta
aprendida (estampa la conexión entre el estímulo y la respuesta, pero
la ejecución de la respuesta es provocada por la mera
presentación del estímulo ambiental antecedente (E-E).
à
Premack (1965): señaló que las respuestas que acompañan a los estímulos
reforzadores son actividades altamente probables, mientras que las actividades
instrumentales son menos probables: «Dadas dos respuestas en un
procedimiento de condicionamiento instrumental, la respuesta más
probable reforzará a la menos probable y la respuesta menos probable no
reforzará a la más probable» (Premack, 1959, 1965).
17
-Experimento cambiando las condiciones de privación: correr y beber podían
usarse indistintamente como respuestas reforzadoras e instrumentales,
dependiendo del estado de privación de agua del animal.
18
-Rata y libre acceso a dos actividades (beber botella y correr rueda): punto de
bienestar 400 lametones y 200 giros de rueda (beber sería una actividad
preferida a correr).
• Cómo sería la gráfica para los programas de RF: rata con hambre
(comida y palanca de respuestas libre accesoàconsumirá más
bolitas de comida que presionará la palanca). Punto de bienestar 100
bolitas-10 presiones.
20