Ps. Experimental S06

UPN, PASIÓN POR
TRANSFORMAR
VIDAS
PSICOLOGÍA
EXPERIMENTAL Y DEL
APRENDIZAJE
UNIDAD I:
PRINCIPIOS DE APRENDIZAJE
SESIÓN 06: PROGRAMAS DE

REFORZAMIENTO
HEBER.SEMINARIO@UPN.ED UPN.EDU.PE
U.PE
Interés
Reflexión luego de ver el vídeo
Los efectos conductuales de las drogas, las

lesiones cerebrales o las manipulaciones de
los sistemas de neurotransmisores,
frecuentemente dependen del programa de
reforzamiento que esté efectuándose
durante la prueba conductual.
Esto propicia que comprender el desempeño
del programa resulte útil para estudiar
muchos otros temas en la teoría de la
conducta y la neurociencia conductual. https://www.desdeabajo.info/ciencia-y-tecnologia/item/34676-neurociencia-ficcion.html
VIDEO INTRODUCTORIO:
https://www.youtube.com/watch?v=RjtZdtjUU8Y
OBJETIVOS DE CLASE
1. Distinguir entre programas continuos e intermitentes, simples y compuestos, y fijos y

variables.
2. Conocer los programas de reforzamiento de razón, intervalo y reforzamiento diferencial
de tasas de respuesta.
3. Conocer los patrones conductuales que generan los distintos programas de
reforzamiento.
4. Conocer los fundamentos de la ley de igualación, las variables que relaciona y cómo
predice la conducta.
5. Conocer los principales estudios sobre “autocontrol”.
6. Aplicaciones en situaciones organizacionales, educativas, clínicas.
Logro de sesión 6:
Al término de la sesión, el estudiante realiza

entrenamiento a los programas de reforzamiento de la
rata virtual Sniffy, aplicando los principios de
condicionamiento operante y teniendo en cuenta las
diferencias de los programas de reforzamiento.
Descubrimiento
PROGRAMAS DE REFORZAMIENTO
El programa de reforzamiento hace referencia a la regla que determina bajo

qué condiciones aparecerá un reforzador 4 ,5, 6, 7, 5 , 4
El P.R. puede ser “artificial”: Ej.: Si haces los ejercicios 3.2 y 6.3 del PROMEDIO 5
cuadernillo (PEC2) puedes conseguir hasta 0.5 puntos.
El P.R. puede ser “natural”: Ej.: Sólo a determinadas horas se puede
contemplar un amanecer o atardecer.
En los P.R. nos centramos en el patrón conductual estable que producen (no
RV5
tanto el proceso de adquisición)
Nos fijaremos en la cantidad de respuestas que producen y en su
distribución en el tiempo
• Fuente:
Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid https://www.facebook.com/INCOSAMEOficial/photos/a.452197878
202353/1369787976443334/?type=3&theater
CLASIFICACIÓN DE LOS PROGRAMAS DE
REFORZAMIENTO
Siempre que se da R aparece el Er: p(Er/R)=1
Depende del número de respuestas
Depende del tiempo entre

reforzadores
Depende del tiempo entre

Criterio que respuestas
determina bajo
qué condiciones
se obtienen un
reforzador NO siempre que se da R
aparece el Er: 0<p(Er/R)<1 Combinan programas simples.
No los estudiaremos en este
NOTA: si el Er es independiente de la tema
R, p(Er/R)=p(Er/noR) el programa se
denomina de tiempo (fijo o variable) Dos PR funcionando al mismo
tiempo. Los estudiaremos en la
conducta de elección
Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
Ej.: Trabajo a destajo: “Cada 5 piezas fabricadas te pago X euros”
Patrón conductual: Tasa alta con pausas tras el reforzamiento
Ej.: Máquina tragaperras

Patrón conductual: tasa alta y estable con pausas ocasionales
Ej.: Correo postal; el amanecer / atardecer; exámenes

Patrón conductual: tasa baja tras el reforzador, incremento
progresivo y tasa máxima poco antes del reforzador (“festón”)
Ej.: Correo electrónico

Patrón conductual: tasa baja y muy estable
COMPARACIÓN ENTRE PROGRAMAS DE
RAZÓN E INTERVALO
Experimento de Reynolds (1975). Una paloma

trabajaba bajo un programa de Razón Variable
• Los programas de razón producen tasas
Cada vez que era reforzada, otra paloma más altas que los de intervalo
ACOPLADA tenía disponible el reforzador (programa de
• Si el aumento en la tasa no se debe a la
IV). Ambas recibían idéntica frecuencia de RV frecuencia de reforzamiento como
reforzamiento
demuestra Reynolds (1975)
RESULTADO: ¿a qué se debe?
La tasa en RV fue mayor que en IV
Replicado en humanos por • Reforzamiento diferencial del Tiempo
Raia y cols. (2000) InterRespuesta (TIR)
• Los programas de razón refuerzan TIRs
cortos (todas las respuestas son
IV necesarias para llegar al Er)
• Los programas de intervalo refuerzan
TIRs largos: tras un TIR largo, es más
probable que el Er esté disponible
• El TIR se puede reforzar explícitamente:
programas de tasa de respuesta.
Ej.: doble click del ratón
CONDUCTA DE ELECCIÓN: PROGRAMAS
CONCURRENTES
• En el medio natural usualmente operan varios P.R.

• Muchas veces, hacer una cosa implica dejar de hacer otras
• El número de elecciones en la vida cotidiana es enorme,
y analizar todos los detalles es difícil y costoso
Sólo en el ajedrez, existen
miles de millones de partidas
posibles
Respuesta A Respuesta B
• Los programas concurrentes
permiten estudiar esas
circunstancias de forma P.R. X P.R. Y
simplificada en el laboratorio Programa de reforzamiento concurrente
¿QUÉ ES UN PROGRAMA
DE ELECCIÓN?
Es un programa de reforzamiento
complejo en el cual cada una de
las situaciones de elección
produce un tipo diferente de
reforzador de acuerdo con un
programa de reforzamiento
distinto
ECONOMÍA DE FICHAS
¿Qué es? ¿Cómo?
Un programa de economía de fichas es una estrategia más general y más efectiva,

que supone un acuerdo, un pacto por el que se establecen las conductas que el niño
debe realizar y aquellas recompensas que consigue con ellas.
Asimismo, se fija el «beneficio» por cada comportamiento (aquella cantidad de

puntos, fichas o valores que se obtienen) y el «precio» de cada recompensa (aquella
cantidad de puntos o fichas que se requieren para alcanzar el privilegio).
Para poder canjear y cambiar puntos por las recompensas se debe esperar a acabar
el periodo de tiempo marcado. Por ello, se consigue que el niño intente tener una buena
actitud a lo largo de amplios períodos de tiempo.
Fuente: www.cicad.oas.org
ECONOMÍA DE FICHAS
¿Qué es? ¿Cómo?
La estructura general de estos programas se

sintetizaría en las siguientes fases:
Escoger la Escoger Tono de por

Cambio voz Darles Evaluar la Retirada
conducta las fichas agradable
privilegios valor eficacia progresiva
En primer lugar, se debe seleccionar la conducta que se quiere modificar

(como por ejemplo, las interacciones sociales que el niño inicia, la obediencia
a las órdenes del profesor, el número de problemas realizados en un
determinado periodo de tiempo, el tiempo que el niño permanece sentado en
su mesa de trabajo, etc.)
Fuente: www.cicad.oas.org
Fuente: https://www.ortodoncia.ws/publicaciones/2005/art-7/
MEDIDAS DE LA CONDUCTA DE ELECCIÓN
• Tasa relativa de respuestas (TRR)

• En un programa concurrente con dos alternativas de respuesta (a y b),
se suele calcular la tasa de respuesta que se obtienen en cada
alternativa:
TRRa = Ra/(Ra+Rb)
• Cuando la respuesta es continua (ej. ver la TV) se suele usar el tiempo relativo,
pero la filosofía es la misma
• La tasa de respuesta depende de los P.R. en cada alternativa
• Otro parámetro importante es la tasa relativa de reforzamiento
de los programas (TRr)
• Cada programa puede proporcionar distintas cantidades de
reforzamiento a lo largo del tiempo:
TRra = ra/(ra+rb)
LA LEY DE IGUALACIÓN
La tasa de respuestas en una opción tiende a

igualarse a la tasa de reforzamiento en dicha TRR = TRr
opción. Ra/(Ra+Rb) = ra/(ra+rb) ó Ra/Rb = ra/rb
(Adaptado de Herrnstein, 1961).
Opción a Max. Er/hora en a = 120 (2 por min.)
Opción b
Max. Er/hora en b = 30 (cada 2 min.)
ra/(ra+rb) = 0,80
Tasa relativa de respuesta en a = 0,8: La
respuesta se distribuirá preferentemente
IV 30’’ IV 120’’ hacia la opción a
Max. Er/hora en a = 60 (1 por min.)

Opción a Opción b
Max. Er/hora en b = 60 (1 por min.)
ra/(ra+rb) = 0,5
respuesta se distribuirá por igual entre a
IV 60’’ IV 60’’ yb
Max. Er/hora en a = 60 (1 por min.)

Opción a Opción b
Max. Er/hora en b = 120 (2 por min.)
ra/(ra+rb) = 0,33
respuesta se distribuirá por igual entre a
IV 60’’ IV 30’’ yb
LA LEY DE IGUALACIÓN Y LA CONDUCTA HUMAN
COMPLEJA
INFRAIGUALACIÓN, SUPRAIGUALACIÓN Y
SESGO
• La ley de igualación muestra que la conducta voluntaria no es caprichosa,
sino que está sujeta a leyes
• Pero en muchas ocasiones la igualación no es perfecta tal como predice la
fórmula original. Esto se debe a que más parámetros entran en juego
• Baum (1974): Ley generalizada de igualación:
Sensibilidad: Parámetros que influyen:
Ra/Rb = b(ra/rb)s - Especie

- Coste del cambio de alternativa
Bias (Sesgo): Parámetros que influyen: - Otros específicos del experimento
- Tipo de reforzador Ej. no discriminar entre los distintos programas que
- Tipo de respuesta para cada alternativa operan
- Otros específicos del experimento NOTA: La ley de igualación también se aplica a los P.R.
simples (P.R. = opción a; cualquier otra actividad = opción
Ej. preferencia de base por una alternativa b)
MECANISMOS DE LA LEY DE IGUALACIÓN
• Maximización molecular: elegir la alternativa con más

posibilidad de ser reforzada en ese momento
• Maximización molar: obtener la mejor tasa global de
reforzamiento posible
• Mejoramiento: distribuir las respuestas cuando logra
mejorar la tasa local (momentánea) de reforzamiento
Hay evidencia empírica a favor y en contra de todos los

mecanismos propuestos. Se siguen investigando los
procesos involucrados
PROGRAMAS CONCURRENTES
Ahora queremos investigar la conducta de elección.

Si te dejan elegir, ¿qué prefieres hacer?
En los programas concurrentes se deja elegir al sujeto
entre dos programas de reforzamiento.
ELECCIÓN CON COMPROMISO: P.
CONCURRENTE ENCADENADO
Eslabón de elección • En un programa concurrente encadenado, el momento de la
decisión se separa del momento de consecución del
reforzador
• Esto permite estudiar determinados fenómenos relacionados
con el autocontrol, entendido como preferir una recompensa
Demora corta mayor, pero demorada en lugar de una recompensa menor,
pero inmediata
Demora
larga • El tiempo de demora hace disminuir el valor de un reforzador
según una función de descuento
• Un reforzador inmediato puede tener un mayor valor que un
reforzador de mayor magnitud, pero demorado
Eslabones
terminales • Si podemos elegir en cualquier momento, es fácil “caer en la
tentación”
• Pero si se realiza un “compromiso” (en el eslabón de elección)
que nos impida volver a elegir, podemos “evitar caer en la
tentación”
• El autocontrol puede entrenarse
¿QUÉ DETERMINA LOS CAMBIOS DE UN
PROGRAMA A OTRO?
-Teorías de la maximización molecular: El animal hace un cambio de programa para
obtener un reforzador determinado.
-Teorías de la maximización molar: El animal hace los cambios precisos para obtener el
máximo de reforzadores a la larga.
-Teoría del mejoramiento: El animal cambia para obtener una tasa local de reforzamiento
mejor que la actual.
Tasa local de reforzamiento en el programa A: Número de reforzadores obtenidos durante el
tiempo que se ha dedicado al programa A.
La alternancia de programas continúa hasta que las tasas locales se igualan.
LAS TEORÍAS MOLECULARES :
Se concentran en lo que sucede a
nivel de respuestas individuales y
consideran que la relación de
igualación es el resultado neto de
las elecciones individuales.
LAS TEORÍAS MOLARES:

Explican conglomerados de
respuestas, tienen que ver con la
distribución total de respuestas y
de reforzadores.
ELECCIÓN CON COMPROMISO (ELECCIÓN COMPLEJA):
UNA VEZ TOMADA UNA DECISIÓN, NO SE PUEDE CAMBIAR.
Programas concurrentes encadenados:
AUTOCONTROL
Autocontrol:
Normalmente, es una decisión entre una recompensa
importante demorada o una más pequeña pero inmediata.
A largo plazo A corto plazo
PPTevidenciado
Aprendizaje
ESTRUCTURA
TRABAJO APLICATIVO EN CLASE
ACTIVIDAD N°06
Responden a las preguntas y comparta en aula virtual (en

grupos de 4) :
1. Comparen los programas de razón y de intervalo en

términos de cómo se establecen las contingencias de
reforzamiento y los efectos que tienen sobre la respuesta
instrumental.
2. Presentan un ejemplo de programas de reforzamiento en el
mundo LABORAL, EDUCATIVO, CONSUMIDOR
PPTevidenciado
Aprendizaje
ESTRUCTURA
TRABAJO APLICATIVO DE LA SEMANA
LABORATORIO SNIFFY
1. Elabora informe de experimento:
LABORATORIO: Ejercicio 31. Inclusión

de Sniffy en un programa de RV
pequeña. Ejercicio 34. Programa de
razón fija.
Referencias
GRACIA
S

Ps. Experimental S06

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ps. Experimental S06

Cargado por

Copyright:

Formatos disponibles

UPN, PASIÓN POR

SESIÓN 06: PROGRAMAS DE

Reflexión luego de ver el vídeo

Los efectos conductuales de las drogas, las

1. Distinguir entre programas continuos e intermitentes, simples y compuestos, y fijos y

Al término de la sesión, el estudiante realiza

El programa de reforzamiento hace referencia a la regla que determina bajo

Siempre que se da R aparece el Er: p(Er/R)=1

Depende del número de respuestas

Depende del tiempo entre

Depende del tiempo entre

Ej.: Máquina tragaperras

Ej.: Correo postal; el amanecer / atardecer; exámenes

Ej.: Correo electrónico

Experimento de Reynolds (1975). Una paloma

• En el medio natural usualmente operan varios P.R.

simplificada en el laboratorio Programa de reforzamiento concurrente

Un programa de economía de fichas es una estrategia más general y más efectiva,

Asimismo, se fija el «beneficio» por cada comportamiento (aquella cantidad de

La estructura general de estos programas se

Escoger la Escoger Tono de por

En primer lugar, se debe seleccionar la conducta que se quiere modificar

• Tasa relativa de respuestas (TRR)

La tasa de respuestas en una opción tiende a

Max. Er/hora en a = 60 (1 por min.)

Max. Er/hora en a = 60 (1 por min.)

Sensibilidad: Parámetros que influyen:

Ra/Rb = b(ra/rb)s - Especie

• Maximización molecular: elegir la alternativa con más

Hay evidencia empírica a favor y en contra de todos los

Ahora queremos investigar la conducta de elección.

LAS TEORÍAS MOLARES:

Programas concurrentes encadenados:

A largo plazo A corto plazo

TRABAJO APLICATIVO EN CLASE

Responden a las preguntas y comparta en aula virtual (en

1. Comparen los programas de razón y de intervalo en

TRABAJO APLICATIVO DE LA SEMANA

1. Elabora informe de experimento:

LABORATORIO: Ejercicio 31. Inclusión

También podría gustarte