Está en la página 1de 29

UPN, PASIÓN POR

TRANSFORMAR
VIDAS
PSICOLOGÍA
EXPERIMENTAL Y DEL
APRENDIZAJE
UNIDAD I:
PRINCIPIOS DE APRENDIZAJE

SESIÓN 06: PROGRAMAS DE


REFORZAMIENTO

HEBER.SEMINARIO@UPN.ED UPN.EDU.PE
U.PE
Interés

Reflexión luego de ver el vídeo

Los efectos conductuales de las drogas, las


lesiones cerebrales o las manipulaciones de
los sistemas de neurotransmisores,
frecuentemente dependen del programa de
reforzamiento que esté efectuándose
durante la prueba conductual.
Esto propicia que comprender el desempeño
del programa resulte útil para estudiar
muchos otros temas en la teoría de la
conducta y la neurociencia conductual. https://www.desdeabajo.info/ciencia-y-tecnologia/item/34676-neurociencia-ficcion.html

VIDEO INTRODUCTORIO:
https://www.youtube.com/watch?v=RjtZdtjUU8Y
OBJETIVOS DE CLASE

1. Distinguir entre programas continuos e intermitentes, simples y compuestos, y fijos y


variables.
2. Conocer los programas de reforzamiento de razón, intervalo y reforzamiento diferencial
de tasas de respuesta.
3. Conocer los patrones conductuales que generan los distintos programas de
reforzamiento.
4. Conocer los fundamentos de la ley de igualación, las variables que relaciona y cómo
predice la conducta.
5. Conocer los principales estudios sobre “autocontrol”.
6. Aplicaciones en situaciones organizacionales, educativas, clínicas.
Logro de sesión 6:

Al término de la sesión, el estudiante realiza


entrenamiento a los programas de reforzamiento de la
rata virtual Sniffy, aplicando los principios de
condicionamiento operante y teniendo en cuenta las
diferencias de los programas de reforzamiento.
Descubrimiento

PROGRAMAS DE REFORZAMIENTO

El programa de reforzamiento hace referencia a la regla que determina bajo


qué condiciones aparecerá un reforzador 4 ,5, 6, 7, 5 , 4

El P.R. puede ser “artificial”: Ej.: Si haces los ejercicios 3.2 y 6.3 del PROMEDIO 5
cuadernillo (PEC2) puedes conseguir hasta 0.5 puntos.
El P.R. puede ser “natural”: Ej.: Sólo a determinadas horas se puede
contemplar un amanecer o atardecer.
En los P.R. nos centramos en el patrón conductual estable que producen (no
RV5
tanto el proceso de adquisición)
Nos fijaremos en la cantidad de respuestas que producen y en su
distribución en el tiempo

• Fuente:
Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid https://www.facebook.com/INCOSAMEOficial/photos/a.452197878
202353/1369787976443334/?type=3&theater
CLASIFICACIÓN DE LOS PROGRAMAS DE
REFORZAMIENTO

Siempre que se da R aparece el Er: p(Er/R)=1

Depende del número de respuestas

Depende del tiempo entre


reforzadores

Depende del tiempo entre


Criterio que respuestas
determina bajo
qué condiciones
se obtienen un
reforzador NO siempre que se da R
aparece el Er: 0<p(Er/R)<1 Combinan programas simples.
No los estudiaremos en este
NOTA: si el Er es independiente de la tema
R, p(Er/R)=p(Er/noR) el programa se
denomina de tiempo (fijo o variable) Dos PR funcionando al mismo
tiempo. Los estudiaremos en la
conducta de elección

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
Ej.: Trabajo a destajo: “Cada 5 piezas fabricadas te pago X euros”
Patrón conductual: Tasa alta con pausas tras el reforzamiento

Ej.: Máquina tragaperras


Patrón conductual: tasa alta y estable con pausas ocasionales

Ej.: Correo postal; el amanecer / atardecer; exámenes


Patrón conductual: tasa baja tras el reforzador, incremento
progresivo y tasa máxima poco antes del reforzador (“festón”)

Ej.: Correo electrónico


Patrón conductual: tasa baja y muy estable

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
COMPARACIÓN ENTRE PROGRAMAS DE
RAZÓN E INTERVALO

Experimento de Reynolds (1975). Una paloma


trabajaba bajo un programa de Razón Variable
• Los programas de razón producen tasas
Cada vez que era reforzada, otra paloma más altas que los de intervalo
ACOPLADA tenía disponible el reforzador (programa de
• Si el aumento en la tasa no se debe a la
IV). Ambas recibían idéntica frecuencia de RV frecuencia de reforzamiento como
reforzamiento
demuestra Reynolds (1975)
RESULTADO: ¿a qué se debe?
La tasa en RV fue mayor que en IV
Replicado en humanos por • Reforzamiento diferencial del Tiempo
Raia y cols. (2000) InterRespuesta (TIR)
• Los programas de razón refuerzan TIRs
cortos (todas las respuestas son
IV necesarias para llegar al Er)
• Los programas de intervalo refuerzan
TIRs largos: tras un TIR largo, es más
probable que el Er esté disponible
• El TIR se puede reforzar explícitamente:
programas de tasa de respuesta.
Ej.: doble click del ratón
Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
CONDUCTA DE ELECCIÓN: PROGRAMAS
CONCURRENTES

• En el medio natural usualmente operan varios P.R.


• Muchas veces, hacer una cosa implica dejar de hacer otras
• El número de elecciones en la vida cotidiana es enorme,
y analizar todos los detalles es difícil y costoso
Sólo en el ajedrez, existen
miles de millones de partidas
posibles

Respuesta A Respuesta B
• Los programas concurrentes
permiten estudiar esas
circunstancias de forma P.R. X P.R. Y

simplificada en el laboratorio Programa de reforzamiento concurrente

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
¿QUÉ ES UN PROGRAMA
DE ELECCIÓN?

Es un programa de reforzamiento
complejo en el cual cada una de
las situaciones de elección
produce un tipo diferente de
reforzador de acuerdo con un
programa de reforzamiento
distinto

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
ECONOMÍA DE FICHAS
¿Qué es? ¿Cómo?

Un programa de economía de fichas es una estrategia más general y más efectiva,


que supone un acuerdo, un pacto por el que se establecen las conductas que el niño
debe realizar y aquellas recompensas que consigue con ellas.

Asimismo, se fija el «beneficio» por cada comportamiento (aquella cantidad de


puntos, fichas o valores que se obtienen) y el «precio» de cada recompensa (aquella
cantidad de puntos o fichas que se requieren para alcanzar el privilegio).

Para poder canjear y cambiar puntos por las recompensas se debe esperar a acabar
el periodo de tiempo marcado. Por ello, se consigue que el niño intente tener una buena
actitud a lo largo de amplios períodos de tiempo.

Fuente: www.cicad.oas.org
ECONOMÍA DE FICHAS
¿Qué es? ¿Cómo?

La estructura general de estos programas se


sintetizaría en las siguientes fases:

Escoger la Escoger Tono de por


Cambio voz Darles Evaluar la Retirada
conducta las fichas agradable
privilegios valor eficacia progresiva

En primer lugar, se debe seleccionar la conducta que se quiere modificar


(como por ejemplo, las interacciones sociales que el niño inicia, la obediencia
a las órdenes del profesor, el número de problemas realizados en un
determinado periodo de tiempo, el tiempo que el niño permanece sentado en
su mesa de trabajo, etc.)

Fuente: www.cicad.oas.org
Fuente: https://www.ortodoncia.ws/publicaciones/2005/art-7/
MEDIDAS DE LA CONDUCTA DE ELECCIÓN

• Tasa relativa de respuestas (TRR)


• En un programa concurrente con dos alternativas de respuesta (a y b),
se suele calcular la tasa de respuesta que se obtienen en cada
alternativa:
TRRa = Ra/(Ra+Rb)
• Cuando la respuesta es continua (ej. ver la TV) se suele usar el tiempo relativo,
pero la filosofía es la misma
• La tasa de respuesta depende de los P.R. en cada alternativa
• Otro parámetro importante es la tasa relativa de reforzamiento
de los programas (TRr)
• Cada programa puede proporcionar distintas cantidades de
reforzamiento a lo largo del tiempo:
TRra = ra/(ra+rb)
Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
LA LEY DE IGUALACIÓN

La tasa de respuestas en una opción tiende a


igualarse a la tasa de reforzamiento en dicha TRR = TRr
opción. Ra/(Ra+Rb) = ra/(ra+rb) ó Ra/Rb = ra/rb
(Adaptado de Herrnstein, 1961).
Opción a Max. Er/hora en a = 120 (2 por min.)
Opción b
Max. Er/hora en b = 30 (cada 2 min.)
ra/(ra+rb) = 0,80
Tasa relativa de respuesta en a = 0,8: La
respuesta se distribuirá preferentemente
IV 30’’ IV 120’’ hacia la opción a

Max. Er/hora en a = 60 (1 por min.)


Opción a Opción b
Max. Er/hora en b = 60 (1 por min.)
ra/(ra+rb) = 0,5
Tasa relativa de respuesta en a = 0,5: La
respuesta se distribuirá por igual entre a
IV 60’’ IV 60’’ yb

Max. Er/hora en a = 60 (1 por min.)


Opción a Opción b
Max. Er/hora en b = 120 (2 por min.)
ra/(ra+rb) = 0,33
Tasa relativa de respuesta en a = 0,5: La
respuesta se distribuirá por igual entre a
IV 60’’ IV 30’’ yb

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
LA LEY DE IGUALACIÓN Y LA CONDUCTA HUMAN
COMPLEJA

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
INFRAIGUALACIÓN, SUPRAIGUALACIÓN Y
SESGO
• La ley de igualación muestra que la conducta voluntaria no es caprichosa,
sino que está sujeta a leyes
• Pero en muchas ocasiones la igualación no es perfecta tal como predice la
fórmula original. Esto se debe a que más parámetros entran en juego
• Baum (1974): Ley generalizada de igualación:

Sensibilidad: Parámetros que influyen:

Ra/Rb = b(ra/rb)s - Especie


- Coste del cambio de alternativa
Bias (Sesgo): Parámetros que influyen: - Otros específicos del experimento
- Tipo de reforzador Ej. no discriminar entre los distintos programas que
- Tipo de respuesta para cada alternativa operan

- Otros específicos del experimento NOTA: La ley de igualación también se aplica a los P.R.
simples (P.R. = opción a; cualquier otra actividad = opción
Ej. preferencia de base por una alternativa b)

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
MECANISMOS DE LA LEY DE IGUALACIÓN

• Maximización molecular: elegir la alternativa con más


posibilidad de ser reforzada en ese momento
• Maximización molar: obtener la mejor tasa global de
reforzamiento posible
• Mejoramiento: distribuir las respuestas cuando logra
mejorar la tasa local (momentánea) de reforzamiento

Hay evidencia empírica a favor y en contra de todos los


mecanismos propuestos. Se siguen investigando los
procesos involucrados
Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
PROGRAMAS CONCURRENTES

Ahora queremos investigar la conducta de elección.


Si te dejan elegir, ¿qué prefieres hacer?
En los programas concurrentes se deja elegir al sujeto
entre dos programas de reforzamiento.

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
ELECCIÓN CON COMPROMISO: P.
CONCURRENTE ENCADENADO
Eslabón de elección • En un programa concurrente encadenado, el momento de la
decisión se separa del momento de consecución del
reforzador
• Esto permite estudiar determinados fenómenos relacionados
con el autocontrol, entendido como preferir una recompensa
Demora corta mayor, pero demorada en lugar de una recompensa menor,
pero inmediata
Demora
larga • El tiempo de demora hace disminuir el valor de un reforzador
según una función de descuento
• Un reforzador inmediato puede tener un mayor valor que un
reforzador de mayor magnitud, pero demorado
Eslabones
terminales • Si podemos elegir en cualquier momento, es fácil “caer en la
tentación”
• Pero si se realiza un “compromiso” (en el eslabón de elección)
que nos impida volver a elegir, podemos “evitar caer en la
tentación”
• El autocontrol puede entrenarse

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
¿QUÉ DETERMINA LOS CAMBIOS DE UN
PROGRAMA A OTRO?
-Teorías de la maximización molecular: El animal hace un cambio de programa para
obtener un reforzador determinado.

-Teorías de la maximización molar: El animal hace los cambios precisos para obtener el
máximo de reforzadores a la larga.

-Teoría del mejoramiento: El animal cambia para obtener una tasa local de reforzamiento
mejor que la actual.
Tasa local de reforzamiento en el programa A: Número de reforzadores obtenidos durante el
tiempo que se ha dedicado al programa A.
La alternancia de programas continúa hasta que las tasas locales se igualan.

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
LAS TEORÍAS MOLECULARES :
Se concentran en lo que sucede a
nivel de respuestas individuales y
consideran que la relación de
igualación es el resultado neto de
las elecciones individuales.

LAS TEORÍAS MOLARES:


Explican conglomerados de
respuestas, tienen que ver con la
distribución total de respuestas y
de reforzadores.

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
ELECCIÓN CON COMPROMISO (ELECCIÓN COMPLEJA):
UNA VEZ TOMADA UNA DECISIÓN, NO SE PUEDE CAMBIAR.

Programas concurrentes encadenados:

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
AUTOCONTROL
Autocontrol:
Normalmente, es una decisión entre una recompensa
importante demorada o una más pequeña pero inmediata.

A largo plazo A corto plazo

Fuente: Domjan, M., (2011). Principios de aprendizaje y conducta, 6ª edición, Thomson, Madrid
PPTevidenciado
Aprendizaje
ESTRUCTURA

TRABAJO APLICATIVO EN CLASE

ACTIVIDAD N°06

Responden a las preguntas y comparta en aula virtual (en


grupos de 4) :

1. Comparen los programas de razón y de intervalo en


términos de cómo se establecen las contingencias de
reforzamiento y los efectos que tienen sobre la respuesta
instrumental.
2. Presentan un ejemplo de programas de reforzamiento en el
mundo LABORAL, EDUCATIVO, CONSUMIDOR
PPTevidenciado
Aprendizaje
ESTRUCTURA

TRABAJO APLICATIVO DE LA SEMANA

LABORATORIO SNIFFY

1. Elabora informe de experimento:

LABORATORIO: Ejercicio 31. Inclusión


de Sniffy en un programa de RV
pequeña. Ejercicio 34. Programa de
razón fija.
Referencias
GRACIA
S

También podría gustarte