Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2º Psicología
1er Trimestre
1
1. INTRODUCCIÓN A LA PSICOLOGÍA DEL APRENDIZAJE
2. ANTECEDENTES HISTÓRICOS
3. DESARROLLO HISTÓRICO DEL ESTUDIO DE LA MENTE
4. DESARROLLO HISTÓRICO DEL ESTUDIO DE LOS REFLEJOS
5. INTERÉS Y ESTUDIO DE LOS PRINCIPIOS BÁSICOS DEL APRENDIZAJE
6. DEFINICIÓN DE APRENDIZAJE
7. ASPECTOS METODOLÓGICOS DEL ESTUDIO DEL APRENDIZAJE
2
2. ANTECEDENTES HISTÓRICOS
Descartes
• Contenido de la mente: Experiencias sensoriales + ideas innatas*
- *Concepto de Dios, el concepto de sí mismo y ciertos axiomas
básicos de geometría.
- Ideas innatas → innatismo.
- Funcionamiento de la mente caótico; sin reglas claras. Cada
mente es unica y cada mente tiene un funcionamiento caotico
por eso no nos podemos centrar en estudiarla
Postura nativista
• John Locke (1632-1704)
- Todas las ideas son aprendidas (directa o indirectamente) a
través de experiencias posteriores al nacimiento.
- Mente como tabula rasa.
- Aprendizaje → empirismo.( el aprendizaje es atraves del
empirismo a traves de las experiencias)
• Thomas Hobbes (1588 – 1679): Funcionamiento de la mente predecible
y sujeto a leyes generales.
- Principio del hedonismo ( no se aprenden coas que no se
quieren aprender)
3
Empiristas británicos
• Concepto de asociación
- Sensaciones simples combinadas dan lugar a ideas complejas
• Leyes de asociación primarias (Aristóteles)
- Leyes de Contigüidad: Si dos eventos ocurren juntos en el
espacio o en el tiempo de forma repetida quedarán asociados
(✓)( si cada vez que suena un sonido a ti te dan un calambre
llega un momento que solamente solo con el sonido emitiras la
misma conducta que si recibieras el calambrazo)
- Leyes de Similitud: dos ideas quedaran asociadas si son similares
en algún aspecto (✓)
- Leyes de Contraste: dos ideas quedaran asociadas si tienen
alguna característica contraria (✗) es la única ley no verdadera
• Leyes de asociación secundaria (Brown (1778-1820))
- Intensidad de las sensaciones, frecuencia y recencia( recencia: el
espacio entre una y otra ej:el espacio que hay entre la luz y el
calambre) con que las dos sensaciones ocurren conjuntamente.
Siglo XIX
• Fisiología rusa: I. M. Sechenov (1829-1905) e Ivan Pavlov (1849-1936)
• Sechenov
- Los EE no siempre elicitan RR reflejas de forma directa.
- Un EE puede liberar una RR previamente inhibida.
- La fuerza de la RR no depende solo de la intensidad del EE.
- Formas de pensamiento = RR reflejas elicitadas por EE débiles.
• Pavlov
- Principios del condicionamiento clásico.
- Demostración empírica de que no todos los reflejos son innatos.
- Mecanismos asociativos pueden establecer nuevos reflejos para
los estímulos.
- https://www.youtube.com/watch?v=Pb3opXRVE2k (Pág 7)
- https://www.youtube.com/watch?v=KG3N-zZF4dI (Pág 8)
4
5. INTERÉS Y ESTUDIO DE LOS PRINCIPIOS BÁSICOS DEL APRENDIZAJE
2. Neurología funcional
• Iván Pavlov
- Utilizar los estudios de aprendizaje animal para estudiar el
funcionamiento del SN.
- Principio de nervismo: las principales funciones fisiológicas están
gobernadas por el sistema nervioso.
- Estudios de condicionamiento → información sobre
funcionamiento del SN.
àInformación sobre plasticidad del SN, condiciones para el
aprendizaje, mantenimiento de las respuestas aprendidas, etc.
- Kendel: “el principio central de las modernas neurociencias es
que todo comportamiento es un reflejo del funcionamiento del
cerebro”
3. Modelos animales
5
6. DEFINICIÓN DE APRENDIZAJE
6
2. Perspectiva de proceso general en el estudio del aprendizaje
• Los fenómenos estudiados son resultado de procesos más elementales
y es en ellos donde emerge la generalidad.
• Estos procesos elementales son las leyes universales de la asociación
• Edward Thorndike:
“Desde un punto de vista formal, el cangrejo, el pez, la tortuga, el perro,
el gato, el mono y un bebé son similares en cuanto a intelecto. Todos
ellos son sistemas de conexiones susceptibles de cambio por las leyes
del ejercicio y del efecto. Las diferencias se encuentran: primero, en las
conexiones concretas, en lo que estimula al animal a responder, en la
respuesta que realiza, en qué estímulo se conecta con qué respuesta, y
segundo, en el grado de capacidad para aprender”
• Thorndike asumió que las leyes del aprendizaje eran universales.
• Se debe poder descubrir los principios del aprendizaje estudiando
cualquier especie o sistema de respuesta que muestre aprendizaje.
• La adopción de la perspectiva de proceso general no prueba de forma
empírica que esta sea correcta, pero hay suficiente evidencia para
sostenerla.
7
1. CONDUCTA ELICITADA:
• REFLEJOS
• PAUTAS DE ACCIÓN MODAL
• ORGANIZACIÓN SECUENCIAL DE LA CONDUCTA
2. EFECTOS DE LA ESTIMULACIÓN REPETIDA
3. CONCEPTOS DE HABITUACIÓN Y SENSIBILIZACIÓN
4. DIFERENTES ENTRE HABITUACIÓN, ADAPTACIÓN SENSORIAL Y FATIGA
5. TEORÍA DEL PROCESO DUAL
6. CARACTERÍSTICAS DE LA HABITUACIÓN Y LA SENSIBILIZACIÓN
• CURSO TEMPORAL
• EFECTOS DE UN ESTÍMULO EXTERNO INTENSO
7. TEORÍA DEL PROCESO OPONENTE
8. VARIACIONES DE LA CONDUCTA DIRIGIDA A METAS
1. CONDUCTA ELICITADA
REFLEJO
8
PAUTAS ACCIÓN MODAL
9
2. EFECTOS DE LA ESTIMULACIÓN REPETIDA
10
Respuesta de sobresalto en ratas
• Respuesta elicitada y variable dependiente: respuesta de sobresalto.
• Participantes: 2 grupos de ratas.
• Variable independiente: sonido breve (90 ms) e intenso (110 dB)
• Procedimiento:
i. 100 presentaciones del tono separadas entre sí por 30 segundos
ii. Dos condiciones experimentales: (1) ruido ambiental de 60 dB;
(2) ruido ambiental de 80 dB
40
35
• ¿Qué está ocurriendo en el experimento
con la VD en función de las condiciones
RESPUESTA DE SOBRESALTO
30
experimentales?
25 - La presentación repetida del estímulo
20 elicitante no siempre produjo la misma
15 respuesta.
- En un caso se produjo habituación y en
10
el otro se produjo sensibilización.
5 - Comentar implicaciones para la práctica
0
2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
EJ: cuando empiezas a sacarte el carné tu nivel de activación es muy alto y miras
mucho lo retrovisores una vez ya eres conductor el nivel de activación cae en picado
11
4. DIFERENCIAS ENTRE HABITUACIÓN, ADAPTACIÓN SENSORIAL Y FÁTIGA
12
Mecanismos de acción de habituación y sensibilización
Habituación y sensibilización tienen lugar en diferentes sistemas:
• Habituación: sistema E – R.
• Como arco reflejo.
• Cada presentación de un E elicitante activa el sistema E – R.
1º S. E-R= 0 • Permite al animal dar una respuesta específica al estímulo
Hà S. E-R 2º S. E-R= 2 relevante.
3º S. E-R= 5 • El sistema E – R se activa siempre que un E elicita una respuesta.
* + Presentaciones del E + intensidad de respuesta
1º 0 12 0+12=12
2º 4 12 8+12=20
3º 8 12 4+20=24
4º 12 12 24+0=24
5º 12 12 24+0=24
6º 12 12 24+0=24
13
6. CARACTERÍSTICAS DE LA HABITUACIÓN Y LA SENSIBILIZACIÓN
CURSO TEMPORAL
fase?
Habituación a largo plazo
• ¿Qué efecto de habituación ocurre en la segunda
fase?
1 3 5 7 9 11 2 4 6 8 10 1 3 Habituación a corto plazo
• ¿Qué efecto de habituación ocurre en la tercera
Estímulos una vez al día
fase?
Estímulos cada 3 segundos Recuperación espontánea y habituación a largo
Estímulos una vez al día plazo.
14
• Especificidad del estímulo en la H-:
• H- específica del E presentado repetidamente.
• Experimento de la salivación y de la evaluación hedónica en respuesta a
un sabor.
- Al cambiar el sabor, la magnitud de la respuesta se restablecía.
• No obstante, puede darse cierta generalización (e.j.: sonido parecido de
reloj)
- Generalización del estímulo de la habituación
• Especificidad del estímulo en la S+:
• S+ con poca especificidad al E.
• Ejemplo de traumas.
• Efecto de generalización.
• Experimento de deshabituación:
• Variable dependiente: tiempo de fijación.
• Participantes: 2 grupos de bebés humanos.
• Variable independiente: tablero de ajedrez 4x4.
• Procedimiento (tres fases):
i. Ocho presentaciones del tablero 4x4.
ii. En el ensayo 9 uno de los grupos de bebés recibió un sonido de
75 dB junto con la VI.
iii. Tres presentaciones de la VI omitiendo el tono.
Sin tono Con tono • ¿Qué efecto ocurre en la tercera fase, al volver a
eliminar el estímulo externo?
El efecto de la recuperación se mantiene
15
7. Tª DEL PROCESO OPONENTE
• Postulado principal
• Los mecanismos fisiológicos involucrados en la conducta emocional
tratan de mantener la estabilidad emocional.
• Teoría homeostática —— el organismo busca reducir las desviaciones
de un estado neutral
• Ante una fuerza x en una dirección, tendrá que haber una fuerza
y, igual y opuesta.
i. EE emocional —— proceso primario o proceso a
(responsable de la emoción x)
ii. Proceso primario o a —— proceso oponente o proceso b
(responsable de la emoción y).
iii. Respuesta emocional consciente = proceso b – proceso a.
• Postulados adicionales
• El proceso oponente es ligeramente ineficiente
• A la zaga de la alteración emocional primaria; no logra
compensar por completo la emoción primaria.
• El proceso oponente se hace más fuerte con la experiencia y la
práctica (sensibilización)
• Llega un punto en el que logra bloquear la mayor parte de la
reacción emocional primaria.
• En este momento provoca un postefecto muy intenso cuando el
EE activador emocional desaparece.
16
• Mecanismos oponentes tras la exposición prolongada al estímulo
(NO ENTRA)
Situaciones en las que los organismos responden repetidamente para obtener un
reforzador muestran muchas de las propiedades comunes de la habituación y la
sensibilización
17
1. INTRODUCCIÓN AL CONDICIONAMIENTO CLÁSICO
2. HISTORIA DEL CONDICIONAMIENTO CLÁSICO
3. SITUACIONES EXPERIMENTALES DEL CONDICIONAMIENTO CLÁSICO
4. CONDICIONAMIENTO PAVLOVIANO EXCITATORIO
5. CONDICIONAMIENTO PAVLOVIAO INHIBITORIO (INHIBICIÓN CONDICIONADA)
6. EFICACIA DE LOS EC Y DE LOS EI
7. NATURALEZA DE LA RESPUESTA CONDICIONADA
8. MODELOS DEL CONDICIONAMIENTO CLÁSICO
Habituación y sensibilización
• Aprendizaje tipo EE —— RR
• No aprendizaje de RR fuera del repertorio conductual del sujeto
• No permiten el aprendizaje de nuevas RR
• No permiten el aprendizaje de RR a nuevos EE
• El aprendizaje tiene lugar sobre un solo EE
Twitmyer (1902).
18
Pavlov
• Investigación sobre el proceso de digestión
• Sus técnicos descubrieron que los perros secretaban jugos gástricos en
respuesta a la mera visión de la comida o de la persona que
habitualmente les alimentaba.
• Se denominaron “secreciones psíquicas”
• Escaso interés científicos durante muchos años
19
Condicionamiento del miedo (situación experimental clásica)
• Sujetos: ratas de laboratorio.
• EI: descarga eléctrica (administrada a través de una rejilla en el suelo).
• EC: tono o luz.
• RI: miedo; disminución del movimiento.
• Técnica para medir el miedo: respuesta emocional condicionada o
supresión condicionada (REC)
90
% DE ENSAYOS CON RR
80
CONDICIONADA
21
• Variaciones del experimento
• Hearst y Jenkins (1974) colocaron a las palomas en un pasillo de
182 cm.
• En ambos extremos del pasillo había un disco circular
iluminable.
• La comida iba precedida por la iluminación de uno de los
discos, mientras que el otro se iluminaba de forma
aleatoria.
• La comida estaba solo disponible durante 4 segundos
• Resultado: cuando la tecla EC se iluminaba, las palomas
corrían hacia allí y después volvían a la comida, pero no
siempre a tiempo para comer.
22
Falsa exposición
• ¿Cuántos ensayos han hecho falta para
100 producir el condicionamiento?
% DE PREFERENCIA
50
23
Tipos de condicionamientos pavlovianos:
24
• Eficacia de los procedimientos típicos de condicionamiento
I. Perspectiva tradicional:
• Importancia del intervalo EC-EI:
• Eje x: Intervalo EC-EI
• Eje y: Respuesta condicionada
• Poco condicionamiento en procedimientos de condicionamiento
simultáneo
• Menos efectivo el condicionamiento de huella que el de demora.
• Idea de que el condicionamiento es más efectiva cuando el EC es
un buen predictor del EI.
• El condicionamiento hacia atrás ha obtenido resultados
ambiguos (excitatorio, inhibitorio y ambos).
II. Perspectiva actual:
• Los procedimientos de demora, simultáneo, de huella y hacia
atrás producen un aprendizaje sólido.
• Se aprenden cosas diferentes en cada uno.
• Hipótesis de la codificación temporal: se aprende, además de la
asociación EC-EI, cuándo aparece el EI en relación al EC.
5,2
ii. La ansiedad ”después” es mucho mayor
5
cuando se da un ataque de pánico
4,8 imprevisto
4,6 • Si alguien debe ser expuesto a una estimulación
4,4 aversiva, es preferible que los EE aversivo sean
predecibles.
4,2
i. Esto ocurre, no tanto porque podamos
4
predecir un evento negativo, sino porque
Antes Después
somos capaces de predecir la no aparición
Imprevisto Previsto de un estímulo aversivo.
ii. Las señales que predicen la no aparición de
un EE aversivo son EC inhibitorios
25
Procedimientos de condicionamiento inhibitorio
26
• Esta prueba compensa las dificultades originadas por una baja línea
base.
• El procedimiento consiste en medir la reducción en la RC, tras haber
producido un EC+.
6. EFICACIA DE LOS EC Y EI
27
Efecto de preexposición al EC o efecto de inhibición latente.
• Conclusiones:
- Este fenómeno sirve para limitar la cantidad de procesamiento y
atención a los EE que se sabe que carecen de consecuencias.
- La inhibición latente sirve para sesgar el aprendizaje en favor de
los estímulos novedosos.
• Procedimiento de estudio experimental con el EI
- Similar a cuando se utilizad el EC, con resultados similares:
efecto de preexposición al EI
28
El concepto de fuerza biológica
• Se entiende la fuerza biológica como la capacidad de un estímulo de
elicitar una respuesta
• Según Pavlov, para que un estímulo se condicionara, debía tener una
fuerza biológica menor que la del estímulo incondicionado con el que se
emparejaba.
29
ambos eliciten inicialmente respuestas intensas. Viola el
principio de propuesto por Pavlov
• Precondicionamiento sensorial
• Dos estímulos que apenas elicitan respuestas; es decir, dos EC
con una fuerza biológica débil (EC1 = sabor a vainilla y EC2 = sabor
a canela)
• Emparejamos EC1 con un EI intenso (inyección que provoca
malestar), lo que termina provocando una RC (malestar al notar
el sabor de vainilla).
• Al presentar EC2 (sabor a canela) también se produce RC
(malestar), aunque nunca se ha asociado este estímulo con el EI
(inyección que provoca malestar).
• Este supuesto también viola el principio de fuerza biológica
propuesto por Pavlov, dado que, en este caso, los dos EC tienen
una fuerza biológica débil y, aún así, se pueden asociar
30
•Se detecta un desvío y entonces el sistema actúa con
proceso compensatorio.
• Sistema ineficiente si debe esperar a que se
produzca el desvío para actuar.
• Sistema eficiencia si puede predecir la aparición
de un desvío y actuar con anterioridad.
• Papel del CC: la respuesta condicionada a
una alteración fisiológica es igual que la
respuesta compensatoria a dicha
alteración.
• Ejemplo: consumo de drogas psicoactivas
• Alteraciones homeostáticas producidas por el consumo.
• Alteraciones provocan reacciones compensatorias.
• Las reacciones compensatorias se condicionan.
• La ansiedad por consumir es una respuesta
compensatoria condicionada.
• Experimento de Ehrman, Robbins, Childress y O’Brien
(1992)**
• Sujetos:
• GE: hombres con un historial de consumo de cocaína (sin historia de
consumo de heroína)
• GC: hombres sin historia de consumo de drogas.
• Procedimiento: tres condiciones de prueba:
• Presentación de las claves contextuales relacionadas con el consumo de
cocaína
• Presentación de las claves contextuales relacionadas con el consumo de
heroína
• Presentación de estímulos sin relación con el consumo de droga.
• VD: cambios en el ritmo cardíaco con respecto a una línea base.
1
• Necesidad de consumir más sustancia para
0
Grupo cocaína Grupo sin experiencia con
obtener mismos efectos.
-1 drogas • Predicciones acertadas del modelo:
• Modificación de las claves —— pérdida de
-2
tolerancia
-3 • Pre-exposición al EC —— pérdida de
Cocaína Heroína Neutro tolerancia
31
El EC como determinante de la forma de la RC
• Experimento de Timberlake y Grant (1975)
• Sujetos: ratas
• EI: comida
• Respuesta esperable según el modelo de sustitución del
estímulo: roer y morder
• EC: otra rata
• Procedimiento: 10 segundos antes de EI, aparece EC.
• Respuesta observada: conductas de orientación, aproximación,
olfateo y contacto social a medida que aumentaban los ensayos
EC-EI.
• Si no hay emparejamientos EC-EI, estas respuestas no se
daban.
El patrón de respuestas condicionadas, particularmente la conducta social elicitada por
la rata EC, estuvo sin duda determinado por la naturaleza del EC
32
8.MODELOS DE CONDICIONAMIENTO CLÁSICO
EL EFECTO BLOQUEO
El efecto del bloqueo (Kamin, 1968, 1969) no es una teoría en sí, pero es un efecto que
abrió camino para la elaboración de otras muchas teorías.
• Paradigma del efecto del bloqueo:
• Dos grupos: GE y GC
• Tres fases:
i. GE: ECA —— EI / GC: Nada.
ii. GE: ECA + ECB —— EI / GC: ECA + ECB —— EI.
iii. ECB en solitario
• Resultados: En el GE el ECB apenas ofrece RC, mientras que en el GC el
ECB sí ofrece una RC intensa.
i. El hecho de que el EI se haya asociado a un EC previo (ECA)
“bloquea” el condicionamiento a otro estímulo (ECB).
El efecto del bloqueo muestra que no es suficiente emparejar un EC con un EI para que
se desarrolle la RC.
¿Por qué la presencia del estímulo A previamente condicionado bloquea la adquisición
de la respuesta a la clave añadida B?
• Según Kamin, para que se produjera aprendizaje de forma efectiva, el EI
debía ser sorprendente. Si el EI va señalado por un estímulo
previamente condicionado (A), no sorprenderá al sujeto y, por tanto, no
funcionará bien a la hora de condicionar al estímulo añadido B.
Aspectos a considerar:
• Definición de sorprendente: un evento es sorprendente si es diferente
de lo que se espera.
• La expectativa del EI está relacionada con las propiedades
condicionadas o asociativas del estímulo que precede al EI:
- Una respuesta condicionada intensa indica una fuerte
expectativa de que el EI aparecerá
- Una respuesta condicionada débil indica una baja expectativa de
que el EI aparecerá
33
• Un EI inesperadamente grande es la base del condicionamiento
excitatorio o del incremento de la fuerza asociativa
• Un EI inesperadamente pequeño es la base del condicionamiento
inhibitorio o de la disminución de la fuerza asociativa.
ΔV = k(λ – V)
- ECA + ECB — EI
• ¿Qué sucede con las propiedades condicionadas de los
estímulos A y B como resultado del entrenamiento de la
fase 2?
34
• El sentido común dice que las propiedades condicionadas
se mantendrán sin cambios.
• El modelo predice que se reducirán pues… VA+B = VA + VB
= 2λ Sin embargo, sigue cayendo una sola bolita de
comida, en lugar de dos, por lo que el EI es
sorprendentemente pequeño, lo que hace que las
propiedades condicionadas disminuyan.
Inhibición condicionada:
1) EC+ —— EI
2) EC+ (+) EC— —— Ausencia de EI.
• Exceso de expectativa en el ensayo de inhibición condicionada.
• Se reduce la fuerza del condicionamiento.
• El modelo de Rescorla y Wagner explica la inhibición
condicionada asumiendo que el EC— adquiere un valor
asociativo negativo.
35
• Algunos estudios han encontrado que un mismo estímulo puede
tener ambas propiedades.
4. Problemas a la hora de predecir el efecto de aumento o contrabloqueo:
• Paradigma de aversión al sabor y al olor:
i. Fase I: EC1 (olor o sabor) —— EI (malestar inducido por
litio)
ii. Fase II: EC1 + EC2 —— EI
iii. Resultado esperable según modelo: efecto de bloqueo: el
EC2 no se condiciona.
iv. Resultado observado: El estímulo previamente
condicionado (EC1) aumenta el condicionamiento del EC2
40
30
• La respuesta condicionada es directamente
20 proporcional a la razón IEE/DE
10 • No importa la duración del EC, ni tampoco el
intervalo entre ensayos, sino solo su relación.
0
1 2 3 4 5 6
-10
-20
36
DE = 10 s DE = 20 s
Hipótesis del tiempo de espera relativo:
• Supone que un EC proporciona información acerca de la aparición del EI
solo si el sujeto tiene que pasar menos tiempo esperando al EI tras la
aparición del EC que cuando está.
• IEE/DE alto: tiempo de espera ante el EC menor al tiempo de espera en
contexto: mucho condicionamientsimplemente expuesto al contexto
experimental.
• IEE/DE bajo: tiempo de espera ante el EC similar al tiempo de
espera en contexto: poco condicionamientoo.
37
1.INTRODUCCIÓN E HISTORIA DEL CONDICIONAMIENTO INSTRUMENTAL
2. APROXIMACIONES MODERNAS AL ESTUDIO DEL CI
3. PROCEDIMEINTOS DE CONDICIONAMIENTO INSTRUMENTAL
4. ELEMENTOS FUNDAMENTALES DEL CI
5. INDEFENSIÓN APRENDIDA
6. PROGRAMAS DE REFORZAMIENTO. RAZON E INTERVALOS
7. PROGRAMAS DE REFORZAMIENTO DE TASA DE RESPUESTA
8. CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES
9. ELECCIÓN CON COMPROMISO: PROGRAMA CONCURRENTE ENCADENADO
10. FUNCIÓN DESCONTADORA DEL VALOR DEL REFUERZO
11. TEORÍAS DEL REFORZAMIENTO
38
2. APROXIMACIONES MODERNAS AL ESTUDIO DEL CI
CAJA DE SKINNER
39
ENTRENAMIENTO Y MOLDEAMIENTO AL COMEDERO
• Conducta de presionar la palanca poco frecuente para las ratas.
• Necesidad de un entrenamiento:
i. Condicionamiento clásico (entrenamiento al comedero):
• EC: luz o sonido.
• EI: comida.
• Respuesta: seguimiento del signo (la rata se acerca al
comedero).
ii. Fase de moldeamiento:
• Refuerzo de conductas que se ”acercan” a la conducta
objetivo (presionar la palanca)
• C1 —— C2 —— C3 —— CO
• Fase de reforzamiento de aproximaciones
sucesivas
• Una vez instaurada la conducta “puente” (C1, C2, C3,…), se
deja de reforzar esa conducta.
• Efecto de aumento en la frecuencia y cambio en
la topografía.
• Refuerzo de la siguiente conducta puente
• Fase de extinción
• Se repite el procedimiento hasta llegar a la conducta
objetivo.
• El moldeamiento puede producir nuevas formas de respuesta.
40
4. ELEMENTOS FUNDAMENTALES DEL CI
41
• La teoría de los sistemas de conducta afirma que, en función del
tipo de reforzador, se activan unos sistemas de conducta y no
otros.
• La teoría de los sistemas de conducta explican la deriva
instintiva.
• El reforzador instrumental:
1. Cantidad y naturaleza del reforzador. Experimento de Hutt (1954)
• Objetivo: aislar los efectos de la cantidad y naturaleza de un
reforzador.
• Sujetos: ratas.
• RI: presionar una palanca.
• Er: Dos cambios en sus propiedades:
i. Cantidad: pequeña / mediana /grande
ii. Calidad: ácido / normal / dulce
70
60
50 Cuantas más cantidad y más
40 calidad tenían los
30 reforzadores más respuesta
20
instrumental se producía
10
0
Ácido Normal Dulce
respuestas.
10
• Tras R1 (conducta reforzada), el
5 sujeto emite R2, R3, R4,…
Si el reforzador se emite tras R6, la
0
conducta que se refuerza no es R1,
0 10 20 40 60
sino R6
DEMORA (SEGUNDOS)
43
• Brazo negro: sin refuerzo.
• Brazo blanco: refuerzo demorado (60 segundos) en caja de
meta.
100
PORCENTAJE DE RR CORRECTAS
50
0
1 2 3 4 5
BLOQUES DE 10 ENSAYOS
No marcado Marcado
44
• La contingencia respuesta — reforzador:
• La entrega del reforzador es dependiente de la ocurrencia previa de la
respuesta instrumental.
• Al principio se creyó que era más importante la contigüidad temporal
que la contingencia.
• Más adelante, se ha visto que no es así…
• El experimento de superstición de Skinner:
https://www.youtube.com/watch?v=nKsXDMsPYQc
45
• La contingencia respuesta — reforzador:
• El estudio de la importancia de la contingencia respuesta — reforzador
se ha realizado principalmente siguiendo el paradigma de la indefensión
aprendida.
• Seligman, Overmier y Maier investigaron los efectos de la exposición a
una descarga incontrolable en el aprendizaje posterior de escape-
evitación en perros.
El hallazgo más relevante fue que la exposición a una descarga
incontrolable dificultaba el aprendizaje posterior.
• Estudios de indefensión aprendida:
I. El diseño triádico
II. La hipótesis de la indefensión aprendida
III. Déficit de actividad
IV. Déficit atencional
V. Relaciones estimulares en el condicionamiento de escape
5. INDEFENSIÓN APRENDIDA
• El diseño triádico:
• Incluye dos fases:
i. Fase de exposición
• Grupo E (escape): ratas expuestas a una descarga a la que
pueden escapar emitiendo una respuesta (girar una pequeña
rueda).
• Grupo A (acoplado): cada rata de este grupo es acoplada a una
rata del grupo E y recibe las mismas descargas que ella.
• Grupo C (confinado): no recibe descargas durante esta fase, pero
esta confinado en el aparato el mismo tiempo que las demás.
ii. Fase de condicionamiento
• Los tres grupos reciben un entrenamiento de escape – evitación.
• Consiste en que las ratas vayan de un lado al otro en una
caja lanzadera y así evitar una descarga.
• Resultado:
i. Los grupos E y C aprenden rápido en el entrenamiento de escape a
evitar la descarga.
ii. El grupo A no aprende a evitar la descarga.
• La exposición a una descarga incontrolable produce una severa
interrupción del aprendizaje posterior de escape – evitación.
• Estos resultados; las diferencias en la tasa de aprendizaje entre estos dos
grupos, muestra que los animales son sensibles a la contingencia respuesta –
reforzador.
46
• La hipótesis de la indefensión aprendida:
• Exposición a descargas incontrolables —— aprendizaje de que los
reforzadores son independientes de las conducta propia.
• Déficit de aprendizaje producido por dos razones:
i. Expectativa de falta de control —— reducción de motivación
para realizar RI’s
ii. Si se emiten RI, el aprendizaje previo dificulta el aprendizaje
posterior.
• Hipótesis del déficit de actividad
• Descarga inescapable produce una disminución en el movimiento motor
i. Esto provoca los posteriores déficits de actuación
ii. Hipótesis del déficit atencional
• Descarga inescapable provoca un déficit atencional hacia las propias
acciones
i. Dificultades para asociar las acciones propias con los
reforzadores contingentes a ella.
• Experimento de Maier, Jackson y Tomie (1987).
30
20
10
0
1 2 3 4 5
BLOQUE DE 5 ENSAYOS
E A A-M C
47
• Relaciones estimulares en el condicionamiento de escape:
• Rasgo definitorio de la conducta de escape — la RI tiene como
consecuencia la terminación del E aversivo.
• Otras relaciones estimulares:
• Claves de retroalimentación de la terminación de la descarga:
estímulos que se experimentan al inicio de la respuesta de
escape, antes de que la descarga haya desaparecido.
• Claves de retroalimentación de la señal de seguridad: estímulos
que se experimenta cuando la descarga ha desaparecido
• Esta clave va seguida de una período de seguridad
• Son inhibidores condicionados del miedo.
• Estas señales de seguridad no existen para el grupo A
porque, para ellos, los períodos de descarga y no
descarga no son predecibles.
6. PROGRAMAS DE REFORZAMIENTO
PROGRAMAS DE RAZÓN
• Razón fija:
• El reforzamiento se obtiene tras un número de fijo de respuestas
emitidas.
48
• RF 10: diez respuestas para obtener el reforzador.
• Tasa constante y alta una vez que la conducta se ha iniciado.
• Tiempo antes de comenzar el número requerido de respuestas.
• Pausa postreforzamiento: se deja de responder un tiempo después del
reforzamiento.
• Cuanto mayor es el requerimiento conductual, mayor es la pausa
postreforzamiento.
• Tensión de la razón: cuando el requerimiento de la razón sufre un
incremento súbito y significativo se produce una pausa periódica cada
vez que se completa la razón requerida.
• En caso extremos, la tensión de la razón es tan intensa que el
animal deja de responder.
• Caso particular: RF 1: reforzamiento continuo.
• Razón variable:
• El reforzamiento se obtiene tras un número variable de respuestas
emitidas
• RV 10: con un promedio de diez respuestas se obtiene el
reforzador
• Cada cien respuestas se obtendrán diez reforzadores,
pero no se puede saber en qué puntos concretos
ocurrirá.
• Tasa constante, alta y con pocas pausas postreforzamiento o muy
cortas.
• Tasa global de respuesta similar a los programas RF.
PROGRAMAS DE INTERVALO
• Intervalo fijo:
• El refuerzo se obtiene cuando la conducta se emite pasado cierta
cantidad de tiempo.
• IF 1’: se refuerza la primera conducta emitida tras un minuto
desde la última entrega del reforzador.
• Patrón de respuesta: festón del intervalo fijo.
• Tras la entrega del reforzador, pausa larga.
• Conforme se acerca el momento en el que el reforzador vuelve a
estar disponible, aumento intenso de las respuestas.
• El intervalo determina solo cuándo el reforzador está disponible, no
cuándo se entrega.
• Intervalo variable:
• El refuerzo se obtiene cuando la conducta se emite pasada cierta
cantidad variable de tiempo.
• IV 1’: se refuerza la primera conducta emitida tras, en promedio,
un minuto desde la última entrega del reforzador.
• En un experimento de 5 minutos, se entregarán 5
reforzadores, pero no sabemos en qué momento preciso
se entregarán.
49
• Estos programas mantienen tasas de respuesta constantes y estables sin
pausas regulares.
• Programa de intervalo con margen limitado:
• Similares a los programas de intervalo, pero el sujeto tiene un tiempo
limitado para emitir la respuesta si quiere obtener el reforzador.
• Semejanzas:
• RF y IF: pausa postreforzamiento.
• RF y IF: tasas altas de respuesta justo antes de la administración del
reforzador.
• RV y IV: tasas altas de respuesta sin pausas predecibles.
• Diferencias:
• Los programas de intervalo están mediados por el
sentido temporal del organismo.
• Diferencias fundamentales: experimento de Reynolds
(1975):
• Comparación de un programa de RV y IV en
palomas.
• Mismas oportunidades de reforzamiento
• Los refuerzos de IV estaban sujetos al
programa de RV
• El programa de RV motiva una conducta
instrumental mucho más vigorosa que el IV.
¿?
50
7. PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA
RA/(RA + RB)
rA/(rA + rB)
• La ley de la igualación:
• Hernstein (1961): estudio de la distribución de las respuestas en varios
programas concurrentes IV-IV en los cuales la tasa máxima de
reforzamiento estaba fijada en 40 por hora.
51
• Por ejemplo: IV 6min y IV 2 min.
• Con el IV 2 min se pueden obtener 30 reforzadores en
una hora
• Con el IV 6 min se pueden obtener 10 reforzadores en
una hora
• Resultados: las palomas distribuían sus respuestas de forma que
la tasa relativa de respuesta en una alternativa estuviera
siempre cerca de igualar la tasa relativa de reforzamiento
logrado en esa alternativa
• Por tanto, la tasa relativa de respuestas en una
alternativa se iguala con la tasa relativa de reforzamiento
en esa alternativa.
RA/RB = b(rA/rB)s
s = sensibilidad
b = sesgo
52
• Cantidad, palatabilidad y demora influyen en la saliencia
del reforzador.
• En ausencia de sesgos b = 1.
53
• V: valor del reforzador / M: magnitud del reforzador / K:
parámetro de la tasa descontadora / D: demora en la
recompensa.
• Aplicación al tema del autocontrol:
54
b. Por la boca de forma inmediata
c. Por la boca de forma demorada
• Los resultados indican que todos los grupos aprenden,
pero unos mejor que otros:
-El reforzamiento de tomar leche por la boca fue
más efectivo que el de inyección al estómago.
-El reforzamiento de tomar leche por la boca de
forma inmediata mejor que el demorado.
55
• No obstante, el entender los reforzadores como tipos especiales
de respuestas y no como tipos especiales de estímulos abrió una
nueva forma de concebir los reforzadores.
• Teoría de Premack:
• Premack desarrolla la idea de que las respuestas pueden actuar como
reforzadores.
• Afirma que la contingencia real se produce entre dos respuestas:
por ejemplo, la presión de palanca y la oportunidad de comer.
• La presión de palanca es una respuesta instrumental
reforzada por la respuesta de comer.
• Factor fundamental para el reforzamiento: diferencia en la probabilidad
de cada una de las respuestas.
• Dos respuestas con diferente probabilidad de aparición: A y B //
PA > PB
• A actúa como reforzador de la respuesta B: principio de
Premack de la probabilidad diferencial.
• Reforzamiento si las respuestas menos probables
permiten realizar las respuestas más probables
56
• Hacemos contingente la conducta de correr con la
conducta de beber (en el grupo B).
• Para poder correr, las ratas tienen que beber: 6
lameteos —— 10’ en la rueda de actividad
• En la línea base (previo al establecimiento de la
contingencia), las ratas bebían durante 23’’
• Resultados: tras la contingencia el tiempo de
beber aumentó a 98’’
• Conclusión: la respuesta más frecuente (correr)
refuerza la respuesta menos frecuente (beber)
57
• Teoría de la regulación conductual
• Supuesto básico: cuando los organismos son libres de elegir entre varias
alternativas de respuesta, distribuyen sus actividades de la forma más
óptima posible.
• La mejor forma de distribución de las respuestas es el punto de
deleite conductual.
• Cuando se impide a un organismo realizar una determinada respuesta
por debajo de su línea base de actuación, este hará todo lo posible por
realizar cualquier otra respuesta que le permita acercarse al punto de
deleite conductual.
• Si introducimos una contingencia respuesta-reforzador, el
organismo cambiará su actividad y hará todo lo posible por
reestablecerla.
• En este caso el reforzador actuará como regular
conductual.
• Ejemplo del joven que tiene que elegir entre jugar al ordenador y
ponerse a estudiar.
58
1.IDENTIFICACIÓN Y MEDIDA DEL CONTROL POR EL ESTÍMULO
2. FACTORES DEL ESTÍMULO Y LA RESPUESTA EN EL CONTROL POR EL ESTÍMULO
3. FACTORES DE APRENDIZAJE EN EL CONTROL POR EL ESTÍMULO
4. ¿QUÉ SE APRENDE EN LE ENTRENAMIENTO EN DISCRIMINACIÓN?
5. INTERACCIONES ENTRE EL E+ Y EL E- : DESPLAZAMIENTO DEL MÁXIMO
¿Cómo se puede afirmar que una respuesta instrumental está bajo el control de ciertos
estímulos?
59
• Efecto de discriminación de estímulos: cuando se responde de forma diferente
a dos o más estímulos.
• La conducta de picoteo de cada pájaro estaba controlada por un estímulo
diferente (la discriminación es específica del organismo y no universal).
• No se puede predecir qué EE adquirirán la propiedad de controlar la
conducta.
• GENERALIZACIÓN DE ESTÍMULOS:
• Los estímulos pueden definirse de formas muy distintas: función, rasgos
físicos, etc.
• Generalización y discriminación opuestos: si hay mucha generalización
hay poca discriminación y viceversa.
• Generalización: cuando se responde de forma similar a dos o más
estímulos.
590
600
615
640
generalización de un estímulo proporciona
una medida precisa del grado de control
del estímulo.
• Se obtiene un gradiente de
LONGITUD DE ONDA
generalización plano si el
organismo responde de forma
similar a todos los EE de la prueba
(ningún control por el estímulo).
¿Qué determina que una de las muchas características de una situación estimular
adquiera control sobre la conducta instrumental?
1. Capacidad sensorial y orientación: que el organismo pueda percibir el
estímulo**
2. Facilidad relativa del condicionamiento de varios estímulos.
3. Tipo de reforzamiento
4. Tipo de respuesta instrumental
60
• FACILIDAD RELATIVA DEL CONDICIONAMIENTO DE VARIOS ESTÍMULOS
• Ensombrecimiento: interferencia en el condicionamiento de un
estímulo debido a la presencia simultánea de otro estímulo que es más
fácil de condicionar
• Pavlov (1927): primero en observar que si dos estímulos se presentan al
mismo tiempo, la presencia del estímulo que se puede entrenar más
fácilmente puede “ocultar” el aprendizaje del otro.
• En general, cuanto más intenso sea el estímulo, más rápido se
condicionará y ensombrecerá el aprendizaje del estímulo más débil.
• TIPO DE REFORZAMIENTO
• Experimento de Foree y LoLordo (1973):
• Sujetos: palomas.
• Entrenamiento: presión pedal en presencia de un estímulo compuesto
por: luz roja y tono de 440 Hz
• Dos grupos.
i. Reforzamiento con comida al pulsar el pedal.
ii. Evitación de una descarga al pulsar el pedal.
• Ensayos de prueba: solo se presenta la luz o el sonido.
14
12 mucho más cuando se presentó solo la luz
10 que cuando se presentó solo el tono
PRUEBA
8
6
• Las palomas que fueron entrenadas con
4 reforzamiento con evitación de una descarga
2 respondieron mucho más cuando se presentó
0 solo el tono que cuando se presentó solo la
Refozamiento con Reforzamiento con
comida evitación de una
luz.
descarga • El control por el estímulo de la conducta
instrumental está determinado en parte por
Tono Luz Tono + Luz
el tipo de reforzamiento utilizado
61
i. Grupo 1: entrenamiento en tarea derecha/izquierda
(importancia de la localización de la respuesta)
• Metrónomo —— levantar pierna derecha
• Zumbador —— levantar pierna izquierda
ii. Grupo 2: entrenamiento en una tarea de hacer/no hacer
(importancia de la naturaleza de la repuesta)
• Zumbador —— levantar pierna derecha
• Metrónomo —— no levantar pierna derecha
• ¿Qué aspecto de las claves auditivas —naturaleza o localización—
adquiriría control sobre la conducta instrumental en los dos grupos?
i. Prueba: Se intercambian las posiciones del metrónomo y el
zumbador (metrónomo detrás y zumbador delante) y se prueba
qué aspecto (localización o naturaleza del sonido) controla qué
conducta.
• Resultados:
• Grupo 1 (tarea derecha — izquierda): levantaron la pata derecha
en respuesta al sonido de enfrente, más que en función de si el
sonido era producido por el metrónomo o el zumbador.
• Conducta controlada de forma más intensa por la
localización que por la naturaleza de los sonidos
• Grupo 2 (tarea hacer — no hacer): levantaron una pata en
respuesta al zumbador si el sonido venía de enfrente o de detrás
y no la levantaron cuando estaba sonando el metrónomo.
• Conducta controlada por la naturaleza del sonido más que
por su localización.
• Las respuestas que se diferencian por la localización es más que
probable que lleguen a estar bajo el control de la característica
espacial de las claves auditivas.
• Las respuestas que se diferencian por la naturaleza es más
probable que lleguen a estar bajo el control de la naturaleza de
las claves auditivas
62
• Proponen que la generalización ocurre si los organismos no han
aprendido a distinguir las diferencias entre los estímulos.
• ¿Qué estrategias puede utilizar un sujeto para asegurar que la mayoría de sus
respuestas serán reforzadas en una situación de control por discriminación?
1. Aprender a responder en presencia del E+ y no aprender nada sobre el
E—
2. Aprender a suprimir la respuesta durante el E—, pero no aprender nada
sobre el E+
3. Aprender el significado del E+ y del E—.
• Sujetos: palomas.
• Procedimiento (I): entrenamiento en discriminación con estímulos visuales.
• Dos grupos:
i. Grupo 1:
a. Reforzamiento —— tecla iluminada con luz blanca y línea
vertical negra (E+)
b. No reforzamiento —— tecla iluminada con luz blanca sin línea
vertical negra (E—)
ii. Grupo 2: (contrario)
64
a. Reforzamiento —— tecla iluminada con luz blanca sin línea
vertical negra (E+)
b. No reforzamiento —— tecla iluminada con luz blanca y línea
vertical negra (E—)
• Procedimiento (II): prueba de generalización variando el ángulo de la línea
vertical.
65
• Los otros dos grupos desplazan el máximo hacia colores con menores
longitudes de onda (se recuerda que la respuesta nunca había sido reforzada
con picoteos ante teclas de 540 nm).
• Las tasas más altas de respuesta se dieron ante estímulos que nunca
habían sido presentados durante el entrenamiento original.
66
1.INTRODUCCIÓN
2. EFECTOS DE LOS PROCEDIMIENTOS DE EXTINCIÓN
3. EXTINCIÓN Y APREDIZAJE ORIGINAL
4. EFECTOS PARADOJICOS DE LA RECOMPENSA
5. EFECTOS DEL REFORZAMIENTO PARCIAL EN LA EXTINCIÓN
1.INTRODUCCIÓN
67
• La paloma 2 es reforzada con comida y está centrada en su
reforzamiento, ignorando a la paloma 1.
• Cuando se aplica extinción a la paloma 2…
• …se acerca a la paloma 1 y comienza a agredirla.
RECUPERACIÓN ESPONTANEA
70
ii. Teoría secuencial.
• (los mecanismos propuestos por ambas teorías
contribuyen a la persistencia de la respuesta)
Teoría de la frustración:
• Asume que el reforzamiento intermitente da como resultado aprender a
responder a pesar de esperar la ausencia de reforzamiento.
• Al principio del entrenamiento, los sujetos entrenados con reforzamiento
intermitente están en conflicto con lo que se ha de hacer.
• Sus expectativas motivan tendencias de respuesta opuestas.
• A medida que el entrenamiento continua, el conflicto se resuelve a
favor de responder.
• La respuesta instrumental se condiciona a la expectativa de la ausencia de
recompensa.
• Clave de la teoría: el reforzamiento intermitente da como resultado el
aprendizaje de realizar la respuesta instrumental como reacción a la
expectativa de ausencia de recompensa.
• Por el contrario, no existe nada en la experiencia del reforzamiento
continuo que motive a los sujetos a responder cuando esperan ausencia
de recompensa.
Teoría secuencial:
• Propuesta por Capaldi y formulada en términos de conceptos de memoria.
• Asume que los sujetos pueden recordar si fueron reforzados por realizar la
respuesta instrumental en el pasado reciente.
• Asume además que durante el entrenamiento en reforzamiento intermitente,
la memoria de ausencia de recompensa llega a ser una clave para la realización
de la respuesta instrumental, lo que produce persistencia en la extinción.
• La forma exacta en la que esto ocurre depende en gran medida de la
secuencia de ensayos recompensados (R) y no recompensados (N) que
se administran en el programa de reforzamiento intermitente.
• Por ejemplo: RNNRRNR
• En el cuarto ensayo, el sujeto es reforzado tras no recibir
recompensa en los dos ensayos precedentes.
La memoria de los ensayos no recompensados llega a ser una clave para la respuesta
71
1. INTRODUCCIÓN
2. DISTINCIÓN ENTRE REFUERZO NEGATIO, CASTIGO Y
EXTINCIÓN
3. METODOLOGÍA EXPERIMENTAL
4. CONDICIONAMIENTOS DE ESCAPE
5. CONDICIONAMIENTO DE EVITACIÓN
6. EL CASTIGO
1.INTRODUCCIÓN
72
• El resultado (a medio-largo plazo) es la disminución de la probabilidad
de la respuesta
3. METODOLOGÍA EXPERIMENTAL
4. CONDICIONAMIENTO DE ESCAPE
73
5. CONDICIONAMIENTO DE EVITACIÓN
74
también como un procedimiento de condicionamiento instrumental
(donde la respuesta se da de un modo “controlado”).
• ¿Cuál de los dos procedimientos da lugar a aprendizajes más intensos?
• Experimento de Wahlstein y Cole (1972):
• Sujetos: perros.
• VD: tasa de aprendizaje de la respuesta de flexión de la pata.
• Dos procedimientos: CC (no control de la respuesta de evitación)
y CI (control de la respuesta de evitación).
• CC: Emparejamiento EC-EI independientemente de la
conducta del sujeto.
• CI: Si se emite la conducta, se evita el reforzador.
• Conclusiones:
• Si interpretamos desde un CI, las respuestas de evitación son
reforzadas por sus consecuencias.
• Si interpretamos desde un CC, nos encontramos con varios
problemas.
1. En el grupo de CI, según avanza el entrenamiento, la
señal se presenta sola (sin reforzador). Si interpretamos
desde un CC, se estaría aplicando un procedimiento de
extinción clásica, de forma que la fuerza de la respuesta
debería disminuir. Sin embargo, ocurre lo contrario.
2. Interpretando desde el CC, este grupo debería tener
mayor tasa de respuestas que el de CI, dado que todas
las respuestas son reforzadas. Sin embargo, ocurre lo
contrario.
75
VARIABLES QUE INFLUYEN EN EL CONDICIONAMIENDO DE EVITACIÓN
• Intensidad del estímulo:
• Interacción entre la intensidad del estímulo y la dificultad de la tarea de
evitación
• Tarea sencilla —— A mayor intensidad del estímulo aversivo,
mayor velocidad de aprendizaje y mayor tasa de respuesta.
• Tarea compleja —— Los estímulos de intensidad alta dificultan
la adquisición de la respuesta de evitación
• Intervalo entre estímulos (presentación del estímulo discriminativo y la
aparición del estímulo aversivo)
• Intervalos muy largos o muy cortos hace que la respuesta se adquiera
peor.
• Lo más utilizado en experimentación son 10’’.
• Intervalo entre ensayos
• Intervalos cortos dificultan mucho el aprendizaje.
• Intervalos más largos, mejor (1-5 minutos).
• Dificultad de la tarea:
• A mayor dificultad de la tarea, mayor dificultad en el aprendizaje de
evitación.
76
TEORIAS EXPLICATIVAS DE LA EVITACIÓN
• Teoría de los dos procesos (Mowrer, 1960)
• Dos procesos implicados en el aprendizaje de evitación:
i. Proceso de condicionamiento clásico: el sujeto aprende a tener
miedo a la señal de aviso (EC).
ii. Proceso de condicionamiento instrumental: el sujeto aprende la
respuesta de evitación, reforzada por la reducción del miedo (y
no por la eliminación del estímulo aversivo).
• El sujeto no aprende a dar una respuesta instrumental
para evitar un estímulo aversivo, sino para escapar del
miedo que le produce la señal de aviso.
• Es un aprendizaje basado en las emociones, más que en
las consecuencias.
• Puesta a prueba de la teoría: experimento del impulso adquirido de
Brown y Jacobs (1947):
Sujetos: ratas. // VD: latencia de la respuesta (cambio de
compartimento).
Contexto: Caja con dos compartimentos
Dos fases y dos grupos:
• Fase 1: compartimentos estancos
• Grupo experimental: Presentación de un estímulo
discriminativo (señal) seguido de un estímulo
aversivo inevitable (descarga) (20 ensayos)
• Grupo control: Mismo tratamiento pero sin la
aplicación del estímulo aversivo.
• Fase 2: compartimentos conectados
• Grupo experimental y control: el animal puede
cambiar de compartimento, con lo que hace que
el estímulo discriminativo (señal) desaparezca.
• Independientemente de la conducta, no se
recibe descarga.
• Puesta a prueba de la teoría de los dos procesos: experimento del impulso
adquirido de Brown y Jacobs (1947):
• Resultados:
• La latencia de la respuesta fue
menor en el grupo
experimental que en el grupo
control.
• La respuesta aprendida fue la
respuesta contingente con la
señal.
• Conclusiones:
• La finalización del estímulo que
suscita el miedo parece ser suficiente para que el animal aprenda a
realizar la respuesta instrumental.
• Problemas de la teoría:
77
• Una de las predicciones de la teoría es que el miedo motiva la conducta
de evitación:
i. Si esto es así, la cantidad de miedo debería correlacionar con la
fuera de la respuesta de evitación.
• Sin embargo, cuando el entrenamiento es prolongado, la
respuesta de evitación es muy fuerte y el miedo, por el
contrario, es muy débil.
78
• La diferencia radica en que la respuesta de evitación
reduce la probabilidad de recibir el estímulo aversivo y la
respuesta de escape solo lo retira cuando está presente.
• Limitación: no explica los resultados proporcionados por los
experimentos sobre el impulso adquirido.
6. EL CASTIGO
• Variables:
• Intensidad del castigo: relación directa entre la intensidad del castigo y
la supresión de la respuesta.
• Castigos de intensidad baja suprimen la respuesta solamente de
forma temporal, volviendo la tasa de respuesta a los valores
anteriores a la aplicación del castigo.
• Castigos de intensidad moderada suprimen la respuesta de
forma más duradera.
79
• Castigos de alta intensidad dan lugar a la supresión total y
duradera de la respuesta.
• Experimento de Azrin y Holz (1961)
• Sujetos: Palomas.
• Primera fase: entrenamiento en picoteo de disco
(reforzado con comida).
• Segunda fase (castigo): aplicación de distintas
intensidades de descarga según un programa IF 5
minutos.
• Resultados:
i. Cuanto mayor es el castigo, mayor supresión de la respuesta.
ii. Recuperación de la respuesta ante intensidades moderadas, pero no
ante intensidades altas.
iii. La experiencia previa con el castigo influye en la efectividad de un
determinado castigo para suprimir la respuesta.
iv. El castigo produce un efecto de rebote al aumentar la tasa de
respuestas por encima de la línea base anterior al castigo.
v. Cuando las intensidades del castigo se van aumentando de forma
progresiva a lo largo de la sesión experimental, la supresión de la
respuesta es menor que si se comienza desde el principio con una
intensidad y se mantiene durante todo el entrenamiento.
• Efecto de habituación al castigo.
• Consiste en la presentación de un estímulo aversivo tras la
realización de una respuesta instrumental.
El resultado de este entrenamiento es una reducción de la fuerza
de la respuesta.
• Variables:
• Duración del castigo: relación directa entre la duración del castigo y la
supresión de la respuesta.
• Demora del castigo: cuanto más cercano a la respuesta, más efectivo
es.
• Programa de castigo:
80
• Para que el castigo sea eficaz debe aplicarse de forma
consistente.
• Experiemento de Azrin, Holz y Hake (1963).
• Fase 1: Palomas entrenadas para picotear disco con un
programa IV 3 minutos.
• Fase 2: Castigo bajo programa de razón fija que varía
entre RF 1 y RF 1000.
• La supresión de la respuesta
disminuye a medida que aumenta
el número de respuestas exigido
por el programa de castigo.
• Cuanto mayor es la relación
de contingencias respuesta –
refuerzo, mayor es el efecto del
castigo sobre la supresión de la
respuesta.
• Variables:
• Castigo discriminado:
• A veces el castigo cae bajo el control de un estímulo
discriminativo.
• Cuando esto ocurre, el castigo es muy poco efectivo.
• Dinsmoor (1952):
• Fase 1: entrenamiento de presión de palanca IV 2
minutos
• Fase 2:
i. 5 minutos con la luz apagada: castigo.
ii. 5 minutos con la luz encendida: no castigo.
• Resultados: los animales aprenden a presionar la palanca
solo cuando la luz está encendida.
• La persona que aplica el castigo puede convertirse en el estímulo
discriminativo.
• Limitaciones y precauciones del castigo:
• Problemas éticos dado que el único castigo eficaz a largo plazo es el de
intensidad alta.
• Es poco probable que el castigo se pueda aplicar siempre que se emite
la respuesta
• También es poco probable que no quede sujeto a estímulos
discriminativos concretos.
• En ocasiones el agente que aplica el castigo solo puede hacerlo tras una
demora larga tras la ejecución de la respuesta que se quiere suprimir.
81
• Puede tener efectos indeseables:
• Respuestas de contracontrol.
• Genera respuestas agresivas en el agente que aplica el castigo.
• Genera respuestas agresivas en la persona que recibe el castigo.
• El agente que aplica el castigo puede convertirse en un estímulo
aversivo por CC.
82