Está en la página 1de 26

Aprendizaje y Conducta.

Tema 5. Condicionamiento Instrumental: Fundamentos

Condicionamiento
Condicionamiento Instrumental:
Instrumental:
Fundamentos
Fundamentos

Domjan, captulo 5.

Condicionamiento clsico:

Estmulo
Estmulo

Conducta
Conducta

Conducta
instrumental

Condicionamiento instrumental:

Conducta
Conducta

Consecuencia
Consecuencia

Conducta
Conducta

La conducta produce la consecuencia.


Pero la consecuencia afecta a la conducta posterior.

Fernando Blanco; 2007

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Clever Hans

2x3=...

Thorndike: las cajas-problema

-Aprendizaje por ensayo y error.


-Latencias progresivamente ms
cortas: el animal aprende.

Conducta:
Conducta:
tirar
tirarde
delalacuerda
cuerda

Consecuencia:
Consecuencia:
lalapuerta
puertase
seabre
abre

Repetir
Repetir
la
laconducta
conducta

Asociacin
Respuesta-Estmulo

Fernando Blanco; 2007

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Thorndike: las cajas-problema

Ley del Efecto (Thorndike):


-Una conducta aparece en presencia de un estmulo
(por ejemplo, la caja problema en s), y es seguida de
una consecuencia satisfactoria (salir de la caja).
-Se fortalece la asociacin entre ese estmulo y esa
conducta (asociacin E-R).
Por eso se repite la conducta.
CUIDADO: la asociacin es entre la conducta y el
estmulo que est presente al producirla.

Ensayo Discreto vs. Operante Libre

Ensayo discreto:
Ej: Cajas-problema, Laberintos.
Slo se da una respuesta instrumental en cada ensayo.

Fernando Blanco; 2007

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Ensayo Discreto vs. Operante Libre

Ensayo discreto:
Ej: Cajas-problema, Laberintos.
El experimentador decide cundo puede responder el
animal.

Medimos la LATENCIA: tiempo que tarda en abandonar la


caja de salida (en el laberinto) o en dar la respuesta
correcta (caja-problema).
Medimos la VELOCIDAD DE LA CARRERA (en el
laberinto).

Ensayo Discreto vs. Operante Libre


Operante Libre (Skinner):
Ej: presin de palanca en la caja de Skinner.
El animal decide cundo responde, y puede hacerlo una
y otra vez.
Unidad de respuesta = operante.
Capa operante produce un efecto en el ambiente, que
hace que la respuesta aparezca con ms o con menos
frecuencia en el futuro.

Fernando Blanco; 2007

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La caja de Skinner

NOTA: NO es
este Skinner

La otra caja de Skinner


Sueo: sociedad
perfeccionada gracias a la
ciencia de la conducta.
Aplicacin radical del
conductismo.
...y mucha malinterpretacin
por parte de la prensa).

Fernando Blanco; 2007

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Ensayo Discreto vs. Operante Libre


Operante Libre (Skinner):
Medimos la tasa de ocurrencia
de la respuesta operante. Ej:
8 pulsaciones de la palanca
por minuto. Cuanto ms
probable es la conducta, mayor
tasa de respuesta.
Segn la ley del efecto, una
conducta seguida de una
consecuencia positiva aumenta
su tasa de ocurrencia.

Ensayo Discreto vs. Operante Libre


Definiendo el reforzador:
Reforzador = Todo aquel estmulo que:
1. Aparezca como consecuencia de una conducta.
2. Provoque que esa conducta se haga ms frecuente en
el futuro.
Problemas: Definicin circular. No puedo predecir si un
estmulo ser un reforzador.

Fernando Blanco; 2007

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Ensayo Discreto vs. Operante Libre

La conducta operante puede no aparecer en el


repertorio original del animal. Entonces:
Moldeamiento:
Reforzamiento de conductas cada vez ms parecidas
a la conducta meta.
Cada conducta reforzada se hace ms probable. Se
trabaja por fases.

Moldeamiento:

Escojo siempre la
conducta ms
parecida a la meta
para ser reforzada.

Conducta meta

Primer set
de conductas

Segundo set
de conductas

Al reforzar una
conducta, la hago
ms probable.

Tercer set
de conductas

Fernando Blanco; 2007

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Moldeamiento:
Lo mejor para entender el moldeamiento es HACERLO (Sniffy).
Gracias
Graciasalal
moldeamiento,
moldeamiento,
podemos
podemosensear
ensearaa
Sniffy
Sniffyaapulsar
pulsaruna
una
palanca
palancapara
paraobtener
obtener
comida.
comida.

Gracias
Graciasalal
moldeamiento,
moldeamiento,yo
yopuedo
puedo
ensear
al
investigador
ensear al investigadoraa
que
queme
med
dcomida
comidapor
por
pulsar
una
pulsar unapalanca.
palanca.

Moldeamiento:

Palomas jugando al ping-pong


gracias al moldeamiento.

Fernando Blanco; 2007

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva

Negativa

Apetitiva
Reforzamiento
Positivo

Entrenamiento
De Omisin

Castigo

Reforzamiento
Negativo:
Escape,
Evitacin

Aversiva

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva

Negativa

Apetitiva
Reforzamiento
Positivo

Aversiva

Conducta Consecuencia
apetitiva.
Hace que la conducta se haga
ms frecuente (ms tasa de
respuesta).
Ej: Premios

Fernando Blanco; 2007

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva

Apetitiva

Negativa

Conducta Consecuencia
aversiva.
Hace que la conducta se haga
menos frecuente (suprime
conductas).

Aversiva

Castigo

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva

Negativa

Apetitiva

Entrenamiento
De Omisin
Aversiva

Conducta NO
Consecuencia apetitiva.
Hace que la conducta se haga
menos frecuente (menos tasa
de respuesta).
Ej: Castigado sin postre!

Fernando Blanco; 2007

10

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Procedimientos de condicionamiento instrumental

Estimulacin

Contingencia
Positiva

Apetitiva

Negativa

Conducta NO
Consecuencia aversiva.
Hace que la conducta se haga
ms frecuente (ms tasa de
respuesta).
Ej: Hacer caso a un no que
llora porque no te deja dormir.

Aversiva

Reforzamiento
Negativo:
Escape,
Evitacin

Con este ltimo siempre


metemos la pata.
Recordemos que
aumenta la tasa de
respuesta, igual que el
refuerzo positivo.

Procedimientos de condicionamiento instrumental

Escape / Evitacin
Escape
Estimulacin aversiva

Conducta
Estimulacin aversiva
La estimulacin aversiva
se detiene si se da la
conducta

Fernando Blanco; 2007

11

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

Procedimientos de condicionamiento instrumental

Escape / Evitacin
Evitacin
Conducta

Estimulacin aversiva
La estimulacin aversiva
no se inicia si se da la
conducta

La respuesta instrumental
Normalmente:
El reforzamiento produce conductas estereotipadas,
reduce la variabilidad de la conducta.
Conductas variadas Reforzamiento Conductas estereotipadas

Pero tambin es posible reforzar la variabilidad. Con lo


que aumentamos la variabilidad de la conducta
mediante reforzamiento.
(Ej: Slo recompenso al animal cuando lleva a cabo un
patrn de respuestas novedoso).

Fernando Blanco; 2007

12

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental
Pertinencia.
Por su naturaleza, hay estmulos que se asocian mejor
con otros.
En el condicionamiento clsico:

Mal
condicionamiento

EC:
SABOR

EI:
DESCARGA

La respuesta instrumental
Pertinencia.
Por su naturaleza, hay estmulos que se asocian mejor
con otros.
En el condicionamiento clsico:

Buen
condicionamiento

EC:
SABOR

EI:
Enfermedad

Fernando Blanco; 2007

13

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental
Pertinencia.
Por su naturaleza, hay estmulos que se asocian mejor
con otros. Tambin en el condicionamiento
instrumental.
Debe haber cierta correspondencia entre la
respuesta y el reforzador.
Pero recordemos: El reforzador se define por su efecto
sobre la conducta (decamos que era una definicin
circular). No sabemos seguro si un estmulo servir
como reforzador de una conducta en concreto.

La respuesta instrumental
Pertinencia.
Sujeto: Pez macho.
Respuesta: Gesto de morder.
Reforzador: Aparicin de otro pez macho.

Respuesta: morder

Reforzador: macho

Fernando Blanco; 2007

14

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental
Pertinencia.
Sujeto: Pez macho.
Respuesta: Gesto de morder.
Reforzador: Aparicin de un pez hembra.
No hay buen condicionamiento

Respuesta: morder

Reforzador: hembra

La respuesta instrumental
Pertinencia.
Morder: conducta agresiva. La practican los machos con
otros machos.
Cuando el reforzador es un macho: el condicionamiento
es bueno. La respuesta morder tiene que ver con el
reforzador.

Estoy
Estoyque
queecho
echo
chispas.
Dnde
chispas. Dndeest
est
mi
mirival?
rival?Que
Queme
melolo
como!
como!

Fernando Blanco; 2007

15

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental
Pertinencia.
Cuando el reforzador es una hembra: El gesto de
morder no es una respuesta adecuada para ser
reforzada con acceso a una hembra.
Por otro lado:
Si la conducta que quiero reforzar es el baile de cortejo,
entonces sucede justo al revs (mejor que el reforzador
sea el acceso a una hembra).
Ha de haber cierta relacin entre la respuesta y el
reforzador.

La respuesta instrumental
Pertinencia.

Aqu lo vemos: El acceso a


una hembra es el reforzador
adecuado para la conducta
del baile de cortejo.

Respuesta: cortejo

Reforzador: hembra
Estudias
Estudiasoo
trabajas,
trabajas,liiinda?
liiinda?

Fernando Blanco; 2007

16

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La respuesta instrumental
Cmo predigo si una conducta es
apropiada para reforzarla con un
reforzador en concreto?

Cuando tiene hambre, se activa el


sistema de conducta de alimentacin
(buscar comida).
Estas conductas (olfatear, excavar...)
forman parte del sistema de
alimentacin y en esta condicin de
privacin se hacen ms frecuentes.

Una ayuda son los Sistemas de


conducta (ver captulo 4).

Conductas del animal en


su estado natural:
20% Erguirse
20% Limpiarse
20% Rascarse
20% Excavar
20% Olfatear

Conductas del animal con


hambre (privado de comida):
30% Erguirse
Las conductas
2% Limpiarse
del sistema de
3% Rascarse
alimentacin se
30% Excavar
refuerzan mejor
35% Olfatear
con comida.

El reforzador instrumental
Cantidad y calidad del reforzador:
Afecta a la cantidad e intensidad de la respuesta.
Reforzador cuantioso y de calidad Respuesta frecuente
e intensa.

Qu pasa si la cantidad o la calidad del reforzador


varan a lo largo del experimento?
Lo predice el modelo de Rescorla & Wagner.
Cambios en el reforzador = ms sorpresa (positiva o
negativa).

Fernando Blanco; 2007

17

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

El reforzador instrumental

Trabajo

Trabajo ms

Comparo lo que tena


antes con lo que tengo
ahora

Trabajo

Trabajo menos

El reforzador instrumental

Trabajo

Trabajo ms

El contraste
es importante.

Trabajo

Trabajo
MUCHO ms

Fernando Blanco; 2007

18

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

El reforzador instrumental

Contraste positivo:
Recompensa mala Recompensa regular ++RC.
Contraste negativo:
Recompensa muy buena Recompensa buena --rc.
Ej: nio rico.
Estoy acostumbrado a
tenerlo todo
Richie Rich

La relacin respuesta - reforzador instrumental

Contigidad temporal:
El reforzador sigue inmediatamente a la respuesta.
Contingencia:
El reforzador sigue a la respuesta y slo a la respuesta.
Entonces podemos decir que tienen una relacin causal.
La respuesta es la causa del reforzador.
Puede haber contigidad sin contingencia y contingencia
sin contigidad.

Fernando Blanco; 2007

19

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental

Contigidad temporal:
El condicionamiento es mejor si la demora es corta
(mucha contigidad).
Explicacin: el animal no sabe qu conducta ha sido
reforzada.
Reforzamiento no contiguo:
R1

R3

R2

Reforzador

R4

?
Tiempo

La relacin respuesta - reforzador instrumental

Contigidad temporal:
El condicionamiento es mejor si la demora es corta
(mucha contigidad).
Explicacin: el animal no sabe qu conducta ha sido
reforzada.
Reforzamiento contiguo:
R1

Reforzador

R1

Tiempo

Fernando Blanco; 2007

20

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental

Contigidad temporal:
A veces no es posible presentar el reforzador
inmediatamente despus de la conducta.
Maneras de resolver esa situacin:
1- Usar un reforzador condicionado o secundario.

La relacin respuesta - reforzador instrumental


(Es el mismo
estmulo que har
de reforzador)

EI

EC

EI
R1
EC

En vez del
reforzador,
presento el EC
que estaba
asociado con el
reforzador.

Tiempo
Ahora s hay contigidad

Fernando Blanco; 2007

21

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental

Contigidad temporal:
A veces no es posible presentar el reforzador
inmediatamente despus de la conducta.
Maneras de resolver esa situacin:
1- Usar un reforzador condicionado o secundario.
2- Marcado. Un estmulo aparece tras las respuestas
correctas (que son las que se reforzarn) y tras las
incorrectas. As el animal sabe qu conducta es la que se
va a reforzar (marca la respuesta que es importante de
cara a obtener el reforzador).

La relacin respuesta - reforzador instrumental

Contingencia respuesta-reforzador:
La entrega del reforzador depende de la ejecucin de la
respuesta. No hay reforzador si no hay respuesta.
Es tan importante como la contigidad.
Mejor que estn las dos.

Fernando Blanco; 2007

22

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental

Supersticin (Skinner)
Experimento: Entrega de comida independiente de la
conducta (cada 15 segundos). No hay contingencia, por
tanto, entre conducta y reforzador.
Resultado: Aparecen conductas extraas en las
palomas.
Las palomas se comportan como si estas conductas
controlaran la administracin del reforzador.

La relacin respuesta - reforzador instrumental


Supersticin (Skinner)

R1

R2

Tiempo

Reforzador

R3

Reforzamiento
Reforzamiento
accidentaloo
accidental
adventicio.
adventicio.

Laconducta
conductaprevia
previaalal
La
reforzadorNO
NOtiene
tiene
reforzador
contingenciacon
conelel
contingencia
reforzador,pero
perosstiene
tiene
reforzador,
contigidad,
por
puro
azar.
contigidad, por puro azar.

R4
R2

R2

Esaconducta
conductaque
quepor
por
Esa
azarha
hasido
sidocontigua
contiguaalal
azar
reforzadorse
sehace
hacems
ms
reforzador
frecuenteen
enelelfuturo.
futuro.
frecuente

Alser
serms
msfrecuente,
frecuente,es
es
Al
ms
probable
que
ms probable que
vuelvaaaser
serreforzada
reforzada
vuelva
accidentalmente.
accidentalmente.

Fernando Blanco; 2007

23

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental


Supesticin (Skinner)

Este mecanismo puede explicar


las supersticiones humanas.

La relacin respuesta - reforzador instrumental


Indefensin aprendida (Seligman)
Ingredientes para hacer un experimento de indefensin aprendida:

Pared baja
Gato
(No hace
falta que
sea un
gato
espacial)*

*Nota: el experimento
original usaba perros

Lado
seguro

Es por tanto un
procedimiento
de Escape.

Descargas

Fernando Blanco; 2007

24

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental


Indefensin aprendida (Seligman)
En la segunda fase, hacemos un cambio en la jaula experimental:

Pared
inaccesible

Al subir la altura
de la pared que
separa los dos lados,
el pobre gato queda
confinado en el lado de
las descargas.

La relacin respuesta - reforzador instrumental


Indefensin aprendida (Seligman)
Por ltimo, volvemos a poner la pared a la altura inicial:

Ya no quiero
saltar, esto no
tiene remedio!
La vida es
injusta.

Pared baja
de nuevo

El gato ni siquiera
intenta saltar:
INDEFENSIN APRENDIDA

Fernando Blanco; 2007

25

Aprendizaje y Conducta.
Tema 5. Condicionamiento Instrumental: Fundamentos

La relacin respuesta - reforzador instrumental


Indefensin aprendida (Seligman)
La exposicin a estimulacin aversiva incontrolable ha
producido inactividad (como no puedo controlar lo que
me pasa, no tiene sentido intentar cambiarlo).
La indefensin aprendida se relaciona con la depresin.
Puede ser debido a un dficit atencional.
Tiene, por lo tanto, 3 tipos de consecuencias: motoras
(inactividad), cognitivas (distorsiones cognitivas, falta de
atencin), y emocionales (depresin).

Hasta aqu llegamos,


Muchas gracias!

Diapositivas de Fernando Blanco, 2007


Pgina web: http://www.labpsico.com/pers/blanco/FernandoBlanco.htm

Fernando Blanco; 2007

26

También podría gustarte