Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AME Tema 4
AME Tema 4
Tema 4: Condicionamiento
instrumental
Bibliografía: Domjan (2006) Cap. 5, 6, 7, 9, 10
2
Situaciones experimentales CI
Extinción en CI
Las siguientes dos transparencias se refieren a la descripción de los primeros
experimentos de condicionamiento instrumental realizados por Thorndike, tal y como
se describe en las páginas 62-63 del documento de lecturas.
700
Tal y como se indica en las lecturas (página 63), esta ley del efecto plantea que “quan
un animal executa una conducta que va seguida d’un esdeveniment agradable llavors
els estímuls presents en el moment de la resposta i la resposta quedaven connectats
de manera que en el futur la presència dels estímuls activava directament la resposta a
ells connectada. Si la conseqüència era aversiva, llavors la connexió es debilitava.”
Elementos del CI
- E (Ed: estímulo discriminativo): El contexto (el aparato
experimental), o cualquier estímulo discreto (p.ej. una
luz) o varios presente/s cuando se obtiene la
consecuencia.
- R: Respuesta
- C: consecuencia
Para Thorndike, la asociación es E → R
8
Situaciones experimentales CI
Extinción en CI
En esta sección (transparencias 9-14) se describen las dos grandes modalidades de
situaciones experimentales en el condicionamiento instrumental: las de ensayos
discretos (en las que se permite una única respuesta por ensayo, y de las que los
experimentos iniciales de Thorndike formarían parte) y las de operante libre (en las
que se puede realizar la conducta instrumental tantas veces como se quiera una vez se
está en la situación experimental). Podéis encontrar una descripción de ambas
modalidades en el documento de lecturas, páginas 63-67.
Podéis encontrar más información en la sección “Aproximaciones modernas al estudio del condicionamiento
instrumental” del capítulo 5 del manual Domjan (2006).
9
60
50
Tiempo en segundos
40
30
20
10
0 Caja de salida
1 2 3 4 5 6 7 8 9 10
Ensayos
En la gráfica de la siguiente transparencia puede observarse cómo, a medida que
avanza el aprendizaje, el animal aumentaría el número de elecciones del brazo
correcto que le permitiría llegar a la caja de meta donde encontraría el reforzador (ej.
alimento).
Caja de meta
% de respuestas correctas
95
85
75
65
55
45
1 2 3 4 5 6 7 8 9 10 Caja de salida
Sesiones
12
En las lecturas, podéis revisar la descripción de la caja que se hace en la página 65.
13
Skinner (1904-1990)
Cuando se llega a la parte superior del papel, el bolígrafo baja en vertical y comienza
un nuevo registro acumulado, tal y como podéis ver en las lecturas (podéis revisar la
descripción de esta medida que se hace en la página 65-66).
14
Situaciones experimentales CI
Extinción en CI
Esta sección (transparencias 16-28) presenta los cuatro procedimientos básicos de
condicionamiento instrumental. Comprender estos cuatro procedimientos es muy
relevante, y los tenéis descritos en el documento de lecturas (páginas 68-70). Además,
disponéis de ejercicios de autoevaluación para practicarlos (en el campus virtual).
Los cuatro procedimientos surgen de combinar dos niveles posibles de dos variables
relevantes:
Procedimientos de condicionamiento
instrumental
Contingencia Contingencia
positiva negativa
Consecuencia: Consecuencia:
apetitivo
Estímulo
Castigo negativo
Reforzamiento (entrenamiento
positivo por omisión)
Reforzamiento
negativo
Castigo positivo
aversivo
Estímulo
(evitación,
escapada)
17
Procedimientos de condicionamiento
instrumental
Procedimientos de condicionamiento
instrumental
Reforzamiento positivo
Reforzamiento positivo
21
Castigo positivo
La ejecución de la respuesta
instrumental conlleva la aparición de
un estímulo desagradable.
200Km/h
Castigo positivo
23
Castigo negativo
La ejecución de la respuesta
instrumental conlleva la desaparición
de un estímulo agradable.
Castigo negativo
25
Reforzamiento negativo
Ejemplo: la conducta de lavarnos las manos va unida a la no aparición de una infección (la
infección sería un estímulo aversivo).
En realidad dentro del reforzamiento negativo distinguimos entre las conductas de evitación y las
de escape. En las de evitación la respuesta se realiza antes de que aparezca el estímulo aversivo
(anticipamos que podría aparecer y realizamos la conducta para evitarlo). En el escape el
estímulo aversivo ya ha aparecido y realizamos la conducta para escapar de él (véase el ejemplo
de las lecturas de la persona con miedo a los perros que escapa al encontrarse con uno).
NOTA: He detectado un error en las lecturas. Al final de la página 68 se indica “Una persona que té fòbia als
gossos pot sortir corrent si de cop i volta es troba en front d’un gos. Un conductor pot portar el cotxe al
mecànic per fer una revisió abans d’un viatge llarg per evitar una averia. Aquests són dos exemples del
procediment de reforçament positiu”. En realidad no son ejemplos de reforzamiento POSITIVO sino ejemplos
de reforzamiento NEGATIVO.
Images: https://openclipart.org/
26
Reforzamiento negativo
27
Reforzamiento negativo
Reforzamiento negativo
Podéis encontrar más información en la introducción del capítulo 5 del manual Domjan (2006).
Images: https://openclipart.org/
29
Podéis encontrar más información en la sección “Aproximaciones modernas al estudio del condicionamiento
instrumental” del capítulo 5 del manual Domjan (2006).
30
Hasta ahora hemos hablado de reforzar o castigar
conductas que el sujeto emite
espontáneamente…
Fijaos que una ventaja de utilizar el sonido del dispensador como reforzador
secundario en el moldeamiento es que, si queremos reforzar cualquier conducta que
realice el animal en cualquier lugar de la caja, y para ello liberamos una bolita de
comida cuando la realiza, el animal escuchará el sonido del dispensador y el sonido le
hará acercarse inmediatamente al comedero.
31
Alloway, T.; Wilson, G. Graham, J. (2005). Sniffy la rata virtual, pro version 2.0. Thomson Paraninfo.
32
Moldeamiento
1. “…podríem començar per reforçar cada vegada que l’animal es posa dret sobre les
potes posteriors i amb independència d’en quin lloc de la cambra ho faci”
2. “El següent pas consistirà en restringir el reforçador a quan es posa dret però en
una ubicació propera a la palanca però no el reforçarem per posar-se dret si es troba
lluny de la palanca”
3. “podrem passar a reforçar només quan l’animal es posi dret just davant la palanca”
4. Finalmente, únicamente se reforzará al animal cuando presione la palanca.
33
1) 2)
Alloway, T.; Wilson, G. Graham, J. (2005). Sniffy la rata virtual, pro version 2.0. Thomson Paraninfo.
En las siguientes transparencias (de la 34 a la 40) se introducen los principales
programas de reforzamiento positivo. Esta sección es fundamental y disponéis en las
lecturas de una explicación en detalle de cada tipo de programa (páginas 83-89).
También disponéis en el campus virtual de un cuaderno de ejercicios de
autoevaluación sobre estos programas.
Podéis encontrar más información en la sección “Programas simples de reforzamiento intermitente” del
capítulo 6 del manual Domjan (2006).
34
Programas de razón
Programas de intervalo
FIJO
RF IF
Los programas
VARIABLE variables dan
RV IV lugar a tasas
estables de
respuesta.
RAZÓN INTERVALO
41
Situaciones experimentales CI
Extinción en CI
Esta sección describe las distintas variables relativas a la respuesta y a la consecuencia
que pueden influir en el condicionamiento instrumental.
Hutt (1954)
60
50
Respuetas por minuto
40
30
20
10
0
Pequeña Mediana Grande
Si pensamos en la vida diaria, por ejemplo una misma cantidad de dinero por realizar determinado
trabajo podría resultar más o menos atractiva para diferentes personas en función de qué cantidades de
dinero hayan recibido por trabajos similares en el pasado.
Podéis encontrar más información en la sección “Elementos fundamentales del condicionamiento instrumental” del
capítulo 5 del manual Domjan (2006).
43
Crespi (1942)
16-16 16 16 1
64-16 64 16 0
LB 1 2 3 4 5 6 7 8
Bloques de ensayos de prueba
15 un deteriodo del
aprendizaje
minuto
10
5
(Dickinson, Watt y
Griffiths, 1992).
0
0 20 40 60
Demora (segundos)
Negro
Salida Elección Demora Meta
Blanco
51
Hipótesis del marcado
Negro
Salida Elección Demora Meta
Blanco
aprendieron la R 80
60
Marcado
grupo no marcado 20
(demora de 60’’) 0
1 2 3 4 5
Bloques de 10 ensayos
En las siguientes transparencias se introduce el concepto de contingencia, que tenéis
descrito en las páginas 81-83 de las lecturas.
Contingencia respuesta-reforzador
P(Consecuencia/Respuesta)-P(Consecuencia/No_Respuesta)
Siguiendo con el comentario anterior, si quisiésemos hacer el cálculo numérico del
valor de contingencia, podríamos utilizar la estrategia de generar tablas de
contingencia, tal como hacíamos en el condicionamiento clásico pero, tal y como os
decía en el comentario anterior, en este caso en lugar de tratarse de la contingencia
entre el estímulo condicionado y el estímulo incondicionado, se trata de la
contingencia entre la respuesta y el estímulo consecuente y por lo tanto debéis aplicar
los mismos cálculos a estos nuevos elementos. Así obtendréis la
P(Consecuencia/Respuesta) y la P(Consecuencia /no_Respuesta) y a partir de la resta
de estas probabilidades podéis obtener el valor de la contingencia.
Contingencia respuesta-reforzador
a b a b
c d c d
ΔP = P(EI/EC) – P(EI/noEC) ΔP = P(Comida/presión
ΔP = [a/(a+b)]– [c/(c+d)] palanca) – P(comida/no
presión palanca)
ΔP = [a/(a+b)]– [c/(c+d)]
54
Situaciones experimentales CI
Extinción en CI
La siguiente sección (transparencias 55-60) se corresponde con la sección de las
lecturas que va desde la página 98 hasta la 103.
R: Respuesta (instrumental)
Ed
Ley del efecto
(Thorndike)
Ed-R
R C
La siguiente transparencia muestra esquemáticamente el diseño y resultados de
Colwill y Rescorla (1985) que se describe en el documento de lecturas (páginas 100-
102)
57
Asociaciones R-C
Asociación R-C
Entrenamiento Devaluación Prueba
R1-C1 y R2-C2 R1 o R2
C1-ClLi
(días alternos) (20 min)
Asociaciones E-C
(asociación por condicionamiento clásico)
Entrenamiento Entrenamiento
Prueba
Ed de respuesta
Asociaciones E-C
(asociación por condicionamiento clásico)
Entrenamiento Entrenamiento
Prueba
Ed de respuesta
Ed Expectativa de
reforzamiento
(R C)
Ed activa la expectativa de reforzamiento: Expectativa que
activa asociaciones R-C aprendidas; Se realiza la respuesta
posible.
61
Situaciones experimentales CI
Extinción en CI
La siguiente transparencia describe el efecto del reforzamiento parcial en la extinción
que aparece descrito en las páginas 97-98 de las lecturas.
62