Está en la página 1de 37

1

Referencias
Domjan (2006). Capítulo 8.
Domjan y Burkhard (1990). Capítulo 8.
Pearce (1998). Capítulo 5.
Tarpy (2000). Capítulo 13.

Tema 5: El control por el estímulo


La transparencia a continuación ilustra mediante un ejemplo la importancia de los
estímulos presentes en el momento en que se realiza una respuesta instrumental
(estímulos antecedentes) y cómo estos estímulos pueden llegar a controlar la
realización de la conducta.

Se corresponde con las ideas expuestas en la primera página del capítulo de


generalización y discriminación de las lecturas (página 105).

Podéis encontrar más información en la introducción del capítulo 8 del manual Domjan (2006).
Imágenes: https://openclipart.org/
2

El control por el estímulo

Tanto Thorndike como Skinner: las respuestas


instrumentales y los reforzadores no ocurren en el
vacío, sino ante estímulos concretos.
Ej: la conducta de estudiar está relacionada con
estímulos presentes en la universidad, será más
difícil estudiar en verano (estímulos muy diferentes)
La transparencia a continuación ilustra esta idea mediante un experimento clásico (Reynolds,
1961), que aparece descrito en las páginas 105-106 de las lecturas.

En la gráfica se observa que la conducta de picoteo en la paloma 107 está controlada de manera
mucho más intensa por el color rojo que por el triángulo blanco (picotea mucho con el rojo y muy
poco con el triángulo cuando se presenta cada elemento por separado en la prueba), mientras
que en la paloma 105 lo que controla la conducta de picoteo del animal es el triángulo blanco.

Podéis encontrar más información en la sección “Identificación y medida del control por el estímulo” del
capítulo 8 del manual Domjan (2006).
3

Ejemplo clásico de respuesta diferencial y


discriminación del estímulo

Reynolds (1961). Entrenamiento: palomas reforzadas con un


programa IV siempre que picoteen una tecla cuando ésta se
ilumina de rojo y con un triángulo blanco en medio.
La transparencia a continuación introduce los conceptos de generalización y discriminación, tal y
como se describen en la página 106 de las lecturas.

Podéis encontrar más información en la sección “Identificación y medida del control por el estímulo” del
capítulo 8 del manual Domjan (2006).
4

Respuesta diferencial y discriminación del


estímulo
El control por el estímulo de la conducta instrumental
implica variaciones en la respuesta como consecuencia de
las variaciones de los estímulos.

Existe discriminación del estímulo siempre que los sujetos


respondan de forma diferente ante los distintos estímulos.

Se dice que existe generalización del estímulo siempre que el


sujeto no responde de forma diferencial ante estímulos
distintos.
Las transparencias a continuación introducen el experimento de Guttman y Kalish (1956) que
aparece en las páginas 106-107 de las lecturas.

Tal y como se explica en las lecturas, en este experimento se realizaba un entrenamiento en el que
una tecla se iluminaba con una longitud de onda de 580nm. Los animales aprendían que, si
picoteaban la tecla durante su iluminación, su conducta era reforzada (bajo un programa de
reforzamiento de intervalo variable, que es uno de los programas que estudiamos en el tema 4 de
condicionamiento instrumental). Por el contrario, si picoteaban cuando la tecla estaba apagada, la
conducta no era reforzada.

Después del entrenamiento se pasaba a la fase de prueba, en la que se presentaba la tecla


iluminada del mismo color que en el entrenamiento y también de otros colores diferentes, y se
medía la conducta de picoteo de las palomas ante cada color.

En los resultados se observa que la respuesta más elevada de las palomas aparecía ante el color
que se había utilizado en el entrenamiento y, conforme el color iba alejándose más de este color
entrenado, la respuesta era menor. Es decir, tal y como se indica en las lecturas, los gradientes de
generalización muestran que la generalización y la discriminación dependen del grado de similitud
entre los estímulos.

Podéis encontrar más información en la sección “Identificación y medida del control por el estímulo” del
capítulo 8 del manual Domjan (2006).
5

(Guttman y Kalish, 1956)


Guttman y Kalish
(1956) entrenaron a
unas palomas a
picotear una tecla que
se iluminaba con una Color: Longitud de onda (se mide en nanómetros nm)
luz de una
determinada longitud
de onda. Entrenamiento
A continuación se (el E+)
presentó a las palomas
una variedad de luces
de diversa longitud de Prueba
onda, que se
presentaron en la
misma tecla.
6

(Guttman y Kalish, 1956)


Gradiente de Generalización:

350

300

250
Respuestas

200

150

100

50

0
500 510 520 530 540 550 560 570 580 590 600

longitud de onda

Los resultados mostraron un gradiente de respuesta que adoptó una forma


gaussiana, que estaba en función de lo similar que era cada estímulo de
prueba respecto al estímulo con el que se había entrenado a las palomas.
La siguiente transparencia muestra datos hipotéticos para ilustrar la idea de que un gradiente de
generalización totalmente plano (una línea horizontal) indica que existe una generalización total
entre el estímulo de entrenamiento y los estímulos de prueba (el animal responde igual ante
todos los estímulos de prueba).
7

Gradiente de Generalización Plano: datos


hipotéticos

Estímulo de
300
entrenamiento
250
Respuestas

200
150
100
50
0
530 540 550 570 580 590 600 610 630
Longitud de onda (nm)

¿Qué hubiera ocurrido si las aves del experimento de Guttman y Kalish hubiesen
sido ciegas al color? (no discriminación)
A tener en cuenta: lo acusado que sea un gradiente refleja el grado de control de
un estímulo.
La siguiente transparencia se refiere a lo que se explica al final de la página 107 e inicio de la 108
de las lecturas.

En los experimentos de discriminación y generalización, los estímulos que anuncian la


disponibilidad del reforzador se denominan E+ ED. Además, los estímulos que anuncian que el
reforzador no estará disponible se denominan E- o EΔ.

Aunque en el experimento de Guttman y Kalish que se ha visto en transparencias anteriores se


intercalaba un E+ (la tecla de 580nm) con espacios de tiempo con la tecla apagada, en ocasiones
se realizan entrenamientos en discriminación en los que se utiliza un estímulo concreto como E+ y
otro estímulo concreto como E-.

Podéis encontrar más información en la sección “Factores de aprendizaje en el control por el estímulo” del
capítulo 8 del manual Domjan (2006).
8

Factores de aprendizaje en el control por el


estímulo

Entrenamiento de discriminación (o discriminativo): E+ (o ED


”e de”), E– (o EΔ ”e delta”)

El E+ es un estímulo discriminativo para la ejecución de la


respuesta (es decir, el E+ indica al sujeto que sus respuestas
instrumentales serán reforzadas).

El E- es un estímulo discriminativo para la supresión de la


respuesta (es decir, el E– indica al sujeto que sus respuestas
instrumentales no serán reforzadas).
La siguiente transparencia introduce el experimento de Jenkins y Harrison (1962) que se describe
en las lecturas en la página 108. La gráfica muestra los resultados de la prueba de generalización.
En la gráfica se observa que el G2 (el grupo que había aprendido previamente una discriminación
en la que el E+ era un tono de 100 Hz y el E- un tono de 950 Hz) muestra un gradiente muy
acusado, mientras que en el grupo G3 el tono del sonido no parece controlar la conducta de los
animales, porque responden igual ante diferentes tonos en la prueba de generalización. En el
grupo G1 el nivel de discriminación observado es intermedio (no tan fino como el del G2 pero sí
mayor que el del G3).

Tal y como se indica en Domjan (2006, p. 233), este experimento muestra que es más probable
que una dimensión concreta de un estímulo (la frecuencia de los tonos, en este ejemplo) adquiera
el control sobre la conducta instrumental si el E+ y E- difieren en esa dimensión. Es lo que ocurre
en el grupo G2, en el que los animales debían aprender en el entrenamiento a discriminar entre
dos tonos de frecuencias ligeramente diferentes (1000 Hz versus 950 Hz). Por el contrario en el G1
los animales deben discriminar entre un tono de 1000 Hz (E+) y la ausencia del tono (E-).
Pensemos que el tono E+ tiene diversas características (frecuencia, intensidad, timbre...) y por
tanto es posible que en la discriminación del G1 no cobre tanta importancia la frecuencia del tono
sino otras de sus características. Por el contrario en el G2 es la diferencia en frecuencia del tono la
que permite discriminar el E+ del E- durante el entrenamiento y por ello esta característica
adquiere más control sobre la conducta de los animales, mostrando por ello un gradiente de
generalización más acusado en la prueba.

Podéis encontrar más información en la sección “Factores de aprendizaje en el control por el estímulo” del
capítulo 8 del manual Domjan (2006).
9

Factores de aprendizaje en el control por el


estímulo
¿Cuál es la precisión del E+ en su control sobre la conducta instrumental?
Entrenamiento con un estímulo E+ versus entrenamiento de
discriminación: E+ E– (Jenkins y Harrison, 1962). Experimento con
palomas que son reforzadas por picotear ante un tono determinado.

E+: siempre un tono de 1.000 Hz


E-:
G1: no tono;
G2: 950 Hz;
G3: sin discriminación (el tono de
1.000 Hz suena de manera
ininterrumpida y siempre pueden
obtener comida si picotean)

El mejor control por el estímulo se traduce en el gradiente de


generalización más acusado.
A partir de aquí hasta el final las transparencias presentan la teoría de Spence sobre qué se
aprende en un entrenamiento en discriminación, los fenómenos del desplazamiento del vértice y
de la transposición, y la aproximación relacional como explicación alternativa.

En las lecturas todas estas ideas aparecen reflejadas a partir de la página 108 hasta la 113.

Podéis encontrar más información en la sección “Factores de aprendizaje en el control por el estímulo” del
capítulo 8 del manual Domjan (2006).
10

Factores de aprendizaje en el control por el


estímulo
¿Qué se aprende en el entrenamiento de discriminación?
Teoría de Spence (1936) sobre el aprendizaje de discriminación:

Según SPENCE (1936) el reforzamiento de una respuesta en presencia de


un E+ condiciona en el E+ propiedades excitatorias que llegan a provocar
la conducta instrumental en las futuras presentaciones de ese estímulo
(E+ activa la respuesta).

Por el contrario, el no reforzamiento de las respuestas durante las


presentaciones del E– condiciona propiedades inhibitorias en el E– que
sirven para inhibir la conducta instrumental en las futuras presentaciones
del E– .

Spence consideraba que la respuesta diferencial al E+ y al E– refleja la


excitación y la inhibición que se han condicionado al E+ y al E–
respectivamente (teoría de la excitación-inhibición del aprendizaje
discriminativo).
La siguiente transparencia muestra gráficamente los resultados del experimento de Honig y
colaboradores que aparecen descritos en las páginas 111-112 de las lecturas. Este experimento da
apoyo a la idea de la teoría de Spence de que alrededor de los E+ se forman gradientes de
generalización excitatorios y alrededor de los E- se forman gradientes de generalización
inhibitorios.
11
Experimento de Honig, Boneau, Burstein y Pennypacker (1963)

Grupo 1
Media de respuestas totales

300

200

Grupo 2

100

Grados de inclinación
12

Resultados del experimento de Honig y cols. (1963):

El entrenamiento en discriminación puede producir tanto


condicionamiento excitatorio al E+ como condicionamiento
inhibitorio al E–.

El gradiente excitatorio tenía forma de U invertida, con la


mayor tasa de respuesta en el E+ original.

El gradiente inhibitorio tenía la forma opuesta, con el menor


nivel de respuesta ante el E– original.

Este experimento proporciona un fuerte apoyo a la teoría de


Spence (1936).
La siguiente transparencia continúa explicando la teoría de Spence, que plantea que los gradientes
excitatorios que se forman alrededor del E+ y los gradientes inhibitorios que se forman alrededor
del E- pueden ejercer su influencia simultáneamente, determinando la respuesta neta que se
observe ante diferentes estímulos. Una forma de comprender mejor esta idea es analizar el
experimento de Hanson que se presenta más adelante y el fenómeno del desplazamiento del
vértice (también llamado desplazamiento del máximo) que muestra ese experimento. Tenéis este
experimento explicado en detalle en las lecturas.
13

Factores de aprendizaje en el control por el


estímulo
Teoría de Spence (1936) sobre el aprendizaje de discriminación:

Además, lo que se aprende acerca del E+ puede influir en la respuesta al


E– y lo que se aprende acerca del E– puede influir en la respuesta al E+.

Esto es especialmente claro en las “discriminaciones intradimensionales”


(cuando el E+ y el E– pertenecen a la misma modalidad sensorial –por
ejemplo dos tonos de distinta frecuencia– y por tanto sólo difieren en
una característica del estímulo). [Se trata de discriminaciones de
“expertos”: como las que realizan los catadores de vino o de aceite.]

El desplazamiento del máximo -o del vértice- (Hanson, 1959): Ejemplo de


interacción entre el E+ y el E-
14
Entrenamiento discriminativo: DESPLAZAMIENTO DEL VÉRTICE
Hanson (1959) Prueba
550 nm

3 grupos

550 nm + 555 nm —

550 nm + 590 nm —

550 nm + (Control)
15
Entrenamiento discriminativo: DESPLAZAMIENTO DEL VÉRTICE
Hanson (1959) Prueba
550 nm

550 nm + 555 nm —

Control
550 nm + 590 nm —

550 nm + (Control)
16
Entrenamiento discriminativo: DESPLAZAMIENTO DEL VÉRTICE
Hanson (1959) Prueba
550 nm

Discri. fácil
550 vs 590 nm
550 nm + 555 nm —

550 nm + 590 nm —

550 nm + (Control)
Tal y como se explica en las lecturas y se puede observar aquí en el gráfico, en el grupo en el que
se entrena a los animales en una discriminación intradimensional relativamente compleja (el E+ y
el E- son similares en el grupo en el que E+: 550nm y E-: 555nm), se observa en la fase de prueba
un desplazamiento del máximo de respuesta (la gráfica muestra las respuestas de los animales en
esta fase de prueba). Es decir, el máximo de respuestas no se da ante el E+ (la longitud de onda de
550nm) sino que se desplaza. En el gráfico vemos que se desplaza hacia la izquierda, hacia
estímulos con longitudes de onda más bajas. De forma general, se espera que este máximo se
desplace en dirección contraria al E- (como aquí el E- era de una longitud de onda superior al E+,
el máximo de respuesta se desplaza hacia longitudes de onda más bajas que las del E+).
17
Entrenamiento discriminativo: DESPLAZAMIENTO DEL VÉRTICE
Hanson (1959) Prueba
550 nm

550 nm + 555 nm —
Discri. difícil
550 vs 555 nm
550 nm + 590 nm —

550 nm + (Control)
18

Resultados del experimento de Hanson


(1959)
El único estímulo en cuya presencia se ha reforzado la respuesta (el E+)
no es necesariamente el que posteriormente evoca la tasa de respuesta
más alta.
___________________________________________________

El efecto de desplazamiento del máximo está en función de la semejanza


entre los estímulos E+ y E– del entrenamiento discriminativo original.

El mayor desplazamiento del máximo ocurre tras un entrenamiento


discriminativo en el que el E+ y el E– son muy similares (como 550 y 555
nm, respectivamente).

Con colores más “diferentes” en la adquisición, este efecto se atenúa


(como 550 y 590 nm, respectivamente).

LA TEORÍA DE SPENCE PERMITE EXPLICAR ESTOS RESULTADOS


19

La teoría de Kenneth Spence (1936)


En torno a un estímulo Ed+ se
produce un gradiente de
generalización excitatorio.
Gradiente de Motivación

En torno a un Ed- se produce un +


gradiente de generalización
inhibitorio.
Gradiente de Desmotivación E-
E+
La generalización neta es el
resultado de la suma algebraica de
la excitación y la inhibición. _
20
Spence (1936)
desplazamiento del vértice
Gradiente de
generalización
excitatorio
MOTIVACION
Excitación

Gradiente neto
Inhibición

Gradiente de
generalización
inhibitorio
DESMOTIVACION
21

La teoría de Kenneth Spence (1936)


Por tanto, para Spence los
gradientes (excitatorio e inhibitorio)
se superpondrán y el grado de
superposición dependerá del grado
de semejanza entre el E+ y el E-.
+
Para Spence los animales aprenden
acerca de las propiedades absolutas
de los estímulos. E-
E+

_
En la siguiente transparencia se introduce el fenómeno de transposición, y junto con él la
explicación relacional.
22
Explicación alternativa del desplazamiento del máximo

FENÓMENO DE TRANSPOSICIÓN (Kohler, 1918)


Adquisición o entrenamiento
Entrenamiento

E+ E-
(gris oscuro) (negro)

Prueba

E+ Estímulo nuevo
(gris oscuro) (gris claro)

Los pollos eligen el gris claro. ¿Cómo se explica esto?


(Según Kohler, se trata de un aprendizaje relacional). 35
23

ANÁLISIS TEÓRICO DEL EFECTO DE TRANSPOSICIÓN

Entrenamiento

Wolfang Köhler: En la primera fase los animales aprenden a


elegir el estímulo más brillante: Regla relacional.
En la segunda aplican la regla relacional al elegir el estímulo más
brillante.

De acuerdo con Köhler nos encontramos ante un caso de


aprendizaje relativamente complejo.
En la última transparencia se muestra gráficamente de qué forma la teoría de Spence puede
explicar también el fenómeno de la transposición apelando a la interacción entre gradientes de
generalización excitatorios e inhibitorios. Según Spence, el estímulo que ha actuado de E+ en el
entrenamiento genera a su alrededor un gradiente excitatorio y el que ha actuado de E- en el
entrenamiento genera a su alrededor un gradiente inhibitorio. Si los gradientes de ambos
estímulos se solapan lo suficiente, es posible que el gradiente neto sea mayor ante estímulos que
se alejan del E+ en dirección contraria al E- (en este ejemplo, grises más claros que el E+) que ante
el propio E+. Esta idea se explica en la página 113 de las lecturas.
24

ANÁLISIS TEÓRICO DEL EFECTO DE TRANSPOSICIÓN

Entrenamiento

La teoría de Spence ofrece otra explicación

También podría gustarte