Está en la página 1de 21

TEMA 3.

FUNDAMENTOS DEL APRENDIZAJE ASOCIATIVO

 CONDICIONAMIENTO CLÁSICO

Para alimentarse, eludir los depredadores o para reproducirse, los animales disponen de mecanismos
fisiológicos y motores que contribuyen a realizar estas funciones biológicas; sin embargo, no basta con
ellos para sobrevivir; es preciso además aprender a localizar los alimentos, dónde se esconden los
depredadores o cómo atraer a la pareja. Estas funciones se consiguen gracias a los mecanismos del
condicionamiento y el aprendizaje asociativo.

La realización de conductas adaptativas y la anticipación de hechos biológicamente relevantes (comida,


p.ej.) en el entorno requieren la capacidad de aprender. Estas adaptaciones al ambiente son tan
fundamentales para la supervivencia del individuo como los procesos fisiológicos de la respiración o la
digestión.
Michael Domjan, 1999

“Mecanismos para la detección e inferencia de las relaciones estructurales del ambiente,


mayoritariamente causales, que determinan la conducta adaptativa”.

(Predecir eventos importantes y las consecuencias de la conducta).

Dickinson, 1980

El aprendizaje asociativo es un aprendizaje que tiene lugar cuando dos elementos se conectan en
nuestro cerebro, y cuyos procesos tienen lugar mediante la experiencia y produce cambios en la
conducta.

El condicionamiento clásico es un mecanismo elemental de aprendizaje que permite a los organismos


predecir acontecimientos relevantes en su entorno (alimento, un depredador) y anticiparse a su
aparición mediante la realización de respuestas adaptativas de tipo reflejo.

Paulov estaba investigando los


procesos de digestión. Pretendía
analizar la salivación de los perros
cuando se les proporcionaba comida.
Descubrió que los perros, una vez
acostumbrados a la situación
experimental, no esperaban a salivar
cuando tenían la comida en la boca,
sino que el proceso de salivación
comenzaba en cuanto se les exponía a
estímulos propios de la situación
experimental. Así, supo detectar aquí

1
un fenómeno mucho más interesante que analizar y cambió el rumbo de su investigación. De hecho,
dedicó el resto de su trayectoria investigadora al estado de lo que se conoce como aprendizaje por
condicionamiento. El condicionamiento clásico es el método por el cual al presentar un estímulo
previamente neutro en contigüidad espaciotemporalmente con otro estímulo capaz de suscitar una
respuesta a de manera innata, el primer estímulo queda asociado con el segundo de tal forma que
acaba siendo capaz de suscitar por si solo dicha respuesta.

Pavlov proporcionaba comida a sus perros hambrientos, lo que


producía una respuesta refleja de salivación (respuesta
fisiológica). Luego el primer elemento consustancial son los
estímulos del ambiente que producen sin experiencia la reacción
del organismos (estímulo incondicionado, sin mediar experiencia)
Estos estímulos producen una reacción refleja de tipo nervioso
acorde con el acontecimiento. La respuesta refleja de salivación
es respuesta condicionada. Paulov constata que esos reflejos
comienzan a producirse también ante estímulos del ambiente
que preceden a la comida. Esos estímulos (luz, tono…) son
estímulos neutros o arbitrarios porque no median en la
saluvación. Estos estímulos que adquieren propiedad condicionada son estímulos condicionados. La
condición esque el estímulo condicionado (EC) y el estímulo incondicinado (EI) estén ligados
temporalmente. Lo que constata es que los estímulos condicionados (EC) adquieren por la experiencia
repetida también, una capacidad de respuesta análoga a la respuesta incondicionada (RI) Llamó a esto
conexión nerviosa temporal.

La respuesta condicionada (RC) es análoga a la respuesta incondicionada (RI), pero no siempre se da


esto. A veces la respuesta condicionada (RC) da otra respuesta. Cuando se asocia un EI con un EC, la
presentación del EC provocará una respuesta análoga a la RI, llamada RC. La RC no siempre va en la
misma dirección que la RI, a veces, va en la dirección contraria (p.e. respuesta condicionada
compensatoria). Por ejemplo, cuando damos droga, se provoca analgesia, la respuesta compensatoria es
distinta. Hay distintos modelos o procedimientos para estudiar la naturaleza del condicionamiento
clásico, sus métodos…

o EI  estímulo incondicionado (cualquier acontecimiento capaz de provocar una respuesta


refleja específica en el organismo). Es aquel que biológicamente relevante para el sujeto, y que,
por tanto, provoca una respuesta refleja incondicionada (de por sí sin necesidad del
condicionamiento) (comida o descarga).

o EC  estímulo condicionado (estímulo que por asociación con un EI es capaz de provocar una
respuesta que antes del entrenamiento no provocaba). Es aquel estímulo que antes del
condicionamiento es considerado con un estímulo incondicionado (EI) provoca una respuesta
refleja condicionada en el sujeto (p.e. un tono o una luz).

2
o RI  respuesta incondicionada (respuesta que se emite de forma automática ante la presencia
de un determinado EI). Respuesta que provoca estímulo incondicionado.

o RC  respuesta condicionada (respuesta provocada por el EC tras la asociación. En ocasiones


RC y RI son distintas. Respuesta que provoca el estímulo condicionado (comida o descarga).

EI → RI EC → Estímulo condicionado
EC-EI → RI EI → Estímulo incondicionado
RC → Respuesta condicionada
EC → RC RI → Respuesta incondicionada

 Métodos de condicionamiento clásico (apetitivos)


a) Salivación
En el ejemplo de la salivación del perro, condicionamiento de la respuesta de salivación (de tipo
apetitivo porque evoca una respuesta relacionada con la comida).

Perro de Pavlov: El EI es la comida


del perro, el EC un estímulo neutro
(campana). La RI es salivar (en
presencia de la comida), al igual
que la RC (en presencia
de la campana). Se asocia el EC con
el EI de manera que en este caso
la RC y la RI
son iguales.

b) Automoldeamiento
En el otro ejemplo, observamos el fenómeno de automoldeamiento. Hay dos estímulos. Aparece el
de la izquierda en rojo y recibe comida (esto es condicionamiento) El estímulo provoca la
respuesta. El otro estímulo (gris) no da comida. ¿Cuál es la respuesta refleja que provoca en un
animal hambriento? Conducta de aproximación. Después de hacer varias veces esto, observamos
que a la luz roja se acerca y coge la comida pero también se da la respuesta condicionada que es
picotear la luz roja (RC) Este es el otro ejemplo de paradigma apetitivo que se llama
automoldeamiento. El efecto principal de la experiencia es que un estímulo neutro que antes no
daba respuesta, ahora provoca un aumento de respuesta.

Justo antes de la presentación del EI (comida) se encendía un disco luminoso (EC). Así, el EC
adquiría la propiedad de informar sobre la disponibilidad de la comida (la comida era proporcionada
independientemente de las respuestas de la paloma) Se observó un fenómeno curioso: en vez de
acercarse directamente al plato cuando veían la luz, las palomas comenzaron a picotear primero el
disco cuando este se encendía (incluso bajo el riesgo de no llegar a tiempo a por la comida) Esta es
una prueba de la atracción que ejercen las señales condicionadas clásicamente cuando el premio es

3
la comida. Los acontecimientos que predicen un suceso relevante estimulan una conducta de
seguimiento debido a su significación informativa. Esto también ocurre en humanos (por ejemplo,
cuando estamos en un ascensor y vamos siguiendo los botones que se iluminan indicando el piso por
el que pasamos a pesar de que el hecho de que miremos fijamente no hará que lleguemos antes a
donde queremos.

 Métodos de condicionamiento clásico (aversivos)

c) Condicionamiento de la respuesta palpebral

Los estímulos desagradables


producen huída. Siguiendo el sonido
se le aplica una descarga eléctrica o
una corriente de aire frio (aversivo)
¿Qué reacción provoca en el conejo
ese estímulo? ¿Qué respuesta
refleja? Se produce una reacción
refleja de parpadeo. Tras el
condicionamiento del sonido y la
descarga, si se presenta sólo el
sonido, parpadea. El conejo tiene
varios párpados (membrana
nictitante) Cuando regularmente la
corriente o descarga va precedida del sonido, si se presenta solo el sonido el conejo parpadea (se
presentan estímulos auditivos y se aplica después una descarga eléctrica o corriente de aire frío, su
respuesta refleja es la de parpadeo por lo que cuando presentamos el sonido solo el conejo también
parpadea) El EI sería el soplo de aire en la superficie del ojo o la breve descarga en el párpado
inferior. La RI sería el parpadeo (parecida a la RC) y el EC será el tono que le indica que habrá una
descarga. Siguiendo un ejemplo, los parámetros podrían ser:

o Duración (EC breve, por ejemplo 500 msegundos)


o Latencia de R (muy breve (< 525 msegundos)
o Velocidad de aprendizaje (lento)

En los humanos también ocurre (reflejo palpebral) En un experimento, hacemos que el sujeto observe
una pantalla de ordenador con casos, teniendo estímulos auditivos o viendo proyecciones (imágenes)
Por ejemplo presentamos por el altavoz nombres de ciudades que sean capital de provincia y cuando
aparecen capitales de provincias aplicamos descargas en el ojo o una corriente de aire, lo que provoca
parpadeo. Al repetir la experiencia varias veces y repetirle varias veces las palabras, aunque no haya
corriente de aire el sujeto parpadea por efecto del condicionamiento (RC)

4
d) Condicionamiento del miedo

¿Qué son los estímulos fóbicos? ¿Los que provocan miedo o ansiedad? ¿Han adquirido un significado de
que es biológico? Es una conducta o respuesta con distintos componentes que es para escapar de los
estímulos fóbicos y así sobrevivir. El miedo, para reducirlo, se mide mirando cómo afecta a actividades
cotidianas que realizábamos normalmente. Los procedimientos apetitivos provocan aumento de la
respuesta. Los aversivos no necesariamente provocan reducción de la respuesta (más bien aumento) en
el ejemplo del conejo, el parpadeo no se elimina, sino que se incrementa. Tanto en condicionamiento
aversivo como apetitivo puede haber disminución o aumento de la respuesta dependiendo de la
situación. En el miedo hablamos de la supresión condicionada, que estima como afecta al miedo a la
realización de tareas cotidianas. Si medimos el condicionamiento del miedo con ratas y electrificamos
el suelo de la jaula, el EI será la descarga que esto provoca en los pies. La RI es la respuesta de miedo,
huida o evitación y el EC es la luz o tono que le indica la sucesiva descarga. Lo que nos interesa aquí es
¿Cómo medimos el grado en que hemos conseguido condicionar la respuesta de miedo ante el EC (luz,
tono)? Utilizamos un método indirecto llamado supresión condicionada. La supresión condicionada es un
índice que nos informa sobre el grado en que un estímulo condicionado al miedo altera la actividad que
está llevando a cabo el animal. Para medirlo, se comparan el nº de veces que se presenta la respuesta
en presencia del EC (asociación aversiva) con las veces que se presenta la respuesta instrumental
cuando no está el EC (ambos períodos de tiempo deben ser iguales).

El máximo de miedo será el valor 0 (máximo


condicionamiento) y la ausencia de miedo el valor 0,5. La
razón de supresión mide el C.C. aversivo aunque se mide a
través de RI.

e) Aprendizaje de aversión al sabor

No se puede identificar aversivo


con disminución de la respuesta.
Por ejemplo, al animal le damos
sacarina y se siente mal por
haber consumido mucho, así que
hay una devaluación afectiva de
ese alimento. Hay una respuesta
de rechazo por parte de la rata.
Si le volvemos a dar, ella lo
rechaza (esta es la manifestación
conductual que aprendió).

Tras ingerir una sustancia,


inducimos en los animales un sentimiento de malestar por inyección de algo tóxico (LiCl). Debido a que
asociación el sabor de esa sustancia (EC) con una experiencia de malestar (EI) adquieren una aversión
(RC) a dicho sabor. Antes se pensaba que esta reacción no podía responder al paradigma del
condicionamiento clásico al igual que la respuesta palpebral o la salivación porque tenía dos
peculiaridades: basta un solo emparejamiento para adquirir la aversión al sabor y porque la demora
aunque sea muy larga (y pasen horas entre el sabor-malestar) se produce condicionamiento. Sin

5
embargo, esto responde a la importancia biológica que tiene para los animales saber que sustancias les
resultan dañinas, por eso es un aprendizaje tan eficaz.

Los procesos de salivación y automoldeamiento son de carácter apetitivo (el EI es un hecho o situación
deseada), mientras que el condicionamiento palpebral, supresión condicionada y aversión gustativa son
aversivos (el EI es un hecho o situación no deseada).

 VARIEDADES DE CONDICIONAMIENTO
CLÁSICO

Clasificación atendiendo a dos criterios: el valor


motivacional y la relación EC-EI (dos factores, dos
variables con dos niveles).

Desde el punto de vista motivacional pueden ser


positivos o negativos, desde la relación EC-EI
pueden ser excitatorios o inhibitorios. Por ejemplo,
la salivación o el automoldeamiento serían apetitivos y
el condicionamiento palpebral sería aversivo. ¿Cuándo
decimos que hay relación causal entre dos estímulos
del ambiente? Cuando siempre que sucede uno,
necesariamente aparece el otro (relación causal).

(ESQUEMA)

6
Valor motivacional del EI:
- Si es apetitivo, hablamos de condicionamiento clásico apetitivo
- Si es aversivo, hablamos de condicionamiento clásico aversivo

Relación EC-EI
El condicionamiento clásico permite aprender o detectar relaciones causales entre estímulos del
ambiente. ¿Cuántos tipos de relación puede haber? Uno que dé lugar a otro (relación causal positiva o
contingencia positiva) E1-> E2 para referirse a situaciones en las que tras un estímulo aparece
necesariamente el otro (un acontecimiento predice el otro)
Por ejemplo, cuando se da una relación causal positiva decimos que el condicionamiento resultante es
excitatorio porque provoca necesidad de respuesta en el organismo (que será distinta según el valor
del EI). Uno que aparece en primer lugar se percibe como causante del otro. Excitatorio que será
aversivo o apetitivo según la naturaleza (según el valor motivacional del EI).

Con independencia de que sean placenteros o aversivos y con independencia de la relación causal de los
estímulos, el otro criterio sería condicionamiento inhibitorio/excitatorio en base a la relación causal o
contingencia que entiende el sujeto (ambos provocan aumento o disminución de la respuesta):

 Contingencia positiva: aumento (el sujeto percibe que hay un nexo causal entre dos estímulos).
Aparece el EC y luego necesariamente aparece el EI (condicionamiento clásico excitatorio =
contingencia positiva). Existirá, por tanto, una relación de contingencia entre EC y EI generando
una RC. Situaciones donde un estímulo causa necesariamente la aparición de otro (luz -> comida /
tono -> descarga). Hablamos de aprendizaje excitatorio porque provoca una respuesta nueva en el
organismo.

Hay 2 tipos de condicionamiento clásico excitatorio:


o Condicionamiento clásico excitatorio apetitivo : ya que existen dos estímulos entre los cuales
hay una contingencia positiva y no causan dolor.
o Condicionamiento clásico excitatorio aversivo: ya que existen estímulos entre los cuales hay una
contingencia positiva y son desagradables.

 Contingencia negativa: cuando se espera un acontecimiento relevante y un estímulo hace que


finalmente no se presente. Indica que, tras el EC, nunca va a aparecer el EI, por lo tanto no se
generará una RC. Siempre que la contingencia sea negativa se trata de condicionamiento clásico
inhibitorio. Por ejemplo, una entrada para ir a un concierto me hace esperar ese acontecimiento
relevante. La entrada anticipa la consecuencia positiva pero el siguiente estímulo anuncia que no se
provoca el resultado esperado (es el que tiene contingencia negativa) Situaciones donde un
estímulo no provoca lo que el individuo espera, se denomina aprendizaje inhibitorio.

7
Hay 2 tipos de condicionamiento clásico inhibitorio:
o Condicionamiento clásico inhibitorio apetitivo : se da cuando existe una situación agradable que
no se llega a producir.
o Condicionamiento clásico inhibitorio aversivo: se da cuando la situación desagradable que se
tendría que producir no se lleva a cabo.

 PROCESOS GENERALES

 CURVA DE ADQUISICIÓN

La curva de adquisición representa el


aumento del aprendizaje en el
condicionamiento clásico. Primero el
aprendizaje de la respuesta aumenta
considerablemente para luego
estabilizarse a medida que se acerca su
nivel máximo (asíntota del aprendizaje).
Es una curva negativamente acelerada.

Por ejemplo, en el primer ensayo de la curva arriba representada se alcanza casi el 50% del
aprendizaje, en el segundo hay un aumento, pero menor que el anterior y así sucesivamente (nunca
superará el valor máximo de la asíntota). La línea crece de forma negativamente acelerada (siempre
crece, pero cada vez un poco menos). En cualquier proceso de condicionamiento se sigue esta línea.

 EXTINCIÓN

Si después de la asíntota (el máximo crítico) presentamos el EC solo, sin el EI tiende a desaparecer
(extinción). La RC ante el EI va disminuyendo hasta que desaparece (extinción de la respuesta
condicionada, algo que es distinto al olvido por el paso del tiempo porque hay un aprendizaje inhibitorio
por una contingencia negativa).

Si tras un periodo de tiempo se deja de presentar el EC y una vez extinguía la respuesta se vuelve a
presentar el EC aparece RC (recuperación espontánea) pero con menor fuera que en el momento
asintótico. Con lo cual no es un olvido permanente del aprendizaje y no es una vuelta al estado original.
Presentaciones repetidas del EC hacen disminuir la magnitud de la respuesta (recuperación
espontánea). La recuperación no es el máximo, es más pobre.

 Recuperación espontánea: dependerá del proceso de condicionamiento y del carácter del


estímulo incondicionado.

8
 GENERALIZACIÓN

El sujeto no responde de forma diferencial a ECs distintos. La


ventaja es que economizamos en aprendizaje. ¿De que depende?
Del parecido físico-químico entre estímulos y de la experiencia
previa con los estímulos. Lo que se aprende de un estímulo se
puede transferir a otro, por lo que dos estímulos parecidos
provocan la misma respuesta. Depende básicamente del parecido
o la proximidad (cuanto más parecido, más provoca la respuesta)

Guttman y Kausch (1956) condicionaron una paloma


con un EC (luz) de 180 nm. Le hicieron una prueba con
luces de 570 y 590, observando que también había
respuesta, aunque menos.

La escala donde comparan las respuetas obtenidas


ante estímulos semejantes se denomina gradiente de
generalización (grado en que la tasa de RC varía al
variar el parecido entre los estímulos y el EC original).

 DISCRIMINACIÓN

A la vez que generalizamos, también aprendemos a discriminar


(responder de forma distinta a dos estímulos muy parecidos) Se logra
no asociando los mismos EI a EC parecidos (se llama aprendizaje
perceptivo, porque se perciben las diferencias). Si nos asocian un
árbol con comida, si ahora damos otro estímulo que comparta
características con él, sin haber sido asociado con la comida da la
respuesta de igual manera por su pasado.

Así, esta situación se soluciona si aprendemos a diferenciar (discriminar), proceso opuesto a la


generalización. Aprendemos a discriminar mediante rasgos distintivos. Intercalamos el EC1 con un EC2
parecido que no va seguido del EI.

Por ejemplo, en una persona un lunar. Si presentamos en un plato cordero y en el otro plato acelgas, es
fácil de discriminar. Si presentamos el cordero con un plato de canguro, ya no lo será tanto. Sin
embargo, con el paso del tiempo encontramos diferencias entre ellos. (Ejemplos: diferenciar a dos
gemelos, distinguir do-re)

9
 ANÁLISIS PARAMÉTRICO

 RELACIÓN TEMPORAL EC-EI


La adquisición de condicionamiento depende del tiempo de comienzo del EI tras el EC
y del sistema de respuesta y la relación de causalidad. El mejor método para alcanzar
el condicionamiento más rápido es el demorado, el EI aparece inmediatamente después del cese de EC
(relación de causalidad).
Determina la velocidad o magnitud de la respuesta. Tiempo
transcurrido desde la exposición al EC y la exposición del
EI (van a determinar la RC). Al aumentar el intervalo entre
EC y EI disminuye la magnitud del condicionamiento (ley de
contigüidad).

Hay diferentes tipos:


o Condicionamiento simultáneo  EC y EI empiezan y
acaban a la vez. No es eficaz. Solo funciona en el
condicionamiento del miedo y no es lo mejor.

o Condicionamiento demorado  El EI se presenta cuando termina el EC (antes de que este


acabe) Es el mejor para un condicionamiento, el más eficaz (se hace mejor la relación causa-
efecto)

o Demorado (demora larga) la duración del EC es más duradera. El EI se presenta cuando ya


llega un rato el EC (antes de que acabe) Al principio es muy eficaz, luego el animal aprende que
no le hace falta prepararse hasta un rato después del EI. A esta retención Pavlov lo llamó
inhibición de demora.

o Huella  Una vez terminado el EC, transcurre un tiempo antes de la introducción del EI, es
decir, el EI se presenta cuando ya ha terminado el EC (la memoria copia del estímulo que deja
una huella en la memoria con el paso del tiempo) A veces enseña más a inhibir la respuesta o a
retenerla que a ejecutarla.

o Hacia atrás  Hay otro que es hacia atrás (se presenta el EI y luego el EC poco después,
tiene resultados ambiguos)

10
 Intervalo óptico

Aquel que favorece el condicionamiento, el que


consigue el máximo condicionamiento. Muy
breve en respuestas esqueléticas o motoras,
pero en las que impliquen el SNA (tasa
cardiaca…) suelen ser un poco mayores. Si el
intervalo entre el EC y el EI es mayor que el
intervalo óptimo, el condicionamiento va a ser
muy pobre. En la respuesta de parpadeo el
intervalo óptimo ha de ser muy bajo.

 Intensidad del EC

Si es alta la asíntota será mayor, si es


baja la asíntota será menor. Observamos
de modo general que en la curva del
condicionamiento se alcanza más rápido la
asíntota cuanto más intenso es el
estímulo. Hay una relación directa entre
la magnitud del EC y el resultado.

 Intensidad del EI

Mismas características que el anterior. Cuanto


más intenso, mayor repuesta se
obtendrá, es decir, a mayor intensidad más
rápido será el condicionamiento. Pero si se
excede la intensidad puede haber un efecto
negativo.

 Naturaleza de los estímulos


Se relacionan ciertos hechos con ciertas consecuencias en función de los sistemas de defensa interno
(alimentos) o externos (animales amenazantes). Si un estímulo (mal estar) es interno se asociará con la
comida, mientras que uno externo con otro externo (descarga con una luz).

11
 CONDICIONAMIENTO INSTRUMENTAL

 PARADIGMA INSTRUMENTAL
Condicionamiento instrumental: aprender a
realizar una conducta o actividad nueva
(conducta o respuesta instrumental) ante un
estímulo discriminativo, el cual utiliza el sujeto
para obtener algo. La recompensa es un
reforzador.

El condicionamiento instrumental y el
condicionamiento clásico son dos variedades de
un proceso común de asociación. En el
condicionamiento clásico el sujeto es pasivo, la
aparición de los dos estímulos (EI y EC) no
dependen de lo que el sujeto haga, no es necesario que el sujeto realice la respuesta tras el EC para
que aparezca el EI. Este aparece independientemente de lo que el sujeto haga, es el experimentador
el que decide. La respuesta que realiza el individuo es consecuencia del condicionamiento.

En el condicionamiento instrumental depende del sujeto. Si el gato de la caja de Thornedike no da a la


palanca, no recibe comida. Debe realizar la conducta para recibir la consecuencia (reforzador) EL
sujeto realiza la conducta instrumental en presencia de unos estímulos determinados llamados
discriminativos que dan lugar a la obtención de varias consecuencias o reforzadores.

Thorndike quiso estudiar la inteligencia animal. Para ello metía un gato hambriento en una caja
problema y ponía comida fuera. La tarea del gato consistía en aprender a escapar de la caja para
obtener la comida. Comprobó que a medida que avanzaban los ensayos, los gatos tardaban menos en
salir. Interpretó que esa mejora era resultado del aprendizaje, de una asociación entre su conducta y
el estímulo antecedente. Formulo entonces la ley del efecto que dice que si una respuesta ejecutada
en presencia de un estímulo, va seguida de un hecho satisfactorio, la asociación entre el hecho y la
respuesta se fortalece. Si el hecho es molesto, la asociación se debilita.

Estos resultados despertaron el interés de los científicos, que diseñaron nuevas situaciones
experimentales.

 SITUACIONES EXPERIMENTALES ESTUDIADAS

o Ensayos libres (Small 1900, laberintos) Solo pueden realizar la respuesta instrumental una vez por
ensayo. Corredor (laberinto recto) y laberinto en forma de T.

o Operante libre (El sujeto puede repetir la instrumental una y otra vez) B. F Skinner (1938) quería
analizar en laboratorio una forma de conducta que fuera representativa de toda la actividad que se

12
produce continuamente. En la caja se Skinner medimos la latencia de respuesta, magnitud… pero sobre
todo la tasa de respuesta. Previamente hay que definir una unidad mediable de conducta. Definimos
unidades de conducta en función de su funcionalidad.

 ELEMENTOS DEL PARADIGMA INDTRUMENTAL

ED  R  REF

o Estímulos discriminativos (ED): en su presencia la realización de una conducta llevará unas


consecuencias.

Hay estímulos discriminativos positivos y negativos.


 Positivos: Indican al sujeto si la relación de contingencia positiva entre la respuesta y las
consecuencias. ¿Qué tipo de relación hay entre acción y consecuencia? Un Ed es positivo porque
se dice que de la acción se derivan sus consecuencias (sean las que sean) No tiene que ver con
el valor motivacional, aquí también habría contingencia positiva (contingencia = relación entre la
conducta y sus consecuencias, sean estas agradables o desagradables para el sujeto) También
sería contingencia positiva si hubiese relación pero el reforzador fuese negativo (por ejemplo
descarga) Contingencia positiva entre la acción y el reforzador

 Negativos: Señal del ambiente que indica que hay una relación de contingencia negativa
entre su acción y las consecuencias (no hay reforzador presente) Indica que de la acción no
se deriva una consecuencia (no tiene que ver con el valor motivacional).

Los reforzadores también se clasifican en función de su valor motivacional:


 Reforzador positivo: aquellos que tienen valor motivacional apetitivo
 Reforzador negativo: estímulos reforzantes que tienen cualidades desagradables
(aversivos)

13
o Respuesta instrumental (RIns): es
una respuesta intencionada en el
sentido de que tiene un fin, puesta
que se realiza con el fin de obtener un
reforzador.

o Reforzador: consecuencia
encaminada a fortalecer la relación
Ed-Respuesta instrumental.
El sujeto realiza una acción (conducta
o respuesta instrumental) en
presencia de unos estímulos determinados (estímulos discriminativos, Ed) que da lugar a la
obtención/eliminación de ciertas recompensas (reforzadores) tras realizar la respuesta
instrumental. Siempre se debe debe realizar la respuesta para poder obtenerlo.

Puede ser de dos tipos:


- Reforzador positivo: apetitivo, agradable.
- Reforzador negativo: aversivo, desagradable.

En el condicionamiento clásico recordamos que un E neutro tras su asociación con el EI, pasaba a
ser EC. La respuesta instrumental es el acto motor, intencional, propositivo y encaminado a una
respuesta instrumental, la cual conllevará un reforzador. Por ello, Tolman decía que un acto
instrumental refleja conocimiento.
La respuesta se realiza en un contexto específico (yo no tecleo mi número de cuenta en el
ordenador para sacar dinero, lo hago en el cajero; tampoco pido el café en una lavandería).

¿Es lo mismo lo que el sujeto aprende en los dos tipos de condicionamientos? EN el


condicionamiento clásico (con el EC) la respuesta tiene lugar independientemente de lo que haga el
sujeto. Un EC es una señal que le indica al sujeto que de modo inmediato (sin contemplar sus
respuestas) va a recibir el EI. Se presentan al sujeto independientemente de lo que haga. La
respuesta es un accidente. El sujeto no tiene que hacer nada para recibirlo. En cambio, en el
condicionamiento instrumental (CI) el sujeto si debe hacer algo para obtener la recompensa. Es
necesario realizar la acción.

¿Un Ec es lo mismo que un Ed? No son lo mismo. Los Ed son estímulos presentes en el
condicionamiento instrumental que indican al individuo la relación entre la acción y sus consecuencias.
Cuando el EC se presenta, va seguido por el EI y se presentan con independencia de lo que el sujeto
haga. En cambio el Ed no indica que va a recibir el EI, es una señal que indica que puede realizar la
conducta tras la cual va a recibir el reforzador. El reforzador es lo mismo que el EI, solo que
utilizamos terminología diferente para cada paradigma. Un EC entonces es una señal que advierte al
sujeto que de modo inmediato se va a producir el EI (el sujeto no tiene que hacer nada) El Ed es una

14
señal que indica al sujeto que en esas condiciones se debe realizar una acción para obtener
determinados estímulos (reforzadores) En términos físicos pueden ser idénticos pero su significado
es distinto para el sujeto.

 VARIEDADES DE CONDICIONAMIENTO INSTRUMENTAL

o Valor motivacional Ref


Criterios para distinguir los distintos tipos de CI:

Contingencia es lo mismo que relación (entre 2 estímulos):


 Contingencia positiva: cuando un estímulo provoca un resultado (independientemente de si ese
resultado es placentero o no para nosotros, eso sería referido al valor motivacional).
 Contingencia negativa sería la no relación entre estímulos (retirada de estímulos).

Hay contingencia relativa si hay un resultado positivo o negativo. Sólo se necesita que una conducta
provoque esas consecuencias.

15
(Completar)

o RECOMPENSA
 Por ejemplo, salario y trabajo realizado, estudiar y aprobar.
“Entrenamiento o aprendizaje de recuperación”. Aumento de la respuesta.
Contingencia positiva y un reforzador apetitivo (reforzador positivo por lo que aumenta la
respuesta).

o CASTIGO POSITIVO
 Un sujeto presiona la palanca y recibe una descarga eléctrica. Si no realiza la acción, no la
recibe.
Contingencia positiva, porque hay relación y reforzador aversivo ¿Qué efecto conductual tendrá?
Disminución de la respuesta (“castigo positivo”, el nombre no tiene que ver con el valor
motivacional)

¿Semejanzas o diferencias entre ambos? En ambos casos hay contingencia (relación) positiva entre
una acción y una consecuencia. Lo que las diferencia es el valor motivacional del reforzador (en la
recompensa una conducta lleva a conseguir algo positivo, en el castigo positivo una conducta te lleva a
conseguir algo que no tiene para ti valor motivacional alto)

o CASTIGO NEGATIVO (aprendizaje de omisión)


 El carnet por puntos.
Hacer las tareas o respuestas tienen como consecuencia no recibir el reforzador. Contingencia
negativa (omisión de algo positivo, el reforzador retirado es positivo o apetecible). Ocasiona que
algo que esperas recibir, finalmente no se reciba. Disminuye entonces la frecuencia de la respuesta
porque esa acción lleva a omitir algo positivo (por ejemplo, el carnet por puntos).

“Entrenamiento de omisión”: Impide algo positivo. Los efectos conductuales son parecidos a los del
castigo negativo.
 Tengo 8 puntos en el carnet, si me salto el semáforo me retiran puntos.
 Abro la ventana, llega el ladrón y me quita el cuadro.
Mi conducta instrumental es inapropiada y conlleva que me quiten puntos, algo que yo tenía.

16
o EVITACIÓN O ESCAPE
La conducta o respuesta interrumpe o impide algo aversivo, impide algo negativo, pone fin a algo
desagradable (evitación). El reforzador retirado es de tipo aversivo por lo que aumenta la
respuesta. Contingencia negativa. Usa sus actos para eludir hechos aversivos ¿Qué puedo hacer
para eludirlo? La respuesta interrumpe exponerse a la estimulación aversiva. Escape es para eludir
un hecho que ya has experimentado en parte, y evitación es para eludir un hecho que aún no has
experimentado.
- Escapa es cuando el sujeto ya está expuesto al estímulo aversivo y la conducta pone fin al
estímulo.
- Evitación es cuando la conducta se da antes de que se presente el estímulo aversivo.

 No quiero ir a la cena de nochebuena porque no aguanto a la familia, por tanto digo que tengo
que ir a una cena de trabajo a la que no puedo faltar para evitar ir a la cena de familia (evitar).
 El rey se marchó porque Chávez no se callaba (escape). Es positiva (la consecuencia) porque
eludes consecuencias o situaciones negativas.
 Marchar de clase por no aguantar al profesor.
 El perro escapa de A ante la descarga, cuando aprende a anticipar la descarga entonces es
evitación.

 EQUIVALENCIAS O SEMEJANZAS ENTRE C.CLÁSICO Y C. INTRUMENTAL

o Entrenamiento recompensa (CI) y excitatorio apetitivo (CC)


Son lo mismo, puesto que, ambas tienen una contingencia positiva, dando lugar a un aumento en la
tasa de respuesta (instrumental y refleja) y, finalmente, las dos hacen referencia a experiencias
positivas.
- Semejanzas: aumenta la respuesta, contingencia positiva, valor motivacional apetitivo (EI y
reforzador positivo)
- Diferencias: En el C.C el sujeto no tiene que hacer nada para recibir la consecuencia, en el
CI sí que hay que realizar una R para obtener el reforzador.

17
o Castigo positivo (CI) y excitatorio aversivo (CC)
Ambos son experiencias negativas, pero en el condicionamiento clásico como su propio nombre
indica, aumenta la tasa de respuesta y en el condicionamiento instrumental disminuye.
- Semejanzas: contingencia positiva (EI y reforzador negativo)
- Diferencias: en el excitatorio aversivo aumenta la respuesta y en el castigo es más baja
(disminuye) por lo que hay distintos efectos conductuales

o Entrenamiento omisión (CI) e inhibición apetitiva (CC)


Se trata en ambos casos de una contingencia negativa. Pero en el condicionamiento clásico hay una
inhibición de la conducta refleja, mientras que en el instrumental hay una disminución de la
respuesta instrumental.
- Semejanzas: disminuye la respuesta (mismos efectos conductuales) y contingencia negativa
(los reforzadores retirados son positivos)
- Diferencias: En el C.C el sujeto no tiene que hacer nada para recibir la consecuencia, en el
CI sí.

o Evitación o escape (CI) e inhibición aversiva (CC)


Ambas con contingencia negativa, pero en el condicionamiento clásico se inhibe la conducta refleja,
y en el instrumental aumenta la tasa de respuesta instrumental.
- Semejanzas: contingencia negativa (El EI y el reforzador retirados son negativos)
- Diferencias: en el escape aumenta la respuesta, en la inhibitoria apetitiva baja (efectos
conductuales distintos)

 ANÁLISIS PARAMÉTRICO Y PROCESOS GENERALES

o Generalización
Cuanto más similares son los estímulos más se
parece la respuesta.

o Discriminación
Ocurre lo contrario. Saber exactamente ante que
estímulo responder para que hay recompensa.
Consiste en responder de manera diferenciada
hacia estímulos similares. Hay dos mecanismos.
¿Cómo aprendemos a discriminar por ejemplo
entre una luz de 600 mm y una de 650? Al
principio, el individuo responde por igual, pero tras unos
entrenamientos aprende a distinguir, a ver que tras uno
hay reforzamiento y tras otro no.

18
o Magnitud de la recompensa

Cuanto mayor sea la recompensa mayor es la


respuesta y mayor es la adquisición de
aprendizaje. También influye el valor
motivacional de la recompensa para el sujeto,
valor del incentivo). No siempre una recompensa
alta es garantía de un gran CI, a veces influye el
modo de presentar esa recompensa. Por
ejemplo, un billete de 10 euros, tiene un valor
absoluto, pero también tiene un valor relativo
para el individuo. Un ejecutivo mostrará menos
respuestas de búsqueda que un pobre. Si para los sujetos la recompensa es grande, estarán más
motivados. El efecto de un procedimiento de condicionamiento instrumental en la conducta aumenta
cuanto mayor es la cantidad/cualidad del reforzador.

Se introducen dos sujetos en un laberinto lineal en cuya meta se encuentra una caja con comida. El
tiempo de realización de la conducta disminuye a medida que aumentan los ensayos. Mientras el primer
sujeto recibe 6 bolitas de comida, el segundo tan solo recibe 1. El que aprende más rápido es el que
recibe 6 bolitas, debido a la mayor magnitud de su recompensa. Cuando ambos sujetos han alcanzado la
asíntota del aprendizaje, se comienza a dar 6 bolitas también al segundo sujeto, de manera que este
reduce aún más el tiempo de realización de la conducta (hay mayor valor del reforzador). Se trata de
un ejemplo de aprendizaje incentivo.

 Contraste conductual positivo: los sujetos


responden más a un premio favorable si
previamente han recibido un premio menos
favorable que si no han tenido esta
experiencia anterior. El premio favorable
parece especialmente bueno a los sujetos
al contrastarlo con el que habían recibido
antes que era peor. No depende tanto del
valor absoluto, como de la valoración que le
da el sujeto.

EJ: cuando al sujeto acostumbrado a 1 bolita, cuya velocidad de respuesta era más lenta, les
suministramos 6, y la tasa de respuesta
aumenta mucho más que las que recibían 6,
que por el contrario, mantienen su velocidad
de respuesta.

 Contraste conductual negativo: Se le da


menos recompensa de la que espera. Los

19
sujetos responden menos intensamente a un premio desfavorable si han recibido un premio
mejor si no han tenido esta experiencia anterior. El premio desfavorable parece especialmente
malo a los sujetos al contrastarlo con el que habían recibido antes, que era mejor.

EJ: aquellas ratas que reciben una bolita tienen una tasa de respuesta constante, y las que
reciben 6 una menos constante. Tras un periodo de tiempo, a ambos grupos se les da una bolita
de comida, de tal manera que el primer grupo, sigue experimentando una velocidad de
respuesta similar. En cambio, en el segundo grupo, ya que la recompensa disminuye, las ratas
sufren una recaída de mayor magnitud que aquellas a las que se mantuvo.

o Demora del reforzamiento


Cuando mayor sea la demora más difícil es
que se produzca el CI, por ejemplo,
saltarse un semáforo en rojo y la multa se
produce un año después. La eficacia del
reforzamiento es mayor cuando es
inmediato. Cuanto más rápido se da el
reforzamiento menos latencia de la
respuesta.

 FORMAS DE REFORZAMIENTO
Lo más importante de todo lo dicho es el modo en cómo se administre.

o Continuo cada vez que se realiza la


respuesta o conducta se obtiene el
reforzamiento. Siempre se da
reforzamiento.

o Intermitente  a veces se refuerza y


otras no (no siempre que el sujeto realiza la
conducta recibirá el reforzamiento) Es el más
eficaz. A veces se da reforzamiento y a veces
no. Se consigue una tasa de respuesta muy alta.

o Intervalo: la obtención de la recompensa


depende del tiempo desde la última acción

20
realizada y reforzada. La obtención del reforzamiento depende de la última vez que la conducta
fue reforzada.

 IF (depende de un intervalo fijado, por ejemplo 30 segundos) Depende del tiempo transcurrido
desde la última vez que el sujeto recibió la recompensa
 IV (intervalo variable) El tiempo varía (a veces una semana, otras un mes…)

o Razón: la obtención de la recompensa depende del número de acciones que realiza el sujeto) Para
obtener la recompensa hay que realizar la conducta un número determinado de veces que puede
ser fijo (RF) o variable (RV)

 RF (razón fija) El sujeto recibe la recompensa tras hacer un determinado número de


respuestas (por ejemplo, tras dar 50 veces a la palanca)
 RV (razón variable). Cuando el número de veces cambia o se mantiene en torno a intervalo.

Cada programa tiene su pauta típica de respuesta. En general, el reforzamiento intermitente (efecto
del reforzamiento parcial) genera tasas de respuesta más alta. Por ejemplo, máquinas tragaperras.

21

También podría gustarte