Está en la página 1de 136

BLOQUE I: FUNDAMENTOS PSICOLÓGICOS

TEMA 1: Introducción: Aprendizaje y conducta

La asignatura versa sobre un proceso cognitivo básico: aprendizaje (A), pero ni siquiera sobre
todas las formas de aprendizaje: solo el aprendizaje que resulta de asociar (mentalmente; es
un proceso mental, algo de lo que no hablan los conductistas) a través de la experiencia
eventos “contingentes” (relacionados, que covarían) del medio, con los consiguientes efectos
sobre la conducta: aprendizaje mediante condicionamiento (A…C*).

Es decir, se centra en el estudio de los cambios conductuales provocados por procesos


mentales asociativos desarrollados con la experiencia.

Se puede aprender mediante razonamiento, pensamiento, sin maestros, sin


métodos…Antiguamente se pensaba que, si se da aprendizaje, la conducta cambia.
Actualmente, esto es más flexible:
puede ser que se haya aprendido, que se hayan asociado eventos mentalmente, pero que
no influya en la conducta.

Algunas siglas empleadas en Aprendizaje y Condicionamiento: A&C.


A: Aprendizaje – C: Condicionamiento
§ As: asociación.
§ AAs ≈ AmC ≈ AAsCo: aprendizaje asociativo ≈ aprendizaje mediante condicionamiento ≈
aprendizaje asociativo conductual.
§ CC = CP: condicionamiento clásico o pavloviano (variante especial: CE = condicionamiento
evaluativo).
§ CI ≈ CO: condicionamiento instrumental u operante (Skinner hizo distinción entre ellos,
pero no los diferenciaremos tanto).
§ E–Es: estímulo/s: EI/EC/ED/ER = estímulo in/condicionado/desencadenante/reforzante.
§ PEDA: patrón estándar de la dinámica afectiva.
§ PO: procesos oponentes.
§ R–Rs: respuesta/s (≈ Co: Conducta); RI/RC = respuesta in/condicionada.
§ Rf: reflejo.
§ S–Ss: sujeto/s o persona/s (por ejemplo, participante/s en investigación).
§ SN (SNC) = sistema nervioso (central).
§ Ψ = Psicología.

ÍNDICE

1- Antecedentes de la Psicología del Aprendizaje

2- Procesos del Aprendizaje


a. Asociacionismo Conductual mecanicista
b. Asociacionismo Conductual cognitivo

3- Experimentación Animal
4- Noción del Aprendizaje mediante Condicionamiento

1. ANTECEDENTES DE LA PSICOLOGÍA DEL APRENDIZAJE

Hasta hace 2 ó 3 siglos, la idea de aprendizaje del comportamiento tenía un peso


secundario. Se consideraba que los animales actúan movidos por sus instintos innatos y que
las personas nos comportamos guiados por nuestra voluntad libre y consciente (libre
albedrío), escapando a las leyes naturales.
(También Aristóteles tuvo importancia antes, al contrario que Platón).

a) Descartes: dualismo cuerpo–mente. Primer pensador importante que tuvo influencia


indirecta. Era racionalista. Definió dos tipos de actividad en los organismos:
– Acción involuntaria: los reflejos. Los reflejos están gobernados por las leyes del
organismo (la naturaleza): mundo físico. Mediados por el sistema nervioso, son
reacciones automáticas desencadenadas por estímulos externos.
– Acción voluntaria: conducta deliberada. La conducta deliberada depende de la
mente: realidad psíquica. No depende de los estímulos externos.
El error de Descartes fue independizar la mente del organismo, al considerar que no está
gobernada por leyes de la naturaleza.
Aunque el dualismo cartesiano no enfatiza la importancia del aprendizaje ni en los reflejos ni en
la conducta deliberada, a partir de él surgen 2 corrientes de pensamiento/estudio que sí lo
harían, en Europa:
- Reflexología: se ocupa de la naturaleza y funcionamiento de los reflejos (corporales).
Como Pavlov.

- Mentalismo: se ocupa de la naturaleza y funcionamiento de la mente (humana).


Fueron filósofos en siglos XV, XVI, XVII.
A finales del siglo XIX, las dos corrientes enfatizan la importancia del aprendizaje. A partir de
ahí, la Psicología conductista desarrolló esta asignatura.
- Mentalismo: naturaleza de la mente.
• Descartes:
– Contenidos de la mente: ideas innatas en gran medida, no derivan del aprendizaje.
– Modo de operar de los procesos mentales que originan la conducta: voluntaria,
consciente y libre (no gobernada por leyes naturales). Surgía de fuera de componentes
físicos de la realidad humana.
Según él, existe libre albedrío.
• Empiristas británicos (David Hume, John Locke…): enfatizan la idea de
– Contenidos de la mente: ideas adquiridas a través de la experiencia. Tabula rasa:
nacemos sin ideas o tendencias innatas, sin esquemas preconcebidos.

– Modo de operar de los procesos mentales que originan la conducta: mediante


las leyes de la asociación, que relacionan diferentes contenidos para generar
contenidos más complejos.
Los empiristas, siguiendo el planteamiento iniciado por Aristóteles, consideraban que el
conocimiento humano procede de las sensaciones elementales aportadas por los sentidos y
los consiguientes registros o ideas que quedan en la mente, cuando se desvanecen las
impresiones sensoriales producidas por los estímulos ambientales.
A partir de ahí, el conocimiento y los conceptos complejos se desarrollan por la asociación
de ideas más simples, siguiendo los principios o leyes de asociación.
Nuestro contenido mental, además de estar constituido por estímulos del medio adquiridos a
través de los sentidos, está gobernado por las leyes de asociación.
Las leyes de asociación ya fueron planteadas por Aristóteles y son las siguientes:
1) Contigüidad: dos experiencias que tienen lugar de forma contigua (próximas en tiempo y
espacio) se asocian en la mente.
2) Semejanza: la mente tiende a relacionar elementos que se parecen.
3) Contraste: se asocian los opuestos entre sí como límites o marcos de una dimensión.
4) Frecuencia: dos experiencias que nos encontramos contiguas de forma repetida se
asocian más que si solo se encontraran una vez. Cuantas más veces aparezcan dos cosas
juntas, más las asociaremos entre sí (grado de asociación).
5) Recencia: las cosas que hemos encontrado contiguas últimamente están más fuertemente
asociadas en la mente que las que encontramos hace tiempo (fuerza de la asociación).
6) Intensidad: las vivencias o sensaciones se asocian más cuanto más sobresalgan, más
importantes sean, más se perciban.
Es la Teoría de la copia asociacionista: si la mente se gobierna por estos principios
asociativos, tiende a copiar lo que se encuentra en el ambiente → las cosas que aparecen
juntas también se asociarán en la mente.
La mente refleja la realidad, la estructura del mundo real.
El aprendizaje refleja variaciones o regularidades del ambiente, las registra y no construye.
Se concibe a la mente como una tabula rasa: no existirían ideas que no procedan de la
experiencia.
Esta perspectiva finalmente cambió en Psicología por una más constructiva.
*La conducta, en realidad, es resultado de la interacción entre la dotación genética y el
ambiente; por tanto, cada persona tendrá una conducta diferente. Ninguna persona comparte
el mismo ambiente, aunque la dotación genética sea compartida por gemelos monocigóticos.
No hay libre albedrío.
Si dos personas que comparten el mismo ambiente y la misma genética son sometidas al
mismo estímulo, reaccionarían igual.

- Reflexología: naturaleza de los reflejos.


• Descartes: los reflejos son reacciones simples, innatas y fijadas por el sistema nervioso a
estímulos desencadenantes naturales. Ejemplos: reflejo salivar, reflejo palmar (se pierde tras
la niñez). Reflejos ligados de forma inexorable a ciertos estímulos que los disparan.
Los siguientes fisiólogos rusos ampliaron esa definición de reflejo:
• Sechenov: muchas veces los estímulos, aunque no provoquen directamente ciertas
conductas, pueden hacerlo indirectamente al liberarlas de los mecanismos que las tienen
inhibidas. En ese caso, la reacción no tiene por qué ser proporcional al desencadenante inicial.
Eventos menores pueden dar lugar a reacciones complejas. También las conductas
complejas son reacciones ante situaciones o estímulos desencadenantes naturales.
Sigue considerando innatos e invariables los reflejos.
• Pavlov: siendo innatos, los reflejos no son fijos e invariables como decía Descartes, sino
que se pueden ligar a nuevos estímulos desencadenantes que no los provocaban de forma
innata. El reflejo digestivo, normalmente desencadenado por estímulos sensoriales de la
comida, podía desencadenarse solo con los pasos del cuidador.
Esto significa que muchas reacciones reflejas pueden ser aprendidas por
condicionamiento. Y además de sufrir cambios cualitativos como los descritos, también
pueden sufrir cambios cuantitativos por habituación y sensibilización.

b) A finales del siglo XIX se da el clima propicio para pensar que buena parte del
conocimiento y la conducta humana son aprendidos, por asociación. Gran importancia de
los mecanismos asociativos:
proceso psíquico fundamental por el que, a través de la experiencia, cambia el
comportamiento; se desarrollan nuevas pautas de actuación, nuevos contenidos mentales.

La Psicología surgió en torno al segundo cuarto del siglo XIX, pero este movimiento se
consolida en el siglo XX. La Psicología inicia en el siglo XX la investigación científica del
aprendizaje: concretamente, del aprendizaje mediante condicionamiento.
• Pavlov estudia cómo cambian las “conductas reflejas” por el desarrollo de asociaciones
estímulo–estímulo: condicionamiento clásico o pavloviano.
• Thorndike estudia cómo cambian las “conductas voluntarias” debido a sus consecuencias,
asociaciones respuesta–estímulo: condicionamiento informado u operante (que desarrollaría
Skinner más tarde).
• El conductismo desarrolla durante la primera mitad del siglo XX el condicionamiento clásico
y el instrumental: implanta la Psicología del aprendizaje.
• La Psicología actual continúa investigando y desarrollando el condicionamiento clásico y
el instrumental.
2. PROCESOS DE APRENDIZAJE
Todos los organismos nos adaptamos a nuestro entorno gracias a la capacidad de aprender.
Mediante el estudio, el entrenamiento y la experiencia, sea en centros de instrucción o en la
vida, aprendemos muchas cosas distintas de diferentes maneras a través de procesos
diversos. Son aprendidos todos los conocimientos y comportamientos que no responden a la
herencia genética, que no son innatos.
Aquí solo vamos a ocuparnos del aprendizaje mediante condicionamiento asociativo, que
se produce en la vida, se investiga en laboratorio –en gran medida mediante experimentación
animal– con importantes implicaciones prácticas en Psicología humana. Se les instruía para
que llevaran a cabo conductas arbitrarias.
Se puede hablar de dos mecanismos mentales generales de aprendizaje: desarrollo de
asociaciones entre eventos (ASOCIACIONISMO) y reestructuración mental
(CONSTRUCTIVISMO).
Asociacionismo: asimilando covariaciones y regularidades ambientales
El aprendizaje asociativo conductual constituye el proceso psicológico central para el
enfoque dominante en Psicología entre 1920–1960: conductismo, caracterizado por una serie
de planteamientos y supuestos que afectaron de forma decisiva la concepción del aprendizaje.
La disciplina de Psicología del Aprendizaje surge como tal, se consolida y adquiere la
máxima relevancia dentro de la corriente conductista.

El aprendizaje asociativo conductual consiste en la adquisición de conocimiento y la adaptación


conductual a que da lugar el desarrollo de asociaciones provocadas por la experiencia con
eventos del entorno.
En el conductismo se pueden distinguir 2 concepciones:
1) Asociacionismo conductual mecanicista.
2) Neoasociacionismo cognitivo (incluso animal): se fue imponiendo cada vez más. Tiene en
cuenta los procesos mentales.

1) Asociacionismo conductual mecanicista: aprendizaje reproductivo.


Derivado de los supuestos del conductismo radical.
Según Watson, no se debían estudiar aquellos procesos no observables en las personas (lo
que dicen o piensan), sino la conducta manifiesta, que sí es observable. De esa manera,
pretende desarrollar una psicología objetiva y científica.
– Objeto de la Psicología: la conducta manifiesta (respuestas).
– Considera que la respuesta está provocada por estímulos ambientales: adopta una
interpretación estímulo–respuesta (E–R). Se aplica a la Psicología los principios de la
epistemología positivista.
– Planteamiento atomista: los comportamientos complejos resultan de cadenas de
asociaciones entre elementos simples.
– Reduccionismo antimentalista: no tenía en cuenta la mente, pues no era accesible a la
ciencia.
– Aprendizaje: asociación E–R → se detecta a través de un cambio en la conducta.
– Principio de isomorfismo o correspondencia: el aprendizaje se limita a reflejar los cambios,
covariaciones, pautas y regularidades que tienen lugar en el ambiente. Se asocian las cosas
que aparecen juntas (causas y efectos). No son innatas. El individuo es un ser pasivo.
– Supuesto de equipotencialidad (modelo: rata): todos los estímulos y todas las respuestas
se asocian entre sí siguiendo los mismos principios (leyes de asociación) en todos los
organismos, incluso entre diferentes especies.
Se utilizan para los experimentos conductas y estímulos arbitrarios para “partir de 0”, en lugar
de usar los naturales.
Consecuencias de los axiomas que definen el conductismo:
– Para investigar los principios básicos del Aprendizaje no consideraban críticos ni las
especies, ni los sujetos, ni los estímulos, ni las conductas manejadas: valía trabajar con
respuestas arbitrarias en ratas. Luego se pueden extrapolar las conclusiones funcionales,
con las adaptaciones correspondientes, a nuestra especie en su contexto natural.
- Generó durante décadas un corpus formidable de investigación y la principal teoría
psicológica del Aprendizaje (y la asignatura).
Anomalías empíricas: el Aprendizaje asociativo no siempre responde a los supuestos
precedentes.
Comenzaron a aparecer datos experimentales que no encajaban en los supuestos teóricos.

– Los procesos de aprendizaje no siempre conllevan cambios en la conducta: aprendizaje


latente.
• Ejemplo de Tolman: puso de manifiesto que los organismos (ratas) podían aprender
laberintos, desarrollar un mapa mental, sin mostrar cambios en la conducta. Puede
ser que no tengan interés en llegar a la meta porque no encuentran el refuerzo o
motivación idóneo al final de esta.

Estos datos obligan a distinguir entre aprendizaje (proceso interno de adquisición de


conocimiento) y actuación (manifestación conductual externa resultante del aprendizaje, que
no tiene por qué aparecer siempre).
– No todos los eventos se asocian igual: su asociación depende de la relevancia biológica
mutua, que a su vez varía según las especies.
– No siempre se asocian eventos que aparecen juntos: no basta la contigüidad. Para que un
animal asocie dos estímulos no basta con que estos aparezcan juntos un cierto número de
veces; es necesario que la aparición de uno dependa de la presencia del otro. Puede ser
que uno aparezca muchas veces solo.
– Cuenta la naturaleza biológica y cognitiva de los organismos.

2) Neoasociacionismo cognitivo animal: liberalización del mecanicismo.


Las anomalías empíricas y la irrupción del cognitivismo dan importancia a la actividad mental y
los procesos cognitivos. Ponen de manifiesto:
– Diferencias importantes entre especies y eventos.
– Que la influencia del ambiente está mediada por procesos cognitivos.
– Incorpora supuestos de Psicología humana a la investigación animal. Ejemplo: sistemas
de memoria, teoría de la atención, esquemas mentales, expectativas, información (reducción
de la incertidumbre o la sorpresa ante eventos importantes).
Sin embargo, sigue:
– Buscando principios básicos generales de aprendizaje, que también afecten a las
personas.
– Defendiendo que compartimos mecanismos asociativos básicos con otras especies.
– Interés de las investigaciones centrado en el análisis E–R (en animales).

Hoy, la investigación del aprendizaje mediante condicionamiento enfatiza cada vez más:
– Los procesos cognitivos que intervienen en el condicionamiento.
– El interés por su funcionamiento en las personas.
La conducta interesa en la medida en que nos informa de la naturaleza de la mente, que no
puede ser observada directamente.
– Sus bases neurobiológicas: en lugar de las bases comportamentales y ambientales.
La Psicología actual es mucho más integradora (ecléctica) que la que dominó la mayor parte
del siglo XX.
Ya no se puede hablar de escuelas o paradigmas cerrados.

Enfoques asociacionistas (RESUMEN DEL


ASOCIACIONISMO)
Otorgan mayor o menor peso a las asociaciones.
- Conductual animal: conductismo.
– Mecanicista (a): distinguir entre distintos ambientes
o estímulos, análisis del ambiente para ver cómo
generan distintas respuestas. Entre medias, nada.
– Cognitivo (b) daba mayor importancia a procesos y
estructuras cognitivas.
- Conductual humano: cognitivismo.
– De PI (c): también incluye asociaciones. Estímulos
son input, respuestas son output.
No entra:

- Asociacionismo computacional

- Punto 1.2.2

- Punto 1.2.3

3. EXPERIMENTACIÓN ANIMAL
Obviados los aspectos mentales y asumido el supuesto de equipotencialidad, inicialmente el
conductismo recurrió en gran medida a la experimentación animal (modelo/rata y
objetivo/psicología humana solo tienen que resultar comparables en la función relevante,
sometida a estudio), para investigar el Aprendizaje con control y rigor.
*No entra de la página 12 a la 17.
Ejemplo: tener ratas con cepas genéticamente modificadas, tener la certeza de que nunca han
sido sometidas a cierto estímulo.
Después, habría que adaptarlos en función de las diferencias entre especies, pero esto permite
estudiar los procesos básicos.

Ratones albinos/ Monumento ratón en el laboratorio de Novorsivirsk, Rusia. Ventajas de


trabajar con ratones:
- Fácil manejo.
- Tamaño apropiado manejo y manipulación.
- Periodo gestión y destete corto.
- Camadas grandes.
- No requieren demasiados cuidados.

Genoma y sistema inmune similar entre todos y parecido con los humanos.

Las grandes transformaciones del sistema nervioso a lo largo de la evolución de las


especies se deben más a la incorporación de nuevas estructuras que a la sustitución de las
antiguas por otras más avanzadas, por lo que las especies más próximas en la escala evolutiva
debemos compartir mecanismos psicológicos, como los asociativos. Por eso la investigación
animal puede proporcionar información muy útil para comprender la naturaleza humana.

Ejemplo de Aprendizaje compartido en diferentes especies: miedo condicionado


Aprender miedo mediante Aprendizaje condicionado. Hay miedos que son naturales (por
genética), otros que se aprenden por cultura, pero hay otros que se aprenden por
condicionamiento pavloviano.
Ejemplo: asociar sonido con descarga eléctrica. La respuesta de miedo, finalmente, se
producirá con solo oír el sonido.

Los mecanismos y bases neurológicas son similares en las diferentes especies.

La extrapolación tiene un límite


Nuestros mecanismos asociativos compartidos con otras especies son menos de los asumidos
inicialmente por Pavlov o el conductismo radical, pero son numerosos e importantes, y nada
despreciables.

4. NOCIÓN DE APRENDIZAJE MEDIANTE CONDICIONAMIENTO

Noción actual de Aprendizaje asociativo conductual: desarrollo de conocimiento


asociativo entre eventos ambientales producido por la experiencia, con el consiguiente
cambio (potencial) en la conducta.
Influencia de la psicología cognitiva y la filosofía empirista de la mente: el aprendizaje es
un proceso mental, de naturaleza cognitiva. Por ello, no es directamente observable, solo se
puede inferir.
Influencia del conductismo: puede provocar cambios en la conducta.
Influencia del conductismo y el empirismo: producido por la experiencia.

Aprendizaje asociativo y su relación con la experiencia y la conducta

Las dos flechas inferiores representan casos de cambio de conducta distintos al


Aprendizaje, que no responden a adquisición de conocimiento. Ese es el caso de los
cambios debidos a la maduración psicobiológica, a estados motivacionales de los organismos o
a simple cansancio.
– Maduración: programación genética, llega un momento en que se tienen ciertos
impulsos o creencias. Aunque es verdad que la mayor parte de los cambios generados
por la maduración suelen requerir o verse afectados por la estimulación ambiental
(comportamientos sexuales).
– Modificación del estado motivacional o fisiológico: hambre, incremento de
secreción de ciertas hormonas. En ocasiones pueden ser resultado de la experiencia,
pero no constituyen fenómenos de aprendizaje porque son transitorios y no están
mediados por la adquisición de conocimiento.
– Fatiga: es reversible en cuanto se descansa.

Se puede hablar de aprendizaje asociativo entre eventos, eventos de 2 tipos:


1) Asociación entre 2 estímulos ambientales, uno inductor innato de un reflejo que,
por la asociación, acaba siendo provocado también por el otro estímulo:
CONDICIONAMIENTO CLÁSICO.
2) Asociación entre una conducta del sujeto y un estímulo ambiental /
consecuencia reforzante, con los consiguientes cambios en la conducta:
CONDICIONAMIENTO INSTRUMENTAL.
Fauna inteligente: gorilas, cuervos, orangutanes y otros representantes del reino animal
capaces de desarrollar asociaciones, y más. No somos los únicos que tienen inteligencia y
estas capacidades.
TEMA 2: La “conducta provocada” y su modificación: Aprendizaje pre– asociativo
En este tema nos ocuparemos de los cambios cuantitativos (en intensidad) que experimentan
los reflejos al repetir los estímulos desencadenantes: Aprendizaje pre-asociativo.
Esos cambios constituyen las formas más elementales de aprendizaje (protoaprendizaje).
Dado que en estos casos se trata de reacciones desencadenadas automáticamente por
algún evento ambiental, sin necesidad de que intervengan procesos asociativos o de
aprendizaje previos, se habla de ‘conducta provocada’.
Aunque se trata de reacciones innatas, pueden sufrir cambios con la experiencia.

Ejemplo: una situación que de forma ineludible provoca una respuesta emocional, si esa
situación se repite cambia la reacción a raíz de esta experiencia; sobre todo si esas
repeticiones son contiguas en el tiempo.

ÍNDICE
1. Los reflejos

2. Cambios en los reflejos


a. Habituación
b. Sensibilización

3. Patrón de las respuestas emocionales y su cambio

4. Teoría de los procesos oponentes

1. LOS REFLEJOS
- Reacciones innatas, por lo general simples, disparadas por un estímulo desencadenante.
Ejemplo: reflejo parperal (cerrar los párpados).
Se disparan automáticamente ante estímulos específicos y predeterminados: un objeto que
se aproxima rápidamente al ojo; mientras que, si cerramos los ojos de forma voluntaria,
podemos hacerlo por muchas razones diferentes.

- Son respuestas adaptativas rápidas, que no necesitan ser aprendidas. Son útiles
para la supervivencia. Intervienen en múltiples actividades importantes para sostener
las funciones vitales.

- También hay reacciones reflejas complejas, como las ‘pautas fijas de acción’ en
algunas especies animales, o ciertas reacciones emocionales en personas. Están
integradas por secuencias estereotipadas de respuestas.
Ejemplo: cuando los salmones, llegado el periodo correspondiente, remontan la corriente del
río con gran esfuerzo y riesgo para su vida, para desovar y reproducirse en zonas propicias, lo
hacen en la primera temporada tras haber nacido, sin necesitar experiencia de aprendizaje. Es
una reacción que resulta de la concatenación de diferentes acciones.
Ejemplo 2: rito de cortejo ante cierto elemento disparador (como una mancha en la hembra):
lleva a una serie de bailes, demostraciones de poder…
Boakers y Watson poniendo a prueba en la ‘barra-fija’ el reflejo palmar de la joven atleta. En
los humanos recién nacidos los reflejos son parte importante de su repertorio
conductual. Los bebés son capaces de sujetarse, incluso de sostener todo su peso, gracias al
reflejo palmar. El reflejo tiene su ciclo vital y acaba desapareciendo.
A nivel neurológico, en las respuestas reflejas:
- Intervienen como mínimo 3 tipos de neuronas / haces neuronales (nervios):
1) Sensitivas / aferentes: detectan la información, el estímulo desencadenante del
reflejo. Transmiten el mensaje sensorial al sistema nervioso central.
2) Motoras / eferentes: transmiten los impulsos para la ejecución de la reacción.
3) Interneuronas: conectan entre sí las dos anteriores.
Ejemplo: subida repentina de temperatura cuando ponemos la mano encima de algo caliente.
La neurona sensitiva lleva la información al sistema nervioso central, frecuentemente a la
médula espinal; de allí arrancan neuronas motoras que controlan la reacción o ejecución de la
respuesta refleja (retirar la mano inmediatamente) y, normalmente, también interviene una
interneurona que conecta la sensorial con la motora.
- Estos tres elementos conforman el ‘arco reflejo’ que, al estar integrado por células
sensorio-motoras específicas, hace que las distintas reacciones reflejas solo sean
desencadenadas por un conjunto limitado de estímulos.

El arco reflejo puede operar a nivel medular, aunque también suele transmitir señales al ser
modulado desde el cerebro. El cerebro interviene en la regulación/modulación del reflejo,
pues las neuronas sensitivas derivan información hacia el cerebro para informarle acerca de lo
que ocurre.
Ejemplo: un faquir que esté acostumbrado a entrar en contacto con fuego y aguantar, puede
no reaccionar de forma refleja ante el estímulo antes descrito, retrasar la respuesta o
reaccionar más despacio. Y al revés, si una persona sospecha que la encimera puede quemar,
puede que retire la mano antes que quien la toca sin querer. Es una potenciación del reflejo
regulada desde el cerebro: reaccionas preventivamente.
- Esto implica que la intensidad del reflejo ante un estímulo desencadenante puede variar
por razones psíquicas: manejadas desde el cerebro.

2. CAMBIOS EN LOS REFLEJOS


La noción de aprendizaje con la que acabamos el tema 1 no encaja del todo con la del tema 2.
Esa noción estaba pensada para el aprendizaje asociativo conductual.
Esta es una forma más básica y elemental del aprendizaje, a veces se denomina
protoaprendizaje, aunque sea un cambio producido en la conducta producido por la
experiencia; no implica un cambio en el conocimiento de antes.

Descartes fue el primero en formalizar el concepto de ‘reflejo’.


Pese a ser innatos, los reflejos pueden cambiar con la experiencia, para adaptarse. Uno de
los hechos más llamativos de la conducta es su plasticidad.
La repetición del estímulo desencadenante unas veces reduce (habituación) y otras
incrementa (sensibilización) la respuesta refleja.
Ambos son cambios meramente cuantitativos: no conllevan asociaciones nuevas. Son formas
muy elementales (preasociativas) y complementarias de aprendizaje, o protoaprendizaje.
El cambio en la respuesta no es producto del desarrollo de ninguna asociación nueva, sino que
solo se trata de modificaciones en la intensidad de la reacción refleja.

a. Habituación
- Reducción progresiva de los reflejos al repetirse los estímulos desencadenantes.
- Es lo que suele ocurrir, sobre todo cuando los estímulos desencadenantes no resultan
nocivos (es lo práctico) ni son muy intensos, o que el organismo no los considera como
nocivos.
- Especificidad en cuanto a los estímulos ante los que se observa. Desarrollada habituación
ante un estímulo específico, la atenuación de la responsividad resulta específica para ese
elemento u otros muy similares. A su vez, el hecho de que estímulos parecidos al habituado,
pero que no aparecieron durante el proceso de habituación, también dejen de generar
respuesta indica cierta generalización.
Es un cambio mediado por procesos neurológicos centrales. Hay un cambio en la
transmisión sináptica de las conducciones que intervienen en la conducta refleja, a raíz de la
repetición del estímulo desencadenante.
Esto lo pone de manifiesto la deshabituación: la intromisión de otros estímulos intensos y
novedosos durante el proceso de habituación a un desencadenante suele dar lugar a la
recuperación parcial de la respuesta habituada a ese evento.
No debe confundirse con otros cambios periféricos, como el cansancio o la adaptación
sensorial (vemos menos al entrar en una sala oscura después de haber estado al sol; al cabo
del tiempo, vemos de forma normal gracias a la dilatación pupilar).
El organismo deja de responder al estímulo aun cuando siga siendo perfectamente capaz de
sentirlo y de llevar a cabo las reacciones necesarias para responder.
Intensidad: parámetro importante de los estímulos desencadenantes. Cuanto más débil es,
más fácilmente se habitúa.

b. Sensibilización
- Incremento del reflejo al repetirse el estímulo desencadenante.
- Tiende a producirse cuando el estímulo desencadenante resulta nocivo.
- Aun así, suele acabar por aparecer habituación, si el sistema no sucumbe en esas
repeticiones.
Somos capaces de habituarnos casi a cualquier cosa.
Ejemplo: en el ámbito emocional.
Ejemplo 2: reflejo defensivo en gatos ante descargas sucesivas de diferentes intensidades. No
son destructivas. Se compara siempre con la reacción que tuvieron la primera vez que se
aplica el desencadenante. Se repite el desencadenante y se mide cada vez la reacción
defensiva.
– Descarga débil: habituación.
– Descarga media: cierto incremento a partir de la segunda vez (sensibilización), pero
finalmente acabó habiendo habituación.
– Descarga fuerte: sensibilización, aunque luego acabó reduciéndose (sin llegar a cruzar la
línea base; es decir, no hubo habituación respecto al nivel base, sino respecto al nivel máximo
que se alcanzó).
Si, entre medias, pasa mucho tiempo, puede ser que partamos de nuevo de la misma línea
base.

- Pseudocondicionamiento: manifestación especial de sensibilización. Recuerda al


condicionamiento pavloviano, pero no es el mismo.
– A raíz de la exposición al estímulo desencadenante de un reflejo, este puede
aparecer también ante estímulos desencadenantes que antes no lo provocaban (o
aumentarlo, si ya lo provocaban).
– Esta manifestación de sensibilización (conocida como pseudo-condicionamiento) no
responde a asociación entre esos estímulos.
Ejemplo: si una persona ha sufrido repetidas veces una descarga eléctrica y se ha
hipersensibilizado, puede ser que un sonido, una luz, una palabra… desencadenen la
respuesta refleja, incluso aunque no se presentaran de forma contigua en ningún momento. Es
decir, nunca se ha producido una asociación.
Esto significa que la sensibilización no es tan específica y restringida como la habituación
en cuanto a los estímulos que la desencadenan. Además, un estímulo que ordinariamente
produce habituación puede generar sensibilización en individuos traumatizados o
excitados.

Migraña: dolores de cabeza primarios. Hipótesis del trabajo: alteración de la habituación y la


sensibilización. Puede ser que el proceso de habituación no funcione de la misma manera que
en el resto de personas. Habituación deficiente e hipersensibilidad.
– En la migraña, el cerebro de estas personas se caracteriza por una falta de
habituación de la respuesta que provocan los estímulos cuando se repiten.
Ejemplo: hay un ruido en casa del que no somos conscientes porque nos hemos habituado.
Únicamente detectas la ausencia del estímulo cuando deja de escucharse.
En las personas con migraña, las personas tienen el sistema nervioso alterado y no se
habitúa a los estímulos.
– Este procesamiento anormal de la información entrante alcanza su máximo unos
pocos días antes de comenzar el ataque de migrañas. Una fase en la que también se
puede manifestar la presencia de sensibilización; no solo la falta de habituación.
Implicación práctica: la investigación en la migraña puede progresar de forma importante
dependiendo de una mejor comprensión de los mecanismos que subyacen a la habituación y
sus mecanismos. Así se averiguaría la causa de su déficit de habituación.
Conclusión: que la repetición de un estímulo que desencadena un reflejo produzca
habituación o sensibilización depende principalmente de los atributos de la estimulación y
del estado de los individuos. Es probable que se produzca sensibilización ante la repetición
de eventos peligrosos o dolorosos y en individuos que se encuentran excitados.

3. PATRÓN DE LAS RESPUESTAS EMOCIONALES Y SU CAMBIO


¿Qué sucede cuando se repite un estímulo desencadenante de una reacción emocional? (de
forma innata, refleja). Esta es una reacción compleja.
Hay eventos que provocan reacciones complejas, como aquellas que desencadenan las
reacciones emocionales o las drogas psicoactivas.
Muchas respuestas emocionales suelen evolucionar de forma parecida cuando se repite su
desencadenante.

- Cuando tiene lugar una vez


La conducta tiene que ver con el desencadenante, pero no interesa el tipo de emoción que
provoque (valencia positiva o negativa) sino el patrón emocional.
Al margen de la emoción concreta, esta suele mostrar un curso bifásico característico: patrón
estándar de la dinámica afectiva (PEDA).
Hablamos de eventos emocionales transitorios, para analizar tanto sus efectos como lo que
ocurre cuando desaparecen. Ejemplo: drogas psicoactivas, amor, lotería, muerte de un ser
querido (en caso de estímulo transitorio o reversible: que se deba a una equivocación y se
informe tras un tiempo de esto).
Registramos cómo cambia la reacción a partir de la línea base cuando aparece un estímulo
desencadenante.
Reflexionamos acerca de la evolución de la emoción ante desencadenantes presentados en
el tiempo.

Se observa típicamente que, a raíz de la exposición al desencadenante (ejemplo: dosis de


cocaína, una droga estimulante), el sistema entra en un estado de máxima emoción al poco
tiempo de estar expuesto (pico de la reacción afectiva primaria). Conforme transcurre el
tiempo, esa emoción continúa, pero se reduce la intensidad, se reduce el pico y se entra en
una fase de adaptación al estímulo: nivel más bajo y estable de la emoción.
Si llega un momento en que desaparece la incidencia de la situación desencadenante
(periodo de actividad farmacológica delimitado para la droga, al cabo de horas apenas quedan
restos de ella en el sistema metabólico), cruzas la línea base (Ej.: de alegría a tristeza, de
tristeza a alegría, etc.), y entras en un estado emocional opuesto al que disparó el
desencadenante (posreacción afectiva). Con el paso del tiempo también ese estado
emocional se irá desvaneciendo progresivamente, hasta regresar a la línea base.

El PEDA es común para cualquier situación de gran emoción, en general.

- Cuando se repite la situación desencadenante


También es un patrón bifásico. En la imagen anterior, el patrón de la derecha se
correspondería a la enésima exposición al estímulo desencadenante.
- Pierde fuerza la reacción afectiva primaria. El pico de reacción primaria es fuerte,
más fuerte la primera vez que las sucesivas veces.

- Gana intensidad la posreacción afectiva. La posreacción afectiva es menos intensa


la primera vez que las sucesivas veces. También se vuelve más duradera.
La reacción emocional primaria también se conoce como estado A, y la posreacción
afectiva como estado B.

4. TEORÍA DE LOS PROCESOS OPONENTES


Se ha intentado explicar tanto PEDA como su cambio cuando se repite, mediante la
hipótesis de los procesos oponentes (PO), una teoría de proceso-dual orientado a mantener
el equilibrio en el sistema.
En los organismos existe tendencia a mantener un equilibrio en los parámetros psicobiológicos:
homeostasis. Cuando una fuerza externa rompe la homeostasis, el organismo pone en
marcha un proceso compensatorio / oponente. El estado resultante depende de la
correlación de ambas fuerzas.
El sistema neuropsicológico también tiene tendencia a poner en marcha reacciones
compensatorias que ayuden a recuperar la homeostasis emocional si se produce un
desequilibrio.
Esto sucede porque, en esas situaciones en las que una circunstancia nos arrastra hacia un
pico emocional, el estado del organismo responde a dos procesos:

- Proceso a: lo pone en marcha la situación que desencadena la emoción.


- Proceso b: algún tipo de reacción o proceso compensatorio que pone en marcha el
sistema para recuperar el equilibrio, la homeostasis.
Si restamos: ‘proceso a – proceso b’, según cuál sea más potente estaremos en un estado A
consistente en la experimentación de la reacción afectiva primaria, o B, consistente en la
experimentación de la posreacción afectiva. El estado en que nos encontramos en cada
momento es resultado de dos procesos, de la fuerza relativa de A y B.
Resumen de la teoría
1) Drogas y situaciones emotivas son ‘agresiones’ que rompen mediante algún mecanismo el
equilibrio orgánico: proceso a.
2) Para recuperarlo, los organismos ponen en marcha operaciones de compensación: proceso
b. El estado psíquico en cada momento es resultado de sustraer de a la influencia de b.
3) Con la repetición del estímulo desencadenante cambia la correlación de fuerzas entre a y
b.
Mientras el proceso a no cambia, b cada vez opera con mayor celeridad, intensidad y
persistencia.

Esto permite explicar la pauta bifásica de PEDA, y su cambio al repetirse el estímulo


desencadenante.
- La primera vez → a > b
- Luego → b > a
El proceso antagónico puesto en marcha para contrarrestar la “agresión” responsable de la
reacción afectiva primaria inicialmente no resulta demasiado eficaz, por ponerse en marcha de
forma reactiva (algo tarde) y sin intensidad suficiente para anular por completo los efectos del
evento desencadenante. Con la exposición reiterada al evento el sistema “aprende”
progresivamente a protegerse.

Los procesos oponentes subyacentes serían los procesos que ocurren en realidad. La
respuesta afectiva observable es el resultado de restar a – b.
Con la exposición repetida a la situación que altera la homeostasis, aunque el proceso a sea
el mismo (el sistema vuelve a llevar a cabo la bioquímica de la nueva dosis de morfina, por
ejemplo), la reacción compensatoria (dejar de producir endorfinas) alcanza intensidades
mayores y se mantiene durante más tiempo.
Los organismos poseen su propio mecanismo cerebral de producción de sedantes naturales,
las endorfinas. Cuando un organismo recibe este tipo de sustancias exógenas, reduce la
producción interna de endorfinas como reacción compensatoria. Esto explica parte de la
progresiva tolerancia de las drogas.
Al restar, puede que a gane un poquito al principio, pero pronto llega el momento en que
tiene más fuerza la reducción de producción de endorfinas que el efecto de la morfina.
Nivel de producción bajísimo de endorfinas: caes en un estado de inquietud,
hipersensibilidad, molestia.
Parece una habituación, pero realmente es una situación de sensibilización de la reacción
compensatoria, que cada vez funciona mejor. Pero el efecto de la situación desencadenante
es cada vez mejor, nos habituamos gracias a ese proceso de sensibilización.
Aunque se trata de un planteamiento en buena medida especulativo, hay alguna evidencia,
como por ejemplo con drogas como la morfina o la heroína.
Al final los adictos se ven atrapados no por el placer que les proporcionan los narcóticos, sino
por la necesidad de reducir el sufrimiento que les produce su abstinencia.

¿Por qué el proceso b es cada vez más intenso? La reacción compensatoria es mayor
cuando afrontamos las situaciones desencadenantes de la emoción de la misma manera, en
el mismo contexto.
Ejemplo: consumimos cocaína los viernes a las 9 de la noche con los amigos en un lugar
concreto, con determinada música…

Se observa que el efecto de la droga, con uso repetido, es cada vez menor cuando lo hacemos
de la misma manera. El organismo se acostumbra más, es más fácil compensarlo. La misma
situación actúa como estímulo condicionado; en esa situación, el organismo pone en marcha la
situación compensatoria (incluso aunque no se consuma droga). Aprendizaje por
condicionamiento.
En un contexto nuevo, hace de nuevo más efecto. Si hay sobredosis, se soporta peor en
nuevos contextos.
TEMA 3: Condicionamiento Clásico: Fundamentos
Cuando dos eventos covarían, tendemos a asociarlos. Esto afecta con frecuencia a nuestra
conducta.
Cómo se adquieren con la experiencia, a través del desarrollo de asociaciones, conductas
nuevas: emisión de conductas ya existentes por circunstancias que antes no las
provocaban, o desarrollo de nuevas configuraciones conductuales por la integración de
otras más elementales antes existentes, o aparición de conductas nuevas, o
modificaciones en la probabilidad y fuerza de actividades existentes y voluntarias.

A partir de ahora nos ocuparemos del aprendizaje derivado de asociar 2 eventos


contingentes, que cambia la conducta: condicionamiento, del que existen 2 tipos según la
naturaleza de los eventos.

En el condicionamiento clásico ambos eventos son estímulos ambientales, mientras que en


el instrumental uno es una conducta del propio organismo.

ÍNDICE
1. Pavlov y el origen del Condicionamiento Clásico
2. Elementos del Condicionamiento Clásico
3. Respuestas susceptibles de ser condicionadas
a. Reacciones automáticas: Reflejos
i. Efectos de las drogas: pscofarmacología pavloviana
ii. Psiconeuroinmunología: inmunopotenciación condicionada
b. Acciones esqueletales: comportamiento
c. Motivación y afectividad: impulsos y sentimientos
4. Casos especiales: Inhibición condicionada, condicionamiento de 2º orden,
contracondicionamiento…
5. Curso de asociación
6. Generalización y discriminación
7. Importancia de disposición cronológica de estímulos

1. PAVLOV Y EL ORIGEN DEL CONDICIONAMIENTO CLÁSICO


1.1. Los reflejos condicionados
Pavlov observa los ‘reflejos psíquicos’ (condicionados) y expone por 1ª vez su teoría en
Madrid, 1903. Estudiaba cómo se producía la secreción de la saliva en los perros, así como
de otros jugos gástricos, a fin de comprender el funcionamiento de la digestión. Son
respuestas reflejas innatas que se desencadenan automáticamente por el contacto de los
alimentos con las papilas gustativas.
Llegaba él, les daba de comer y registraba la salivación. Observó que antes de que les diera de
comer, cuando lo oían acercarse por el pasillo, ya habían comenzado a salivar, sobre todo si
llevaban un tiempo siendo sometidos a investigación. La primera vez que experimentaba con
ellos no ocurría.
A eso lo llamó ‘secreciones psíquicas’. Empezó a interesarse por ellas, frente a las
fisiológicas o innatas.
Su idea era que: cuando dos centros del cerebro se activan simultáneamente de forma
repetida, se establece una conexión entre esos dos centros, aunque antes no estuvieran
conectados. El sistema nervioso es muy lábil, adaptable (se crean y destruyen
constantemente nuevas conexiones).
Por eso, cuando a un perro se le da comida, esa comida activa ciertas estructuras que
intervienen en la metabolización y respuesta a la ingestión de esos alimentos. Entre otras
cosas, ciertos centros del sistema nervioso vegetativo activan la secreción de las glándulas
salivales y otros centros del sistema digestivo (reacción refleja). Pero, si hay otro estímulo que,
simultáneamente, también se ha procesado por el SNC (percepción de Pavlov), se establecerá
una conexión entre ambos centros.
Se activa el centro que procesa los estímulos visuales y se propaga esa activación al centro
correspondiente al procesamiento de los alimentos. La presencia de Pavlov activa las
glándulas salivales.
Abandonó sus líneas de investigación sobre el funcionamiento del sistema digestivo para
centrarse en la investigación de las secreciones psíquicas. Si la educación y los beneficios
del entrenamiento son resultado de establecer nuevas conexiones nerviosas, podría
comprenderse cómo se origina la conducta en general. Pavlov montó su laboratorio en San
Petersburgo (Nobel en 1904).
Allí había instrumentos necesarios para llevar a cabo su investigación: dispensador de
comida, luz o sonido que acompaña al estímulo, sujeción de los animales… Eso permitía
realizar un tratamiento y mediciones precisos y un control riguroso de las variables extrañas.
1.2. Un experimento prototípico
Manejaban un sonido que duraba 5 segundos y 2 segundos después les daban una ración de
comida. Repite esto hasta 50 veces cada 5–35 minutos. Cada 10 ensayos, el sonido dura 30
segundos y en ese ensayo no hay comida.

2 perros presentan una curva de salivación similar ante el sonido:


– Antes del primer ensayo, con el estímulo neutro sin asociar, no salivan.
– Si durante 9 ensayos se empareja el sonido con la comida, y al décimo ensayo se pone el
sonido sin comida, se encuentra que los animales salivan un poco.
– De nuevo, en el siguiente ensayo de 30 segundos de sonido, salivan bastante más.
– Cada vez irán salivando más en el ensayo sin comida.
Regularidad y semejanza de ambas curvas: principio explicativo común para las dos. Pavlov y
sus colaboradores replicaron este tipo de observaciones con elementos distintos a los tonos y
la comida y con otras especies, obteniendo con frecuencia resultados similares. Eso los llevó a
plantear el supuesto de la ‘equipotencialidad’, luego asumido por el conductismo, y
descartado o muy corregido más tarde.
Aunque no se pueda hablar de leyes universales, sí hay cierto carácter general de algunos
procesos y principios asociativos.

2. ELEMENTOS DEL CONDICIONAMIENTO CLÁSICO


Condicionamiento clásico: proceso mediante el que un estímulo originalmente irrelevante
se asocia, debido a su reiterado emparejamiento, con algún evento motivacionalmente
importante, por lo que el primero acaba por adquirir la capacidad de provocar también una
reacción similar a la generada por el elemento importante.
EI: estímulo incondicionado.
RI: respuesta incondicionada.
EC: estímulo condicionado.
RC: respuesta condicionada.

2.1. Estímulo incondicionado


Cualquier evento que desencadene en el organismo un reflejo no aprendido.
Las propiedades del proceso de condicionamiento clásico dependen en buena medida del
estímulo incondicionado. Por lo general, cuanto más intenso es el EI, más fuerte es el
condicionamiento.

2.2. Respuesta incondicionada


Reacción refleja generada automáticamente por el EI.
No siempre hay una respuesta incondicionada, como en los siguientes casos:

• Condicionamiento con RI bloqueada: llevar a cabo un experimento de


condicionamiento en el que el EI es un estímulo doloroso que provoca
reacción defensiva. Esa reacción provoca tensión muscular para afrontar la
agresión; o también puede provocar congelación, en algunos casos de
descarga eléctrica.
Si se aplican drogas (como el curare) que paralizan, sigues sintiendo el dolor y oyendo la señal
acústica previa a la descarga, pero no hay respuesta física a la agresión. Estás paralizado. Si
haces esto varias veces y no hay respuesta defensiva física ante el EI, cuando no estés
paralizado es posible que sí se provoque la respuesta defensiva. Se ha producido respuesta
condicionada sin respuesta incondicionada.

• Precondicionamiento sensorial.

2.3. Estímulo condicionado


Evento en origen neutro que acompaña repetidamente al EI, con el que acaba asociándose,
hasta provocar por sí mismo una respuesta similar a la RI.
No todos funcionan con la misma eficacia. La eficacia depende de:

• Relevancia ecológica: o pertinencia respecto al EI y al sistema de RI. El


condicionamiento pavloviano es selectivo en cierta manera.

• Intensidad: en particular la relativa a otros elementos (estímulos


condicionados) presentes: si una imagen y un sonido aparecen a la vez con
una descarga, se asociará el que destaque más. Discriminabilidad.
No condicionan mejor dos estímulos juntos que si aparece primero el EI y luego el EC. Al
contrario, se condicionan mejor de esta última manera. La contigüidad no tiene por qué facilitar
la asociación. El EC debe preceder al EI porque si no, aunque se asociara, no va a
condicionar: ya aparecían juntos, al fin y al cabo.

2.4. Respuesta condicionada


Reacción desencadenada por el EC, similar a la RI (con frecuencia es menos intensa, a veces
puede ser ligeramente distinta).
Se genera porque, tras la aparición contigua repetida del EI y el estímulo neutro (que después
será EC), llega un momento en que el organismo asocia ambos eventos.
Ejemplo de distinta (incluso opuesta): el condicionamiento en el efecto de las drogas; se
condiciona más el proceso B que el proceso A.
Son numerosas y variadas las respuestas susceptibles de ser condicionadas. Dependiendo de
qué respuestas y en qué condiciones se puedan condicionar, el condicionamiento
pavloviano puede ser más o menos relevante psicológicamente.

3. RESPUESTAS SUSCEPTIBLES DE SER CONDICIONADAS.


El hecho de que sean numerosas y diversas avala el interés e importancia del
condicionamiento pavloviano.
Antes de hablar de los tipos de respuestas susceptibles de ser condicionadas, veamos un
esquema del sistema nervioso, ya que categorizamos las respuestas condicionadas en
función del subsistema nervioso que media en los distintos tipos de respuestas.
Dentro del sistema nervioso existen distintos subsistemas, de los cuales la principal categoría
es la que distingue entre sistema nervioso central y periférico.
-Sistema nervioso central: cerebro y médula espinal.
- Sistema nervioso periférico: resto de neuronas, nervios y estructuras nerviosas. Dentro de
él se
distinguen 2 subsistemas:
- Autónomo: controla la acción autorregulada de los órganos y las glándulas internos.
Actividad vegetativa. Condicionamiento pavloviano. A su vez, 2 subestructuras:
- Simpático: excitador.
- Parasimpático: relajante.
- Somático: controla los movimientos voluntarios de los músculos esqueléticos.
Actividad voluntaria. Condicionamiento instrumental.
La actividad regulada por el sistema nervioso periférico autónomo es la regulada
principalmente por el condicionamiento pavloviano, aunque a veces se observa la incidencia
de este condicionamiento en la actividad del sistema nervioso periférico somático. Además,
también condiciona otros aspectos psicobiológicos complejos: emociones y motivación.
Ejemplo: miedo, uno de los aspectos psicológicos más investigados.
Así, la actividad de los organismos se puede dividir en 2 grandes categorías:
- Reacciones vegetativas: reflejas y automáticas, mediada fundamentalmente por el sistema
nervioso autónomo.
- Actividad esqueletal: la conducta, que en humanos se suele considerar voluntaria e
intencional, mediada por el sistema nervioso somático.
Además, existen estados motivacionales y afectivos.
3.1. Reacciones autónomas: los reflejos
Mediadas por el SN autónomo. ¿Son todos sensibles al condicionamiento clásico?
1) Investigadores soviéticos: en Rusia, se creía que prácticamente todos los reflejos podían
condicionarse.
2) Investigadores occidentales: investigación del condicionamiento asumida por la
Psicología conductista, que no tenía en cuenta procesos mentales sino manifestaciones
externas. Hacía experimentos con reacciones externas, periféricas. Dudaba de que pudieran
condicionarse todos los reflejos, pero finalmente se acabó concluyendo lo mismo que los
soviéticos.
La activación o arousal implica incremento de adrenalina, tasa cardíaca, RGP (respuesta
psico-galvánica), dilatación pupilar… Serie de variaciones orgánicas que cambian cuando
estamos activados. Se ha visto que los parámetros del arousal son sensibles al
condicionamiento.

3.1.1. Efectos de las drogas: psicofarmacología pavloviana


Los efectos de las drogas psicoactivas (reacción compensatoria, tolerancia, síndrome de
abstinencia…) pueden ser condicionados, en parte.
Teoría de los Procesos Oponentes revisitada
Según veíamos en el tema 2, se ha intentado explicar el PEDA y su cambio al repetirse el
estímulo desencadenante mediante la teoría de los Procesos Oponentes.
Ejemplo: la morfina seda, anestesia. Cuando pasa el efecto de la dosis de morfina, no
volvemos a la línea base, sino que la cruzamos: estamos más inquietos que de costumbre,
estamos más doloridos y molestos.
Patrón bifásico.

Al exponerse a la droga de forma repetida, cambia la intensidad relativa de las fases.


Patrón bifásico porque intervienen 2 procesos:
– Proceso a: efecto directo del estímulo desencadenante (droga).
– Proceso b: el cerebro, al detectar la dosis, da órdenes para que se reduzca la producción de
endorfinas. Es la contra.
El estado en que nos encontramos depende de la correlación entre ambas fuerzas: qué
proceso es más potente.

Con la repetición del estímulo desencadenante, cambia la correlación de fuerzas entre a y b.


El proceso defensivo (b) cada vez opera con mayor celeridad, intensidad y persistencia.
Esto hace que cada vez predomina menos a sobre b, y así, por ejemplo, se tolera mejor la
droga.
¿Y por qué esta evolución de b?
- Hipótesis 1 (la original): asumía que la mayor eficacia del proceso defensivo cuando
se repite la agresión responde a su tendencia natural a fortalecerse, conforme se
ejercita. Sería algo así como un fenómeno de “habituación” al evento
desencadenante, provocada por la progresiva “sensibilización” de la reacción
compensatoria.

- Hipótesis 2 (la nueva): las circunstancias que acompañan (ECs) al elemento


perturbador (EI) tienden a asociarse a este y a disparar la acción compensatoria (RC).
Se trataría de una potenciación condicionada del proceso b, conforme se repite la
situación.
Es decir, un mismo contexto dispararía el proceso b incluso antes de que se consuma la
droga.
El proceso oponente se liga a los estímulos que señalan el elemento perturbador.

- Uno de los primeros experimentos: reacción compensatoria condicionada.


- Experimento que no tiene que ver con condicionamiento: para observar si los efectos de la
morfina siguen un patrón bifásico. 2 condiciones experimentales: dosis de morfina y placebo.

Se medía el grado de actividad de los animales desde 30 minutos antes de inyectarles la


dosis hasta 24 horas después de la inyección.
El grupo al que se inyectó morfina tuvo una caída drástica de la actividad, hipoactividad,
después de la morfina (lo esperado, porque la morfina seda). A las 2 horas, la actividad
había aumentado; a las 4 horas, había más que duplicado su nivel de actividad. Pasadas
bastantes horas, finalmente habían vuelto a su estado normal.
Se ve el patrón bifásico de los efectos de la morfina: pasados los efectos, no vuelves al estado
normal, sino que cruzas la línea base y sufres los efectos opuestos a los de la morfina.
Caída de la actividad, seguida de hiperactividad, antes de recuperar el nivel normal.

- Sometieron a condicionamiento los efectos de la morfina. 3 grupos y varios ensayos:

• Grupo m-e: 9 dosis de morfina aplicadas en una cabina experimental especial (EC), en
días consecutivos.

• Grupo m-ch: 9 dosis de morfina en la cabina habitual, donde vivían.

• Grupo s: 9 dosis de solución salina (placebo) en la cabina habitual.

El día de prueba (día 10) todos los animales recibían una inyección salina
en la cabina experimental especial. Muestra hiperactividad ante el placebo
en el contexto distintivo solo el grupo que había recibido aquí la droga.
Por la anticipación: habían asociado el traslado a la cabina (aspecto, olor,
textura…) con un incremento de morfina que, en el organismo, de forma
natural, conlleva la reducción de producción de endorfinas. El día 10 les
someten al mismo traslado. Se pone en marcha la acción compensatoria
pero no hay morfina, con lo que la reducción de endorfinas supone
hiperactividad.
Reacción compensatoria condicionada: potencia la reducción de endorfinas y no hay
morfina.
La hiperactividad mostrada por el grupo que antes había sido inyectado con morfina en esa
cabina especial era una RC producida por las claves del contexto como EC, que desencadena
una reacción compensatoria, en esta ocasión en ausencia de morfina que contrarrestar.
- Tolerancia condicionada
El condicionamiento de la reacción compensatoria podría explicar en parte el fenómeno de la
tolerancia:
pérdida de efectividad de las drogas con su uso repetido.
Mayor tolerancia cuando el consumo se repite en un mismo contexto específico (especificidad
situacional):
indicativo de condicionamiento clásico.
Eso puede explicar más muertes por sobredosis en contextos nuevos, donde no operaría la
reacción compensatoria condicionada. En el contexto antiguo (EC), el organismo se preparaba
y ayudaba a potenciar la reacción compensatoria; en un contexto nuevo, no hay reacción
compensatoria potenciada por condicionamiento, por lo que la dosis tiene mayor efecto.
Desde los años 80, Siegel trabaja con los efectos de las drogas.
Trabajo de Siegel y colaboradores con 3 grupos (1982)
Inyectaron a 2 grupos de ratas cantidades crecientes de heroína (con-exper-anter); un tercer
grupo recibía un placebo (sin-exper-anter). A uno de los grupos a los que inyectan droga les
llevan a un lugar especial para ello (el que será el contexto habitual).
El día de la prueba, inyectaron a los 3 grupos una dosis de heroína de 15 mg/kg.

Se midió el efecto de la sobredosis en cada grupo. Murieron casi todos los animales del grupo
sin experiencia anterior; menos en el grupo con experiencia en un contexto nuevo (más
tolerancia por haber tenido dosis previas y progresivas); y menos en el grupo con experiencia
en el contexto habitual.

• Tolerancia farmacológica: bioquímica, no tiene que ver con procesos psicológicos.


Reducción de muertes en el grupo 2 con respecto al 1. Sin oportunidad de condicionar.

• Tolerancia condicionada: reducción de muertes en el grupo 3 con respecto al 2.


Réplicas posteriores, con pequeñas variaciones y resultados similares en grupo control,
contexto diferente y mismo contexto. En total, se hicieron otros 3 experimentos con
pentobarbital, etanol y cocaína.
(Experimento que no viene en el libro) - Vila et al (2013) informan de respuesta
compensatoria y tolerancia condicionada a los efectos cardiovasculares de la nicotina
(que, entre otros efectos, incrementa la tasa cardiaca). Observaron que al consumirla en un
contexto diferencial especial (reducción de iluminación, música reggae…), la presencia de
esas claves en prueba ulterior dio lugar a:

• Reducción de la tasa cardíaca ante placebo: la nicotina la sube; como ahora no hay
nicotina, se observa una bajada con respecto a la línea base.

• Menor tasa cardíaca ante nicotina que si estas pruebas se llevan a cabo en contexto
diferente al del consumo.

- Síndrome de abstinencia condicionado


Si se puede condicionar la reacción compensatoria y, por consiguiente, la tolerancia de los
organismos a la droga, también se puede ver potenciado mediante condicionamiento clásico el
síndrome de abstinencia: alteración biológica y psicológica que sufren los consumidores
habituales de drogas cuando no están bajo los efectos de la droga (necesidad de consumir).
En efecto, los drogodependientes suelen sufrir mayor síndrome de abstinencia en presencia
de claves ligadas a la droga. En ausencia de la droga, induce reacciones condicionadas
compensatorias que no encuentran oposición, lo que potencia la aparición del síndrome de
abstinencia.
Esto implica que la droga debe operar como un fuerte “refuerzo negativo” de las conductas
que la proporcionan.

Por eso, la necesidad de volver a consumir se da, sobre todo, si la persona se encuentra en
el mismo contexto en que suele consumir. Se disparan las reacciones orgánicas y
psicológicas que llevan a sentir esa necesidad. Si la terapia tuvo lugar en un contexto diferente
a aquel en que la consumía, es posible que no tenga efecto en caso de regresar a ese lugar.
Al disparar la reacción compensatoria, se necesita la droga en mayor medida que si no se
disparara.

*No entra la Interpretación alternativa, pág. 62-63.

Mencionar otro punto de vista sobre el papel del condicionamiento en drogodependencias.


El condicionamiento clásico no es el único que condiciona.
Las primeras veces es una conducta deliberada, se hace para socializar, integrarte en el
grupo, desinhibirte …
Por ejemplo, el alcohol inhibe las estructuras corticales prefrontales, que es la parte del
cerebro que se encarga del control de la toma de decisiones, etc.

- Drogodependencias (Everitt y Robbins, 2016)


1) Con las drogas tiende a darse la siguiente dinámica:
uso → abuso → adicción (acción → hábito → compulsión)
2) Se pasa del consumo controlado (se elige por sus consecuencias: condicionamiento
instrumental) al compulsivo (disparado automáticamente por la dependencia y los estímulos
condicionados: condicionamiento clásico).
Cuando llevamos a cabo una conducta y trae placer consigo, la repetiremos, pero castigar
una conducta nos disuade de volver a llevarla a cabo o, al menos, disminuye la frecuencia
con que la hacemos.
Cuando consumimos una droga la primera vez, actúa el condicionamiento instrumental: lo
haces para obtener los beneficios que crees tendrá. Si compruebas que es cierto, repetirás.
La consumes porque decides consumirla.

Pero, si se sigue haciendo, es un hábito. Llega un momento en que desarrollas adicción: es


un consumo compulsivo, abusivo, adictivo. Cuando estás en el contexto, se disparan una serie
de reacciones (reacción compensatoria, síndrome de abstinencia), con lo que ya no decides
consumirla por beneficios, sino que se presenta la necesidad de consumirla no por decisión
propia.
Poco a poco, gana peso el condicionamiento clásico con respecto al instrumental.

3) Neurológicamente, el control pasa del córtex prefrontal (que permite elegir / inhibir la
acción; decidir cuál es la mejor respuesta para un problema o situación: función ejecutiva) a
áreas estriadas límbicas (que la disparan sin participación de la conciencia). Sistema
subcortical que lanza respuestas en función de la búsqueda del placer y la recompensa.
Se comparan los registros neurológicos de una persona que no consume una droga
habitualmente con los de una persona que la consume de forma compulsiva.

En otro trabajo de 2014 analizan las bases neurológicas. Presentan una espiral que
caracteriza la evolución psicológica y neurológica en los consumidores de drogas desde las
primeras veces en que la consumen hasta que la consumen compulsivamente. Depende de
factores ambientales, psicológicos (impulsividad…).
Analizan los factores que determinan si serás tragado por la espiral.

Se preguntan de qué depende que unos individuos desarrollen dependencia pese al daño,
mientras que otros lo abandonan al notar el daño. Depende de diferencias individuales
(autocontrol, impulsividad…).
Llevan a cabo un experimento con ratones: se entrena a los animales a conseguir droga, que
se autoaplica pulsando una palanca. Es una caja de Skinner en la que se conecta a
dispensadores con dosis de heroína.
En un momento dado, antes de que lleven a cabo la conducta de consumo de la droga muchas
veces, aplican castigo: pulsar la palanca no les proporciona droga y les da una descarga
eléctrica. Normalmente, se deja de pulsar la palanca (en las 2 condiciones).
Pero, cuando se lleva un historial muy largo de consumo de droga, muchas persisten en
pulsar la palanca.
Los individuos impulsivos siguen pulsando la palanca, pero los no impulsivos rápidamente
dejan de hacerlo.
No todo el mundo que consume drogas a un nivel de dependencia, por más efectos negativos
que le produzca, son capaces de abandonarla.
3.1.2. Psiconeuroinmunología: inmunomodulación condicionada
El sistema circulatorio no está relacionado con la Psicología de las personas como se pensaba,
sino que la Psicología está regulada y depende principalmente del sistema nervioso.
Existía la teoría de que la Psicología (sistema nervioso) de las personas afecta al sistema
inmunológico, integrado por células especializadas en defendernos, mediante la producción y
movilización de anticuerpos, de las infecciones, ataques de virus, bacterias… elementos
extraños que penetran en el organismo. De hecho, las personas que sufren depresión son más
sensibles a sufrir infecciones. Conexión sistema nervioso – sistema inmunológico.
El sistema nervioso regula el funcionamiento del sistema inmunológico. Uno de los
mecanismos por los que puede afectar al sistema inmunológico es el condicionamiento
pavloviano.
Ante el uso reiterado de fármacos inmunosupresores o inmunoactivadores la operación del
sistema inmunitario puede verse afectada por procesos de condicionamiento pavloviano.

Aparte de los trabajos del entorno de Pavlov (1926) y posteriores de Ader y Cohen (1975,
1982, 1993), investigaciones recientes de un equipo multidisciplinar: Buske-Kirschbaum,
Exton, Stockhorst, Goebel…
La primera observación en este contexto tuvo lugar cuando Ader observó que muchos
animales a los que sometía a experimentos sobre aversión adquirida a sabores morían.
Estudiaba la aversión adquirida (RC) al sabor de la sacarina (EC), emparejando su ingestión
con inyecciones de ciclofosfamida (EI), sustancia inductora de náuseas (RI). De esa manera,
el sabor de la comida disparaba las náuseas.
Se da a los animales un alimento nuevo; si en ese momento les sienta mal, es probable que
ya no vuelvan a comerlo. No se daría contingencia (covariación baja) si les sentara mal un
alimento en un determinado momento y ya lo hubieran comido muchas veces anteriormente.
Sucedió que, en la fase de extinción, en la que a los animales ya solo se les proporcionaba la
solución dulce, murieron algunos sin causa aparente.

Consultó a Cohen por qué morían los ratones experimentales. Consideró la posibilidad de que
las muertes guardaran relación con la ciclofosfamida, que además de producir náuseas es un
fármaco inmunosupresor.
Lo que las mataba era obligarles a comer o beber aquello que habían asociado a la
ciclofosfamida. Los animales habían ligado, mediante un proceso asociativo, la reacción
reductora del funcionamiento inmunológico generada por la ciclofosfamida al suero endulzado.
Al ingerirlo, sufrían problemas de salud debido a los microorganismos patógenos que siempre
hay en los laboratorios.

- Paradigma experimental
La metodología de todos los trabajos es parecida.
– Fase de adquisición: los sujetos son sometidos a varios emparejamientos de un EC
(distintivo, algo nuevo que tiene que ver con el sistema digestivo como un sabor
especial, porque se considera que es más natural asociar alteraciones en el sistema
inmunológico con la ingesta de un producto que con otros sentidos) con un
inmunomodulador (EI), que puede ser depresor o potenciador.
– Fase de evocación: el EI (fármaco) es reemplazado por un placebo, que reciben
junto con el EC (el sabor).
– La inmunomodulación condicionada es estimada por el cambio del sistema
inmune en esta fase, comparada con la condición de referencia. Se establece la línea
base de un individuo y se ve qué pasa con respecto a esta al darle el inmunomodulador
y el placebo.
4 fases de experimentación:
a) Condicionamiento inmunosupresor: caída del sistema inmunológico en animales.
b) Condicionamiento inmunosupresor: en personas.
c) Potenciación del sistema inmunológico: en animales.
d) Potenciación del sistema inmunológico: en personas.

1. Inmunodepresión condicionada en animales


Inmunodepresión condicionada con cyclosporin (CsA) como EI.

En la primera fase, son tratados por igual todos los animales de todos los grupos: someten a
ratas a un severo racionamiento de agua.
En la segunda fase (emparejamiento, días 5, 8 y 11), según las condiciones experimentales,
someten a 4 grupos a emparejamientos EC-EI: (como tienen sed, beberán).

El CsA es un potente inmunosupresor, usado frecuentemente en trasplantes de órganos.


Reduce la producción de linfocitos T a través de la inhibición de la síntesis de interleukin-2 (IL-
2), que es la RI.
El grupo ‘condicionamiento ficticio’ se llama así porque se da contigüidad vs. contingencia:
llevan bebiendo agua desde que nacieron; aunque se empareje con un EI, no cumple el
supuesto de contingencia, solo el de contigüidad. No hay ningún efecto condicionado.
La caída que muestre el grupo ‘tratado con CsA’ estará condicionada por el fármaco.
La tercera fase (reexposición) se llevaba a cabo 3 días después del último emparejamiento,
durante los días 14, 15 y 16.
El día 16, se hace un análisis inmunológico con muestras extraídas una hora después de la
tercera reexposición, sacrificando a las ratas.
Resultados: presentan 10 índices del sistema inmunológico, con datos muy similares.
Recogemos 2: nivel de linfocitos (NK, natural killers) e IL-2.
- Linfocitos: reducción en el grupo ‘condicionado’ de proliferación de linfocitos en el
bazo.
- IL-2: reducción en el grupo ‘condicionado’ de la síntesis, significativa en comparación
con el grupo ‘condicionamiento ficticio’ y el ‘sin tratamiento’.
¿Comparando qué grupos se puede estimar la inmunosupresión incondicionada y la
condicionada?
- Incondicionada: grupo ‘tratado con CsA’ con ‘condicionamiento ficticio’ y ‘sin
tratamiento’.

- Condicionada: grupo ‘condicionado’ con ‘condicionamiento ficticio’ y ‘tratado con CsA’.

2. Inmunodepresión condicionada en personas


Se observa por primera vez inmunosupresión condicionada en personas, en 2002, en el
departamento de Psicología médica en la Universidad de Ensen, Alemania.
Primero, establecieron en cada participante su línea base en diferentes parámetros
inmunológicos (PRIMER ANÁLISIS).
Luego, emparejaron varias veces una bebida con color y sabor especiales (EC) con 2,5
mg/kg de CsA (EI) en el grupo experimental. Se utilizó un placebo en el grupo control. Esa
‘fase de condicionamiento’ se llevó a cabo los días 1, 2 y 3.

A las dos horas del último emparejamiento, midieron en ambos grupos el cambio, respecto a la
línea base, en producción de IL-2 por linfocitos T y de IFH-y (interferón) –valores
inmunológicos–. Así constataron los efectos inmunosupresores del CsA (SEGUNDO ANÁLISIS
→ efecto fármaco).
Los días 3–8 no los someten a tratamiento, para que no queden efectos residuales del
tratamiento del primer día. Midieron de nuevo los valores inmunológicos para comprobarlo
(TERCER ANÁLISIS).
Son todos reexpuestos durante dos días al EC, y se hace un análisis el día 10 para ver cómo
evolucionó el sistema inmunológico (CUARTO ANÁLISIS) con respecto a la línea base.
Resultados: efectos inmunosupresores significativos inducidos por el EC en el grupo
experimental (n), a diferencia del control (􀀀).

1. En el análisis del día 3 (efecto del CsA), los que tienen placebo lo tienen al nivel de la
línea base, pero los que recibieron el fármaco tienen una caída muy significativa.
2. En el último análisis hay una caída (no tan significativa) en el grupo experimental, pero
no en el control.
Esa caída no son secuelas del fármaco.

Resumen inmunosupresión: observan inmunosupresión condicionada (a los 11 días en


humanos y a los 6 en ratones) similar a la del primer día, lo que resulta importante a efectos
prácticos.
Si condicionas un efecto inmunológico y luego los expones al EC, este puede generar una
caída inmunológica no solo al poco de ser emparejado, sino al cabo de varios días. El
condicionamiento puede afectar al sistema inmunológico de forma duradera y apreciable.
El condicionamiento de la inmunosupresión no solo se observa en el momento mismo en que
se produce el condicionamiento, sino que al cabo de esos días (11 y 6 en humanos y
animales) perdura.

3. Inmunopotenciación condicionada en personas


Ya se sabía que la inmunodepresión es susceptible de condicionamiento. Trabajaron con
animales que sufrían lupus: enfermedad autoinmune que consiste en que el sistema
inmunológico está hiperactivo y ataca tejidos y células sanas del propio organismo. Se pensó
que los ratones que sufrían lupus era una población interesante para investigar con ellos si se
podía rebajar la actividad del sistema inmunológico, mejorando su calidad de vida; o
disminuir la dosis de fármacos inmunosupresores, porque presentan efectos secundarios
adversos.
¿No podrá ser también susceptible la inmunopotenciación?
Experimento en personas sanas, asignadas al azar a 4 grupos diferentes:

La epinefrina es una hormona que potencia la actividad de linfocitos NK, especializados en


atacar los antígenos que penetran en el organismo.
Se empareja durante cuatro días consecutivos el EC y el EI en el grupo ‘condicionado’.
Fase de prueba: el quinto día eran reexpuestos al EC junto a una inyección salina todos
ellos, excepto el grupo EI, donde también les inyectan epinefrina.
Miden el sistema inmunológico (linfocitos NK) y ven el nivel diferente de componentes,
comparando con antes y después de recibir el EC.

(La T hace referencia a la varianza intragrupo. El asterisco significa que las diferencias solo
cabría esperarlas por errores/casualidades un 5% de las veces. Es una diferencia significativa,
por tanto. Las diferencias que se observan entre el tratamiento control y experimental no
deberían ocurrir por azar o fallos. En caso de que ocurran en poca medida debido al azar o
fallos, tendremos diferencias significativas.)
Estimaron el efecto de los diferentes tratamientos en el funcionamiento de los NK comparando
su actividad cinco minutos antes (Pre-EC) y 20 después (Post-EC) de la presentación del
EC el quinto día.
Resultados: incremento de los linfocitos en el grupo EI (recibe epinefrina junto con el EC,
con lo que se suman los efectos condicionados e incondicionados) y en el grupo
‘condicionado’.
Sin embargo, esto no ocurre en los otros dos grupos control, en los que el sorbete dulce no
opera como EC.
- EC+: incremento de los linfocitos.
- CD: no se produjo la asociación.
- Sal: nunca ha sido sometido a condicionamiento.

2018 PNAS: Proceedings of the National Academy of Sciences

Ensayo clínico

Learned inmosuppressive placebo responses in renal transplant patients.

Pacientes sometidos a trasplantes de riñón sometidos a inmunosupresores, tienen muchos


efectos negativos, para evitar que lo rechacen se prueban antes. Por ejemplo, intentar bajar la
dosis. Condicionamiento como medio para poder hacerlo. Rebaja del sistema inmune se
mantiene para bajar la dosis del fármaco. Necesario dar ensayos de refuerzo de esa
asociación para que no se extinga, asociación del EC-EI.

Significación o impacto práctico de este estudio.

Funciones inmunes pueden ser rebajadas mediante procedimientos de condicionamiento


asociativo. No está claro si ocurre con pacientes que reciben inmunosupresores. Se
demuestra que en pacientes que ya estaban recibiéndolo, que el placebo inmunosupresor
aprendido incrementa la eficacia de la medicación inmunosupresora. Los datos demuestran
que el condicionamiento de las respuestas a drogas pueden ser una herramienta prometedora
que podría ser utilizada como estrategia basada en el placebo para la reducción de la dosis,
dentro de un régimen de tratamiento farmacológico que reciben porque lo necesitan, de
manera que la meta sería reducir los efectos no deseados o limitarlos e incrementar la
eficacia del tratamiento.

4. Efectos condicionados del etanol en el sistema inmunológico


Experimental Biology and Medicine, 2017.
Matando 2 pájaros de un tiro: si es condicionamiento del alcohol, tiene que ver con drogas
psicoactivas, por lo que es una investigación con una droga psicoactiva. Pero tiene efectos en
el sistema inmunológico; se ven efectos condicionados tanto con respecto al alcohol1 como
al sistema inmunológico2.
- El etanol incrementa el nivel de interleucina-6 en hipocampo y amígdala, lo que genera
neuroinflamación y toxicidad en el cerebro.
- Algunos estudios observaron que eso incrementa la ansiedad y consumo de alcohol en
ratones.
(Animales en caja de Skinner que podían consumir alcohol al presionar una palanca. La
presionaban más cuando ocurría esto.)

- Olor distintivo (EC) emparejado con etanol (EI) también genera incremento de la
interleucina-6 (condicionamiento clásico en el sistema inmunológico) y, por tanto, puede
potenciar el consumo condicionado de alcohol.
- Este trabajo, que recurre al alcohol como modificador del sistema inmunológico, resulta
relevante para los 2 últimos apartados: CP de 1) alteración del sistema inmunológico – y
ansiedad; 2) consumo de alcohol.

3B. Acciones esqueletales: el comportamiento.

• Seguimiento de señales.
• Pautas de comportamiento sexual (las veremos en el siguiente punto, al hablar de la
motivación y la efectividad).

*No entra el epígrafe de la página 62-63. Tampoco el apartado 3.3.1.2, efectos de la insulina,
pág. 63-65.

En ocasiones, el condicionamiento pavloviano puede afectar a la conducta, al sistema


nervioso somático que controla la conducta voluntaria a través de la musculatura estriada.
Sin embargo, la mayor parte de las veces afectará al sistema autónomo, vegetativo, porque
requiere un EI que desencadene una reacción refleja, algo infrecuente entre las actividades
mediadas por el sistema nervioso somático.

El condicionamiento pavloviano puede ayudar a los animales a defenderse contra los


ataques de depredadores. Buena parte de las reacciones defensivas de los organismos son de
tipo fisiológico (como las de activación). Dependiendo de las circunstancias, puede ser útil
acelerar la tasa cardiaca (movilizar recursos estratégicamente, ganar fuerza y velocidad) o
disminuirla y contener la respiración (inmovilizarse y pasar inadvertido).
Sin embargo, las reacciones defensivas habitualmente también incluyen respuestas
motoras: inmovilización o desarrollo de pautas de comportamiento agresivo. En ocasiones se
ha observado potenciación condicionada de ambas.
3.2.1. Seguimiento de señales
Observación casual que Brown y Jenkins encontraron una mañana al volver al laboratorio.
Trabajaron con la caja de Skinner: los sujetos experimentales solían ser palomas. En esa caja
hay:

• Palanca: si la pulsan, proporciona un grano de comida, bebida, droga… para encontrar


qué programas producen de manera más frecuente, intensa, la pulsación de la
palanca.
• Dispensador.
• Señales acústicas o visuales: usadas para señalar la puesta en marcha del programa
o la suspensión del programa. Ejemplo: si se enciende la luz verde, al pulsar la palanca
tienen comida; con luz roja, no la tienen. Aprenden a pulsar la palanca únicamente
cuando hay luz verde.
El condicionamiento instrumental recurre al manejo de refuerzos o castigos para aumentar o
reducir la probabilidad de llevar a cabo conductas existentes. Si queremos implantar una
conducta nueva mediante condicionamiento instrumental no podemos: no puede reforzarse
algo que no existe.
Por eso, se recurrió al moldeamiento: los animales no pulsaban la palanca (no es parte de su
repertorio habitual de comportamiento), no podemos ver cómo afecta la recompensa a esa
conducta. Lo que se puede hacer es moldearlo: como un animal hará muchas cosas en la caja
de Skinner, se analiza y vemos qué conducta más parecida a pulsar la palanca realiza:
acercarse a la zona donde está la palanca. Esa es la que se refuerza, con lo que el animal
tenderá a estar cerca de la palanca.
Al final, acabará tocándola de vez en cuando. En esa segunda fase ya solo reforzamos el
hecho de que la toque. En algún momento, acabará accionándola.
En una tercera fase, solo se refuerza cuando la toca y la acciona.
* Modelado NO es Moldeamiento. El modelado (imitar los modelos, aprendiendo en cabeza
ajena) que el moldeamiento (aprender por uno mismo poco a poco). Fenómeno del
condicionamiento instrumental, pero más aplicado al condicionamiento clásico.

Después de algunos ensayos en los que una tecla de la caja experimental en la que se
encontraban palomas se iluminaba unos segundos antes de que apareciera comida en el
dispensador de alimento, Brown y Jenkins vieron que estas tendían a dirigirse a la tecla y
picotearla, en lugar de encaminarse al comedero.
Para conseguir la comida, las palomas no tenían que hacer nada: esta les era presentada,
precedida por la iluminación de la tecla, cada 15 segundos, con independencia de lo que
hicieran.
Por tanto, picotear la tecla no era una conducta instrumental, ni tampoco una reacción
espontánea y natural ante una tecla que se ilumina, ya que solo tienden a picotear la tecla
cuya iluminación precede de forma sistemática a la comida.

Al ver que picoteaban la tecla, se llevó a cabo un experimento: si son palomas, quizá creen
que la luz pequeña y amarillenta es un grano de maíz (reacción espontánea y natural).
Trabajaron con 2 grupos:
1) Iluminación de la tecla y alimento contingentes.
2) Recibían comida la mitad de las veces cuando la tecla estaba encendida y la otra
mitad cuando estaba apagada.
En el segundo caso no se produjo automoldeamiento. No era una reacción instintiva la que
habían percibido, sino que era una reacción producida por la asociación EC-EI: la reacción es
una RC pavloviana debida al emparejamiento iluminación–alimento.
A veces, esta tendencia puede llegar a operar incluso cuando las circunstancias son tales que
la vuelven disfuncional. En otro experimento, del propio Jenkins, había dos teclas que se
podían iluminar. Una se iluminaba antes de la presentación de la comida, la otra estaba
descompaginada. Las palomas solo tenían 4 segundos para conseguir la comida.
Tras varios ensayos, las palomas corrían hacia la tecla ligada al alimento cuando se
iluminaba, la picoteaban y luego iban al comedero. No siempre llegaban a tiempo, pero
seguían respondiendo a la tecla iluminada antes de ir a por los granos.
Conclusión: los animales desarrollan una fuerte atracción hacia los estímulos asociados con los
refuerzos, aun a costa de perder estos últimos.
En el medio natural, el seguimiento de indicios suele resultar funcional para satisfacer las
necesidades.
- Experimento: Seg-Señal etanol (Krank et al, 2003-2008). Fases en la caja de Skinner:
– Condicionamiento instrumental: entrenan ratones sedientos a obtener una solución dulce
pulsando una palanca.
– Condicionamiento pavloviano: se enciende una luz encima de la palanca, de cuando en
cuando, durante 10 segundos. Antes, pulsándola, les proporcionaba la solución dulce, pero
ahora está retraída de forma que no pueden pulsarla.

• Grupo experimental: estos episodios iban seguidos de solución con etanol en el


dispensador.
• Grupo desemparejado: la luz se encendía también, pero estaba desemparejada con
el etanol.
• Grupo control: no se le sometió a tratamiento.
– Extinción (del condicionamiento instrumental): despliegan la palanca, pero pulsarla no
genera solución.
La luz que se enciende de cuando en cuando durante 10 segundos, la mitad de veces es la
próxima al dispensador, la otra mitad la alejada. Registraron la tendencia a pulsar la palanca en
varios momentos:
– En los 10 segundos previos a que se encienda la luz (EC): no la pulsan. La pulsan más
durante los 10 segundos en los que está encendida.
– Cuando se enciende la luz próxima: la pulsan más.
– Cuando se enciende la luz alejada: la pulsan menos.

También miden otras variables típicas: aproximarse a la señal, interactuar con ella como si
fuese el etanol.
Se aproximan más a la luz próxima (Seg-señal).

3.2.2. Pautas de comportamiento sexual


Las veremos en el siguiente punto, con motivación y afectividad.
En cuanto a efectos vegetativos: si emparejamos la actividad sexual de las especies con un
estímulo, cuando vuelve a presentarse ese estímulo puede aumentar la actividad sexual.
Imaginar una especie que lleva a cabo ritos de cortejo, todo un comportamiento (no vegetativo).
Si se empareja la hembra receptiva con la presencia de una señal externa, dispara una
reacción de cortejo.
Ejemplo de que el condicionamiento pavloviano no solo provoca reflejos, sino también actividad
conductual regulada por el sistema nervioso somático.

3.3. Motivación y afectividad: impulsos y sentimientos


El condicionamiento pavloviano puede afectar al estado motivacional y afectivo. Los
estímulos inocuos pueden perder su neutralidad y adquirir valor afectivo o motivacional cuando
se emparejan con elementos con fuerte carga de este tipo. A veces, incluso, pueden promover
conductas adaptativas mediadas por el sistema nervioso somático.
3.3.1. Regulación alimenticia
El condicionamiento clásico juega un papel apreciable en dos aspectos: preferencias y
apetito.
Condicionamiento de las preferencias
Razones que regulan la preferencia: hay diferentes mecanismos que intervienen en el
desarrollo de preferencias, algunos puramente culturales, otros incluso innatos (lo dulce es
atractivo de forma innata, al revés que lo amargo), por condicionamiento clásico…
Los componentes nutritivos beneficiosos no siempre tienen sabores distintivos. ¿Cómo
regulamos de forma natural nuestra dieta para ingerir una cantidad adecuada de esos
componentes, si no tienen sabor por sí mismos? El condicionamiento clásico puede jugar algún
papel al respecto → los sabores asociadas con enfermedades se tornan aversivos,
mientras que los asociados con la recuperación se tornan apetecibles. Pero no son necesarias
consecuencias tan drásticas. Pueden seleccionarse eficazmente alimentos nutritivos y sanos
nuevos basándose en claves sensoriales sin tener que probarlos y esperar sus efectos.
Dos tipos de asociaciones:
– Aprendizaje sabor-sabor: potenciar un sabor asociándolo a otros que gustan.
– Aprendizaje sabor-nutriente: se asocian las propiedades sensoriales de los alimentos a sus
consecuencias post-ingestivas, desarrollándose preferencia hacia alimentos/sabores que van
seguidos de valor nutritivo alto.
Experimento: dieron a ratas diferentes sabores con infusiones intragástricas distintas:
1) EC+AC: solución de un sabor junto con infusión intragástrica alta en carbohidratos.
2) EC+AG: solución de un sabor junto con infusión alta en grasas.
3) EC–: solución de un sabor junto con infusión de agua.
Hicieron 3 grupos, presentando todas las combinaciones posibles entre los 3 sabores y las 3
infusiones. Luego midieron el consumo de las diferentes soluciones: daban a los animales la
oportunidad de elegir entre dos sabores. Comparaban, pues, de 2 en 2 para establecer el sabor
preferido, asociada con qué nutriente.
Pruebas de dos vasijas.

Cuando se comparaba la vasija asociada con agua y la asociada con AC, bebían bastante más
de la AC.
Cuando comparaban asociada con agua y asociada con AG, bebían más de la AG.
Cuando comparaban asociada con AG y AC, ganaban las grasas.
Ganaron las grasas. Aunque esto variaba según el grado de privación alimenticia con que
accedían a la prueba.
- Condicionamiento del apetito (la ingesta)
Fenómeno de “resistencia contextualizada a la saciación”: los estímulos neutros (sobre
todo el contexto) presentes durante la ingestión de alimentos en individuos hambrientos suelen
inducir consumo, incluso cuando los individuos están saciados.
Experimentos de animales hambrientos, alimentándolos en presencia de diferentes
contextos, con estímulos ambientales concretos.
En un experimento, se expuso repetidamente a ratas hambrientas a un tono de 4,5 minutos a
la vez que les proporcionaba comida. Luego, en la fase de prueba, se les tiene comiendo
hasta que paren espontáneamente, sin límite, hasta que se sacien. Cuando han parado de
comer, se introduce el tono que se utilizó para darles de comer cuando estaban hambrientos, y
entonces vuelven a comer en torno al 20% de su ración normal.
Esto puede ocurrirnos también a los humanos. Por ejemplo, cuando nos llega el olor de una
parrillada y nos despierta el apetito, o cuando ir a casa de la abuela hace que entre hambre.

3.3.2. Activación del impulso sexual


Condicionar el comportamiento en el ámbito sexual mediante procesos pavlovianos.
Trabajo 1: presentaron a codornices macho un EC durante 30 segundos (bloque de espuma
con plumas amarillas) seguido, según el grupo, de:
1) Grupo experimental 1: acceso a una hembra receptiva que propiciaba la
oportunidad de copular.
2) Grupo experimental 2: acceso visual a la hembra.
3) Nada.

Preferencia condicionada de lugar: desarrollamos preferencia por aquellos lugares que nos
han dado buenas experiencias.
Se mide la permanencia media junto al EC durante la fase de adquisición (a) y de prueba
ulterior (b), indicativa de desarrollo de preferencia condicionada de lugar.

Los animales en los dos grupos experimentales, sobre todo los que disfrutaron de la
oportunidad de copular, muestran una tendencia creciente a permanecer junto al EC.
Vuelven a estar en la cabina y en un momento determinado aparece el monigote en esa misma
zona.

No solo toman cariño por el lugar que ocupa el EI (hembra receptiva), sino también por el
lugar que ocupa el EC (monigote). Esto es indicativo de que el EC se ha convertido en una
señal atractiva, excitatoria, con valor en el ámbito del impulso sexual.

En seres humanos, el desarrollo de preferencias por cosas asociadas con el sexo se denomina
fetichismo.

- Trabajo 2: el buen ambiente (contexto) asociado con la sexualidad ayuda a que funcione
mejor.
Se hicieron 2 grupos de palomas macho:

1) Grupo condicionado: el EC es el traslado a una cabina experimental distintiva. Se


asoció al EI: oportunidad de copular.

2) Exposición a ambos eventos sin emparejar.

Esto tuvo unos efectos hormonales notables cuando, en una prueba ulterior, ambos grupos
fueron expuestos en esa cabina a hembras receptivas. Los animales del ‘grupo
condicionado’ producen mayor cantidad de semen y mayor concentración y numero de
espermatozoides al eyacular en el contexto previamente ligado a la oportunidad de copular.
Además, se observó la consecuencia reproductiva lógica de todo lo anterior: la presencia en un
encuentro sexual de un elemento previamente condicionado incrementó la prole resultante.

- Trabajo 3: potenciación de la activación neural de regiones del cerebro que median en las
respuestas sexuales que siguen a la exposición de estímulos condicionados que predicen la
cópula.
Los estímulos condicionados asociados con la conducta sexual producen actividad en áreas
cerebrales que median esta conducta sexual, e incrementan el éxito reproductivo al ser
expuestos antes de la copulación.
En el estudio, en un grupo se emparejó un EC con la cópula y en otro no. En el grupo
emparejado, el EC dispara movimientos copulatorios. Incluso aumenta la fisiología de la
conducta sexual (secreción de esperma).
3.3.3. Aprendizaje del miedo

Se habla de ansiedad, fobia, miedo patológico, ataque de pánico (crisis de angustia que, en
algunos casos, incluso conlleva miedo a morir), síndrome de estrés postraumático… Diferentes
manifestaciones emocionales de miedo parecen ser sensibles al condicionamiento. Se habla
de respuesta emocional condicionada (REC).

Sin embargo, el miedo puede tener otros orígenes diferentes a procesos asociativos por
condicionamiento.
Hay miedos innatos, al margen de experiencia o aprendizaje; otros son aprendidos: culturales
(por mecanismos inferenciales, raciocinio, leyendas), que no implican aprendizaje por
condicionamiento.
El miedo es el aspecto psicológico (y neurobiológico) más estudiado en el área del
condicionamiento pavloviano.

Ejemplo que fue referencia: experiencia de Watson con el pequeño Albert. Demostró que
se podía desarrollar miedo aprendido. A base de exponer al niño a la presencia de un ratoncito
a la vez que detrás hacían sonar un gong intenso, en unas pocas experiencias, al presentarle
una mascota de este tipo, rompía a llorar y huía. Incluso a pesar de que previamente le
gustaran esos animales.
A partir de ahí, se consideró que algunas emociones podían condicionarse.

- Inducir y estimar REC

Principal problema al estudiar el miedo en animales: cómo medirlo (la estimación). Una de las
formas que se utilizó es lo que se denomina ‘congelación’.
Cuando algo le asusta, hay varias formas de reaccionar. Una es hacerle frente y pelear; otras
veces, si el estímulo no se puede vencer fácilmente, es huir; por último, si no hay posibilidad
de escapar, es la congelación: tratar de pasar inadvertido, interrumpiendo cualquier actividad.

Fases del proceso de investigación:

1) Se establece una conducta que los animales realicen de forma notable, con cierta
frecuencia y estabilidad, y se mide la frecuencia de la conducta. Se puede consolidar
una conducta instrumental mediante condicionamiento operante (como pulsar una
barra para conseguir comida).

2) Se somete a condicionamiento clásico de miedo el estímulo que se desee, con lo


que desarrolla miedo a un EC.

3) Para medir el miedo a un estímulo, se mide la frecuencia de la conducta


instrumental en presencia del estímulo que le produce miedo, para compararla con
la frecuencia en condiciones normales.

Si el EC ha adquirido la capacidad de provocar miedo, su presencia deberá dar lugar a una


disminución relativa de la frecuencia. Seguramente interrumpa la conducta: congelación →
miedo condicionado.

Se establece una fórmula para calcular cuánto miedo le da: índice de congelación, calculado
con la razón de supresión (en lugar de comparar la frecuencia absoluta, se utiliza una escala
ponderada que equipare a todos los organismos).
𝐵
RzS =
𝐴+𝐵
A: frecuencia de la conducta en un periodo sin estímulo que le dé miedo (en ausencia del EC).
B: frecuencia de la conducta en un periodo equivalente cuando tiene miedo (con EC).
1. Valor máximo de la razón de supresión: ½ = 0,5. Si el elemento no le da miedo en
absoluto y no lo altera, realizará la conducta el mismo número de veces que si ese elemento
no estuviera presente.
2. Valor mínimo: 0. Que le dé tanto miedo que, en presencia del EC, interrumpe la conducta
por completo. 0/A = 0.
Ejemplo: experimento de condicionamiento de miedo con un sonido que predecía descargas
fuertes o tenues. Las descargas tenues no congelan el comportamiento, no dan miedo, razón
de supresión es 0,5. Si es intensa, el animal prácticamente deja de realizar la conducta: razón
de supresión 0.
¿En qué supuesto se observa mayor REC? En aquel que dé una razón de supresión más
baja. Dentro de esta escala, la intensidad del miedo guarda una relación inversa con el valor de
la razón de supresión: a menor razón, más miedo.
Recientemente se verificó congelación en personas ante estímulos sociales amenazantes
Se presentó a mujeres rostros de personas. Reducción de movimiento corporal (y
bradicardia) en situaciones ante rostros con expresión de enfado.
Ejemplo:
A: 13, 11, 6
B: 4,3,2
RZS = a) 23 / b) 0,21 / c) 0,25
A menor razón de supresión, mayor congelación, mayor miedo.

- Realidad virtual
En una clínica para corregir fobias, se les expone de forma virtual a los objetos que producen
miedo. Menos costoso y más fácil. Índice del miedo: respuesta psicogalvánica (RPG) u otras,
en lugar del índice decongelación.
En un experimento, manejaron como ECs imágenes dinámicas de serpientes o arañas, y
como EI estimulación eléctrica molesta. Trabajaron con un paradigma de condicionamiento
discriminativo: en unas ocasiones aparecía un EC+ (que para unos participantes consistía en la
incursión de una serpiente en la escena virtual, para otros de una araña) seguido algunas
veces de una descarga; en otras ocasiones aparecía un EC– (incursión de una araña o una
serpiente, según el participante), que nunca iba seguido de descarga.
Al día siguiente volvieron a exponerlos unas veces al EC+ solo y otras al EC–, en el mismo
contexto o en uno diferente.

Resultados:
– Primer día: incremento significativo de RPG ante el EC+ en comparación con el EC–,
indicativo de desarrollo de miedo condicionado al elemento emparejado con el EI.
– Segundo día: se mantenía esta RC diferencial en el grupo expuesto al EC en el mismo
contexto que el del día anterior (fase de adquisición), mientras que prácticamente desaparecía
en el grupo expuesto al EC en contexto cambiado.
Se observa, por tanto, desarrollo de miedo a la clave predictora de descargas, pero su
persistencia en el tiempo resulta mediatizada por el contexto.

- Experimento de aprendizaje vicario de miedo


Usa condicionamiento de segundo orden: primero se condiciona un estímulo y luego este se
utiliza para condicionar otro estímulo.
Aprendizaje / condicionamiento vicario: por observación. Ejemplo: ves que alguien mete la
mano en una papelera y se asusta cuando le pica una avispa; aprendes que no debes meter la
mano dentro sin haberlo hecho.
Los niños aprenden a no meterse en situaciones que a los adultos les dan miedo por
observación.

- Psicópatas
2016. Contra lo que se había pensado, encuentran que los psicópatas, al menos los primarios
(predisposición orgánica al comportamiento carente de reglas y empatía), muestran incremento
en la actividad de la amígdala en el CP del miedo.
Normalmente se pensaba que los psicópatas no tienen sensaciones de miedo que les disuadan
de llevar a cabo conductas. Se demuestra que no es del todo cierto: algunos sí condicionan
miedo.

- Miedo interoceptivo: personas que sufren ataques de pánico (2015)


Quien lo sufre, de pronto le da la sensación de que se queda sin aire, siente taquicardia, que le
puede matar esa crisis.
Las amenazas interoceptivas (disnea, taquicardia…) resultan importantes en la etiología de
los ataques de pánico (AP). En esta etiología puede intervenir el aprendizaje: CP.
Sensaciones interoceptivas benignas pueden generar AP, si antes han ido seguidas de AP
(amenazas masivas). Es decir, una sensación en principio inofensiva puede desencadenar un
AP si ha sido condicionado. Sentirte con un poco de taquicardia o falta de oxígeno
desencadena una reacción orgánica, el EI, señalada por una pequeña crisis. Si una pequeña
reacción se asocia con una de gran valor, dispara una reacción masiva relacionada con el
AP.
Si se empareja una pequeña disnea con una gran disnea varias veces, la pequeña disnea
desencadena un estado de miedo. Y este puede ocurrir aun sin que intervenga esa
expectativa. Las personas pueden no ser conscientes de esa alteración entre pequeña disnea y
que se desencadene el AP.
Hay AP que ocurren de manera impredecible, pero algunos se pueden predecir: cierta
situación sabes que te lo provocará. Esos que se pueden predecir son causa de CP.
El AP es una forma catastrófica de miedo y se puede ver afectado por un proceso de
condicionamiento interoceptivo.

- Trabajo recién publicado


Un CP similar del pánico a las claves interoceptivas (EC) en el contexto en que estas fueron
seguidas del EI (incremento del CO2), y no en un contexto en el que no fueran seguidas por el
EI.
Provocaron una crisis mayor ante una clave interoceptiva en un contexto y en otro, no. La
reacción de miedo solo la disparaban las claves en el contexto en que habían ido seguidas de
una reacción mayor, una crisis.
Vínculo de la crisis con las claves, pero de forma selectiva al contexto en que se daba.
Aprendizaje selectivo justificado por las experiencias previas, objetivas. No se generalizaba, no
era producido siempre, sino solo en determinado contexto.

3.3.4. Condicionamiento evaluativo


Hasta ahora, hemos hablado de casos en los que un EC se asocia con un EI importante, en
cuyo caso el EC se convierte en señal del EI: aprendizaje-de-expectativas.
Pero si se empareja un EC con un E simplemente agradable/desagradable, este tiende a
transferir su valencia afectiva al EC (efecto halo), incluso sin necesidad de que este
funcione como señal del EI: aprendizaje evaluativo.
El condicionamiento evaluativo tiene una serie de peculiaridades, y seguramente participa en
la base del desarrollo de actitudes, preferencias…
– Resistencia a la extinción: cuando se produce no desaparece; es menos intenso
pero se desmonta con menor facilidad si no se cumplen las condiciones.
– Independencia del orden cronológico de los eventos.
– Operación automática.
– Desarrollo inconsciente.
Habíamos hablado de que los EIs son estímulos vitales/mortales, importantes, necesarios
(comida, descargas eléctricas, drogas psicoactivas): producen de forma natural un cambio
biológico potente.
Si se usan como EI estímulos que simplemente resultan más o menos agradables o
desagradables, emparejados con estímulos neutros, ¿los estímulos neutros se verán afectados
por esa valencia afectiva positiva o negativa?
Esto se hace en publicidad: potenciar la actitud positiva hacia el producto.
El condicionamiento evaluativo es CP en el que el EI no tiene un valor determinante en el
sistema natural del organismo.

Ejemplo: desarrollaré más aprecio por una persona si siempre me la encuentro en una
situación agradable, que si me la encuentro en una situación desagradable. Mi imagen de la
persona se puede ver afectada por el entorno.

4. Algunos casos especiales.

El CP no sólo puede influir en diferentes tipos de R. También puede operar en circunstancias


muy diversas, lo que avala su importancia.

Ejemplo: pasar de una relación binaria (EC-EI, dos estímulos) a relaciones condicionales
(con un tercer elemento modulando la relación EC-EI).
Las relaciones condicionales ocurren con frecuencia en la vida. Ejemplo del experimento en el
que claves interoceptivas tenues iban seguidas de alteraciones interoceptivas más potentes, en
un contexto sí y en el otro no. De esa manera, la respuesta solo se producía en un contexto.
En este apartado veremos:

• C inhibitorio
• C de 2º orden
• Contracondicionamiento
• Aversión adquirida a sabores.

4.1. Inhibición condicionada

Se maneja un tercer elemento para generar condicionamiento inhibitorio. Ver si hay un EC


que se asocie con la ausencia de un EI, que funcione como señal de ausencia de él.

Aunque todavía no hemos formalizado el concepto de contingencia, podríamos decir que hasta
ahora hemos visto CP cuando:

Probabilidad de EI/EC > probabilidad del EI/ sin EC= CP – excitatoria. (llamémoslo C
excitatorio): el EC señala la presencia del EI. (Ley de la contingencia).

¿Pero qué pasa cuando Probabilidad del EI/EC < probabilidad del EI/ sin EC?
Condicionamiento inhibitorio = inhibición condicionada: el EC se convierte en
señal de ausencia del EI. (Si es la misma, no se asocia.)
Esto es una forma de general contingencia positiva y negativa: CP excitatorio e inhibitorio.
Depende de que ocurra con ellas por separado, no solamente cuando aparecen juntas.

- Contigüidad: Aparecen los dos fenómenos a la vez, sin que haya relación entre los
mismos.

Ahora vamos a ver otra forma diferente y sencilla de inducir CP inhibitorio de un EC que
opera como señal de ausencia del EI (ej. De relación condicional en CP).

• Prerrequisito: Contexto excitatorio para el EI.

Solo en un contexto excitatorio en el que esperas el EI, pero finalmente no se da en


presencia de otro estímulo. Solo se convierte en señal de ausencia del EI cuando lo esperas,
lo temes, y te indica que no lo hay. Es condicionamiento negativo: tiene que negar un
positivo. El EI tiende a estar presente, salvo cuando tiene lugar el EC.

Ej. Levanta mano con puntero, descarga, no levanta la mano con puntero, no hay descarga. Si
vuelve a levantarla con puntero, y no hay descarga, el puntero se convierte en señal de
ausencia de descarga en un contexto en que se esperaba la descarga.

Forma de inducirlo: alternar ensayos tipo A y tipo B. En el tipo A, el sonido se asociará con la
descarga.

– Tipo A: se le presenta el EC positivo (EC+) junto con el EI, por ejemplo, sonido con
descarga = condicionamiento excitatorio.

– Tipo B: se presenta el EC+ junto con un EC negativo (EC–), y sin EI = hay sonido
con una luz, pero no hay descarga, condicionamiento inhibitorio.
De esa manera, conforme se repiten los ensayos tipo A, el EC+ va adquiriendo valor
de señal del EI, mientras que a lo largo de los ensayos tipo B el EC– adquiere
propiedades inhibitorias, al aparecer en un contexto excitatorio (generado por el
EC+) para el EI, pero sin él.

Ej.: Campana – comida

Campana + hijos de puta: no hay comida

Condicionamiento inhibitorio exige un contexto ecxcitatorio, es ausencia de asociación positiva


con EI, tiene una dificultad añadida, que es la prueba del retraso.

Detección: saber que el EC– ha desarrollado condicionamiento inhibitorio con respecto al EI.
Mediante el retraso observado al condicionar luego el EC–, es decir, al emparejar el EC– con
el EI. Intentamos condicionar el EI con el EC–; usando un grupo control, se observa que
desarrolla mayor condicionamiento de miedo al sonido que el grupo que previamente desarrolló
condicionamiento inhibitorio del sonido con respecto a la descarga. Antes de que el sonido se
convierta en señal de descarga, hay que destruir la asociación sonido–ausencia de descarga.

Ejemplo:

– Sonido aparece repetidamente seguido de una descarga, pero NO cuando le acompaña una
luz. ¿Qué ocurre con esta?

– Se convierte en EC inhibitorio respecto a la descarga. Se ve por el retraso a la hora de


asociarse, si luego se emparejan luz-descarga.

El condicionamiento excitatorio se produce con mayor facilidad que el inhibitorio,


probablemente porque la presencia del EI es más sobresaliente que su ausencia.
4.2. Condicionamiento de segundo orden

Primero se condiciona un EC que luego se usa para condicionar otro EC. Se utiliza como EI un
EC. Un elemento originalmente neutro produce una RC por haber sido emparejado con otro
cuyas propiedades motivacionales son adquiridas, es decir, previamente condicionadas, y no
innatas. El elemento que funciona como EI lo hace por haber sido convertido antes en EC.

Más difícil de lograr y menos intenso que el de primer orden. Curva diferente: demasiados
ensayos lo reducen. En la segunda fase, se presenta el EC1 sin el EI, y con muchos ensayos
se extinguiría su asociación con el EI. No sigue la curva de incrementos graduales indefinida,
sino que puede darse lugar siempre que no haya demasiados ensayos de condicionamiento de
segundo orden, porque podría perder sus atributos y el condicionamiento de primer orden.

¿El sonido generará respuesta de miedo? Como la luz había condicionado, podemos usarla
para condicionar un sonido. Eventualmente, es posible que llegue a tener lugar
condicionamiento de tercer orden, pero cuanto más elevado sea el nivel de transferencia,
más difícil resulta que se produzca condicionamiento de orden superior.

Diferencias entre el condicionamiento de primer y de segundo orden.

2017. Learning to fear a second-order stimulus following vicarious learning.

Aprendizaje vicario: Aprender por observación de los otros, en cabeza ajena. Ej.; ves que
una conducta es recompensada, y otra castigada, ayudará a aumentar la probabilidad de
realizar aquella que tenga consecuencias positivas.

Ej.: Monos jóvenes que todavía no temen a las serpientes si ven a otros monos que ante la
serpiente ponen cara de pánico o muestran reacciones con expresión facial indicativas de
miedo, los monos jóvenes aprenden a temer a las serpientes sin haber tenido ningún tipo de
altercado con las mismas.

Ejemplo típico de esto, manejado en investigaciones anteriores:

1) Desarrollo vicario de miedo a un E: mono sin experiencia ni miedo a serpientes


(EC1), cuando ve a otros reaccionar con miedo a ellas empieza a temerlas:
aprendizaje vicario.
2) Miedo condicionado a otro EC2 que precede repetidamente a EC1 (serpiente).

En este trabajo observaron algo similar con niños:

Interés clínico: esto les lleva a pensar que ésta puede ser en ocasiones la razón por la que
sufrimos fobia a EE, incluso sin recordar haber tenido experiencias traumáticas previamente.
Desde el punto de vista clínico, el CP de 2º orden, y más en los casos de aprendizaje vicario,
podría justificar por qué algunas personas con fobia no recuerdan haber sufrido experiencias
traumáticas con el E que les genera fobia: no las han sufrido, propiamente.

- Semejanza con el condicionamiento inhibitorio

En ambos casos se manejan dos ECs, y mientras uno (el EC1 o el EC+) se empareja con el
EI, otro (el EC2 o el EC–) se empareja con el EC anterior, pero sin el EI. Por tanto, el
segundo EC señala que, en su presencia, al otro EC no le sigue el EI. Así que, en un
procedimiento de segundo orden, EC2 debería generar inhibición condicionada, lo mismo
que vimos que sucedía con el EC.

Que se observe uno u otro condicionamiento depende del procedimiento y del número de
ensayos. En los primeros emparejamientos de segundo orden, el EC2 puede adquirir
propiedades excitatorias, pero si se repitieran los ensayos mezclados, el EC2 cada vez
señala más claramente la omisión del EI ante el EC1, lo que termina por otorgarle al EC2
propiedades inhibitorias.

- Condicionamiento de miedo de segundo orden

Exponían a niños a reacciones de adultos ante el estímulo de un animal y el niño desarrollaba


miedo ante el animal porque veía a los adultos poner cara de susto al verlo. Luego se asoció
otro animal al animal al que tenían miedo y también desarrollaban miedo a ese animal.
Aprendizaje / condicionamiento de segundo orden y vicario.

Desde el punto de vista clínico, el CP de 2º orden, y más en los casos de aprendizaje


vicario, podría explicar por qué algunas personas con fobia no recuerdan haber sufrido
experiencias traumáticas con el estímulo fóbico: no las han sufrido propiamente.

4.3. Contracondicionamiento

Condicionar algo que se ha condicionado en un sentido, en un sentido diferente.

Se produce cuando un EC se empareja con un EI de un valor afectivo, motivacional y


emocional (psicológico) determinado y después, en una segunda fase, se intenta condicionar
ese mismo EC con un EI de valor psicológico distinto al anterior.

Cuesta mucho más el contracondicionamiento que el condicionamiento, porque no se parte de


un elemento neutro sino de uno elemento que ha ganado valor informativo con respecto a un
EI, algo que hay que desmontar para dar un valor informativo diferente, respecto a un EI con
valor contrario al anterior

Un caso extremo: cuando se emparejan 2 EIs biológicamente importantes de significado


contrario (signo motivacional contrario). Condicionamos un EI por asociación con otro EI de
valencia opuesta o incompatible.

Se podría pensar que tiene lugar en el síndrome de Estocolmo: las víctimas acaban
sintiendo afecto por los secuestradores y sus causas, valorándolos positivamente.

4.4. Aversión adquirida/condicionada a sabores (ACS)

El aspecto, sabor y olor de los alimentos se asocian con el malestar experimentado después
de consumirlos, lo que lleva a desarrollar aversión a esas claves alimenticias.
El autor que destacó más por retomar e investigar este asunto es García, junto con Rescorla,
cuyo primer artículo (que contravenía las ideas que había en el momento) fue rechazado al
principio, aunque acabó siendo publicado e influyó a partir de los años 60 en los trabajos
acerca de condicionamiento. Tenía cierto conocimiento sobre esto gracias a la observación
natural de la “vergüenza-al-cebo” mostrada por los ratones, pues era agricultor y había
ratones que se comían los granos. La solución era envenenarlos. Algunos comían suficiente
dosis de veneno y morían, pero los que sobrevivían desarrollaban un aprendizaje muy
rápido: habiendo comido eso que nunca antes habían comido, y habiéndoles sentado mal, no
volvían a comerlo. Desarrollaban una aversión muy fijada a los parámetros de sabor del
veneno. Pensó que sería un proceso de condicionamiento pavloviano: asociar el sabor del
veneno con el malestar que les había producido; a partir de ahí, lo rechazaban. Sin embargo,
había algo que no acababa de cuadrar: si los animales asocian la enfermedad con las claves
que rodean al alimento, deberían desarrollar aversión al lugar en el que estaba el veneno,
pero eso no ocurre.

Ante esa idea, hizo experimentos: daba a ratones una solución dulce que nunca hubieran
probado, y cada vez que utilizaban el dispensador sonaba un clic sonoro y un destello
luminoso. Quería ver qué estímulo de esos 3 era asociado con las náuseas que producía
una inyección que les aplicaba.

Consumo de H2O en función del EC y del EI (consecuencias) con que ha sido asociado.

EC-sabor se asocia con nauseas por droga y produce aversión.

ECs exteroceptivo se asocian con dolor por shock y produce supresión.

En la prueba, se llevaba a los ratones en condiciones de privación de agua. Medía cuánto


bebían acompañando el agua de uno de esos tipos de clave: en un caso, de sabor dulce y, en
otro, del clic y el destello (señales exteroceptivas). Observó que, en el día de prueba, los
animales a los que, sedientos, se les daba la oportunidad de beber agua acompañada de
sonido y luz, esos estímulos no los inquietaban. Si bebían de un sabor especial dulce,
bebían prácticamente una quinta parte de lo que sería su consumo normal.

En un segundo experimento, emparejaban los mismos ECs, pero el EI era una descarga
eléctrica en las patas que producía dolor externo, en lugar de la droga inductora de náuseas.
El día de prueba era similar al del primer experimento. Encontró lo contrario: en este caso, si al
beber se dispara el clic y la señal visual, como la descarga era aplicada externamente,
esas claves externas interferían con su conducta y, asociadas con la descarga, provocaban
que no bebiera. Dejaban de beber agua cuando iba acompañada de señales exteroceptivas.
Sin embargo, el sabor del agua no se había asociado con el dolor externo: consumían agua
dulce con normalidad. ECs exteroceptivos se asocian con dolor por shock y produce
supresión.

Investigaciones posteriores establecieron que también es posible asociar el sabor con


descargas y el ruido con malestar gastrointestinal, pero es mucho más difícil lograrlo. Sin
embargo, depende de la especie qué tipo de estímulos es más sencillo asociar a alimentos. En
relación con estas tendencias selectivas diferenciales según la especie y los tipos de estímulos
condicionado e incondicionado, Seligman acuñó el término preparación: las diferentes
especies estamos más preparadas para asociar unas combinaciones de EC–EI que otras. Los
estímulos que resultan mutuamente más pertinentes desde el punto de vista evolutivo y de la
adaptación se asocian más fácilmente entre sí que los que no lo son. Equipotencialidad se
viene abajo.
Aversión incluso con demora larga de las náuseas.

Contradice la ley de la contigüidad, que dice que dos cosas que ocurren juntas (sobre todo
si la experiencia se repite: principio de frecuencia) se asocian entre sí. Se ha observado
aversión adquirida al sabor con un solo emparejamiento y con demoras entre el EC y el EI de
hasta 12 horas, lo que infringe los principios de la frecuencia y la contigüidad. También el de
aprendizaje progresivo, ya que aprendemos con un solo emparejamiento, un solo ensayo.

Trabajaron en distintas condiciones en las que:

– Grupo experimental (rayos X): ponían una solución dulce y, mediante rayos X, les inducían
náuseas pasados diferentes intervalos, desde 0 hasta 24 horas.

– Grupo control (falsa exposición): dan solución dulce y llevan a cabina experimental, pero
sin rayos X.

Resultado: si las náuseas las daban 24 horas después de haber bebido, bebían con
normalidad. Si tenían náuseas hasta 12 horas después, mostraban una caída en la tendencia a
beber la solución dulce. Incluso con una separación entre el EC y el EI de 6 horas, todavía se
producía asociación intensa.

La aversión adquirida a sabores con frecuencia se manifiesta con un solo emparejamiento,


sobre todo si las náuseas siguen a la ingestión de algún alimento nuevo y no preferido, y
frecuentemente se generaliza con facilidad hacia sabores similares.
Noticia de Telediario

Se está desarrollando en España un programa, parece que muy solicitado por viticultores de
diferentes países, basado en la aversión condicionada a sabores. Usan rebaños de ovejas para
que pasten y limpien de hierbas los viñedos, sin que se coman los brotes de las vides.

En un primer ensayo dejan que las ovejas coman el nuevo manjar: los brotes. A continuación,
les induce náuseas mediante un producto emético. Parece que a partir de ese momento ya
no vuelven a comer los brotes.

Se limitan a la hierba: un sistema natural, barato y ecológico para mantener limpios los viñedos.

2017 Conditioned taste aversions: From poisons to pain to drugs of abuse.

Revisión: Aversiones condicionadas al sabor, desde el veneno hasta las drogas. ACS
como mecanismo defensivo del sistema alimenticio.

– La ACS no opera sola: viene acompañada por neofobia al sabor (fobia a sabores nuevos),
otro mecanismo saludable, que en casos exagerados puede devenir en trastorno.

– Carácter general: afecta a muchas especies, también a la humana.

– EC: olor, sabor (su combinación: flavor), temperatura, textura de alimentos. Sobre todo,
NUEVOS.

– Aprendizaje incluso con demora EC-EI larga: hasta 24 horas (contigüidad prácticamente
nula).

– Aprendizaje de un-solo-ensayo.

– Detección temprana: comienza a funcionar incluso con pequeñas dosis de EI. Si solo se
diera aversión con dosis grandes, podría poner en peligro la supervivencia.

– Orden temporal: la aversión (AC a S) se produce a algo que precede al daño.


Supongamos que el EI induce COMA enseguida, aparte de las alteraciones gastrointestinales
(no se siente malestar); el sabor genera, aun sin tomar conciencia de ello, aversión. Si no se
diera ACS en condiciones precedentes, el animal podría volver a comer EI dañino en cantidad
letal. Se ha observado que se da ACS en sujetos anestesiados durante toda la incidencia del
EI. Y en personas que saben que el malestar no se debe al EC (cáncer; la quimioterapia,
entre otros efectos secundarios, produce náuseas. El problema es que has comido, y si te
sientes mal después puedes desarrollar aversión hacia el alimento). Aunque te garanticen que
no te ha sentado mal un alimento, desarrollas igualmente aversión hacia él.

Ni hace falta la conciencia para desarrollar aversión, ni la conciencia de que el malestar no se


debe al alimento es suficiente para no desarrollarla.

¿Qué opera como EI/RI?

– Aprendizaje a claves específicas del alimento, no a su contexto, por ejemplo.

– EI: veneno, alimento-en-mal-estado.

– RI: malestar gástrico.

– Drogas Psicoactivas y Dolor Interno (muscular) pueden producir también alguna ACS. El
dolor externo no funciona.

5. EL CURSO DE LA ASOCIACIÓN

Curva característica del condicionamiento pavloviano. Al someter al estímulo a repeticiones


del emparejamiento, el EC y el EI acaban asociándose y se producen incrementos graduales
negativamente acelerados de la capacidad del EC de producir la RC.

La curva de adquisición característica muestra un incremento gradual negativamente


acelerado. Cada nuevo emparejamiento del EC y el EI añade fuerza a la asociación entre
ellos. Sin embargo, llega un momento en que la curva se detiene y no sube más (40–67
repeticiones). Es decir, una vez alcanzado el límite (nivel asintótico) la fuerza de la RC
apenas aumenta con la adición de nuevos ensayos de condicionamiento.

La adquisición es reversible, por un lado, pero, por otro, no.

Extinción de la RC

Una vez se ha producido la asociación plena, si se expone a los individuos al EC sin el EI se


produce la extinción de la RC. La asociación se irá debilitando, y también muestra una curva
característica: reducción gradual negativamente acelerada.

Cada nuevo ensayo hará que se reduzca la asociación del EC y del EI y, por tanto, su
capacidad para producir la respuesta condicionada, hasta que esta deje de darse.

La extinción de la RC no es el resultado de la destrucción de las conexiones de asociación,


como indica la recuperación espontánea: si después de que se ha extinguido la capacidad de
producir RC se deja pasar tiempo sin nada (ni EC, ni EI…), si después de ese periodo de
tiempo se presenta de nuevo el EC sin el EI, reaparece la respuesta condicionada (aunque
en un nivel más bajo que el inicial). No se puede destruir la asociación con la técnica de la
extinción.
Ejemplo: si se recurre a la técnica de extinción para extinguir fobias (temor importante a algo
que no es peligroso, normalmente porque se asocia con algo malo) o síndrome de estrés
postraumático, con la exposición reiterada al EC sin que ocurra la desgracia se extingue el
miedo al mismo, pero si reaparece espontáneamente podría no ser suficiente (recuperación
espontánea).

Ej.: sufre una agresión en un ascensor. Asocia ascensor con colapso. Se le vuelve a llevar a un
ascensor, para que aparezca EC, pero no EI, hasta que la RC desaparezca. Si aparece de
nuevo la RC, habrá que tratarlo.

Hipótesis de Pavlov sobre la causa de la extinción

Proceso de aprendizaje opuesto al de la fase de adquisición, que da lugar a la inhibición


transitoria de la RC ante el EC sin el EI.

El emparejamiento entre el EC y el EI genera una conexión excitatoria entre sus centros


cerebrales: la activación del centro correspondiente al EC se transmite al del EI.

Al presentar de forma repetida el EC solo, se establece progresivamente una nueva conexión


inhibitoria entre los centros, de modo que la activación de esta conexión, finalmente, será
suficiente para bloquear la de la conexión excitatoria.

A nivel neurológico, existe evidencia de que una neurona que reciba neurotransmisores
excitatorios suficientes para disparar su actividad eléctrica puede verse bloqueada por los
neurotransmisores inhibitorios recibidos de otras neuronas. Que una neurona se dispare o no
depende de la correlación de neurotransmisores excitatorios e inhibitorios que reciba.

6. GENERALIZACIÓN Y DISCRIMINACIÓN

Tendencia a la generalización y discriminación de lo condicionado. Son tendencias opuestas y


complementarias.

– Generalización: RC ante estímulos distintos al EC, debido a su similitud. Sin embargo, la RC


no es tan intensa. Cuanto más se diferencie, menos RC provocará (gradiente de
generalización). Función adaptativa: raramente encontramos dos veces exactamente el
mismo estímulo.

– Discriminación: ausencia de RC ante estímulos más o menos parecidos al EC, debido a su


diferencia.

Se da generalización hasta cierto punto, límite en el cual se produce discriminación.


- Promover la discriminación

Existe una forma de entrenar a las especies para que presenten discriminación. Es un
entrenamiento discriminativo.

Para perros: cuando aparecía una circunferencia, había comida; con figura ovalada, no la
había. Los perros aprendieron a salivar solo ante las circunferencias.

Si iba cambiando las figuras y ya no era capaz de distinguir si era circular u ovalada, los
animales manifestaban inquietud: neurosis experimental. Puede inducir neurosis en los
animales sometiéndolos a un entrenamiento discriminativo que luego sean incapaces de
discriminar.

7. DISPOSICIÓN CRONOLÓGICA DE LOS ESTÍMULOS

Hasta ahora, habíamos partido de la ley de contigüidad entre EC y EI, pero sabemos que no
basta con eso, sino que debe haber contingencia. Al fin y al cabo, las cosas más contiguas son
las que ocurren a la vez, algo que no funciona: la señal debe preceder al EI.

Una de las circunstancias que más influyen en el condicionamiento pavloviano es la relación


temporal entre los estímulos condicionado e incondicionado; pequeñas variaciones pueden
dar lugar a grandes diferencias en el desarrollo del proceso asociativo o impedirlo.

4 casos de disposición cronológica del EC y el EI que dan lugar a tipos de CP:

1) Simultáneo: nivel máximo de contigüidad; el EC y el EI aparecen juntos. Funciona


bastante mal, da lugar a escaso condicionamiento. Matiz: el principio de contigüidad es
relativo, no absoluto.

Sin embargo, la ausencia de RC no implica ausencia de aprendizaje. Si el propósito de la


respuesta desencadenada por el EC es preparar al organismo para el EI inminente, en la
disposición simultánea no hay tiempo de prepararse y carece de sentido desarrollar una
respuesta ligada al EC. De hecho, se hizo un experimento: primero, se presentó a ratas un clic
seguido de un sonido. Después, presentaban una descarga eléctrica a la vez que el tono.
Encontraron que, después, el clic producía miedo, mientras que el tono no lo hacía.

2) Demorado: el EC precede al EI, pero se pueden solapar algo en el tiempo. El EI aparece


un poco más tarde que el EC. Es la mejor disposición, la que da lugar a mejor
condicionamiento. Aunque depende del EC: si este es muy largo, puede no percibirse el EI
como causa.

3) De huella: hay un intervalo (intervalo de huella) entre la desaparición del EC y la aparición


del EI (no debe ser muy grande, pues se podrían producir problemas de memoria o
interferencias: procesarán otras experiencias). No funciona mal si el intervalo de huella no es
muy grande. Se llama ‘de huella’ porque, cuando percibes el EI, el EC ya no está presente,
sino su “huella” en la memoria, la representación mental.
4) Hacia atrás / retroactivo: el EI precede al EC. No se produce asociación. El EC podría
convertirse, incluso, en señal de ausencia del EI: en lugar de condicionamiento excitatorio
con respecto al EC, se da condicionamiento inhibitorio. Peor condicionamiento.

De mejor a peor condicionamiento: demorado > de huella > simultáneo > retroactivo.

El gradiente es similar al de generalización. Es bueno que el EC preceda al EI algunos


segundos, no 0. Curva en forma de U invertida.

Inhibición de la demora: con intervalos cortos, la magnitud de la RC aumenta y su latencia


disminuye, pero con intervalos largos la latencia evoluciona de forma diferente: se acorta al
principio del entrenamiento, pero finalmente suele alargarse casi hasta el momento en que
tiene lugar el EI.

Después de una práctica prolongada, los organismos aprenden que el EI no tiene lugar hasta
pasado un buen rato desde que aparece el EC, por lo que tienden a inhibir la RC hasta un
momento próximo a la aparición del EI.
TEMA 5: Condicionamiento Instrumental I – Refuerzo Positivo
1. ANTECEDENTES HISTÓRICOS Y NOCIÓN DE CONDICIONAMIENTO INSTRUMENTAL
(CI)

El CI se ocupa de cambios en la conducta generados por las consecuencias que esta


provoca: tendemos a realizar las conductas que nos producen satisfacción y a evitar las que
producen malestar, incomodidades, sensaciones desagradables (conductas que son
castigadas).

Es una forma de cambio conductual debido a la experiencia que se conoce como


condicionamiento instrumental: la conducta es el instrumento para lograr experiencias
apetecibles y evitar las desagradables.

Las respuestas que dan los organismos no son reflejas, sino que están controladas.

- Antecedentes históricos

Desde el punto de vista científico: investigación, teoría. Que se empezara a analizar e


investigar de forma sistemática y formal. Son antecedentes más antiguos que los del clásico
(cuando Pavlov se dio cuenta de lo que llamó ‘secreciones psíquicas’ o ‘reflejo
condicionado’, al principio del siglo XX). En el caso del instrumental, hay un antecedente
previo al trabajo de Pavlov, pero no fue el autor que más aportó, sino que quien más aportó fue
Skinner, más tarde.

– El manejo del CI es universal y tan antiguo como la humanidad. En cambio, el


clásico existía antes de que Pavlov lo desarrollara, pero nadie había identificado el
fenómeno. Es algo que nos ocurre, pero nadie lo había manejado de forma expresa
para influir en la conducta de otras personas o animales.

En el instrumental, tampoco es así. Ponerle nombre, investigarlo de manera sistemática y


específica… todo ello comenzó en el siglo XX. Pero los animales y humanos lo utilizaban de
manera instintiva.

– Antecedente más directo de su investigación científica (siglo XIX): Thorndike y


su ley del efecto. Se planteaba por qué los animales se adaptan a su medio y
aprenden a sobrevivir en él: ¿porque son inteligentes y comprenden lo que ocurre o
porque, por ensayo y error, las conductas van seguidas de consecuencias buenas o
malas (asociación entre lo que hacen y las consecuencias)? Para investigarlo, llevó a
cabo una serie de experimentos con diferentes animales, para lo que utilizó las cajas–
problema. Suponía que, encerrando a un animal hambriento en una jaula, poniéndole
comida fuera, se esforzará por salir por dos motivos: para salir y para comer la
comida. Hizo ensayos en los que a gatos hambrientos los encerraba en jaulas y
podían salir mediante un pestillo, una cuerda… para ver cómo maniobraban.

Los animales comienzan actuando por ensayo y error: emiten diferentes respuestas con
diferentes probabilidades. Las respuestas que van seguidas de consecuencias satisfactorias
ven aumentada su probabilidad en ese contexto.

A esto lo llamó la ley del efecto: las conductas que van seguidas de consecuencias
satisfactorias tienden a conectarse con la situación en la que se produjeron, de manera que
cuando se repita la situación, será más probable que vuelva a tener lugar la misma conducta.

Y cuantas más veces se repita (ley del ejercicio) y más intensa sea la satisfacción, más se
fortalecerá la asociación.
Interpretación de Thorndike de la ley del efecto:

El refuerzo de una conducta (R) mediante un estímulo reforzante (ER) en un contexto dado
(EC) produce asociación EC–R, lo que incrementa la probabilidad de esa conducta
instrumental en ese contexto.

Aparte de las cajas-problema, Thorndike también investigó la respuesta de animales en


sucesivos ensayos en otras ocasiones, como en laberintos. Permiten estudiar diferentes
aspectos conductuales del aprendizaje (errores, latencia de las respuestas, velocidad,
orientación espacial, valor incentivo de los refuerzos…), pero no la tasa conductual (que a
Skinner le parecía fundamental): número de respuestas por unidad de tiempo; qué harían los
animales experimentales si pudieran ejecutar tan a menudo como quisieran la respuesta que
les proporciona refuerzos.

¿Qué hacen los animales si los colocas en la caja de partida y están hambrientos? En un brazo
hay una recompensa, en otro no. Variaban en complejidad, y también en el tiempo que
tardan en presentarles los laberintos (para estudiar la memoria).

Si hay veces que aparece el alimento a la derecha y otras a la izquierda, ¿qué hará? También
se les pueden poner pistas para que las asocien con el alimento.

O también se pueden utilizar diferentes refuerzos para ver su valor incentivo, es decir, con
qué intensidad llevan a cabo una conducta con cada tipo.

Son capaces de establecer mapas mentales.

Skinner (psicología conductista) hace las mayores contribuciones instrumentales,


metodológicas, empíricas y teóricas al condicionamiento instrumental. Fue uno de los
psicólogos más influyentes del siglo XX.

– Le interesaba investigar, aparte de qué conductas se aprenden y cómo, cuánto se


realizan (en función de diferentes factores). Le interesaba la conducta principalmente
en su aspecto funcional, por los eventos que provoca (como “operante”).

– De ahí que se quisiera trabajar en condiciones de ‘operante libre’: que no solo se


pueda aprender a emitir una respuesta, sino realizarla a voluntad más o menos
veces.
Con Thorndike (caja-problema o laberinto), el animal solo puede llegar a la meta una vez en
cada oportunidad para hacer la prueba. No permite averiguar la frecuencia con que harán cierta
conducta.

– Para eso desarrolló un nuevo instrumento: la caja de Skinner.

Tiene dispositivos que los animales pueden manipular y, por tanto, emitir respuestas con
ellos. También tiene dispositivos que permiten aplicarles recompensas y castigos. Además,
se puede programar para que la aparición de refuerzos o castigos siga diferentes patrones
según la conducta del animal. Hay claves contextuales (visuales, acústicas…). Si recibir
comida depende de que pulsen una palanca, puede ser que solo funcione si está encendida
la luz azul, pero no si está encendida la roja. Se combina el condicionamiento clásico y el
instrumental.

Registro acumulativo: rodillo con plumillas que estaba conectado con la caja de Skinner y,
cada vez que el animal emitía la respuesta de interés, la plumilla lo señala dibujando un salto.
Permite estudiar la evolución de la tasa de respuesta (qué frecuencia, qué persistencia) y su
acumulación total a lo largo del proceso.

Se puede analizar con detalle el desarrollo del CI.

Todo ello dio lugar a la variedad de aprendizaje conocida como ‘condicionamiento


operante’.

Por lo demás, la dinámica característica del proceso de condicionamiento instrumental es


bastante similar a la del condicionamiento clásico. Conforme avanza el tratamiento de
adquisición, en el que la acción instrumental produce la consecuencia reforzante, aumenta la
fuerza de esa acción, que se mide en términos de probabilidad o tasa (número de respuestas
por unidad de tiempo). Con frecuencia se emplean también otros criterios: número de errores,
tiempo que lleva ejecutar la acción, vigor y velocidad, persistencia cuando ya no da lugar al
refuerzo. Algunos de estos criterios tienen más que ver con adquisición de conocimiento
(descubrir qué conductas generan refuerzos) y otros con cambios en la ejecución conductual
(empeño en su realización).

Una vez desarrollada, una conducta instrumental, si se procede a un tratamiento de


extinción, en el que se omite el refuerzo manejado hasta ese momento, tiende a producirse
una reducción gradual de su fuerza. Sin embargo, la desaparición de la conducta instrumental
raramente es completa y definitiva en estos casos.

Tras un periodo de descanso en el que no se aplica tratamiento ni de adquisición ni de


extinción, suele observarse cierta recuperación espontánea de la respuesta original, cuando
se repone la situación ligada a la obtención del refuerzo.

En estos casos, la asociación original no se destruye del todo, sino que es contrarrestada por
un nuevo aprendizaje que la enmascara. Cuando un individuo es sometido, después de un
proceso asociativo, a un tratamiento de extinción, es como si se le estuviera diciendo que en
este momento y situación esa conducta no funciona de aquella manera, pero puede volver a
hacerlo en el futuro.

La evolución del proceso de extinción depende bastante del programa de reforzamiento


manejado en la fase de adquisición.

El hecho de que el tratamiento de extinción no destruya por completo las asociaciones


desarrolladas con anterioridad tiene importancia cuando se intenta modificar el
comportamiento. Es preferible sobreimponer otro aprendizaje incompatible con el anterior:
potenciar conductas incompatibles con las que queremos eliminar.
2. TIPOS DE CI

Si el CI consiste en la modificación de la conducta a raíz de sus consecuencias, y…

a) Una conducta puede generar un evento o suprimirlo: contingencia positiva (la acción
provoca el evento) o contingencia negativa (la acción suprime el evento).

b) El evento puede ser agradable o desagradable.

Al combinar ambos parámetros obtenemos 4 tipos de condicionamiento instrumental. pR+


significa que potencial la probabilidad de respuesta instrumental, pR– que la reducen.

Ejemplos:

– Dar azote a niño por arrojar macetas desde 5º piso: castigo / castigo positivo.

– Retirar permiso de un conductor por conducción muy temeraria: omisión / coste de


respuesta / castigo negativo.

– ‘Arrepentidos’ que redimen pena por dar información valiosa: escape / evitación / refuerzo
negativo.

– Dar una propina a un niño por haber hecho un recado: recompensa / refuerzo positivo.

– Madre que dice: “Brais, si vuelves a morder al perro no te querré”: omisión / coste de
respuesta / castigo negativo.

– Tomar analgésico contra el dolor de cabeza: escape / evitación / refuerzo negativo. El


consumo de narcóticos en drogodependientes parece responder más a refuerzo negativo
(intento de atajar el sufrimiento generado por el síndrome de abstinencia) que a refuerzo
positivo (disfrute de los efectos primarios genuinos de las sustancias).

– Ir a la cárcel: omisión / coste de respuesta / castigo negativo porque te quitan la libertad.


Si en la cárcel te maltratan, te gritan, te someten a temperaturas inadecuadas sería castigo /
castigo positivo, aunque esto está prohibido.

Negativo porque la conducta suprime el evento.

El castigo tiene mala prensa y cada vez está más prohibido con personas, animales
domésticos e incluso con animales vertebrados superiores. El tratamiento por omisión es a
menudo el preferido para disuadir conductas indeseables en personas, porque, a diferencia del
castigo, suele tener una eficacia notable sin necesidad de recurrir a estimulación aversiva, con
el consiguiente ahorro de efectos secundarios perniciosos.

No confundir:

– Refuerzo positivo y negativo: no se refieren a naturaleza agradable / desagradable de las


consecuencias, sino a la contingencia positiva / negativa entre respuesta y evento.

– Castigo y refuerzo negativo: en ambos casos interviene un evento aversivo, pero la


contingencia entre respuesta y evento es distinta. En el castigo, la conducta provoca el evento;
en el refuerzo negativo, la conducta suprime el evento. Por tanto, la conducta instrumental
aumenta en el caso del refuerzo negativo y disminuye en el castigo.
– Castigo y omisión: se puede suprimir una conducta con cada uno de ellos. La omisión tiene
menos efectos secundarios adversos, por razones legales y psicológicas es mejor utilizarla.

3. ELEMENTOS FUNDAMENTALES DEL CI

[EC – R] →ER

Son 3 elementos:

1) Conducta / respuesta (R).

2) Consecuencia / refuerzo (ER).

3) Contexto (EC).

El contexto también puede marcar la relación entre conducta y consecuencias. Por ejemplo,
si a un niño solo le regaña su madre por hacer algo, podrá hacerlo en presencia del padre; si
hay un radar, el conductor relaciona la conducta con sanción y baja la velocidad, pero si no hay
un radar aumentará la velocidad.

3.1. La respuesta / conducta

Antecedente o factor causal del refuerzo.

- Respuestas ‘voluntarias’: el CI sirve para regular el comportamiento controlado por


el sistema nervioso central y mediado periféricamente por el subsistema somático.
Mientras tanto, el condicionamiento clásico incide en las respuestas vegetativas,
automáticas, en los efectos de las drogas… (actividad bio-fisio-vegetativa).

- El CI permite:

– Modificar la probabilidad y fuerza de respuestas ya existentes (conductas dirigidas a


metas).

– Adquirir respuestas nuevas mediante moldeamiento. Es diferente del aprendizaje


vicario, que es aprendizaje por modelado (por el modelo que se observa). Consiste en
reforzar progresivamente, por fases, aproximaciones sucesivas cada vez más similares
a la conducta perseguida, hasta lograrla.

Primero se comienza reforzando la conducta espontánea más próxima a la que queremos


lograr, para incrementar su frecuencia. Como una acción casi nunca se realiza dos veces
exactamente igual, aparecerán variaciones de la misma. Se pasa a reforzar solamente la
versión más próxima a la deseada, y así sucesivamente hasta implantar la conducta que se
quiere lograr.

• Carácter selectivo del CI: no es un proceso ciego. La posibilidad de inducir ciertas


conductas mediante ciertas recompensas no es la misma para las distintas conductas,
recompensas o especies.

Thorndike propuso el concepto de ‘pertinencia’ para justificar por qué unas conductas se
condicionan con más facilidad que otras, variando la pertinencia en función del tipo de
refuerzos, la especie, el estado de motivación del organismo… Según las especies y los
refuerzos en juego, unas conductas resultan más relevantes que otras en términos naturales,
por razones adaptativas.

3.2. El refuerzo

Consecuencias que siguen a las conductas y que les afectan.


- Concepto problemático: no se puede definir u operativizar qué es un refuerzo. Debe
comprobarse que afecta a la conducta.

- Según Hull, basándose en el principio del homeostasis: estímulos que reducen


algún estado impulsivo (teoría de la ‘reducción del impulso’). Los organismos
tienen tendencia natural a mantener un estado de equilibrio biológico que, al romperse,
genera un impulso o estado motivacional. Son reforzantes los estímulos que reducen
algún estado impulsivo, ayudando a recuperar la homeostasis.

(Nos quedamos con este concepto, pero tenemos el caso de las estimulaciones sexuales
táctiles: no reducen impulsos.)

3.2.1. Tipos de refuerzos

Estímulos

– Refuerzos primarios: resultan reforzantes de manera innata, natural, sin aprendizaje


previo. Ejemplo: comida, descarga eléctrica.

– Refuerzos secundarios: adquieren valor reforzante por experiencia o aprendizaje previo.


Por ejemplo, por condicionamiento clásico, mediante su asociación con algún refuerzo
primario: si asociamos un sonido con descarga, el sonido podría resultar desagradable y
modificar la conducta para evitar ese sonido; o también por cultura, socialización…

– Refuerzos sociales: refuerzos (cualquiera de las 4 variables) que nos aplican los
congéneres. Estimulación generada por miembros de la misma especie. Ejemplo: sonrisa
(primario), piropo (secundario).

– Estimulación sensorial: para muchas especies, es un refuerzo primario, pero puede tener
valencia diferente para diferentes personas. Ejemplo: a un niño lo lanzas al aire y puede ser
que le guste o no.

– Estimulación cerebral directa: activar el centro del placer (ciertos núcleos de la amígdala) si
se lleva a cabo una conducta determinada.

Experimento de Talwar (2002): navegación en ratas guiadas mediante estimulación eléctrica


del cerebro enviada a través de control remoto. Los ratones tenían un electrodo en el centro
del placer cerebral con un dispositivo que podía activarlo a distancia y, a su vez, otro
electrodo situado en cada oreja. Al animal lo soltaban en la cabina de investigación y se le
entrenaba: si se le daba impulso eléctrico hacia la oreja izquierda y se movía hacia la
izquierda, se le daba un impulso al centro del placer. Se manejan los 3 elementos:
conducta (girar hacia la derecha / izquierda), recompensa (activación del centro del placer),
contexto (si hay una señal eléctrica que sentía por el lado izquierdo y giraba hacia ese lado,
había recompensa).

Experimento 2: ratón gigante que es entrenado en Mozambique para oler y aproximarse a


(detectar) minas enterradas: recibe un bocado de banana después de hacerlo.

Actividades como refuerzo

1) Principio de la probabilidad diferencial

Premack propuso que muchas actividades también pueden funcionar como refuerzos.
Dadas 2 actividades de probabilidad diferente, si la oportunidad de realizar la más probable se
condiciona a que se aumente la realización de la menos probable, la menos probable se
verá potenciada. La oportunidad condicional de realizar la más probable puede ser utilizada
como refuerzo de la menos probable.
¿Cuál funciona aquí como conducta instrumental: la más o la menos probable? (actividad
que genera la consecuencia) La menos probable, porque la haces para conseguir la
conducta más probable, que es la que te resulta agradable.

Se recurre a conductas frecuentes (más placenteras) para aumentar la probabilidad de las


que son poco frecuentes (menos apetecibles). De esta manera, la conducta más probable se
convierte en la recompensa.

Ejemplo: Lenxa juega muchas horas al día (4 horas) y lee poco (1 hora). Si la posibilidad de
jugar (más placentera) se condiciona a leer más (menos apetecible), esto hará que lea más. El
poder jugar es la recompensa.

2) Principio de privación de la respuesta

(Timberlake y Allison, 1974). Hablamos de conductas más o menos probables que forman
parte del repertorio natural de conductas. En este caso, puede ser que la conducta poco
frecuente nos guste mucho, pero que tenga un periodo refractario (no nos apetece cuando
acabamos de hacerla).

Si es espontánea y natural, la frecuencia baja no es señal de que no nos guste.

Para que una actividad A sea potenciada (reforzada) por dar acceso a la actividad B, basta
con someter B a restricción, a menos que se aumente A. En este caso, la actividad A
funciona como conducta instrumental.

Según este nuevo planteamiento, para poder utilizar una actividad para reforzar otra ni siquiera
es necesario que la reforzante sea más probable que la instrumental. Basta con que la
reforzante no se pueda realizar en su frecuencia espontánea ideal a menos que se aumente la
realización de la instrumental.

Ejemplo: a Lenxa le gusta jugar (A) mucho (4 horas) y leer (B) menos (1 hora). Si para poder
leer su hora tiene que jugar más, lo hará.

¿Qué actividad se maneja aquí como refuerzo? La más probable (jugar) es la actividad
instrumental; la menos probable (leer) es el refuerzo.

La frecuencia a veces no correlaciona positivamente con que te guste más hacer una actividad,
a veces, cuanto más realices una actividad más asco le acabas cogiendo a la misma.

3) Regulación conductual

Existe una suerte de homeostasis conductual o distribución ideal de actividades en los


organismos, cuando no están sometidos a restricciones: punto de deleite.

Ejemplo: Rodrigo, dejado a sus anchas, dedica: 11 horas a dormir, 8 a ver la televisión, 3 a
jugar, ½ a hacer deberes… Ese es su punto de deleite.

Si jugar deja de ser independiente de estudiar y se le exige que por cada hora de juego
dedique otra a hacer deberes, esta restricción rompe su homeostasis, interrumpe la
distribución preferida, y disparará los mecanismos de ajuste encaminados a recuperarla: en
este caso, estudiar más.

Se condiciona la realización de una actividad (refuerzo) a la ejecución de otra que se quiere


promover (instrumental). Ante la imposición de unas restricciones así, el individuo trata de
aproximarse a su punto óptimo de distribución conductual.

Su distribución preferida indica que dedica apenas media hora a estudiar por cada 3 horas que
juega. A partir de ahora, le someto a un tratamiento instrumental por el que por cada hora
que quiera jugar tiene que estudiar otra hora.
Punto de deleite y restricción que impone el CI respecto a las conductas de jugar y
estudiar. Esto deberá hacer que aumente el tiempo dedicado a estudiar, para poder jugar
más. Tendrá necesidad de jugar, pero para satisfacer esa necesidad estudiará. Quizá juegue
menos para no tener que estudiar tanto, pero estudiará más que antes.

Se impide uno de los componentes de la homeostasis salvo que el individuo aumente otro
para recuperar o aproximarse lo máximo que pueda a la homeostasis. FALTA GRÁFICO

3.2.2. Los parámetros de los refuerzos


- Calidad y cantidad

El condicionamiento instrumental muestra relación positiva con la calidad y cantidad de


refuerzos.

A mayor cantidad de refuerzo, más afecta a la conducta. No solo importa la cantidad


absoluta, sino también la relativa a la experiencia anterior (historia de reforzamiento): las
expectativas. Esto lo pone de manifiesto el fenómeno del contraste de incentivos.

Experimento de Crespi (1942): demostrar la importancia de la cantidad en términos


absolutos y en términos relativos.

Era un laberinto en forma de corredor para ver cómo los animales corrían hacia la meta en
función de la cantidad de recompensa que hubiera en ella.

– Fase A: unos animales recibían 1 granito al llegar a la meta, otros 16 y otros 256. Los
que recibían poco refuerzo apenas variaban la velocidad entre los primeros y los
sucesivos ensayos. Cuantos más granos recibían, se distraían menos en el camino
hacia la meta. Se esfuerzan más por un refuerzo mayor.

– Fase B: a partir del ensayo 20. Consta de 8 ensayos. Todos los animales recibían 16
bolitas de alimento al alcanzar la meta. La misma cantidad de comida no tiene el
mismo efecto en todos los animales; depende de cómo hayan sido tratados.

Para unos animales era mucho comparado con lo que habían recibido antes, por lo que
aumentaban la velocidad (contraste positivo); si era menos que antes, disminuían la
velocidad (contraste negativo).

Efectos del contraste de la cantidad de refuerzo en fase B, respecto a fase A.

Frente a la interpretación mecanicista de Thorndike y muchos conductistas radicales


posteriores, estos datos concuerdan más con la interpretación cognitivista de Tolman, quien
sostenía que los refuerzos alimenticios generan en los animales la expectativa de encontrar
comida en la meta. El efecto de los refuerzos depende de su valor con respecto a las
expectativas.

Demora
Los refuerzos aplicados con demora con respecto a la conducta que los provoca reduce su
eficacia.

Parte del problema puede ser por problemas de olvido: incapacidad de asociar respuestas y
estímulos reforzados demorados. También puede ser un problema de interferencia: entre la
conducta y el refuerzo se llevan a cabo muchas otras acciones que podrían asociarse con el
refuerzo. Cuando no se puede aplicar inmediatamente un refuerzo primario, una forma de
mitigar la influencia contraproducente de su demora es manejar refuerzos secundarios
inmediatos o marcar la respuesta instrumental mediante el lenguaje. Aun así, no desaparecen
del todo sus efectos adversos.

La demora reduce el valor incentivo de los refuerzos: descuento de la demora.

Es posible que afecte más a una persona impulsiva, o que no ha madurado. Aquellas
personas que son capaces de esperar por las recompensas (autocontrol) tienen mayor
probabilidad de éxito futuro.

Tendencia a realizar acciones indeseables y a no realizar las deseables, debido a sus


beneficios y perjuicios, y consecuencias inmediatas.

Acciones Beneficios Perjuicios Tendemos a


Perniciosas Inmediatos Diferidos Realizarlas
Deseables Diferidos Inmediatos No realizarlas

Experimento de Rachlin y Green (1972): elección con pichones en una caja de Skinner con
dos llaves. Si picoteaban una, tenían acceso inmediato a grano durante 2 segundos; si
picoteaban otra, después de 4 segundos tenían acceso a grano durante 4 segundos. Aunque
la segunda opción proporcionaba el doble de comida, las aves optaban por el refuerzo
inmediato en el 95% de los ensayos.

¿Cuál es el curso del descuento de la demora? Es decir, ¿pierde una cantidad constante de
valor incentivo por unidad de tiempo? Se pensaba que perdemos un porcentaje fijo por unidad
de tiempo, pero se ha demostrado que esto no es así, no perdemos un porcentaje de
incentivo por unidad de tiempo.

Es una función hiperbólica: es una pérdida negativamente acelerada. Pierde más en las
primeras unidades de retraso que en las sucesivas.

Donde VA representa el valor incentivo actual de una recompensa R, diferida con una
demora D, y K es una constante incluida para reflejar la tasa de descuento (y que no siempre
es la misma: ni en todas las personas ni en todas las circunstancias).

El valor incentivo de un refuerzo aumenta en una proporción creciente por unidad de tiempo
conforme disminuye su demora.

Diferencias en k (y en margen de vulnerabilidad)

Se ha observado mayor k por ejemplo en niños, drogodependientes y ludópatas, personas con


trastorno bipolar y esquizofrenia, seguramente por su impulsividad y bajo autocontrol.
Imaginemos la pérdida de valor de un coche nuevo, a partir del momento en que lo
compramos. Si hemos pagado por él 30.000€, y queremos devolverlo o revenderlo, ¿perdemos
una cantidad fija (ej. 500), por cada semana que pasa?: NO. ¿Perdemos un % fijo cada
semana? NO. Se da una pérdida negativamente acelerada: función hiperbólica.

Si sufren una pérdida fija por unidad de tiempo y fueran preferibles 1000€ dentro de un año y 1
mes, a 980 dentro de 1 año, lo serían siempre, también dentro de un mes, frente a 980 ahora.

Las curvas del valor incentivo de un refuerzo pequeño más próximo y otro mayor más diferido
nunca se cruzarían.

¿Sufren una devaluación en una proporción constante por unidad de tiempo: función
exponencial? En este caso las curvas del valor incentivo de un refuerzo pequeño más
inmediato…

Contra lo definido por algún modelo económico, la evidencia vino a indicar que el valor de
incentivo de los refuerzos diferidos disminuye en una proporción decreciente por unidad de
tiempo, conforme aumenta la demora. Función hiperbólica.

La función hiperbólica permite que las curvas que reflejan la dinámica cronológica del valor
incentivo de dos refuerzos de diferente tamaño y demora se crucen: puede llegar a
invertirse la preferencia entre ambas recompensas conforme transcurre su tiempo de espera
pendiente. Se podrá dar preferencia por un refuerzo mayor, aunque requiera más espera,
sobre otro menor más próximo, cuando ambos resultan suficientemente remotos. Mientras
que se puede producir una inversión de prioridades, y pasar a preferir el pequeño más
próximo cuando su momento se acerca.

A la hora de determinar el valor incentivo relativo de dos refuerzos de intensidad y demora


suficientes:

– Mayor incidencia de la diferencia entre intensidades cuando son refuerzos muy


lejanos en el tiempo.

– Mayor incidencia de la diferencia entre demoras cuando son refuerzos más


próximos. El punto a partir del que pasa a ser preferido el refuerzo menor marca el
margen de vulnerabilidad: propensión a sucumbir a la elección más impulsiva y
menos adaptativa.

Motivación
La motivación potencia la ejecución de la respuesta al aumentar la eficacia de los refuerzos,
pero también puede incidir sobre el aprendizaje. En este caso, la relación positiva entre
motivación y aprendizaje tiene su límite: ley de Yerkes-Dodson.

En general, para conductas en que sabemos qué debemos hacer para lograr la recompensa,
la motivación promoverá que realicemos esa conducta. Pero, si debemos encontrar la
respuesta para lograr la recompensa (proceso de aprendizaje), no es tan claro que a mayor
motivación mejor aprenderemos. Estados muy elevados de motivación pueden resultar
excesivos para aprender con eficacia tareas altamente complejas.

La relación no es lineal en caso de que deba producirse el aprendizaje. La relación entre


motivación y aprendizaje es curvilínea, en forma de U invertida. Al seguir aumentando la
motivación, eso perjudica la eficacia en el proceso de aprendizaje. Hay un nivel de
activación óptimo que es intermedio. El nivel óptimo de motivación (rendimiento más alto)
será mayor en las tareas fáciles y menor en las difíciles. Si hubiera que pensar más, una
motivación demasiado grande podría provocar “miopía de la hipótesis”.
Hipótesis de la sobremotivación: demasiada motivación reduce el foco atencional: centras tu
atención en la solución que te parece más natural y lógica. No estás en condiciones de probar
hipótesis o soluciones alternativas.

Facilitación social: si controlas muy bien una tarea, la presencia de otros hace que la
desempeñes mejor. Sin embargo, si no la controlas te perjudicará.

En situaciones de emergencia debería ser espontánea, natural e instintiva, porque si tienes que
llevar a cabo la actividad de manera premeditada y hay mucha motivación por salvarse, esta
interfiere de manera negativa.

Importan los procesos ambientales, pero también la interpretación, los procesos cognitivos. En
los años 60 se produjo una revolución en la interpretación de los mecanismos del
condicionamiento, propiciada por los propios conductistas.

Experimento de Broadhurst (1957): aprendizaje de laberinto en forma de T sumergido, en


función de la motivación y dificultad de la tarea.
Había una plataforma para salir a flote en el brazo más iluminado, que cambiaba al azar.
Manipulaba dos cosas:
1) Dificultad: variaba la iluminación relativa de los brazos. 3 niveles: fácil, moderada y
difícil.
2) Motivación: variaba el tiempo de retención antes de poder salir corriendo, 5 grupos
experimentales distintos (0, 2, 4, 6 y 8 segundos).
– Fácil: cuanto más tiempo los retuvieran, menos se equivocaban. La motivación potencia el
aprendizaje.
– Moderada: igual que la fácil, más o menos.
– Difícil, acertaba menos el grupo 0 que el grupo 2. A partir de ahí, a mayor retención, menos
aciertos. Se observa una curva que refleja, de manera parecida, la ley de Yerkes-Dodson.
Experimento con personas: Ariely et al., 2009. La crisis afectó, sobre todo, a la clase obrera.
Muchos ejecutivos no sufrieron la crisis, incluso algunos ganaron más dinero. Ariely se
planteaba: ¿los ejecutivos tendrán mejor rendimiento por pagarles más?
Los sujetos experimentales debían afrontar una serie de tareas: físicas y sencillas o
cognitivas, con diferentes niveles de dificultad.
– Tareas físicas sencillas: a mayor recompensa, mejor rendimiento.
– Tareas cognitivas: la relación entre rendimiento y grado de recompensa no era
lineal y directa.
Llevó a cabo en EE. UU. y en la India, para ver si también dependía de la situación económica.
En la India, 3 niveles de recompensa: bajo, medio y alto. Rindieron más los que ganaban una
cantidad media; los que tenían recompensa alta ganaron menos que los de baja.

3.3. El contexto: control por el estímulo


- Thorndike consideraba que se produce asociación entre el estímulo contextual y la
respuesta, cuando se refuerza. Tiende a desarrollarse asociación entre los dos eventos
estimulares que intervienen (EC–ER). Como ER tiene lugar reiteradamente en presencia de
EC, este acaba activando la representación del otro (participación del condicionamiento
clásico).
- Skinner defendía la asociación entre la conducta y el estímulo reforzante (refuerzo). El
estímulo contextual señala la contingencia entre la respuesta y el refuerzo. Es decir, determina
en qué contexto se dan la conducta y el refuerzo.
En la caja de Skinner se manejan claves que indican cuándo funciona llevar a cabo una
conducta para conseguir un refuerzo. La conducta se condiciona en un contexto, y no en el
otro: se adapta. Los organismos no solo aprenden qué hacer, sino también cuándo y dónde
hacerlo: control por el estímulo.
Frecuentemente se emplea una clave particular indicativa de la disponibilidad del refuerzo
(estímulo discriminativo, EC +) y otra indicativa de su no disponibilidad (EC–). Solo en
presencia del EC+ la conducta instrumental conduce al refuerzo; será entonces,
preferentemente, cuando se emita la respuesta operante.
Interés no solo teórico, también práctico. Ejemplo: tendemos a no cometer infracciones en
presencia de policía o sistema de vigilancia. Por eso a veces se utilizan señuelos con fines
disuasorios (mobiliario de radar sin equipo…).

4. RELACIÓN RESPUESTA–REFUERZO
De nuevo se presenta la pregunta: ¿es la contigüidad suficiente para que se produzca el
condicionamiento instrumental?
- Contigüidad: se refiere a la proximidad en el tiempo entre la respuesta y el estímulo
reforzante. Para que se produzca, basta con que aparezcan próximos en el tiempo un
determinado número de veces.
- Contingencia: implica que la posibilidad del estímulo reforzante es mayor si tiene
lugar la respuesta que si no. Covariación estadística. No basta con que la respuesta y
el estímulo reforzante aparezcan juntos un determinado número de veces.
¿Es suficiente la contigüidad o el CI requiere también contigencia R-ER?
- Algunas observaciones pueden hacer pensar que basta con la contigüidad.
- Conducta supersticiosa.
Sin embargo, a diferencia de lo que ocurrió con el condicionamiento pavloviano (en la década
de los 60 ya se aceptó la contingencia), en el condicionamiento instrumental se publicaron
artículos en los años 70 que parecían apoyar que la contingencia no era necesaria, que
bastaba con la contigüidad. Las conductas que van seguidas de consecuencias satisfactorias
se imponen.
Consideró que esto es un apoyo a la ‘conducta supersticiosa’: si hacer algo va seguido de
una consecuencia adversa, procuras evitar esa conducta, y viceversa, aunque solo haya
ocurrido una vez o no haya relación entre conducta y consecuencia (la probabilidad de obtener
la recompensa no es mayor cuando se lleva a cabo la conducta).
Contraposición de contigüidad y contingencia. Las experiencias satisfactorias que vivimos
después de realizar una conducta afectan a esta conducta, aunque no tengan nada que ver
con ella.
Se crea una situación ficticia de ilusión de control: se cree que la consecuencia es producto
de la conducta, aunque no sea cierto. Hace que parezca más importante la contigüidad.
Experimento: evidencia de la capacidad de los refuerzos de potenciar las conductas
precedentes, al margen de que ambos eventos resulten o no contingentes. En este
experimento, responder reduce la probabilidad de refuerzo.
Los animales recibían comida cada 20 segundos. Si pulsaban la palanca, recibían comida
inmediatamente, pero eso cancelaba el refuerzo de los 2 tramos siguientes. De esta manera, la
probabilidad de obtener refuerzos era mayor sin pulsar la palanca que pulsándola, pero los
animales cada vez pulsan más la palanca y obtienen menos refuerzos. En estas condiciones, el
principio de contigüidad se impone al de la contingencia. Situación engañosa que genera
ilusión de control y que hace que parezca más importante la contigüidad.
Conclusión pese al experimento: la contingencia es necesaria, afecta al proceso de
condicionamiento de una conducta.
Contigüidad y contingencia: sin contingencia entre respuesta y estímulo reforzante, aunque
aparezcan juntos algunas veces, no se percibe relación causal entre ellos, por lo que el
refuerzo no altera la tendencia a emitir la conducta.
La contigüidad del refuerzo también es un principio decisivo con respecto a la conducta que lo
provoca. La demora produce una reducción de la eficacia del estímulo reforzante; con
demoras excesivas puede no producirse condicionamiento, aunque entre ambos eventos se dé
contingencia.
“El principio subyacente más relevante del condicionamiento instrumental es la contingencia
entre la respuesta y el reforzador. Aunque la contigüidad es necesaria, lo que sustenta al
condicionamiento es la relación predictiva diferencial entre la respuesta y la consecuencia”.
5. PROGRAMAS DE REFUERZO: PROGRAMAS SIMPLES DE REFUERZO PARCIAL (RP)
La contingencia es un parámetro estadístico: tiene un valor desde –1 hasta +1, pasando por el
0.
Hay diferentes programas de condicionamiento instrumental según el valor de la
contingencia, tanto en el laboratorio como en la vida. Veremos los 4 más básicos.

• Refuerzo continuo
Se aplica el castigo o recompensa cada vez que se produce la respuesta. Tienen poco
interés porque no hay variaciones del mismo y apenas ocurren en la vida diaria.
La contingencia es igual a 1 (máxima). Sin embargo, no tiene por qué ser siempre la más eficaz
para inducir condicionamiento.

• Refuerzo parcial
La respuesta no siempre va seguida de estímulo reforzante. Hay dos tipos:
• Simples / básicos
Se maneja una sola respuesta bajo un solo programa. Existen diferentes programas según los
requisitos necesarios para obtener el refuerzo con la emisión de la respuesta instrumental.
– Programas de razón: fijo o variable. El refuerzo/castigo se aplica a la conducta
instrumental pero no de forma continua, sino ocasionalmente. Para lograr un refuerzo,
hace falta emitir la respuesta un número determinado de veces. Si es variable, se
mantiene la media, pero cambia el número de respuestas necesarias cada vez.
Ejemplo: en un casino, las máquinas tragaperras siguen un programa de razón variable.

– Programas de intervalo: fijo o variable. La recompensa solo la logra haciendo la conducta


cuando pasa cierto intervalo de tiempo desde la última vez que realizó la conducta y obtuvo
una recompensa.
Ejemplo: un sueldo, si te pagan de manera fija a final de mes, sería un programa de intervalo
fijo. Un taxímetro lo tendría combinado: sería un programa de razón cuando está en
movimiento, pues cobra por revoluciones de la rueda (distancia recorrida); cuando está parado,
sería de intervalo porque cobra por tiempo.

La combinación de los dos criterios usados para esa clasificación (requisito exigido y carácter
constante/ variable del requisito) da lugar a 4 tipos de programas de refuerzo parcial simples:

El RV es el que más se aproxima a muchas situaciones naturales, en las que se refuerzan las
conductas que se desea promover, aunque no el 100% de las veces ni de manera fija por
diferentes razones. La obtención de refuerzos depende en última instancia de la emisión del
comportamiento: a más emisiones, más refuerzos.
Patrón de respuesta característico:
- Los programas de razón generan tasas más altas que los de intervalo.
- Los fijos suelen producir pausas post-refuerzo, sobre todo los de IF. Los animales
aprenden no solo qué tienen que hacer para obtener el refuerzo, sino cuándo.
- Que los variables no produzcan pausas post-refuerzo implica que:
o Generan pautas de conducta más estables.
o Tienden a generar tasas superiores de respuesta. Porque, sobre todo en
RF, el número suficiente de respuestas no siempre es el mismo, nunca sabes
si dando una respuesta más ya has emitido las suficientes para que te den un
refuerzo. La pauta no está tan interiorizada.
En RF se acumulan muchas respuestas seguidas y descansos. Igual en los de IF: las
respuestas se dan cuando el organismo considera que va a obtener el refuerzo, y entre medias
hay descansos.
– Otros programas: ámbito clínico.
- Complejos
Se maneja más de una respuesta o, al menos, más de un programa simple para la
administración de recompensas.

- Efecto del refuerzo parcial en la extinción


La extinción consiste en dejar de aplicar el programa de condicionamiento: se produce la
pérdida de fuerza de la respuesta instrumental cuando deja de ser reforzada.
En condicionamiento clásico, se presenta el EC sin el EI: la fuerza asociativa entre ellos se
reduce.
Si una conducta que ha sido promovida mediante condicionamiento instrumental deja de ser
reforzada, salvo que la conducta tenga motivación intrínseca (la propia conducta se
autorrefuerza), se reducirá su ejecución.
Es diferente el efecto que tienen el refuerzo continuo y el parcial sobre la extinción.
Con menos refuerzos es más difícil lograr que la conducta se extinga
El refuerzo/castigo continuo es el más eficaz para promover/eliminar una conducta; lleva
menos tiempo. Sin embargo, para que aguante la conducta y no desaparezca cuando es
sometida a extinción, son mejores los programas de refuerzo parcial.
Mayor resistencia a la extinción en el caso de las respuestas adquiridas bajo programas
de refuerzo parcial. Cuanto más alta es la razón o el intervalo de refuerzo, más resistencia.

El refuerzo continuo adquiere una fuerza mayor que el parcial. Sin embargo, en caso de dejar
de reforzarla, cae más rápido la conducta adquirida por refuerzo continuo que la adquirida
por refuerzo parcial.
Explicaciones:
– Hipótesis de la discriminación: los individuos tratados con refuerzo parcial no tienen claro
que no volverán a conseguir nunca el refuerzo, porque ya antes necesitaban llevar a cabo la
conducta varias veces. Es más difícil discriminar. Sin embargo, los que habían sido tratados
con refuerzo continuo tienen claro que la situación ha cambiado: la respuesta ya no conlleva
obtener recompensa.
– Teoría de la tolerancia a la frustración: si obtenemos una recompensa cuando damos una
respuesta, no nos gusta que de pronto no la recibamos. Sin embargo, en el caso del refuerzo
parcial estás acostumbrado a que no siempre obtendrás la recompensa, e insistes porque ya
has tenido que repetir la conducta para poder obtener el refuerzo: no te frustra tanto.
¿Por qué algunos juegos son más adictivos que otros? Investigación de verificación con
un experimento en humanos: conclusiones de la investigación utilizando el juego. Programas
que pueden seguir las máquinas a la hora de promover la perseverancia en el juego.
1) Los participantes expuestos a una tasa menor de refuerzos perseveraron más en la
condición de extinción.
2) Esto interactuó con intervalo entre ensayos (IEE): los participantes expuestos a IEE mayor
y tasa menor de refuerzo persistieron más en extinción.
3) Y más, sobre todo, los sujetos más impulsivos. En esto coincide con lo observado en
adicción a drogas: mayor vulnerabilidad al abuso y adicción en sujetos impulsivos.
Para saber qué programa es el mejor, hay que tener en cuenta el objetivo:
– Refuerzo continuo: la prioridad es implantar una conducta sin reparar en otros aspectos.
– Refuerzo parcial: se pretende reducir a la larga el riesgo de extinción en caso de suspensión
de los refuerzos.

6. CONDICIONAMIENTO INSTRUMENTAL HUMANO INCONSCIENTE


¿Es indispensable la conciencia?
Además de la contigüidad R–ER, la clave del condicionamiento instrumental radica en la
contingencia entre ambos elementos para que se pueda registrar relación causa–efecto entre
ellos.
El papel de la conciencia de la contingencia R–ER en CI pasó por fases similares al CP.
Thorndike ya barajó la idea de que el CI opera al margen de la conciencia. Luego Skinner la
defendió: las experiencias reforzantes fortalecen directa y automáticamente las acciones que
las preceden; las recompensas y los castigos también conforman la conducta de especies que
carecen de conciencia.
Pero, finalmente, se impuso aún con más fuerza la idea de necesidad de conciencia, por
tratarse de conductas deliberadas dirigidas a metas: las personas desarrollan tendencia a
realizar unas conductas para lograr beneficios, y a omitir otras para evitar perjuicios.
Es más importante la conciencia que en el clásico, donde se trabaja con reflejos y se podría
dar condicionamiento al margen de la conciencia. Sin embargo, en el condicionamiento
instrumental se hace algo para lograr una recompensa o evitar un castigo.
- Experimento: condicionamiento inconsciente
Se utilizó el estímulo contextual.
Trabajaron con recompensas o sanciones de dinero por llevar a cabo unas conductas. Había
un estímulo (‘cue’) en cuya presencia se obtenía una recompensa, pero pasaba inadvertido a la
conciencia. Otras dos claves llevaban a no obtener dinero o a perderlo, respectivamente.
Debían prestar atención a ‘cue’ (EC) enmascarado y, al llegar al signo ?, pulsar o no un botón.
Pulsarlo = 0£, + 1£, – 1£, dependiendo del EC en ese ensayo.
No pulsarlo = 0£.
Teóricamente, en los ensayos en presencia de la clave que quita dinero aprendes a no apostar;
cuando está la clave con la que no ganas ni pierdes, a veces apostarás y otras no. Adaptarás
la conducta a las claves que te indican si es conveniente, o no, apostar.
Los datos empíricos señalan que, efectivamente, se adapta la conducta, aunque no lo perciban
de forma consciente: los participantes no son capaces de explicar por qué apuestan o no.
Valoración de EC al verlos al final sin enmascarar: las preferencias están ordenadas en función
de la recompensa obtenida. +1£ → 0£ → –1£.

- Motivación inconsciente de la respuesta instrumental: mayor esfuerzo ante E C de ER


mayores
Si una conducta va seguida de una gran recompensa (mayor valor incentivo), habrá más
esfuerzo.
Contra el supuesto de que la intensidad del esfuerzo se acomoda a la expectativa consciente
del tamaño del refuerzo, estas investigaciones obtuvieron evidencia conductual y neurológica
de que la fuerza de la conducta instrumental también se puede ver afectada por una motivación
no consciente.

Secuencia de elementos, incluida imagen de una moneda (libra vs. penique), que indicaba el
valor en juego que ganaban si llevaban el marcador al tope presionando un mecanismo.
Pulsaban más cuando estaba en juego la libra, incluso con exposiciones del EC de 17 ms
enmascaradas, en las que no eran conscientes de lo que había en juego.
Los sujetos adaptaban su conducta y se esforzaban más, aun sin saber por qué.

Más difícil todavía: actuación al margen de ‘la persona’


Normalmente, se considera que la motivación denota deseo consciente de la persona para
lograr una meta, por lo que el refuerzo que espera en una situación instrumental pone en
marcha su esfuerzo deliberado para alcanzarlo mediante la acción que corresponda.
La conducta instrumental tiene que hacerla unas veces con la mano izquierda y otras, con la
derecha. La clave que se utiliza para señalar el refuerzo grande o pequeño se la mandan en
ensayos controlados al hemisferio derecho o al izquierdo.
Cuando les ponían la clave de recompensa alta vs. baja de manera consciente, la conducta
se adaptaba con ambas manos, independientemente de que la señal llegara al hemisferio
derecho o al izquierdo.
Sin embargo, cuando la señal de lo que se jugaba llegaba a un hemisferio era muy fugaz y
pasaba inadvertida, solo apostaba cuando se trataba de hacer la conducta con la mano del
hemisferio al que había llegado la información. Adaptación automática de la respuesta cuando
esta estaba controlada por el mismo hemisferio que recibía la información.

Cuando la información la recibía un hemisferio y el otro hemisferio debía tomar la


decisión de llevar a cabo la conducta, no se producía esa adaptación.
Esto indica que el valor incentivo de los refuerzos estaba operando a nivel sub-personal e
inconsciente.

Se supone que la motivación implica deseo consciente de la persona para lograr una meta. Las
personas también se adaptan cuando el EC no se percibe conscientemente.
Conclusión: los procesos de aprendizaje mediados por el striatum, aunque no resultan
accesibles a la conciencia, influyen en la toma de decisiones. Si las claves contextuales
alcanzan la conciencia, entonces intervienen otros sistemas cerebrales que permiten el
desarrollo de conocimiento explícito de las covariaciones.
TEMA 4: Condicionamiento Clásico II – Principios y teorías

- ¿Qué se asocia? Se produce asociación EC–RC y EC–EI, sobre todo esta última.
- ¿Por qué? Por contingencia entre EC–EI contiguos, si el EI sorprende (en cuyo caso se
presta atención al EC, de modo que condiciona el mejor).
- ¿Cómo se desarrolla el condicionamiento pavloviano y por qué se producen ciertos
fenómenos?
Integrar los fenómenos del condicionamiento pavloviano en un modelo o teoría general.

1. ¿QUÉ SE ASOCIA?
Debate: asociación EC con EI / EC con RI. ¿El EC con la RI directamente, o a través del EI?
El EI provoca una respuesta biológica innata, y se condiciona el EC hasta que produce esa
respuesta.

Ejemplo: las marcas suelen recurrir a personas o situaciones atractivas para que
atribuyamos sus características a los productos. Sin embargo, imaginemos que se descubre
que esa persona ha cometido un delito. Las marcas, normalmente, anulan el contrato porque
no quieren que eso repercuta en su marca.
La solución de esa anulación depende de qué se asocie.

Cuando se empareja un EC con un EI (que provoca de manera automática una respuesta


innata), el EC acaba provocando esa respuesta. Dos interpretaciones:
– La provoca porque el EC se asocia directamente con la RI.
– El EC acaba adquiriendo la capacidad de adquirir una respuesta por su asociación
con el EI. El EC activa la representación mental del EI y por eso provoca una respuesta
parecida a la de este.
En esto discreparon Pavlov y los conductistas.
- Conductistas: defendieron que se trataba de una asociación EC–RI (asociación E–R).
- Pavlov: cuando dos eventos del ambiente tienen lugar de forma contigua en el tiempo se
produce
una conexión entre los dos centros mentales y cerebrales que procesan las respectivas
informaciones.
Consideraba que el EC activaba en centro del EI: defendía una asociación entre el EC–EI.
Se intentó aclarar qué asociación funciona. ¿Cómo comprobarlo? La técnica principal:
reevaluación postcondicionamiento
del EI. Se devalúa el valor del EI después de consolidar la asociación.
Lo que predice cada teoría:
– Teoría EC–EI: EC cambia de respuesta condicionada.
– Teoría EC–RI: el EC no cambia de RC, no se vería afectada por la devaluación.
Sin embargo, lo que ocurre es que sí se ve afectada. El EC provoca una respuesta devaluada,
paralela,
correspondiente.
Señal de que el EC provoca la respuesta a través de la asociación con el EI. La técnica dio
la razón a Pavlov.
Hipótesis de los dos niveles
Hay datos para todo: en alguna medida, el EC también se asocia con el centro de control de la
RI. El EC no es solo sensible al valor del EI. Ambas intervienen, pero tiene más importancia la
asociación EC–EI.
Por eso retirar la mala figura de la campaña no funciona si el EC–EI se asocian. Por retirar la
figura no va a hacer que la marca deje de activar una idea negativa.
No solo tiene implicaciones teóricas, sino también implicaciones prácticas.

2. ¿POR QUÉ SE ASOCIA? CONTIGÜIDAD VS CONTINGENCIA


Inicialmente se consideró decisivo el principio de contigüidad: que EC y EI se sucedan
repetidamente de forma contigua. Dos eventos que ocurren de manera contigua se asocian en
la mente.
Sin embargo, una serie de hallazgos empíricos y la llegada del enfoque cognitivo pusieron en
entredicho la contigüidad como condición suficiente para la asociación.

2.1. Principio de la contigüidad


Dos eventos se asocian en la medida en que ocurren próximos en el tiempo.
En un principio, se podría decir que la aparición simultánea del EC y el EI constituye la
contigüidad máxima, pero ya sabemos que el condicionamiento funciona mal en ese caso.
Rescorla matizó el concepto: la contigüidad puede ser necesaria, pero es insuficiente. Planteó
el principio de la contingencia.

2.2. Principio de la contingencia


Parámetro derivado de comparar la probabilidad del EI en presencia del EC [p(EI | EC)] con la
probabilidad del EI en ausencia del EC [p(EI | EC)]. La probabilidad (p) va desde 0 a 1.
Aunque la probabilidad de que el EI tenga lugar en presencia del EC fuera la misma siempre,
si la probabilidad de que tenga lugar en su ausencia es diferente varía la probabilidad relativa:
la contingencia es distinta en cada caso.
Pueden ocurrir 3 cosas: que sea positiva, negativa o nula.
– p(EI | EC) > p(EI | EC) → Contingencia + = Condicionamiento excitatorio.
– p(EI | EC) < p(EI | EC) → Contingencia – = Condicionamiento inhibitorio.
– p(EI | EC) = p(EI | EC) → Contingencia 0 = No condicionamiento. El EC no dice nada con
respecto al EI. No quiere decir que no se aprenda nada, simplemente no provoca respuesta
condicionada.
En este último caso sí se cumple la ley de la contigüidad: han aparecido el EC y el EI
juntos. Sin embargo, no se da condicionamiento porque no es suficiente: hace falta que se
cumpla el principio de la contingencia.
Rescorla fue investido Dr Honoris Causa por la Universidad de Gante en 2006. Es el autor que
más ha destacado en la segunda mitad del siglo XX en la investigación acerca del
condicionamiento pavloviano.
- Distinguir entre contigüidad y contingencia
Experimento. Trabajaba con dos grupos de animales, a los que sometía a un EC (tono que
duraba 2 minutos) y un EI (descarga de 5 segundos):
– Grupo aleatorio: durante la sesión experimental, de media hora, cada cierto tiempo tenía
lugar cada estímulo, de forma aleatoria. A veces aparecían juntos, otras veces solos.
Aparición de ambos eventos al azar.
– Grupo de contingencia: le aplicó los mismos ECs pero solo aplicó los EIs que coincidían
con el EC. Siempre que apareció el EI apareció junto al EC, aunque el EC apareció alguna vez
sin el EI. Nunca hubo EI sin EC.
Según la ley de la contigüidad, se debería producir condicionamiento en ambos grupos,
que han sufrido el mismo número de veces la descarga junto con el tono. Sin embargo, el
grupo aleatorio no producía asociación entre los estímulos. El grupo de contingencia sí
desarrolla condicionamiento.
En los grupos no cambia la contigüidad, sino la contingencia.

- Condicionamiento pavloviano según el nivel de contingencia


Estimado mediante la razón de supresión (RzS).
El EI es un choque eléctrico y el EC es un tono. La p(choque/tono) = 0.4: el 40% de las
veces que aparecía el EC le acompañaba el EI.
Cuatro niveles de contingencia, desde 0.0 a 0.4: manejó el mismo número de emparejamientos
EC-EI en todos los grupos, pero varió la p(choque/no-tono) = de 0.0 a 0.4.

Lo que cambia es cuántas veces reciben el EI en ausencia del EC. Quiere evaluar el miedo
condicionado al EC en los 4 grupos, medido gracias a la RzS.
En el grupo 0.0: RzS = 0. Indicativa de alto miedo. En cambio, en el grupo 0.4 no tenían una
reacción de miedo (RzS = 0,5).
Observó un nivel de miedo condicionado proporcional al valor de la contingencia del EC-
EI.

2.3. Contingencia negativa: condicionamiento inhibitorio


La pEI es mayor en ausencia que en presencia del EC.
Esto llevó a hablar de espacio de contingencia: permite anticipar qué va a ocurrir manejando
diferentes probabilidades del EI en presencia o ausencia del EC.

Según dónde se encuentre la situación:


– Por encima o a la izquierda de la diagonal del gráfico: pEI en presencia del EC es mayor
que en su ausencia (condicionamiento excitatorio).
– Por debajo o a la derecha de la diagonal: contingencia negativa, la pEI es mayor en
ausencia del EC (condicionamiento inhibitorio).
– Diagonal: contingencia nula. No quiere decir que no se produzca aprendizaje; los animales
aprenden que ambos eventos no guardan relación, lo que hará más difícil asociarlos en el
futuro (irrelevancia aprendida).
Con Rescorla, la ley de la contigüidad es corregida con el concepto de ‘contingencia’.
Había una concepción mecanicista que obviaba los procesos cognitivos y hacía depender al
condicionamiento únicamente del ambiente.
Sin embargo, se empieza a cognitivizar y humanizar el comportamiento de las ratas. El
proceso de condicionamiento no es un proceso mecánico que depende de la ley de la
contigüidad, sino que también depende de los procesos mentales que lleva a cabo el sujeto a
la hora de producirse la asociación.

2.4. Bloqueo: el papel de la sorpresa

Bloqueo de un elemento de un EC compuesto, por preexposición al otro.

Con este experimento, Kamin nos habla de atención: de la sorpresa que provoque el EI y la
consiguiente atención que se presente a la situación.

Si se empareja un elemento neutro (ECT) con un EI, al incluirlo en un EC compuesto (ECT +


ECL), impide el condicionamiento del elemento añadido (ECL).

En un experimento de Respuesta Emocional Condicionada (REC) de miedo trabajó en 2


fases + la prueba, con 2 grupos:

– Experimental: trabajó con 2 fases, de preentrenamiento y de condicionamiento compuesto.

• Preentrenamiento: empareja EC con EI.


• Condicionamiento compuesto: manejó dos ECs simultáneos que emparejó con una
descarga.

– Control: mismo condicionamiento compuesto, pero sin preentrenamiento.

Quería ver si la luz condiciona miedo por su emparejamiento con la descarga en ambos
grupos.

En el grupo control, la luz y el tono se asocian con la descarga. En cambio, en el


experimental la luz, pese a ser emparejada con la descarga el mismo número de veces que el
grupo control, no generaba miedo condicionado.

Es lo que se conoce como bloqueo de un elemento de un EC compuesto, por preexposición


al otro. Se ve bloqueado porque previamente su compañero fue emparejado antes, gana
relevancia, y es la mejor señal del EI.
Razón de supresión ante la luz

Índice de condicionamiento del miedo.

– Grupo experimental: RzS próxima a 0,5.

– Grupo control: RzS próxima a 0, indicativa de bastante miedo.

– Grupo en el que solo se había emparejado el EC tono con las descargas (no reseñado en
la tabla). Lógico que la luz en esta condición no produzca RC de miedo. En el experimental
no se generaba miedo condicionado, hasta el punto de que muestra una razón de supresión
similar a la del grupo solo con tono.

Sin embargo, según el principio de contigüidad el grupo experimental debería haber


mostrado un condicionamiento ante la luz similar al del grupo control, ya que en ambos esta fue
sometida a los mismos emparejamientos con el EI. El bloqueo pone de manifiesto que el
emparejamiento EC–EI no siempre da lugar a condicionamiento.

Explicación del bloqueo

Los organismos solo rastrean en el medio respecto a EIs que les sorprenden, que no son
capaces de anticipar. Por eso, los ECs solo se asocian con EIs sorprendentes. Por eso,
cuando hay más de un predictor de un EI, suele condicionar solo el mejor predictor. Al resto
no se presta atención. Los recursos son limitados en todas las especies y se aprovechan para
comportamientos adaptativos y útiles.

Si el EI es esperado quiere decir que ya existe alguna clave que permite anticiparlo, de
manera que no es necesaria ninguna búsqueda adicional.

Interpretación nueva del condicionamiento pavloviano. No se parece a la interpretación


mecanicista en la que se ignoran los procesos mentales/cognitivos. El condicionamiento, como
proceso de aprendizaje, es cognitivo. Importan los procesos ambientales, pero también la
interpretación, los procesos cognitivos. En los años 60 se produjo una revolución en la
interpretación de los mecanismos del condicionamiento, propiciada por los propios
conductistas.

3. ¿CÓMO SE CONDICIONA? MODELOS EXPLICATIVOS

- ¿Qué se asocia? Se produce asociación EC–RC y EC–EI, sobre todo esta última.

- ¿Por qué? Por contingencia entre EC–EI contiguos, si el EI sorprende (en cuyo caso se
presta atención al EC, de modo que condiciona el mejor).
- ¿Cómo se desarrolla el condicionamiento pavloviano y por qué se producen ciertos
fenómenos? Integrar los fenómenos del condicionamiento pavloviano en un modelo o teoría
general.

Se han aportado varias teorías generales con respecto al condicionamiento. La más influyente
es la primera de todas ellas, aportada por Rescorla y Wagner. Incluso se aplicó fuera de la
Psicología, en procesamiento de información. Es uno de los pocos modelos formales
establecidos en Psicología.

3.1. Modelo de Rescorla–Wagner Cuantificar la sorpresa

El condicionamiento generado por un ensayo (la asociación EC–EI) depende del grado de
sorpresa ante el EI. Si es sorprendente, generará la búsqueda de claves predictivas.

La cantidad de condicionamiento de un EC que resulte contingente con respecto a un EI


responde a la medida en que se procese el EI en busca de predictores, lo que depende de la
magnitud de la sorpresa que provoca.

En los primeros ensayos del proceso de condicionamiento resultará muy inesperado. La


primera vez que te aplican una descarga, como es sorprendente, prestas atención para
averiguar qué la produce, cómo evitarla. Por eso, a medida que se producen repeticiones, te
vas dando cuenta de que el EC precede a esa descarga. La sorpresa que produce el EI la
segunda vez será algo menor que la primera. Y así ocurre sucesivamente. De ahí la curva
característica de adquisición: con incrementos graduales negativamente acelerada, hasta
aproximarse a su nivel máximo o asíntota.

3.2 y 3.3 No entra!

Es decir, los incrementos son más pequeños en cada ensayo.

- Unos estímulos pueden asociarse entre sí más y/o más fácilmente que otros.
Hay diferentes tipos de curva. Puede cambiar de varias maneras:

a) Tener un nivel asintótico diferente, pero alcanzarlo en el mismo número de ensayos.

b) Tasa o velocidad diferente con que llega a la misma asíntota: alcanzan la asíntota en
pocos o en muchos ensayos.

c) Diferencia en ambas: asíntota mayor/menor y velocidad mayor/menor.

- ¿Cómo podemos estimar la sorpresa ante el EI?

Rescorla y Wagner partieron del experimento del bloqueo (de la sorpresa) como eje central
para su teoría. Querían explicar el fenómeno del bloqueo con su teoría. La idea es la que
defiende Kamin: el condicionamiento se producirá en aquellos ensayos en los que el EI resulte
sorprendente. A más sorpresa, más condicionamiento de la señal para anticipar el EI en el
futuro. Ellos dijeron que el grado de condicionamiento depende del grado de sorpresa.

Creyeron que la curva típica de condicionamiento permite calcularlo.

- Simbolicemos la asociación EC–EI como V, su incremento como ΔV, la tasa de


condicionamiento como K y su nivel asintótico como λ.

- Al repetir EC–EI aumenta V, aproximándose a λ (y también disminuye la sorpresa ante el EI).

- Por tanto, índice razonable de sorpresa ante el EI en el ensayo n: la diferencia entre λ y la V


previa a ese ensayo (aportada por todos los ECs, los ensayos anteriores), lo que se puede
simbolizar como VΣ(n–1).

El nivel de sorpresa que experimenten los sujetos ante un nuevo ensayo (en que se
encuentran el EC) para el EI será progresivamente menor cuanto más grande sea la
asociación EC–EI.

Es decir:

- La sorpresa y, por tanto, la fuerza asociativa ganada (ΔV) en un ensayo n viene marcada por
la diferencia λ – VΣ(n–1) (modulado por K: no todos los estímulos se procesan de la misma
manera, puede hacerse con mayor o menor intensidad; K refleja curvas más o menos rápidas).

- La teoría de Rescorla–Wagner expresada formalmente:

ΔVn = k (λ – VΣ(n–1))

- Evaluación del modelo: evidencia favorable


a) Adquisición (con K = 0.30 y λ = 1)

A menor valor de K, y mayor λ, se tarda más en alcanzar la asíntota. La curva de adquisición


típica se construyó con los resultados de un experimento.

Según este cálculo, el EC adquiere en cada ensayo una fuerza asociativa adicional (ΔVn)
proporcional a su cantidad todavía disponible, es decir, a la diferencia entre la intensidad
máxima de condicionamiento generable por el EI y la asociación ya adquirida hasta ese
momento por el EC (λ – VΣ(n–1)).

De ahí que el incremento de la RC resulte menor en cada ensayo sucesivo: la “disponibilidad


asociativa” que queda disminuye a medida que V se aproxima a λ.

b) Extinción (con k = 0.30 y λ = 0)

Es el caso inverso, hay que cambiar algún elemento: sustituimos λ por 0. Se produce la
disminución progresiva de la RC conforme se repiten los ensayos en los que aparece solo el
EC. Se encuentra que la curva baja a 0: en lugar de techo, se habla de suelo.

Hasta ahora habíamos dicho que λ representa la fuerza asociativa EC–EI máxima alcanzable.
Refleja el límite de una curva que responde a una función exponencial. Si λ = 0, λ – VΣ(n–1)
resultará negativo. Por tanto, la variación de la fuerza asociativa en los ensayos de extinción
(ΔVn) será negativa: sufrirá una reducción.

k = 0.3 en ambos casos porque la curva de adquisición es igual de rápida que la de


extinción.

Supongamos que los ensayos siguientes a la Adquisición son de Extinción. En este caso, ΔV
es negativa. De esa manera, se obtiene la típica curva de extinción: los ensayos se repiten
hasta que se extinga del todo.

Una línea de razonamiento similar se puede emplear para explicar la inhibición condicionada.
En los ensayos en los que el EI no sigue al EC+ y el EC–, λ = 0.

c) Bloqueo (con k = 0.30 y λ = 1)

Para anticipar el EI se utilizan todas las claves disponibles necesarias. Cuando intervienen
simultáneamente dos ECs, son tenidos en cuenta ambos a la hora de anticipar un EI.
– Al inicio del condicionamiento compuesto, la fuerza asociativa total será resultado de la suma
de la fuerza asociativa que haya ganado el tono y la luz. VΣ = VT + VL

– Si el tono ya se ha asociado por completo con la descarga en la fase de preexposición: VT ≈


1. El EI ya resulta totalmente predecible en base al tono.

– Pero la luz tendrá 0: ΔVL = K (λ – VΣ(n–1)) = 0.3 (1 – 1) = 0.

d) Predicciones nuevas y sorprendentes: sobre-expectación

Situación en la que añadir nuevos emparejamientos de EC con EI disminuya la asociación,


como consecuencia de un factor de sobreexpectación. Trabajó en 2 fases:

– Fase 1: alternaba ensayos ECT → EI y ECL → EI (por ejemplo, emparejar tono y descarga
eléctrica, y luz y descarga eléctrica). Se emparejan por separado dos ECs distintos con un EI.
– Fase 2: ensayos [ECT + ECL] → EI (sobreexpectación). Aparecen a la vez los dos ECs
seguidos del EI. Estos ensayos disminuirán la respuesta condicionada (miedo), al contrario de
lo que se pensaba.

El condicionamiento que se produce en cualquier ensayo no depende solo del emparejamiento


de un determinado EC con el EI, sino de las expectativas con respecto al EI.

- Fuerza combinada de ambos ECs (VΣ) moderada

A los ensayos con EC compuesto (fase 2) les precedieron pocos simples (fase 1). El EI
resultará aún bastante imprevisible y es de esperar que se incremente la asociación del EI con
cada uno de los ECs.

Al final de la fase 1: VT = VL = 0,20. Cada uno de ellos ha ganado una fuerza asociativa.

Depende del nivel asociativo alcanzado por cada uno de los ECs antes.

En el ensayo de la fase 2, se suman las fuerzas asociativas, lo que hace que el animal se
espere la descarga. VΣ = 0,40.

En el primer ensayo de la fase 2, aplicamos la ecuación: ΔVT = ΔVL = K (λ – VΣ(n–1)) = 0,3 [1,0 –
0,40] = 0,18. Crecerá la fuerza asociativa de la luz y la descarga en 0,18.

- Condicionamiento intenso de los ECs en la fase 1

Si al final de la fase 1 ha habido suficiente experiencia como para que la fuerza asociativa sea
muy alta, el animal está prácticamente seguro de que al tono y a la luz les sigue descarga:
apenas le sorprende, porque ambos están altamente asociados con la descarga. VT = VL =
0,90. Entonces VΣ = 1,8. Supera el valor techo (1,0). El modelo predice una disminución de la
RC en la fase 2.

En el primer ensayo de la fase 2, aplicando el algoritmo compuesto, debería disminuir la fuerza


de asociación: ΔVT = ΔVL = K (λ – VΣ(n–1)) = 0,3 [1,0 – 1,8] = –0,24.

Rescorla hizo este tipo de diseño con animales, y se confirmó. En la fase 1, los dos ECs
alcanzaron un nivel de REC próxima a la asíntota.
Si, de repente, te presentan los dos estímulos, piensas que la descarga será mayor que antes;
sin embargo, se aplica la misma descarga, lo que supone un alivio. La sobreexpectación no se
confirma.

Expresado con la nomenclatura formal del modelo, el término λ – VΣ(n–1) reflejaría la diferencia
entre lo que se prevé en cierto ensayo (VΣn) y la intensidad del EI experimentado realmente (λ).
Si en unos ensayos lo esperado a causa de la fuerza combinada de todos los ECs presentes
es mayor que el EI encontrado realmente (VΣn > λ), se produce inhibición, en este caso del
miedo condicionado.

Evaluación del modelo: sus limitaciones

1) Tratamiento que da al EC
La operatividad del EC suele verse afectada por factores como su relevancia, intensidad… Sin
embargo, el modelo pretende reflejar la efectividad en el proceso de condicionamiento a
través de K3, una constante que no cambia durante el proceso.

2) Preexposición al EC

El modelo de Rescorla-Wagner no predice, por ejemplo, la inhibición latente a que da lugar la


preexposición al EC. No ha resuelto toda la teoría del condicionamiento pavloviano, aunque
haya contribuido a su avance.

El haberlo expuesto antes sin que le siga el EI, condiciona peor. Sin embargo, la denominación
no es del todo correcta: cuando he sido preexpuesto, realmente no es que desarrolle inhibición
latente, es que no espero que ocurra nada. Tardo más en asociarlo.

¿A qué se puede deber? Irrelevancia aprendida. Aprendemos que el estímulo es irrelevante y


dejamos de prestarle atención. Si ahora me lo encuentro y pasa algo, tardo más en asociarlo
que si partiera desde cero.

Según el modelo, durante la preexposición al EC no interviene ningún EI, por lo que λ = 0. No


debería producirse reducción de la sorpresa ante un EI que solo comenzará a aparecer en una
fase posterior.
ΔVluz–desc = K (λ – Vluz–desc) = K (0,0 – 0,0) = 0

Por tanto, no debería observarse inhibición latente.


¿Tal vez es un modelo más incompleto que erróneo?
El modelo se centraba en la sorpresa ante el EI. La primera vez que te exponen a un estímulo,
en ambos grupos se produce la misma sorpresa. Sin embargo, al sufrir la descarga por primera
vez la sorpresa también debería ser del 100% en los dos grupos. Hay más factores a tener
en cuenta, además de la sorpresa.

Wagner hizo un modelo por su cuenta, pero para poder predecir mucho se trató de un modelo
muy complejo y ya no tuvo tanta fama.

Aportaciones del modelo


– Dio impulso a la investigación experimental, aumentando el conocimiento empírico del
aprendizaje.
– Recuperación del interés por los modelos formales y matemáticos en este campo.
– Influencia en otros campos de la psicología: aprendizaje causal humano, percepción,
psicología social, desarrollo de modelos neoconexionistas de redes neuronales.

Es una de las microteorías formales más influyentes de la psicología experimental.

4. CONDICIONAMIENTO PAVLOVIANO EN HUMANOS. EL PAPEL DE LA CONCIENCIA


4.1. El papel de la conciencia
- Los animales condicionan y, debido a continuidad biológica, nosotros compartimos
mecanismos de CP con ellos.

- Peculiaridades del ser humano: lenguaje y conciencia. Si se produce respuesta


condicionada provocada por el EC, bastaría un solo ensayo si se utilizara el lenguaje. En
cuanto tomen conciencia. También a la inversa: si se les dice que ya no aparecerá
acompañado del EI, toman conciencia de ello. La conciencia marca una impronta al proceso
de condicionamiento.

- Desplazamiento pendular en el papel atribuido a la conciencia a lo largo del siglo XX.


Posiciones históricas respecto al papel de la conciencia en condicionamiento pavloviano:

1) Concepción mecanicista tradicional: la conciencia era concebida como un


epifenómeno. Aunque no se tome conciencia, el condicionamiento se produce si los
estímulos son contiguos y contingentes. La conciencia de la covariación EC–EI es
irrelevante.

2) Concepción cognitivista: sin conocimiento consciente de la contingencia EC–EI no


se da aprendizaje. Sin conciencia no se produce condicionamiento alguno.

3) Modelo de los dos procesos (polivalente): normalmente la conciencia resulta


decisiva para el condicionamiento clásico, pero en circunstancias propicias se puede
dar condicionamiento clásico sin conocimiento de la contingencia EC–EI.
Ejemplo: si te dicen que el EC ya no va a ir seguido de una descarga, la RC de miedo
no desaparece completamente.

Hipótesis de los 2 niveles:


- Sistema primitivo de aprendizaje mecanicista: el EC se asocia automáticamente con el
EI y provoca la RC.
- Sistema más sofisticado: el EC genera la expectativa del EI y prepara al organismo:
RC.
- En la especie humana coexisten ambos sistemas lo que posibilita el CP
inconsciente.
- Hoy es frecuente hablar de cognición inconsciente (CgI).

Adquisición de miedo
El sistema de alarma lleva a cabo una valoración inicial de emergencia (del tálamo a la
amígdala) que responde de forma automática, antes de que el sistema cognitivo sofisticado
desarrolle un pensamiento completo y reconocimiento consciente del ED de la reacción de
miedo (pasando por la corteza cerebral)

Esquema neurológico del recorrido de la información


El miedo es un tipo de respuesta interesante y útil que nos caracteriza a los humanos, para
defendernos de peligros. Está regulado por el sistema límbico, fundamentalmente en la
amígdala.
Se encontraron datos que confirmaban que el miedo se aprende, y se regula la respuesta ante
el mismo, por 2 vías:
1) Ruta alta / vía cortical (amígdala izquierda): cuando algo nos da miedo, si lo
percibimos lo registran los sentidos, eso se transmite al tálamo, desde donde la
información va a la corteza, conecta con el sistema de almacenamiento sobre ese
estímulo (hipocampo, que incorpora la información a la memoria a largo plazo),
tomamos conciencia de que el estímulo es el que nos da miedo gracias a la memoria a
largo plazo, activando la amígdala (sistema límbico) y nos asustamos.

2) Ruta baja / vía subcortical (amígdala derecha): la información también puede


llegar directamente del tálamo al sistema límbico, en menos de la mitad de tiempo. El
sistema puede reaccionar con una respuesta rápida defensiva antes de que la
información llegue a la corteza cerebral. La conciencia no es indispensable.

Estímulo visual: gato.


Los ojos registran, pasan a tálamo llega a córtex occipital, luego al parietal y temporal,
alcanzando áreas sensorio-motoras y asociativas: AHÍ SE PROCESA.

No reaccionamos con miedo solo ante la información que va por la vía superior, más lenta.

Procesar información VS. Tomar conciencia de ella:


Tomar conciencia del gato requiere además ignición de su Ep TNG Espacio de trabajo
neuronal global: que la activación occipital se propague a arreas superiores
(parietotemporales y parafrontales) que las últimas retroalimenten las primeras, y esta red se
mantenga activa sincronizada en banda de frecuencia alta durante mas menos 250 ms.
Propicia la Conciencia de gato, además de inhibir interpretaciones y estímulos lo que provoca
un PCE-P300.

4.2. Condicionamiento inconsciente


Métodos para suprimir la conciencia de la contingencia EC–EI sin impedir el condicionamiento
clásico:
– Tareas concurrentes distractoras cuya ejecución exige mucha atención para impedir tomar
conciencia de la covariación EC–EI.
– Enmascarar el EC para que pase inadvertido.
– Supresión por flash continuo (SNFC) del EC.
– Manipulación de expectativas: mediante instrucciones verbales…

Enmascaramiento ausencia de atención y lesiones corticales pueden impedir la ignición del E f


TNG: no se toma de conciencia del objetivo.
Aun así, el E puede activar la corteza occipito - temporo- parietal, incluida áreas percepto-
motoras y asociativas
En el medio natural sucede con frecuencia que los eventos potencialmente dañinos se
presentan precedidos de señales. Los organismos aprenden a ligar las reacciones defensivas
vegetativas y conductuales a las señales de peligro.
Las reacciones reflejas provocadas por el miedo se pueden condicionar de forma automática
e inconsciente, al menos ante estímulos evolutivamente preparados al respecto (rostros con
expresión agresiva, serpientes, arañas…).

Öhman y colaboradores hicieron experimentos en los que recurren al enmascaramiento del EC


para impedir la toma de conciencia de su covariación con el EI. Eso no impide el desarrollo de
reacciones emocionales condicionadas ante elementos relevantes para el miedo.
En un experimento manejaron un procedimiento de entrenamiento discriminativo, con diferente
condición para cada mitad de un grupo:

1) Presentaban fotos enmascaradas, unas veces de serpientes (EC+) seguidas de


descargas suaves y otras de arañas (EC–) sin descarga.

2) Al revés: las fotos de arañas iban seguidas de descargas, pero no las de


serpientes.

En otro grupo, hicieron lo mismo con dos tipos de ECs no relevantes para el miedo: fotos de
flores y setas.

Aunque los sujetos eran incapaces de identificar los ECs presentados en estas condiciones de
enmascaramiento y, por tanto, de señalar en qué ensayos tendría lugar descarga, en el caso
de los objetos relevantes para el miedo desarrollaron un incremento de la RPG ante el EC+, en
comparación con el EC–, cosa que no sucedió con los ECs no relevantes para el miedo.

- Respuesta palpebral al margen de las expectativas (conciencia)


Hay indicios de condicionamiento automático e inconsciente de morado, no de huella.
En un experimento se manipularon las expectativas del EI generado por el EC, para ver si el
nivel de RC que produce el EC depende de las expectativas (en el procedimiento demorado vs.
de huella).
Demorado: EC – EI (Tiempo): Van seguidos y no hay ningún intervalo entre ellos. Afectado por
la historia al que ha sido sometido, contra las expectativas. El cerebelo se adapta a lo que está
pasando.
De huella: EC – EI (Tiempo) EC no está presente cuando está el EI, pero como tenemos
memoria, todavía podemos asociar ambos. Reduce la efectividad del condicionamiento. Tiene
que intervenir un sistema de memoria junto al cerebelo. Paralelo a las expectativas.

Condicionamiento palpebral
¿Se puede emparejar en personas dormidas?

EC= TONO///EI=SOPLO A OJO, MANEJARON SERIES DE 1,2,3,4 ENSAYOS DEL MISMO


TIPO: BIEN EC SOLO, BIEN EC-EI.

En cada ensayo la expectativa de que el EC le siga el EI es mayor cuanto mejor hay sido la
serie previa EC-EI, y aún mayor cuanto más grande haya sido la serie previa EC-solo. Casos
extremos la expectativa menor se dará después de una serie de 4 ensayos EC-EI; y la
mayor, después de 4 EC-solo.

Izquierda: Previsión teórica de la expectativa del EI y de la RC ante el EC, según la serie que
hubiera precedido el EC en cada ensayo.

Derecha: RCs provocadas por EC (antes de que en ese ensayo tenga lugar en el EI) según la
serie que le hubiera precedido.
También las expectativas se acomodan a las previsiones; p estimada por los SS de sufrir
chorro de aire en ensayo siguiente en función de serie previa.
LIBRO

EXPERIMENTO
También aquí, con una descarga como EI (CP demorado) encuentran dislocación entre
expectativas y RPG condicionada.
Esta asociación apoya el sistema de procesamiento dual que explica el sistema de
condicionamiento pavloviano humano.

EXPERIMENTO 2
El reflejo del párpado se puede generar mientras los niños dormían. Se les daba un soplo
(EI), con lo que cerraban más fuertemente los párpados, y el EC era música determinada. Al
despertar, el EC genera la respuesta condicionada, aunque ellos no tomaran conciencia de
ello. Solo se observa condicionamiento palpebral demorado. R- EMG provocada por EC en Gr
Exper (expuestos a un tono seguido de soplo) y Control (exposición desemparejada).

- Aprendizaje evaluativo
Respuesta de esnifar durante el sueño: esnifan más ante olores agradables que desagradables
durante sueño profundo.
B) Y C) también ante tonos (EC) emparejados con los respectivos olores, durante SWS b)
resultado global; c) curva de evolución de la RC.

d) este efecto condicionado perdura al despertar.

Condicionamiento: un buen ambiente que hacía respirar bien se asoció con un tono, un mal
ambiente con otro tono. También lo emparejaron: la situación que promovía más inhalación lo
hacía tanto durante el sueño como cuando despertaban.

- A modo de conclusión
No se produce condicionamiento indiscriminado de cualquier elemento que acompañe al EI. La
asociación entre un EC y un EI depende, además de su emparejamiento, también de su
relevancia mutua, la experiencia previa con cada uno de ellos y la presencia de otros estímulos
durante el proceso de condicionamiento. El condicionamiento pavloviano está involucrado en la
regulación de aspectos muy diversos del comportamiento, incluidos los afectivos y
motivacionales, además de las reacciones vegetativas.

Efectos neuropsicológicos asociados con condiciones subliminales de motivaciones de


apetito (EXPERIMENTO 2019)
Cuando intentamos inducir o animar a comer diciéndole explícitamente cosas como que comer
es placentero puede producir otro efecto. Esto puede ser debido a las valencias
subjetivamente negativas de la narrativa evocada por la percepción del verbo comer, borrando
cualquier cualquier tipo de valencia relacionada con el placer de comer.

En nuestro estudio presentamos verbos relacionados con comer en condiciones de


estimulación o visión subliminal para mitigar que se pongan en marcha las asociaciones
relacionadas con comer, por lo que mitigará la presentación subliminal de esos verbos, para
poner a prueba si esto funciona emparejaron verbos con términos de valencia positiva
(experimental) y neutral (control) e incrementaron incremento significativo de salivación y
hambre en aquellos grupos ligados a términos positivos. Percepción de estos verbos en la
condición en que fueron emparejados con adjetivos positivos generaban señales neurológicas
fisiológicas y conductuales de desarrollo de preferencia por esos verbos relacionados con
comer. Lo que se pretende lograr es que la persona anoréxica de manera subconsciente
desarrollase las ganas por comer.
EC: Comer, masticar, merendar, saborear
EI: Happy, rich, pleasant, lovely, wonderful, enjoyable, great
Cuando te ponen pleasant no eres consciente de qué pasa cuando te ponen la palabra comer
por ejemplo.

Condicionamiento evaluativo:

Cuando se empareja EC a EI agradable/ desagradable (no vital), se transfiere a la valencia


afectiva del EC al EI, sin que EC tenga que funcionar como señal EI: EC.

CE tiene peculiaridades diferentes al aprendizaje de señal; entre otras: parece que puede
operar de forma automática, incluso sin conciencia de contingencia entre el EC-EI.
TEMA 6: Condicionamiento Instrumental II

Control aversivo El comportamiento se ve influido también por estimulación aversiva.

Los organismos tienden a minimizar su exposición a situaciones aversivas (además de


maximizar las apetecibles).

Tratamos esta tendencia básicamente en CI de castigo (escape–evitación aparece en el


capítulo 7). El escape–evitación contribuye a aumentar la tendencia de la conducta. La omisión
o coste de respuesta también se mencionará, pues también contribuye a disminuir la conducta.

Por tanto, veremos el castigo: contingencia positiva entre una conducta y un estímulo
aversivo ulterior. Se supone que este tratamiento disminuye la probabilidad de la conducta
afectada, pudiendo llegar incluso a suprimirla por completo.

1. INTRODUCCIÓN
Técnica muy empleada y muy controvertida, por las dudas sobre su eficacia y por sus
efectos ‘colaterales’ adversos (los estímulos aversivos crean inestabilidad emocional,
agresividad…), sobre todo cuando es intenso y/o aplicado sobre conductas muy internalizadas
y difíciles de cambiar. Escasamente investigado.

Fue descubierto por la Psicología (Thorndike, siglo XIX; Skinner, siglo XX). Sin embargo, ya
existía y los humanos hacían uso de él desde siempre. Castigaban aquello que querían que se
dejara de hacer, para regular la conducta del entorno.

Hace 100 años nadie discutía su uso, pero hoy en día sí. Hay autores que afirman que el
castigo no funciona tan bien como la recompensa, no tiene efectos duraderos. Al dejar de
castigar la conducta, esta vuelve a llevarse a cabo.

Para educar no se puede recurrir al castigo. Se plantea si los padres pueden acudir al castigo
para educar a sus hijos. Legalmente no está permitido.

Actualidad: Condena al castigo. Condenada dos años de cárcel una maestra por agredir a sus
alumnos. Los niños, de dos años, sufrieron expresiones impropias tirones y algún bofetón o
cachete en una guardería de Castellón.

El castigo nunca desaparecerá de la faz de la tierra. Israel estrena una doctrina de castigos u
premios colectivos en Cisjordania. Se podrían señalar miles de ejemplos en diferentes ámbitos
y situaciones. El recurso al castigo parece una tendencia natural, cuando se trata de combatir
conductas indeseables en el ámbito social.
Campaña de tráfico 2019

Castigar la conducción temeraria o indebida con experiencias desagradables (ej.: pagar una
multa, quitar puntos…)

- ¿Carece de eficacia el castigo?


Basándose en unos pequeños experimentos con sujetos humanos, Thorndike sostuvo que el
castigo no constituye un procedimiento eficaz para producir reducciones importantes y
duraderas en la conducta, por lo que consideraba que no debía emplearse.

Skinner llegó a la conclusión de que no funcionaba bien, pues las conductas castigadas
tendían a desaparecer mientras se castigaban, pero si se deja de aplicar el castigo la
conducta reaparece. El castigo no suprime las conductas.

En su investigación experimental, primero se establece una respuesta instrumental y luego


se castiga. Aunque al principio el castigo resultó efectivo (redujo de forma notable la emisión
de la conducta instrumental mientras era aplicado e incluso a lo largo del resto de la primera
sesión de prueba experimental), solo produjo una reducción transitoria de la conducta
sancionada, mientras era manejado. Se desvaneció su efecto bastante pronto al dejar de
ser aplicado.

Defendió el uso de las otras técnicas

Por ejemplo: animales aprenden a pulsar una palanca para conseguir comida
(condicionamiento Instrumental de recompensa). Después castigan su conducta en un grupo y
no en otro. Miran cómo evoluciona su conducta en el grupo experimental (castigo) y en el
control (no castigo).

Al principio conseguían comida y luego ya no recibían comida y encima eran castigados. Si


quieres eliminar la conducta basta con extinguirla, sin aplicar castigo. No es efectivo aplicar el
castigo a menos que lo mantengas en el tiempo y tiene consecuencias que no son buenas.
2. FACTORES QUE AFECTAN A SU EFECTIVIDAD
La eficacia del castigo, aun siendo relativamente limitada, depende de diversos factores.
- Intensidad
- Demora
- Programa
- Control por el estímulo
- Motivación
- Refuerzo de conductas alternativas
- Explicación
- Factores personales: ej. La psicopatía: niveles bajos de serotonina en áreas corticales
prefrontales, carácter compulsivo (en animales).
a) Intensidad Influencia compleja.
Cuanto más intenso, más efectivo, pero también más efectos ‘colaterales’ indeseables. Si
el castigo es suficientemente intenso, incluso su aplicación durante un breve periodo transitorio
puede generar una supresión importante y duradera de la conducta.

Se pensó que una alternativa para eliminar una conducta sería empezar con castigos tenues.
Si no es suficiente con ellos, se aumenta la intensidad. Esta es una estrategia nefasta porque
tiende a generar inmunización, de modo que pierden efectividad incluso castigos intensos.
Cada vez lo castigas más, pero él cada vez aguanta más. En dos grupos en el que
directamente se aplica la intensidad 6 tendrá más efecto que en aquellos en los que se le va
aplicando poco a poco, que necesitarán una intensidad bastante más alta por hacerse
inmunes.

Por el contrario, comenzar con castigos intensos puede producir sensibilización, también
con sus correspondientes efectos: positivos y negativos. Incrementa el impacto de castigos
más leves posteriores.

La idea es: castigo mínimo suficiente para eliminar la conducta.

b) Demora
Perjudica su eficacia. Recompensas demoradas restan valor incentivo a las recompensas, y lo
mismo ocurre con los castigos. A más retaso de las consecuencias punitivas, menor
supresión de la conducta que las provoca. Además, la caída del valor aversivo de los
castigos con la demora parece seguir también una función hiperbólica.

Experimento: se podían emitir 2 respuestas (R1 y R2) para conseguir comida. A su vez, se
manejaron 2 condiciones experimentales:
1) R1: castigo pequeño con demora de 2 segundos. R2: castigo grande con demora de 12
segundos.
2) R1: castigo pequeño con demora de 40 segundos. R2: castigo grande con demora de 50
segundos.

La preferencia depende de la demora relativa.


1) Preferían R2 en el 65% de los casos. El menor es muy inmediato.
2) Preferían R1 en el 60% de los casos. Como las dos son relativamente tardías, optan por el
castigo de menor intensidad.

Tiene mayor valor aversivo un castigo inmediato, y afecta más a la conducta. Preferimos
evitar un castigo inmediato, aunque sea pequeño, y que nos apliquen uno mayor más tarde;
salvo que la demora del pequeño también sea grande.

Al establecer la preferencia entre dos castigos de intensidad y demora diferentes, tiende a


incidir más la diferencia entre sus intensidades que entre sus demoras, si se trata de castigos
muy diferidos: se opta por el pequeño, aunque vaya a tener lugar antes que el grande. Sin
embargo, con castigos más inmediatos tiende a predominar el peso de la diferencia entre sus
demoras: se opta por el menos inminente, aunque sea mayor.

Pregunta de examen:
Cuando se trata de optar entre una R para conseguir comida que conlleva castigo pequeño con
demora pequeña y otra R que conlleva castigo mayor y más diferido hemos visto que se
prefiere la R que conlleva castigo con demora más pequeños.
a) Siempre
b) Cando ambas demoras son relativamente pequeñas
c) Cuando ambas demoras son relativamente grandes

c) Programa de aplicación

¿Qué programas son más eficaces: los de refuerzo continuo o parcial?

Para que una conducta se mantenga a lo largo del tiempo, el programa parcial es el más
efectivo para las recompensas. Sin embargo, para el castigo ocurre lo contrario: se debe
castigar siempre: castigo sistemático, equivalente al refuerzo continuo.
Los castigos aplicados con programa de refuerzo continuo son más eficaces para eliminar la
conducta.

Dentro de ellos, su eficacia depende de la razón con la que se apliquen, y del programa con el
que se vea (o haya visto) reforzada la conducta objeto del castigo. Cuanto más pequeña la
razón (cuanto más consistente su manejo), mayor supresión de la conducta.

d) Control por el estímulo


En presencia de una señal no se lleva a cabo una conducta, pero fuera de ella no es
castigado y la ejecuta.

La asociación de una conducta con castigo puede verse ligada a un contexto o señal: castigo
discriminado, con supresión selectiva.

En ocasiones es útil, pero en otras es contraproducente.

Por ejemplo: no dejar que el niño hable en alto cuando estás en la iglesia, pero no fuera de
ese contexto.

e) Motivación y vías alternativas de satisfacción


Las conductas muy arraigadas y con motivación fuerte resultan más difíciles de suprimir,
sobre todo si no se dispone de alternativas para satisfacer el impulso que las promueve.

Los castigos suprimen más fácilmente nuestras conductas poco arraigadas y reemplazables
que las vitales.

f) Refuerzo de conductas alternativas


Si son alternativas e incompatibles, se impondrán las reforzadas.

Ejemplo: Si quieres que tu hijo no se muerda las uñas, aparte de castigarle poniéndole
pintauñas de mal sabor, se le premia por bailar sevillanas, ya que no puedes estar bailando y
mordiéndote a las uñas a la vez.

g) Explicación
La capacidad cognitiva y lingüística de las personas también juega un papel importante en el
funcionamiento del castigo. Los niños son más afectados por castigos justos, que reciban
explicaciones.
Ayudan a precisar la conducta castigada y a justificar el uso del castigo. Además, las
explicaciones juegan un papel importante en el desarrollo moral durante la infancia. Cuando un
niño actúa de manera inapropiada, si se le explican las consecuencias negativas además de
reprocharle su actuación, es más probable que desarrolle empatía hacia los demás y acepte
las responsabilidades de su propia conducta.

h) Factores personales ¡¡(NO ESTÁ EN EL LIBRO)!!


- Psicópatas:
Se hizo una investigación en Canadá: “Los psicópatas no aprenden del castigo”. Charles
Manson y su “familia” cometieron una serie de asesinatos a finales de los sesenta. Manson
cumple cadena perpetua.
Los psicópatas condenados por delitos graves muestran una actividad cerebral diferente al
resto de personas, incluidos otros asesinos. El escáner cerebral a una treintena de criminales
muestra que los afectados por psicopatía presentan anomalías en las estructuras cerebrales
implicadas en el aprendizaje: cíngulo anterior (comportamientos aceptables, no aceptables,
toma de decisiones…).

Pueden aprender de las recompensas; parecen incapaces de hacerlo con el castigo (los
errores).

“Los criminales con psicopatía podrían considerar solo las posibles consecuencias positivas y
fallarían al valorar la posibilidad de un resultado negativo”. Es como si no aprendieran de los
castigos o errores. “El castigo indica la necesidad de cambiar la conducta. En determinadas
situaciones, estos criminales tienen dificultad para aprender del castigo para modificar su
conducta”. No se trataría solo de falta de empatía hacia los demás, es que tienen un déficit
neurológico por lo que no les funciona con normalidad la tendencia de asociar los errores con
los castigamos que recibimos cuando realizamos dichos errores.

- Consumo adictivo de drogas cuando pasa a ser castigado


Investigación experimental en ratones (Everitt, 2014). Después de una larga historia de
consumo de cocaína, los animales con nivel marcadamente reducido de serotonina en áreas
corticales prefrontales (el 20% de sujetos) continúan consumiéndola, aunque el consumo
pase a ser castigado, cosa que no sucede con el resto de animales (80%).

Cuando la respuesta que proporcionaba droga durante las 4 sesiones de línea base dejaba de
proporcionarla el 50% de las veces y el otro 50% era castigada (al azar), si su historia de
consumo había sido corta suprimía la respuesta en todos los animales, pero si había sido
larga, el 20% de animales con nivel bajo de serotonina seguía realizando la respuesta
(consumo compulsivo).

El castigo implica aprendizaje acerca de las relaciones entre la conducta y sus


consecuencias adversas. Ese aprendizaje se ve interrumpido en desordenes psiquiátricos
tales como las adicciones, la depresión y la psicopatía. Mostramos que los procesos mal
adaptativos al castigo están implicados en adicciones en desordenes de control de los
impulsos en la psicopatía en la ansiedad ye n la depresión lo que argumenta que una mejor
comprensión celular y del circuito de los mecanismos cognitivos del castigo harán
contribuciones importantes en las próximas generaciones en los enfoques terapéuticos.

3. DAÑOS ‘COLATERALES’: EL DILEMA DEL CASTIGO

Sobre todo, los castigos intensos y persistentes a conductas muy arraigadas. Cuanto más
indispensable es la conducta castigada, más fastidia que nos castiguen; igual a menor número
de conductas alternativas.

- Dolor físico.

- Ansiedad y miedo: puede empobrecer el rendimiento.


- Agresividad:

– Provocada por el dolor: en especies pacíficas, cuando pasan a ser castigadas con
frecuencia se observan conductas agresivas que son poco frecuentes.

– Modelo de comportamiento agresivo: si nos enseñan castigando, aprenderemos y


llevaremos a cabo las mismas conductas agresivas que hicieron con nosotros
(aprendizaje vicario). Los niños ven, los niños hacen. Aprendizaje vicario o por
imitación de los modelos.

También se pueden producir alteraciones de la atención, rechazo de las situaciones


asociadas con esas emociones o indefensión.

Realmente, dado que la indefensión aprendida se trata de que no se puede evitar el


castigo, no se considera condicionamiento instrumental. El condicionamiento instrumental
es el efecto de las consecuencias sobre las conductas que realizamos. Pero aquí solo hay
castigos con independencia del comportamiento, no se pueden evitar.

Un último inconveniente del castigo es que se aplica a una conducta ya realizada. No sirve
para evitar el episodio conductual castigado, sino solo por sus efectos disuasorios de cara al
futuro para que no se vuelva a repetir. Pero, incluso de cara al futuro, el castigo por sí mismo
no fortalece directamente la emisión de una conducta apropiada.

Realmente, dado que la indefensión aprendida se trata de que no se puede evitar el castigo,
no se considera condicionamiento instrumental.

El condicionamiento instrumental es el efecto de las consecuencias sobre las conductas que


realizamos. Pero aquí solo hay castigos con independencia del comportamiento, no se pueden
evitar.
TEMA 7: Implicaciones Prácticas y Aplicaciones derivadas del condicionamiento

1. Aplicaciones derivadas del condicionamiento pavloviano


a. Terapia de conducta: DS, TE y TA
b. Otras aplicaciones: publicidad

2. Aplicaciones derivadas del Condicionamiento Operante


a. Introducción de conductas (adaptativas): ámbito escolar, familiar, laboral
y clínico.
b. Supresión de conductas (disfuncionales): extinción, RCI, omisión y
castigo.

1. APLICACIONES DERIVADAS DEL CONDICIONAMIENTO CLÁSICO / PAVLOVIANO


Origen de las técnicas derivadas del Condicionamiento:

- Investigación básica contra la incidencia en situaciones naturales. Se preguntan si el


condicionamiento puede modificar conductas naturales en personas en el medio ecológico.

- Muchas conductas, incluidas algunas patológicas, se consideran aprendidas mediante


condicionamiento y, por tanto, susceptibles de ser modificadas mediante condicionamiento
(por ejemplo, fobias, miedos, síndrome de estrés postraumático, aversiones, efectos de las
drogas, etc.).

- Las aplicaciones derivadas del condicionamiento clásico están más centradas en el ámbito
clínico (terapia de conducta, integrada en la terapia cognitivo–conductual), aunque también se
utiliza en publicidad y en medicina, ocasionalmente; y las del condicionamiento
instrumental más abiertas a la influencia sobre la conducta en general (modificación de
conducta), en la vida cotidiana, el ámbito académico, el ámbito social…

- Ambas corrientes surgieron casi a la vez, en torno a mediados del siglo XX (el uso
sistemático y riguroso científicamente).

Pavlov pensaba que el aprendizaje resultaba, en gran medida, del establecimiento de nuevas
conexiones nerviosas.
La elaboración formal de estrategias aplicadas inspiradas en el condicionamiento pavloviano se
produjo en torno a mediados de la década de 1950, casi a la vez que las técnicas basadas en
el condicionamiento operante, pese a que la investigación de este último (promovida
principalmente por Skinner) fue muy posterior a las aportaciones de Pavlov.

1.1. Terapia de conducta: DS, TE y TA


-Antecedentes

El caso del pequeño Albert, aportado por Watson y Rayner: trabajo sobre el desarrollo del
miedo y su ulterior supresión (frustrada, en este caso). Se le sometió a desarrollo de respuesta
de miedo a elementos que no se lo producían previamente. Al niño le gustaban animales
(ratones, conejos…), pero cuando comenzó a presentarles esos animales y a hacer sonar un
gong intenso cuando se le acercaba uno de ellos de forma que lo asustaba, comenzó a
alejarse de los animales y mostrar respuesta de miedo ante ellos. Esto se debía a un proceso
de asociación de los animales con un sonido desagradable. Además, ese miedo se
generalizó a otros animales que compartían propiedades con los utilizados. No puso en
práctica la fase de corrección, o terapia, de los miedos.

Mª C. Jones, 25 años después, llevó a cabo una experiencia parecida con otro niño y luego lo
sometió a corrección de ese miedo: lo expuso a los elementos que le producían miedo mientras
experimentaba sensaciones agradables. Además, intentó potenciar los beneficios de esta
técnica con los del aprendizaje observacional (modelado): aplicó el contracondicionamiento
en presencia de otros niños que mostraban atracción por los animales. Hizo un informe más
riguroso y publicó un artículo, al contrario que Watson. Observó que el miedo del niño
disminuía progresivamente: primero soportaba cada vez su presencia más cercana, después
los buscó de forma activa.

Después, Wolpe creó la desensibilización sistemática (DS). Finalmente, Eysenck y él


desarrollaron en Londres otras técnicas, llamadas en conjunto terapia de conducta (TC).
Desde esta corriente, se considera que algunos miedos tienen un origen aprendido: posible
origen y pervivencia condicionada de algunas fobias; sensibles, por tanto, a la terapia de
conducta y, en particular, a la desensibilización sistemática.

La fobia puede haber surgido mediante condicionamiento pavloviano y luego mantenerse


por condicionamiento instrumental de escape / evitación: la evitación del objeto del miedo
proporciona un refuerzo negativo. Una vez se ha asociado el EC con una experiencia
desagradable, el EC induce ansiedad y la persona comienza a evitar la situación en cuestión.
Esa conducta de evitación es negativamente reforzada (condicionamiento instrumental)
porque reduce la ansiedad.

a. Desensibilización sistemática (DS)


Primera técnica. Para eliminar los miedos de los pacientes, se les exponía de forma gradual a
los objetos y situaciones fóbicas para que comprobaran que no pasaba nada en su presencia.
Posteriormente se agregó otro elemento: los pacientes realizaban alguna actividad o
alcanzaban algún estado incompatible con el temor, que lo inhibiera (relajación) mientras eran
expuestos a los objetos inductores de miedo.

A partir del contracondicionamiento, maneja el principio de la inhibición recíproca. Recurre


a imágenes mentales, aunque también se puede manejar desensibilización sistemática in vivo.

Consiste en 3 componentes:
1) Entrenamiento en técnicas de relajación de los sujetos.

2) Jerarquía de ansiedad: describir, de menos a más, las situaciones que disparan una fobia,
para ordenarlas y enfrentarlas en ese orden.
3) Afrontamiento progresivo y sostenido (imaginario o en vivo) de cada componente de la
jerarquía de ansiedad en estado de relajación. Aplicar la DS consiste en imaginarte a ti mismo
en la situación, al mismo tiempo que te aplican las técnicas de relajación. De esa manera, si
puedes imaginarlo sin perder la tranquilidad pasas al siguiente componente de la jerarquía.
Finalmente, se deben aplicar las técnicas de relajación en la propia situación.

Esta técnica contribuye a superar miedos patológicos, sobre todo cuando se trata de fobias
desencadenadas por escenas y objetos específicos. Pero no hay acuerdo en que responda
solo a procesos de condicionamiento y, menos aún, solo a operaciones de
contracondicionamiento.

Algunos investigadores (Eysenck, 1976) sostienen que la DS es un simple fenómeno de


extinción, en el que el temor al EC disminuye de manera progresiva por ser expuesto
reiteradamente en ausencia del EI (experiencia traumática original). Evidencia a favor de esta
explicación: la relajación no siempre es necesaria para que el tratamiento resulte efectivo,
sino que muchas veces es suficiente la exposición gradual al objeto temido. Por eso, es
probable que en la DS intervengan dos mecanismos: contracondicionamiento y extinción.

b. Técnica de la exposición (TE)


También especialmente apta para los temores condicionados, incluso es útil para tratar el
desorden de estrés postraumático y algunos trastornos obsesivo–compulsivos en los que
intervienen elementos inductores de ansiedad. Es el fenómeno de la extinción.

Pretende extinguir el miedo al objeto fóbico (EC) mediante su exposición reiterada, masiva
y prolongada, en condiciones de seguridad, sin que el paciente la pueda eludir (para no dar
lugar a refuerzo negativo de la conducta de escape–evitación). También existe versión
imaginaria y en vivo, e incluso mediante realidad virtual.

Si ese miedo surgió por alguna situación aversiva, la persona buscará coartadas para evitarla y
no vencerá la fobia. Esta técnica consiste en someter al paciente a la exposición directa y
real del EC sin el EI (experiencia que desencadenó el miedo). De esa manera, tiende a
extinguirse la respuesta de miedo al EC por no ir acompañado de evento traumático que lo
justifique.

Se utiliza más que la desensibilización sistemática, sobre todo en fobias. Sin embargo, en
ocasiones puede acarrear complicaciones o no resultar efectivo (sobre todo en pacientes con
estrés postraumático o un historial de otros desórdenes psiquiátricos). Es más arriesgado que
la DS.

¿También la exposición subliminal?


Si puede tener lugar condicionamiento clásico de forma inconsciente, la técnica de la
exposición también puede operar de esa manera.

Se llevaron a cabo una serie de experimentos en los que trabajan con la técnica de exposición
con personas que tienen fobia a animales. Se les expone a esos animales, lo que hace que se
supere cada vez más la conducta de evitación.

La exposición repetida durante 25 milisegundos a imágenes enmascaradas de arañas


también reduce en fóbicos la conducta de evitación (a tarántula en una caja), sin aumentar la
ansiedad. La ventaja es que hace sufrir menos, pues los sujetos no son conscientes de que
el estímulo haya sido presentado.

Se comprobó en la exposición in vivo al objeto del miedo. Los efectos son duraderos,
persistían incluso pasado un año.
Han analizado los cambios que produce esa exposición encubierta. Investigaron la base neural
de los efectos adaptativos de las exposiciones enmascaradas a estímulos fóbicos. La
exposición a arañas enmascaradas activó zonas del cerebro encargadas de procesamiento del
miedo más en fóbicos.

¿Ciencia ficción o sofistica ingeniería psico-neurológica?


Reducción del miedo sin miedo a través del reforzamiento de la actividad neural que
sobrepasa la exposición consciente.
El miedo condicionado es un proceso fundamentalmente importante y preservado en todas las
especies. En los humanos está ligado a desórdenes relacionados con el miedo tales como
fobias y síndrome de estrés postaraumático (PTSD). Los recuerdos del miedo pueden ser
reducidos mediante contracondicionamiento, en el que el estímulo condicionado de miedo
(CS+s) está repetidamente reforzado con recompensa o con un nuevo estímulo no
amenazante. Sin embargo, este procedimiento incluye una presentación explícita de CSS+s,
que es aversivo por sí mismo antes de que el miedo sea eliminado satisfactoriamente. Esta
aversión puede ser un problema cuando se intenten traducir estos paradigmas experimentales
en ajustes clínicos. Esto aumenta la pregunta fundamental de si la exposición explícita a
objetos temidos es necesaria para la reducción del miedo.

Aunque aprendemos sin estímulos explícitos…(fMRI) señales en ausencia de la presentación


de estímulos. fMRI neurofeedback.

Mostramos que podemos reducir el miedo mediante CS+s mediante la asociación de


recompensas con los patrones de activación ¡FALTA COMPLETAR!

- Condicionan miedo a dos EC+, emparejando cada uno de ellos con el EI. Se registra
la IRMf característica de cada uno de esos ECs.
- Luego, bajo la coartada de que realicen el esfuerzo mental de aumentar el tamaño de
un disco ilusorio al que son expuestos (que manipulan los experimentadores).
- Los refuerzan cuando el patrón de IRMf es similar a la de un EC+.
- Esto reduce miedo a este EC, sin necesidad de exponerlos a él.

Thibault et al 2018: Neurofeedback con IRMf.

También la exposición al contexto (olor) del EC+ (emparejado con el EI descarga) durante
fase de sueño profundo contribuyó a la extinción de REC.
Haunner et al., 2013

- El curso de la asociación
No se puede olvidar el fenómeno de la recuperación espontánea.

Hay un problema con esta técnica. La exposición es el efecto que tiene el hecho de aplicar el
EC sin que vaya acompañado del EI. De esa manera, el EC pierde la capacidad de provocar
miedo: se reduce la RC de forma progresiva hasta desaparecer.

Cuando se aplica la extinción, si pasado un tiempo después de que haya desaparecido la


respuesta se vuelve a presentar el EC, en ocasiones se observa reaparición del miedo
condicionado.

Curva característica del condicionamiento pavloviano: incrementos graduales negativamente


acelerados.
– ¿Resulta reversible? Sí y no.
– La extinción de la RC no resulta solo de la destrucción de la asociación, como indica la
recuperación espontánea.
- Nueva técnica para combatir la recuperación espontánea
La memoria a largo plazo (MLP) es el registro y retención de una experiencia cuando esta ya
ha desaparecido. Es necesario que se dé la consolidación: consiste en que la información se
codifique en el sistema mnésico para poder recuperarlo; una vez consolidada, perdura
indefinidamente.

La técnica parte de la idea de que registros de memoria a largo plazo (MLP) no son fijos, sino
que se tornan lábiles cada vez que se activan, por lo que requieren re–consolidación. Esto
sirve para actualizar el registro: integrar la información nueva y adaptarse según las
circunstancias. Se buscó la forma de cambiar, mediante tratamiento psicológico, la carga
emocional de registros de eventos consolidados. Al volver a activar ese recuerdo y tornarlo
lábil, se hace que no se reconsolide sino que se borre, evitando que vuelva a aparecer más
tarde. Se corrige el registro de miedo anterior.

Trabajan con eventos que adquieren una carga emocional mediante condicionamiento
pavloviano, que pretenden suprimir mediante extinción de la respuesta condicionada (terapia
de exposición), sin que se produzca recuperación espontánea.

Se sometía a animales a condicionamiento de miedo. Después, se les exponía una última vez
a un ensayo de presentación de EC con EI (activación del recuerdo en la MLP) y se les
aplicaba un fármaco para que no pudieran reconsolidar la información. En ese caso, se
extinguía el miedo condicionado y no aparecía. Sin embargo, el fármaco no se aplicó con
humanos y se trató de desarrollar una técnica: la presente.

Consiste en combatir la recuperación espontánea del miedo condicionado mediante


mecanismos de actualización y extinción de la huella mnésica durante la re–consolidación.

IDEAS PREVIAS

- CP miedo

- Extinción: pérdida de la capacidad del EC de provocar RC cuando se presenta sin él. Pero,
Recuperación (expontánea) de la RC.

- Consolidación: proceso mediante el que se estabilizan los registros mnésicos a través de a


correspondiente plasmación sináptica por la síntesis de ciertas proteínas, y que requiere
algunas horas: ventana de consolidación de la MLP. Mientras no concluye, el registro resulta
inestable.

- Reconsolidación: últimamente se ha planteado que los trazos de memoria consolidados


pueden tornarse lábiles mediante su reactivación. Esto permite que se actualicen (integren
nueva información, potencien, bloqueen…) lo que también necesita re–consolidarse.

Se puede destruir la asociación EC–EI activándola e impidiendo la re–consolidación.

Trabajo de Schiller (2010) y numerosos trabajos anteriores y, sobre todo, posteriores:


- Condicionan miedo a un EC.

- La memoria de un miedo condicionado resulta lábil, hasta que se consolida, gracias a las
exposiciones EC–EI y el paso del tiempo.

- Al recuperarla posteriormente con un nuevo ensayo EC–EI entra en nuevo periodo lábil (fase
de re– consolidación), que permite actualizarla (por ejemplo, potenciarla, pero también
bloquearla).

- Se ha procedido a bloquear la re–consolidación mediante fármacos inhibidores de la


síntesis de proteínas, pero su uso no es seguro.

- Investigaciones recientes lograron bloquearla mediante tratamiento de extinción antes de la


re– consolidación.

- Esto puede resultar útil para extinguir un viejo miedo condicionado (ya consolidado) sin que
se vuelva a recuperar.

La extinción durante la re–consolidación previene al recuperación espontánea de miedo


extinguido. Trabajaron con 3 grupos experimentales humanos, 3 días.

Día 1: condicionamiento pavloviano de miedo (discriminativo):

– EC+ → EI (descarga).

– EC–

Desarrollan miedo al EC+, y no al otro.

Día 2: extinción. Se sometió al EC+ varias veces sin el EI.

– Grupo 1: recibió un ensayo EC+ → EI 10


minutos antes para tornar lábil su asociación
en el momento del tratamiento de extinción.

– Grupo 2: ensayo 6 horas antes, la extinción


se aplicaba cuando ya se había completado la
consolidación.

– Grupo 3: no se le expuso a ensayo de


refresco. La RC desapareció.

Día 3: re–extinción. Exposición al EC+ sin el


EI. Para estimar la recuperación espontánea.
Diferencia en la respuesta condicionada de
miedo entre el EC+, emparejado con el EI, y el
EC no emparejado. La extinción funcionó,
pues el EC+ y el EC provocaban la misma
respuesta.

Solo no reapareció la respuesta de miedo


en el grupo 1 (no hubo recuperación
espontánea de la RC). Aplicarle la extinción
tras esos 10 minutos hizo que se extinguiera
la asociación del EC+ con el EI, y no reapareció la respuesta de miedo condicionada.

Se hizo una estimación un año más tarde y se seguía manteniendo.

Índice de restablecimiento: diferencia en RC de miedo (EC+ menos EC-) entre final 3 dia y 1
año después.
Un año después persistía bloqueo de RC producido por extinción durante la reconsolidación
en grupo 10 min, en comparación con otros 2 grupos.

Xue y Col (2012): tratamiento psicológico en ratas y personas sobre síndrome de abstinencia
ante EC asociado a droga. Aplicación del mismo fenómeno por otro equipo y otro país con otro
estímulo, el condicionamiento del uso de drogas.

Otras investigaciones posteriores, manejando registros conductuales y neurológicos, replican y


amplían este tipo de observaciones en animales y personas, con tratamiento farmacológico.

EXPERIMENTO (2015) Efectos sobre el síndrome de abstinencia y serbos atencionales


sobre la exposición breve relacionadas con claves del consumo de alcohol.
Si la exposición prolongada a las claves relacionadas con el consumo de alcohol produce
mayor efecto que las breves.

Les exponen al olor de una copa de cerveza para ver si tienen síndrome de abstinencia. No
encontraron que una exposición breve no cambiaba un efecto distinto en esa sensación. No
desaparecía con una disposición prolongada que con una breve. Ç

Técnica de exposición aplicada a los EC asociados con el alcohol- EXPERIMENTO (2019)


Exponer a las personas a esa situación fóbica de manera repetida y directa no progresiva,
afrotándola de lleno una y otra vez, asegurándose de que no vuelva a ocurrir la experiencia
adversa o el ataque o cualquier cosa que haya sido causa de asociar eso con el ataque y que
generó fobia.
Identificando disparadores del síndrome de abstinencia de alcohol para desarrollar un
tratamiento efectivo mediante realidad virtual para la terapia de exposición a las drogas.

El contexto, compañías, lugar donde se suele consumir alcohol o drogas, hacen que se dispare
el síndrome de abstinencia. El contexto nos dispara una reacción preparatoria para que se
prepare esa situación. EC → EI. Reacción compensatoria.

Trabajan con adultos aclcohólicos y con realidad virtual para manejar contextos más globales y
realistas de claves vinculadas al uso de alcohol.

Encuentran que ciertos ambientes por la noche en fin de semana, así como ciertos estados de
ánimo disparan el síndrome de abstinencia.

Es parte de un proyecto más amplio para validar la terapia de exposición a las claves
mediante realidad virtual.

c. Terapia aversiva (TA)

Las alteraciones conductuales, en este caso, derivan de que algunos elementos resultan
excesiva e inadecuadamente atractivos (consumo excesivo de alcohol, tabaco u otras drogas;
comportamientos sexuales abusivos). Una forma de combatir esos problemas conductuales
consiste en restar atractivo a los estímulos.

Relacionada con la aversión adquirida a sabores, fue empleada por Plinio y en la URSS.

Procedimientos encaminados a transformar en aversivos estímulos y sustancias que


inducen a consumos abusivos para combatir esas conductas.

Fobias: te da miedo un estímulo por el que no deberías tenerlo.


- Alcoholismo
OTRO EXPERIMENTO: Emparejar la visión, olor y sabor de las bebidas alcohólicas con las
náuseas producidas por alguna sustancia vomitiva (emetina, litio…). En cuanto a eficacia,
aunque este tratamiento tiene complicaciones y riesgo de recaída al abandonar el ámbito
hospitalario, se ha mostrado efectivo como parte de una intervención terapéutica más amplia.

- Tabaquismo
Procedimiento de ‘fumar rápido’: el paciente fuma de forma compulsiva e inhalando el humo
cada pocos segundos para asociar el tabaco con las náuseas producidas por la propia nicotina.
Es un tratamiento bastante estresante y suele producir incremento de la tasa cardíaca, por lo
que debe ser empleado con precaución y bajo supervisión profesional.

- Sensibilización encubierta
Se recurre a estímulos aversivos imaginarios.

- Medios de comunicación
Se manejan imágenes repulsivas para combatir diferentes comportamientos peligrosos.

Ejemplo: esquelas e imágenes para que se asocie el tabaco con sus efectos letales.
Demarketing (fumar puede ser causa de una muerte lenta y dolorosa).

En este tipo de tratamientos interviene el condicionamiento operante, además del pavloviano.


Se intenta asociar el consumo con sensaciones y consecuencias negativas.

Actitud hacia pasta de dientes, en función de sus emparejamientos con imágenes

INHIBICIÓN LATENTE

1.2. Otras aplicaciones


Aplicaciones médicas
- Drogas psicoactivas
El consumo reiterado de drogas psicoactivas puede provocar condicionamiento de las
reacciones compensatorias respecto a las claves contextuales que acompañan
habitualmente el consumo. Por eso, la presencia de esas claves tiende a potenciar el
síndrome de abstinencia en ausencia de las drogas.

Esto significa que, a la hora de tratar las drogodependencias, conviene tener en cuenta las
claves contextuales condicionadas, para evitar recaídas en el consumo durante el proceso de
desintoxicación. Al fin y al cabo, aun habiendo superado la dependencia en un ambiente
distinto al del consumo habitual, el reencuentro posterior de las señales críticas puede
desencadenar síndrome de abstinencia.

Interesa superar la dependencia en presencia de las claves asociadas con el consumo de la


droga.

El procedimiento de exposición a las claves es efectivo, al menos como complemento de otros


tratamientos más convencionales, sobre todo si se lleva a cabo en diferentes contextos entre
los que se incluya el de adquisición. Eso favorece la supresión de las reacciones
condicionadas compensatorias ante las claves de las drogas.

Sistema inmunitario
El condicionamiento pavloviano puede potenciar la eficacia del tratamiento con dosis
subterapéuticas del inmunosupresor CsA en ratones que sufrían lupus. El condicionamiento
ayudó a alargar la supervivencia de estos animales con hiperfuncionamiento patológico de
su sistema inmunitario. El EC previamente emparejado con la sustancia inmunosupresora
incrementó más de 100 días la supervivencia del 20% de los animales tratados.
Sin embargo, a este respecto no existen datos clínicos de investigación experimental humana.
Sí existen evidencias experimentales de potenciación inmunológica condicionada en personas
sanas, así como estudios que sugieren cambios condicionados en parámetros inmunológicos
relevantes para personas con cáncer.
El condicionamiento humano podría modificar la evolución de la patología.

- Publicidad
El condicionamiento de actitudes, preferencias, valor afectivo de las cosas o estados
motivacionales puede tener importancia a la hora de configurar la imagen de marcas y
productos comerciales a través de la publicidad.
Cuando se empareja un producto con personas, términos, imágenes, música y escenas
altamente positivas, se espera que los sentimientos y emociones favorables provocados por
estos eventos se transfieran al producto y potencien su imagen. Y si una empresa logra una
imagen de marca positiva, aumenta la probabilidad de que los consumidores elijan su producto.

Se refuerza un producto con una imagen atractiva. Tiene que ver con el condicionamiento
evaluativo.

Una cosa es que muchos anuncios puedan responder a una disposición de elementos propicia
para el desarrollo del condicionamiento, y otra muy distinta es verificar la operación real y
efectiva del proceso.

Stuart, Shimp y Engle (1987) realizaron experimentos en los que analizaron diferentes
aspectos; entre ellos, el efecto del número de emparejamientos entre el producto comercial
(EC) y los estímulos positivos (EI), el efecto de la disposición cronológica entre ellos o el de la
pre–exposición al producto (fenómeno de inhibición latente).
– Producto: marca de pasta dental.
– Elemento reforzante: escenas naturales atractivas.

Efecto del número de ensayos de adquisición


Según el grupo experimental, 1, 3, 10 ó 20 emparejamientos EC–EI. Para encubrir el propósito
de la investigación, estos ensayos se intercalaban entre otros de relleno en los que se
presentaban otras marcas de diferentes productos junto con imágenes neutras.

Los integrantes de los grupos de control veían los mismos elementos, pero dispuestos de
forma aleatoria, por lo que la pasta dental no resultaba emparejada preferentemente con
escenas atractivas.
A continuación, pedían a los participantes que evaluaran en diversos aspectos las marcas
manejadas.

La valoración de la marca emparejada con las escenas agradables se ve potenciada, sobre


todo en los grupos con más emparejamientos.

- Disposición cronológica de los elementos


La disposición proactiva (condicionamiento demorado: pasta–escenas) resultaba más
eficaz que la retroactiva (condicionamiento hacia atrás: escenas–pasta).

- Preexposición al producto
Reduce su condicionamiento, aunque no lo suprime del todo.
– Potenciación mediante condicionamiento evaluativo de la actitud hacia marcas ya
muy conocidas, emparejándolas con palabras e imágenes positivas, aunque solo en
los participantes que no tenían una preferencia fuerte por las mismas.

– Potenciación tanto la evaluación como la elección de marcas emparejándolas con


contenidos humorísticos.

– Los efectos condicionados muestran una persistencia notable.


– Tendencia a generalizar los efectos a productos relacionados con los
condicionados.

– Incidencia del condicionamiento incluso cuando los participantes no prestaban


atención a los emparejamientos.

2. APLICACIONES DERIVADAS DEL CONDICIONAMIENTO INSTRUMENTAL / OPERANTE


Aun siendo antiguo el uso de refuerzos, su aplicación sistemática y profesional en modificación
de conducta con niños autistas, pacientes psicóticos y con otras alteraciones: para combatir el
consumo de drogas y otros remedios… comenzó en la década de 1950 gracias a la influencia
de los trabajos de Skinner, quien consideraba que muchas conductas inapropiadas se
producen porque son reforzadas, en tanto que otras conductas deseables no tienen lugar por
falta de reforzamiento apropiado.

2.1. Inducción de conductas (adaptativas): ámbito escolar, familiar, laboral y clínico

Cuando los refuerzos se aplican de forma adecuada, pueden influir incluso en la evolución de
algunos comportamientos patológicos.

- Ámbito familiar
- Parejas con problemas
A partir de mediados del siglo 70, algunos terapeutas comenzaron a recurrir a los principios
conductuales para ayudar a parejas con problemas conyugales, donde cada miembro tiende a
recurrir a amenazas y venganzas para conseguir lo que desea del otro.

Esta intervención se diseña para promover interacciones recíprocas más positivas (refuerzos)
entre los cónyuges. A veces se maneja un contrato de contingencias: acuerdo escrito sobre las
conductas requeridas a cada parte y beneficios de llevarlas a cabo.
Normalmente, ambos miembros de la pareja participan de forma activa en la elaboración del
contrato y aceptan los términos.

Ventajas del contrato de contingencias:


– Es un compromiso explícito ante el terapeuta para cambiar.
– Cada miembro conoce los comportamientos deseados por el otro.
– Disminuye la probabilidad de olvido o distorsión retrospectiva de los acuerdos convenidos.

Se promueve el intercambio de refuerzos o intercambio conductual: cada miembro hace un


esfuerzo para llevar a cabo conductas que satisfagan al otro.

- Educación de los hijos


Si los padres ceden a las protestas de los hijos, refuerzan conductas inadecuadas. Si los hijos
obedecen a los padres cuando estos se gritan y muestran agresivos, refuerzan conductas
violentas. Para romper este círculo vicioso, lo recomendable es:

– Prestar atención a los hijos y destacar su comportamiento y dar otros refuerzos cuando se
portan bien.

– Hacer caso omiso de las rabietas: si atrajeron la atención y surtieron efecto en el pasado,
pueden agudizarse durante un periodo transitorio, pero acabarán desapareciendo con el tiempo
si no se refuerzan.

– No gritar ni pegar a los niños cuando se portan mal y desobedezcan: es preferible


explicarles lo que han hecho mal y apartarlos de lo que pueda reforzarles durante un tiempo.

Mejorar el propio comportamiento.


Autopotenciación de comportamientos deseados y combatir los indeseables.
– Establecer los objetivos en términos ponderables y hacerlos públicos.
– Anotar cuántas veces y en qué condiciones se consiguen.
– Empezar por reforzar sistemáticamente el comportamiento deseado.
– A medida que el nuevo comportamiento se hace más habitual, reducir los incentivos y
asumir mayor control mental.

- Ámbito clínico
Modificar la conducta de niños autistas y con retraso mental, pacientes psicóticos o con otras
patologías y alteraciones menores, así como combatir el consumo abusivo de drogas.

Niños autistas
– Suprimir mediante tratamiento aversivo tendencias autolesivas (en el siguiente punto).
– Promover conductas sociales, comunicativas y emocionales mediante manejo de refuerzos.

Entre sus problemas conductuales destaca su escasa e inadecuada interacción social,


comunicación (verbal y no verbal) y actividades e intereses.
En general, no muestran reacciones afectivas y emocionales normales, no manejan el lenguaje
(y si lo hacen, suelen limitarse a repetir parte de lo que escuchan, ‘ecolalia’) y tienden a realizar
movimientos o actividades estereotipadas y repetitivas, con frecuencia autoestimulantes y a
veces autolesivas.

Moldeamiento de conducta verbal: primero intentaban que los niños se mantuvieran


sentados y tranquilos, mirando al educador, reforzándolos por ello. Luego les reforzaba
vocalizaciones; una vez emitieran suficientes, se les reforzaba solo si se producían dentro del
periodo de 5 segundos desde la emisión de una vocalización del educador.
En la siguiente fase se exigía que el niño emitiese la misma vocalización que él. Después
procedían con otro sonido y así sucesivamente.
A continuación, les exigían la imitación de palabras, y luego su uso para pedir cosas.
Finalmente, reforzaban el uso correcto de pronombres, tiempos verbales y conceptos
abstractos.

A lo largo del proceso, además, se fueron reemplazando las golosinas y refuerzos de este tipo
por otros sociales. A la vez que se llevaba a cabo el programa de comunicación verbal, los
niños eran entrenados en otras habilidades sociales y de subsistencia.

Los programas intensivos con chicos jóvenes son los que producen resultados mejores y más
duraderos, así como si los chicos vivían en entornos que los apoyaran.
Sin embargo, las mejoras se limitaban a la aplicación. Al interrumpir los programas, se
desvanecen los beneficios.

- Esquizofrenia
Promover conductas adaptativas en esquizofrénicos

Economía de fichas: en entornos institucionales. Cuando los pacientes llevan a cabo


conductas apropiadas, reciben fichas de más o menos valor que funcionan como refuerzos
secundarios, porque luego pueden canjearlos por refuerzos primarios variados y potentes.

Ventajas del uso de fichas como refuerzos:


– Se pueden aplicar más fácil, inmediata y consistentemente que los refuerzos naturales
convencionales.
– Tienen alta probabilidad de resultar atractivas, al ser canjeables por gran variedad de
refuerzos.
– Facilitan su manejo con grupos de personas.

- Drogodependencias
Manejo de contingencias: promover la abstinencia en drogodependientes no internos. Se les
entregan vales canjeables fuera del centro clínico por bienes de consumo u otras ventajas
sociales si en el análisis periódico que se les realiza al acudir al centro se observa que se han
abstenido de consumir droga.

Estudio clínico realizado a lo largo de 15 años con 664 cocainómanos sin techo. Se evaluó la
abstinencia alcanzada por los participantes en 4 tipos de programas:
1) Ninguno.
2) Convencional: integrado a lo largo de los diversos trabajos clínicos por diferentes tipos de
intervenciones.
3) Manejo de contingencias: proporcionarles casa y/o trabajo en caso de abstención de la
droga.
4) Convencional + manejo de contingencias.

Beneficios mucho mayores de la combinación convencional + manejo de contingencias, e


incluso del manejo de contingencias solo. Mayor prevalencia de los efectos, evaluados a los 2 y
6 meses del tratamiento.

2.2. Supresión de conductas (disfuncionales): extinción, RCI, omisión y castigo

De menos invasiva a más invasiva.

Manejo estratégico tanto de estímulos deseables como de estímulos aversivos y, sobre todo, la
combinación de ambos.

-Extinción

- Refuerzo de conductas incompatibles

- Tratamiento de omisión

-Reforzamiento diferencia de otras conductas

- Tiempo fuera

- Coste de respuesta

- Castigo

- Extinción
A veces, las conductas problemáticas surgen y se mantienen porque son reforzadas. Una
estrategia para combatirlas consiste en interrumpir su reforzamiento. Que la conducta deje
de provocar recompensas.

Sin embargo, hay conductas indeseables para las que su refuerzo apenas depende de nada ni
nadie ajeno a ellas. No siempre resulta posible aplicar de forma eficiente la técnica de la
extinción; en esos casos, se recurre a otros procedimientos.

- Refuerzo de conductas incompatibles

- Tratamiento de omisión
-Reforzamiento diferencial de otras conductas (RDO)
Tendrás esa recompensa salvo que hagas la que se quiere que omitas. Se recompensa
cualquier comportamiento, excepto el que se quiere eliminar. Se establece un período para
aplicar una recompensa en cuanto pasa ese tiempo sin haber emitido la conducta indeseable.
El refuerzo se hace contingente de que haya transcurrido el tiempo acordado sin la emisión de
la conducta objeto del tratamiento.

- Tiempo fuera
La persona es enviada a un ambiente menos agradable que aquel en el que se encuentra,
cuando lleva a cabo la conducta indeseable.

- Coste de respuesta
Se retira un refuerzo cada vez que se produce la conducta objeto del tratamiento. Ejemplo
típico: sanciones económicas, retirada del permiso de conducir por las infracciones de tráfico.

- Castigo
Aplicar un estímulo aversivo a la conducta. Debe ser el último recurso a la hora de combatir
conductas, por los efectos colaterales perniciosos que produce.
Se debe emplear siguiendo una serie de criterios: usar la intensidad más baja posible, dentro
de que resulte efectiva; aplicarlo de forma consistente, inmediata y justificada…

Efecto del manejo de castigo en niños autistas en sesión clínica de evaluación, para combatir
conductas autodestructivas muy lesivas, y que no desaparecen con ningún otro procedimiento.
Se les aplicaban leves corrientes que no les hacían daño, solo provocaban una sensación
desagradable. Así lograban reducir drásticamente esas conductas autodestructivas en muchos
niños, lo que, además de la ventaja intrínseca que eso entraña en sí mismo, los capacitaba
para beneficiarse de otros programas de entrenamiento, con vistas a desarrollar conductas
comunicativas, emocionales y sociales básicas.

En torno a medio centenar de estudios documentan la efectividad de la terapia aversiva


eléctrica a la hora de combatir las conductas autolesivas. Esta técnica también se aplicó a la
tendencia recurrente a vomitar, las conductas obsesivo–compulsivas o el comportamiento
agresivo. El castigo razonablemente manejado parece útil incluso en el ámbito clínico.

3. CONSIDERACIONES FINALES
Este enfoque terapéutico se considera ‘terapia de conducta de primera generación’.
Posteriormente, a lo largo de los años 70 y 80, con el desarrollo de la psicología cognitiva, se
pasó a considerar que los principios de condicionamiento eran útiles, pero insuficientes.
Durante esos años los terapeutas de conducta (de ‘segunda generación’) desarrollaron
tratamientos más inspirados en la investigación humana, que se interesaba por los mediadores
cognitivos del aprendizaje.
Hoy en día se comienza a hablar de la ‘terapia de conducta de tercera generación’, que debe
tener en cuenta los nuevos principios y hallazgos descubiertos.

Lo que se pensaba que eran formas muy elementales y simples de aprendizaje asociativo no
es así. Las operaciones de condicionamiento no se reducen a asociaciones mecánicas entre
dos eventos contiguos cualesquiera.

Se aprende no solo qué eventos suelen resultar contingentes entre sí, sino también cuándo y
en qué circunstancias. Además, no todos los casos y tipos de condicionamiento responden a
los mismos mecanismos y procesos. Aunque algunas de sus formas pueden tener lugar de
manera automática y al margen de procesos cognitivos conscientes, en otros muchos casos
intervienen sofisticados sistemas de atención, memoria y procesamiento de información que
permiten detectar relaciones entre eventos, anticiparlos y llevar a cabo acciones preparatorias
para, o inductoras de, ciertos eventos.
Bloque ll. Bases neurales del aprendizaje y el condicionamiento

Libro: Neurociencia cognitiva- Redolar D (2014). Capítulos 6,16,17,21.

TEMA 6. Bases neurales del aprendizaje y el condicionamiento


1. Aprendizaje y memoria.
2. Sistemas de aprendizaje y memoria.
3. Aprendizaje no-asociativo: habituación y sensibilización.
4. Aprendizaje asociativo: condicionamiento clásico e instrumental.
5. Aprendizaje perceptivo (priming) y motor (procedimental).
6. Aprendizaje explícito/relacional: espacial, episódico y semántico.

E→R→C
Se basa en cuáles son los procesos o mecanismos que tienen lugar entre el estímulo y la
respuesta. Una vez que se produce el aprendizaje, se da la memoria y vamos a ver cómo
interviene la memoria en el mismo. Aprendizaje y memoria están completamente relacionados.

1. Aprendizaje y memoria

APRENDIZAJE

• Proceso por el cual se adquiere nueva información o conocimiento.

• Es una propiedad fundamental del cerebro que se manifiesta de diversas formas mediante
múltiples sistemas diferenciados anatómica y funcionalmente.

• El entorno modifica nuestro comportamiento, en tanto que es capaz de inducir cambios en


nuestro sistema nervioso.

MEMORIA

• Mecanismo por el que este conocimiento es codificado, almacenado y, posteriormente,


recuperado.

El aprendizaje y la memoria constituyen el cambio de comportamiento asociado a la


experiencia.

Cada vez que queremos recuperar algo para realizar una actividad se hace uso de la memoria.

¿Cuántos tipos de memoria hay?

- ¿Son todos igual de fáciles de adquirir?


- ¿Se aprenden todos igual?
- ¿Siguen el mismo proceso neurológico?
- ¿Se graban/guardan en las mismas estructuras?

No se graban en las mismas estructuras ni siguen el mismo proceso.

¿Qué tipos de memoria hay?

a) Según el criterio categórico

- Memoria explícita (o declarativa/consciente)

- Memoria implícita (o no declarativa/inconsciente)- aquella que no se puede expresar.


b) Según el criterio temporal:

- Memoria inmediata (de milisegundos a pocos segundos)

- Memoria a corto plazo (de segundos unas pocas horas)

- Memoria a largo plazo (a partir de 24 horas)

Hay un componente emocional y de repetición que establece que sea de un tipo o de otro.

c) Si combinamos el criterio categórico con el criterio temporal...

2. Sistemas de aprendizaje y memoria

Memoria perceptiva: información que percibimos del entorno. Muchísima información.

Memoria a corto plazo: damos sentido a la información.

Memoria de trabajo: procesamiento + memoria a corto plazo.

Cuando vemos algo a corto plazo y después vemos un estímulo relacionado con el mismo, es
probable que lo que recordamos a corto plazo sea sacado de la memoria a largo plazo.

Semántica: lo que significa una palabra depende de muchas regiones (corteza), ya que hay un
componente sensorial en función de las experiencias que pueden ser de diverso tipo.
Procedimental: la aprendida.

Priming: Estímulo inicial que modifica y que altera la respuesta posterior.

Amígdala: reacciones de miedo.

3. Aprendizaje asociativo/no-asociativo

La modificación de la conducta se produce por la asociación de dos o más estímulos.

Aprendizaje no-asociativo

Cambio en la conducta por la mera exposición a 1 Estímulo

• Habituación: disminución en la Respuesta a 1 Estímulo → reducción de la magnitud de la


respuesta ante 1 estímulo generalmente inocuo (indefensivo) que se repite con frecuencia en
un breve periodo de tiempo.

• Sensibilización: aumento en la Respuesta a 1 Estímulo → proceso que provoca que la


repuesta a un estímulo sea más intensa de lo normal por presentarse tras un estímulo,
normalmente intenso, nocivo o que provoca miedo, que ha causado un sobresalto inicial.

Aprendizaje asociativo

Cambio en la conducta por la asociación entre 2 o más eventos

• Condicionamiento Clásico: asociación Estímulo – Respuesta

• Condicionamiento Instrumental: asociación Respuesta – Consecuencia

3. Aprendizaje no-asociativo

Habituación y sensibilización.

Formas de aprendizaje que se producen por la mera EXPOSICIÓN a estímulos.

Aplysia: modelo simple para estudiar las bases fisiológicas del aprendizaje (habituación,
sensibilización y condicionamiento clásico).

El cerebro humano es complejo: 100.000.000.000 neuronas.


El cerebro de Aplysia es simple: 20.000 neuronas.

Proteínas como serotonina y factor de crecimiento están implicadas en la memoria a largo


plazo y desarrollo del cerebro.
Reflejo de retirada de la branquia

(Variable Dependiente)

Cualquier estímulo que apliquemos vamos a ver su efecto en la retirada de la branquia (acto
reflejo).

3.1. Habituación

Habituación: disminución en la Respuesta a 1 Estímulo →

* reducción de la magnitud de la respuesta.

* ante 1 estímulo generalmente inocuo que se repite con frecuencia en un breve periodo de
tiempo.

Hay neuronas sensitivas y neuronas motoras. Neurona sensitiva del sifón percibe el estímulo y
comunica la información a la neurona motora que retira la branquia.

Por ejemplo, tenemos piedra en el zapato, cuando la notamos nos sentimos molestos, pero
luego seguimos andando y nos habituamos. Neurona sensitiva sigue respondiendo, pero no
responde la neurona motora. ¿Por qué no responde la neurona motora?

El hecho de que la respuesta motora deje de funcionar, es debido a que se produce una
modificación sensitiva.
La respuesta entre neurona sensitiva y motora está mediada por interneuronas.

En un individuo habituado esa comunicación se produce, pero la cantidad se


neutrotransmisores que se liberan es cada vez menor, motivo por el cual sigue habiendo
actividad en la neurona sensitiva, pero al ser menor no alcanzan el umbral necesario de la
neurona motora para que la respuesta se lleve a cabo. La sinapsis se ve reducida a nivel
presináptico (neurona sensitiva), porque libera menor sustancia neurotransmisora.

La membrana de la neurona está en un umbral de -70 mV aprox. Y cuando recibe un estímulo,


llega a un al potencial de acción (+50), después se produce la caída que es la repolarización, a
continuación, el periodo refractario (mucho más negativo), y vuelve a su umbral de reposo.
MIRAR APUNTES DE NEUROCIENCIA.

Llega el potencial de acción, lo que hace la membrana es que abre sus canales de sodio y
entra sodio (iones positivos – de -40 a 70 mV - despolarizar), y después tiene que volver a su
equilibrio, por lo que sale potasio (negativo, de 70 a -40 mV- repolarizar).

Todo se produce porque necesitamos esa despolarización para que se abran los canales de
calcio (potencial de acción), y es el calcio el que se pega a las vesículas que contienen a los
neurotransmisores y las arrastra hacia el borde de la membrana, se pega a la membrana y se
abre la misma, saliendo los neurotransmisores.

Sodio, potasio y calcio, son canales iónicos dependientes de voltaje, porque en función de la
carga que reciban se abren o cierran.

Dura alrededor de 2 milisegundos.


Al haberse repetido muchas veces (es tan bajo el estado de reposo), que no alcanza el
potencial de acción (no se produce despolarización) suficiente para que se abra el canal de
calcio y no se produce la exocitosis (que es el proceso por el que la vesícula se pega a la
membrana, la cual se abre y deja pasar al espacio sináptico los neurotransmisores). Entra
calcio, pero por otros mecanismos, pero no es suficiente para provocar la exocitosis. Neurona
motora no recibe tantos neurotransmisores por lo que no hay apenas respuesta por parte de la
misma, e incluso puede que ni haya.

Depresión presináptica de la neurona sensorial (Homosináptica). No llega a liberal el


neurotransmisor a la neurona motora.

3.2. Sensibilización
Cuando tocamos el sifón da lugar a una respuesta de retracción moderada de la branquia,
después se aplica un estímulo nocivo a una parte de la cola (distinto de la anterior), que en
principio ha de tener un circuito distinto, y lo que hace es retraer rápidamente la branquia
(mecanismo de defensa). Volvemos a estimular el sifón tras un rato, y lo que podríamos
esperar es que la retracción de la branquia fuese igual la primera que la última, ya que el
mecanismo entre el sifón y la cola no tiene nada que ver, pero la reacción es más rápida que
la primera vez. La estimulación en un punto diferente ha modificado un reflejo. Esto puede
deberse a que como el número de neuronas es bastante menor, estas están mucho más
conectadas. Si no es nocivo, seguramente no haya respuesta en la branquia.

Nos sensibilizamos habitualmente ante estímulos negativos. También puedes hacerlo ante
positivos, pero es más difícil.

Es la modificación en la segunda vía la que produce el cambio en la respuesta. Esa


interneurona moduladora modula el terminal presináptico de la neurona sensitiva. Se
modifica la respuesta motora a través de una alteración de otro circuito.

Repliegue de la branquia en aquel que está sensibilizado es mucho mayor y más rápido
(respuesta motora es más intensa).

Es facilitador por lo que hace es que la respuesta sea más potente.

*RECUERDA: Si hubiese sido inocuo o indefensivo no hubiese ocurrido nada.


La neurona sensorial de la cola contacta con una interneurona (libera serotonina), que a su vez
contacta con el terminal presináptico de la neurona sensorial del sifón, que contacta con la
neurona motora. SINAPSIS AXOAXÓNICA.

Adelitano ciclasa → Activa el AMP cíclico que activa la proteína kinasa.

Las conexiones que se potencian se facilitan, por eso un estímulo mínimo, facilita la respuesta,
es decir, conectamos con más botones sinápticos una neurona con otra (aprender).
Al recibir en el neurotransmisor la serotonina lo que sucede es que aumenta la concentración
de AMP cíclico, y proteína quinasa A. Se han abierto los canales de socio, se están abriendo
los canales de potasio, de forma que al aumentar la concentración de AMP cíclico y proteína
quinasa A, se cierran los canales de potasio, y no salen los iones de potasio. La membrana
está cargada positivamente y no puede liberar esos cationes que haría que el citoplasma
alcanzase su voltaje de -40. Se bloquea el intercambio para que la neurona vuelva a su estado
de reposo. Si se cierran los canales de potasio y no permitimos que vuelvan los canales de
sodio, sigue en estado de hiperpolarización, se prolonga en el tiempo el potencial de acción
los canales de calcio siguen abiertos y la señal de exocitosis continúa, por lo que la liberación
de neurotransmisores continúa (gluatamato). Es muy continuada e intensa.

Diferencias entre habituación y sensibilización

La habituación:

- Es específica del estímulo que la provoca como de la respuesta conductual reducida.

- Se produce tras la exposición repetida al estímulo.

- Se asocia con una depresión de la respuesta presinaptica e


implica reducción de liberación de neurotransmisores.

- Duración: puede prolongarse en el tiempo.

- Homosináptica.

La sensibilización:

- Tiene carácter inespecífico, es generalizable a una gran cantidad de estímulos y respuestas.


No es que haya un canal o una conexión sináptica que sea susceptible a ese estímulo, es que
cualquiera de los mecanismos es susceptible de ser estimulado.
- Se produce tras la aparición única de un estímulo con gran impacto emocional.

- Se asocia a un aumento de la fuerza o fortalecimiento


sináptico (facilitación) y a un aumento en la respuesta a la
excitación.

- Duración: se limita a un corto periodo de tiempo.

- Heterosináptica.

3.3. Habituación y Sensibilización a L.P. en Aplysia

Habituación a Largo Plazo

• Una sesión con 10 estímulos produce habituación a corto plazo que dura minutos.

• Cuatro sesiones espaciadas en el tiempo producen habituación a largo plazo que dura
semanas.

SE PRODUCEN CAMBIOS EN LA DENSIDAD SINÁPTICA.

Sensibilización a Largo Plazo

• Un único estímulo nocivo puede producir sensibilización a corto plazo durante minutos.

• Más de un estímulo nocivo puede producir una sensibilización a largo plazo que dura
días/semanas.

Hay un cambio a nivel neuronal, ya que llega un momento en el que cada vez que es repetido,
se va aumentando la cantidad de terminales sinápticos para facilitar esa mayor respuesta.

SE PRODUCEN CAMBIOS EN LA DENSIDAD SINÁPTICA.


Se produce un aumento de la respuesta, pero sin mantener el potencial de acción durante
mucho tiempo para ahorrar energía.

Se modifica la neurona a base de la repetición (memoria a largo plazo), cambia su estructura y


su función.

La proteína kinasa (además de cerrar los canales de potasio) se dirige hacia el núcleo de la
neurona y arrastra a otras kinasas. Dentro del núcleo de la neurona, activa otra kinasa (MAPK),
esas kinasas activan la proteína DRES-1, que se fosforila (se añaden fósforos) e induce la
expresión de dos genes (de crecimiento neuronal), que dan lugar al crecimiento de nuevas
conexiones sinápticas, de tal manera que cuando vuelva a haber un estímulo de ese tipo, la
respuesta se genera con mucha más facilidad. También depende de la experiencia. Si el
estímulo externo persiste, lo que sucede es que se produce la inducción de la expresión de
dos genes, crecimiento de nuevas conexiones.

Para que la respuesta motora sea más intensa depende de la cantidad de conexiones,
vesículas, etc.

El ambiente induce o no la transcripción de ciertos genes.

MEMORIA A LARGO PLAZO

Alteraciones físicas (estructurales) de la sinapsis ocurren cuando se desarrollan huellas de la


memoria a largo plazo. Las alteraciones estructurales más importantes son:

1. Aumento del número de lugares de liberación de vesículas para la secreción de


neurotransmisores.

2. Incremento del número de vesículas del transmisor.

3. Aumento del número de terminales sinápticas.

4. Modificaciones de las estructuras de las espinas dendríticas.


3.3. Habituación y Sensibilización a L.P Aprendizaje

Cambios estructurales/anatómicos asociados al aprendizaje a largo plazo

• Habituación a largo plazo: retracción de terminales sinápticos en la neurona presináptica


que disminuyen la transmisión sináptica.

• Sensibilización a largo plazo: desarrollo de terminales sinápticos en la neurona


presináptica que facilitan la transmisión sináptica.

6. Aprendizaje explícito

Dependiendo del contenido del aprendizaje, estímulos que se asocian para generar un
aprendizaje, hay diferentes zonas:

El significado de una palabra no solamente


tiene contenido verbal, sino que se
relaciones con recuerdos, olores,
sabores,sonidos, que no dependen de un
solo ámbito sensorial por eso asocia a toda
la corteza
El hipocampo está pegado en la amígdala, es porque el contenido emocional es lo que hace
que nos acordemos de eso.
Henry tenía crisis epilépticas continuas. Y se sometió a una operación y para disminuir la
cantidad de crisis epilépticas es buscar el origen, y resercarlo. No se puede hacer sobre
algunas zonas. ¿A qué se llama mejorar? Depende del objetivo terapeútico. Después de la
operación era incapaz de memorizar ciertas cosas (memoria que se almacenaba en el
hipocampo, espacial y episódica). Pero sí que había ciertas cosas que sí que podía
memorizar (procedimental) que depende de otras regiones. Dependiendo del tipo de memoria
se almacena en diferentes regiones. Podía recuperar información de antes de la operación,
pero no podía incorporar información posterior.

MEMORIA RELACIONAL DEPENDIENTE DE HIPOCAMPO

Memoria basada en el establecimiento de relaciones entre...

- Elementos de un contexto espacial (MEMORIA ESPACIAL).

- Acontecimientos temporalmente relacionados (MEMORIA EPISÓDICA).

- Conceptos (MEMORIA SEMÁNTICA).

Mapa semántico. Relación entre diferentes términos. Algunos términos están más
relacionados con otros.
En el hipocampo identificamos el giro dentado, el CA1 y CA3 y el subiculum. Dentro está la
corteza entorrinal, la parahipocampal. Forman el sistema neural del lóbulo temporal Medial.

Cuando percibimos a un estímulo va a las áreas de asociación primarias, de ahí a las


secundarias y de ahí a las terciarias, donde le damos un significado.
Primaria: hay un estímulo

Corteza sensorial secundaria: ¿qué es ese estímulo?

Corteza sensorial terciaria: ¿qué significa ese estímulo?

Después pasará a ser memorizado. Toda la información que recibimos dependiendo de si llega
de regiones frontales, etc, se almacena en la corteza siguiendo el siguiente esquema:
Una vez que ese contenido de información ha pasado por todas esas estructuras, una vez que
está en la corteza, empieza la memorización.

Durante los primeros momentos es necesario que se produzcan conexiones necesarias (rojas)
y no tan necesarias (azules) entre el cortex y el hipocampo, activación continua del
hipocampo con la corteza. Después las asociaciones empiezan a ser más fuertes con otras
regiones (intracorticales), una vez que están más consolidadas, las del hipocampo no son
necesarias, empiezas a ser necesarias las corticales, ya que solamente el concepto es capaz
de activar esas regiones corticales sin tener que volver a rememorar esas conexiones previas.
Mecanismo para ahorrar recursos y tiempo.

Durante el aprendizaje o codificación se están formando conexione entre el hipocampo y


regiones del cerebro que codifican información auditiva, visual y espacial. Pasado el
tiempo, aparecen una serie de estímulos que nos recuerdan esa situación, hay una activación
del hipocampo y del hipocampo parten las conexiones de nuevo. Más adelante, cuando la
memoria está totalmente consolidada, cada vez que vemos un estímulo relacionado con aquel
elemento, no va a requerir de nuevo la activación del hipocampo, se van a activar las regiones
en las que se han almacenado las diferentes informaciones (de diferentes regiones en función
de la información). Cuando almacenamos un determinado recuerdo es muchísimo más
duradero.

Aprendizaje asociativo

Condicionamiento

Cambio en la conducta por la asociación de 2 o más eventos

• Condicionamiento Clásico: asociación Estímulo – Respuesta

• Condicionamiento Operante: asociación Respuesta – Consecuencia

Hay un emparejamiento
entre dos eventos
En un primer momento estimulamos el manto de la aplisia, y acto seguido estimulamos de
manera aversiva la cola (descarga eléctrica), lo que provoca una retracción violenta de la
branquia. Cuando asociamos el EC- con el EI, la alteración se produce en una conexión
axoaxónica con la neurona sensorial del manto, que sinapta con la interneurona motora-
motora.

Cuando apliquemos la estimulación inocua en el manto, conseguiremos una intensificación en


el repliegue de la branquia.

Cuando vuelves estimular el sifón vuelves ves que es igual. Antes y después se aplica un
estímulo control en el sifón, veremos que el repliegue es el mismo. Lo que se ha condicionado
es que la estimulación del manto va a provocar la retracción violenta de la branquia.

Solo sucede cuando lo estimulas de una determinada forma.

La estimulación del sifón tiene una latencia de 2 segundos.

Estimulamos el manto, en condiciones normales tiene una latencia de 3 segundos.

Emparejamos la estimulación del manto y acto seguido, aplicamos el estímulo incondicionado


que es aversivo (descarga). Si lo hacemos durante 5 veces seguidas de la misma manera, se
puede predecir que cuando se produce el primer estímulo, se producirá a continuación el
segundo. Cuando estimulemos de nuevo el manto solo, la respuesta, la latencia va a ser de un
segundo, y después si volvemos a estimular el sifón pasado un rato, la latencia seguirá siendo
de 2 segundos, ya que es un condicionamiento específico entre manto y cola, y el sifón no
responde porque no afecta otros mecanismos distintos (que no sean ni manto ni cola).

Condicionamiento de demora (Delay conditioning). El proceso de condicionamiento se


localiza en el cerebelo. Cuando emparejo temporalmente el EC con el EI en el que son
fácilmente asociables. Coinciden en el tiempo. Antes de que acabe el EC aplico el EI.

Condicionamiento de huella (Trace conditioning): Pero muchas veces ese


condicionamiento se produce con eventos en los que hay un retraso entre la aparición del EC y
la aplicación del EI (intervienen cerebelo e hipocampo). Hay un momento en el que hay un
efecto de memoria. Cuando se produce el EI, tiene que haber un cierto recuerdo de esa
estimulación (huella de memoria), para asociar el EI con el EC previo. Se va a requerir la
activación por tanto del cerebelo como del hipocampo.

¿Qué pasa cuando esa asociación entre estímulos tiene un componente emocional?

Además del cerebelo y el hipocampo, tendrá que haber una activación de las estructuras que
tiene que ver con las respuestas emocionales (sistema límbico), en el miedo es la amígdala. Se
estudia a pacientes que tienen lesionada la amígdala.

Cuando otra persona nombre al EC, la respuesta será de miedo, ya que está asociada con el
EI (aunque este no se presente). En la piel hay una reacción cuando alguien solamente lo
menciona.

Cuando se menciona o aparece el EC hay un aumento de la conductancia de la piel, y


cuando se produce el EI hay un pico en la conductancia de la piel.

Cuando un individuo tiene lesionada la amígdala, se asocia el EC con el EI, reacciona con
miedo, pero cuando se mide la conductancia de la piel, ante la presencia del EC no hay una
respuesta significativa, pero sí cuando se produce el EI (aversivo), el estímulo aversivo sigue
siendo aversivo. Sí que perciben cuando algo es desagradable, pero no se produce el
condicionamiento entre ambos estímulos.
No es que sea incapaz de memorizar esa asociación, pero no se produce ese
condicionamiento de miedo (emocional). El de salivación sí que se produciría ya que no
interviene la amígdala.

El contenido declarativo (explicación de que después del EC va el EI), sí que existe, pero no
aparece ese condicionamiento al miedo.

Que exista una lesión entre hipocampo y amígdala no es tan imposible porque están bastante
cerca.

La amígdala permite el condicionamiento emocional (no tendrá reacciones de miedo cuando


aparezca el EC en ausencia del EI) y el hipocampo el condicionamiento explícito (saber
asociar ambos estímulos debido a la memoria, saberlo explicar).

Cerebelo + hipocampo: conocimiento clásico (explícito)

Cerebelo + amígdala: condicionamiento (clásico miedo)


Cuál es el mecanismo de refuerzo por el que ese estímulo general esa respuesta. E –
Respuesta motora.

¿Cuáles son los sistemas de refuerzo del cerebro?

Ese sistema de refuerzo es un sistema dopaminérgico, las regiones que están basado este
aprendizaje son los ganglios basales.

La estructura base que libera dopamina a este circuito es la sustancia negra


(neuromelanina). Trabaja entre la conducta y sus consecuencias.
Cuando tienen ganglios basales dañados, no se produce el condicionamiento operante o
instrumental, pero se podría producir otro tipo de aprendizaje. No aprende la relación entre
una conducta y su consecuencia. Lo que hacemos para que aprendan es darles un premio
(incentivo).

Se coloca al animal en un punto del laberinto y la tendencia es la de ir al centro, la de


moverse. ¿Dónde se va a dirigir? A base de ensayos le enseñamos que el refuerzo se
encuentra en los brazos adyacentes. No lo empieza a descubrir hasta el tercer ensayo. Cuando
tiene una lesión en los ganglios basales no saben que tienen que ir hasta el brazo adyacente
para conseguir el refuerzo o incentivo.

Tiene que ir al brazo que está iluminado, aprender que el premio va a estar en un brazo
iluminado que cambia en cada ensayo. Animales con lesión en el hipocampo si son capaces
de aprender, mientras que los animales con lesión en los ganglios basales no logran
aprender.

APRENDIZAJE POR CONDICIONAMIENTO OPERANTE O INSTRUMENTAL NO DEPENDE


DEL HIPOCAMPO, SÍ DE LOS GANGLIOS BASALES.

Dentro de la resonancia magnética, tiene que predecir el tiempo (previsión meteorológica), a


partir de una serie de señales. Se ven los estímulos con unas gafas, o con unas antenas
(espejo doble). Se le enseñan una serie de figuras, que pueden estar en diferentes posiciones,
lo que tiene que deducir es qué combinación corresponde a la predicción de buen o mal
tiempo. Cuando ha aprendido la norma, da a botón cuando cree que corresponde a buen o mal
tiempo, si acierta hay un refuerzo, conseguirá tantos € en función de los puntos que consiga.

Se hizo con pacientes con enfermedad de Parkinson (lesión ganglios basales – sustancia
negra) y con pacientes amnésicos (lesión hipocampo). Cuando tienen que explicar o
demostrar que han entendido la norma, el procedimiento, el aprendizaje instrumental para
hacer bien la tarea y ganar puntos, los pacientes con Parkinson no son capaces de aprender,
mientras que los amnésicos lo entienden, y los sujetos control igual que los amnésicos.
Asociación entre Respuesta y Consecuencia.

Relación entre respuesta y consecuencia: pacientes con enfermedad de Parkinson son


capaces de explicarlo (declarativa), pero no aplicarlo, hipocampo es totalmente intacto. Los
amnésicos hacen bien la tarea, pero no son capaces de explicarlo (no existe memoria
declarativa), (tienen el hipocampo dañado).
Ponían un electrodo estimulador en el cerebro de la rata. La ponían dentro de una caja en la
que cada vez que presionaba una palanca se estimulaban las regiones ventrales, pero vieron
que tenían una rata que pulsaba de manera impulsiva la palanca. Estaba estimulando el área
tegmental ventral (relacionada con la producción de dopamina. Cuando el animal aprendió
en poquísimos ensayos que presionando la palanca recibía una señal de refuerzo, algo que
le impulsaba a repetir la acción. Lo que te motiva a volver a repetir la acción, es que estimula el
sistema de refuerzo directamente.

(meso – mesencéfalo)
B) Predicción de que va a llegar un refuerzo gracias al estímulo discriminativo previo
(luz).

C) Condicionamiento desaparece por una deflación de la dopamina.

5. Aprendizaje perceptivo y motor

Priming: Cómo un estímulo que no te esperas afecta a la respuesta posterior.


Cuando has hecho la tarea varias veces es más fácil que sepas responderla después. Los
sujetos control después de varios ensayos son capaces de acertar mientras que H.M, le cuesta
más y necesita más elementos y más tiempo.

De qué estructuras depende el Priming:


¿Qué tipo de información hace falta? INFORMACIÓN ASOCIATIVA, de otros estímulos, de
otras experiencias previas, está en toda la corteza.

Tarea es poner una línea en medio de la estrella con un espejo, pero es una habilidad que se
entrena a base de repetirla. Paciente que tiene alterado el hipocampo, cuando lo hace con la
mano izquierda a cuando lo hace con la mano derecha, lo hace de manera completamente
diferente. Solo tiene el hipocampo izquierdo operado, por lo que le cuesta mucho más con la
mano derecha, ya que la parte izquierda se encarga del movimiento de la mano contraria, y
viceversa.

Igualmente, que aprendizaje depende de hipocampo y acaba en corteza, la procedimental


depende de circuitos diferentes (ganglios basales y cerebelo) y acaba en estructuras que no
son corticales.
TEMA 7. Consolidación del aprendizaje
1. Aprendizaje y plasticidad cerebral.
2. Mecanismos sinápticos y moleculares del aprendizaje.
2.1. La Potenciación a Largo Plazo (PLP)
2.2. El papel de los receptores NMDA en la PLP
2.3. Fases de la PLP
2.4. Relación entre PLP y memoria

3. Cambios cerebrales como consecuencia de la experiencia.

1. Aprendizaje y plasticidad cerebral


¿Qué regiones del cerebro se asocian con determinados tipos de aprendizaje?

Tema 6 → El sustrato neuroanatómico es MÚLTIPLE: existen distintos sistemas


cerebrales para distintos tipos de aprendizaje y memoria

¿Qué tipo de cambios ocurren en el cerebro cuando se produce un aprendizaje o cuando se


adquiere, almacena, consolida o recupera una memoria?

Tema 7 → Los mecanismos celulares y moleculares tienen un carácter más GENERAL o


UNIVERSAL, ya que dependen de la propia capacidad de adaptación o PLASTICIDAD del
sistema nervioso

Ramón y Cajal (~1890): Hipótesis neuronal y plasticidad: comunicación en el cerebro


funciona en base de una red en la que las neuronas están dispuestas de manera individual y
conectadas entre sí. Mientras que Golgi decía que tenemos una red en la que las neuronas no
están dispuestas de manera individual.

Según Ramón y Cajal: “[…] la corteza cerebral semeja un jardín poblado de innumerables
árboles, las células piramidales, que gracias a un cultivo inteligente pueden multiplicar sus
ramas, hundir más lejos sus raíces y producir flores y frutos cada día más exquisitos” – Se
puede modificar esa estructura y riqueza.

Lejos de ser un sistema estático de elementos interconectados como antiguamente se creyó, el


cerebro es un órgano dinámico, que se desarrolla y cambia continuamente en respuesta a
programas genéticos y a la interacción con el ambiente. – Plasticidad neuronal.

¿De qué depende de que estos mecanismos se pongan en marcha?

Aunque estamos predispuestos genéticamente, la interacción con el ambiente también influye.


Entrenamiento cognitivo puede contribuir a que las ramificaciones y conexiones neuronales se
mantengan.

Partiendo de una capacidad X, hay un margen que depende del ambiente o entrenamiento, el
cual va a determinar si se produce o no el aprendizaje (plasticidad neuronal).

Aprendizaje a largo plazo una modificación en las estructuras de las neuronas, modificación en
la sinapsis.

Donald O. Hebb (1949)

Principio de Hebb

“Neurons that fire together, wire together”. Las neuronas que disparan juntas, se conectan entre
sí (Cell assemblies). A base de disparar y conectar al mismo tiempo, cuando se dispara una,
induce el disparo de la otra. Ensamblaje celular.

Una sinapsis entre dos neuronas se fortalece cuando se produce una coincidencia en la
actividad presináptica y postsináptica, es decir, si las dos neuronas se encuentran activadas
al mismo tiempo.

Neurona motora (presináptica) que conecta con otra neurona motora (postsináptica) que
produce la contracción del párpado.

Hay una neurona somatosensorial que conecta con la neurona motora presináptica a través de
la conexión con la con la neurona motora (postsinaptica) que da lugar a la contracción del
párpado. (soplar)

Cerca hay otra neurona sensorial que produce estimulación auditiva (silbato).

Silbido + soplo en el ojo.

Cuando se activa la neurona sensorial auditiva (silbido) al mismo tiempo se activa la neurona
somatosensorial (silbido), que conectan con la neurona motora y producen la contracción del
ojo. Las neuronas que disparan juntas se conectan entre sí. A base de disparar juntas se
produce una asociación fuerte entre ambas neuronas (auditiva y somatosensorial). Consigues
que estén despolarizadas al mismo tiempo y al final será el estímulo auditivo (silbato), el que
genere esa respuesta.

Mecanismos postsinápticos.

• Habituación y sensibilización son presinápticos.

Lømo y Bliss (1966, 1973)

Hipocampo de un conejo, se hacen láminas.


Estimulan eléctricamente una región del hipocampo y ven cómo responde una neurona. Cómo
se produce ese aprendizaje. Si estimular muchas veces una neurona, ¿qué le pasa para que
realmente se produzca ese aprendizaje?

Potencial X (reposo) y se aplica una estimulación tetánica (tren de estímulos entre 100 y 1000).

Tras una estimulación tetánica (entre 100 y 1000 estímulos a alta frecuencia: 25-400 Hz), el
incremento de la actividad postsináptica se mantenía ante pulsos individuales durante horas
Cuando se daba un solo estímulo que en condiciones normales no producía tanta estimulación,
esa neurona postisáptica se mantenía mucho más tiempo. Alteras la sensibilización de la
membrana. → POTENCIACIÓN A LARGO PLAZO (PLP), efecto se mantiene a largo
plazo→ Fenómeno plástico caracterizado por un incremento estable y duradero de la eficacia
sináptica (magnitud de la respuesta) tras una estimulación de alta frecuencia.

Generas una modificación que no es transitoria, es permanente, y la has modificado a largo


plazo. Consigues modificar la conexión entre las neuronas de forma que ahora hay un
incremento estable y duradero de la eficacia sináptica. Neurona postsináptica sigue
despolarizada incluso cuando el estímulo ya no está, que se mantiene en el tiempo.

2.1. La Potenciación a Largo Plazo (PLP)

Tras una estimulación tetánica (entre 100 y 1000 estímulos a alta frecuencia: 25-400 Hz), el
incremento de la actividad postsináptica se mantenía ante pulsos individuales durante horas →
POTENCIACIÓN A LARGO PLAZO (PLP) → Es necesario que la célula postsináptica esté
activada (despolarizada) cuando la presináptica dispara.

Conexión más duradera y fuerte entre las neuronas.

Aspecto externo.

2.2. El papel de los receptores NMDA en la PLP

Los receptores NMDA:

• Son receptores de Glutamato

• Abundan en el campo CA1 de la formación hipocampal

• Reciben su nombre del fármaco que los activa específicamente (N-metil-D-aspartato)

• Controlan un canal de Ca2+, que está normalmente bloqueado por un ión Mg2+. Éste
impide que los iones Ca2+ penetren en la neurona postsináptica, incluso cuando el
receptor es estimulado por Glutamato
• Pero…. si la membrana postsináptica está despolarizada, el Mg2+ es expulsado del
canal iónico y deja paso libre al Ca2+ → Los receptores NMDA están controlados tanto
por neurotransmisor (Glu) como por voltaje (despolarización de la neurona
postsináptica)

Cuando se libera el glutamato está el NMDA Y los AMPA: sensibles al glutamato y en el


momento en el que está ahí encajan en el receptor abre canales de calcio y sodio y empieza a
cambiar su polarización hasta que se despolariza. Cuando eso ocurre entran en juego los
receptores NMDA son iguales, pero tienen ión de magnesio que impide que haya flujo entre
sodio y potasio. Son sensibles al neurotransmisor glutamato y dependientes de voltaje, ya que
no abren hasta que no se produce la despolarización de la membrana. Una vez que de
despolariza, ya se expulsa el ión se magnesio, se abre el receptor y empieza el intercambio
sodio-potasio. Empieza la activación de los receptores mandan señales al cuerpo de la
neurona para generar cambios.

2.3. Fases de la PLP

Mecanismos por los cuales cambia la morfología y la función de la neurona postsináptica


Inducción del cambio (comienzo)
Expresión y mantenimiento (ya se ha producido, cambio conexión neuronal que te permite
realizar algo, ante un estímulo sabemos dar una nueva respuesta.
Ese aumento de la concentración de calcio a nivel intracelular va a fosforilar la Ca-Camk-ll
Es provocar cambios a nivel de los receptores, esa señal es recibida por el núcleo de la
neurona y tiene la capacidad de auto modificarse, disminuir el número de receptores NMDA y
muchos más receptores AMPA. Esa modificación generada por la fosforilación es producir
cambios en la neurona, en este caso el número de receptores, solamente se quejan los AMPA
que son sensibles a los neurotransmisores glutamato (facilitar), solo con que llegue el
glutamato ya se produce la respuesta, fortalecer la asociación es facilitar el proceso.

Esos cambios se producen por la Ca-Camk-ll fosforilada.

Cambios funcionales:
• Incremento de la capacidad conductiva de los receptores AMPA.
Cambios estructurales:
• Aumento de los receptores AMPA.
• Ensanchamiento de las espinas dendríticas ya existentes (para
acomodar todos los receptores AMPA).
• División de una espina en dos.
• Creación de nuevas espinas dendríticas.

2.4. Relación entre PLP y memoria

Distintos experimentos indican que el almacenamiento en memoria emplea PLP


Aquellos que han alcanzado la plataforma quiere decir que han aprendido, y aquellos que sí la
alcanzan parece que sí que han aprendido.

Distintos experimentos indican que el almacenamiento en memoria emplea PLP


(1) Ratones que carecen del receptor NMDA en el hipocampo

Modificando los receptores de NMDA en el hipocampo, lo que vemos es que un animal normal
aprenderá que a base de dar vueltas consigue alcanzar la plataforma, pero a los que se
modifica o carecen de receptores de NMDA, no tienen esa representación espacial y no tienen
ningún patrón que se asocie, tienen déficits de memoria espacial, y no recuerdan nada que les
permita llegar a la plataforma.

¿Pero qué sucede si mejoramos genéticamente el funcionamiento de los receptores NMDA?


Aprenden más rápido.

3. Cambios cerebrales por la experiencia


El ensayo continuo de un tipo de ejercicio, en este caso el aprender a tocar instrumentos de
cuerda (violín), eso tiene un reflejo en la estructura cerebral. De sujetos que tocan el violín a los
que no, ¿habrá alguna diferencia en cuanto a las regiones corticales que se encarga del
movimiento?
Estudio en el que se ve es que cuantos más años hace que uno practica, la localización, es
decir, la cantidad de espacio que se ha movido extendido en la representación del área de
movilidad de cada dedo, es mayor. Cuanto más joven empiezas, mayor es el área de
desplazamiento que representa cada dedo en el homúnculo. Conforme se va ensayando y
cuando mayor flexibilidad y plasticidad neuronal tenemos más se ajusta la actividad neuronal a
la función. Mayor en la mano izquierda en la derecha. Diferencia entre el pulgar y el meñique,
es que el pulgar no lo utiliza, sino mucho más el meñique. El ejercicio específico modifica
específicamente modifica la representación en el homúnculo.
Estudio en taxistas
Taxistas en Londres hay un entrenamiento exhaustivo de carácter espacial. Se hizo una
comparación entre estos taxistas y conductores a pie de calle. Se vio que la diferencia no era
de todo el hipocampo, sino de la parte posterior del hipocampo, porque es la parte posterior
del hipocampo la que está relacionada con el aprendizaje espacial. Es más evidente en el
hemisferio derecho (aquellos que no son verbales) que en el izquierdo (más verbales). Hay
mayor crecimiento y mayor diferencia en cuanto al volumen de aquellos sujetos que llevan más
meses trabajando como taxistas, tienes posibilidad de mejorar en cuanto al aprendizaje.

Cuando uno no practica se olvida.


Se evaluó eso en otro estudio, de gente que no sabía nada de malabares. Se enseñó a la
gente a hacer malabares y se estudió el volumen. Sujetos antes de presentarse al estudio,
¿aumenta o disminuye la activación de la sustancia gris? Se les enseña a hacer malabares. Se
les hace otra resonancia y se observa que en ese grupo de sujetos hay un cambio en el que
aumenta la sustancia gris en esas dos regiones significativamente relacionadas con el control.
Después les obligamos a que no hagan malabares más veces. Pasados unos meses se les
evalúa de nuevo, lo que se aprende se empieza a reducir, por lo que ese tamaño empieza a
reducirse, no llega al nivel basal, pero aquello que no se practica empieza a tener menor
representación en el cerebro.

Coge un grupo de personas y les induce la ausencia de una función, les tapó los ojos,
provocando falsamente una ceguera durante una serie de días. Lóbulo occipital está entrenado
para la función visual. Les empezó a enseñar braille (somatosensorial). Las áreas visuales
(regiones occipitales) empezaron a tomar activación durante la lectura del braille
(somatosensorial activa las regiones occipitales) 5 días después. ¿Qué pasaba cuando les
quitaba la venda? A los 5 días de quitarle la venda todo volvía a la normalidad.

También podría gustarte