Documentos de Académico
Documentos de Profesional
Documentos de Cultura
A&C. § A: § Aa ≈ A: § Cc = Cp: § Ci ≈ Co: § E-E: Ei/Ec/E /E § Peda: § PO: § R-R: (≈ C: Conducta) ; RI/RC § Rf: § S-S: § Sn (Snc) § Ψ
A&C. § A: § Aa ≈ A: § Cc = Cp: § Ci ≈ Co: § E-E: Ei/Ec/E /E § Peda: § PO: § R-R: (≈ C: Conducta) ; RI/RC § Rf: § S-S: § Sn (Snc) § Ψ
La asignatura versa sobre un proceso cognitivo básico: aprendizaje (A), pero ni siquiera sobre
todas las formas de aprendizaje: solo el aprendizaje que resulta de asociar (mentalmente; es
un proceso mental, algo de lo que no hablan los conductistas) a través de la experiencia
eventos “contingentes” (relacionados, que covarían) del medio, con los consiguientes efectos
sobre la conducta: aprendizaje mediante condicionamiento (A…C*).
ÍNDICE
3- Experimentación Animal
4- Noción del Aprendizaje mediante Condicionamiento
b) A finales del siglo XIX se da el clima propicio para pensar que buena parte del
conocimiento y la conducta humana son aprendidos, por asociación. Gran importancia de
los mecanismos asociativos:
proceso psíquico fundamental por el que, a través de la experiencia, cambia el
comportamiento; se desarrollan nuevas pautas de actuación, nuevos contenidos mentales.
La Psicología surgió en torno al segundo cuarto del siglo XIX, pero este movimiento se
consolida en el siglo XX. La Psicología inicia en el siglo XX la investigación científica del
aprendizaje: concretamente, del aprendizaje mediante condicionamiento.
• Pavlov estudia cómo cambian las “conductas reflejas” por el desarrollo de asociaciones
estímulo–estímulo: condicionamiento clásico o pavloviano.
• Thorndike estudia cómo cambian las “conductas voluntarias” debido a sus consecuencias,
asociaciones respuesta–estímulo: condicionamiento informado u operante (que desarrollaría
Skinner más tarde).
• El conductismo desarrolla durante la primera mitad del siglo XX el condicionamiento clásico
y el instrumental: implanta la Psicología del aprendizaje.
• La Psicología actual continúa investigando y desarrollando el condicionamiento clásico y
el instrumental.
2. PROCESOS DE APRENDIZAJE
Todos los organismos nos adaptamos a nuestro entorno gracias a la capacidad de aprender.
Mediante el estudio, el entrenamiento y la experiencia, sea en centros de instrucción o en la
vida, aprendemos muchas cosas distintas de diferentes maneras a través de procesos
diversos. Son aprendidos todos los conocimientos y comportamientos que no responden a la
herencia genética, que no son innatos.
Aquí solo vamos a ocuparnos del aprendizaje mediante condicionamiento asociativo, que
se produce en la vida, se investiga en laboratorio –en gran medida mediante experimentación
animal– con importantes implicaciones prácticas en Psicología humana. Se les instruía para
que llevaran a cabo conductas arbitrarias.
Se puede hablar de dos mecanismos mentales generales de aprendizaje: desarrollo de
asociaciones entre eventos (ASOCIACIONISMO) y reestructuración mental
(CONSTRUCTIVISMO).
Asociacionismo: asimilando covariaciones y regularidades ambientales
El aprendizaje asociativo conductual constituye el proceso psicológico central para el
enfoque dominante en Psicología entre 1920–1960: conductismo, caracterizado por una serie
de planteamientos y supuestos que afectaron de forma decisiva la concepción del aprendizaje.
La disciplina de Psicología del Aprendizaje surge como tal, se consolida y adquiere la
máxima relevancia dentro de la corriente conductista.
Hoy, la investigación del aprendizaje mediante condicionamiento enfatiza cada vez más:
– Los procesos cognitivos que intervienen en el condicionamiento.
– El interés por su funcionamiento en las personas.
La conducta interesa en la medida en que nos informa de la naturaleza de la mente, que no
puede ser observada directamente.
– Sus bases neurobiológicas: en lugar de las bases comportamentales y ambientales.
La Psicología actual es mucho más integradora (ecléctica) que la que dominó la mayor parte
del siglo XX.
Ya no se puede hablar de escuelas o paradigmas cerrados.
- Asociacionismo computacional
- Punto 1.2.2
- Punto 1.2.3
3. EXPERIMENTACIÓN ANIMAL
Obviados los aspectos mentales y asumido el supuesto de equipotencialidad, inicialmente el
conductismo recurrió en gran medida a la experimentación animal (modelo/rata y
objetivo/psicología humana solo tienen que resultar comparables en la función relevante,
sometida a estudio), para investigar el Aprendizaje con control y rigor.
*No entra de la página 12 a la 17.
Ejemplo: tener ratas con cepas genéticamente modificadas, tener la certeza de que nunca han
sido sometidas a cierto estímulo.
Después, habría que adaptarlos en función de las diferencias entre especies, pero esto permite
estudiar los procesos básicos.
Genoma y sistema inmune similar entre todos y parecido con los humanos.
Ejemplo: una situación que de forma ineludible provoca una respuesta emocional, si esa
situación se repite cambia la reacción a raíz de esta experiencia; sobre todo si esas
repeticiones son contiguas en el tiempo.
ÍNDICE
1. Los reflejos
1. LOS REFLEJOS
- Reacciones innatas, por lo general simples, disparadas por un estímulo desencadenante.
Ejemplo: reflejo parperal (cerrar los párpados).
Se disparan automáticamente ante estímulos específicos y predeterminados: un objeto que
se aproxima rápidamente al ojo; mientras que, si cerramos los ojos de forma voluntaria,
podemos hacerlo por muchas razones diferentes.
- Son respuestas adaptativas rápidas, que no necesitan ser aprendidas. Son útiles
para la supervivencia. Intervienen en múltiples actividades importantes para sostener
las funciones vitales.
- También hay reacciones reflejas complejas, como las ‘pautas fijas de acción’ en
algunas especies animales, o ciertas reacciones emocionales en personas. Están
integradas por secuencias estereotipadas de respuestas.
Ejemplo: cuando los salmones, llegado el periodo correspondiente, remontan la corriente del
río con gran esfuerzo y riesgo para su vida, para desovar y reproducirse en zonas propicias, lo
hacen en la primera temporada tras haber nacido, sin necesitar experiencia de aprendizaje. Es
una reacción que resulta de la concatenación de diferentes acciones.
Ejemplo 2: rito de cortejo ante cierto elemento disparador (como una mancha en la hembra):
lleva a una serie de bailes, demostraciones de poder…
Boakers y Watson poniendo a prueba en la ‘barra-fija’ el reflejo palmar de la joven atleta. En
los humanos recién nacidos los reflejos son parte importante de su repertorio
conductual. Los bebés son capaces de sujetarse, incluso de sostener todo su peso, gracias al
reflejo palmar. El reflejo tiene su ciclo vital y acaba desapareciendo.
A nivel neurológico, en las respuestas reflejas:
- Intervienen como mínimo 3 tipos de neuronas / haces neuronales (nervios):
1) Sensitivas / aferentes: detectan la información, el estímulo desencadenante del
reflejo. Transmiten el mensaje sensorial al sistema nervioso central.
2) Motoras / eferentes: transmiten los impulsos para la ejecución de la reacción.
3) Interneuronas: conectan entre sí las dos anteriores.
Ejemplo: subida repentina de temperatura cuando ponemos la mano encima de algo caliente.
La neurona sensitiva lleva la información al sistema nervioso central, frecuentemente a la
médula espinal; de allí arrancan neuronas motoras que controlan la reacción o ejecución de la
respuesta refleja (retirar la mano inmediatamente) y, normalmente, también interviene una
interneurona que conecta la sensorial con la motora.
- Estos tres elementos conforman el ‘arco reflejo’ que, al estar integrado por células
sensorio-motoras específicas, hace que las distintas reacciones reflejas solo sean
desencadenadas por un conjunto limitado de estímulos.
El arco reflejo puede operar a nivel medular, aunque también suele transmitir señales al ser
modulado desde el cerebro. El cerebro interviene en la regulación/modulación del reflejo,
pues las neuronas sensitivas derivan información hacia el cerebro para informarle acerca de lo
que ocurre.
Ejemplo: un faquir que esté acostumbrado a entrar en contacto con fuego y aguantar, puede
no reaccionar de forma refleja ante el estímulo antes descrito, retrasar la respuesta o
reaccionar más despacio. Y al revés, si una persona sospecha que la encimera puede quemar,
puede que retire la mano antes que quien la toca sin querer. Es una potenciación del reflejo
regulada desde el cerebro: reaccionas preventivamente.
- Esto implica que la intensidad del reflejo ante un estímulo desencadenante puede variar
por razones psíquicas: manejadas desde el cerebro.
a. Habituación
- Reducción progresiva de los reflejos al repetirse los estímulos desencadenantes.
- Es lo que suele ocurrir, sobre todo cuando los estímulos desencadenantes no resultan
nocivos (es lo práctico) ni son muy intensos, o que el organismo no los considera como
nocivos.
- Especificidad en cuanto a los estímulos ante los que se observa. Desarrollada habituación
ante un estímulo específico, la atenuación de la responsividad resulta específica para ese
elemento u otros muy similares. A su vez, el hecho de que estímulos parecidos al habituado,
pero que no aparecieron durante el proceso de habituación, también dejen de generar
respuesta indica cierta generalización.
Es un cambio mediado por procesos neurológicos centrales. Hay un cambio en la
transmisión sináptica de las conducciones que intervienen en la conducta refleja, a raíz de la
repetición del estímulo desencadenante.
Esto lo pone de manifiesto la deshabituación: la intromisión de otros estímulos intensos y
novedosos durante el proceso de habituación a un desencadenante suele dar lugar a la
recuperación parcial de la respuesta habituada a ese evento.
No debe confundirse con otros cambios periféricos, como el cansancio o la adaptación
sensorial (vemos menos al entrar en una sala oscura después de haber estado al sol; al cabo
del tiempo, vemos de forma normal gracias a la dilatación pupilar).
El organismo deja de responder al estímulo aun cuando siga siendo perfectamente capaz de
sentirlo y de llevar a cabo las reacciones necesarias para responder.
Intensidad: parámetro importante de los estímulos desencadenantes. Cuanto más débil es,
más fácilmente se habitúa.
b. Sensibilización
- Incremento del reflejo al repetirse el estímulo desencadenante.
- Tiende a producirse cuando el estímulo desencadenante resulta nocivo.
- Aun así, suele acabar por aparecer habituación, si el sistema no sucumbe en esas
repeticiones.
Somos capaces de habituarnos casi a cualquier cosa.
Ejemplo: en el ámbito emocional.
Ejemplo 2: reflejo defensivo en gatos ante descargas sucesivas de diferentes intensidades. No
son destructivas. Se compara siempre con la reacción que tuvieron la primera vez que se
aplica el desencadenante. Se repite el desencadenante y se mide cada vez la reacción
defensiva.
– Descarga débil: habituación.
– Descarga media: cierto incremento a partir de la segunda vez (sensibilización), pero
finalmente acabó habiendo habituación.
– Descarga fuerte: sensibilización, aunque luego acabó reduciéndose (sin llegar a cruzar la
línea base; es decir, no hubo habituación respecto al nivel base, sino respecto al nivel máximo
que se alcanzó).
Si, entre medias, pasa mucho tiempo, puede ser que partamos de nuevo de la misma línea
base.
Los procesos oponentes subyacentes serían los procesos que ocurren en realidad. La
respuesta afectiva observable es el resultado de restar a – b.
Con la exposición repetida a la situación que altera la homeostasis, aunque el proceso a sea
el mismo (el sistema vuelve a llevar a cabo la bioquímica de la nueva dosis de morfina, por
ejemplo), la reacción compensatoria (dejar de producir endorfinas) alcanza intensidades
mayores y se mantiene durante más tiempo.
Los organismos poseen su propio mecanismo cerebral de producción de sedantes naturales,
las endorfinas. Cuando un organismo recibe este tipo de sustancias exógenas, reduce la
producción interna de endorfinas como reacción compensatoria. Esto explica parte de la
progresiva tolerancia de las drogas.
Al restar, puede que a gane un poquito al principio, pero pronto llega el momento en que
tiene más fuerza la reducción de producción de endorfinas que el efecto de la morfina.
Nivel de producción bajísimo de endorfinas: caes en un estado de inquietud,
hipersensibilidad, molestia.
Parece una habituación, pero realmente es una situación de sensibilización de la reacción
compensatoria, que cada vez funciona mejor. Pero el efecto de la situación desencadenante
es cada vez mejor, nos habituamos gracias a ese proceso de sensibilización.
Aunque se trata de un planteamiento en buena medida especulativo, hay alguna evidencia,
como por ejemplo con drogas como la morfina o la heroína.
Al final los adictos se ven atrapados no por el placer que les proporcionan los narcóticos, sino
por la necesidad de reducir el sufrimiento que les produce su abstinencia.
¿Por qué el proceso b es cada vez más intenso? La reacción compensatoria es mayor
cuando afrontamos las situaciones desencadenantes de la emoción de la misma manera, en
el mismo contexto.
Ejemplo: consumimos cocaína los viernes a las 9 de la noche con los amigos en un lugar
concreto, con determinada música…
Se observa que el efecto de la droga, con uso repetido, es cada vez menor cuando lo hacemos
de la misma manera. El organismo se acostumbra más, es más fácil compensarlo. La misma
situación actúa como estímulo condicionado; en esa situación, el organismo pone en marcha la
situación compensatoria (incluso aunque no se consuma droga). Aprendizaje por
condicionamiento.
En un contexto nuevo, hace de nuevo más efecto. Si hay sobredosis, se soporta peor en
nuevos contextos.
TEMA 3: Condicionamiento Clásico: Fundamentos
Cuando dos eventos covarían, tendemos a asociarlos. Esto afecta con frecuencia a nuestra
conducta.
Cómo se adquieren con la experiencia, a través del desarrollo de asociaciones, conductas
nuevas: emisión de conductas ya existentes por circunstancias que antes no las
provocaban, o desarrollo de nuevas configuraciones conductuales por la integración de
otras más elementales antes existentes, o aparición de conductas nuevas, o
modificaciones en la probabilidad y fuerza de actividades existentes y voluntarias.
ÍNDICE
1. Pavlov y el origen del Condicionamiento Clásico
2. Elementos del Condicionamiento Clásico
3. Respuestas susceptibles de ser condicionadas
a. Reacciones automáticas: Reflejos
i. Efectos de las drogas: pscofarmacología pavloviana
ii. Psiconeuroinmunología: inmunopotenciación condicionada
b. Acciones esqueletales: comportamiento
c. Motivación y afectividad: impulsos y sentimientos
4. Casos especiales: Inhibición condicionada, condicionamiento de 2º orden,
contracondicionamiento…
5. Curso de asociación
6. Generalización y discriminación
7. Importancia de disposición cronológica de estímulos
• Precondicionamiento sensorial.
• Grupo m-e: 9 dosis de morfina aplicadas en una cabina experimental especial (EC), en
días consecutivos.
El día de prueba (día 10) todos los animales recibían una inyección salina
en la cabina experimental especial. Muestra hiperactividad ante el placebo
en el contexto distintivo solo el grupo que había recibido aquí la droga.
Por la anticipación: habían asociado el traslado a la cabina (aspecto, olor,
textura…) con un incremento de morfina que, en el organismo, de forma
natural, conlleva la reducción de producción de endorfinas. El día 10 les
someten al mismo traslado. Se pone en marcha la acción compensatoria
pero no hay morfina, con lo que la reducción de endorfinas supone
hiperactividad.
Reacción compensatoria condicionada: potencia la reducción de endorfinas y no hay
morfina.
La hiperactividad mostrada por el grupo que antes había sido inyectado con morfina en esa
cabina especial era una RC producida por las claves del contexto como EC, que desencadena
una reacción compensatoria, en esta ocasión en ausencia de morfina que contrarrestar.
- Tolerancia condicionada
El condicionamiento de la reacción compensatoria podría explicar en parte el fenómeno de la
tolerancia:
pérdida de efectividad de las drogas con su uso repetido.
Mayor tolerancia cuando el consumo se repite en un mismo contexto específico (especificidad
situacional):
indicativo de condicionamiento clásico.
Eso puede explicar más muertes por sobredosis en contextos nuevos, donde no operaría la
reacción compensatoria condicionada. En el contexto antiguo (EC), el organismo se preparaba
y ayudaba a potenciar la reacción compensatoria; en un contexto nuevo, no hay reacción
compensatoria potenciada por condicionamiento, por lo que la dosis tiene mayor efecto.
Desde los años 80, Siegel trabaja con los efectos de las drogas.
Trabajo de Siegel y colaboradores con 3 grupos (1982)
Inyectaron a 2 grupos de ratas cantidades crecientes de heroína (con-exper-anter); un tercer
grupo recibía un placebo (sin-exper-anter). A uno de los grupos a los que inyectan droga les
llevan a un lugar especial para ello (el que será el contexto habitual).
El día de la prueba, inyectaron a los 3 grupos una dosis de heroína de 15 mg/kg.
Se midió el efecto de la sobredosis en cada grupo. Murieron casi todos los animales del grupo
sin experiencia anterior; menos en el grupo con experiencia en un contexto nuevo (más
tolerancia por haber tenido dosis previas y progresivas); y menos en el grupo con experiencia
en el contexto habitual.
• Reducción de la tasa cardíaca ante placebo: la nicotina la sube; como ahora no hay
nicotina, se observa una bajada con respecto a la línea base.
• Menor tasa cardíaca ante nicotina que si estas pruebas se llevan a cabo en contexto
diferente al del consumo.
Por eso, la necesidad de volver a consumir se da, sobre todo, si la persona se encuentra en
el mismo contexto en que suele consumir. Se disparan las reacciones orgánicas y
psicológicas que llevan a sentir esa necesidad. Si la terapia tuvo lugar en un contexto diferente
a aquel en que la consumía, es posible que no tenga efecto en caso de regresar a ese lugar.
Al disparar la reacción compensatoria, se necesita la droga en mayor medida que si no se
disparara.
3) Neurológicamente, el control pasa del córtex prefrontal (que permite elegir / inhibir la
acción; decidir cuál es la mejor respuesta para un problema o situación: función ejecutiva) a
áreas estriadas límbicas (que la disparan sin participación de la conciencia). Sistema
subcortical que lanza respuestas en función de la búsqueda del placer y la recompensa.
Se comparan los registros neurológicos de una persona que no consume una droga
habitualmente con los de una persona que la consume de forma compulsiva.
En otro trabajo de 2014 analizan las bases neurológicas. Presentan una espiral que
caracteriza la evolución psicológica y neurológica en los consumidores de drogas desde las
primeras veces en que la consumen hasta que la consumen compulsivamente. Depende de
factores ambientales, psicológicos (impulsividad…).
Analizan los factores que determinan si serás tragado por la espiral.
Se preguntan de qué depende que unos individuos desarrollen dependencia pese al daño,
mientras que otros lo abandonan al notar el daño. Depende de diferencias individuales
(autocontrol, impulsividad…).
Llevan a cabo un experimento con ratones: se entrena a los animales a conseguir droga, que
se autoaplica pulsando una palanca. Es una caja de Skinner en la que se conecta a
dispensadores con dosis de heroína.
En un momento dado, antes de que lleven a cabo la conducta de consumo de la droga muchas
veces, aplican castigo: pulsar la palanca no les proporciona droga y les da una descarga
eléctrica. Normalmente, se deja de pulsar la palanca (en las 2 condiciones).
Pero, cuando se lleva un historial muy largo de consumo de droga, muchas persisten en
pulsar la palanca.
Los individuos impulsivos siguen pulsando la palanca, pero los no impulsivos rápidamente
dejan de hacerlo.
No todo el mundo que consume drogas a un nivel de dependencia, por más efectos negativos
que le produzca, son capaces de abandonarla.
3.1.2. Psiconeuroinmunología: inmunomodulación condicionada
El sistema circulatorio no está relacionado con la Psicología de las personas como se pensaba,
sino que la Psicología está regulada y depende principalmente del sistema nervioso.
Existía la teoría de que la Psicología (sistema nervioso) de las personas afecta al sistema
inmunológico, integrado por células especializadas en defendernos, mediante la producción y
movilización de anticuerpos, de las infecciones, ataques de virus, bacterias… elementos
extraños que penetran en el organismo. De hecho, las personas que sufren depresión son más
sensibles a sufrir infecciones. Conexión sistema nervioso – sistema inmunológico.
El sistema nervioso regula el funcionamiento del sistema inmunológico. Uno de los
mecanismos por los que puede afectar al sistema inmunológico es el condicionamiento
pavloviano.
Ante el uso reiterado de fármacos inmunosupresores o inmunoactivadores la operación del
sistema inmunitario puede verse afectada por procesos de condicionamiento pavloviano.
Aparte de los trabajos del entorno de Pavlov (1926) y posteriores de Ader y Cohen (1975,
1982, 1993), investigaciones recientes de un equipo multidisciplinar: Buske-Kirschbaum,
Exton, Stockhorst, Goebel…
La primera observación en este contexto tuvo lugar cuando Ader observó que muchos
animales a los que sometía a experimentos sobre aversión adquirida a sabores morían.
Estudiaba la aversión adquirida (RC) al sabor de la sacarina (EC), emparejando su ingestión
con inyecciones de ciclofosfamida (EI), sustancia inductora de náuseas (RI). De esa manera,
el sabor de la comida disparaba las náuseas.
Se da a los animales un alimento nuevo; si en ese momento les sienta mal, es probable que
ya no vuelvan a comerlo. No se daría contingencia (covariación baja) si les sentara mal un
alimento en un determinado momento y ya lo hubieran comido muchas veces anteriormente.
Sucedió que, en la fase de extinción, en la que a los animales ya solo se les proporcionaba la
solución dulce, murieron algunos sin causa aparente.
Consultó a Cohen por qué morían los ratones experimentales. Consideró la posibilidad de que
las muertes guardaran relación con la ciclofosfamida, que además de producir náuseas es un
fármaco inmunosupresor.
Lo que las mataba era obligarles a comer o beber aquello que habían asociado a la
ciclofosfamida. Los animales habían ligado, mediante un proceso asociativo, la reacción
reductora del funcionamiento inmunológico generada por la ciclofosfamida al suero endulzado.
Al ingerirlo, sufrían problemas de salud debido a los microorganismos patógenos que siempre
hay en los laboratorios.
- Paradigma experimental
La metodología de todos los trabajos es parecida.
– Fase de adquisición: los sujetos son sometidos a varios emparejamientos de un EC
(distintivo, algo nuevo que tiene que ver con el sistema digestivo como un sabor
especial, porque se considera que es más natural asociar alteraciones en el sistema
inmunológico con la ingesta de un producto que con otros sentidos) con un
inmunomodulador (EI), que puede ser depresor o potenciador.
– Fase de evocación: el EI (fármaco) es reemplazado por un placebo, que reciben
junto con el EC (el sabor).
– La inmunomodulación condicionada es estimada por el cambio del sistema
inmune en esta fase, comparada con la condición de referencia. Se establece la línea
base de un individuo y se ve qué pasa con respecto a esta al darle el inmunomodulador
y el placebo.
4 fases de experimentación:
a) Condicionamiento inmunosupresor: caída del sistema inmunológico en animales.
b) Condicionamiento inmunosupresor: en personas.
c) Potenciación del sistema inmunológico: en animales.
d) Potenciación del sistema inmunológico: en personas.
En la primera fase, son tratados por igual todos los animales de todos los grupos: someten a
ratas a un severo racionamiento de agua.
En la segunda fase (emparejamiento, días 5, 8 y 11), según las condiciones experimentales,
someten a 4 grupos a emparejamientos EC-EI: (como tienen sed, beberán).
A las dos horas del último emparejamiento, midieron en ambos grupos el cambio, respecto a la
línea base, en producción de IL-2 por linfocitos T y de IFH-y (interferón) –valores
inmunológicos–. Así constataron los efectos inmunosupresores del CsA (SEGUNDO ANÁLISIS
→ efecto fármaco).
Los días 3–8 no los someten a tratamiento, para que no queden efectos residuales del
tratamiento del primer día. Midieron de nuevo los valores inmunológicos para comprobarlo
(TERCER ANÁLISIS).
Son todos reexpuestos durante dos días al EC, y se hace un análisis el día 10 para ver cómo
evolucionó el sistema inmunológico (CUARTO ANÁLISIS) con respecto a la línea base.
Resultados: efectos inmunosupresores significativos inducidos por el EC en el grupo
experimental (n), a diferencia del control ().
1. En el análisis del día 3 (efecto del CsA), los que tienen placebo lo tienen al nivel de la
línea base, pero los que recibieron el fármaco tienen una caída muy significativa.
2. En el último análisis hay una caída (no tan significativa) en el grupo experimental, pero
no en el control.
Esa caída no son secuelas del fármaco.
(La T hace referencia a la varianza intragrupo. El asterisco significa que las diferencias solo
cabría esperarlas por errores/casualidades un 5% de las veces. Es una diferencia significativa,
por tanto. Las diferencias que se observan entre el tratamiento control y experimental no
deberían ocurrir por azar o fallos. En caso de que ocurran en poca medida debido al azar o
fallos, tendremos diferencias significativas.)
Estimaron el efecto de los diferentes tratamientos en el funcionamiento de los NK comparando
su actividad cinco minutos antes (Pre-EC) y 20 después (Post-EC) de la presentación del
EC el quinto día.
Resultados: incremento de los linfocitos en el grupo EI (recibe epinefrina junto con el EC,
con lo que se suman los efectos condicionados e incondicionados) y en el grupo
‘condicionado’.
Sin embargo, esto no ocurre en los otros dos grupos control, en los que el sorbete dulce no
opera como EC.
- EC+: incremento de los linfocitos.
- CD: no se produjo la asociación.
- Sal: nunca ha sido sometido a condicionamiento.
Ensayo clínico
- Olor distintivo (EC) emparejado con etanol (EI) también genera incremento de la
interleucina-6 (condicionamiento clásico en el sistema inmunológico) y, por tanto, puede
potenciar el consumo condicionado de alcohol.
- Este trabajo, que recurre al alcohol como modificador del sistema inmunológico, resulta
relevante para los 2 últimos apartados: CP de 1) alteración del sistema inmunológico – y
ansiedad; 2) consumo de alcohol.
• Seguimiento de señales.
• Pautas de comportamiento sexual (las veremos en el siguiente punto, al hablar de la
motivación y la efectividad).
*No entra el epígrafe de la página 62-63. Tampoco el apartado 3.3.1.2, efectos de la insulina,
pág. 63-65.
Después de algunos ensayos en los que una tecla de la caja experimental en la que se
encontraban palomas se iluminaba unos segundos antes de que apareciera comida en el
dispensador de alimento, Brown y Jenkins vieron que estas tendían a dirigirse a la tecla y
picotearla, en lugar de encaminarse al comedero.
Para conseguir la comida, las palomas no tenían que hacer nada: esta les era presentada,
precedida por la iluminación de la tecla, cada 15 segundos, con independencia de lo que
hicieran.
Por tanto, picotear la tecla no era una conducta instrumental, ni tampoco una reacción
espontánea y natural ante una tecla que se ilumina, ya que solo tienden a picotear la tecla
cuya iluminación precede de forma sistemática a la comida.
Al ver que picoteaban la tecla, se llevó a cabo un experimento: si son palomas, quizá creen
que la luz pequeña y amarillenta es un grano de maíz (reacción espontánea y natural).
Trabajaron con 2 grupos:
1) Iluminación de la tecla y alimento contingentes.
2) Recibían comida la mitad de las veces cuando la tecla estaba encendida y la otra
mitad cuando estaba apagada.
En el segundo caso no se produjo automoldeamiento. No era una reacción instintiva la que
habían percibido, sino que era una reacción producida por la asociación EC-EI: la reacción es
una RC pavloviana debida al emparejamiento iluminación–alimento.
A veces, esta tendencia puede llegar a operar incluso cuando las circunstancias son tales que
la vuelven disfuncional. En otro experimento, del propio Jenkins, había dos teclas que se
podían iluminar. Una se iluminaba antes de la presentación de la comida, la otra estaba
descompaginada. Las palomas solo tenían 4 segundos para conseguir la comida.
Tras varios ensayos, las palomas corrían hacia la tecla ligada al alimento cuando se
iluminaba, la picoteaban y luego iban al comedero. No siempre llegaban a tiempo, pero
seguían respondiendo a la tecla iluminada antes de ir a por los granos.
Conclusión: los animales desarrollan una fuerte atracción hacia los estímulos asociados con los
refuerzos, aun a costa de perder estos últimos.
En el medio natural, el seguimiento de indicios suele resultar funcional para satisfacer las
necesidades.
- Experimento: Seg-Señal etanol (Krank et al, 2003-2008). Fases en la caja de Skinner:
– Condicionamiento instrumental: entrenan ratones sedientos a obtener una solución dulce
pulsando una palanca.
– Condicionamiento pavloviano: se enciende una luz encima de la palanca, de cuando en
cuando, durante 10 segundos. Antes, pulsándola, les proporcionaba la solución dulce, pero
ahora está retraída de forma que no pueden pulsarla.
También miden otras variables típicas: aproximarse a la señal, interactuar con ella como si
fuese el etanol.
Se aproximan más a la luz próxima (Seg-señal).
Cuando se comparaba la vasija asociada con agua y la asociada con AC, bebían bastante más
de la AC.
Cuando comparaban asociada con agua y asociada con AG, bebían más de la AG.
Cuando comparaban asociada con AG y AC, ganaban las grasas.
Ganaron las grasas. Aunque esto variaba según el grado de privación alimenticia con que
accedían a la prueba.
- Condicionamiento del apetito (la ingesta)
Fenómeno de “resistencia contextualizada a la saciación”: los estímulos neutros (sobre
todo el contexto) presentes durante la ingestión de alimentos en individuos hambrientos suelen
inducir consumo, incluso cuando los individuos están saciados.
Experimentos de animales hambrientos, alimentándolos en presencia de diferentes
contextos, con estímulos ambientales concretos.
En un experimento, se expuso repetidamente a ratas hambrientas a un tono de 4,5 minutos a
la vez que les proporcionaba comida. Luego, en la fase de prueba, se les tiene comiendo
hasta que paren espontáneamente, sin límite, hasta que se sacien. Cuando han parado de
comer, se introduce el tono que se utilizó para darles de comer cuando estaban hambrientos, y
entonces vuelven a comer en torno al 20% de su ración normal.
Esto puede ocurrirnos también a los humanos. Por ejemplo, cuando nos llega el olor de una
parrillada y nos despierta el apetito, o cuando ir a casa de la abuela hace que entre hambre.
Preferencia condicionada de lugar: desarrollamos preferencia por aquellos lugares que nos
han dado buenas experiencias.
Se mide la permanencia media junto al EC durante la fase de adquisición (a) y de prueba
ulterior (b), indicativa de desarrollo de preferencia condicionada de lugar.
Los animales en los dos grupos experimentales, sobre todo los que disfrutaron de la
oportunidad de copular, muestran una tendencia creciente a permanecer junto al EC.
Vuelven a estar en la cabina y en un momento determinado aparece el monigote en esa misma
zona.
No solo toman cariño por el lugar que ocupa el EI (hembra receptiva), sino también por el
lugar que ocupa el EC (monigote). Esto es indicativo de que el EC se ha convertido en una
señal atractiva, excitatoria, con valor en el ámbito del impulso sexual.
En seres humanos, el desarrollo de preferencias por cosas asociadas con el sexo se denomina
fetichismo.
- Trabajo 2: el buen ambiente (contexto) asociado con la sexualidad ayuda a que funcione
mejor.
Se hicieron 2 grupos de palomas macho:
Esto tuvo unos efectos hormonales notables cuando, en una prueba ulterior, ambos grupos
fueron expuestos en esa cabina a hembras receptivas. Los animales del ‘grupo
condicionado’ producen mayor cantidad de semen y mayor concentración y numero de
espermatozoides al eyacular en el contexto previamente ligado a la oportunidad de copular.
Además, se observó la consecuencia reproductiva lógica de todo lo anterior: la presencia en un
encuentro sexual de un elemento previamente condicionado incrementó la prole resultante.
- Trabajo 3: potenciación de la activación neural de regiones del cerebro que median en las
respuestas sexuales que siguen a la exposición de estímulos condicionados que predicen la
cópula.
Los estímulos condicionados asociados con la conducta sexual producen actividad en áreas
cerebrales que median esta conducta sexual, e incrementan el éxito reproductivo al ser
expuestos antes de la copulación.
En el estudio, en un grupo se emparejó un EC con la cópula y en otro no. En el grupo
emparejado, el EC dispara movimientos copulatorios. Incluso aumenta la fisiología de la
conducta sexual (secreción de esperma).
3.3.3. Aprendizaje del miedo
Se habla de ansiedad, fobia, miedo patológico, ataque de pánico (crisis de angustia que, en
algunos casos, incluso conlleva miedo a morir), síndrome de estrés postraumático… Diferentes
manifestaciones emocionales de miedo parecen ser sensibles al condicionamiento. Se habla
de respuesta emocional condicionada (REC).
Sin embargo, el miedo puede tener otros orígenes diferentes a procesos asociativos por
condicionamiento.
Hay miedos innatos, al margen de experiencia o aprendizaje; otros son aprendidos: culturales
(por mecanismos inferenciales, raciocinio, leyendas), que no implican aprendizaje por
condicionamiento.
El miedo es el aspecto psicológico (y neurobiológico) más estudiado en el área del
condicionamiento pavloviano.
Ejemplo que fue referencia: experiencia de Watson con el pequeño Albert. Demostró que
se podía desarrollar miedo aprendido. A base de exponer al niño a la presencia de un ratoncito
a la vez que detrás hacían sonar un gong intenso, en unas pocas experiencias, al presentarle
una mascota de este tipo, rompía a llorar y huía. Incluso a pesar de que previamente le
gustaran esos animales.
A partir de ahí, se consideró que algunas emociones podían condicionarse.
Principal problema al estudiar el miedo en animales: cómo medirlo (la estimación). Una de las
formas que se utilizó es lo que se denomina ‘congelación’.
Cuando algo le asusta, hay varias formas de reaccionar. Una es hacerle frente y pelear; otras
veces, si el estímulo no se puede vencer fácilmente, es huir; por último, si no hay posibilidad
de escapar, es la congelación: tratar de pasar inadvertido, interrumpiendo cualquier actividad.
1) Se establece una conducta que los animales realicen de forma notable, con cierta
frecuencia y estabilidad, y se mide la frecuencia de la conducta. Se puede consolidar
una conducta instrumental mediante condicionamiento operante (como pulsar una
barra para conseguir comida).
Se establece una fórmula para calcular cuánto miedo le da: índice de congelación, calculado
con la razón de supresión (en lugar de comparar la frecuencia absoluta, se utiliza una escala
ponderada que equipare a todos los organismos).
𝐵
RzS =
𝐴+𝐵
A: frecuencia de la conducta en un periodo sin estímulo que le dé miedo (en ausencia del EC).
B: frecuencia de la conducta en un periodo equivalente cuando tiene miedo (con EC).
1. Valor máximo de la razón de supresión: ½ = 0,5. Si el elemento no le da miedo en
absoluto y no lo altera, realizará la conducta el mismo número de veces que si ese elemento
no estuviera presente.
2. Valor mínimo: 0. Que le dé tanto miedo que, en presencia del EC, interrumpe la conducta
por completo. 0/A = 0.
Ejemplo: experimento de condicionamiento de miedo con un sonido que predecía descargas
fuertes o tenues. Las descargas tenues no congelan el comportamiento, no dan miedo, razón
de supresión es 0,5. Si es intensa, el animal prácticamente deja de realizar la conducta: razón
de supresión 0.
¿En qué supuesto se observa mayor REC? En aquel que dé una razón de supresión más
baja. Dentro de esta escala, la intensidad del miedo guarda una relación inversa con el valor de
la razón de supresión: a menor razón, más miedo.
Recientemente se verificó congelación en personas ante estímulos sociales amenazantes
Se presentó a mujeres rostros de personas. Reducción de movimiento corporal (y
bradicardia) en situaciones ante rostros con expresión de enfado.
Ejemplo:
A: 13, 11, 6
B: 4,3,2
RZS = a) 23 / b) 0,21 / c) 0,25
A menor razón de supresión, mayor congelación, mayor miedo.
- Realidad virtual
En una clínica para corregir fobias, se les expone de forma virtual a los objetos que producen
miedo. Menos costoso y más fácil. Índice del miedo: respuesta psicogalvánica (RPG) u otras,
en lugar del índice decongelación.
En un experimento, manejaron como ECs imágenes dinámicas de serpientes o arañas, y
como EI estimulación eléctrica molesta. Trabajaron con un paradigma de condicionamiento
discriminativo: en unas ocasiones aparecía un EC+ (que para unos participantes consistía en la
incursión de una serpiente en la escena virtual, para otros de una araña) seguido algunas
veces de una descarga; en otras ocasiones aparecía un EC– (incursión de una araña o una
serpiente, según el participante), que nunca iba seguido de descarga.
Al día siguiente volvieron a exponerlos unas veces al EC+ solo y otras al EC–, en el mismo
contexto o en uno diferente.
Resultados:
– Primer día: incremento significativo de RPG ante el EC+ en comparación con el EC–,
indicativo de desarrollo de miedo condicionado al elemento emparejado con el EI.
– Segundo día: se mantenía esta RC diferencial en el grupo expuesto al EC en el mismo
contexto que el del día anterior (fase de adquisición), mientras que prácticamente desaparecía
en el grupo expuesto al EC en contexto cambiado.
Se observa, por tanto, desarrollo de miedo a la clave predictora de descargas, pero su
persistencia en el tiempo resulta mediatizada por el contexto.
- Psicópatas
2016. Contra lo que se había pensado, encuentran que los psicópatas, al menos los primarios
(predisposición orgánica al comportamiento carente de reglas y empatía), muestran incremento
en la actividad de la amígdala en el CP del miedo.
Normalmente se pensaba que los psicópatas no tienen sensaciones de miedo que les disuadan
de llevar a cabo conductas. Se demuestra que no es del todo cierto: algunos sí condicionan
miedo.
Ejemplo: desarrollaré más aprecio por una persona si siempre me la encuentro en una
situación agradable, que si me la encuentro en una situación desagradable. Mi imagen de la
persona se puede ver afectada por el entorno.
Ejemplo: pasar de una relación binaria (EC-EI, dos estímulos) a relaciones condicionales
(con un tercer elemento modulando la relación EC-EI).
Las relaciones condicionales ocurren con frecuencia en la vida. Ejemplo del experimento en el
que claves interoceptivas tenues iban seguidas de alteraciones interoceptivas más potentes, en
un contexto sí y en el otro no. De esa manera, la respuesta solo se producía en un contexto.
En este apartado veremos:
• C inhibitorio
• C de 2º orden
• Contracondicionamiento
• Aversión adquirida a sabores.
Aunque todavía no hemos formalizado el concepto de contingencia, podríamos decir que hasta
ahora hemos visto CP cuando:
Probabilidad de EI/EC > probabilidad del EI/ sin EC= CP – excitatoria. (llamémoslo C
excitatorio): el EC señala la presencia del EI. (Ley de la contingencia).
¿Pero qué pasa cuando Probabilidad del EI/EC < probabilidad del EI/ sin EC?
Condicionamiento inhibitorio = inhibición condicionada: el EC se convierte en
señal de ausencia del EI. (Si es la misma, no se asocia.)
Esto es una forma de general contingencia positiva y negativa: CP excitatorio e inhibitorio.
Depende de que ocurra con ellas por separado, no solamente cuando aparecen juntas.
- Contigüidad: Aparecen los dos fenómenos a la vez, sin que haya relación entre los
mismos.
Ahora vamos a ver otra forma diferente y sencilla de inducir CP inhibitorio de un EC que
opera como señal de ausencia del EI (ej. De relación condicional en CP).
Ej. Levanta mano con puntero, descarga, no levanta la mano con puntero, no hay descarga. Si
vuelve a levantarla con puntero, y no hay descarga, el puntero se convierte en señal de
ausencia de descarga en un contexto en que se esperaba la descarga.
Forma de inducirlo: alternar ensayos tipo A y tipo B. En el tipo A, el sonido se asociará con la
descarga.
– Tipo A: se le presenta el EC positivo (EC+) junto con el EI, por ejemplo, sonido con
descarga = condicionamiento excitatorio.
– Tipo B: se presenta el EC+ junto con un EC negativo (EC–), y sin EI = hay sonido
con una luz, pero no hay descarga, condicionamiento inhibitorio.
De esa manera, conforme se repiten los ensayos tipo A, el EC+ va adquiriendo valor
de señal del EI, mientras que a lo largo de los ensayos tipo B el EC– adquiere
propiedades inhibitorias, al aparecer en un contexto excitatorio (generado por el
EC+) para el EI, pero sin él.
Detección: saber que el EC– ha desarrollado condicionamiento inhibitorio con respecto al EI.
Mediante el retraso observado al condicionar luego el EC–, es decir, al emparejar el EC– con
el EI. Intentamos condicionar el EI con el EC–; usando un grupo control, se observa que
desarrolla mayor condicionamiento de miedo al sonido que el grupo que previamente desarrolló
condicionamiento inhibitorio del sonido con respecto a la descarga. Antes de que el sonido se
convierta en señal de descarga, hay que destruir la asociación sonido–ausencia de descarga.
Ejemplo:
– Sonido aparece repetidamente seguido de una descarga, pero NO cuando le acompaña una
luz. ¿Qué ocurre con esta?
Primero se condiciona un EC que luego se usa para condicionar otro EC. Se utiliza como EI un
EC. Un elemento originalmente neutro produce una RC por haber sido emparejado con otro
cuyas propiedades motivacionales son adquiridas, es decir, previamente condicionadas, y no
innatas. El elemento que funciona como EI lo hace por haber sido convertido antes en EC.
Más difícil de lograr y menos intenso que el de primer orden. Curva diferente: demasiados
ensayos lo reducen. En la segunda fase, se presenta el EC1 sin el EI, y con muchos ensayos
se extinguiría su asociación con el EI. No sigue la curva de incrementos graduales indefinida,
sino que puede darse lugar siempre que no haya demasiados ensayos de condicionamiento de
segundo orden, porque podría perder sus atributos y el condicionamiento de primer orden.
¿El sonido generará respuesta de miedo? Como la luz había condicionado, podemos usarla
para condicionar un sonido. Eventualmente, es posible que llegue a tener lugar
condicionamiento de tercer orden, pero cuanto más elevado sea el nivel de transferencia,
más difícil resulta que se produzca condicionamiento de orden superior.
Aprendizaje vicario: Aprender por observación de los otros, en cabeza ajena. Ej.; ves que
una conducta es recompensada, y otra castigada, ayudará a aumentar la probabilidad de
realizar aquella que tenga consecuencias positivas.
Ej.: Monos jóvenes que todavía no temen a las serpientes si ven a otros monos que ante la
serpiente ponen cara de pánico o muestran reacciones con expresión facial indicativas de
miedo, los monos jóvenes aprenden a temer a las serpientes sin haber tenido ningún tipo de
altercado con las mismas.
Interés clínico: esto les lleva a pensar que ésta puede ser en ocasiones la razón por la que
sufrimos fobia a EE, incluso sin recordar haber tenido experiencias traumáticas previamente.
Desde el punto de vista clínico, el CP de 2º orden, y más en los casos de aprendizaje vicario,
podría justificar por qué algunas personas con fobia no recuerdan haber sufrido experiencias
traumáticas con el E que les genera fobia: no las han sufrido, propiamente.
En ambos casos se manejan dos ECs, y mientras uno (el EC1 o el EC+) se empareja con el
EI, otro (el EC2 o el EC–) se empareja con el EC anterior, pero sin el EI. Por tanto, el
segundo EC señala que, en su presencia, al otro EC no le sigue el EI. Así que, en un
procedimiento de segundo orden, EC2 debería generar inhibición condicionada, lo mismo
que vimos que sucedía con el EC.
Que se observe uno u otro condicionamiento depende del procedimiento y del número de
ensayos. En los primeros emparejamientos de segundo orden, el EC2 puede adquirir
propiedades excitatorias, pero si se repitieran los ensayos mezclados, el EC2 cada vez
señala más claramente la omisión del EI ante el EC1, lo que termina por otorgarle al EC2
propiedades inhibitorias.
4.3. Contracondicionamiento
Se podría pensar que tiene lugar en el síndrome de Estocolmo: las víctimas acaban
sintiendo afecto por los secuestradores y sus causas, valorándolos positivamente.
El aspecto, sabor y olor de los alimentos se asocian con el malestar experimentado después
de consumirlos, lo que lleva a desarrollar aversión a esas claves alimenticias.
El autor que destacó más por retomar e investigar este asunto es García, junto con Rescorla,
cuyo primer artículo (que contravenía las ideas que había en el momento) fue rechazado al
principio, aunque acabó siendo publicado e influyó a partir de los años 60 en los trabajos
acerca de condicionamiento. Tenía cierto conocimiento sobre esto gracias a la observación
natural de la “vergüenza-al-cebo” mostrada por los ratones, pues era agricultor y había
ratones que se comían los granos. La solución era envenenarlos. Algunos comían suficiente
dosis de veneno y morían, pero los que sobrevivían desarrollaban un aprendizaje muy
rápido: habiendo comido eso que nunca antes habían comido, y habiéndoles sentado mal, no
volvían a comerlo. Desarrollaban una aversión muy fijada a los parámetros de sabor del
veneno. Pensó que sería un proceso de condicionamiento pavloviano: asociar el sabor del
veneno con el malestar que les había producido; a partir de ahí, lo rechazaban. Sin embargo,
había algo que no acababa de cuadrar: si los animales asocian la enfermedad con las claves
que rodean al alimento, deberían desarrollar aversión al lugar en el que estaba el veneno,
pero eso no ocurre.
Ante esa idea, hizo experimentos: daba a ratones una solución dulce que nunca hubieran
probado, y cada vez que utilizaban el dispensador sonaba un clic sonoro y un destello
luminoso. Quería ver qué estímulo de esos 3 era asociado con las náuseas que producía
una inyección que les aplicaba.
Consumo de H2O en función del EC y del EI (consecuencias) con que ha sido asociado.
En un segundo experimento, emparejaban los mismos ECs, pero el EI era una descarga
eléctrica en las patas que producía dolor externo, en lugar de la droga inductora de náuseas.
El día de prueba era similar al del primer experimento. Encontró lo contrario: en este caso, si al
beber se dispara el clic y la señal visual, como la descarga era aplicada externamente,
esas claves externas interferían con su conducta y, asociadas con la descarga, provocaban
que no bebiera. Dejaban de beber agua cuando iba acompañada de señales exteroceptivas.
Sin embargo, el sabor del agua no se había asociado con el dolor externo: consumían agua
dulce con normalidad. ECs exteroceptivos se asocian con dolor por shock y produce
supresión.
Contradice la ley de la contigüidad, que dice que dos cosas que ocurren juntas (sobre todo
si la experiencia se repite: principio de frecuencia) se asocian entre sí. Se ha observado
aversión adquirida al sabor con un solo emparejamiento y con demoras entre el EC y el EI de
hasta 12 horas, lo que infringe los principios de la frecuencia y la contigüidad. También el de
aprendizaje progresivo, ya que aprendemos con un solo emparejamiento, un solo ensayo.
– Grupo experimental (rayos X): ponían una solución dulce y, mediante rayos X, les inducían
náuseas pasados diferentes intervalos, desde 0 hasta 24 horas.
– Grupo control (falsa exposición): dan solución dulce y llevan a cabina experimental, pero
sin rayos X.
Resultado: si las náuseas las daban 24 horas después de haber bebido, bebían con
normalidad. Si tenían náuseas hasta 12 horas después, mostraban una caída en la tendencia a
beber la solución dulce. Incluso con una separación entre el EC y el EI de 6 horas, todavía se
producía asociación intensa.
Se está desarrollando en España un programa, parece que muy solicitado por viticultores de
diferentes países, basado en la aversión condicionada a sabores. Usan rebaños de ovejas para
que pasten y limpien de hierbas los viñedos, sin que se coman los brotes de las vides.
En un primer ensayo dejan que las ovejas coman el nuevo manjar: los brotes. A continuación,
les induce náuseas mediante un producto emético. Parece que a partir de ese momento ya
no vuelven a comer los brotes.
Se limitan a la hierba: un sistema natural, barato y ecológico para mantener limpios los viñedos.
Revisión: Aversiones condicionadas al sabor, desde el veneno hasta las drogas. ACS
como mecanismo defensivo del sistema alimenticio.
– La ACS no opera sola: viene acompañada por neofobia al sabor (fobia a sabores nuevos),
otro mecanismo saludable, que en casos exagerados puede devenir en trastorno.
– EC: olor, sabor (su combinación: flavor), temperatura, textura de alimentos. Sobre todo,
NUEVOS.
– Aprendizaje incluso con demora EC-EI larga: hasta 24 horas (contigüidad prácticamente
nula).
– Aprendizaje de un-solo-ensayo.
– Detección temprana: comienza a funcionar incluso con pequeñas dosis de EI. Si solo se
diera aversión con dosis grandes, podría poner en peligro la supervivencia.
– Drogas Psicoactivas y Dolor Interno (muscular) pueden producir también alguna ACS. El
dolor externo no funciona.
5. EL CURSO DE LA ASOCIACIÓN
Extinción de la RC
Cada nuevo ensayo hará que se reduzca la asociación del EC y del EI y, por tanto, su
capacidad para producir la respuesta condicionada, hasta que esta deje de darse.
Ej.: sufre una agresión en un ascensor. Asocia ascensor con colapso. Se le vuelve a llevar a un
ascensor, para que aparezca EC, pero no EI, hasta que la RC desaparezca. Si aparece de
nuevo la RC, habrá que tratarlo.
A nivel neurológico, existe evidencia de que una neurona que reciba neurotransmisores
excitatorios suficientes para disparar su actividad eléctrica puede verse bloqueada por los
neurotransmisores inhibitorios recibidos de otras neuronas. Que una neurona se dispare o no
depende de la correlación de neurotransmisores excitatorios e inhibitorios que reciba.
6. GENERALIZACIÓN Y DISCRIMINACIÓN
Existe una forma de entrenar a las especies para que presenten discriminación. Es un
entrenamiento discriminativo.
Para perros: cuando aparecía una circunferencia, había comida; con figura ovalada, no la
había. Los perros aprendieron a salivar solo ante las circunferencias.
Si iba cambiando las figuras y ya no era capaz de distinguir si era circular u ovalada, los
animales manifestaban inquietud: neurosis experimental. Puede inducir neurosis en los
animales sometiéndolos a un entrenamiento discriminativo que luego sean incapaces de
discriminar.
Hasta ahora, habíamos partido de la ley de contigüidad entre EC y EI, pero sabemos que no
basta con eso, sino que debe haber contingencia. Al fin y al cabo, las cosas más contiguas son
las que ocurren a la vez, algo que no funciona: la señal debe preceder al EI.
De mejor a peor condicionamiento: demorado > de huella > simultáneo > retroactivo.
Después de una práctica prolongada, los organismos aprenden que el EI no tiene lugar hasta
pasado un buen rato desde que aparece el EC, por lo que tienden a inhibir la RC hasta un
momento próximo a la aparición del EI.
TEMA 5: Condicionamiento Instrumental I – Refuerzo Positivo
1. ANTECEDENTES HISTÓRICOS Y NOCIÓN DE CONDICIONAMIENTO INSTRUMENTAL
(CI)
Las respuestas que dan los organismos no son reflejas, sino que están controladas.
- Antecedentes históricos
Los animales comienzan actuando por ensayo y error: emiten diferentes respuestas con
diferentes probabilidades. Las respuestas que van seguidas de consecuencias satisfactorias
ven aumentada su probabilidad en ese contexto.
A esto lo llamó la ley del efecto: las conductas que van seguidas de consecuencias
satisfactorias tienden a conectarse con la situación en la que se produjeron, de manera que
cuando se repita la situación, será más probable que vuelva a tener lugar la misma conducta.
Y cuantas más veces se repita (ley del ejercicio) y más intensa sea la satisfacción, más se
fortalecerá la asociación.
Interpretación de Thorndike de la ley del efecto:
El refuerzo de una conducta (R) mediante un estímulo reforzante (ER) en un contexto dado
(EC) produce asociación EC–R, lo que incrementa la probabilidad de esa conducta
instrumental en ese contexto.
¿Qué hacen los animales si los colocas en la caja de partida y están hambrientos? En un brazo
hay una recompensa, en otro no. Variaban en complejidad, y también en el tiempo que
tardan en presentarles los laberintos (para estudiar la memoria).
Si hay veces que aparece el alimento a la derecha y otras a la izquierda, ¿qué hará? También
se les pueden poner pistas para que las asocien con el alimento.
O también se pueden utilizar diferentes refuerzos para ver su valor incentivo, es decir, con
qué intensidad llevan a cabo una conducta con cada tipo.
Tiene dispositivos que los animales pueden manipular y, por tanto, emitir respuestas con
ellos. También tiene dispositivos que permiten aplicarles recompensas y castigos. Además,
se puede programar para que la aparición de refuerzos o castigos siga diferentes patrones
según la conducta del animal. Hay claves contextuales (visuales, acústicas…). Si recibir
comida depende de que pulsen una palanca, puede ser que solo funcione si está encendida
la luz azul, pero no si está encendida la roja. Se combina el condicionamiento clásico y el
instrumental.
Registro acumulativo: rodillo con plumillas que estaba conectado con la caja de Skinner y,
cada vez que el animal emitía la respuesta de interés, la plumilla lo señala dibujando un salto.
Permite estudiar la evolución de la tasa de respuesta (qué frecuencia, qué persistencia) y su
acumulación total a lo largo del proceso.
En estos casos, la asociación original no se destruye del todo, sino que es contrarrestada por
un nuevo aprendizaje que la enmascara. Cuando un individuo es sometido, después de un
proceso asociativo, a un tratamiento de extinción, es como si se le estuviera diciendo que en
este momento y situación esa conducta no funciona de aquella manera, pero puede volver a
hacerlo en el futuro.
a) Una conducta puede generar un evento o suprimirlo: contingencia positiva (la acción
provoca el evento) o contingencia negativa (la acción suprime el evento).
Ejemplos:
– Dar azote a niño por arrojar macetas desde 5º piso: castigo / castigo positivo.
– ‘Arrepentidos’ que redimen pena por dar información valiosa: escape / evitación / refuerzo
negativo.
– Dar una propina a un niño por haber hecho un recado: recompensa / refuerzo positivo.
– Madre que dice: “Brais, si vuelves a morder al perro no te querré”: omisión / coste de
respuesta / castigo negativo.
El castigo tiene mala prensa y cada vez está más prohibido con personas, animales
domésticos e incluso con animales vertebrados superiores. El tratamiento por omisión es a
menudo el preferido para disuadir conductas indeseables en personas, porque, a diferencia del
castigo, suele tener una eficacia notable sin necesidad de recurrir a estimulación aversiva, con
el consiguiente ahorro de efectos secundarios perniciosos.
No confundir:
[EC – R] →ER
Son 3 elementos:
3) Contexto (EC).
El contexto también puede marcar la relación entre conducta y consecuencias. Por ejemplo,
si a un niño solo le regaña su madre por hacer algo, podrá hacerlo en presencia del padre; si
hay un radar, el conductor relaciona la conducta con sanción y baja la velocidad, pero si no hay
un radar aumentará la velocidad.
- El CI permite:
Thorndike propuso el concepto de ‘pertinencia’ para justificar por qué unas conductas se
condicionan con más facilidad que otras, variando la pertinencia en función del tipo de
refuerzos, la especie, el estado de motivación del organismo… Según las especies y los
refuerzos en juego, unas conductas resultan más relevantes que otras en términos naturales,
por razones adaptativas.
3.2. El refuerzo
(Nos quedamos con este concepto, pero tenemos el caso de las estimulaciones sexuales
táctiles: no reducen impulsos.)
Estímulos
– Refuerzos sociales: refuerzos (cualquiera de las 4 variables) que nos aplican los
congéneres. Estimulación generada por miembros de la misma especie. Ejemplo: sonrisa
(primario), piropo (secundario).
– Estimulación sensorial: para muchas especies, es un refuerzo primario, pero puede tener
valencia diferente para diferentes personas. Ejemplo: a un niño lo lanzas al aire y puede ser
que le guste o no.
– Estimulación cerebral directa: activar el centro del placer (ciertos núcleos de la amígdala) si
se lleva a cabo una conducta determinada.
Premack propuso que muchas actividades también pueden funcionar como refuerzos.
Dadas 2 actividades de probabilidad diferente, si la oportunidad de realizar la más probable se
condiciona a que se aumente la realización de la menos probable, la menos probable se
verá potenciada. La oportunidad condicional de realizar la más probable puede ser utilizada
como refuerzo de la menos probable.
¿Cuál funciona aquí como conducta instrumental: la más o la menos probable? (actividad
que genera la consecuencia) La menos probable, porque la haces para conseguir la
conducta más probable, que es la que te resulta agradable.
Ejemplo: Lenxa juega muchas horas al día (4 horas) y lee poco (1 hora). Si la posibilidad de
jugar (más placentera) se condiciona a leer más (menos apetecible), esto hará que lea más. El
poder jugar es la recompensa.
(Timberlake y Allison, 1974). Hablamos de conductas más o menos probables que forman
parte del repertorio natural de conductas. En este caso, puede ser que la conducta poco
frecuente nos guste mucho, pero que tenga un periodo refractario (no nos apetece cuando
acabamos de hacerla).
Para que una actividad A sea potenciada (reforzada) por dar acceso a la actividad B, basta
con someter B a restricción, a menos que se aumente A. En este caso, la actividad A
funciona como conducta instrumental.
Según este nuevo planteamiento, para poder utilizar una actividad para reforzar otra ni siquiera
es necesario que la reforzante sea más probable que la instrumental. Basta con que la
reforzante no se pueda realizar en su frecuencia espontánea ideal a menos que se aumente la
realización de la instrumental.
Ejemplo: a Lenxa le gusta jugar (A) mucho (4 horas) y leer (B) menos (1 hora). Si para poder
leer su hora tiene que jugar más, lo hará.
¿Qué actividad se maneja aquí como refuerzo? La más probable (jugar) es la actividad
instrumental; la menos probable (leer) es el refuerzo.
La frecuencia a veces no correlaciona positivamente con que te guste más hacer una actividad,
a veces, cuanto más realices una actividad más asco le acabas cogiendo a la misma.
3) Regulación conductual
Ejemplo: Rodrigo, dejado a sus anchas, dedica: 11 horas a dormir, 8 a ver la televisión, 3 a
jugar, ½ a hacer deberes… Ese es su punto de deleite.
Si jugar deja de ser independiente de estudiar y se le exige que por cada hora de juego
dedique otra a hacer deberes, esta restricción rompe su homeostasis, interrumpe la
distribución preferida, y disparará los mecanismos de ajuste encaminados a recuperarla: en
este caso, estudiar más.
Su distribución preferida indica que dedica apenas media hora a estudiar por cada 3 horas que
juega. A partir de ahora, le someto a un tratamiento instrumental por el que por cada hora
que quiera jugar tiene que estudiar otra hora.
Punto de deleite y restricción que impone el CI respecto a las conductas de jugar y
estudiar. Esto deberá hacer que aumente el tiempo dedicado a estudiar, para poder jugar
más. Tendrá necesidad de jugar, pero para satisfacer esa necesidad estudiará. Quizá juegue
menos para no tener que estudiar tanto, pero estudiará más que antes.
Se impide uno de los componentes de la homeostasis salvo que el individuo aumente otro
para recuperar o aproximarse lo máximo que pueda a la homeostasis. FALTA GRÁFICO
Era un laberinto en forma de corredor para ver cómo los animales corrían hacia la meta en
función de la cantidad de recompensa que hubiera en ella.
– Fase A: unos animales recibían 1 granito al llegar a la meta, otros 16 y otros 256. Los
que recibían poco refuerzo apenas variaban la velocidad entre los primeros y los
sucesivos ensayos. Cuantos más granos recibían, se distraían menos en el camino
hacia la meta. Se esfuerzan más por un refuerzo mayor.
– Fase B: a partir del ensayo 20. Consta de 8 ensayos. Todos los animales recibían 16
bolitas de alimento al alcanzar la meta. La misma cantidad de comida no tiene el
mismo efecto en todos los animales; depende de cómo hayan sido tratados.
Para unos animales era mucho comparado con lo que habían recibido antes, por lo que
aumentaban la velocidad (contraste positivo); si era menos que antes, disminuían la
velocidad (contraste negativo).
Demora
Los refuerzos aplicados con demora con respecto a la conducta que los provoca reduce su
eficacia.
Parte del problema puede ser por problemas de olvido: incapacidad de asociar respuestas y
estímulos reforzados demorados. También puede ser un problema de interferencia: entre la
conducta y el refuerzo se llevan a cabo muchas otras acciones que podrían asociarse con el
refuerzo. Cuando no se puede aplicar inmediatamente un refuerzo primario, una forma de
mitigar la influencia contraproducente de su demora es manejar refuerzos secundarios
inmediatos o marcar la respuesta instrumental mediante el lenguaje. Aun así, no desaparecen
del todo sus efectos adversos.
Es posible que afecte más a una persona impulsiva, o que no ha madurado. Aquellas
personas que son capaces de esperar por las recompensas (autocontrol) tienen mayor
probabilidad de éxito futuro.
Experimento de Rachlin y Green (1972): elección con pichones en una caja de Skinner con
dos llaves. Si picoteaban una, tenían acceso inmediato a grano durante 2 segundos; si
picoteaban otra, después de 4 segundos tenían acceso a grano durante 4 segundos. Aunque
la segunda opción proporcionaba el doble de comida, las aves optaban por el refuerzo
inmediato en el 95% de los ensayos.
¿Cuál es el curso del descuento de la demora? Es decir, ¿pierde una cantidad constante de
valor incentivo por unidad de tiempo? Se pensaba que perdemos un porcentaje fijo por unidad
de tiempo, pero se ha demostrado que esto no es así, no perdemos un porcentaje de
incentivo por unidad de tiempo.
Es una función hiperbólica: es una pérdida negativamente acelerada. Pierde más en las
primeras unidades de retraso que en las sucesivas.
Donde VA representa el valor incentivo actual de una recompensa R, diferida con una
demora D, y K es una constante incluida para reflejar la tasa de descuento (y que no siempre
es la misma: ni en todas las personas ni en todas las circunstancias).
El valor incentivo de un refuerzo aumenta en una proporción creciente por unidad de tiempo
conforme disminuye su demora.
Si sufren una pérdida fija por unidad de tiempo y fueran preferibles 1000€ dentro de un año y 1
mes, a 980 dentro de 1 año, lo serían siempre, también dentro de un mes, frente a 980 ahora.
Las curvas del valor incentivo de un refuerzo pequeño más próximo y otro mayor más diferido
nunca se cruzarían.
¿Sufren una devaluación en una proporción constante por unidad de tiempo: función
exponencial? En este caso las curvas del valor incentivo de un refuerzo pequeño más
inmediato…
Contra lo definido por algún modelo económico, la evidencia vino a indicar que el valor de
incentivo de los refuerzos diferidos disminuye en una proporción decreciente por unidad de
tiempo, conforme aumenta la demora. Función hiperbólica.
La función hiperbólica permite que las curvas que reflejan la dinámica cronológica del valor
incentivo de dos refuerzos de diferente tamaño y demora se crucen: puede llegar a
invertirse la preferencia entre ambas recompensas conforme transcurre su tiempo de espera
pendiente. Se podrá dar preferencia por un refuerzo mayor, aunque requiera más espera,
sobre otro menor más próximo, cuando ambos resultan suficientemente remotos. Mientras
que se puede producir una inversión de prioridades, y pasar a preferir el pequeño más
próximo cuando su momento se acerca.
Motivación
La motivación potencia la ejecución de la respuesta al aumentar la eficacia de los refuerzos,
pero también puede incidir sobre el aprendizaje. En este caso, la relación positiva entre
motivación y aprendizaje tiene su límite: ley de Yerkes-Dodson.
En general, para conductas en que sabemos qué debemos hacer para lograr la recompensa,
la motivación promoverá que realicemos esa conducta. Pero, si debemos encontrar la
respuesta para lograr la recompensa (proceso de aprendizaje), no es tan claro que a mayor
motivación mejor aprenderemos. Estados muy elevados de motivación pueden resultar
excesivos para aprender con eficacia tareas altamente complejas.
Facilitación social: si controlas muy bien una tarea, la presencia de otros hace que la
desempeñes mejor. Sin embargo, si no la controlas te perjudicará.
En situaciones de emergencia debería ser espontánea, natural e instintiva, porque si tienes que
llevar a cabo la actividad de manera premeditada y hay mucha motivación por salvarse, esta
interfiere de manera negativa.
Importan los procesos ambientales, pero también la interpretación, los procesos cognitivos. En
los años 60 se produjo una revolución en la interpretación de los mecanismos del
condicionamiento, propiciada por los propios conductistas.
4. RELACIÓN RESPUESTA–REFUERZO
De nuevo se presenta la pregunta: ¿es la contigüidad suficiente para que se produzca el
condicionamiento instrumental?
- Contigüidad: se refiere a la proximidad en el tiempo entre la respuesta y el estímulo
reforzante. Para que se produzca, basta con que aparezcan próximos en el tiempo un
determinado número de veces.
- Contingencia: implica que la posibilidad del estímulo reforzante es mayor si tiene
lugar la respuesta que si no. Covariación estadística. No basta con que la respuesta y
el estímulo reforzante aparezcan juntos un determinado número de veces.
¿Es suficiente la contigüidad o el CI requiere también contigencia R-ER?
- Algunas observaciones pueden hacer pensar que basta con la contigüidad.
- Conducta supersticiosa.
Sin embargo, a diferencia de lo que ocurrió con el condicionamiento pavloviano (en la década
de los 60 ya se aceptó la contingencia), en el condicionamiento instrumental se publicaron
artículos en los años 70 que parecían apoyar que la contingencia no era necesaria, que
bastaba con la contigüidad. Las conductas que van seguidas de consecuencias satisfactorias
se imponen.
Consideró que esto es un apoyo a la ‘conducta supersticiosa’: si hacer algo va seguido de
una consecuencia adversa, procuras evitar esa conducta, y viceversa, aunque solo haya
ocurrido una vez o no haya relación entre conducta y consecuencia (la probabilidad de obtener
la recompensa no es mayor cuando se lleva a cabo la conducta).
Contraposición de contigüidad y contingencia. Las experiencias satisfactorias que vivimos
después de realizar una conducta afectan a esta conducta, aunque no tengan nada que ver
con ella.
Se crea una situación ficticia de ilusión de control: se cree que la consecuencia es producto
de la conducta, aunque no sea cierto. Hace que parezca más importante la contigüidad.
Experimento: evidencia de la capacidad de los refuerzos de potenciar las conductas
precedentes, al margen de que ambos eventos resulten o no contingentes. En este
experimento, responder reduce la probabilidad de refuerzo.
Los animales recibían comida cada 20 segundos. Si pulsaban la palanca, recibían comida
inmediatamente, pero eso cancelaba el refuerzo de los 2 tramos siguientes. De esta manera, la
probabilidad de obtener refuerzos era mayor sin pulsar la palanca que pulsándola, pero los
animales cada vez pulsan más la palanca y obtienen menos refuerzos. En estas condiciones, el
principio de contigüidad se impone al de la contingencia. Situación engañosa que genera
ilusión de control y que hace que parezca más importante la contigüidad.
Conclusión pese al experimento: la contingencia es necesaria, afecta al proceso de
condicionamiento de una conducta.
Contigüidad y contingencia: sin contingencia entre respuesta y estímulo reforzante, aunque
aparezcan juntos algunas veces, no se percibe relación causal entre ellos, por lo que el
refuerzo no altera la tendencia a emitir la conducta.
La contigüidad del refuerzo también es un principio decisivo con respecto a la conducta que lo
provoca. La demora produce una reducción de la eficacia del estímulo reforzante; con
demoras excesivas puede no producirse condicionamiento, aunque entre ambos eventos se dé
contingencia.
“El principio subyacente más relevante del condicionamiento instrumental es la contingencia
entre la respuesta y el reforzador. Aunque la contigüidad es necesaria, lo que sustenta al
condicionamiento es la relación predictiva diferencial entre la respuesta y la consecuencia”.
5. PROGRAMAS DE REFUERZO: PROGRAMAS SIMPLES DE REFUERZO PARCIAL (RP)
La contingencia es un parámetro estadístico: tiene un valor desde –1 hasta +1, pasando por el
0.
Hay diferentes programas de condicionamiento instrumental según el valor de la
contingencia, tanto en el laboratorio como en la vida. Veremos los 4 más básicos.
• Refuerzo continuo
Se aplica el castigo o recompensa cada vez que se produce la respuesta. Tienen poco
interés porque no hay variaciones del mismo y apenas ocurren en la vida diaria.
La contingencia es igual a 1 (máxima). Sin embargo, no tiene por qué ser siempre la más eficaz
para inducir condicionamiento.
• Refuerzo parcial
La respuesta no siempre va seguida de estímulo reforzante. Hay dos tipos:
• Simples / básicos
Se maneja una sola respuesta bajo un solo programa. Existen diferentes programas según los
requisitos necesarios para obtener el refuerzo con la emisión de la respuesta instrumental.
– Programas de razón: fijo o variable. El refuerzo/castigo se aplica a la conducta
instrumental pero no de forma continua, sino ocasionalmente. Para lograr un refuerzo,
hace falta emitir la respuesta un número determinado de veces. Si es variable, se
mantiene la media, pero cambia el número de respuestas necesarias cada vez.
Ejemplo: en un casino, las máquinas tragaperras siguen un programa de razón variable.
La combinación de los dos criterios usados para esa clasificación (requisito exigido y carácter
constante/ variable del requisito) da lugar a 4 tipos de programas de refuerzo parcial simples:
El RV es el que más se aproxima a muchas situaciones naturales, en las que se refuerzan las
conductas que se desea promover, aunque no el 100% de las veces ni de manera fija por
diferentes razones. La obtención de refuerzos depende en última instancia de la emisión del
comportamiento: a más emisiones, más refuerzos.
Patrón de respuesta característico:
- Los programas de razón generan tasas más altas que los de intervalo.
- Los fijos suelen producir pausas post-refuerzo, sobre todo los de IF. Los animales
aprenden no solo qué tienen que hacer para obtener el refuerzo, sino cuándo.
- Que los variables no produzcan pausas post-refuerzo implica que:
o Generan pautas de conducta más estables.
o Tienden a generar tasas superiores de respuesta. Porque, sobre todo en
RF, el número suficiente de respuestas no siempre es el mismo, nunca sabes
si dando una respuesta más ya has emitido las suficientes para que te den un
refuerzo. La pauta no está tan interiorizada.
En RF se acumulan muchas respuestas seguidas y descansos. Igual en los de IF: las
respuestas se dan cuando el organismo considera que va a obtener el refuerzo, y entre medias
hay descansos.
– Otros programas: ámbito clínico.
- Complejos
Se maneja más de una respuesta o, al menos, más de un programa simple para la
administración de recompensas.
El refuerzo continuo adquiere una fuerza mayor que el parcial. Sin embargo, en caso de dejar
de reforzarla, cae más rápido la conducta adquirida por refuerzo continuo que la adquirida
por refuerzo parcial.
Explicaciones:
– Hipótesis de la discriminación: los individuos tratados con refuerzo parcial no tienen claro
que no volverán a conseguir nunca el refuerzo, porque ya antes necesitaban llevar a cabo la
conducta varias veces. Es más difícil discriminar. Sin embargo, los que habían sido tratados
con refuerzo continuo tienen claro que la situación ha cambiado: la respuesta ya no conlleva
obtener recompensa.
– Teoría de la tolerancia a la frustración: si obtenemos una recompensa cuando damos una
respuesta, no nos gusta que de pronto no la recibamos. Sin embargo, en el caso del refuerzo
parcial estás acostumbrado a que no siempre obtendrás la recompensa, e insistes porque ya
has tenido que repetir la conducta para poder obtener el refuerzo: no te frustra tanto.
¿Por qué algunos juegos son más adictivos que otros? Investigación de verificación con
un experimento en humanos: conclusiones de la investigación utilizando el juego. Programas
que pueden seguir las máquinas a la hora de promover la perseverancia en el juego.
1) Los participantes expuestos a una tasa menor de refuerzos perseveraron más en la
condición de extinción.
2) Esto interactuó con intervalo entre ensayos (IEE): los participantes expuestos a IEE mayor
y tasa menor de refuerzo persistieron más en extinción.
3) Y más, sobre todo, los sujetos más impulsivos. En esto coincide con lo observado en
adicción a drogas: mayor vulnerabilidad al abuso y adicción en sujetos impulsivos.
Para saber qué programa es el mejor, hay que tener en cuenta el objetivo:
– Refuerzo continuo: la prioridad es implantar una conducta sin reparar en otros aspectos.
– Refuerzo parcial: se pretende reducir a la larga el riesgo de extinción en caso de suspensión
de los refuerzos.
Secuencia de elementos, incluida imagen de una moneda (libra vs. penique), que indicaba el
valor en juego que ganaban si llevaban el marcador al tope presionando un mecanismo.
Pulsaban más cuando estaba en juego la libra, incluso con exposiciones del EC de 17 ms
enmascaradas, en las que no eran conscientes de lo que había en juego.
Los sujetos adaptaban su conducta y se esforzaban más, aun sin saber por qué.
Se supone que la motivación implica deseo consciente de la persona para lograr una meta. Las
personas también se adaptan cuando el EC no se percibe conscientemente.
Conclusión: los procesos de aprendizaje mediados por el striatum, aunque no resultan
accesibles a la conciencia, influyen en la toma de decisiones. Si las claves contextuales
alcanzan la conciencia, entonces intervienen otros sistemas cerebrales que permiten el
desarrollo de conocimiento explícito de las covariaciones.
TEMA 4: Condicionamiento Clásico II – Principios y teorías
- ¿Qué se asocia? Se produce asociación EC–RC y EC–EI, sobre todo esta última.
- ¿Por qué? Por contingencia entre EC–EI contiguos, si el EI sorprende (en cuyo caso se
presta atención al EC, de modo que condiciona el mejor).
- ¿Cómo se desarrolla el condicionamiento pavloviano y por qué se producen ciertos
fenómenos?
Integrar los fenómenos del condicionamiento pavloviano en un modelo o teoría general.
1. ¿QUÉ SE ASOCIA?
Debate: asociación EC con EI / EC con RI. ¿El EC con la RI directamente, o a través del EI?
El EI provoca una respuesta biológica innata, y se condiciona el EC hasta que produce esa
respuesta.
Ejemplo: las marcas suelen recurrir a personas o situaciones atractivas para que
atribuyamos sus características a los productos. Sin embargo, imaginemos que se descubre
que esa persona ha cometido un delito. Las marcas, normalmente, anulan el contrato porque
no quieren que eso repercuta en su marca.
La solución de esa anulación depende de qué se asocie.
Lo que cambia es cuántas veces reciben el EI en ausencia del EC. Quiere evaluar el miedo
condicionado al EC en los 4 grupos, medido gracias a la RzS.
En el grupo 0.0: RzS = 0. Indicativa de alto miedo. En cambio, en el grupo 0.4 no tenían una
reacción de miedo (RzS = 0,5).
Observó un nivel de miedo condicionado proporcional al valor de la contingencia del EC-
EI.
Con este experimento, Kamin nos habla de atención: de la sorpresa que provoque el EI y la
consiguiente atención que se presente a la situación.
Quería ver si la luz condiciona miedo por su emparejamiento con la descarga en ambos
grupos.
– Grupo en el que solo se había emparejado el EC tono con las descargas (no reseñado en
la tabla). Lógico que la luz en esta condición no produzca RC de miedo. En el experimental
no se generaba miedo condicionado, hasta el punto de que muestra una razón de supresión
similar a la del grupo solo con tono.
Los organismos solo rastrean en el medio respecto a EIs que les sorprenden, que no son
capaces de anticipar. Por eso, los ECs solo se asocian con EIs sorprendentes. Por eso,
cuando hay más de un predictor de un EI, suele condicionar solo el mejor predictor. Al resto
no se presta atención. Los recursos son limitados en todas las especies y se aprovechan para
comportamientos adaptativos y útiles.
Si el EI es esperado quiere decir que ya existe alguna clave que permite anticiparlo, de
manera que no es necesaria ninguna búsqueda adicional.
- ¿Qué se asocia? Se produce asociación EC–RC y EC–EI, sobre todo esta última.
- ¿Por qué? Por contingencia entre EC–EI contiguos, si el EI sorprende (en cuyo caso se
presta atención al EC, de modo que condiciona el mejor).
- ¿Cómo se desarrolla el condicionamiento pavloviano y por qué se producen ciertos
fenómenos? Integrar los fenómenos del condicionamiento pavloviano en un modelo o teoría
general.
Se han aportado varias teorías generales con respecto al condicionamiento. La más influyente
es la primera de todas ellas, aportada por Rescorla y Wagner. Incluso se aplicó fuera de la
Psicología, en procesamiento de información. Es uno de los pocos modelos formales
establecidos en Psicología.
El condicionamiento generado por un ensayo (la asociación EC–EI) depende del grado de
sorpresa ante el EI. Si es sorprendente, generará la búsqueda de claves predictivas.
- Unos estímulos pueden asociarse entre sí más y/o más fácilmente que otros.
Hay diferentes tipos de curva. Puede cambiar de varias maneras:
b) Tasa o velocidad diferente con que llega a la misma asíntota: alcanzan la asíntota en
pocos o en muchos ensayos.
Rescorla y Wagner partieron del experimento del bloqueo (de la sorpresa) como eje central
para su teoría. Querían explicar el fenómeno del bloqueo con su teoría. La idea es la que
defiende Kamin: el condicionamiento se producirá en aquellos ensayos en los que el EI resulte
sorprendente. A más sorpresa, más condicionamiento de la señal para anticipar el EI en el
futuro. Ellos dijeron que el grado de condicionamiento depende del grado de sorpresa.
El nivel de sorpresa que experimenten los sujetos ante un nuevo ensayo (en que se
encuentran el EC) para el EI será progresivamente menor cuanto más grande sea la
asociación EC–EI.
Es decir:
- La sorpresa y, por tanto, la fuerza asociativa ganada (ΔV) en un ensayo n viene marcada por
la diferencia λ – VΣ(n–1) (modulado por K: no todos los estímulos se procesan de la misma
manera, puede hacerse con mayor o menor intensidad; K refleja curvas más o menos rápidas).
ΔVn = k (λ – VΣ(n–1))
Según este cálculo, el EC adquiere en cada ensayo una fuerza asociativa adicional (ΔVn)
proporcional a su cantidad todavía disponible, es decir, a la diferencia entre la intensidad
máxima de condicionamiento generable por el EI y la asociación ya adquirida hasta ese
momento por el EC (λ – VΣ(n–1)).
Es el caso inverso, hay que cambiar algún elemento: sustituimos λ por 0. Se produce la
disminución progresiva de la RC conforme se repiten los ensayos en los que aparece solo el
EC. Se encuentra que la curva baja a 0: en lugar de techo, se habla de suelo.
Hasta ahora habíamos dicho que λ representa la fuerza asociativa EC–EI máxima alcanzable.
Refleja el límite de una curva que responde a una función exponencial. Si λ = 0, λ – VΣ(n–1)
resultará negativo. Por tanto, la variación de la fuerza asociativa en los ensayos de extinción
(ΔVn) será negativa: sufrirá una reducción.
Supongamos que los ensayos siguientes a la Adquisición son de Extinción. En este caso, ΔV
es negativa. De esa manera, se obtiene la típica curva de extinción: los ensayos se repiten
hasta que se extinga del todo.
Una línea de razonamiento similar se puede emplear para explicar la inhibición condicionada.
En los ensayos en los que el EI no sigue al EC+ y el EC–, λ = 0.
Para anticipar el EI se utilizan todas las claves disponibles necesarias. Cuando intervienen
simultáneamente dos ECs, son tenidos en cuenta ambos a la hora de anticipar un EI.
– Al inicio del condicionamiento compuesto, la fuerza asociativa total será resultado de la suma
de la fuerza asociativa que haya ganado el tono y la luz. VΣ = VT + VL
– Fase 1: alternaba ensayos ECT → EI y ECL → EI (por ejemplo, emparejar tono y descarga
eléctrica, y luz y descarga eléctrica). Se emparejan por separado dos ECs distintos con un EI.
– Fase 2: ensayos [ECT + ECL] → EI (sobreexpectación). Aparecen a la vez los dos ECs
seguidos del EI. Estos ensayos disminuirán la respuesta condicionada (miedo), al contrario de
lo que se pensaba.
A los ensayos con EC compuesto (fase 2) les precedieron pocos simples (fase 1). El EI
resultará aún bastante imprevisible y es de esperar que se incremente la asociación del EI con
cada uno de los ECs.
Al final de la fase 1: VT = VL = 0,20. Cada uno de ellos ha ganado una fuerza asociativa.
Depende del nivel asociativo alcanzado por cada uno de los ECs antes.
En el ensayo de la fase 2, se suman las fuerzas asociativas, lo que hace que el animal se
espere la descarga. VΣ = 0,40.
En el primer ensayo de la fase 2, aplicamos la ecuación: ΔVT = ΔVL = K (λ – VΣ(n–1)) = 0,3 [1,0 –
0,40] = 0,18. Crecerá la fuerza asociativa de la luz y la descarga en 0,18.
Si al final de la fase 1 ha habido suficiente experiencia como para que la fuerza asociativa sea
muy alta, el animal está prácticamente seguro de que al tono y a la luz les sigue descarga:
apenas le sorprende, porque ambos están altamente asociados con la descarga. VT = VL =
0,90. Entonces VΣ = 1,8. Supera el valor techo (1,0). El modelo predice una disminución de la
RC en la fase 2.
Rescorla hizo este tipo de diseño con animales, y se confirmó. En la fase 1, los dos ECs
alcanzaron un nivel de REC próxima a la asíntota.
Si, de repente, te presentan los dos estímulos, piensas que la descarga será mayor que antes;
sin embargo, se aplica la misma descarga, lo que supone un alivio. La sobreexpectación no se
confirma.
Expresado con la nomenclatura formal del modelo, el término λ – VΣ(n–1) reflejaría la diferencia
entre lo que se prevé en cierto ensayo (VΣn) y la intensidad del EI experimentado realmente (λ).
Si en unos ensayos lo esperado a causa de la fuerza combinada de todos los ECs presentes
es mayor que el EI encontrado realmente (VΣn > λ), se produce inhibición, en este caso del
miedo condicionado.
1) Tratamiento que da al EC
La operatividad del EC suele verse afectada por factores como su relevancia, intensidad… Sin
embargo, el modelo pretende reflejar la efectividad en el proceso de condicionamiento a
través de K3, una constante que no cambia durante el proceso.
2) Preexposición al EC
El haberlo expuesto antes sin que le siga el EI, condiciona peor. Sin embargo, la denominación
no es del todo correcta: cuando he sido preexpuesto, realmente no es que desarrolle inhibición
latente, es que no espero que ocurra nada. Tardo más en asociarlo.
Wagner hizo un modelo por su cuenta, pero para poder predecir mucho se trató de un modelo
muy complejo y ya no tuvo tanta fama.
Adquisición de miedo
El sistema de alarma lleva a cabo una valoración inicial de emergencia (del tálamo a la
amígdala) que responde de forma automática, antes de que el sistema cognitivo sofisticado
desarrolle un pensamiento completo y reconocimiento consciente del ED de la reacción de
miedo (pasando por la corteza cerebral)
No reaccionamos con miedo solo ante la información que va por la vía superior, más lenta.
En otro grupo, hicieron lo mismo con dos tipos de ECs no relevantes para el miedo: fotos de
flores y setas.
Aunque los sujetos eran incapaces de identificar los ECs presentados en estas condiciones de
enmascaramiento y, por tanto, de señalar en qué ensayos tendría lugar descarga, en el caso
de los objetos relevantes para el miedo desarrollaron un incremento de la RPG ante el EC+, en
comparación con el EC–, cosa que no sucedió con los ECs no relevantes para el miedo.
Condicionamiento palpebral
¿Se puede emparejar en personas dormidas?
En cada ensayo la expectativa de que el EC le siga el EI es mayor cuanto mejor hay sido la
serie previa EC-EI, y aún mayor cuanto más grande haya sido la serie previa EC-solo. Casos
extremos la expectativa menor se dará después de una serie de 4 ensayos EC-EI; y la
mayor, después de 4 EC-solo.
Izquierda: Previsión teórica de la expectativa del EI y de la RC ante el EC, según la serie que
hubiera precedido el EC en cada ensayo.
Derecha: RCs provocadas por EC (antes de que en ese ensayo tenga lugar en el EI) según la
serie que le hubiera precedido.
También las expectativas se acomodan a las previsiones; p estimada por los SS de sufrir
chorro de aire en ensayo siguiente en función de serie previa.
LIBRO
EXPERIMENTO
También aquí, con una descarga como EI (CP demorado) encuentran dislocación entre
expectativas y RPG condicionada.
Esta asociación apoya el sistema de procesamiento dual que explica el sistema de
condicionamiento pavloviano humano.
EXPERIMENTO 2
El reflejo del párpado se puede generar mientras los niños dormían. Se les daba un soplo
(EI), con lo que cerraban más fuertemente los párpados, y el EC era música determinada. Al
despertar, el EC genera la respuesta condicionada, aunque ellos no tomaran conciencia de
ello. Solo se observa condicionamiento palpebral demorado. R- EMG provocada por EC en Gr
Exper (expuestos a un tono seguido de soplo) y Control (exposición desemparejada).
- Aprendizaje evaluativo
Respuesta de esnifar durante el sueño: esnifan más ante olores agradables que desagradables
durante sueño profundo.
B) Y C) también ante tonos (EC) emparejados con los respectivos olores, durante SWS b)
resultado global; c) curva de evolución de la RC.
Condicionamiento: un buen ambiente que hacía respirar bien se asoció con un tono, un mal
ambiente con otro tono. También lo emparejaron: la situación que promovía más inhalación lo
hacía tanto durante el sueño como cuando despertaban.
- A modo de conclusión
No se produce condicionamiento indiscriminado de cualquier elemento que acompañe al EI. La
asociación entre un EC y un EI depende, además de su emparejamiento, también de su
relevancia mutua, la experiencia previa con cada uno de ellos y la presencia de otros estímulos
durante el proceso de condicionamiento. El condicionamiento pavloviano está involucrado en la
regulación de aspectos muy diversos del comportamiento, incluidos los afectivos y
motivacionales, además de las reacciones vegetativas.
Condicionamiento evaluativo:
CE tiene peculiaridades diferentes al aprendizaje de señal; entre otras: parece que puede
operar de forma automática, incluso sin conciencia de contingencia entre el EC-EI.
TEMA 6: Condicionamiento Instrumental II
Por tanto, veremos el castigo: contingencia positiva entre una conducta y un estímulo
aversivo ulterior. Se supone que este tratamiento disminuye la probabilidad de la conducta
afectada, pudiendo llegar incluso a suprimirla por completo.
1. INTRODUCCIÓN
Técnica muy empleada y muy controvertida, por las dudas sobre su eficacia y por sus
efectos ‘colaterales’ adversos (los estímulos aversivos crean inestabilidad emocional,
agresividad…), sobre todo cuando es intenso y/o aplicado sobre conductas muy internalizadas
y difíciles de cambiar. Escasamente investigado.
Fue descubierto por la Psicología (Thorndike, siglo XIX; Skinner, siglo XX). Sin embargo, ya
existía y los humanos hacían uso de él desde siempre. Castigaban aquello que querían que se
dejara de hacer, para regular la conducta del entorno.
Hace 100 años nadie discutía su uso, pero hoy en día sí. Hay autores que afirman que el
castigo no funciona tan bien como la recompensa, no tiene efectos duraderos. Al dejar de
castigar la conducta, esta vuelve a llevarse a cabo.
Para educar no se puede recurrir al castigo. Se plantea si los padres pueden acudir al castigo
para educar a sus hijos. Legalmente no está permitido.
Actualidad: Condena al castigo. Condenada dos años de cárcel una maestra por agredir a sus
alumnos. Los niños, de dos años, sufrieron expresiones impropias tirones y algún bofetón o
cachete en una guardería de Castellón.
El castigo nunca desaparecerá de la faz de la tierra. Israel estrena una doctrina de castigos u
premios colectivos en Cisjordania. Se podrían señalar miles de ejemplos en diferentes ámbitos
y situaciones. El recurso al castigo parece una tendencia natural, cuando se trata de combatir
conductas indeseables en el ámbito social.
Campaña de tráfico 2019
Castigar la conducción temeraria o indebida con experiencias desagradables (ej.: pagar una
multa, quitar puntos…)
Skinner llegó a la conclusión de que no funcionaba bien, pues las conductas castigadas
tendían a desaparecer mientras se castigaban, pero si se deja de aplicar el castigo la
conducta reaparece. El castigo no suprime las conductas.
Por ejemplo: animales aprenden a pulsar una palanca para conseguir comida
(condicionamiento Instrumental de recompensa). Después castigan su conducta en un grupo y
no en otro. Miran cómo evoluciona su conducta en el grupo experimental (castigo) y en el
control (no castigo).
Se pensó que una alternativa para eliminar una conducta sería empezar con castigos tenues.
Si no es suficiente con ellos, se aumenta la intensidad. Esta es una estrategia nefasta porque
tiende a generar inmunización, de modo que pierden efectividad incluso castigos intensos.
Cada vez lo castigas más, pero él cada vez aguanta más. En dos grupos en el que
directamente se aplica la intensidad 6 tendrá más efecto que en aquellos en los que se le va
aplicando poco a poco, que necesitarán una intensidad bastante más alta por hacerse
inmunes.
Por el contrario, comenzar con castigos intensos puede producir sensibilización, también
con sus correspondientes efectos: positivos y negativos. Incrementa el impacto de castigos
más leves posteriores.
b) Demora
Perjudica su eficacia. Recompensas demoradas restan valor incentivo a las recompensas, y lo
mismo ocurre con los castigos. A más retaso de las consecuencias punitivas, menor
supresión de la conducta que las provoca. Además, la caída del valor aversivo de los
castigos con la demora parece seguir también una función hiperbólica.
Experimento: se podían emitir 2 respuestas (R1 y R2) para conseguir comida. A su vez, se
manejaron 2 condiciones experimentales:
1) R1: castigo pequeño con demora de 2 segundos. R2: castigo grande con demora de 12
segundos.
2) R1: castigo pequeño con demora de 40 segundos. R2: castigo grande con demora de 50
segundos.
Tiene mayor valor aversivo un castigo inmediato, y afecta más a la conducta. Preferimos
evitar un castigo inmediato, aunque sea pequeño, y que nos apliquen uno mayor más tarde;
salvo que la demora del pequeño también sea grande.
Pregunta de examen:
Cuando se trata de optar entre una R para conseguir comida que conlleva castigo pequeño con
demora pequeña y otra R que conlleva castigo mayor y más diferido hemos visto que se
prefiere la R que conlleva castigo con demora más pequeños.
a) Siempre
b) Cando ambas demoras son relativamente pequeñas
c) Cuando ambas demoras son relativamente grandes
c) Programa de aplicación
Para que una conducta se mantenga a lo largo del tiempo, el programa parcial es el más
efectivo para las recompensas. Sin embargo, para el castigo ocurre lo contrario: se debe
castigar siempre: castigo sistemático, equivalente al refuerzo continuo.
Los castigos aplicados con programa de refuerzo continuo son más eficaces para eliminar la
conducta.
Dentro de ellos, su eficacia depende de la razón con la que se apliquen, y del programa con el
que se vea (o haya visto) reforzada la conducta objeto del castigo. Cuanto más pequeña la
razón (cuanto más consistente su manejo), mayor supresión de la conducta.
La asociación de una conducta con castigo puede verse ligada a un contexto o señal: castigo
discriminado, con supresión selectiva.
Por ejemplo: no dejar que el niño hable en alto cuando estás en la iglesia, pero no fuera de
ese contexto.
Los castigos suprimen más fácilmente nuestras conductas poco arraigadas y reemplazables
que las vitales.
Ejemplo: Si quieres que tu hijo no se muerda las uñas, aparte de castigarle poniéndole
pintauñas de mal sabor, se le premia por bailar sevillanas, ya que no puedes estar bailando y
mordiéndote a las uñas a la vez.
g) Explicación
La capacidad cognitiva y lingüística de las personas también juega un papel importante en el
funcionamiento del castigo. Los niños son más afectados por castigos justos, que reciban
explicaciones.
Ayudan a precisar la conducta castigada y a justificar el uso del castigo. Además, las
explicaciones juegan un papel importante en el desarrollo moral durante la infancia. Cuando un
niño actúa de manera inapropiada, si se le explican las consecuencias negativas además de
reprocharle su actuación, es más probable que desarrolle empatía hacia los demás y acepte
las responsabilidades de su propia conducta.
Pueden aprender de las recompensas; parecen incapaces de hacerlo con el castigo (los
errores).
“Los criminales con psicopatía podrían considerar solo las posibles consecuencias positivas y
fallarían al valorar la posibilidad de un resultado negativo”. Es como si no aprendieran de los
castigos o errores. “El castigo indica la necesidad de cambiar la conducta. En determinadas
situaciones, estos criminales tienen dificultad para aprender del castigo para modificar su
conducta”. No se trataría solo de falta de empatía hacia los demás, es que tienen un déficit
neurológico por lo que no les funciona con normalidad la tendencia de asociar los errores con
los castigamos que recibimos cuando realizamos dichos errores.
Cuando la respuesta que proporcionaba droga durante las 4 sesiones de línea base dejaba de
proporcionarla el 50% de las veces y el otro 50% era castigada (al azar), si su historia de
consumo había sido corta suprimía la respuesta en todos los animales, pero si había sido
larga, el 20% de animales con nivel bajo de serotonina seguía realizando la respuesta
(consumo compulsivo).
Sobre todo, los castigos intensos y persistentes a conductas muy arraigadas. Cuanto más
indispensable es la conducta castigada, más fastidia que nos castiguen; igual a menor número
de conductas alternativas.
- Dolor físico.
– Provocada por el dolor: en especies pacíficas, cuando pasan a ser castigadas con
frecuencia se observan conductas agresivas que son poco frecuentes.
Un último inconveniente del castigo es que se aplica a una conducta ya realizada. No sirve
para evitar el episodio conductual castigado, sino solo por sus efectos disuasorios de cara al
futuro para que no se vuelva a repetir. Pero, incluso de cara al futuro, el castigo por sí mismo
no fortalece directamente la emisión de una conducta apropiada.
Realmente, dado que la indefensión aprendida se trata de que no se puede evitar el castigo,
no se considera condicionamiento instrumental.
- Las aplicaciones derivadas del condicionamiento clásico están más centradas en el ámbito
clínico (terapia de conducta, integrada en la terapia cognitivo–conductual), aunque también se
utiliza en publicidad y en medicina, ocasionalmente; y las del condicionamiento
instrumental más abiertas a la influencia sobre la conducta en general (modificación de
conducta), en la vida cotidiana, el ámbito académico, el ámbito social…
- Ambas corrientes surgieron casi a la vez, en torno a mediados del siglo XX (el uso
sistemático y riguroso científicamente).
Pavlov pensaba que el aprendizaje resultaba, en gran medida, del establecimiento de nuevas
conexiones nerviosas.
La elaboración formal de estrategias aplicadas inspiradas en el condicionamiento pavloviano se
produjo en torno a mediados de la década de 1950, casi a la vez que las técnicas basadas en
el condicionamiento operante, pese a que la investigación de este último (promovida
principalmente por Skinner) fue muy posterior a las aportaciones de Pavlov.
El caso del pequeño Albert, aportado por Watson y Rayner: trabajo sobre el desarrollo del
miedo y su ulterior supresión (frustrada, en este caso). Se le sometió a desarrollo de respuesta
de miedo a elementos que no se lo producían previamente. Al niño le gustaban animales
(ratones, conejos…), pero cuando comenzó a presentarles esos animales y a hacer sonar un
gong intenso cuando se le acercaba uno de ellos de forma que lo asustaba, comenzó a
alejarse de los animales y mostrar respuesta de miedo ante ellos. Esto se debía a un proceso
de asociación de los animales con un sonido desagradable. Además, ese miedo se
generalizó a otros animales que compartían propiedades con los utilizados. No puso en
práctica la fase de corrección, o terapia, de los miedos.
Mª C. Jones, 25 años después, llevó a cabo una experiencia parecida con otro niño y luego lo
sometió a corrección de ese miedo: lo expuso a los elementos que le producían miedo mientras
experimentaba sensaciones agradables. Además, intentó potenciar los beneficios de esta
técnica con los del aprendizaje observacional (modelado): aplicó el contracondicionamiento
en presencia de otros niños que mostraban atracción por los animales. Hizo un informe más
riguroso y publicó un artículo, al contrario que Watson. Observó que el miedo del niño
disminuía progresivamente: primero soportaba cada vez su presencia más cercana, después
los buscó de forma activa.
Consiste en 3 componentes:
1) Entrenamiento en técnicas de relajación de los sujetos.
2) Jerarquía de ansiedad: describir, de menos a más, las situaciones que disparan una fobia,
para ordenarlas y enfrentarlas en ese orden.
3) Afrontamiento progresivo y sostenido (imaginario o en vivo) de cada componente de la
jerarquía de ansiedad en estado de relajación. Aplicar la DS consiste en imaginarte a ti mismo
en la situación, al mismo tiempo que te aplican las técnicas de relajación. De esa manera, si
puedes imaginarlo sin perder la tranquilidad pasas al siguiente componente de la jerarquía.
Finalmente, se deben aplicar las técnicas de relajación en la propia situación.
Esta técnica contribuye a superar miedos patológicos, sobre todo cuando se trata de fobias
desencadenadas por escenas y objetos específicos. Pero no hay acuerdo en que responda
solo a procesos de condicionamiento y, menos aún, solo a operaciones de
contracondicionamiento.
Pretende extinguir el miedo al objeto fóbico (EC) mediante su exposición reiterada, masiva
y prolongada, en condiciones de seguridad, sin que el paciente la pueda eludir (para no dar
lugar a refuerzo negativo de la conducta de escape–evitación). También existe versión
imaginaria y en vivo, e incluso mediante realidad virtual.
Si ese miedo surgió por alguna situación aversiva, la persona buscará coartadas para evitarla y
no vencerá la fobia. Esta técnica consiste en someter al paciente a la exposición directa y
real del EC sin el EI (experiencia que desencadenó el miedo). De esa manera, tiende a
extinguirse la respuesta de miedo al EC por no ir acompañado de evento traumático que lo
justifique.
Se utiliza más que la desensibilización sistemática, sobre todo en fobias. Sin embargo, en
ocasiones puede acarrear complicaciones o no resultar efectivo (sobre todo en pacientes con
estrés postraumático o un historial de otros desórdenes psiquiátricos). Es más arriesgado que
la DS.
Se llevaron a cabo una serie de experimentos en los que trabajan con la técnica de exposición
con personas que tienen fobia a animales. Se les expone a esos animales, lo que hace que se
supere cada vez más la conducta de evitación.
Se comprobó en la exposición in vivo al objeto del miedo. Los efectos son duraderos,
persistían incluso pasado un año.
Han analizado los cambios que produce esa exposición encubierta. Investigaron la base neural
de los efectos adaptativos de las exposiciones enmascaradas a estímulos fóbicos. La
exposición a arañas enmascaradas activó zonas del cerebro encargadas de procesamiento del
miedo más en fóbicos.
- Condicionan miedo a dos EC+, emparejando cada uno de ellos con el EI. Se registra
la IRMf característica de cada uno de esos ECs.
- Luego, bajo la coartada de que realicen el esfuerzo mental de aumentar el tamaño de
un disco ilusorio al que son expuestos (que manipulan los experimentadores).
- Los refuerzan cuando el patrón de IRMf es similar a la de un EC+.
- Esto reduce miedo a este EC, sin necesidad de exponerlos a él.
También la exposición al contexto (olor) del EC+ (emparejado con el EI descarga) durante
fase de sueño profundo contribuyó a la extinción de REC.
Haunner et al., 2013
- El curso de la asociación
No se puede olvidar el fenómeno de la recuperación espontánea.
Hay un problema con esta técnica. La exposición es el efecto que tiene el hecho de aplicar el
EC sin que vaya acompañado del EI. De esa manera, el EC pierde la capacidad de provocar
miedo: se reduce la RC de forma progresiva hasta desaparecer.
La técnica parte de la idea de que registros de memoria a largo plazo (MLP) no son fijos, sino
que se tornan lábiles cada vez que se activan, por lo que requieren re–consolidación. Esto
sirve para actualizar el registro: integrar la información nueva y adaptarse según las
circunstancias. Se buscó la forma de cambiar, mediante tratamiento psicológico, la carga
emocional de registros de eventos consolidados. Al volver a activar ese recuerdo y tornarlo
lábil, se hace que no se reconsolide sino que se borre, evitando que vuelva a aparecer más
tarde. Se corrige el registro de miedo anterior.
Trabajan con eventos que adquieren una carga emocional mediante condicionamiento
pavloviano, que pretenden suprimir mediante extinción de la respuesta condicionada (terapia
de exposición), sin que se produzca recuperación espontánea.
Se sometía a animales a condicionamiento de miedo. Después, se les exponía una última vez
a un ensayo de presentación de EC con EI (activación del recuerdo en la MLP) y se les
aplicaba un fármaco para que no pudieran reconsolidar la información. En ese caso, se
extinguía el miedo condicionado y no aparecía. Sin embargo, el fármaco no se aplicó con
humanos y se trató de desarrollar una técnica: la presente.
IDEAS PREVIAS
- CP miedo
- Extinción: pérdida de la capacidad del EC de provocar RC cuando se presenta sin él. Pero,
Recuperación (expontánea) de la RC.
- La memoria de un miedo condicionado resulta lábil, hasta que se consolida, gracias a las
exposiciones EC–EI y el paso del tiempo.
- Al recuperarla posteriormente con un nuevo ensayo EC–EI entra en nuevo periodo lábil (fase
de re– consolidación), que permite actualizarla (por ejemplo, potenciarla, pero también
bloquearla).
- Esto puede resultar útil para extinguir un viejo miedo condicionado (ya consolidado) sin que
se vuelva a recuperar.
– EC+ → EI (descarga).
– EC–
Índice de restablecimiento: diferencia en RC de miedo (EC+ menos EC-) entre final 3 dia y 1
año después.
Un año después persistía bloqueo de RC producido por extinción durante la reconsolidación
en grupo 10 min, en comparación con otros 2 grupos.
Xue y Col (2012): tratamiento psicológico en ratas y personas sobre síndrome de abstinencia
ante EC asociado a droga. Aplicación del mismo fenómeno por otro equipo y otro país con otro
estímulo, el condicionamiento del uso de drogas.
Les exponen al olor de una copa de cerveza para ver si tienen síndrome de abstinencia. No
encontraron que una exposición breve no cambiaba un efecto distinto en esa sensación. No
desaparecía con una disposición prolongada que con una breve. Ç
El contexto, compañías, lugar donde se suele consumir alcohol o drogas, hacen que se dispare
el síndrome de abstinencia. El contexto nos dispara una reacción preparatoria para que se
prepare esa situación. EC → EI. Reacción compensatoria.
Trabajan con adultos aclcohólicos y con realidad virtual para manejar contextos más globales y
realistas de claves vinculadas al uso de alcohol.
Encuentran que ciertos ambientes por la noche en fin de semana, así como ciertos estados de
ánimo disparan el síndrome de abstinencia.
Es parte de un proyecto más amplio para validar la terapia de exposición a las claves
mediante realidad virtual.
Las alteraciones conductuales, en este caso, derivan de que algunos elementos resultan
excesiva e inadecuadamente atractivos (consumo excesivo de alcohol, tabaco u otras drogas;
comportamientos sexuales abusivos). Una forma de combatir esos problemas conductuales
consiste en restar atractivo a los estímulos.
Relacionada con la aversión adquirida a sabores, fue empleada por Plinio y en la URSS.
- Tabaquismo
Procedimiento de ‘fumar rápido’: el paciente fuma de forma compulsiva e inhalando el humo
cada pocos segundos para asociar el tabaco con las náuseas producidas por la propia nicotina.
Es un tratamiento bastante estresante y suele producir incremento de la tasa cardíaca, por lo
que debe ser empleado con precaución y bajo supervisión profesional.
- Sensibilización encubierta
Se recurre a estímulos aversivos imaginarios.
- Medios de comunicación
Se manejan imágenes repulsivas para combatir diferentes comportamientos peligrosos.
Ejemplo: esquelas e imágenes para que se asocie el tabaco con sus efectos letales.
Demarketing (fumar puede ser causa de una muerte lenta y dolorosa).
INHIBICIÓN LATENTE
Esto significa que, a la hora de tratar las drogodependencias, conviene tener en cuenta las
claves contextuales condicionadas, para evitar recaídas en el consumo durante el proceso de
desintoxicación. Al fin y al cabo, aun habiendo superado la dependencia en un ambiente
distinto al del consumo habitual, el reencuentro posterior de las señales críticas puede
desencadenar síndrome de abstinencia.
Sistema inmunitario
El condicionamiento pavloviano puede potenciar la eficacia del tratamiento con dosis
subterapéuticas del inmunosupresor CsA en ratones que sufrían lupus. El condicionamiento
ayudó a alargar la supervivencia de estos animales con hiperfuncionamiento patológico de
su sistema inmunitario. El EC previamente emparejado con la sustancia inmunosupresora
incrementó más de 100 días la supervivencia del 20% de los animales tratados.
Sin embargo, a este respecto no existen datos clínicos de investigación experimental humana.
Sí existen evidencias experimentales de potenciación inmunológica condicionada en personas
sanas, así como estudios que sugieren cambios condicionados en parámetros inmunológicos
relevantes para personas con cáncer.
El condicionamiento humano podría modificar la evolución de la patología.
- Publicidad
El condicionamiento de actitudes, preferencias, valor afectivo de las cosas o estados
motivacionales puede tener importancia a la hora de configurar la imagen de marcas y
productos comerciales a través de la publicidad.
Cuando se empareja un producto con personas, términos, imágenes, música y escenas
altamente positivas, se espera que los sentimientos y emociones favorables provocados por
estos eventos se transfieran al producto y potencien su imagen. Y si una empresa logra una
imagen de marca positiva, aumenta la probabilidad de que los consumidores elijan su producto.
Se refuerza un producto con una imagen atractiva. Tiene que ver con el condicionamiento
evaluativo.
Una cosa es que muchos anuncios puedan responder a una disposición de elementos propicia
para el desarrollo del condicionamiento, y otra muy distinta es verificar la operación real y
efectiva del proceso.
Stuart, Shimp y Engle (1987) realizaron experimentos en los que analizaron diferentes
aspectos; entre ellos, el efecto del número de emparejamientos entre el producto comercial
(EC) y los estímulos positivos (EI), el efecto de la disposición cronológica entre ellos o el de la
pre–exposición al producto (fenómeno de inhibición latente).
– Producto: marca de pasta dental.
– Elemento reforzante: escenas naturales atractivas.
Los integrantes de los grupos de control veían los mismos elementos, pero dispuestos de
forma aleatoria, por lo que la pasta dental no resultaba emparejada preferentemente con
escenas atractivas.
A continuación, pedían a los participantes que evaluaran en diversos aspectos las marcas
manejadas.
- Preexposición al producto
Reduce su condicionamiento, aunque no lo suprime del todo.
– Potenciación mediante condicionamiento evaluativo de la actitud hacia marcas ya
muy conocidas, emparejándolas con palabras e imágenes positivas, aunque solo en
los participantes que no tenían una preferencia fuerte por las mismas.
Cuando los refuerzos se aplican de forma adecuada, pueden influir incluso en la evolución de
algunos comportamientos patológicos.
- Ámbito familiar
- Parejas con problemas
A partir de mediados del siglo 70, algunos terapeutas comenzaron a recurrir a los principios
conductuales para ayudar a parejas con problemas conyugales, donde cada miembro tiende a
recurrir a amenazas y venganzas para conseguir lo que desea del otro.
Esta intervención se diseña para promover interacciones recíprocas más positivas (refuerzos)
entre los cónyuges. A veces se maneja un contrato de contingencias: acuerdo escrito sobre las
conductas requeridas a cada parte y beneficios de llevarlas a cabo.
Normalmente, ambos miembros de la pareja participan de forma activa en la elaboración del
contrato y aceptan los términos.
– Prestar atención a los hijos y destacar su comportamiento y dar otros refuerzos cuando se
portan bien.
– Hacer caso omiso de las rabietas: si atrajeron la atención y surtieron efecto en el pasado,
pueden agudizarse durante un periodo transitorio, pero acabarán desapareciendo con el tiempo
si no se refuerzan.
- Ámbito clínico
Modificar la conducta de niños autistas y con retraso mental, pacientes psicóticos o con otras
patologías y alteraciones menores, así como combatir el consumo abusivo de drogas.
Niños autistas
– Suprimir mediante tratamiento aversivo tendencias autolesivas (en el siguiente punto).
– Promover conductas sociales, comunicativas y emocionales mediante manejo de refuerzos.
A lo largo del proceso, además, se fueron reemplazando las golosinas y refuerzos de este tipo
por otros sociales. A la vez que se llevaba a cabo el programa de comunicación verbal, los
niños eran entrenados en otras habilidades sociales y de subsistencia.
Los programas intensivos con chicos jóvenes son los que producen resultados mejores y más
duraderos, así como si los chicos vivían en entornos que los apoyaran.
Sin embargo, las mejoras se limitaban a la aplicación. Al interrumpir los programas, se
desvanecen los beneficios.
- Esquizofrenia
Promover conductas adaptativas en esquizofrénicos
- Drogodependencias
Manejo de contingencias: promover la abstinencia en drogodependientes no internos. Se les
entregan vales canjeables fuera del centro clínico por bienes de consumo u otras ventajas
sociales si en el análisis periódico que se les realiza al acudir al centro se observa que se han
abstenido de consumir droga.
Estudio clínico realizado a lo largo de 15 años con 664 cocainómanos sin techo. Se evaluó la
abstinencia alcanzada por los participantes en 4 tipos de programas:
1) Ninguno.
2) Convencional: integrado a lo largo de los diversos trabajos clínicos por diferentes tipos de
intervenciones.
3) Manejo de contingencias: proporcionarles casa y/o trabajo en caso de abstención de la
droga.
4) Convencional + manejo de contingencias.
Manejo estratégico tanto de estímulos deseables como de estímulos aversivos y, sobre todo, la
combinación de ambos.
-Extinción
- Tratamiento de omisión
- Tiempo fuera
- Coste de respuesta
- Castigo
- Extinción
A veces, las conductas problemáticas surgen y se mantienen porque son reforzadas. Una
estrategia para combatirlas consiste en interrumpir su reforzamiento. Que la conducta deje
de provocar recompensas.
Sin embargo, hay conductas indeseables para las que su refuerzo apenas depende de nada ni
nadie ajeno a ellas. No siempre resulta posible aplicar de forma eficiente la técnica de la
extinción; en esos casos, se recurre a otros procedimientos.
- Tratamiento de omisión
-Reforzamiento diferencial de otras conductas (RDO)
Tendrás esa recompensa salvo que hagas la que se quiere que omitas. Se recompensa
cualquier comportamiento, excepto el que se quiere eliminar. Se establece un período para
aplicar una recompensa en cuanto pasa ese tiempo sin haber emitido la conducta indeseable.
El refuerzo se hace contingente de que haya transcurrido el tiempo acordado sin la emisión de
la conducta objeto del tratamiento.
- Tiempo fuera
La persona es enviada a un ambiente menos agradable que aquel en el que se encuentra,
cuando lleva a cabo la conducta indeseable.
- Coste de respuesta
Se retira un refuerzo cada vez que se produce la conducta objeto del tratamiento. Ejemplo
típico: sanciones económicas, retirada del permiso de conducir por las infracciones de tráfico.
- Castigo
Aplicar un estímulo aversivo a la conducta. Debe ser el último recurso a la hora de combatir
conductas, por los efectos colaterales perniciosos que produce.
Se debe emplear siguiendo una serie de criterios: usar la intensidad más baja posible, dentro
de que resulte efectiva; aplicarlo de forma consistente, inmediata y justificada…
Efecto del manejo de castigo en niños autistas en sesión clínica de evaluación, para combatir
conductas autodestructivas muy lesivas, y que no desaparecen con ningún otro procedimiento.
Se les aplicaban leves corrientes que no les hacían daño, solo provocaban una sensación
desagradable. Así lograban reducir drásticamente esas conductas autodestructivas en muchos
niños, lo que, además de la ventaja intrínseca que eso entraña en sí mismo, los capacitaba
para beneficiarse de otros programas de entrenamiento, con vistas a desarrollar conductas
comunicativas, emocionales y sociales básicas.
3. CONSIDERACIONES FINALES
Este enfoque terapéutico se considera ‘terapia de conducta de primera generación’.
Posteriormente, a lo largo de los años 70 y 80, con el desarrollo de la psicología cognitiva, se
pasó a considerar que los principios de condicionamiento eran útiles, pero insuficientes.
Durante esos años los terapeutas de conducta (de ‘segunda generación’) desarrollaron
tratamientos más inspirados en la investigación humana, que se interesaba por los mediadores
cognitivos del aprendizaje.
Hoy en día se comienza a hablar de la ‘terapia de conducta de tercera generación’, que debe
tener en cuenta los nuevos principios y hallazgos descubiertos.
Lo que se pensaba que eran formas muy elementales y simples de aprendizaje asociativo no
es así. Las operaciones de condicionamiento no se reducen a asociaciones mecánicas entre
dos eventos contiguos cualesquiera.
Se aprende no solo qué eventos suelen resultar contingentes entre sí, sino también cuándo y
en qué circunstancias. Además, no todos los casos y tipos de condicionamiento responden a
los mismos mecanismos y procesos. Aunque algunas de sus formas pueden tener lugar de
manera automática y al margen de procesos cognitivos conscientes, en otros muchos casos
intervienen sofisticados sistemas de atención, memoria y procesamiento de información que
permiten detectar relaciones entre eventos, anticiparlos y llevar a cabo acciones preparatorias
para, o inductoras de, ciertos eventos.
Bloque ll. Bases neurales del aprendizaje y el condicionamiento
E→R→C
Se basa en cuáles son los procesos o mecanismos que tienen lugar entre el estímulo y la
respuesta. Una vez que se produce el aprendizaje, se da la memoria y vamos a ver cómo
interviene la memoria en el mismo. Aprendizaje y memoria están completamente relacionados.
1. Aprendizaje y memoria
APRENDIZAJE
• Es una propiedad fundamental del cerebro que se manifiesta de diversas formas mediante
múltiples sistemas diferenciados anatómica y funcionalmente.
MEMORIA
Cada vez que queremos recuperar algo para realizar una actividad se hace uso de la memoria.
Hay un componente emocional y de repetición que establece que sea de un tipo o de otro.
Cuando vemos algo a corto plazo y después vemos un estímulo relacionado con el mismo, es
probable que lo que recordamos a corto plazo sea sacado de la memoria a largo plazo.
Semántica: lo que significa una palabra depende de muchas regiones (corteza), ya que hay un
componente sensorial en función de las experiencias que pueden ser de diverso tipo.
Procedimental: la aprendida.
3. Aprendizaje asociativo/no-asociativo
Aprendizaje no-asociativo
Aprendizaje asociativo
3. Aprendizaje no-asociativo
Habituación y sensibilización.
Aplysia: modelo simple para estudiar las bases fisiológicas del aprendizaje (habituación,
sensibilización y condicionamiento clásico).
(Variable Dependiente)
Cualquier estímulo que apliquemos vamos a ver su efecto en la retirada de la branquia (acto
reflejo).
3.1. Habituación
* ante 1 estímulo generalmente inocuo que se repite con frecuencia en un breve periodo de
tiempo.
Hay neuronas sensitivas y neuronas motoras. Neurona sensitiva del sifón percibe el estímulo y
comunica la información a la neurona motora que retira la branquia.
Por ejemplo, tenemos piedra en el zapato, cuando la notamos nos sentimos molestos, pero
luego seguimos andando y nos habituamos. Neurona sensitiva sigue respondiendo, pero no
responde la neurona motora. ¿Por qué no responde la neurona motora?
El hecho de que la respuesta motora deje de funcionar, es debido a que se produce una
modificación sensitiva.
La respuesta entre neurona sensitiva y motora está mediada por interneuronas.
Llega el potencial de acción, lo que hace la membrana es que abre sus canales de sodio y
entra sodio (iones positivos – de -40 a 70 mV - despolarizar), y después tiene que volver a su
equilibrio, por lo que sale potasio (negativo, de 70 a -40 mV- repolarizar).
Todo se produce porque necesitamos esa despolarización para que se abran los canales de
calcio (potencial de acción), y es el calcio el que se pega a las vesículas que contienen a los
neurotransmisores y las arrastra hacia el borde de la membrana, se pega a la membrana y se
abre la misma, saliendo los neurotransmisores.
Sodio, potasio y calcio, son canales iónicos dependientes de voltaje, porque en función de la
carga que reciban se abren o cierran.
3.2. Sensibilización
Cuando tocamos el sifón da lugar a una respuesta de retracción moderada de la branquia,
después se aplica un estímulo nocivo a una parte de la cola (distinto de la anterior), que en
principio ha de tener un circuito distinto, y lo que hace es retraer rápidamente la branquia
(mecanismo de defensa). Volvemos a estimular el sifón tras un rato, y lo que podríamos
esperar es que la retracción de la branquia fuese igual la primera que la última, ya que el
mecanismo entre el sifón y la cola no tiene nada que ver, pero la reacción es más rápida que
la primera vez. La estimulación en un punto diferente ha modificado un reflejo. Esto puede
deberse a que como el número de neuronas es bastante menor, estas están mucho más
conectadas. Si no es nocivo, seguramente no haya respuesta en la branquia.
Nos sensibilizamos habitualmente ante estímulos negativos. También puedes hacerlo ante
positivos, pero es más difícil.
Repliegue de la branquia en aquel que está sensibilizado es mucho mayor y más rápido
(respuesta motora es más intensa).
Las conexiones que se potencian se facilitan, por eso un estímulo mínimo, facilita la respuesta,
es decir, conectamos con más botones sinápticos una neurona con otra (aprender).
Al recibir en el neurotransmisor la serotonina lo que sucede es que aumenta la concentración
de AMP cíclico, y proteína quinasa A. Se han abierto los canales de socio, se están abriendo
los canales de potasio, de forma que al aumentar la concentración de AMP cíclico y proteína
quinasa A, se cierran los canales de potasio, y no salen los iones de potasio. La membrana
está cargada positivamente y no puede liberar esos cationes que haría que el citoplasma
alcanzase su voltaje de -40. Se bloquea el intercambio para que la neurona vuelva a su estado
de reposo. Si se cierran los canales de potasio y no permitimos que vuelvan los canales de
sodio, sigue en estado de hiperpolarización, se prolonga en el tiempo el potencial de acción
los canales de calcio siguen abiertos y la señal de exocitosis continúa, por lo que la liberación
de neurotransmisores continúa (gluatamato). Es muy continuada e intensa.
La habituación:
- Homosináptica.
La sensibilización:
- Heterosináptica.
• Una sesión con 10 estímulos produce habituación a corto plazo que dura minutos.
• Cuatro sesiones espaciadas en el tiempo producen habituación a largo plazo que dura
semanas.
• Un único estímulo nocivo puede producir sensibilización a corto plazo durante minutos.
• Más de un estímulo nocivo puede producir una sensibilización a largo plazo que dura
días/semanas.
Hay un cambio a nivel neuronal, ya que llega un momento en el que cada vez que es repetido,
se va aumentando la cantidad de terminales sinápticos para facilitar esa mayor respuesta.
La proteína kinasa (además de cerrar los canales de potasio) se dirige hacia el núcleo de la
neurona y arrastra a otras kinasas. Dentro del núcleo de la neurona, activa otra kinasa (MAPK),
esas kinasas activan la proteína DRES-1, que se fosforila (se añaden fósforos) e induce la
expresión de dos genes (de crecimiento neuronal), que dan lugar al crecimiento de nuevas
conexiones sinápticas, de tal manera que cuando vuelva a haber un estímulo de ese tipo, la
respuesta se genera con mucha más facilidad. También depende de la experiencia. Si el
estímulo externo persiste, lo que sucede es que se produce la inducción de la expresión de
dos genes, crecimiento de nuevas conexiones.
Para que la respuesta motora sea más intensa depende de la cantidad de conexiones,
vesículas, etc.
6. Aprendizaje explícito
Dependiendo del contenido del aprendizaje, estímulos que se asocian para generar un
aprendizaje, hay diferentes zonas:
Mapa semántico. Relación entre diferentes términos. Algunos términos están más
relacionados con otros.
En el hipocampo identificamos el giro dentado, el CA1 y CA3 y el subiculum. Dentro está la
corteza entorrinal, la parahipocampal. Forman el sistema neural del lóbulo temporal Medial.
Después pasará a ser memorizado. Toda la información que recibimos dependiendo de si llega
de regiones frontales, etc, se almacena en la corteza siguiendo el siguiente esquema:
Una vez que ese contenido de información ha pasado por todas esas estructuras, una vez que
está en la corteza, empieza la memorización.
Durante los primeros momentos es necesario que se produzcan conexiones necesarias (rojas)
y no tan necesarias (azules) entre el cortex y el hipocampo, activación continua del
hipocampo con la corteza. Después las asociaciones empiezan a ser más fuertes con otras
regiones (intracorticales), una vez que están más consolidadas, las del hipocampo no son
necesarias, empiezas a ser necesarias las corticales, ya que solamente el concepto es capaz
de activar esas regiones corticales sin tener que volver a rememorar esas conexiones previas.
Mecanismo para ahorrar recursos y tiempo.
Aprendizaje asociativo
Condicionamiento
Hay un emparejamiento
entre dos eventos
En un primer momento estimulamos el manto de la aplisia, y acto seguido estimulamos de
manera aversiva la cola (descarga eléctrica), lo que provoca una retracción violenta de la
branquia. Cuando asociamos el EC- con el EI, la alteración se produce en una conexión
axoaxónica con la neurona sensorial del manto, que sinapta con la interneurona motora-
motora.
Cuando vuelves estimular el sifón vuelves ves que es igual. Antes y después se aplica un
estímulo control en el sifón, veremos que el repliegue es el mismo. Lo que se ha condicionado
es que la estimulación del manto va a provocar la retracción violenta de la branquia.
¿Qué pasa cuando esa asociación entre estímulos tiene un componente emocional?
Además del cerebelo y el hipocampo, tendrá que haber una activación de las estructuras que
tiene que ver con las respuestas emocionales (sistema límbico), en el miedo es la amígdala. Se
estudia a pacientes que tienen lesionada la amígdala.
Cuando otra persona nombre al EC, la respuesta será de miedo, ya que está asociada con el
EI (aunque este no se presente). En la piel hay una reacción cuando alguien solamente lo
menciona.
Cuando un individuo tiene lesionada la amígdala, se asocia el EC con el EI, reacciona con
miedo, pero cuando se mide la conductancia de la piel, ante la presencia del EC no hay una
respuesta significativa, pero sí cuando se produce el EI (aversivo), el estímulo aversivo sigue
siendo aversivo. Sí que perciben cuando algo es desagradable, pero no se produce el
condicionamiento entre ambos estímulos.
No es que sea incapaz de memorizar esa asociación, pero no se produce ese
condicionamiento de miedo (emocional). El de salivación sí que se produciría ya que no
interviene la amígdala.
El contenido declarativo (explicación de que después del EC va el EI), sí que existe, pero no
aparece ese condicionamiento al miedo.
Que exista una lesión entre hipocampo y amígdala no es tan imposible porque están bastante
cerca.
Ese sistema de refuerzo es un sistema dopaminérgico, las regiones que están basado este
aprendizaje son los ganglios basales.
Tiene que ir al brazo que está iluminado, aprender que el premio va a estar en un brazo
iluminado que cambia en cada ensayo. Animales con lesión en el hipocampo si son capaces
de aprender, mientras que los animales con lesión en los ganglios basales no logran
aprender.
Se hizo con pacientes con enfermedad de Parkinson (lesión ganglios basales – sustancia
negra) y con pacientes amnésicos (lesión hipocampo). Cuando tienen que explicar o
demostrar que han entendido la norma, el procedimiento, el aprendizaje instrumental para
hacer bien la tarea y ganar puntos, los pacientes con Parkinson no son capaces de aprender,
mientras que los amnésicos lo entienden, y los sujetos control igual que los amnésicos.
Asociación entre Respuesta y Consecuencia.
(meso – mesencéfalo)
B) Predicción de que va a llegar un refuerzo gracias al estímulo discriminativo previo
(luz).
Tarea es poner una línea en medio de la estrella con un espejo, pero es una habilidad que se
entrena a base de repetirla. Paciente que tiene alterado el hipocampo, cuando lo hace con la
mano izquierda a cuando lo hace con la mano derecha, lo hace de manera completamente
diferente. Solo tiene el hipocampo izquierdo operado, por lo que le cuesta mucho más con la
mano derecha, ya que la parte izquierda se encarga del movimiento de la mano contraria, y
viceversa.
Según Ramón y Cajal: “[…] la corteza cerebral semeja un jardín poblado de innumerables
árboles, las células piramidales, que gracias a un cultivo inteligente pueden multiplicar sus
ramas, hundir más lejos sus raíces y producir flores y frutos cada día más exquisitos” – Se
puede modificar esa estructura y riqueza.
Partiendo de una capacidad X, hay un margen que depende del ambiente o entrenamiento, el
cual va a determinar si se produce o no el aprendizaje (plasticidad neuronal).
Aprendizaje a largo plazo una modificación en las estructuras de las neuronas, modificación en
la sinapsis.
Principio de Hebb
“Neurons that fire together, wire together”. Las neuronas que disparan juntas, se conectan entre
sí (Cell assemblies). A base de disparar y conectar al mismo tiempo, cuando se dispara una,
induce el disparo de la otra. Ensamblaje celular.
Una sinapsis entre dos neuronas se fortalece cuando se produce una coincidencia en la
actividad presináptica y postsináptica, es decir, si las dos neuronas se encuentran activadas
al mismo tiempo.
Neurona motora (presináptica) que conecta con otra neurona motora (postsináptica) que
produce la contracción del párpado.
Hay una neurona somatosensorial que conecta con la neurona motora presináptica a través de
la conexión con la con la neurona motora (postsinaptica) que da lugar a la contracción del
párpado. (soplar)
Cerca hay otra neurona sensorial que produce estimulación auditiva (silbato).
Cuando se activa la neurona sensorial auditiva (silbido) al mismo tiempo se activa la neurona
somatosensorial (silbido), que conectan con la neurona motora y producen la contracción del
ojo. Las neuronas que disparan juntas se conectan entre sí. A base de disparar juntas se
produce una asociación fuerte entre ambas neuronas (auditiva y somatosensorial). Consigues
que estén despolarizadas al mismo tiempo y al final será el estímulo auditivo (silbato), el que
genere esa respuesta.
Mecanismos postsinápticos.
Potencial X (reposo) y se aplica una estimulación tetánica (tren de estímulos entre 100 y 1000).
Tras una estimulación tetánica (entre 100 y 1000 estímulos a alta frecuencia: 25-400 Hz), el
incremento de la actividad postsináptica se mantenía ante pulsos individuales durante horas
Cuando se daba un solo estímulo que en condiciones normales no producía tanta estimulación,
esa neurona postisáptica se mantenía mucho más tiempo. Alteras la sensibilización de la
membrana. → POTENCIACIÓN A LARGO PLAZO (PLP), efecto se mantiene a largo
plazo→ Fenómeno plástico caracterizado por un incremento estable y duradero de la eficacia
sináptica (magnitud de la respuesta) tras una estimulación de alta frecuencia.
Tras una estimulación tetánica (entre 100 y 1000 estímulos a alta frecuencia: 25-400 Hz), el
incremento de la actividad postsináptica se mantenía ante pulsos individuales durante horas →
POTENCIACIÓN A LARGO PLAZO (PLP) → Es necesario que la célula postsináptica esté
activada (despolarizada) cuando la presináptica dispara.
Aspecto externo.
• Controlan un canal de Ca2+, que está normalmente bloqueado por un ión Mg2+. Éste
impide que los iones Ca2+ penetren en la neurona postsináptica, incluso cuando el
receptor es estimulado por Glutamato
• Pero…. si la membrana postsináptica está despolarizada, el Mg2+ es expulsado del
canal iónico y deja paso libre al Ca2+ → Los receptores NMDA están controlados tanto
por neurotransmisor (Glu) como por voltaje (despolarización de la neurona
postsináptica)
Cambios funcionales:
• Incremento de la capacidad conductiva de los receptores AMPA.
Cambios estructurales:
• Aumento de los receptores AMPA.
• Ensanchamiento de las espinas dendríticas ya existentes (para
acomodar todos los receptores AMPA).
• División de una espina en dos.
• Creación de nuevas espinas dendríticas.
Modificando los receptores de NMDA en el hipocampo, lo que vemos es que un animal normal
aprenderá que a base de dar vueltas consigue alcanzar la plataforma, pero a los que se
modifica o carecen de receptores de NMDA, no tienen esa representación espacial y no tienen
ningún patrón que se asocie, tienen déficits de memoria espacial, y no recuerdan nada que les
permita llegar a la plataforma.
Coge un grupo de personas y les induce la ausencia de una función, les tapó los ojos,
provocando falsamente una ceguera durante una serie de días. Lóbulo occipital está entrenado
para la función visual. Les empezó a enseñar braille (somatosensorial). Las áreas visuales
(regiones occipitales) empezaron a tomar activación durante la lectura del braille
(somatosensorial activa las regiones occipitales) 5 días después. ¿Qué pasaba cuando les
quitaba la venda? A los 5 días de quitarle la venda todo volvía a la normalidad.