Está en la página 1de 38

Apuntes Aprendizaje y Condicionamiento.

pdf
Apuntes Completos de la Asignatura Aprendizaje y Condicionamiento

1º Aprendizaje y Condicionamiento

Grado en Psicología

Facultad de Psicología
UAM - Universidad Autónoma de Madrid

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

APRENDIZAJE Y CONDICIONAMIENTO
BLOQUE I: Fundamentos psicológicos
TEMA 1. Algunas consideraciones previas
1. Noción de aprendizaje

Aprendizaje guiado, aprendizaje con la experiencia, aprendizaje por imitación, aprendizaje por observación…

- Adaptación: el aprendizaje modifica los patrones de acción y es por ello un proceso adaptativo. Esto se debe
a que somos plásticos.

- Aprendidos son todos los conocimientos y comportamientos que no responden a la herencia genética, es
decir, que no sean innatos (Froufe, 2004).

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- No existe un único tipo o mecanismo de aprendizaje.

- En términos generales se habla de dos mecanismos mentales de aprendizaje (Pozo, 1989): asociación entre
eventos y reestructuración mental.

2. Aprendizaje asociativo: asimilando covariaciones y regularidades ambientales

Forma básica de aprendizaje que consiste en la adquisición de conocimiento y la adaptación conductual a que
da lugar el desarrollo de asociaciones provocadas por la experiencia con eventos del entorno.

El asociacionismo conductual tuvo varios desarrollos a lo largo del siglo XX:

A. Asociacionismo conductual mecanicista: aprendizaje reproductivo (Conductismo).

 Estudio de la conducta manifiesta, públicamente observable, provocada por factores también


públicamente observables: los estímulos ambientales.

 Planteamiento atomista: Estímulo  Respuesta. Los comportamientos más complejos son suma de
cadenas E-R.

 Reduccionismo antimentalista: se niega papel causal alguno a las estructuras, representaciones y


procesos mentales.

 El aprendizaje siempre conlleva algún cambio conductual observable.

 Concepción reduccionista y mecanicista del individuo como un ser pasivo.

 Se buscan los principios generales del aprendizaje.

 Principio de isomorfismo: correspondencia entre lo aprendido y la estructura del mundo. Se asume que
el estímulo llega tal cual al organismo, no hay procesamiento de la información.

 Supuesto de equipotencialidad: las leyes fundamentales de la asociación operan de la misma forma


para todos los organismos de diferentes especies, y con cualesquiera estímulos y respuestas. Por tanto
da igual qué organismo utilizar para estudiar el aprendizaje.

Aprendizaje latente (Tolman y Honzik, 1930): contradice el supuesto de que solo hay aprendizaje si se
observa un cambio en la conducta (VER LIBRO).
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

B. Neoasociacionismo cognitivo animal: liberalización del mecanicismo.

Se introduce lo cognitivo en la secuencia E-R. Sin embargo, no se cree que el humano sea diferente a los
demás animales por tener capacidades cognitivas, sino que se “humaniza” al resto de organismos.

Estímulo  “Filtro” cognitivo  Respuesta.

El estímulo no entra al organismo tal cual es, por lo que se deja de aceptar el isomorfismo.

 Se continúan buscando principios básicos generales de aprendizaje.

 Ya no solo se extrapolan principios asociativos desde la experimentación animal al hombre, también se


incorporan a la investigación animal supuestos y modelos de la psicología humana.

 Las asociaciones E-R (la influencia del ambiente sobre el comportamiento) están mediadas por
diferentes procesos cognitivos.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
 Supuestos: reduccionismo antimentalista, isomorfismo, equipotencialidad, atomismo E-R.

Las anomalías empíricas y la irrupción del cognitivismo ponen de manifiesto:

 Diferencias importantes entre especies y eventos: a ciertos niveles, el aprendizaje asociativo funciona
de forma diferencial.

 Que la influencia del ambiente está mediada por procesos cognitivos: incluso incorpora supuestos de la
psicología humana a la explicación animal: información, atención, expectativas, memoria…

 Pero sigue a) defendiendo que compartimos mecanismos asociativos importantes con especies
próximas en la escala evolutiva, y b) centrado en el análisis E-R.

C. Asociacionismo computacional: así en el hombre como en la máquina.

Aparece una nueva corriente científica, la psicología cognitiva de procesamiento de la información. Las
personas se conciben como sistemas cognoscitivos que manejan datos. Al nuevo paradigma le interesan los
procesos, representaciones y estructuras cognitivas que median entre estímulos y respuestas (inputs y
outputs informativos). El funcionamiento de los sistemas naturales de procesamiento de la información está
mediatizado por operaciones de cómputo. La conducta pasaría a ser considerada un índice que refleja la
naturaleza y forma de operar del sistema cognitivo. Sin embargo, este enfoque apenas se ocupó de los
procesos de aprendizaje.

Input  Sistema cognitivo  Output

Por otra parte, los complejos procesos cognitivos no serían posibles, por las numerosas operaciones de
cómputo que exigen y el tiempo que éstas consumen, si se realizaran secuencialmente. Por ello surgió el
enfoque conexionista, donde el modelo es el cerebro, en cuyas redes neurales trabajan simultáneamente
numerosas neuronas y estructuras nerviosas. Sin embargo, este enfoque tampoco es capaz de explicar todas
las propiedades funcionales del sistema cognitivo de las personas.

Nuestros mecanismos asociativos compartidos con otras especies son menos de los asumidos inicialmente,
pero son numerosos e importantes, y nada despreciables.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

TEMA 2. Aprendizaje Pre-asociativo


1. Aprendizaje Pre-asociativo

El aprendizaje pre-asociativo consiste en cambios cuantitativos que experimentan los reflejos, cuando se
repiten los estímulos desencadenantes (EDs).

- No implica el desarrollo de ninguna asociación nueva. Lo que va a variar es la intensidad en la respuesta.

- Se modifican conductas que se desencadenan automáticamente ante la presencia de un estímulo, a raíz de


la repetición del estímulo. Estas conductas se denominan “conductas provocadas”, ya que no intervienen
procesos asociativos o de aprendizaje previos.

2. Reflejos

- Unidad de conducta innata más simple.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Reacciones automáticamente disparadas por elementos ambientales específicos, los EDs.
- Ajustes comportamentales rápidos.
- Adaptativos.

“El vigor de los reflejos es proporcional a la intensidad de sus desencadenantes y no varía de una ocasión a otra”
(Descartes). En realidad, los reflejos no son invariables. Aunque sean innatos, pueden cambiar con la
experiencia, ya que una de sus características es su plasticidad.

¿Se puede modificar una reacción innata? Sí.


¿Cómo se logra? Mediante la repetición del estímulo.

3. Cambios en los reflejos

 La repetición del ED unas veces reduce (habituación) y otras incrementa (sensibilización) la R refleja.

 Ambos son cambios meramente cuantitativos (en intensidad): no conllevan asociaciones nuevas.

 Son formas muy elementales (pre-asociativas) y complementarias (opuestas) de aprendizaje.

A. Habituación

Reducción progresiva de una reacción refleja cuando se repite muy a menudo el ED.

- Se aprende a no responder.
- Se produce ante la presencia reiterada de estímulos que no resultan dañinos. La respuesta tiende a
atenuarse de forma progresiva.

 Ornith y Guthrie (1989)

La respuesta de sobresalto disminuye en el día y a través de los días.


Recuperación espontánea: restauración de la respuesta tras un periodo de tiempo sin estimulación.

¿Qué pasaría si, una vez habituado un individuo a un determinado tono, se le administra otro? ¿Volvería a
responder?

- Especificidad: desarrollada habituación a un estímulo, la atenuación de la responsividad resulta


específica para ese elemento u otros muy similares.

- Generalización: emisión de una respuesta aprendida ante estímulos parecidos a los presentes durante
el desarrollo del aprendizaje, que no aparecieron durante la habituación.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

La intromisión de otros estímulos intensos y novedosos durante el proceso de habituación a un


desencadenante suele dar lugar a la recuperación parcial de la respuesta habituada ante este evento. Esto
de denomina deshabituación, y sugiere que la habituación es el resultado de un proceso de aprendizaje, no
una simple adaptación sensorial de los receptores ni fatiga en el sistema de respuesta. El organismo deja de
responder al estímulo aun cuando siga siendo perfectamente capaz de sentirlo y responder ante él. En la
habituación la omisión de la respuesta se debe a cambios en el SN que bloquean la transmisión de impulsos
desde las neuronas sensoriales a las motoras.

En cuanto a la intensidad de los EDs, cuanto más débiles son, más rápidamente disminuye la respuesta que

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
provocan, es decir, más fácilmente se habitúan. Aprender a ignorar los estímulos reiterativos inocuos
resulta claramente adaptativo.

La habituación es el resultado de:

a) Fatiga
b) Adaptación sensorial de los receptores
c) Aprendizaje: no ocurre que los receptores se adapten y no capten los estímulos, sino que se aprende a
no responder.

B. Sensibilización

Agudización de una reacción refleja ante la presencia reiterada de un evento potencialmente nocivo.

Si estamos activados, el mismo estímulo provocador disparará una reacción mucho más fuerte, lo cual se
conoce como efecto de sensibilización.

 Sensibilización ≈ Pseudocondicionamiento

La sensibilización se puede manifestar como un incremento de la reacción ante otros estímulos diferentes a
su desencadenante original. Los estímulos nunca se dieron juntos, por tanto no se puede llamar
condicionamiento. Esto indica que la sensibilización no es tan específica y restringida como la habituación
en cuanto a los estímulos que la desencadenan.

Davis (1989): se expone a un conjunto de ratas a un ruido. Se observa que un grupo de ellas tienen una
respuesta de sobresalto mayor que otras. Sin embargo, todas las ratas estaban en la misma situación y ante
el mismo estímulo. La diferencia debe estar en la experiencia previa.

 Trastorno de Estrés Postraumático

El desorden de estrés postraumático constituye un caso clínico de sensibilización mórbida, resultante de la


exposición crónica a una situación estresante o a algún evento traumático.

Morgan et al. (1996): veteranos de la guerra del Golfo. VD = respuesta de sobresalto. Su respuesta está muy
incrementada en comparación con otros sujetos. Cuando se va incrementando la intensidad del ruido, su
respuesta se va incrementando, lo que no ocurre con otros grupos: se van sensibilizando.

 ¿Sensibilización o habituación?

Un estímulo que ordinariamente al repetirse produce habituación puede generar sensibilización en


individuos que han sido traumatizados o están excitados (Davis, 1974).

- Depende de los atributos de la estimulación y del estado de los individuos.

- La sensibilización normalmente requiere menos exposiciones.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

- La sensibilización es más abierta: una vez que el individuo se ha sensibilizado a un estímulo es fácil que
estímulos similares den lugar a una respuesta parecida.

- Ante los estímulos que inicialmente generan sensibilización finalmente suele acabar apareciendo
habituación si se repiten muchas veces seguidas.

Reflejo defensivo en gatos ante descargas sucesivas de diferentes intensidades

- Descargas débiles: se produce habituación.


- Descargas medias: al principio se produce sensibilización para finalmente producirse habituación.
- Descargas fuertes: se produce sensibilización, aunque luego ésta baja.

4. Patrón Estándar de la Dinámica Afectiva (PEDA): El patrón de las reacciones emocionales y su cambio

Muchas respuestas emocionales no solo tienden a mostrar un patrón dinámico bastante característico y similar
entre sí, sino que también suelen evolucionar de forma parecida cuando se repite su desencadenante. Al margen

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
de su valencia o cualidad concreta, las emociones suelen mostrar un curso bifásico característico, con dos fases
de signo opuesto. Solomon y Corbit (1974) llamaron a esta pauta reactiva bifásica patrón estándar de la
dinámica afectiva (PEDA).

La aparición de un estímulo afectivamente potente suscita un estado emocional, la reacción afectiva primaria,
que rápidamente alcanza su nivel más alto. A este pico máximo le sigue una fase de adaptación, en la que el
estado emocional se va suavizando, hasta alcanzar un nivel más o menos estable. Cuando cesa el estímulo, el
estado emocional se transforma rápidamente en el sentimiento contrario; esto es la posreacción afectiva. Esto
es lo que ocurre las primeras veces que se presenta el ED, antes de habituarnos a él.

Cuando el ED se convierte en rutinario, suscita una reacción emocional primaria o estado A más suave, mientas
que la posreacción afectiva o estado B resulta más intenso y extenso.

No es bueno permanecer muy excitado durante mucho tiempo. Es mejor permanecer estable, para poder
reaccionar emocionalmente ante diferentes situaciones.

5. Teoría de los Procesos Oponentes (PO)

Solomon y Corbit (1974) han intentado explicar tanto el PEDA como su evolución, cuando el ED se repite,
mediante una teoría de proceso-dual orientado a mantener el equilibrio en el sistema, la hipótesis de los PO.

- En los organismos existe tendencia a mantener equilibrio: homeostasis.

- Cuando una fuerza rompe la homeostasis, el organismo pone en marcha un proceso orgánico
compensatorio.

- La emoción o estado psicológico experimentado en cada momento resulta de la diferencia neta de sustraer
la influencia del proceso b de a. Estado psicológico consonante con el proceso subyacente dominante.

 Proceso a: drogas y situaciones emotivas son “agresiones” que rompen mediante algún mecanismo el
equilibrio orgánico. Cuando a > b  Estado A.
 Proceso b: los organismos ponen en marcha operaciones compensatorias. Cuando a < b  Estado B.

¿Pero qué pasa cuando el ED se repite?

Mientras el proceso a no cambia de las primeras situaciones a las situaciones de estabilidad, el proceso b cada
vez opera con mayor celeridad, intensidad y persistencia (duración). Por tanto, la intensidad del estado B va
aumentando, al revés que la del A.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

TEMA 3. Condicionamiento Clásico: fundamentos


1. Características del Condicionamiento

- Aprendizaje de conductas nuevas.


- A través de la asociación.
- Mediante la experiencia.

Se puede tratar de:

- La emisión de conductas ya existentes en el repertorio comportamental del organismo, pero generadas por
circunstancias que antes no las provocaban.
- El desarrollo de nuevas conductas resultantes de la integración de otras más elementales ya existentes.
- La aparición de conductas genuinamente nuevas, inexistentes previamente.

Hay dos tipos principales de condicionamiento: el clásico y el instrumental. En ambos se trata

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
fundamentalmente de la asociación entre dos eventos, pero, mientras que en el clásico ambos eventos
consisten en estímulos ambientales, en el instrumental uno es una conducta del propio organismo.

2. Pavlov y el origen del Condicionamiento Clásico

Estudiado por el fisiólogo ruso Iván Pavlov, que recibió el premio Nobel de 1904 por sus estudios sobre el
funcionamiento de las glándulas digestivas.

Pavlov observó las “secreciones psíquicas” (condicionadas) y expuso por primera vez su teoría en Madrid, 1903.
Después de recibir el premio Nobel abandonó su anterior investigación y consagró su vida a estudiar este
descubrimiento. Montó su laboratorio en San Petersburgo.

a) Antes del condicionamiento: Estímulo Incondicionado (comida)  Respuesta Incondicionada (salivación)


b) Antes del condicionamiento: Estímulo Neutro (diapasón)  Respuesta No Condicionada (no hay salivación)
c) Durante el condicionamiento: Diapasón + Comida  Respuesta Incondicionada (salivación)
d) Después del condicionamiento: Estímulo Condicionado (diapasón)  Respuesta Condicionada (salivación)

La explicación de Pavlov sostenía que se forma una conexión nerviosa nueva entre los centros activados por la
percepción de cada uno de los estímulos. La contigüidad repetida de los estímulos acaba consolidando la
formación de una asociación entre sus codificaciones cerebrales.

 Un experimento prototípico (Anrep, 1920)

Sonido durante 5s y 2s después comida. Repite esto cada 5-35 minutos. Cada 10 ensayos, sonido 30s.

La intensidad de la salivación en los ensayos de prueba (fase de sonido 30s) aumenta gradualmente. Al
comparar los resultados de dos de los animales, se observa que son muy similares, por lo que debe haber un
principio explicativo común para los dos.

Pavlov y sus colaboradores replicaron este tipo de observaciones con elementos distintos a los tonos y la
comida y con otras especies, obteniendo con frecuencia resultados similares. Esto les llevó a plantear el
supuesto de equipotencialidad asumido más tarde por el Conductismo.

 Definición del Condicionamiento Clásico

Proceso mediante el que un estímulo originalmente irrelevante se asocia, debido a su reiterado


emparejamiento, con algún evento motivacionalmente importante, por lo que el primero acaba por
adquirir la capacidad de provocar también una reacción similar a la generada por el elemento importante.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

3. Elementos del Condicionamiento Pavloviano

A. Estímulo Incondicionado (EI): evento que desencadena en el organismo una reacción refleja, no aprendida.
Eventos biológicamente relevantes, drogas; eventos con connotación afectiva, estética... En general, cuanto
más intenso es el EI, más fuerte resulta el condicionamiento.

ECs convertidos en EIs  Condicionamiento de segundo orden.

B. Respuesta Incondicionada (RI): reacción refleja generada automáticamente por el EI. Salivación, tasa
cardíaca, respuesta electrodérmica…

¿Tiene que haber siempre una RI para que se produzca aprendizaje? Parece que no: CC con RI bloqueada,
precondicionamiento sensorial.

C. Estímulo Condicionado (EC): elemento originalmente neutro que precede de forma repetida al EI, con el que
acaba asociándose, hasta provocar una reacción similar a la RI. Sonidos, luces, imágenes, palabras… Los

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
elementos capaces de funcionar como EC no se limitan a los estímulos neutros.

Las características del EC que inciden en el proceso de condicionamiento son:

 Relevancia ecológica: atribuir el malestar a causas biológicas o fisiológicas y no a causas psicológicas, a


cosas que biológicamente se conectan mejor. Por ejemplo, si nos duele la tripa pensamos que es por
algo que hemos comido, si nos duele la cabeza pensamos que es por un sonido repetitivo…
 Intensidad: relación directa (hasta cierto límite) entre la intensidad del EC y la efectividad de su
condicionamiento.
 Discriminabilidad: no solo importa la intensidad del EC, sino que sea discriminable respecto a otros
elementos concurrentes.

D. Respuesta Condicionada (RC): reacción desencadenada por el EC, similar a la RI. La RC suele ser menos
intensa que la RI. Además, no siempre es similar a la RI: en ocasiones, no solo tienden a ser diferentes, sino
incluso opuestas.

4. Respuestas susceptibles de ser condicionadas

A. Reacciones autónomas: los reflejos

Tasa cardiaca, actividad electrodérmica, secreción de insulina y de orina, temperatura corporal, nivel de
glucosa en sangre, funcionamiento del sistema inmunitario, efectos de drogas…

1. Efectos de las drogas

En los estímulos motivacional y afectivamente intensos… ¿a qué se debía el progresivo incremento de la


contrarreacción?

- H1 (la original): asumía que la mayor eficacia del proceso defensivo cuando se repite la agresión
responde a su tendencia natural a fortalecerse, conforme se ejercita. “Habituación” al evento
desencadenante provocada por la progresiva “sensibilización” de la reacción compensatoria.

- H2 (la nueva): las circunstancias (Ecs, estímulos contextuales) que acompañan al elemento perturbador
(EI) tienden a asociarse a este y a disparar la reacción compensatoria. Se trataría de una potenciación
condicionada (RC) del proceso b, conforme se repite la situación.

(Froufe: el proceso oponente se liga a los estímulos, incluido el contexto, que señalan el elemento
perturbador. El fortalecimiento progresivo de la reacción defensiva con las experiencias repetidas
simplemente reflejaría el curso característico del proceso de condicionamiento).
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

 Reacción compensatoria condicionada (Paletta y Wagner, 1986)

Estudio 1: observar el patrón reactivo bifásico. Dos grupos de ratas. Al grupo experimental se le inyecta
morfina. Mientras dura el efecto de la droga su actividad baja mucho. Cuando se pasa el efecto su
actividad no vuelve al nivel anterior, sino que sube muchísimo, al contrario que el grupo control, y
tardan un tiempo en volver a la normalidad.

Estudio 2: provocar el condicionamiento de la reacción compensatoria. Fase 1: a dos grupos de ratas se


les inyecta morfina (un grupo contexto experimental, un grupo en su jaula habitual), un tercer grupo
control (inyectan suero en su jaula habitual). Diez sesiones para lograr el condicionamiento. Fase 2: a

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
todas les inyectan suero en el laboratorio. El grupo de contexto experimental en la fase 1 se activa más
que los otros grupos. Esto quiere decir que el proceso b se ha activado, y la causa solo puede ser el
contexto: no hay morfina, pero son las únicas ratas que asocian el contexto (la jaula de laboratorio) con
la situación; no asocian el pinchazo, puesto que eso no cambia en ambas situaciones.

 Tolerancia condicionada

Tolerancia: pérdida progresiva de la efectividad de las drogas con su uso repetido.

Especificidad situacional de la tolerancia: se ha observado que la tolerancia es mayor cuando la droga


se maneja repetidamente en el mismo contexto. Indicativo de condicionamiento compensatorio ligado a
la situación, que funcionaría como EC (RC = poner en marcha la reacción compensatoria): cuanta mayor
reacción antagónica desencadenen las señales que preceden y acompañen a la droga, en este caso el
contexto específico de su uso, menos efectos primarios netos producirá.

Eso puede contribuir a explicar las muertes por sobredosis. Conforme se desarrolla tolerancia, se
requieren cada vez mayores dosis para mantener los mismos efectos. Puede llegar un momento en que
tales dosis excesivas resulten letales. Según esta propuesta explicativa, ¿dónde se produciría con más
probabilidad una sobredosis? ¿En contextos habituales o nuevos? Más en contextos nuevos, donde no
operaría la RC compensatoria: el organismo no está preparado para hacer frente a los efectos de la
droga, porque no están las claves contextuales que le indican que debe reaccionar contra ellos.

Siegel et al. (1982): MUERTE POR SOBREDOSIS (VER LIBRO)

2. Efectos de la insulina: glucemia condicionada.


3. Psiconeuroinmunología: inmunomodulación condicionada.

B. Acciones esqueletales: el comportamiento

 Seguimiento de señales (VER LIBRO)

Brown y Jenkins, 1968: se mete a una paloma en una jaula, se enciende una luz y seguidamente se le pone
comida. La paloma siempre va a la luz y no a la comida.

Hearst y Jenkins, 1974: hay dos luces, una que es señal predictora de comida, y otra que no lo es. La paloma
en seguida asocia la primera luz con la comida. La paloma continúa yendo hacia la luz aunque le pongan la
comida.

En el medio natural el seguimiento de indicios suele resultar funcional a la hora de satisfacer necesidades. La
eficacia en la consecución de alimentos, agua, pareja… se puede ver potenciada por la tendencia a seguir las
señales relacionadas con las situaciones y objetos que permiten satisfacer esas necesidades.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

C. Motivación y afectividad: mediante CC también se pueden modificar los estados motivacionales y afectivos.

1. Regulación alimenticia

Los sabores asociados con enfermedades se tornan aversivos, mientras que los asociados con la
recuperación se tornan apetecibles, un proceso de condicionamiento que permite a los animales adoptar
dietas aptas para sobrevivir.

 Preferencias

o Aprendizaje “sabor-sabor”: una forma de tornar apetecible un sabor es asociarlo a otros que ya
gustan. Y viceversa, un sabor agradable verá reducido su atractivo cuando se asocie a otros
desagradables.

o Aprendizaje “sabor-nutriente”: se desarrolla preferencia hacia alimentos/sabores cuya ingestión


va seguida de valor nutritivo alto. Las propiedades sensoriales de los alimentos se pueden

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
asociar con sus consecuencias post-ingestivas.

Lucas y Sclafani (1999): dieron repetidamente a ratas unas veces una solución de un sabor junto
con infusión intragástrica alta en carbohidratos (EC + AC); otra solución de otro sabor junto con
infusión alta en grasas (EC + AG); y otra solución de otro sabor junto con infusión intragástrica de
agua EC-). Los emparejamientos entre los diferentes sabores y nutrientes se contrabalancearon.
Consumo de las soluciones de los diferentes sabores con dos vasijas, para ver qué sabor
(NUTRIENTE) era el preferido. En la prueba de preferencia manifestaron una marcada
preferencia por nutriente con independencia del sabor. Prefirieron las grasas. (VER LIBRO)

 Apetito: los EE neutros (sobre todo el contexto) presentes durante la ingestión de alimentos en
individuos hambrientos suelen inducir consumo incluso cuando los individuos están saciados. Por
ejemplo, cuando nos sentamos en el sofá nos da hambre aunque acabamos de comer, porque
hemos asociado ese estímulo a la comida.

2. Activación del impulso sexual

Entre los aspectos susceptibles de condicionamiento están los rituales de cortejo.

 Holloway y Domjan (1993): presentaron a codornices macho un EC seguido, según el grupo, de:
acceso a cópula hembra, acceso visual hembra, nada. Desarrollo de preferencia condicionada de
lugar: aquellos machos que tienen acceso físico a la hembra pasan más tiempo con la pelota (EC).

 Domjan, Biesbois y Williams (1998): reacciones fisiológicas condicionadas (medida de esperma)


ante un EC de tipo contextual. A un grupo de machos se le deja acceso físico a una hembra tras un
EC, al otro grupo no se les presenta una hembra. En un grupo se asocia cabina distintiva (EC) con la
oportunidad de copular (EI) y en otro grupo no. Se observan diferencias fisiológicas condicionadas al
ser expuestos luego a hembra receptiva en esa cabina.

 El CC es capaz de contribuir a regular y potenciar el impulso sexual y la actividad reproductiva.

¿Es esto posible también en el hombre?

Rachman y Hodson (1968) realizaron un experimento parecido a los anteriores con hombres y
obtuvieron efectos similares. Ocurre con lugares, olores, música, velas… condicionan un mejor
contexto para la reproducción. Otro ejemplo de esto es el fetichismo.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

3. Aprendizaje del miedo: Respuesta Emocional Condicionada (REC).

Un problema con el miedo: estimarlo. Estes y Skinner (1941) pensaron que para medir el miedo se
podría aprovechar que en ciertas ocasiones el miedo “congela” al individuo, es decir, da lugar a cierto
grado de inactividad (≠ Indefensión Aprendida). Esto es lo que se ha llamado Razón de Supresión (RzS).
El procedimiento para estimar el miedo sería pues el siguiente:

1. Elegir una actividad en la que el individuo esté muy motivado.

2. Consolidar una conducta instrumental (CI) mediante condicionamiento operante.

3. Condicionar clásicamente miedo a un EC.

4. Se registra en qué medida llevan a cabo la conducta instrumental en presencia del EC durante un

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
determinado periodo de tiempo (B).

5. Se compara con la realización de esa misma actividad durante otro periodo equivalente previo sin EC
(A). La reducción de R con respecto a A indica que el EC “congela”: miedo condicionado.

6. Se aplica la fórmula: Razón de Supresión (RzS) = B/(A+B). En este caso:

 Si B = A, RzS = 0.5, lo que indica ausencia de miedo al EC.


 Si B = 0.0, RzS = 0.0, lo que indica fuerte miedo al EC.
 No se prevé que B > A, por lo que RzS nunca es mayor de 0,5.
 Es decir, la intensidad del miedo guarda una relación inversa con el valor de la RzS: a menor
razón, más miedo.

Annau y Kamin (1961): primero entrenaron a ratas hambrientas a pulsar una palanca para obtener
comida. Luego introdujeron sonido (EC: 3min.) seguido de descarga (EI) de distintas intensidades. Se
observó diferente RzS durante EC, según su EI.

¿En qué supuesto (asumiendo que los periodos A y B tienen la misma duración y que las marcas verticales
indican emisiones de la R utilizada para estimar la RzS) se observa mayor REC? En:

a) A (sin EC) = 13, B (con EC) = 4, RzS = 0.23


b) 11, 3, 0.21
c) 6, 2, 0.25

4. Condicionamiento evaluativo (CE): hasta ahora hemos hablado de casos en los que un EC neutro se
asocia con un EI importante, en cuyo caso el EC se convierte en señal del EI: aprendizaje de
expectativas. Pero si se empareja un EC con un E simplemente agradable/desagradable, éste tiende a
transferir su valencia afectiva al EC, incluso sin necesidad de que éste funcione como señal del EI:
aprendizaje evaluativo (no implica que visto el EC vaya a aparecer el EI). La RC es un valor afectivo.

El CE tiene una serie de peculiaridades y seguramente está en la base del desarrollo de actitudes,
preferencias, estereotipos, prejuicios raciales, gustos alimenticios, autoestima… Características:

 Resistencia a la extinción.
 Independencia del orden cronológico de los eventos.
 Operación automática.
 Desarrollo inconsciente.

Es muy utilizado en publicidad.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

5. Algunos casos especiales

A. Inhibición condicionada

El EC opera como señal de la ausencia del EI.

p EI|EC > p EI|EC = Condicionamiento Excitatorio: la probabilidad de que aparezca el EI (la comida) si antes
ha aparecido el EC (la campana) es mayor que la probabilidad de que aparezca el EI si antes no ha aparecido
el EC. El EC es un estímulo informativo sobre lo que va a venir, informa de que el EI viene.

p EI|EC < p EI|EC = Condicionamiento Inhibitorio: la probabilidad de que aparezca el EI (la comida) si antes
ha aparecido el EC (la campana) es menor que la probabilidad de que aparezca el EI si antes no ha aparecido
el EC. El EC es un estímulo informativo sobre lo que va a venir, pero esta vez informa de que el EI NO viene.

Procedimiento:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1. Prerrequisito: solo puede darse en un contexto excitatorio para el EI. El EI debería ser esperado, de no
ser por la señal inhibitoria. Es decir, el EI debe tender a estar presente, salvo cuando tiene lugar el EC.

2. Forma de inducirlo: alternando ensayos tipo A y B.

 Tipo A: EC+  EI. El elemento EC+ se empareja con el EI.


 Tipo B: EC+ y EC-  X. El EC+ se presenta a la vez que un EC- y se omite el EI.
 Conforme se repiten los ensayos de tipo A, el EC+ va adquiriendo valor de señal del EI, en tanto que
el EC- adquiere propiedades inhibitorias a lo largo de los ensayos de tipo B, al aparecer en un
contexto excitatorio (generado por el EC+) para el EI, pero sin él.

3. Detección: mediante técnica retraso al condicionar EC- (retraso del condicionamiento excitatorio).

Ejemplo: Un sonido aparece repetidamente seguido de una descarga, pero no cuando le acompaña una luz,
¿qué ocurre con esta?  Se convierte en EC inhibitorio respecto a la descarga, lo que se ve por el retraso a
la hora de asociarse con ella, si luego se emparejan luz-descarga.

B. Condicionamiento de 2º orden

Un elemento originalmente neutro produce una RC por haber sido emparejado con otro cuyas propiedades
motivacionales son adquiridas (previamente condicionadas, no innatas). Es decir, el elemento que funciona
como EI lo hace por haber sido convertido antes en EC. Procedimiento similar a Rizley y Rescorla (1972):

Fase Tratamiento
Grupo experimental Grupo control
1. Condicionamiento de primer orden EC1  EI EC1  EI
(Luz  Descarga) (Luz  Descarga)
2. Condicionamiento de segundo orden EC2  EC1 Presentación aleatoria EC1 y EC2
(Tono  Luz)
3. Prueba EC2  RC EC2  Ausencia de RC
(Tono  Miedo)

La RC2 es similar a la RC1 y, por extensión, a la RI. El EC2 nunca debe ir emparejado con el EI.

Más difícil de lograr y menos intenso que el de primer orden. La RC en el segundo orden suele ser
cuantitativamente inferior. Curva diferente: demasiados ensayos lo reducen. Esto se debe a que los ensayos
EC2-EC1 implican un tratamiento, a la vez que de segundo orden, de extinción de la asociación EC1-EI. Así, si
se extingue la RC ante el EC1, también lo hará ante el EC2.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

Por ello guarda cierta semejanza con el condicionamiento inhibitorio:

 Se manejan dos EC: EC1 o EC+, que se empareja con el EI, y EC2 o EC-, que se empareja con el EC anterior,
pero sin el EI.
 El segundo EC señala que, en su presencia, al otro EC no le sigue el EI. Por tanto, en un procedimiento de
segundo orden, EC2 debería generar inhibición condicionada.
 Que se produzca uno y no otro parece depender del procedimiento y del número de ensayos. Si se
prolongan los ensayos de segundo orden durante demasiado tiempo, el condicionamiento se convierte
en inhibitorio, ya que el EC2 avisa de que no aparece el EI.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
C. Contracondicionamiento

Un estímulo originalmente neutro (p. e. sonido) que se había convertido en un EC apetitivo por haber sido
emparejado con un EI de esa naturaleza, se transforma en un EC aversivo, capaz de provocar una RC
defensiva, al ser emparejado posteriormente con, p. e., descarga eléctrica. O a la inversa. Este proceso se
desarrolla de forma comparativamente lenta, ya que tienen que ser contrarrestados los efectos del
condicionamiento previo.

EC EI RC
Condicionamiento Sonido Comida Salivación
Contracondicionamiento Sonido Descarga Respuesta defensiva

Un caso extremo de contracondicionamiento: se emparejan dos EE biológicamente importantes (dos EI) de


signo motivacional contrario. La RI al primer elemento es reemplazada por una RC de valor opuesto. Por
tanto, el contracondicionamiento modifica el significado motivacional del elemento que funciona como EC.

EI+  RI+
EI- + EI+  RI-
EC1  RC-

Pavlov (1927): contracondicionamiento

Descarga (suave) + Comida


Descarga  Salivación

Un ejemplo es el síndrome de Estocolmo, por el cual las personas secuestradas llegan a encariñarse con su
secuestrador porque piensan que a pesar de todo son protegidas por él.

 Aplicación en fobias

Técnicas: desensibilización sistemática (DS). Para aplicar el contracondicionamiento hay que asociar el
objeto de la fobia con otro estímulo positivo para el paciente. Por ejemplo: inicialmente se aplican técnicas
de relajación para que el sujeto aprenda a controlar su estado de ánimo y generar un sentimiento positivo.
Después se le expone a una imagen del objeto. Es decir:

- Exposición gradual a los objetos o situaciones fóbicas.


- Generar estado incompatible con el miedo.

Fases:

1. Entrenamiento en relajación
2. Elaboración jerarquía de ansiedad.
3. Afrontamiento progresivo.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

Hipótesis alternativa: no es contracondicionamiento sino mera extinción (se puede sin relajación):
Exposición / Inundación

D. Aversión adquirida a sabores

¿Alguna vez te ha ocurrido que te sentiste mal después de haber comido algo y ya nunca más has vuelto a
querer tomar eso? ¿Y si sabes que lo que provocó tu malestar no se debe a lo que comiste?

6. El curso de la asociación

A. Adquisición

La presentación repetida de un EC seguido de un EI hace que ambos elementos acaben asociándose y, por lo
general, el primero produzca por sí mismo una RC mayor cuantos más emparejamientos, hasta un límite.

La curva de asociación característica muestra un crecimiento negativamente acelerado. Una vez alcanzado

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
el límite, la fuerza de la RC apenas aumenta con la adición de nuevos ensayos de condicionamiento.

B. Extinción

El condicionamiento, ¿se puede eliminar, una vez consolidado? Sí y no.

Si, una vez alcanzado cierto grado de condicionamiento, aparece reiteradamente el EC solo, sin el EI, se
observa un proceso aparentemente opuesto al de adquisición. Este fenómeno es la extinción, que suele
seguir un curso parecido al de la curva de adquisición, pero inverso y más lento: reducción gradual
negativamente acelerada de la fuerza de la RC, hasta su eventual desaparición.

¿Significa esto que desaparece todo el condicionamiento anterior, que se destruye la asociación EC-EI?

No: la extinción de la RC no es principalmente el resultado de la destrucción de las conexiones de la


asociación. No es olvido o “desaprendizaje”, ya que, una vez extinguida la RC, la reaparición del EC tras un
periodo de tiempo sin su presencia ni la del EI vuelve a provocar la RC. Este fenómeno es la recuperación
espontánea, que tiene lugar sin que desde la extinción haya tenido lugar ensayo alguno que permita rescatar
o reconstruir la asociación.

7. Generalización y discriminación

Tendencias contrarias y complementarias del CP.

A. Generalización

También pueden provocar la RC estímulos distintos al EC, pero similares a él, dentro de ciertos límites.

La intensidad de la RC generada por un determinado elemento es mayor cuanto más se parece al EC original,
lo que se conoce como gradiente de generalización.

La tendencia a la generalización tiene una función claramente adaptativa, ya que es muy difícil encontrar
siempre exactamente el mismo estímulo, y los elementos parecidos suelen tener consecuencias similares.

B. Discriminación

Responder de manera distinta a estímulos diferentes. En algunas situaciones puede resultar importante,
también, no responder de la misma manera a estímulos parecidos. Esto evitaría, por ejemplo, los
estereotipos y los prejuicios sociales.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

¿Cómo se puede promover la discriminación?

Pavlov probó inicialmente a aumentar el entrenamiento, pero no resultó muy eficaz. En cambio, era mucho
más efectivo emplear un entrenamiento de discriminación, en el que los ensayos de condicionamiento con
un estímulo positivo (EC+), al que seguía el EI, se alternaban con ensayos en los que no se presentaba un
estímulo parecido negativo (EC-), que no iba seguido del EI. Al principio se responde a ambos estímulos, ya
que la RC al EC+ tiende a generalizarse al EC-, pero conforme aumenta el entrenamiento la respuesta se
restringe progresivamente al EC+.

8. Importancia de la disposición cronológica de los estímulos

Animales y personas no solo desarrollan asociaciones entre eventos relacionados; también aprenden
disposiciones y pautas cronológicas entre ellos, a las que acomodan sus respuestas. Hay cuatro disociaciones
cronológicas básicas del EC con respecto al EI, y no todas tienen la misma eficacia:

A. Condicionamiento simultáneo

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Consiste en presentar a la vez el EC y el EI. Tiene una eficacia bastante baja, si es que llega a producir RC,
aunque la ausencia de ésta no implica ausencia de aprendizaje.

Procedimiento seguido por Matzel, Held y Miller (1988) para verificar el funcionamiento del
condicionamiento simultáneo:

Precondicionamiento sensorial Tiempo Condicionamiento simultáneo Prueba RC


Click Descarga Click Sí
Tono Tono Tono No

Este condicionamiento no es adaptativo, ya que el EC no adquiere el papel de anticipar el EI, por lo que no
funciona como señal que induzca la correspondiente reacción condicionada preparatoria.

B. Condicionamiento demorado

El EC precede al EI, y su final coincide con la aparición o tiene lugar durante el transcurso de éste último. Es
el procedimiento asociativo más eficaz. El condicionamiento mejora a medida que aumenta el intervalo EC-EI
(intervalo interestimular) desde cero hasta un punto, a partir del cual comienza a descender. Su magnitud
ideal varía en función de los estímulos, las respuestas y los organismos implicados.

Mientras que con intervalos cortos la magnitud de la RC aumenta y su latencia disminuye a medida que
avanza el entrenamiento, con intervalos largos la latencia evoluciona de forma diferente. Se acorta al
principio, pero finalmente suele alargarse casi hasta el momento que tiene lugar el EI. Esto se conoce como
inhibición de la demora (Pavlov): los organismos aprenden que el EI no tiene lugar hasta pasado un buen
rato desde que aparece el EC, por lo que tienden a inhibir la RC hasta un momento próximo a la aparición de
aquél.

C. Condicionamiento de huella

El EC comienza y termina antes de que aparezca el EI. El lapso entre el final del EC y el inicio del EI es el
intervalo de huella. La asociación del EI debe realizarse con la huella del EC, su representación mental.
Menos efectivo que el demorado, aunque su eficacia depende del intervalo de huella.

D. Condicionamiento hacia atrás o retroactivo

El EC sigue al EI, en lugar de precederlo. Es el procedimiento menos efectivo.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

TEMA 4. Condicionamiento Clásico: principios y teorías


1. ¿Qué se asocia en el condicionamiento?

A. Asociación E-R

Interpretación conductista. El EC se asocia directamente con la RI, de tal manera que acaba provocando por
sí mismo una reacción similar, la RC.

Antes del condicionamiento el centro neurológico de representación del EI está ligado de forma natural con
el centro de control de la RI, mientras que el centro de representación del EC no está ligado con ninguno de
ellos. Durante el proceso de condicionamiento se desarrolla una conexión entre los centros del EC y de la RI,
de manera que la activación del primer es capaz de activar de forma directa (no mediada por la activación
del EI) en el segundo una respuesta similar a la incondicionada, la RC.

Evidencia a favor: la RC es frecuentemente casi idéntica a la RI.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
B. Asociación E-E

Interpretación pavloviana. Se produce asociación entre el EC y el EI, es decir, el EC no se asociaría


directamente con la RI.

Durante el proceso de condicionamiento se desarrolla una conexión entre las representaciones del EC y del
EI. Entonces, la activación de la representación mental del EC a raíz de su presencia se propaga al centro de
representación del EI y seguidamente, como consecuencia natural, se produce la reacción conductual
correspondiente: en este caso, condicionada, por venir desencadenada por el EC.

Evidencia a favor: en ocasiones la RC es sustancialmente distinta a la RI.

Estímulos Representaciones internas Respuestas

EI EI  RI RI (RC)
Asociación E-R
EC EC

EI EI  RI RI (RC)
Asociación E-E
EC EC

C. Revaluación post-condicionamiento del EI

Es un procedimiento para poner a prueba las dos hipótesis anteriores, que consiste en alterar el valor el EI
después del condicionamiento.

La teoría E-E predice que después de la revaluación la RC debería cambiar en consonancia con la
modificación sufrida por el EI, puesto que el EC opera a través de él.

Según la teoría E-R, el cambio post-condicionamiento del valor del EI no debería alterar la naturaleza de la
RC, ya que esta sería consecuencia de la asociación directa del EC con la RI.

La evidencia empírica favorece preferentemente la hipótesis de la asociación E-E, más que E-R.

D. Hipótesis de los dos niveles

Que se desarrollen y operen preferentemente asociaciones E-E no implica que no se puedan formar en
ocasiones o en alguna medida también asociaciones E-R. Hoy día existe cierta evidencia neurológica
consistente con la idea del funcionamiento de los dos sistemas.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

2. ¿Por qué se asocia? Contigüidad VS Contingencia

A. Principio de la contigüidad

Inicialmente se consideraba (Pavlov, conductistas) que la contigüidad es el principio de asociación más


importante. La ley de contigüidad establece que dos eventos se asocian en la medida en que ocurren
próximos en el tiempo.

Sin embargo, ya se ha visto que la contigüidad máxima (la aparición simultánea del EC y el EI) provoca una
baja eficacia del condicionamiento. Por tanto, la contigüidad es condición necesaria, pero no suficiente

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
(Rescorla), para que se produzca la asociación.

B. Principio de la contingencia

Para que se produzca condicionamiento resulta fundamental la covariación entre el EC y el EI.

El principio de contingencia (Rescorla) es la capacidad predictiva del EC con respecto al EI. Es un parámetro
derivado de comparar p[EI|EC] con p[EI|EC].

A B C D
p[EI|EC] 0,8 0,8 0,8 0,8
p[EI|EC] 0,0 0,8 0,4 1,0
Contingencia EC-EI ALTA NULA MEDIA NEGATIVA

Como se ve, entre las tres situaciones no habría diferencias en términos de contigüidad, pero sí en términos
de contingencia.

 Rescorla (1968)

Experimento 1

Grupo aleatorio Sonido + descarga Descarga Descarga Sonido Descarga Sonido + descarga
Grupo contingente Sonido + descarga Sonido Sonido + descarga

En el grupo contingente, no siempre que suena le damos la descarga, solo 2 de 3. Y además, nunca le han
dado descarga si antes no ha sonado. Sin embargo, el grupo aleatorio ha recibido tres descargas sin que se
produjera antes sonido, por lo que ésta no es una señal predictora.

El de arriba no aprende nada, no le da miedo el sonido, pero el de abajo sí aprende a temer al sonido. Esto se
ha conseguido manejando la contingencia. Este parámetro es lo que marca la diferencia, ya que la
contigüidad es la misma en los dos grupos.

Experimento 2

Compara 4 niveles de contingencia, modificando la p[EI|EC]: 0.0, 0.1, 0.2 y 0.4, respectivamente. El nº de
emparejamientos (contigüidad) sigue siendo el mismo: p[EI|EC] = 0,4 (siempre mismo nº de
emparejamientos Tono-Choque en todos los grupos).

VD = Razón de Supresión (dejaron de comer en presencia del tono).

La contingencia puede ser positiva, negativa y nula:

 Si p[EI|EC] > p[EI|EC]: Contingencia + = C. EXCITATORIO.


 Si p[EI|EC] < p[EI|EC] : Contingencia - = C. INHIBITORIO.
 Si p[EI|EC] = p[EI|EC] : Contingencia 0 = NO CONDICIONAMIENTO.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

C. Espacio de contingencia (VER LIBRO)

Cada punto del espacio representa una combinación diferente de la probabilidad del EI en presencia y en
ausencia del EC y, por tanto, una contingencia particular.

- Todos los valores situados por encima de la diagonal indican que p[EI|EC] > p[EI|EC], es decir,
condicionamiento excitatorio.
- Todos los valores situados por debajo de la diagonal indican que p[EI|EC] < p[EI|EC], es decir,
condicionamiento inhibitorio.
- Los valores a lo largo de la diagonal indican que p[EI|EC] = p[EI|EC], y por tanto no se observa
condicionamiento.

Este último caso no quiere decir que no se produzca aprendizaje alguno. Los animales aprenden que ambos
eventos no guardan relación (el EC no sirve para predecir el EI), lo que hará más difícil asociarlos en el futuro,
si en algún momento resultan contingentes. Este fenómeno es la irrelevancia aprendida.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
D. Bloqueo: el papel de la sorpresa (Kamin, 1969)

Si se empareja un elemento neutro (ECT) con un EI, su inclusión ulterior en un EC compuesto (ECT + ECL)
impide el condicionamiento del elemento añadido (ECL) dentro del compuesto.

Tratamiento
Fase Grupo experimental Grupo control
1. Preentrenamiento ECT  EI Sin preentrenamiento
(Tono  Descarga)
2. Condicionamiento compuesto [ECT + ECL]  EI [ECT + ECL]  EI
([Tono + Luz]  Descarga) ([Tono + Luz]  Descarga)
3. Prueba ECL  Ausencia RC ECL  RC
(Luz  No miedo) (Luz  Miedo)

¿Por qué el condicionamiento previo de un elemento del EC compuesto inhabilita al otro componente añadido
ulteriormente?

Cuando tiene lugar un evento importante, los animales buscan pistas en su memoria que les permitan
anticiparlo en el futuro, por lo que generalmente acaban ligándolo con aquellas claves que resultan
efectivas, como es el EC en los procedimientos convencionales de condicionamiento. Para optimizar sus
recursos (adaptación), los organismos solo rastrean en su memoria si el EI les resulta sorprendente. Si es
esperado quiere decir que ya existe alguna clave que permite anticiparlo, de manera que no es necesaria
ninguna búsqueda adicional. Eso hace que no se produzca condicionamiento con respecto a ningún
elemento nuevo que preceda a un evento importante.

1. Los elementos redundantes no resultan informativos, apenas generan reacción condicionada.

2. Según el principio de contingencia, solo condicionan los EC que son buenos predictores.

3. Según Kamin, solo condicionan los mejores predictores, cuando concurren varios (competición entre pistas).
Es decir, esto no se puede explicar solamente según el principio de contingencia.

Grupo control Grupo experimental Grupo experimental


T  Descarga
T + L  Descarga T + L  Descarga T  Descarga
L  Miedo L  No miedo L No miedo
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

TEMA 5. Condicionamiento instrumental: refuerzo


1. Antecedentes históricos y noción de CI

Mientras que en el Condicionamiento Clásico se aprendía a asociar estímulos que nos servían de información,
en el Condicionamiento Instrumental la conducta tiene un propósito, está dirigida a metas. La conducta es un
instrumento para lograr experiencias apetecibles y evitar las desagradables.

A. E. Thorndike y su Ley del efecto

Thorndike ideó las llamadas cajas-problema para estudiar el aprendizaje de los gatos. Los animales
comienzaban actuando por ensayo y error, emitiendo diferentes respuestas con diferentes ps
(probabilidades), hasta que daban con la solución al azar. Las respuestas que iban seguidas de consecuencias
satisfactorias vían aumentada su p en ese contexto.

No se ha enseñado nada nuevo, puesto que todas las conductas estaban en el repertorio del animal, pero se

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
ha cambiado la probabilidad de que aparezca la conducta en función de la consecuencia que se le aplica.

- Ley del efecto: las conductas que van seguidas de consecuencias satisfactorias tienden a conectarse con
la situación en la que se produjeron, de manera que cuando la situación se repita, será más probable
que vuelva a tener lugar la misma conducta.

- Ley del ejercicio: y cuantas más veces se repita y más intensa sea la satisfacción, más se fortalecerá la
asociación.

Interpretación de Thorndike de la Ley del efecto:

El refuerzo (ER) de una conducta (R) en un contexto dado (EC) produce asociación EC-R, lo que incrementa la p
futura de esa R en ese EC.

[EC-R]  ER

∆p

B. Skinner

Inicialmente también manejó con frecuencia laberintos. Éstos permiten estudiar diversas cuestiones de
aprendizaje (errores, latencia de respuesta…), pero no proporcionan información sobre qué harían los
animales experimentales si pudieran ejecutar cuanto quisieran la respuesta que les proporciona refuerzos.
Es decir, impiden manejar la tasa conductual (número de respuestas por unidad de tiempo), lo que a Skinner
le parecía fundamental.

A Skinner le interesaba investigar, aparte de qué conductas se aprenden y cómo, cuánto se realizan (en
función de diferentes factores). Por ello, creó la llamada caja de Skinner, en la que los animales:

- Pueden ejecutar la conducta operante tantas veces como quieran.


- Ello les proporciona diferentes tipos de refuerzo.
- El tipo de refuerzo depende de los diversos programas de refuerzo.
- El equipo incluye un sistema de registro acumulativo: permite estudiar la evolución de la tasa de
respuesta y su acumulación total a lo largo del proceso.

Esto dio lugar a la variedad de aprendizaje conocida como condicionamiento operante, sinónimo de
condicionamiento instrumental.

La dinámica característica del proceso de CI es bastante similar a la del CC (adquisición, extinción…).


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

2. Tipos de CI

Refuerzo: incrementa la probabilidad de que se repita la conducta (R).

Castigo: disminuye la probabilidad de que se repita la conducta (R).

- Una conducta puede tener como consecuencia la aparición o desaparición de un evento.


- El evento puede ser agradable o desagradable.

Al combinar los valores de ambos parámetros resultan cuatro tipos de CI:

pR+  Aumenta probabilidad de respuesta Tipo de evento


pR-  Disminuye probabilidad de respuesta Apetitivo Aversivo
Contingencia positiva: lo Recompensa o refuerzo Castigo positivo [pR-]
Efecto de la respuesta provoca positivo [pR+]
sobre el evento Contingencia negativa: Castigo negativo. Escape/evitación

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
lo impide o suprime Omisión (coste de (Refuerzo negativo)
respuesta) [pR-] [pR+]

A. Recompensa o refuerzo positivo

Se maneja una contingencia positiva entre la respuesta instrumental y un estímulo apetitivo. Suele
incrementar la probabilidad de la respuesta. Es el procedimiento de condicionamiento instrumental más
usual para promover conductas.

B. Castigo

Se maneja una contingencia positiva entre la respuesta instrumental y un estímulo aversivo. Tiende a
reducir la probabilidad de la respuesta. Se suele utilizar para eliminar conductas indeseables. Puede suponer
problemas éticos, y su efectividad ha sido muy discutida.

C. Escape/evitación o refuerzo negativo

Se maneja una contingencia negativa entre la respuesta instrumental y un estímulo aversivo. La respuesta
evita que llegue a suceder o interrumpe (si ya está teniendo lugar) el evento aversivo, que sí se produce en
caso de no emitir la respuesta. Normalmente potencia la conducta instrumental.

D. Omisión o coste de la respuesta

Se maneja una contingencia negativa entre una respuesta instrumental y un estímulo apetitivo. La
respuesta suprime o reduce la probabilidad de disfrutar de un evento gratificante, que sí tendría lugar en
ausencia de aquella. Por lo general reduce la conducta instrumental. A menudo se prefiere este
procedimiento para disuadir conductas indeseables en personas, porque, a diferencia del castigo, suele
tener una eficacia notable sin necesidad de recurrir a la estimulación aversiva, evitando efectos perniciosos.

3. Elementos del CI: [EC-R]  ER

A. Respuesta/Conducta (R)

El CI es apto para modificar la probabilidad o frecuencia y la fuerza de las conductas dirigidas a metas,
controladas por el SNC, y que, especialmente en humanos, se consideran deliberadas, voluntarias. Puede
servir para potenciar o combatir este tipo de conductas, siempre que ya existan en el propio repertorio de
los organismos.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

Pero, ¿puede servir el CI para inducir también conductas inexistentes previamente?

Es posible hacerlo, aunque el proceso resulta más lento e indirecto. En personas, la existencia del lenguaje
proporciona una notable ventaja.

Para promover en animales conductas inexistentes mediante CI se suele recurrir al moldeamiento, que
consiste en reforzar progresivamente, por fases, aproximaciones sucesivas cada vez más similares a la
conducta perseguida, hasta lograrla.

No todas las conductas se condicionan con la misma facilidad. Por ello, ya Thorndike estableció el concepto

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
de pertinencia para justificar por qué unas conductas se condicionan con más facilidad que otras, variando la
pertinencia en función del tipo de refuerzos, de la especie y del estado de motivación del organismo, entre
otros factores. Esto, en realidad, supone una ventaja adaptativa.

B. Refuerzo (ER)

 Tipos de refuerzos

- Estímulos como refuerzos

 Primarios: alimentos, agua, estimulación sexual… Son estímulos reductores de algún impulso, su valor
incentivo es innato.

 Secundarios: elogios, olor de comida, dinero… No reducen directamente por sí mismos ninguna
necesidad biológica, han adquirido valor incentivo mediante su asociación con algún refuerzo primario.

 Sociales: atención, cariño, sonrisa, alabanzas… Pueden ser tanto innatos como aprendidos, recibidos de
otros miembros de la propia especie. Muy empleados en la especie humana, pero no exclusivos de ella.

 Estimulación sensorial: música.

 Estimulación eléctrica directa de los “centros cerebrales de gratificación”.

- Actividades como refuerzos

 Principio de la probabilidad diferencial (Premack, 1965)

Dadas dos actividades que difieren en cuanto a su probabilidad de ejecución, la oportunidad condicional
de realizar la más probable puede ser utilizada como refuerzo de la menos probable (no al revés). Es
decir, una actividad poco probable puede verse potenciada si se hace depender de su realización la
oportunidad de llevar a cabo otra muy probable.

 Principio de privación de la respuesta (Timberlake y Allison, 1974)

Para que una actividad resulte potenciada por dar acceso a otra basta con que las personas sufran
restricciones en ésta última, y solo puedan recuperar su realización habitual si llevan a cabo la primera,
que funcionaría como conducta instrumental. Por tanto, ni siquiera es necesario que la reforzante sea
más probable que la instrumental.

Más tarde, estos mismos autores desarrollaron un planteamiento más amplio, la regulación conductual.
Plantearon que existe una distribución “ideal” de actividades en los organismos, cuando no están
sometidos a restricciones: una especie de “homeostasis conductual”, llamada punto de deleite. En las
intervenciones en las que se aplica un tratamiento mediante CI se interrumpe esta distribución,
condicionando la realización de una actividad (la manejada como refuerzo) a la ejecución de otra que se
quiere promover (convertida en conducta instrumental). En este caso el individuo trata de aproximarse a
su punto óptimo de distribución conductual.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

Supongamos que Rodrigo, dejado a sus anchas, dedica: 11h a dormir, 8 a ver TV, 3 a jugar, ½ a hacer
deberes… Si jugar deja de ser independiente de estudiar y se le exige que por cada hora de juego
dedique otra a hacer deberes, esta restricción rompe su homeostasis y dispara los mecanismos de ajuste
encaminados a recuperarla: en este caso, estudia más para poder jugar más.

 Parámetros de los refuerzos

- Cantidad e historia de reforzamiento

 Cuanto mayor es su calidad y cantidad, más potencian la conducta que los proporciona.

 Pero el efecto no depende solo de la cantidad absoluta de los refuerzos, sino también de su cantidad
relativa a la experiencia anterior y, por tanto, de las expectativas. Es decir, la influencia de una
determinada cantidad de refuerzo depende de la historia de reforzamiento. Esto da lugar al fenómeno
de contraste de incentivos. (VER LIBRO: Crespi, 1942)

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Demora

 La demora de los refuerzos reduce su eficacia.


 Seguramente más por interferencia de otras actividades que por incapacidad de retener eventos.
 El perjuicio de la demora se puede mitigar marcando la RI (en humanos, mediante el lenguaje).

- Valor incentivo: descuento de la demora (Tasa de descuento: K)

La demora, además de dificultar la asociación conducta-refuerzo, le resta valor incentivo a este. Este
fenómeno es el descuento de la demora: los refuerzos tienen más valor si se reciben en el momento en el
que se realizan los esfuerzos para lograrlos que si hay que esperar tiempo para su obtención.

C. Contexto (EC): control por el estímulo

Habitualmente las conductas reforzadas lo son en algunos contextos o circunstancias particulares. En estos
casos, la conducta (R) se liga al refuerzo (ER) en ese o esos contextos (EC). De modo que los individuos
condicionados tienden a realizar la acción instrumental en presencia del contexto crítico. Este fenómeno es
el control por el estímulo de la conducta instrumental.

En la caja de Skinner frecuentemente se emplea una clave particular, como una luz, indicativa de la
disponibilidad del refuerzo (estímulo discriminativo o EC+) y otra, como un sonido, indicativa de su no
disponibilidad (EC-). En presencia del EC+ la conducta instrumental conduce al refuerzo, mientras que en
presencia del EC-, no. Eso hace que se tienda a emitir la R operante preferentemente en presencia del EC+.

Pero el EC, además de funcionar como recordatorio de la asociación R-ER, también se asocia con la acción
instrumental (EC-R). Asimismo tiende a desarrollarse asociación entre los dos eventos estimulares: EC-ER.
Esto es la participación del CC (el aprendizaje de predictores de eventos significativos) en el CI.

4. Relación respuesta-refuerzo

- Principio de contigüidad: se refiere a la proximidad en el tiempo entre R y ER. Para que se produzca basta
con que aparezcan próximos un nº X de veces.

- Principio de contingencia: implica que la p de ER es mayor si tiene lugar R que si no. No basta con que R y ER
aparezcan juntos un nº X de veces.

Conducta supersticiosa, ¿avala contigüidad o contingencia?


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

Contigüidad, porque nos fijamos en que una cosa ocurre después de otra una vez, y seguimos creyendo que
seguirá ocurriendo aunque haya pasado más veces cuando la primera cosa no ha ocurrido.

Por ejemplo: el hijo hace una cosa rara una vez, y el equipo del padre marca gol. En varias ocasiones ulteriores,
el equipo marca gol aunque el niño no haya hecho eso, sino que han ocurrido otras cosas (el padre va al baño, la
madre grita…). Por tanto, la probabilidad de que el refuerzo (el gol) ocurra cuando el hijo no hace nada, es mayor
que cuando sí lo hace. Y sin embargo, el padre continúa creyendo que si hace eso el equipo marcará gol.

Sin embargo, en condiciones menos engañosas el desarrollo de CI depende en gran medida de la contingencia R-
ER, además de su contigüidad. Varios estudios han obtenido resultados que indican que cuando no hay
contingencia alguna entre respuesta y refuerzo, aunque aparezcan juntos en ocasiones, no se percibe relación
causal de la respuesta respecto al refuerzo, por lo que este no altera la tendencia a emitir la conducta. De nuevo,
contigüidad es condición necesaria pero no suficiente.

5. Programas de refuerzo

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Refuerzo continuo (RC): siempre hay refuerzo.

- Refuerzo parcial (RP): no siempre hay refuerzo.

 Programas simples: se maneja una sola respuesta bajo un solo programa.

o Programas de razón: se requiere un determinado número de respuestas.

 Razón fija (RF): hay refuerzo cada vez que el individuo repite la conducta X veces.

 Razón variable (RV): hay refuerzo cada vez que el individuo repite la conducta una media de X
veces. Por ejemplo, a veces solo tiene que hacerla 4, y otras 8: la media es 6 veces.

o Programas de intervalo: se requiere que haya transcurrido un determinado periodo de tiempo


desde el refuerzo anterior. El individuo aprende cuál es ese intervalo y realiza la conducta
instrumental poco antes de que se administre el refuerzo.

 Intervalo fijo (IF): hay refuerzo cuando transcurre un periodo de tiempo determinado.

 Intervalo variable (IV): hay refuerzo cuando transcurre una media de X unidad de tiempo.

 Programas complejos (no entran): se maneja más de una respuesta o más de un programa simple.

 En función del programa de refuerzo administrado, se influye en la tasa de adquisición y de extinción

Con un programa de refuerzo continuo, aunque la adquisición es más rápida, al eliminar el refuerzo la extinción
de la conducta es también muy rápida. Con un programa de refuerzo parcial sucede lo contrario. Es decir, hay
mayor resistencia a la extinción en el caso de las R adquiridas bajo programas de refuerzo parcial, y cuanto más
alta es la razón o el intervalo de refuerzo, más resistencia: efecto del refuerzo parcial en la extinción.

Explicaciones del efecto del tipo de programa de refuerzo en la extinción

- Hipótesis de la discriminación: la resistencia a la extinción depende de la similitud entre las situaciones de


adquisición y de extinción, similitud que resulta superior en los programas de RP, más cuanto mayor es la
tasa o el intervalo exigidos durante la adquisición.

- Teoría de la tolerancia de la frustración: la persistencia especial observada durante el tratamiento de


extinción en los individuos sometidos con anterioridad a RP es el resultado de haber aprendido a responder
pese a no lograr refuerzo siempre. Esa experiencia de reforzamiento ha llevado a aprender que si se persiste
en la conducta el refuerzo acaba por llegar, lo que ayuda a anticipar y tolerar la frustración, cuando no llega.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

TEMA 6. Condicionamiento instrumental: castigo


1. El castigo

Consiste en la contingencia positiva entre una conducta y un estímulo aversivo ulterior. Se supone que este
tratamiento disminuye la probabilidad de la conducta afectada, pudiendo llegar incluso a suprimirla por
completo. Sin embargo, lo adecuado de su uso ha sido sometido a un intenso debate, debido a su supuesta
escasa efectividad para suprimir la conducta sancionada, como a sus efectos colaterales contraproducentes.

¿Castigo sí o castigo no?

Thorndike (1932): El castigo NO constituye un procedimiento eficaz para producir reducciones importantes y
duraderas de la conducta. NO debe emplearse.

Skinner (1938): Los efectos supresores del castigo son, en el mejor de los casos, solo temporales. (VER LIBRO)

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ahora se sabe que, comparativamente, es menos efectivo que la recompensa.

2. Factores que afectan a su efectividad

A. Intensidad

Es un factor especialmente importante y complejo.

Boe y Church (1967): tabla de registros acumulados. La línea de abajo indica el grupo de ratas que menos ha
dado a la palanca. Es el grupo que tenía la descarga más intensa la primera vez que toca. Por ello la conducta
desaparece muy rápido. El grupo de arriba es el control, solo con extinción. A medida que va aumentando la
intensidad de la descarga, hay mayor distancia con respecto a la línea de arriba.

Por tanto, si el castigo es suficientemente intenso, incluso su aplicación durante un breve periodo transitorio
puede generar una supresión importante y duradera de la conducta. Así, cuanto más intenso es el castigo,
más efectivo resulta, pero también genera más sufrimiento y efectos colaterales indeseables.

Entonces, ¿habría que comenzar con castigos tenues y, si no funcionan, intensificarlos?

El efecto de un castigo más o menos intenso depende también de la experiencia anterior. Por ello, comenzar
aplicando castigos muy pequeños, para luego aumentar de forma progresiva su intensidad, al no mostrarse
efectivos los anteriores, puede resultar contraproducente. Se genera inmunización al castigo, que acaba
perdiendo parte de su efectividad, incluidas sus versiones severas. Los organismos se adaptan y tornan
resistentes a intensidades que aumentan gradualmente.

Por el contrario, comenzar con castigos intensos produce sensibilización y los correspondientes efectos
secundarios. Así, la exposición inicial a castigos severos puede incrementar el impacto de castigos más leves
posteriores. Lo ideal es, por tanto, encontrar el castigo mínimo suficiente.
B. Demora

Efecto similar al visto en la recompensa: a más retraso de las consecuencias punitivas, menor supresión de
la conducta que las provoca.

Deluty (1978) Intensidad Demora Preferencia


R1 Castigo pequeño Baja: 2’’ Demora 2 VS 12:
Alta: 40’’ 65% R2
R2 Castigo mayor Baja: 12’’ Demora 40 VS 50:
Alta: 50’’ 60% R1
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

Cuando la demora es larga para ambas opciones, predomina la repuesta que conlleva castigo menor, aunque
se reciba antes. Sin embargo, cuando las demoras son cortas predomina la respuesta que da lugar al castigo
mayor, por ser menos inminente.

Un problema que surge debido a este efecto es que mientras las consecuencias adversas de algunas
conductas no deseables aparecen diferidas, esas mismas conductas pueden ser reforzadas a corto plazo, lo
que hace difícil suprimirlas.

C. Programa

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Las conductas castigadas pueden serlo de forma sistemática (equivalente a los programas de RC) o
inconsistente (equivalente al RP). Los programas sistemáticos suelen ser más eficaces que los inconsistentes.

D. Control por el estímulo

Al igual que con la recompensa, la asociación de una conducta con un castigo puede verse controlada por
alguna señal o situación contextual. Si es castigada en unas circunstancias concretas, estas acaban
convirtiéndose en la clave que señala el castigo, y la conducta tiende a desaparecer preferentemente dentro
de esa situación. Se produciría castigo discriminado, con la consiguiente supresión selectiva.

E. Motivación y vías alternativas de satisfacción

Las conductas muy arraigadas y con una motivación fuerte son más difícil es de eliminar, sobre todo si no
se dispone de alternativas para satisfacer el impulso que las promueve. De hecho, castigar conductas muy
motivadas puede generar un conflicto y desestabilización importantes.

F. Refuerzo de conductas alternativas

Si se consigue dar una conducta que sustituye a la que se quiere eliminar, habrá más posibilidades de
conseguirlo.

G. Explicaciones

Todos los factores anteriores afectan a animales tanto como a humanos. Sin embargo, la capacidad cognitiva
y lingüística de las personas también juega un papel importante en el funcionamiento del castigo. Las
explicaciones de por qué se aplica un castigo incrementan notablemente su efectividad, ya que ayudan a
precisar la conducta castigada y a justificar el uso del castigo.

3. “Daños colaterales”

Los eventos punitivos con frecuencia generan efectos colaterales ya que, de no ser así, no funcionan:

- Dolor físico.
- Miedo y ansiedad. A su vez, estas emociones desagradables generan:

 Agresividad, cuando la situación se mantiene, porque necesitamos defendernos.


 Alteraciones de la atención: porque las emociones negativas bloquean los procesos cognitivos.
 Rechazo de las situaciones asociadas con esas emociones.
 Indefensión.

Si el objetivo de un profesor es reducir los errores la estrategia de castigo puede resultar contraproducente. La
realización de las actividades asociadas a castigos se convierte en una fuente de ansiedad, por lo que tenderán a
ser evitadas. En caso de no ser así, el rendimiento resulta en cualquier caso perjudicado.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

Se ha visto que la exposición a estímulos aversivos puede provocar agresividad: es lo que se denomina
agresividad provocada por el dolor. Además, el empleo asiduo de castigos por parte de padres/madres y
maestros/as puede servir a los infantes de modelo de comportamiento agresivo (aprendizaje vicario o por
imitación de los modelos), y favorecer su uso ulterior inadecuado por su parte.

Un último inconveniente del castigo es que se aplica a una conducta “reprobable” ya realizada: se puede
conseguir eliminar una conducta indeseada, pero no se consigue una conducta deseada. Por tanto, a lo mejor
no hay que castigar a los niños cuando juegan mal, sino enseñarles a que jueguen bien. El castigo no llevaría a
jugar de forma cooperativa.

El TDAH suele asociarse al Trastorno Oposicionista Desafiante.

4. Perjuicios de las adversidades inevitables: Indefensión aprendida (Seligman y Maier, 1967)

¿Qué sucede cuando se sufren experiencias aversivas que no se pueden evitar?


¿Qué sucede si no existe contingencia entre el comportamiento de los individuos y sus experiencias adversas?

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La exposición reiterada de animales y personas a sucesos adversos ineludibles importantes tiende a provocar un
estado psicológico caracterizado por la pérdida de capacidad para aprender a evitar posteriores adversidades
eludibles y, en general, para aprender a controlar lo que les ocurre. Es un fenómeno similar en muchos aspectos
a algunas depresiones.

A. El fenómeno: Seligman y Maier (1967)  VER LIBRO

La indefensión adquirida se puso de manifiesto e investigó característicamente a través de diseños triádicos


en los que se trabaja con tres grupos de sujetos experimentales:

- Grupo ejecutivo: expuestos a estímulos aversivos que pueden cancelar emitiendo alguna respuesta.
- Grupo subordinado: no pueden poner fin a los estímulos aversivos, y reciben aquellos que no elimina el
grupo ejecutivo.
- Grupo control: misma situación experimental aparente, pero sin sufrir evento aversivo alguno.

B. Interpretaciones de la indefensión

- Seligman: las experiencias adversas persistentes e incontrolables producen:

 Deficiencia cognitiva: generan la expectativa de carecer de control y la tendencia a transferir esa


creencia a otras situaciones.

 Deficiencia motivacional: reducen los esfuerzos e intentos para controlar los eventos del entorno.

 Deficiencia emocional: incrementan la ansiedad, el miedo, la frustración, el estrés y la agresividad.


Puede desembocar en depresión.

- Otras interpretaciones: las descargas reiteradas ineludibles producen miedo, ansiedad y estrés que, a su
vez, generan:

 Disminución general de la actividad, posiblemente a causa de alteraciones bioquímicas. Esto


explicaría la pérdida de capacidad para aprender a escapar.

 Déficit atencional, que dificulta luego prestar atención a acciones propias y asimilar sus
consecuencias.

Es decir, el origen sería un problema emocional que pone al organismo en una situación nefasta para
aprender que puede buscar una salida.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

C. Tratamiento y prevención de la indefensión

Inmunización: Williams y Maier (1977)

1º Un grupo es entrenado en tratamiento de inmunización: descargas escapables mediante cierta R.

2º Ese grupo y otro son sometidos a tratamiento de indefensión: descargas inescapables.

3º Esos dos grupos y otro control son sometidos a prueba de escape: descargas eludibles mediante otra R.

Resultados: el grupo indefensión es el que más tarda en aprender a escapar. El grupo control, que no ha
tenido fase de indefensión, está en medio, y el grupo inmunización + indefensión es el que más rápido
aprende. Este grupo ha tenido una experiencia previa que le ha inmunizado a que se desencadene el
fenómeno de indefensión.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

BLOQUE II: Bases biológicas


TEMA 7. Bases neurales del aprendizaje y el condicionamiento
1. Aprendizaje y memoria

Aprendizaje:

 Proceso por el cual se adquiere nueva información o conocimiento.

 Es una propiedad fundamental del cerebro que se manifiesta de diversas formas mediante múltiples
sistemas diferenciados anatómica y funcionalmente.

 El entorno modifica nuestro comportamiento, en tanto que es capaz de inducir cambios en nuestro SN.

Memoria: mecanismo por el que este conocimiento es codificado, almacenado y, posteriormente, recuperado.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La fase de codificación de la memoria es, en cierto modo, la fase de aprendizaje. Sin embargo, no es suficiente
con adquirir el conocimiento, sino que éste también tiene que consolidarse y poder ser recuperado para su uso.

La base física y biológica de la memoria, y por tanto del aprendizaje, es el cerebro, y dentro de éste, a nivel
microscópico, las sinapsis. El cerebro es un órgano dinámico, en constante cambio, que genera conexiones de
manera continua, debido al aprendizaje. Esto es posible gracias a la plasticidad cerebral. Por ello, el aprendizaje
induce cambios anatómicos, a medida que se practica.

2. Sistemas de aprendizaje y memoria

Los distintos sistemas de memoria se diferencian por el tiempo y la capacidad de almacenamiento:

- Memoria inmediata o memoria perceptiva: aprendizajes sensoriales. Memoria a muy corto plazo de
información visual y auditiva. Tiene capacidad de almacenamiento ilimitada pero es de muy corta duración
(medio segundo-un segundo).

- Memoria a corto plazo, memoria de trabajo o memoria operativa: dura más que los almacenes sensoriales
pero tiene una capacidad limitada (7+/-2 elementos). Permite manejar la información del momento.

- Memoria a largo plazo: no tiene limitación temporal ni, en principio, de almacenamiento. No obstante, no
toda la información almacenada se consolida, aquella que no se utiliza a menudo se olvida. La limitación de
esta memoria está en la recuperación de la información.

 Aprendizaje y memoria explícitos/relacional/declarativa: la información se puede recuperar de forma


verbal.

o Memoria semántica: corteza cerebral. Memoria de conocimientos generales.


o Memoria episódica: hipocampo, lóbulo temporal medial. Memoria de experiencias.
o Memoria espacial: hipocampo, lóbulo temporal medial.

 Aprendizaje y memoria implícitos: la información no se puede recuperar de forma verbal. De menor a


mayor complejidad:

o Habituación y sensibilización (aprendizaje pre-asociativo): vías reflejas.


o Condicionamiento (aprendizaje asociativo): amígdala, cerebelo.
o Priming: corteza cerebral.
o Procedimental: estriado, cerebelo. Memoria de procedimientos, acciones.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

 Lóbulo temporal medial o mesial

Es la parte interior del lóbulo temporal. Está formado por el hipocampo y la circunvolución hipocampal. Ésta
última está constituida por las cortezas entorhinal, perirhinal y parahipocámpica. Todas las memorias
explícitas necesitan, al menos en algún momento, que esté sana alguna parte del lóbulo temporal medial,
mientras que las memorias implícitas no. Una de las características que lo hacen tan fundamental es que es
especialmente plástico. Esto, por otra parte, es una desventaja, ya que hace que esta zona sea más proclive a
tener una reorganización anómala en la que las neuronas se conecten con ellas mismas dando lugar a un
foco epiléptico. Otra de sus ventajas es que está muy conectado con el resto del cerebro, lo que facilita que

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
envíe y reciba información.

Paciente H.M.: uno de los pacientes más estudiados en la historia de la Neuropsicología. Tenía focos
epilépticos en los dos lóbulos temporales, por lo que le fueron extirpados. Esto le ocasionó una amnesia
total, es decir, nula capacidad de aprendizaje (de aprendizaje explícito, no implícito).

3. Aprendizaje no-asociativo: habituación y sensibilización

El aprendizaje no asociativo consiste en el cambio en la conducta por la mera exposición a 1 estímulo.

 Habituación: reducción de la magnitud de la respuesta ante 1 estímulo generalmente inocuo que se repite
con frecuencia en un breve periodo de tiempo. NO ES:

o Adaptación sensorial: los receptores se adaptan, por lo que dejan de detectar los estímulos y no envían
la información al cerebro. En la habituación la información sí llega al cerebro, pero éste no emite
respuesta.
o Fatiga muscular.

 Sensibilización: proceso que provoca que la R a un estímulo, normalmente intenso, nocivo o que provoca
miedo, sea más intensa de lo normal por presentarse tras un estímulo que ha causado un sobresalto inicial.

Aplysia: modelo animal simple utilizado para estudiar las bases fisiológicas del aprendizaje (habituación,
sensibilización y CC). Tiene muchísimas menos neuronas que el ser humano (20 mil, frente a los 100 mil millones
del SH) y son mucho más grandes que las de éste último, lo que la hace ideal para estudiar este tipo de
aprendizajes, ya que solo se necesitan una neurona sensorial y otra motora. La parte morfológica estudiada en
este animal es la branquia; en concreto, se estudia el reflejo de retirada de la branquia.

A. Habituación

Se estimula repetidamente el sifón, situado en la parte posterior de la branquia, hasta que la Aplysia se
habitúa a la estimulación, por lo que el reflejo de retirada branquial deja de producirse.

 A nivel neuronal

El sifón es la parte de la branquia que recibe la información y la envía a una neurona sensorial. Ésta conecta
con una neurona motora, que provoca el movimiento de la branquia. En estado normal, la neurona sensorial
sufre un potencial postsináptico excitatorio (PEP), por lo que genera un potencial de acción (PA) y envía la
información a la neurona motora. Cuando la Aplysia se ha habituado, la neurona sensorial responde igual,
pero la motora tiene un PEP más pequeño, lo que disminuye la probabilidad de que dispare un PA.

 A nivel sináptico

En condiciones normales, la neurona pre-sináptica es recorrida por el PA. Durante el potencial de reposo, el
interior neuronal está cargado negativamente con respecto al exterior (-70 mV). Cuando se produce el PEP,
comienza a funcionar la bomba de Na+/K+ y entran iones Na+ hasta que se alcanza el umbral de excitación. Si
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

esto ocurre, se genera un PA. Llega un momento en que empiezan a salir iones K+, lo que hace que el
potencial de membrana vuelva a ser negativo. Cuando el PA llega al botón terminal, se abren los canales de
Ca2+. La entrada de este ion provoca que las vesículas sinápticas se fusionen con la membrana y segreguen
los NT a la hendidura sináptica. Cuando éstos llegan a la neurona postsináptica, se abren los canales de Na+ y
se genera un PEP, que, si es suficientemente intenso, vuelve a generar un PA.

Cuando se ha producido habituación, en la sinapsis entre la neurona sensorial y la motora, el PEP que se
genera en ésta última no es lo bastante intenso como para alcanzar el umbral de excitación; por tanto, no se
produce otro PA, y la neurona motora no responde.

Esto sucede porque se bloquean parcialmente los canales de Ca+ de la neurona presináptica. Como
consecuencia, entra menos Ca2+ y se liberan menos NT (Glutamato en este tipo de sinapsis excitatorias) a la
hendidura sináptica. Por ello, la neurona postsináptica capta menos NT, entra en ella menos Na+, y el
resultado final es que el PEP es más pequeño. Este fenómeno se denomina depresión presináptica de la
neurona sensorial.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
B. Sensibilización

Para provocar un proceso de sensibilización en la Aplysia, primero se le aplica un choque eléctrico en la cola.
Esto genera que el animal reaccione de forma exagerada ante cualquier otro toque en otra parte de su
cuerpo, lo que provoca el reflejo de retirada branquial. La clave es el shock en la cola: si no se produce no
hay sensibilización. El estímulo aversivo se da antes.

 A nivel neuronal

Al sistema implicado en la habituación hay que añadir un tercer elemento: la interneurona moduladora de
la cola, que se conecta con la neurona sensorial del sifón y ésta, a su vez, con la motora del sifón. Es decir, no
hay una conexión directa entre la neurona moduladora de la cola y la motora del sifón, sino que media entre
ellas la neurona sensorial del sifón. Es la actividad de la neurona de la cola la que determina la actividad de
la sensorial del sifón. Por ello, si posteriormente al choque eléctrico en la cola se toca otra parte del cuerpo
de la Aplysia, ésta responde exageradamente. Ya no hace falta que haya descarga.

Cuando el animal ya está sensibilizado, la neurona sensorial tiene el mismo comportamiento que antes de la
sensibilización. Lo que ocurre es que se genera un PEP mayor y más largo en la neurona motora, lo que
provoca más PA de lo normal. Por tanto, hay más respuesta, y se repliega más la branquia.

 A nivel sináptico

Aumento de la transmisión sináptica por un mecanismo de facilitación heterosináptica (se denomina así
porque interviene un tercer elemento, externo a la sinapsis entre la neurona sensorial y la motora).

Primero aumenta la cantidad de serotonina liberada por la interneurona de la cola en la sinapsis axo-axónica
(interneurona-neurona sensorial). Esto hace que aumente la concentración de AMPc y PKA (proteína quinasa
A) en la neurona sensorial. Estos dos elementos provocan que se cierren parcialmente los canales de K+, por
lo que se retienen los iones K+ en el terminal sináptico y no salen al exterior. Esto alarga la duración del PA.
Como consecuencia, los canales de Ca2+ se mantienen abiertos durante más tiempo, por lo que entra más
Ca2+, se fusionan más vesículas sinápticas con la membrana y se liberan más NT (Glu) a la hendidura
sináptica. Esto provoca, a su vez, que la neurona postsináptica capte más NT y consecuentemente más iones
Na+, lo que genera un PEP mayor y más largo de lo normal.

Todo esto es posible porque, una vez que se ha aplicado una descarga eléctrica en la cola, su interneurona
empieza a liberar serotonina y continúa haciéndolo durante un tiempo. Por eso más tarde, si se toca otra
parte de su cuerpo, la reacción continúa siendo mayor de lo normal, aunque ya no se haga nada en la cola.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

C. Habituación a largo plazo

- Una sesión con 10 estímulos produce habituación a corto plazo que dura minutos.
- Cuatro sesiones espaciadas en el tiempo producen habituación a largo plazo que dura semanas.

Cambios estructurales/anatómicos asociados al aprendizaje a largo plazo: retracción de terminales


sinápticos en la neurona presináptica que disminuyen la transmisión sináptica.

D. Sensibilización a largo plazo

- Un único estímulo nocivo puede producir sensibilización a corto plazo durante minutos.
- Más de un estímulo nocivo puede producir una sensibilización a largo plazo que dura días/semanas.

A corto plazo la neurona presináptica utiliza el AMPc y la PKA para que se libere más NT. En la sensibilización
a largo plazo se producen los mismos mecanismos químicos que a corto plazo. Además de todo esto, la PKA
se desplaza de la sinapsis hacia el núcleo, donde activa la proteína CREB-1. Ésta produce la expresión de los

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
genes que modifican la función y la estructura de la neurona (p. e. creación de nuevas conexiones
sinápticas). Al ser un cambio estructural es mucho más duradero. Sin embargo, si después se deja de
entrenar este mecanismo, esos genes dejan de expresarse y las neuronas vuelven a la normalidad.

Cambios estructurales/anatómicos asociados al aprendizaje a largo plazo: desarrollo de terminales


sinápticos en la neurona presináptica que facilitan la transmisión sináptica.

4. Aprendizaje asociativo: condicionamiento clásico e instrumental

El aprendizaje asociativo consiste en el cambio en la conducta por la asociación de 2 o más eventos.

 Condicionamiento Clásico: asociación E-E.


 Condicionamiento Instrumental/Operante: asociación R-Consecuencia.

A. Condicionamiento Clásico

1. Condicionamiento Clásico en la Aplysia: EC (manto) + EI (cola)

Estímulo táctil en el manto (EC+) se empareja con una descarga eléctrica en la cola (EI).

La vía del sifón puede servir de control (EC-): se estimula el mismo número de veces, pero sin asociarlo
con la sacudida de la cola.

Al cabo de cinco ensayos de emparejamiento, la respuesta al estímulo del manto (EC+, condicionado) es
mayor que la del sifón (EC-, sin emparejar).

¿Cómo sabemos que no es sensibilización?

Si después se toca en el sifón y la branquia se repliega normalmente, nos aseguramos de que la


asociación es entre la descarga y tocar el manto. Si se replegara exageradamente, se habría producido
sensibilización. Además, durante la sensibilización la descarga va siempre antes de cualquier otra
estimulación, mientras que en el CC va después o a la vez que el EC.

2. Bases cerebrales

a) Condicionamiento de respuestas motoras

La base cerebral de este tipo de condicionamiento es el cerebelo. Sin embargo, en función de la


disposición cronológica de los estímulos, pueden ser necesarias otras estructuras cerebrales.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

En el condicionamiento demorado, el EI aparece poco después del inicio del EC y ambos estímulos
terminan simultáneamente. En este tipo de condicionamiento solo es necesario el cerebelo.

En el condicionamiento de huella el EC empieza y termina sin que aparezca el EI, y éste es


presentado tras un intervalo de tiempo. Se supone que el EC deja una “huella” en la memoria, y por
esto es posible el condicionamiento. No se solapa la percepción de ambos estímulos, sino la huella
del primero con el segundo. Esta “huella de memoria” es mantenida por el hipocampo.

Por tanto, se puede producir cualquier tipo de condicionamiento con la sola participación del
cerebelo, menos en el de huella, para el que es necesario el hipocampo.

El paciente H.M. podía adquirir condicionamiento en la respuesta de parpadeo.

b) Condicionamiento de respuestas emocionales: condicionamiento de la respuesta al miedo

En este tipo de condicionamiento está implicada la amígdala, puesto que es la encargada de valorar

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
afectivamente los estímulos.

Una descarga eléctrica provoca por sí misma una respuesta automática de aumento de la
conductancia de la piel. Esto es un síntoma vegetativo, incontrolable por la persona. Esto ocurre
porque la amígdala analiza el estímulo y lo califica de “peligroso”.

Para condicionar esta respuesta, se puede asociar un estímulo neutro (cuadrado rojo) con una
pequeña descarga eléctrica. Tras el condicionamiento, en una persona con la amígdala sana, ante el
EC la respuesta de conductancia de la piel aumenta. En una persona con lesión en la amígdala, no se
produce el condicionamiento, por lo que la presentación del EC no provoca esta respuesta.

Los pacientes con la amígdala lesionada de forma bilateral, como S.P., tienen preservado el
conocimiento explícito de los acontecimientos que han tenido lugar durante el condicionamiento de
la respuesta de miedo. No obstante, estos pacientes no muestran condicionamiento en sus R.

HIPOCAMPO
Normal Lesión
Normal Conocimiento explícito V Conocimiento explícito X
AMÍGDALA Condicionamiento emocional V Condicionamiento emocional V
Lesión Conocimiento explícito V Conocimiento explícito X
Condicionamiento emocional X Condicionamiento emocional X

B. Condicionamiento Instrumental

1. Establecimiento de asociaciones

Los ganglios basales son la estructura cerebral más relacionada. Tiene varias partes:

a) Cuerpo estriado o estriado dorsal: con dos subestructuras, el núcleo caudado y el putamen.
Responsable de la asociación entre la conducta y sus consecuencias y del establecimiento de la
relación causal entre ambos eventos.

b) Núcleo accumbens: principal estructura implicada en el circuito de recompensa.

c) Sustancia nigra: principal generador de dopamina, el NT necesario para el funcionamiento de los


ganglios basales. En la enfermedad de Parkinson esta estructura se degenera, y como consecuencia
se desarrollan numerosos síntomas motores y cognitivos.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

En experimentos con roedores se utilizan laberintos de ocho brazos. Se coloca comida en los dos brazos
más próximos a derecha e izquierda, ya que no se pretende lograr aprendizaje espacial, sino que asocie
la conducta “girar por el más próximo” con la obtención de comida. Cuando se lesionan los ganglios
basales, en concreto el estriado, se afecta al condicionamiento instrumental, pero no a otras formas de
aprendizaje. Un animal con el hipocampo dañado sí es capaz de establecer estas asociaciones: no
aprende de forma explícita, pero sí implícitamente.

En humanos se estudian pacientes con alguna patología, bien porque se les ha seccionado una parte de
su cerebro, bien porque sufren una enfermedad degenerativa. Se suele emplear la técnica analítica de

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
resonancia magnética funcional (RMf), que sirve para estudiar el funcionamiento del cerebro. Se supone
que las personas con algún área cerebral concreta lesionada mostrarían menor actividad en esa región.
Los pacientes con Parkinson tienen dificultades para realizar tareas de aprendizaje implícito de
probabilidades (p. e. tarea de predicción del tiempo de Knowlton y colaboradores, 1996), ya que no
producen suficiente dopamina como para que los ganglios basales funcionen correctamente. Sin
embargo, el aprendizaje explícito no queda dañado. El paciente H.M. podría hacer esta tarea, aunque no
sabría decir que ha aprendido.

2. Sistemas cerebrales de refuerzo

Autoestimulación eléctrica intracraneal: la experiencia de Olds y Milner

Estudiaban la relación entre la formación reticular y el aprendizaje. Para ello, emplearon roedores a los
que colocaron un electrodo donde ellos creían que estaba la formación reticular. Se dieron cuenta de
que los animales estaban continuamente pulsando la palanca que activaba el electrodo, buscando la
autoestimulación de forma constante. A partir de estos resultados desecharon su anterior investigación
para estudiar este fenómeno. Si colocaban el electrodo en otras zonas del cerebro, no ocurría esto. Por
tanto, pensaron que esa zona estaba involucrada en los mecanismos de placer y recompensa.

El circuito de recompensa o red de refuerzo está constituido por regiones muy antiguas del cerebro. El
principal NT es la dopamina (son dopaminérgicas). Empieza en un núcleo del mesencéfalo llamado área
tegmental ventral (ATV). A partir de ahí se divide en dos rutas:

a) Vía Mesolímbica: corta, acaba en el centro del cerebro, concretamente en el núcleo accumbens
(sistema límbico). Es la más importante, la que tiene más núcleos.

b) Vía Mesocortical: más larga, termina en la corteza prefrontal ventromedial.

Hay otra vía dopaminérgica muy importante, la vía nigroestriada, que resulta afectada en el Parkinson, y
que conecta la sustancia nigra con el cuerpo estriado.

Experimento 1 (Schultz et al., 2002)

a) En monos no entrenados un refuerzo inesperado (zumo) provoca un breve incremento en la tasa de


disparo de neuronas dopaminérgicas del núcleo accumbens.

b) Si la administración del zumo se ve precedida por la presencia de un estímulo luminoso, las neuronas
dopaminérgicas disparan en respuesta a la luz pero no en respuesta al refuerzo en sí.

c) Si la luz predice el refuerzo, pero éste no se presenta, las neuronas dopaminérgicas muestran un
incremento en la tasa de disparo ante la luz, seguido de un descenso en el momento en el que se
esperaba el refuerzo (frustración).

Por tanto, el aumento de los niveles cerebrales de dopamina provoca una sensación agradable, y el
descenso provoca una sensación desagradable que interpretamos como frustración.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

Experimento 2

En el ser humano, la activación del núcleo accumbens no es provocada solamente por recibir una
recompensa, sino por anticipar que va a ser recibida. Además, cuanto mayor es la recompensa, mayor
es la actividad del núcleo.

5. Aprendizaje perceptivo (priming) y motor (procedimental)

A. Priming

Se trata de sesgar la respuesta de la persona presentando un estímulo concreto. Así, ante un segundo
estímulo, la persona responde en función del significado/percepción del primer estímulo.

Este efecto se estudia mediante la tarea de Gollins, que consiste en presentar una serie de tarjetas al sujeto,
cada una de ellas con más información que la anterior, hasta que éste adivina cuál es la figura. El paciente
H.M. realiza la tarea igual de bien que una persona normal.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
A nivel cerebral, lo que ocurre es que se preactivan zonas de la corteza donde está esa información. Por
tanto, participa toda la corteza. Lo que cambia con el tipo de tarea es qué zona de la corteza se activa. Esto
da lugar a diferentes tipos de priming.

En el caso del priming semántico, se preactiva una zona encargada de nombrar las palabras, situada en el
polo temporal del hemisferio izquierdo.

B. Aprendizaje procedimental

Aprendizaje de movimientos de manera implícita, rutinas motoras (montar en bici, conducir, andar).

Una de las tareas utilizadas para evaluar este tipo de aprendizaje es la tarea de dibujo en espejo. El paciente
H.M. podría realizar esta tarea, aunque no se diera cuenta de ello.

A nivel cerebral participan las áreas motoras de la corteza, aquellas regiones involucradas en el movimiento.
La ruta que se activa cuando decidimos realizar un movimiento empieza en la corteza prefrontal
dorsolateral, encargada de planificar y tomar la decisión. La orden pasa a la corteza premotora, que tiene
almacenadas las secuencias de movimientos, y después a la corteza motora primaria (M1), que ordena el
movimiento de la parte concreta del cuerpo. Posteriormente la orden atraviesa el tronco cerebral, la médula
espinal y los nervios motores hasta alcanzar el músculo. Mientras se realiza el movimiento se recibe desde el
músculo feedback visual y táctil a través de los nervios sensitivos, para que el movimiento pueda ser
reequilibrado y ajustado, gracias a los ganglios basales y el cerebelo. Este feedback llega también a las
cortezas somatosensorial y visual. Una vez que se ha realizado el movimiento, la corteza prefrontal
dorsolateral y medial o cíngulo anterior detecta los errores cometidos durante el mismo.

6. Aprendizaje explícito/declarativo/relacional: espacial, episódico y semántico

También se le llama relacional porque se trata de aprendizaje que relaciona cosas, hechos. Otra característica de
este tipo de memorias es que dependen de la actividad del hipocampo, del lóbulo temporal medial.

A. Bases cerebrales: el lóbulo temporal medial

El lóbulo temporal medial es la parte interna del lóbulo temporal. Se compone de dos partes: el hipocampo y
la circunvolución parahipocampal. Ésta última está dividida, a su vez, en tres zonas: las cortezas entorhinal,
perirhinal y parahipocámpica.

Antes del paciente H.M., se pensaba que todo el lóbulo temporal medial se encargaba de la memoria
episódica, y que toda la memoria era inicialmente autobiográfica para después convertirse en semántica. Sin
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

embargo, después se descubrió que la memoria episódica solo depende del hipocampo, y que es
independiente de la memoria semántica. Ésta última depende de la circunvolución parahipocampal. La
memoria espacial depende del hipocampo, especialmente de su parte más posterior.

B. Consolidación de memorias declarativas

Toda la información declarativa, sea episódica o semántica, es almacenada en un primer momento en el


hipocampo*. Progresivamente, esa información se va transfiriendo a la corteza cerebral, activando las
zonas corticales encargadas de cada tipo de información. Llega un momento en que esas regiones se activan
sin necesidad de que el hipocampo se lo “ordene”. Este proceso de transferencia es muy largo. Por eso, los
pacientes con Alzheimer no recuerdan hechos que les han ocurrido recientemente, pero sí acontecimientos
de su infancia: los primeros todavía se encuentran en el hipocampo, que está dañado, mientras que los
segundos ya han pasado a la corteza.

*Aquí resumimos con “hipocampo” todo el lóbulo temporal medial. La información episódica es la que es

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
enviada propiamente por el hipocampo, mientras que la semántica es enviada por la circunvolución
parahipocampal.

C. Recuperación de memorias declarativas

Ocurre lo mismo que durante la consolidación: al principio hay que recurrir al hipocampo para recuperar la
información codificada, que envía la orden a las zonas corticales pertinentes. Cuando la información ya se ha
transferido a la corteza, ésta se activa sin necesidad del hipocampo.

TEMA 8. Consolidación del aprendizaje


1. Aprendizaje y plasticidad cerebral

¿Qué regiones del cerebro se asocian con determinados tipos de aprendizaje?

Tema 7  El sustrato neuroanatómico es múltiple: existen distintos sistemas cerebrales para distintos tipos de
aprendizaje y memoria.

¿Qué tipo de cambios ocurren en el cerebro cuando se produce un aprendizaje o cuando se adquiere, almacena,
consolida o recupera una memoria?

Tema 8  Los mecanismos celulares y moleculares tienen un carácter más general o universal, ya que
dependen de la propia capacidad de adaptación o plasticidad del SN.

Plasticidad no es lo mismo que elasticidad: algo elástico es algo capaz de cambiar, pero la plasticidad implica
que el cambio perdure.

Lejos de ser un sistema estático de elementos interconectados como antiguamente se creyó, el cerebro es un
órgano dinámico, que se desarrolla y cambia continuamente en respuesta a programas genéticos y a la
interacción con el ambiente.

Uno de los científicos más importantes en este cambio de perspectiva fue Ramón y Cajal, quien individualizó las
neuronas como elementos separados unos de otros, y descubrió las sinapsis. También dio la primera descripción
de lo que es la plasticidad cerebral: las neuronas no son estáticas, sino que pueden cambiar y producir más
ramificaciones al hacer “gimnasia cerebral”.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

Otro importante científico fue Hebb, de quien se conoce el Principio de Hebb: “las neuronas que se activan
juntas permanecen juntas”. Una sinapsis entre dos neuronas se fortalece cuando se produce una coincidencia en
la actividad presináptica y postsináptica, es decir, si las dos neuronas se encuentran activadas al mismo tiempo.

Lomo y Bliss (1966, 1973): explicaron el fundamento del principio de Hebb. Si se activa una vez una neurona, se
activa una vez la segunda. Si se activa repetidamente la primera neurona por estimulación tetánica, la segunda
tiene más respuesta. Después de esto, el incremento de la actividad postsináptica se mantiene ante pulsos
individuales durante horas. ¿Por qué ocurre esto? Porque ha habido una mejora sináptica en la conexión entre
ambas neuronas, se ha mejorado la eficacia sináptica mediante la repetición. Las dos neuronas aprenden que
“van juntas”. Esto se denomina Potenciación a Largo Plazo (PLP).

2. Mecanismos sinápticos y moleculares del aprendizaje

A. La Potenciación a Largo Plazo (PLP)

La Potenciación a Largo Plazo (PLP) es un fenómeno plástico que se caracteriza por un incremento estable y

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
duradero en la eficacia sináptica tras una estimulación rápida y repetida. Para que se produzca es necesario
que la célula postsináptica esté activada (despolarizada) cuando la presináptica dispara.

B. El papel de los receptores NMDA en la PLP

Los receptores NMDA posibilitan la PLP. Junto con los receptores AMPA, son un tipo de receptor de Glu, y
abundan en el campo CA1 de la formación hipocampal. Reciben su nombre del fármaco que los activa
específicamente (N-metil-D-aspartato).

El Glu se acopla a los receptores por un mecanismo de llave-cerradura, activándose un canal de Na+/K+. A
diferencia de los receptores AMPA, los NMDA dejan entrar también iones Ca2+. En los receptores NMDA un
ion de Mg2+ bloquea el canal, que permanece cerrado incluso si los receptores son estimulados por Glu. Solo
si la neurona postsináptica está despolarizada este ion se va, dejando libre el canal para el intercambio.
Cuando el Glu se acopla a los receptores AMPA, la neurona se despolariza, lo que hace que los iones Mg2+ se
vayan y se desbloqueen los NMDA. Entonces entran los iones Ca2+, que activan proteínas quinasas, lo que
provoca que se empiecen a sintetizar otras proteínas que provocan cambios en la neurona postsináptica.
Todo esto solo ocurre cuando hay una estimulación rápida y repetida.

Por tanto, los receptores NMDA están controlados tanto por NT (Glu) como por voltaje (despolarización de
la neurona postsináptica).

C. Fases de la PLP

La primera fase es la ya descrita. Para que se mantenga y se fortalezca a largo plazo la sinapsis, es necesario
que la síntesis de proteínas empiece a generar cambios en la sinapsis, haciéndose más grande su superficie,
lo que mejora su eficacia. Primero se producen cambios funcionales: incremento en el número y la
capacidad conductiva de los receptores AMPA. Más tarde hay cambios estructurales:

a) Ensanchamiento de las espinas dendríticas ya existentes para acomodar todos los receptores AMPA.
b) División de una espina en dos.
c) Creación de nuevas espinas dendríticas.

D. Relación entre PLP y memoria

Para estudiar si los receptores NMDA son importantes para el aprendizaje y la memoria hay dos
procedimientos: bloquear los receptores o mejorarlos. Distintos experimentos indican que el
almacenamiento en memoria emplea PLP.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690

1. Ratones que carecen del receptor NMDA en el hipocampo:

 No presentan PLP: ante la estimulación tetánica de alta frecuencia, aunque se incrementa


levemente la actividad de la neurona postsináptica, al poco tiempo vuelve a responder igual que
antes, mientras que en los grupos control el incremento se mantiene en el tiempo.
 Tienen déficits de memoria espacial: en el laberinto de Morris no aprenden dónde está la
plataforma, se limitan a dar vueltas en círculo.

Por tanto, sin receptores NMDA no hay PLP, y sin PLP no hay aprendizaje.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2. Ratones con una mejora genética de los receptores NMDA: se mejora su conductividad. El aprendizaje es
mucho más rápido.

3. Cambios cerebrales como consecuencia de la experiencia

A. Violinistas (Elbert et al., 1995)

Estudiar si personas que llevan tocando el violín desde niños generan mejor funcionalidad (cambios
funcionales) en las zonas cerebrales encargadas de mover los dedos.

El homúnculo motor es una representación de las distintas zonas del cuerpo en el cerebro, y se sitúa en la
corteza motora primaria. Las partes con movilidad más fina son la cara y las manos, por ello, tienen mayor
representación cerebral. Vieron que cuanto antes empezaban a tocar el violín, mayor intensidad de la
activación neuronal en esta área (cambios funcionales). Además, aumentaba la representación (cambios
anatómicos) de los dedos, esto se veía midiendo la distancia entre la zona dedicada al dedo 1 y la dedicada
al dedo 5.

Por tanto, personas que llevan toda su vida realizando una actividad tienen cambios funcionales y
estructurales.

B. Taxistas de Londres (Maguire et al., 2000)

Estudiar si se producen cambios anatómicos en el cerebro de conductores de taxi que llevan muchos años
trabajando, aunque no haya sido desde niños.

Encontraron mayor volumen del hipocampo posterior (HI y HD) y correlación positiva entre el volumen del
hipocampo posterior (HD) y años de experiencia.

Por tanto, no solamente aquellos que llevan toda su vida practicando una actividad tienen cambios
estructurales en el cerebro.

C. Malabaristas (Draganski et al., 2004)

Estudiar si en personas adultas que no llevan mucho tiempo practicando una actividad (malabares), sino que
aprenden en ese momento, se producen cambios cerebrales.

Encontraron cambios anatómicos en áreas visuales relacionadas con la percepción del movimiento tras tres
meses de entrenamiento.

Uno más reciente: experimento de Michelle (Pascual-Leone et al.). Tras solo 5 días de ceguera total, se
detectaron cambios plásticos en la corteza occipital, que desaparecían en cuanto se quitaba la venda.

Por tanto, aunque muchos años de aprendizaje consoliden los cambios que se producen en el cerebro, en
el día a día también se producen cambios plásticos.

También podría gustarte