Documentos de Académico
Documentos de Profesional
Documentos de Cultura
pdf
Apuntes Completos de la Asignatura Aprendizaje y Condicionamiento
1º Aprendizaje y Condicionamiento
Grado en Psicología
Facultad de Psicología
UAM - Universidad Autónoma de Madrid
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
APRENDIZAJE Y CONDICIONAMIENTO
BLOQUE I: Fundamentos psicológicos
TEMA 1. Algunas consideraciones previas
1. Noción de aprendizaje
Aprendizaje guiado, aprendizaje con la experiencia, aprendizaje por imitación, aprendizaje por observación…
- Adaptación: el aprendizaje modifica los patrones de acción y es por ello un proceso adaptativo. Esto se debe
a que somos plásticos.
- Aprendidos son todos los conocimientos y comportamientos que no responden a la herencia genética, es
decir, que no sean innatos (Froufe, 2004).
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- No existe un único tipo o mecanismo de aprendizaje.
- En términos generales se habla de dos mecanismos mentales de aprendizaje (Pozo, 1989): asociación entre
eventos y reestructuración mental.
Forma básica de aprendizaje que consiste en la adquisición de conocimiento y la adaptación conductual a que
da lugar el desarrollo de asociaciones provocadas por la experiencia con eventos del entorno.
Planteamiento atomista: Estímulo Respuesta. Los comportamientos más complejos son suma de
cadenas E-R.
Principio de isomorfismo: correspondencia entre lo aprendido y la estructura del mundo. Se asume que
el estímulo llega tal cual al organismo, no hay procesamiento de la información.
Aprendizaje latente (Tolman y Honzik, 1930): contradice el supuesto de que solo hay aprendizaje si se
observa un cambio en la conducta (VER LIBRO).
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Se introduce lo cognitivo en la secuencia E-R. Sin embargo, no se cree que el humano sea diferente a los
demás animales por tener capacidades cognitivas, sino que se “humaniza” al resto de organismos.
El estímulo no entra al organismo tal cual es, por lo que se deja de aceptar el isomorfismo.
Las asociaciones E-R (la influencia del ambiente sobre el comportamiento) están mediadas por
diferentes procesos cognitivos.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Supuestos: reduccionismo antimentalista, isomorfismo, equipotencialidad, atomismo E-R.
Diferencias importantes entre especies y eventos: a ciertos niveles, el aprendizaje asociativo funciona
de forma diferencial.
Que la influencia del ambiente está mediada por procesos cognitivos: incluso incorpora supuestos de la
psicología humana a la explicación animal: información, atención, expectativas, memoria…
Pero sigue a) defendiendo que compartimos mecanismos asociativos importantes con especies
próximas en la escala evolutiva, y b) centrado en el análisis E-R.
Aparece una nueva corriente científica, la psicología cognitiva de procesamiento de la información. Las
personas se conciben como sistemas cognoscitivos que manejan datos. Al nuevo paradigma le interesan los
procesos, representaciones y estructuras cognitivas que median entre estímulos y respuestas (inputs y
outputs informativos). El funcionamiento de los sistemas naturales de procesamiento de la información está
mediatizado por operaciones de cómputo. La conducta pasaría a ser considerada un índice que refleja la
naturaleza y forma de operar del sistema cognitivo. Sin embargo, este enfoque apenas se ocupó de los
procesos de aprendizaje.
Por otra parte, los complejos procesos cognitivos no serían posibles, por las numerosas operaciones de
cómputo que exigen y el tiempo que éstas consumen, si se realizaran secuencialmente. Por ello surgió el
enfoque conexionista, donde el modelo es el cerebro, en cuyas redes neurales trabajan simultáneamente
numerosas neuronas y estructuras nerviosas. Sin embargo, este enfoque tampoco es capaz de explicar todas
las propiedades funcionales del sistema cognitivo de las personas.
Nuestros mecanismos asociativos compartidos con otras especies son menos de los asumidos inicialmente,
pero son numerosos e importantes, y nada despreciables.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
El aprendizaje pre-asociativo consiste en cambios cuantitativos que experimentan los reflejos, cuando se
repiten los estímulos desencadenantes (EDs).
2. Reflejos
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Reacciones automáticamente disparadas por elementos ambientales específicos, los EDs.
- Ajustes comportamentales rápidos.
- Adaptativos.
“El vigor de los reflejos es proporcional a la intensidad de sus desencadenantes y no varía de una ocasión a otra”
(Descartes). En realidad, los reflejos no son invariables. Aunque sean innatos, pueden cambiar con la
experiencia, ya que una de sus características es su plasticidad.
La repetición del ED unas veces reduce (habituación) y otras incrementa (sensibilización) la R refleja.
Ambos son cambios meramente cuantitativos (en intensidad): no conllevan asociaciones nuevas.
A. Habituación
Reducción progresiva de una reacción refleja cuando se repite muy a menudo el ED.
- Se aprende a no responder.
- Se produce ante la presencia reiterada de estímulos que no resultan dañinos. La respuesta tiende a
atenuarse de forma progresiva.
¿Qué pasaría si, una vez habituado un individuo a un determinado tono, se le administra otro? ¿Volvería a
responder?
- Generalización: emisión de una respuesta aprendida ante estímulos parecidos a los presentes durante
el desarrollo del aprendizaje, que no aparecieron durante la habituación.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
En cuanto a la intensidad de los EDs, cuanto más débiles son, más rápidamente disminuye la respuesta que
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
provocan, es decir, más fácilmente se habitúan. Aprender a ignorar los estímulos reiterativos inocuos
resulta claramente adaptativo.
a) Fatiga
b) Adaptación sensorial de los receptores
c) Aprendizaje: no ocurre que los receptores se adapten y no capten los estímulos, sino que se aprende a
no responder.
B. Sensibilización
Agudización de una reacción refleja ante la presencia reiterada de un evento potencialmente nocivo.
Si estamos activados, el mismo estímulo provocador disparará una reacción mucho más fuerte, lo cual se
conoce como efecto de sensibilización.
Sensibilización ≈ Pseudocondicionamiento
La sensibilización se puede manifestar como un incremento de la reacción ante otros estímulos diferentes a
su desencadenante original. Los estímulos nunca se dieron juntos, por tanto no se puede llamar
condicionamiento. Esto indica que la sensibilización no es tan específica y restringida como la habituación
en cuanto a los estímulos que la desencadenan.
Davis (1989): se expone a un conjunto de ratas a un ruido. Se observa que un grupo de ellas tienen una
respuesta de sobresalto mayor que otras. Sin embargo, todas las ratas estaban en la misma situación y ante
el mismo estímulo. La diferencia debe estar en la experiencia previa.
Morgan et al. (1996): veteranos de la guerra del Golfo. VD = respuesta de sobresalto. Su respuesta está muy
incrementada en comparación con otros sujetos. Cuando se va incrementando la intensidad del ruido, su
respuesta se va incrementando, lo que no ocurre con otros grupos: se van sensibilizando.
¿Sensibilización o habituación?
- La sensibilización es más abierta: una vez que el individuo se ha sensibilizado a un estímulo es fácil que
estímulos similares den lugar a una respuesta parecida.
- Ante los estímulos que inicialmente generan sensibilización finalmente suele acabar apareciendo
habituación si se repiten muchas veces seguidas.
4. Patrón Estándar de la Dinámica Afectiva (PEDA): El patrón de las reacciones emocionales y su cambio
Muchas respuestas emocionales no solo tienden a mostrar un patrón dinámico bastante característico y similar
entre sí, sino que también suelen evolucionar de forma parecida cuando se repite su desencadenante. Al margen
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
de su valencia o cualidad concreta, las emociones suelen mostrar un curso bifásico característico, con dos fases
de signo opuesto. Solomon y Corbit (1974) llamaron a esta pauta reactiva bifásica patrón estándar de la
dinámica afectiva (PEDA).
La aparición de un estímulo afectivamente potente suscita un estado emocional, la reacción afectiva primaria,
que rápidamente alcanza su nivel más alto. A este pico máximo le sigue una fase de adaptación, en la que el
estado emocional se va suavizando, hasta alcanzar un nivel más o menos estable. Cuando cesa el estímulo, el
estado emocional se transforma rápidamente en el sentimiento contrario; esto es la posreacción afectiva. Esto
es lo que ocurre las primeras veces que se presenta el ED, antes de habituarnos a él.
Cuando el ED se convierte en rutinario, suscita una reacción emocional primaria o estado A más suave, mientas
que la posreacción afectiva o estado B resulta más intenso y extenso.
No es bueno permanecer muy excitado durante mucho tiempo. Es mejor permanecer estable, para poder
reaccionar emocionalmente ante diferentes situaciones.
Solomon y Corbit (1974) han intentado explicar tanto el PEDA como su evolución, cuando el ED se repite,
mediante una teoría de proceso-dual orientado a mantener el equilibrio en el sistema, la hipótesis de los PO.
- Cuando una fuerza rompe la homeostasis, el organismo pone en marcha un proceso orgánico
compensatorio.
- La emoción o estado psicológico experimentado en cada momento resulta de la diferencia neta de sustraer
la influencia del proceso b de a. Estado psicológico consonante con el proceso subyacente dominante.
Proceso a: drogas y situaciones emotivas son “agresiones” que rompen mediante algún mecanismo el
equilibrio orgánico. Cuando a > b Estado A.
Proceso b: los organismos ponen en marcha operaciones compensatorias. Cuando a < b Estado B.
Mientras el proceso a no cambia de las primeras situaciones a las situaciones de estabilidad, el proceso b cada
vez opera con mayor celeridad, intensidad y persistencia (duración). Por tanto, la intensidad del estado B va
aumentando, al revés que la del A.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
- La emisión de conductas ya existentes en el repertorio comportamental del organismo, pero generadas por
circunstancias que antes no las provocaban.
- El desarrollo de nuevas conductas resultantes de la integración de otras más elementales ya existentes.
- La aparición de conductas genuinamente nuevas, inexistentes previamente.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
fundamentalmente de la asociación entre dos eventos, pero, mientras que en el clásico ambos eventos
consisten en estímulos ambientales, en el instrumental uno es una conducta del propio organismo.
Estudiado por el fisiólogo ruso Iván Pavlov, que recibió el premio Nobel de 1904 por sus estudios sobre el
funcionamiento de las glándulas digestivas.
Pavlov observó las “secreciones psíquicas” (condicionadas) y expuso por primera vez su teoría en Madrid, 1903.
Después de recibir el premio Nobel abandonó su anterior investigación y consagró su vida a estudiar este
descubrimiento. Montó su laboratorio en San Petersburgo.
La explicación de Pavlov sostenía que se forma una conexión nerviosa nueva entre los centros activados por la
percepción de cada uno de los estímulos. La contigüidad repetida de los estímulos acaba consolidando la
formación de una asociación entre sus codificaciones cerebrales.
Sonido durante 5s y 2s después comida. Repite esto cada 5-35 minutos. Cada 10 ensayos, sonido 30s.
La intensidad de la salivación en los ensayos de prueba (fase de sonido 30s) aumenta gradualmente. Al
comparar los resultados de dos de los animales, se observa que son muy similares, por lo que debe haber un
principio explicativo común para los dos.
Pavlov y sus colaboradores replicaron este tipo de observaciones con elementos distintos a los tonos y la
comida y con otras especies, obteniendo con frecuencia resultados similares. Esto les llevó a plantear el
supuesto de equipotencialidad asumido más tarde por el Conductismo.
A. Estímulo Incondicionado (EI): evento que desencadena en el organismo una reacción refleja, no aprendida.
Eventos biológicamente relevantes, drogas; eventos con connotación afectiva, estética... En general, cuanto
más intenso es el EI, más fuerte resulta el condicionamiento.
B. Respuesta Incondicionada (RI): reacción refleja generada automáticamente por el EI. Salivación, tasa
cardíaca, respuesta electrodérmica…
¿Tiene que haber siempre una RI para que se produzca aprendizaje? Parece que no: CC con RI bloqueada,
precondicionamiento sensorial.
C. Estímulo Condicionado (EC): elemento originalmente neutro que precede de forma repetida al EI, con el que
acaba asociándose, hasta provocar una reacción similar a la RI. Sonidos, luces, imágenes, palabras… Los
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
elementos capaces de funcionar como EC no se limitan a los estímulos neutros.
D. Respuesta Condicionada (RC): reacción desencadenada por el EC, similar a la RI. La RC suele ser menos
intensa que la RI. Además, no siempre es similar a la RI: en ocasiones, no solo tienden a ser diferentes, sino
incluso opuestas.
Tasa cardiaca, actividad electrodérmica, secreción de insulina y de orina, temperatura corporal, nivel de
glucosa en sangre, funcionamiento del sistema inmunitario, efectos de drogas…
- H1 (la original): asumía que la mayor eficacia del proceso defensivo cuando se repite la agresión
responde a su tendencia natural a fortalecerse, conforme se ejercita. “Habituación” al evento
desencadenante provocada por la progresiva “sensibilización” de la reacción compensatoria.
- H2 (la nueva): las circunstancias (Ecs, estímulos contextuales) que acompañan al elemento perturbador
(EI) tienden a asociarse a este y a disparar la reacción compensatoria. Se trataría de una potenciación
condicionada (RC) del proceso b, conforme se repite la situación.
(Froufe: el proceso oponente se liga a los estímulos, incluido el contexto, que señalan el elemento
perturbador. El fortalecimiento progresivo de la reacción defensiva con las experiencias repetidas
simplemente reflejaría el curso característico del proceso de condicionamiento).
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Estudio 1: observar el patrón reactivo bifásico. Dos grupos de ratas. Al grupo experimental se le inyecta
morfina. Mientras dura el efecto de la droga su actividad baja mucho. Cuando se pasa el efecto su
actividad no vuelve al nivel anterior, sino que sube muchísimo, al contrario que el grupo control, y
tardan un tiempo en volver a la normalidad.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
todas les inyectan suero en el laboratorio. El grupo de contexto experimental en la fase 1 se activa más
que los otros grupos. Esto quiere decir que el proceso b se ha activado, y la causa solo puede ser el
contexto: no hay morfina, pero son las únicas ratas que asocian el contexto (la jaula de laboratorio) con
la situación; no asocian el pinchazo, puesto que eso no cambia en ambas situaciones.
Tolerancia condicionada
Eso puede contribuir a explicar las muertes por sobredosis. Conforme se desarrolla tolerancia, se
requieren cada vez mayores dosis para mantener los mismos efectos. Puede llegar un momento en que
tales dosis excesivas resulten letales. Según esta propuesta explicativa, ¿dónde se produciría con más
probabilidad una sobredosis? ¿En contextos habituales o nuevos? Más en contextos nuevos, donde no
operaría la RC compensatoria: el organismo no está preparado para hacer frente a los efectos de la
droga, porque no están las claves contextuales que le indican que debe reaccionar contra ellos.
Brown y Jenkins, 1968: se mete a una paloma en una jaula, se enciende una luz y seguidamente se le pone
comida. La paloma siempre va a la luz y no a la comida.
Hearst y Jenkins, 1974: hay dos luces, una que es señal predictora de comida, y otra que no lo es. La paloma
en seguida asocia la primera luz con la comida. La paloma continúa yendo hacia la luz aunque le pongan la
comida.
En el medio natural el seguimiento de indicios suele resultar funcional a la hora de satisfacer necesidades. La
eficacia en la consecución de alimentos, agua, pareja… se puede ver potenciada por la tendencia a seguir las
señales relacionadas con las situaciones y objetos que permiten satisfacer esas necesidades.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
C. Motivación y afectividad: mediante CC también se pueden modificar los estados motivacionales y afectivos.
1. Regulación alimenticia
Los sabores asociados con enfermedades se tornan aversivos, mientras que los asociados con la
recuperación se tornan apetecibles, un proceso de condicionamiento que permite a los animales adoptar
dietas aptas para sobrevivir.
Preferencias
o Aprendizaje “sabor-sabor”: una forma de tornar apetecible un sabor es asociarlo a otros que ya
gustan. Y viceversa, un sabor agradable verá reducido su atractivo cuando se asocie a otros
desagradables.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
asociar con sus consecuencias post-ingestivas.
Lucas y Sclafani (1999): dieron repetidamente a ratas unas veces una solución de un sabor junto
con infusión intragástrica alta en carbohidratos (EC + AC); otra solución de otro sabor junto con
infusión alta en grasas (EC + AG); y otra solución de otro sabor junto con infusión intragástrica de
agua EC-). Los emparejamientos entre los diferentes sabores y nutrientes se contrabalancearon.
Consumo de las soluciones de los diferentes sabores con dos vasijas, para ver qué sabor
(NUTRIENTE) era el preferido. En la prueba de preferencia manifestaron una marcada
preferencia por nutriente con independencia del sabor. Prefirieron las grasas. (VER LIBRO)
Apetito: los EE neutros (sobre todo el contexto) presentes durante la ingestión de alimentos en
individuos hambrientos suelen inducir consumo incluso cuando los individuos están saciados. Por
ejemplo, cuando nos sentamos en el sofá nos da hambre aunque acabamos de comer, porque
hemos asociado ese estímulo a la comida.
Holloway y Domjan (1993): presentaron a codornices macho un EC seguido, según el grupo, de:
acceso a cópula hembra, acceso visual hembra, nada. Desarrollo de preferencia condicionada de
lugar: aquellos machos que tienen acceso físico a la hembra pasan más tiempo con la pelota (EC).
Rachman y Hodson (1968) realizaron un experimento parecido a los anteriores con hombres y
obtuvieron efectos similares. Ocurre con lugares, olores, música, velas… condicionan un mejor
contexto para la reproducción. Otro ejemplo de esto es el fetichismo.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Un problema con el miedo: estimarlo. Estes y Skinner (1941) pensaron que para medir el miedo se
podría aprovechar que en ciertas ocasiones el miedo “congela” al individuo, es decir, da lugar a cierto
grado de inactividad (≠ Indefensión Aprendida). Esto es lo que se ha llamado Razón de Supresión (RzS).
El procedimiento para estimar el miedo sería pues el siguiente:
4. Se registra en qué medida llevan a cabo la conducta instrumental en presencia del EC durante un
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
determinado periodo de tiempo (B).
5. Se compara con la realización de esa misma actividad durante otro periodo equivalente previo sin EC
(A). La reducción de R con respecto a A indica que el EC “congela”: miedo condicionado.
Annau y Kamin (1961): primero entrenaron a ratas hambrientas a pulsar una palanca para obtener
comida. Luego introdujeron sonido (EC: 3min.) seguido de descarga (EI) de distintas intensidades. Se
observó diferente RzS durante EC, según su EI.
¿En qué supuesto (asumiendo que los periodos A y B tienen la misma duración y que las marcas verticales
indican emisiones de la R utilizada para estimar la RzS) se observa mayor REC? En:
4. Condicionamiento evaluativo (CE): hasta ahora hemos hablado de casos en los que un EC neutro se
asocia con un EI importante, en cuyo caso el EC se convierte en señal del EI: aprendizaje de
expectativas. Pero si se empareja un EC con un E simplemente agradable/desagradable, éste tiende a
transferir su valencia afectiva al EC, incluso sin necesidad de que éste funcione como señal del EI:
aprendizaje evaluativo (no implica que visto el EC vaya a aparecer el EI). La RC es un valor afectivo.
El CE tiene una serie de peculiaridades y seguramente está en la base del desarrollo de actitudes,
preferencias, estereotipos, prejuicios raciales, gustos alimenticios, autoestima… Características:
Resistencia a la extinción.
Independencia del orden cronológico de los eventos.
Operación automática.
Desarrollo inconsciente.
A. Inhibición condicionada
p EI|EC > p EI|EC = Condicionamiento Excitatorio: la probabilidad de que aparezca el EI (la comida) si antes
ha aparecido el EC (la campana) es mayor que la probabilidad de que aparezca el EI si antes no ha aparecido
el EC. El EC es un estímulo informativo sobre lo que va a venir, informa de que el EI viene.
p EI|EC < p EI|EC = Condicionamiento Inhibitorio: la probabilidad de que aparezca el EI (la comida) si antes
ha aparecido el EC (la campana) es menor que la probabilidad de que aparezca el EI si antes no ha aparecido
el EC. El EC es un estímulo informativo sobre lo que va a venir, pero esta vez informa de que el EI NO viene.
Procedimiento:
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1. Prerrequisito: solo puede darse en un contexto excitatorio para el EI. El EI debería ser esperado, de no
ser por la señal inhibitoria. Es decir, el EI debe tender a estar presente, salvo cuando tiene lugar el EC.
3. Detección: mediante técnica retraso al condicionar EC- (retraso del condicionamiento excitatorio).
Ejemplo: Un sonido aparece repetidamente seguido de una descarga, pero no cuando le acompaña una luz,
¿qué ocurre con esta? Se convierte en EC inhibitorio respecto a la descarga, lo que se ve por el retraso a
la hora de asociarse con ella, si luego se emparejan luz-descarga.
B. Condicionamiento de 2º orden
Un elemento originalmente neutro produce una RC por haber sido emparejado con otro cuyas propiedades
motivacionales son adquiridas (previamente condicionadas, no innatas). Es decir, el elemento que funciona
como EI lo hace por haber sido convertido antes en EC. Procedimiento similar a Rizley y Rescorla (1972):
Fase Tratamiento
Grupo experimental Grupo control
1. Condicionamiento de primer orden EC1 EI EC1 EI
(Luz Descarga) (Luz Descarga)
2. Condicionamiento de segundo orden EC2 EC1 Presentación aleatoria EC1 y EC2
(Tono Luz)
3. Prueba EC2 RC EC2 Ausencia de RC
(Tono Miedo)
La RC2 es similar a la RC1 y, por extensión, a la RI. El EC2 nunca debe ir emparejado con el EI.
Más difícil de lograr y menos intenso que el de primer orden. La RC en el segundo orden suele ser
cuantitativamente inferior. Curva diferente: demasiados ensayos lo reducen. Esto se debe a que los ensayos
EC2-EC1 implican un tratamiento, a la vez que de segundo orden, de extinción de la asociación EC1-EI. Así, si
se extingue la RC ante el EC1, también lo hará ante el EC2.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Se manejan dos EC: EC1 o EC+, que se empareja con el EI, y EC2 o EC-, que se empareja con el EC anterior,
pero sin el EI.
El segundo EC señala que, en su presencia, al otro EC no le sigue el EI. Por tanto, en un procedimiento de
segundo orden, EC2 debería generar inhibición condicionada.
Que se produzca uno y no otro parece depender del procedimiento y del número de ensayos. Si se
prolongan los ensayos de segundo orden durante demasiado tiempo, el condicionamiento se convierte
en inhibitorio, ya que el EC2 avisa de que no aparece el EI.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
C. Contracondicionamiento
Un estímulo originalmente neutro (p. e. sonido) que se había convertido en un EC apetitivo por haber sido
emparejado con un EI de esa naturaleza, se transforma en un EC aversivo, capaz de provocar una RC
defensiva, al ser emparejado posteriormente con, p. e., descarga eléctrica. O a la inversa. Este proceso se
desarrolla de forma comparativamente lenta, ya que tienen que ser contrarrestados los efectos del
condicionamiento previo.
EC EI RC
Condicionamiento Sonido Comida Salivación
Contracondicionamiento Sonido Descarga Respuesta defensiva
EI+ RI+
EI- + EI+ RI-
EC1 RC-
Un ejemplo es el síndrome de Estocolmo, por el cual las personas secuestradas llegan a encariñarse con su
secuestrador porque piensan que a pesar de todo son protegidas por él.
Aplicación en fobias
Técnicas: desensibilización sistemática (DS). Para aplicar el contracondicionamiento hay que asociar el
objeto de la fobia con otro estímulo positivo para el paciente. Por ejemplo: inicialmente se aplican técnicas
de relajación para que el sujeto aprenda a controlar su estado de ánimo y generar un sentimiento positivo.
Después se le expone a una imagen del objeto. Es decir:
Fases:
1. Entrenamiento en relajación
2. Elaboración jerarquía de ansiedad.
3. Afrontamiento progresivo.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Hipótesis alternativa: no es contracondicionamiento sino mera extinción (se puede sin relajación):
Exposición / Inundación
¿Alguna vez te ha ocurrido que te sentiste mal después de haber comido algo y ya nunca más has vuelto a
querer tomar eso? ¿Y si sabes que lo que provocó tu malestar no se debe a lo que comiste?
6. El curso de la asociación
A. Adquisición
La presentación repetida de un EC seguido de un EI hace que ambos elementos acaben asociándose y, por lo
general, el primero produzca por sí mismo una RC mayor cuantos más emparejamientos, hasta un límite.
La curva de asociación característica muestra un crecimiento negativamente acelerado. Una vez alcanzado
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
el límite, la fuerza de la RC apenas aumenta con la adición de nuevos ensayos de condicionamiento.
B. Extinción
Si, una vez alcanzado cierto grado de condicionamiento, aparece reiteradamente el EC solo, sin el EI, se
observa un proceso aparentemente opuesto al de adquisición. Este fenómeno es la extinción, que suele
seguir un curso parecido al de la curva de adquisición, pero inverso y más lento: reducción gradual
negativamente acelerada de la fuerza de la RC, hasta su eventual desaparición.
¿Significa esto que desaparece todo el condicionamiento anterior, que se destruye la asociación EC-EI?
7. Generalización y discriminación
A. Generalización
También pueden provocar la RC estímulos distintos al EC, pero similares a él, dentro de ciertos límites.
La intensidad de la RC generada por un determinado elemento es mayor cuanto más se parece al EC original,
lo que se conoce como gradiente de generalización.
La tendencia a la generalización tiene una función claramente adaptativa, ya que es muy difícil encontrar
siempre exactamente el mismo estímulo, y los elementos parecidos suelen tener consecuencias similares.
B. Discriminación
Responder de manera distinta a estímulos diferentes. En algunas situaciones puede resultar importante,
también, no responder de la misma manera a estímulos parecidos. Esto evitaría, por ejemplo, los
estereotipos y los prejuicios sociales.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Pavlov probó inicialmente a aumentar el entrenamiento, pero no resultó muy eficaz. En cambio, era mucho
más efectivo emplear un entrenamiento de discriminación, en el que los ensayos de condicionamiento con
un estímulo positivo (EC+), al que seguía el EI, se alternaban con ensayos en los que no se presentaba un
estímulo parecido negativo (EC-), que no iba seguido del EI. Al principio se responde a ambos estímulos, ya
que la RC al EC+ tiende a generalizarse al EC-, pero conforme aumenta el entrenamiento la respuesta se
restringe progresivamente al EC+.
Animales y personas no solo desarrollan asociaciones entre eventos relacionados; también aprenden
disposiciones y pautas cronológicas entre ellos, a las que acomodan sus respuestas. Hay cuatro disociaciones
cronológicas básicas del EC con respecto al EI, y no todas tienen la misma eficacia:
A. Condicionamiento simultáneo
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Consiste en presentar a la vez el EC y el EI. Tiene una eficacia bastante baja, si es que llega a producir RC,
aunque la ausencia de ésta no implica ausencia de aprendizaje.
Procedimiento seguido por Matzel, Held y Miller (1988) para verificar el funcionamiento del
condicionamiento simultáneo:
Este condicionamiento no es adaptativo, ya que el EC no adquiere el papel de anticipar el EI, por lo que no
funciona como señal que induzca la correspondiente reacción condicionada preparatoria.
B. Condicionamiento demorado
El EC precede al EI, y su final coincide con la aparición o tiene lugar durante el transcurso de éste último. Es
el procedimiento asociativo más eficaz. El condicionamiento mejora a medida que aumenta el intervalo EC-EI
(intervalo interestimular) desde cero hasta un punto, a partir del cual comienza a descender. Su magnitud
ideal varía en función de los estímulos, las respuestas y los organismos implicados.
Mientras que con intervalos cortos la magnitud de la RC aumenta y su latencia disminuye a medida que
avanza el entrenamiento, con intervalos largos la latencia evoluciona de forma diferente. Se acorta al
principio, pero finalmente suele alargarse casi hasta el momento que tiene lugar el EI. Esto se conoce como
inhibición de la demora (Pavlov): los organismos aprenden que el EI no tiene lugar hasta pasado un buen
rato desde que aparece el EC, por lo que tienden a inhibir la RC hasta un momento próximo a la aparición de
aquél.
C. Condicionamiento de huella
El EC comienza y termina antes de que aparezca el EI. El lapso entre el final del EC y el inicio del EI es el
intervalo de huella. La asociación del EI debe realizarse con la huella del EC, su representación mental.
Menos efectivo que el demorado, aunque su eficacia depende del intervalo de huella.
A. Asociación E-R
Interpretación conductista. El EC se asocia directamente con la RI, de tal manera que acaba provocando por
sí mismo una reacción similar, la RC.
Antes del condicionamiento el centro neurológico de representación del EI está ligado de forma natural con
el centro de control de la RI, mientras que el centro de representación del EC no está ligado con ninguno de
ellos. Durante el proceso de condicionamiento se desarrolla una conexión entre los centros del EC y de la RI,
de manera que la activación del primer es capaz de activar de forma directa (no mediada por la activación
del EI) en el segundo una respuesta similar a la incondicionada, la RC.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
B. Asociación E-E
Durante el proceso de condicionamiento se desarrolla una conexión entre las representaciones del EC y del
EI. Entonces, la activación de la representación mental del EC a raíz de su presencia se propaga al centro de
representación del EI y seguidamente, como consecuencia natural, se produce la reacción conductual
correspondiente: en este caso, condicionada, por venir desencadenada por el EC.
EI EI RI RI (RC)
Asociación E-R
EC EC
EI EI RI RI (RC)
Asociación E-E
EC EC
Es un procedimiento para poner a prueba las dos hipótesis anteriores, que consiste en alterar el valor el EI
después del condicionamiento.
La teoría E-E predice que después de la revaluación la RC debería cambiar en consonancia con la
modificación sufrida por el EI, puesto que el EC opera a través de él.
Según la teoría E-R, el cambio post-condicionamiento del valor del EI no debería alterar la naturaleza de la
RC, ya que esta sería consecuencia de la asociación directa del EC con la RI.
La evidencia empírica favorece preferentemente la hipótesis de la asociación E-E, más que E-R.
Que se desarrollen y operen preferentemente asociaciones E-E no implica que no se puedan formar en
ocasiones o en alguna medida también asociaciones E-R. Hoy día existe cierta evidencia neurológica
consistente con la idea del funcionamiento de los dos sistemas.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
A. Principio de la contigüidad
Sin embargo, ya se ha visto que la contigüidad máxima (la aparición simultánea del EC y el EI) provoca una
baja eficacia del condicionamiento. Por tanto, la contigüidad es condición necesaria, pero no suficiente
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
(Rescorla), para que se produzca la asociación.
B. Principio de la contingencia
El principio de contingencia (Rescorla) es la capacidad predictiva del EC con respecto al EI. Es un parámetro
derivado de comparar p[EI|EC] con p[EI|EC].
A B C D
p[EI|EC] 0,8 0,8 0,8 0,8
p[EI|EC] 0,0 0,8 0,4 1,0
Contingencia EC-EI ALTA NULA MEDIA NEGATIVA
Como se ve, entre las tres situaciones no habría diferencias en términos de contigüidad, pero sí en términos
de contingencia.
Rescorla (1968)
Experimento 1
Grupo aleatorio Sonido + descarga Descarga Descarga Sonido Descarga Sonido + descarga
Grupo contingente Sonido + descarga Sonido Sonido + descarga
En el grupo contingente, no siempre que suena le damos la descarga, solo 2 de 3. Y además, nunca le han
dado descarga si antes no ha sonado. Sin embargo, el grupo aleatorio ha recibido tres descargas sin que se
produjera antes sonido, por lo que ésta no es una señal predictora.
El de arriba no aprende nada, no le da miedo el sonido, pero el de abajo sí aprende a temer al sonido. Esto se
ha conseguido manejando la contingencia. Este parámetro es lo que marca la diferencia, ya que la
contigüidad es la misma en los dos grupos.
Experimento 2
Compara 4 niveles de contingencia, modificando la p[EI|EC]: 0.0, 0.1, 0.2 y 0.4, respectivamente. El nº de
emparejamientos (contigüidad) sigue siendo el mismo: p[EI|EC] = 0,4 (siempre mismo nº de
emparejamientos Tono-Choque en todos los grupos).
Cada punto del espacio representa una combinación diferente de la probabilidad del EI en presencia y en
ausencia del EC y, por tanto, una contingencia particular.
- Todos los valores situados por encima de la diagonal indican que p[EI|EC] > p[EI|EC], es decir,
condicionamiento excitatorio.
- Todos los valores situados por debajo de la diagonal indican que p[EI|EC] < p[EI|EC], es decir,
condicionamiento inhibitorio.
- Los valores a lo largo de la diagonal indican que p[EI|EC] = p[EI|EC], y por tanto no se observa
condicionamiento.
Este último caso no quiere decir que no se produzca aprendizaje alguno. Los animales aprenden que ambos
eventos no guardan relación (el EC no sirve para predecir el EI), lo que hará más difícil asociarlos en el futuro,
si en algún momento resultan contingentes. Este fenómeno es la irrelevancia aprendida.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
D. Bloqueo: el papel de la sorpresa (Kamin, 1969)
Si se empareja un elemento neutro (ECT) con un EI, su inclusión ulterior en un EC compuesto (ECT + ECL)
impide el condicionamiento del elemento añadido (ECL) dentro del compuesto.
Tratamiento
Fase Grupo experimental Grupo control
1. Preentrenamiento ECT EI Sin preentrenamiento
(Tono Descarga)
2. Condicionamiento compuesto [ECT + ECL] EI [ECT + ECL] EI
([Tono + Luz] Descarga) ([Tono + Luz] Descarga)
3. Prueba ECL Ausencia RC ECL RC
(Luz No miedo) (Luz Miedo)
¿Por qué el condicionamiento previo de un elemento del EC compuesto inhabilita al otro componente añadido
ulteriormente?
Cuando tiene lugar un evento importante, los animales buscan pistas en su memoria que les permitan
anticiparlo en el futuro, por lo que generalmente acaban ligándolo con aquellas claves que resultan
efectivas, como es el EC en los procedimientos convencionales de condicionamiento. Para optimizar sus
recursos (adaptación), los organismos solo rastrean en su memoria si el EI les resulta sorprendente. Si es
esperado quiere decir que ya existe alguna clave que permite anticiparlo, de manera que no es necesaria
ninguna búsqueda adicional. Eso hace que no se produzca condicionamiento con respecto a ningún
elemento nuevo que preceda a un evento importante.
2. Según el principio de contingencia, solo condicionan los EC que son buenos predictores.
3. Según Kamin, solo condicionan los mejores predictores, cuando concurren varios (competición entre pistas).
Es decir, esto no se puede explicar solamente según el principio de contingencia.
Mientras que en el Condicionamiento Clásico se aprendía a asociar estímulos que nos servían de información,
en el Condicionamiento Instrumental la conducta tiene un propósito, está dirigida a metas. La conducta es un
instrumento para lograr experiencias apetecibles y evitar las desagradables.
Thorndike ideó las llamadas cajas-problema para estudiar el aprendizaje de los gatos. Los animales
comienzaban actuando por ensayo y error, emitiendo diferentes respuestas con diferentes ps
(probabilidades), hasta que daban con la solución al azar. Las respuestas que iban seguidas de consecuencias
satisfactorias vían aumentada su p en ese contexto.
No se ha enseñado nada nuevo, puesto que todas las conductas estaban en el repertorio del animal, pero se
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
ha cambiado la probabilidad de que aparezca la conducta en función de la consecuencia que se le aplica.
- Ley del efecto: las conductas que van seguidas de consecuencias satisfactorias tienden a conectarse con
la situación en la que se produjeron, de manera que cuando la situación se repita, será más probable
que vuelva a tener lugar la misma conducta.
- Ley del ejercicio: y cuantas más veces se repita y más intensa sea la satisfacción, más se fortalecerá la
asociación.
El refuerzo (ER) de una conducta (R) en un contexto dado (EC) produce asociación EC-R, lo que incrementa la p
futura de esa R en ese EC.
[EC-R] ER
∆p
B. Skinner
Inicialmente también manejó con frecuencia laberintos. Éstos permiten estudiar diversas cuestiones de
aprendizaje (errores, latencia de respuesta…), pero no proporcionan información sobre qué harían los
animales experimentales si pudieran ejecutar cuanto quisieran la respuesta que les proporciona refuerzos.
Es decir, impiden manejar la tasa conductual (número de respuestas por unidad de tiempo), lo que a Skinner
le parecía fundamental.
A Skinner le interesaba investigar, aparte de qué conductas se aprenden y cómo, cuánto se realizan (en
función de diferentes factores). Por ello, creó la llamada caja de Skinner, en la que los animales:
Esto dio lugar a la variedad de aprendizaje conocida como condicionamiento operante, sinónimo de
condicionamiento instrumental.
2. Tipos de CI
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
lo impide o suprime Omisión (coste de (Refuerzo negativo)
respuesta) [pR-] [pR+]
Se maneja una contingencia positiva entre la respuesta instrumental y un estímulo apetitivo. Suele
incrementar la probabilidad de la respuesta. Es el procedimiento de condicionamiento instrumental más
usual para promover conductas.
B. Castigo
Se maneja una contingencia positiva entre la respuesta instrumental y un estímulo aversivo. Tiende a
reducir la probabilidad de la respuesta. Se suele utilizar para eliminar conductas indeseables. Puede suponer
problemas éticos, y su efectividad ha sido muy discutida.
Se maneja una contingencia negativa entre la respuesta instrumental y un estímulo aversivo. La respuesta
evita que llegue a suceder o interrumpe (si ya está teniendo lugar) el evento aversivo, que sí se produce en
caso de no emitir la respuesta. Normalmente potencia la conducta instrumental.
Se maneja una contingencia negativa entre una respuesta instrumental y un estímulo apetitivo. La
respuesta suprime o reduce la probabilidad de disfrutar de un evento gratificante, que sí tendría lugar en
ausencia de aquella. Por lo general reduce la conducta instrumental. A menudo se prefiere este
procedimiento para disuadir conductas indeseables en personas, porque, a diferencia del castigo, suele
tener una eficacia notable sin necesidad de recurrir a la estimulación aversiva, evitando efectos perniciosos.
A. Respuesta/Conducta (R)
El CI es apto para modificar la probabilidad o frecuencia y la fuerza de las conductas dirigidas a metas,
controladas por el SNC, y que, especialmente en humanos, se consideran deliberadas, voluntarias. Puede
servir para potenciar o combatir este tipo de conductas, siempre que ya existan en el propio repertorio de
los organismos.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Es posible hacerlo, aunque el proceso resulta más lento e indirecto. En personas, la existencia del lenguaje
proporciona una notable ventaja.
Para promover en animales conductas inexistentes mediante CI se suele recurrir al moldeamiento, que
consiste en reforzar progresivamente, por fases, aproximaciones sucesivas cada vez más similares a la
conducta perseguida, hasta lograrla.
No todas las conductas se condicionan con la misma facilidad. Por ello, ya Thorndike estableció el concepto
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
de pertinencia para justificar por qué unas conductas se condicionan con más facilidad que otras, variando la
pertinencia en función del tipo de refuerzos, de la especie y del estado de motivación del organismo, entre
otros factores. Esto, en realidad, supone una ventaja adaptativa.
B. Refuerzo (ER)
Tipos de refuerzos
Primarios: alimentos, agua, estimulación sexual… Son estímulos reductores de algún impulso, su valor
incentivo es innato.
Secundarios: elogios, olor de comida, dinero… No reducen directamente por sí mismos ninguna
necesidad biológica, han adquirido valor incentivo mediante su asociación con algún refuerzo primario.
Sociales: atención, cariño, sonrisa, alabanzas… Pueden ser tanto innatos como aprendidos, recibidos de
otros miembros de la propia especie. Muy empleados en la especie humana, pero no exclusivos de ella.
Dadas dos actividades que difieren en cuanto a su probabilidad de ejecución, la oportunidad condicional
de realizar la más probable puede ser utilizada como refuerzo de la menos probable (no al revés). Es
decir, una actividad poco probable puede verse potenciada si se hace depender de su realización la
oportunidad de llevar a cabo otra muy probable.
Para que una actividad resulte potenciada por dar acceso a otra basta con que las personas sufran
restricciones en ésta última, y solo puedan recuperar su realización habitual si llevan a cabo la primera,
que funcionaría como conducta instrumental. Por tanto, ni siquiera es necesario que la reforzante sea
más probable que la instrumental.
Más tarde, estos mismos autores desarrollaron un planteamiento más amplio, la regulación conductual.
Plantearon que existe una distribución “ideal” de actividades en los organismos, cuando no están
sometidos a restricciones: una especie de “homeostasis conductual”, llamada punto de deleite. En las
intervenciones en las que se aplica un tratamiento mediante CI se interrumpe esta distribución,
condicionando la realización de una actividad (la manejada como refuerzo) a la ejecución de otra que se
quiere promover (convertida en conducta instrumental). En este caso el individuo trata de aproximarse a
su punto óptimo de distribución conductual.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Supongamos que Rodrigo, dejado a sus anchas, dedica: 11h a dormir, 8 a ver TV, 3 a jugar, ½ a hacer
deberes… Si jugar deja de ser independiente de estudiar y se le exige que por cada hora de juego
dedique otra a hacer deberes, esta restricción rompe su homeostasis y dispara los mecanismos de ajuste
encaminados a recuperarla: en este caso, estudia más para poder jugar más.
Cuanto mayor es su calidad y cantidad, más potencian la conducta que los proporciona.
Pero el efecto no depende solo de la cantidad absoluta de los refuerzos, sino también de su cantidad
relativa a la experiencia anterior y, por tanto, de las expectativas. Es decir, la influencia de una
determinada cantidad de refuerzo depende de la historia de reforzamiento. Esto da lugar al fenómeno
de contraste de incentivos. (VER LIBRO: Crespi, 1942)
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Demora
La demora, además de dificultar la asociación conducta-refuerzo, le resta valor incentivo a este. Este
fenómeno es el descuento de la demora: los refuerzos tienen más valor si se reciben en el momento en el
que se realizan los esfuerzos para lograrlos que si hay que esperar tiempo para su obtención.
Habitualmente las conductas reforzadas lo son en algunos contextos o circunstancias particulares. En estos
casos, la conducta (R) se liga al refuerzo (ER) en ese o esos contextos (EC). De modo que los individuos
condicionados tienden a realizar la acción instrumental en presencia del contexto crítico. Este fenómeno es
el control por el estímulo de la conducta instrumental.
En la caja de Skinner frecuentemente se emplea una clave particular, como una luz, indicativa de la
disponibilidad del refuerzo (estímulo discriminativo o EC+) y otra, como un sonido, indicativa de su no
disponibilidad (EC-). En presencia del EC+ la conducta instrumental conduce al refuerzo, mientras que en
presencia del EC-, no. Eso hace que se tienda a emitir la R operante preferentemente en presencia del EC+.
Pero el EC, además de funcionar como recordatorio de la asociación R-ER, también se asocia con la acción
instrumental (EC-R). Asimismo tiende a desarrollarse asociación entre los dos eventos estimulares: EC-ER.
Esto es la participación del CC (el aprendizaje de predictores de eventos significativos) en el CI.
4. Relación respuesta-refuerzo
- Principio de contigüidad: se refiere a la proximidad en el tiempo entre R y ER. Para que se produzca basta
con que aparezcan próximos un nº X de veces.
- Principio de contingencia: implica que la p de ER es mayor si tiene lugar R que si no. No basta con que R y ER
aparezcan juntos un nº X de veces.
Contigüidad, porque nos fijamos en que una cosa ocurre después de otra una vez, y seguimos creyendo que
seguirá ocurriendo aunque haya pasado más veces cuando la primera cosa no ha ocurrido.
Por ejemplo: el hijo hace una cosa rara una vez, y el equipo del padre marca gol. En varias ocasiones ulteriores,
el equipo marca gol aunque el niño no haya hecho eso, sino que han ocurrido otras cosas (el padre va al baño, la
madre grita…). Por tanto, la probabilidad de que el refuerzo (el gol) ocurra cuando el hijo no hace nada, es mayor
que cuando sí lo hace. Y sin embargo, el padre continúa creyendo que si hace eso el equipo marcará gol.
Sin embargo, en condiciones menos engañosas el desarrollo de CI depende en gran medida de la contingencia R-
ER, además de su contigüidad. Varios estudios han obtenido resultados que indican que cuando no hay
contingencia alguna entre respuesta y refuerzo, aunque aparezcan juntos en ocasiones, no se percibe relación
causal de la respuesta respecto al refuerzo, por lo que este no altera la tendencia a emitir la conducta. De nuevo,
contigüidad es condición necesaria pero no suficiente.
5. Programas de refuerzo
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Refuerzo continuo (RC): siempre hay refuerzo.
Razón fija (RF): hay refuerzo cada vez que el individuo repite la conducta X veces.
Razón variable (RV): hay refuerzo cada vez que el individuo repite la conducta una media de X
veces. Por ejemplo, a veces solo tiene que hacerla 4, y otras 8: la media es 6 veces.
Intervalo fijo (IF): hay refuerzo cuando transcurre un periodo de tiempo determinado.
Intervalo variable (IV): hay refuerzo cuando transcurre una media de X unidad de tiempo.
Programas complejos (no entran): se maneja más de una respuesta o más de un programa simple.
Con un programa de refuerzo continuo, aunque la adquisición es más rápida, al eliminar el refuerzo la extinción
de la conducta es también muy rápida. Con un programa de refuerzo parcial sucede lo contrario. Es decir, hay
mayor resistencia a la extinción en el caso de las R adquiridas bajo programas de refuerzo parcial, y cuanto más
alta es la razón o el intervalo de refuerzo, más resistencia: efecto del refuerzo parcial en la extinción.
Consiste en la contingencia positiva entre una conducta y un estímulo aversivo ulterior. Se supone que este
tratamiento disminuye la probabilidad de la conducta afectada, pudiendo llegar incluso a suprimirla por
completo. Sin embargo, lo adecuado de su uso ha sido sometido a un intenso debate, debido a su supuesta
escasa efectividad para suprimir la conducta sancionada, como a sus efectos colaterales contraproducentes.
Thorndike (1932): El castigo NO constituye un procedimiento eficaz para producir reducciones importantes y
duraderas de la conducta. NO debe emplearse.
Skinner (1938): Los efectos supresores del castigo son, en el mejor de los casos, solo temporales. (VER LIBRO)
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ahora se sabe que, comparativamente, es menos efectivo que la recompensa.
A. Intensidad
Boe y Church (1967): tabla de registros acumulados. La línea de abajo indica el grupo de ratas que menos ha
dado a la palanca. Es el grupo que tenía la descarga más intensa la primera vez que toca. Por ello la conducta
desaparece muy rápido. El grupo de arriba es el control, solo con extinción. A medida que va aumentando la
intensidad de la descarga, hay mayor distancia con respecto a la línea de arriba.
Por tanto, si el castigo es suficientemente intenso, incluso su aplicación durante un breve periodo transitorio
puede generar una supresión importante y duradera de la conducta. Así, cuanto más intenso es el castigo,
más efectivo resulta, pero también genera más sufrimiento y efectos colaterales indeseables.
El efecto de un castigo más o menos intenso depende también de la experiencia anterior. Por ello, comenzar
aplicando castigos muy pequeños, para luego aumentar de forma progresiva su intensidad, al no mostrarse
efectivos los anteriores, puede resultar contraproducente. Se genera inmunización al castigo, que acaba
perdiendo parte de su efectividad, incluidas sus versiones severas. Los organismos se adaptan y tornan
resistentes a intensidades que aumentan gradualmente.
Por el contrario, comenzar con castigos intensos produce sensibilización y los correspondientes efectos
secundarios. Así, la exposición inicial a castigos severos puede incrementar el impacto de castigos más leves
posteriores. Lo ideal es, por tanto, encontrar el castigo mínimo suficiente.
B. Demora
Efecto similar al visto en la recompensa: a más retraso de las consecuencias punitivas, menor supresión de
la conducta que las provoca.
Cuando la demora es larga para ambas opciones, predomina la repuesta que conlleva castigo menor, aunque
se reciba antes. Sin embargo, cuando las demoras son cortas predomina la respuesta que da lugar al castigo
mayor, por ser menos inminente.
Un problema que surge debido a este efecto es que mientras las consecuencias adversas de algunas
conductas no deseables aparecen diferidas, esas mismas conductas pueden ser reforzadas a corto plazo, lo
que hace difícil suprimirlas.
C. Programa
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Las conductas castigadas pueden serlo de forma sistemática (equivalente a los programas de RC) o
inconsistente (equivalente al RP). Los programas sistemáticos suelen ser más eficaces que los inconsistentes.
Al igual que con la recompensa, la asociación de una conducta con un castigo puede verse controlada por
alguna señal o situación contextual. Si es castigada en unas circunstancias concretas, estas acaban
convirtiéndose en la clave que señala el castigo, y la conducta tiende a desaparecer preferentemente dentro
de esa situación. Se produciría castigo discriminado, con la consiguiente supresión selectiva.
Las conductas muy arraigadas y con una motivación fuerte son más difícil es de eliminar, sobre todo si no
se dispone de alternativas para satisfacer el impulso que las promueve. De hecho, castigar conductas muy
motivadas puede generar un conflicto y desestabilización importantes.
Si se consigue dar una conducta que sustituye a la que se quiere eliminar, habrá más posibilidades de
conseguirlo.
G. Explicaciones
Todos los factores anteriores afectan a animales tanto como a humanos. Sin embargo, la capacidad cognitiva
y lingüística de las personas también juega un papel importante en el funcionamiento del castigo. Las
explicaciones de por qué se aplica un castigo incrementan notablemente su efectividad, ya que ayudan a
precisar la conducta castigada y a justificar el uso del castigo.
3. “Daños colaterales”
Los eventos punitivos con frecuencia generan efectos colaterales ya que, de no ser así, no funcionan:
- Dolor físico.
- Miedo y ansiedad. A su vez, estas emociones desagradables generan:
Si el objetivo de un profesor es reducir los errores la estrategia de castigo puede resultar contraproducente. La
realización de las actividades asociadas a castigos se convierte en una fuente de ansiedad, por lo que tenderán a
ser evitadas. En caso de no ser así, el rendimiento resulta en cualquier caso perjudicado.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Se ha visto que la exposición a estímulos aversivos puede provocar agresividad: es lo que se denomina
agresividad provocada por el dolor. Además, el empleo asiduo de castigos por parte de padres/madres y
maestros/as puede servir a los infantes de modelo de comportamiento agresivo (aprendizaje vicario o por
imitación de los modelos), y favorecer su uso ulterior inadecuado por su parte.
Un último inconveniente del castigo es que se aplica a una conducta “reprobable” ya realizada: se puede
conseguir eliminar una conducta indeseada, pero no se consigue una conducta deseada. Por tanto, a lo mejor
no hay que castigar a los niños cuando juegan mal, sino enseñarles a que jueguen bien. El castigo no llevaría a
jugar de forma cooperativa.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La exposición reiterada de animales y personas a sucesos adversos ineludibles importantes tiende a provocar un
estado psicológico caracterizado por la pérdida de capacidad para aprender a evitar posteriores adversidades
eludibles y, en general, para aprender a controlar lo que les ocurre. Es un fenómeno similar en muchos aspectos
a algunas depresiones.
- Grupo ejecutivo: expuestos a estímulos aversivos que pueden cancelar emitiendo alguna respuesta.
- Grupo subordinado: no pueden poner fin a los estímulos aversivos, y reciben aquellos que no elimina el
grupo ejecutivo.
- Grupo control: misma situación experimental aparente, pero sin sufrir evento aversivo alguno.
B. Interpretaciones de la indefensión
Deficiencia motivacional: reducen los esfuerzos e intentos para controlar los eventos del entorno.
- Otras interpretaciones: las descargas reiteradas ineludibles producen miedo, ansiedad y estrés que, a su
vez, generan:
Déficit atencional, que dificulta luego prestar atención a acciones propias y asimilar sus
consecuencias.
Es decir, el origen sería un problema emocional que pone al organismo en una situación nefasta para
aprender que puede buscar una salida.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
3º Esos dos grupos y otro control son sometidos a prueba de escape: descargas eludibles mediante otra R.
Resultados: el grupo indefensión es el que más tarda en aprender a escapar. El grupo control, que no ha
tenido fase de indefensión, está en medio, y el grupo inmunización + indefensión es el que más rápido
aprende. Este grupo ha tenido una experiencia previa que le ha inmunizado a que se desencadene el
fenómeno de indefensión.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Aprendizaje:
Es una propiedad fundamental del cerebro que se manifiesta de diversas formas mediante múltiples
sistemas diferenciados anatómica y funcionalmente.
El entorno modifica nuestro comportamiento, en tanto que es capaz de inducir cambios en nuestro SN.
Memoria: mecanismo por el que este conocimiento es codificado, almacenado y, posteriormente, recuperado.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La fase de codificación de la memoria es, en cierto modo, la fase de aprendizaje. Sin embargo, no es suficiente
con adquirir el conocimiento, sino que éste también tiene que consolidarse y poder ser recuperado para su uso.
La base física y biológica de la memoria, y por tanto del aprendizaje, es el cerebro, y dentro de éste, a nivel
microscópico, las sinapsis. El cerebro es un órgano dinámico, en constante cambio, que genera conexiones de
manera continua, debido al aprendizaje. Esto es posible gracias a la plasticidad cerebral. Por ello, el aprendizaje
induce cambios anatómicos, a medida que se practica.
- Memoria inmediata o memoria perceptiva: aprendizajes sensoriales. Memoria a muy corto plazo de
información visual y auditiva. Tiene capacidad de almacenamiento ilimitada pero es de muy corta duración
(medio segundo-un segundo).
- Memoria a corto plazo, memoria de trabajo o memoria operativa: dura más que los almacenes sensoriales
pero tiene una capacidad limitada (7+/-2 elementos). Permite manejar la información del momento.
- Memoria a largo plazo: no tiene limitación temporal ni, en principio, de almacenamiento. No obstante, no
toda la información almacenada se consolida, aquella que no se utiliza a menudo se olvida. La limitación de
esta memoria está en la recuperación de la información.
Es la parte interior del lóbulo temporal. Está formado por el hipocampo y la circunvolución hipocampal. Ésta
última está constituida por las cortezas entorhinal, perirhinal y parahipocámpica. Todas las memorias
explícitas necesitan, al menos en algún momento, que esté sana alguna parte del lóbulo temporal medial,
mientras que las memorias implícitas no. Una de las características que lo hacen tan fundamental es que es
especialmente plástico. Esto, por otra parte, es una desventaja, ya que hace que esta zona sea más proclive a
tener una reorganización anómala en la que las neuronas se conecten con ellas mismas dando lugar a un
foco epiléptico. Otra de sus ventajas es que está muy conectado con el resto del cerebro, lo que facilita que
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
envíe y reciba información.
Paciente H.M.: uno de los pacientes más estudiados en la historia de la Neuropsicología. Tenía focos
epilépticos en los dos lóbulos temporales, por lo que le fueron extirpados. Esto le ocasionó una amnesia
total, es decir, nula capacidad de aprendizaje (de aprendizaje explícito, no implícito).
Habituación: reducción de la magnitud de la respuesta ante 1 estímulo generalmente inocuo que se repite
con frecuencia en un breve periodo de tiempo. NO ES:
o Adaptación sensorial: los receptores se adaptan, por lo que dejan de detectar los estímulos y no envían
la información al cerebro. En la habituación la información sí llega al cerebro, pero éste no emite
respuesta.
o Fatiga muscular.
Sensibilización: proceso que provoca que la R a un estímulo, normalmente intenso, nocivo o que provoca
miedo, sea más intensa de lo normal por presentarse tras un estímulo que ha causado un sobresalto inicial.
Aplysia: modelo animal simple utilizado para estudiar las bases fisiológicas del aprendizaje (habituación,
sensibilización y CC). Tiene muchísimas menos neuronas que el ser humano (20 mil, frente a los 100 mil millones
del SH) y son mucho más grandes que las de éste último, lo que la hace ideal para estudiar este tipo de
aprendizajes, ya que solo se necesitan una neurona sensorial y otra motora. La parte morfológica estudiada en
este animal es la branquia; en concreto, se estudia el reflejo de retirada de la branquia.
A. Habituación
Se estimula repetidamente el sifón, situado en la parte posterior de la branquia, hasta que la Aplysia se
habitúa a la estimulación, por lo que el reflejo de retirada branquial deja de producirse.
A nivel neuronal
El sifón es la parte de la branquia que recibe la información y la envía a una neurona sensorial. Ésta conecta
con una neurona motora, que provoca el movimiento de la branquia. En estado normal, la neurona sensorial
sufre un potencial postsináptico excitatorio (PEP), por lo que genera un potencial de acción (PA) y envía la
información a la neurona motora. Cuando la Aplysia se ha habituado, la neurona sensorial responde igual,
pero la motora tiene un PEP más pequeño, lo que disminuye la probabilidad de que dispare un PA.
A nivel sináptico
En condiciones normales, la neurona pre-sináptica es recorrida por el PA. Durante el potencial de reposo, el
interior neuronal está cargado negativamente con respecto al exterior (-70 mV). Cuando se produce el PEP,
comienza a funcionar la bomba de Na+/K+ y entran iones Na+ hasta que se alcanza el umbral de excitación. Si
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
esto ocurre, se genera un PA. Llega un momento en que empiezan a salir iones K+, lo que hace que el
potencial de membrana vuelva a ser negativo. Cuando el PA llega al botón terminal, se abren los canales de
Ca2+. La entrada de este ion provoca que las vesículas sinápticas se fusionen con la membrana y segreguen
los NT a la hendidura sináptica. Cuando éstos llegan a la neurona postsináptica, se abren los canales de Na+ y
se genera un PEP, que, si es suficientemente intenso, vuelve a generar un PA.
Cuando se ha producido habituación, en la sinapsis entre la neurona sensorial y la motora, el PEP que se
genera en ésta última no es lo bastante intenso como para alcanzar el umbral de excitación; por tanto, no se
produce otro PA, y la neurona motora no responde.
Esto sucede porque se bloquean parcialmente los canales de Ca+ de la neurona presináptica. Como
consecuencia, entra menos Ca2+ y se liberan menos NT (Glutamato en este tipo de sinapsis excitatorias) a la
hendidura sináptica. Por ello, la neurona postsináptica capta menos NT, entra en ella menos Na+, y el
resultado final es que el PEP es más pequeño. Este fenómeno se denomina depresión presináptica de la
neurona sensorial.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
B. Sensibilización
Para provocar un proceso de sensibilización en la Aplysia, primero se le aplica un choque eléctrico en la cola.
Esto genera que el animal reaccione de forma exagerada ante cualquier otro toque en otra parte de su
cuerpo, lo que provoca el reflejo de retirada branquial. La clave es el shock en la cola: si no se produce no
hay sensibilización. El estímulo aversivo se da antes.
A nivel neuronal
Al sistema implicado en la habituación hay que añadir un tercer elemento: la interneurona moduladora de
la cola, que se conecta con la neurona sensorial del sifón y ésta, a su vez, con la motora del sifón. Es decir, no
hay una conexión directa entre la neurona moduladora de la cola y la motora del sifón, sino que media entre
ellas la neurona sensorial del sifón. Es la actividad de la neurona de la cola la que determina la actividad de
la sensorial del sifón. Por ello, si posteriormente al choque eléctrico en la cola se toca otra parte del cuerpo
de la Aplysia, ésta responde exageradamente. Ya no hace falta que haya descarga.
Cuando el animal ya está sensibilizado, la neurona sensorial tiene el mismo comportamiento que antes de la
sensibilización. Lo que ocurre es que se genera un PEP mayor y más largo en la neurona motora, lo que
provoca más PA de lo normal. Por tanto, hay más respuesta, y se repliega más la branquia.
A nivel sináptico
Aumento de la transmisión sináptica por un mecanismo de facilitación heterosináptica (se denomina así
porque interviene un tercer elemento, externo a la sinapsis entre la neurona sensorial y la motora).
Primero aumenta la cantidad de serotonina liberada por la interneurona de la cola en la sinapsis axo-axónica
(interneurona-neurona sensorial). Esto hace que aumente la concentración de AMPc y PKA (proteína quinasa
A) en la neurona sensorial. Estos dos elementos provocan que se cierren parcialmente los canales de K+, por
lo que se retienen los iones K+ en el terminal sináptico y no salen al exterior. Esto alarga la duración del PA.
Como consecuencia, los canales de Ca2+ se mantienen abiertos durante más tiempo, por lo que entra más
Ca2+, se fusionan más vesículas sinápticas con la membrana y se liberan más NT (Glu) a la hendidura
sináptica. Esto provoca, a su vez, que la neurona postsináptica capte más NT y consecuentemente más iones
Na+, lo que genera un PEP mayor y más largo de lo normal.
Todo esto es posible porque, una vez que se ha aplicado una descarga eléctrica en la cola, su interneurona
empieza a liberar serotonina y continúa haciéndolo durante un tiempo. Por eso más tarde, si se toca otra
parte de su cuerpo, la reacción continúa siendo mayor de lo normal, aunque ya no se haga nada en la cola.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
- Una sesión con 10 estímulos produce habituación a corto plazo que dura minutos.
- Cuatro sesiones espaciadas en el tiempo producen habituación a largo plazo que dura semanas.
- Un único estímulo nocivo puede producir sensibilización a corto plazo durante minutos.
- Más de un estímulo nocivo puede producir una sensibilización a largo plazo que dura días/semanas.
A corto plazo la neurona presináptica utiliza el AMPc y la PKA para que se libere más NT. En la sensibilización
a largo plazo se producen los mismos mecanismos químicos que a corto plazo. Además de todo esto, la PKA
se desplaza de la sinapsis hacia el núcleo, donde activa la proteína CREB-1. Ésta produce la expresión de los
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
genes que modifican la función y la estructura de la neurona (p. e. creación de nuevas conexiones
sinápticas). Al ser un cambio estructural es mucho más duradero. Sin embargo, si después se deja de
entrenar este mecanismo, esos genes dejan de expresarse y las neuronas vuelven a la normalidad.
A. Condicionamiento Clásico
Estímulo táctil en el manto (EC+) se empareja con una descarga eléctrica en la cola (EI).
La vía del sifón puede servir de control (EC-): se estimula el mismo número de veces, pero sin asociarlo
con la sacudida de la cola.
Al cabo de cinco ensayos de emparejamiento, la respuesta al estímulo del manto (EC+, condicionado) es
mayor que la del sifón (EC-, sin emparejar).
2. Bases cerebrales
En el condicionamiento demorado, el EI aparece poco después del inicio del EC y ambos estímulos
terminan simultáneamente. En este tipo de condicionamiento solo es necesario el cerebelo.
Por tanto, se puede producir cualquier tipo de condicionamiento con la sola participación del
cerebelo, menos en el de huella, para el que es necesario el hipocampo.
En este tipo de condicionamiento está implicada la amígdala, puesto que es la encargada de valorar
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
afectivamente los estímulos.
Una descarga eléctrica provoca por sí misma una respuesta automática de aumento de la
conductancia de la piel. Esto es un síntoma vegetativo, incontrolable por la persona. Esto ocurre
porque la amígdala analiza el estímulo y lo califica de “peligroso”.
Para condicionar esta respuesta, se puede asociar un estímulo neutro (cuadrado rojo) con una
pequeña descarga eléctrica. Tras el condicionamiento, en una persona con la amígdala sana, ante el
EC la respuesta de conductancia de la piel aumenta. En una persona con lesión en la amígdala, no se
produce el condicionamiento, por lo que la presentación del EC no provoca esta respuesta.
Los pacientes con la amígdala lesionada de forma bilateral, como S.P., tienen preservado el
conocimiento explícito de los acontecimientos que han tenido lugar durante el condicionamiento de
la respuesta de miedo. No obstante, estos pacientes no muestran condicionamiento en sus R.
HIPOCAMPO
Normal Lesión
Normal Conocimiento explícito V Conocimiento explícito X
AMÍGDALA Condicionamiento emocional V Condicionamiento emocional V
Lesión Conocimiento explícito V Conocimiento explícito X
Condicionamiento emocional X Condicionamiento emocional X
B. Condicionamiento Instrumental
1. Establecimiento de asociaciones
Los ganglios basales son la estructura cerebral más relacionada. Tiene varias partes:
a) Cuerpo estriado o estriado dorsal: con dos subestructuras, el núcleo caudado y el putamen.
Responsable de la asociación entre la conducta y sus consecuencias y del establecimiento de la
relación causal entre ambos eventos.
En experimentos con roedores se utilizan laberintos de ocho brazos. Se coloca comida en los dos brazos
más próximos a derecha e izquierda, ya que no se pretende lograr aprendizaje espacial, sino que asocie
la conducta “girar por el más próximo” con la obtención de comida. Cuando se lesionan los ganglios
basales, en concreto el estriado, se afecta al condicionamiento instrumental, pero no a otras formas de
aprendizaje. Un animal con el hipocampo dañado sí es capaz de establecer estas asociaciones: no
aprende de forma explícita, pero sí implícitamente.
En humanos se estudian pacientes con alguna patología, bien porque se les ha seccionado una parte de
su cerebro, bien porque sufren una enfermedad degenerativa. Se suele emplear la técnica analítica de
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
resonancia magnética funcional (RMf), que sirve para estudiar el funcionamiento del cerebro. Se supone
que las personas con algún área cerebral concreta lesionada mostrarían menor actividad en esa región.
Los pacientes con Parkinson tienen dificultades para realizar tareas de aprendizaje implícito de
probabilidades (p. e. tarea de predicción del tiempo de Knowlton y colaboradores, 1996), ya que no
producen suficiente dopamina como para que los ganglios basales funcionen correctamente. Sin
embargo, el aprendizaje explícito no queda dañado. El paciente H.M. podría hacer esta tarea, aunque no
sabría decir que ha aprendido.
Estudiaban la relación entre la formación reticular y el aprendizaje. Para ello, emplearon roedores a los
que colocaron un electrodo donde ellos creían que estaba la formación reticular. Se dieron cuenta de
que los animales estaban continuamente pulsando la palanca que activaba el electrodo, buscando la
autoestimulación de forma constante. A partir de estos resultados desecharon su anterior investigación
para estudiar este fenómeno. Si colocaban el electrodo en otras zonas del cerebro, no ocurría esto. Por
tanto, pensaron que esa zona estaba involucrada en los mecanismos de placer y recompensa.
El circuito de recompensa o red de refuerzo está constituido por regiones muy antiguas del cerebro. El
principal NT es la dopamina (son dopaminérgicas). Empieza en un núcleo del mesencéfalo llamado área
tegmental ventral (ATV). A partir de ahí se divide en dos rutas:
a) Vía Mesolímbica: corta, acaba en el centro del cerebro, concretamente en el núcleo accumbens
(sistema límbico). Es la más importante, la que tiene más núcleos.
Hay otra vía dopaminérgica muy importante, la vía nigroestriada, que resulta afectada en el Parkinson, y
que conecta la sustancia nigra con el cuerpo estriado.
b) Si la administración del zumo se ve precedida por la presencia de un estímulo luminoso, las neuronas
dopaminérgicas disparan en respuesta a la luz pero no en respuesta al refuerzo en sí.
c) Si la luz predice el refuerzo, pero éste no se presenta, las neuronas dopaminérgicas muestran un
incremento en la tasa de disparo ante la luz, seguido de un descenso en el momento en el que se
esperaba el refuerzo (frustración).
Por tanto, el aumento de los niveles cerebrales de dopamina provoca una sensación agradable, y el
descenso provoca una sensación desagradable que interpretamos como frustración.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Experimento 2
En el ser humano, la activación del núcleo accumbens no es provocada solamente por recibir una
recompensa, sino por anticipar que va a ser recibida. Además, cuanto mayor es la recompensa, mayor
es la actividad del núcleo.
A. Priming
Se trata de sesgar la respuesta de la persona presentando un estímulo concreto. Así, ante un segundo
estímulo, la persona responde en función del significado/percepción del primer estímulo.
Este efecto se estudia mediante la tarea de Gollins, que consiste en presentar una serie de tarjetas al sujeto,
cada una de ellas con más información que la anterior, hasta que éste adivina cuál es la figura. El paciente
H.M. realiza la tarea igual de bien que una persona normal.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
A nivel cerebral, lo que ocurre es que se preactivan zonas de la corteza donde está esa información. Por
tanto, participa toda la corteza. Lo que cambia con el tipo de tarea es qué zona de la corteza se activa. Esto
da lugar a diferentes tipos de priming.
En el caso del priming semántico, se preactiva una zona encargada de nombrar las palabras, situada en el
polo temporal del hemisferio izquierdo.
B. Aprendizaje procedimental
Aprendizaje de movimientos de manera implícita, rutinas motoras (montar en bici, conducir, andar).
Una de las tareas utilizadas para evaluar este tipo de aprendizaje es la tarea de dibujo en espejo. El paciente
H.M. podría realizar esta tarea, aunque no se diera cuenta de ello.
A nivel cerebral participan las áreas motoras de la corteza, aquellas regiones involucradas en el movimiento.
La ruta que se activa cuando decidimos realizar un movimiento empieza en la corteza prefrontal
dorsolateral, encargada de planificar y tomar la decisión. La orden pasa a la corteza premotora, que tiene
almacenadas las secuencias de movimientos, y después a la corteza motora primaria (M1), que ordena el
movimiento de la parte concreta del cuerpo. Posteriormente la orden atraviesa el tronco cerebral, la médula
espinal y los nervios motores hasta alcanzar el músculo. Mientras se realiza el movimiento se recibe desde el
músculo feedback visual y táctil a través de los nervios sensitivos, para que el movimiento pueda ser
reequilibrado y ajustado, gracias a los ganglios basales y el cerebelo. Este feedback llega también a las
cortezas somatosensorial y visual. Una vez que se ha realizado el movimiento, la corteza prefrontal
dorsolateral y medial o cíngulo anterior detecta los errores cometidos durante el mismo.
También se le llama relacional porque se trata de aprendizaje que relaciona cosas, hechos. Otra característica de
este tipo de memorias es que dependen de la actividad del hipocampo, del lóbulo temporal medial.
El lóbulo temporal medial es la parte interna del lóbulo temporal. Se compone de dos partes: el hipocampo y
la circunvolución parahipocampal. Ésta última está dividida, a su vez, en tres zonas: las cortezas entorhinal,
perirhinal y parahipocámpica.
Antes del paciente H.M., se pensaba que todo el lóbulo temporal medial se encargaba de la memoria
episódica, y que toda la memoria era inicialmente autobiográfica para después convertirse en semántica. Sin
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
embargo, después se descubrió que la memoria episódica solo depende del hipocampo, y que es
independiente de la memoria semántica. Ésta última depende de la circunvolución parahipocampal. La
memoria espacial depende del hipocampo, especialmente de su parte más posterior.
*Aquí resumimos con “hipocampo” todo el lóbulo temporal medial. La información episódica es la que es
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
enviada propiamente por el hipocampo, mientras que la semántica es enviada por la circunvolución
parahipocampal.
Ocurre lo mismo que durante la consolidación: al principio hay que recurrir al hipocampo para recuperar la
información codificada, que envía la orden a las zonas corticales pertinentes. Cuando la información ya se ha
transferido a la corteza, ésta se activa sin necesidad del hipocampo.
Tema 7 El sustrato neuroanatómico es múltiple: existen distintos sistemas cerebrales para distintos tipos de
aprendizaje y memoria.
¿Qué tipo de cambios ocurren en el cerebro cuando se produce un aprendizaje o cuando se adquiere, almacena,
consolida o recupera una memoria?
Tema 8 Los mecanismos celulares y moleculares tienen un carácter más general o universal, ya que
dependen de la propia capacidad de adaptación o plasticidad del SN.
Plasticidad no es lo mismo que elasticidad: algo elástico es algo capaz de cambiar, pero la plasticidad implica
que el cambio perdure.
Lejos de ser un sistema estático de elementos interconectados como antiguamente se creyó, el cerebro es un
órgano dinámico, que se desarrolla y cambia continuamente en respuesta a programas genéticos y a la
interacción con el ambiente.
Uno de los científicos más importantes en este cambio de perspectiva fue Ramón y Cajal, quien individualizó las
neuronas como elementos separados unos de otros, y descubrió las sinapsis. También dio la primera descripción
de lo que es la plasticidad cerebral: las neuronas no son estáticas, sino que pueden cambiar y producir más
ramificaciones al hacer “gimnasia cerebral”.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Otro importante científico fue Hebb, de quien se conoce el Principio de Hebb: “las neuronas que se activan
juntas permanecen juntas”. Una sinapsis entre dos neuronas se fortalece cuando se produce una coincidencia en
la actividad presináptica y postsináptica, es decir, si las dos neuronas se encuentran activadas al mismo tiempo.
Lomo y Bliss (1966, 1973): explicaron el fundamento del principio de Hebb. Si se activa una vez una neurona, se
activa una vez la segunda. Si se activa repetidamente la primera neurona por estimulación tetánica, la segunda
tiene más respuesta. Después de esto, el incremento de la actividad postsináptica se mantiene ante pulsos
individuales durante horas. ¿Por qué ocurre esto? Porque ha habido una mejora sináptica en la conexión entre
ambas neuronas, se ha mejorado la eficacia sináptica mediante la repetición. Las dos neuronas aprenden que
“van juntas”. Esto se denomina Potenciación a Largo Plazo (PLP).
La Potenciación a Largo Plazo (PLP) es un fenómeno plástico que se caracteriza por un incremento estable y
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
duradero en la eficacia sináptica tras una estimulación rápida y repetida. Para que se produzca es necesario
que la célula postsináptica esté activada (despolarizada) cuando la presináptica dispara.
Los receptores NMDA posibilitan la PLP. Junto con los receptores AMPA, son un tipo de receptor de Glu, y
abundan en el campo CA1 de la formación hipocampal. Reciben su nombre del fármaco que los activa
específicamente (N-metil-D-aspartato).
El Glu se acopla a los receptores por un mecanismo de llave-cerradura, activándose un canal de Na+/K+. A
diferencia de los receptores AMPA, los NMDA dejan entrar también iones Ca2+. En los receptores NMDA un
ion de Mg2+ bloquea el canal, que permanece cerrado incluso si los receptores son estimulados por Glu. Solo
si la neurona postsináptica está despolarizada este ion se va, dejando libre el canal para el intercambio.
Cuando el Glu se acopla a los receptores AMPA, la neurona se despolariza, lo que hace que los iones Mg2+ se
vayan y se desbloqueen los NMDA. Entonces entran los iones Ca2+, que activan proteínas quinasas, lo que
provoca que se empiecen a sintetizar otras proteínas que provocan cambios en la neurona postsináptica.
Todo esto solo ocurre cuando hay una estimulación rápida y repetida.
Por tanto, los receptores NMDA están controlados tanto por NT (Glu) como por voltaje (despolarización de
la neurona postsináptica).
C. Fases de la PLP
La primera fase es la ya descrita. Para que se mantenga y se fortalezca a largo plazo la sinapsis, es necesario
que la síntesis de proteínas empiece a generar cambios en la sinapsis, haciéndose más grande su superficie,
lo que mejora su eficacia. Primero se producen cambios funcionales: incremento en el número y la
capacidad conductiva de los receptores AMPA. Más tarde hay cambios estructurales:
a) Ensanchamiento de las espinas dendríticas ya existentes para acomodar todos los receptores AMPA.
b) División de una espina en dos.
c) Creación de nuevas espinas dendríticas.
Para estudiar si los receptores NMDA son importantes para el aprendizaje y la memoria hay dos
procedimientos: bloquear los receptores o mejorarlos. Distintos experimentos indican que el
almacenamiento en memoria emplea PLP.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-230690
Por tanto, sin receptores NMDA no hay PLP, y sin PLP no hay aprendizaje.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2. Ratones con una mejora genética de los receptores NMDA: se mejora su conductividad. El aprendizaje es
mucho más rápido.
Estudiar si personas que llevan tocando el violín desde niños generan mejor funcionalidad (cambios
funcionales) en las zonas cerebrales encargadas de mover los dedos.
El homúnculo motor es una representación de las distintas zonas del cuerpo en el cerebro, y se sitúa en la
corteza motora primaria. Las partes con movilidad más fina son la cara y las manos, por ello, tienen mayor
representación cerebral. Vieron que cuanto antes empezaban a tocar el violín, mayor intensidad de la
activación neuronal en esta área (cambios funcionales). Además, aumentaba la representación (cambios
anatómicos) de los dedos, esto se veía midiendo la distancia entre la zona dedicada al dedo 1 y la dedicada
al dedo 5.
Por tanto, personas que llevan toda su vida realizando una actividad tienen cambios funcionales y
estructurales.
Estudiar si se producen cambios anatómicos en el cerebro de conductores de taxi que llevan muchos años
trabajando, aunque no haya sido desde niños.
Encontraron mayor volumen del hipocampo posterior (HI y HD) y correlación positiva entre el volumen del
hipocampo posterior (HD) y años de experiencia.
Por tanto, no solamente aquellos que llevan toda su vida practicando una actividad tienen cambios
estructurales en el cerebro.
Estudiar si en personas adultas que no llevan mucho tiempo practicando una actividad (malabares), sino que
aprenden en ese momento, se producen cambios cerebrales.
Encontraron cambios anatómicos en áreas visuales relacionadas con la percepción del movimiento tras tres
meses de entrenamiento.
Uno más reciente: experimento de Michelle (Pascual-Leone et al.). Tras solo 5 días de ceguera total, se
detectaron cambios plásticos en la corteza occipital, que desaparecían en cuanto se quitaba la venda.
Por tanto, aunque muchos años de aprendizaje consoliden los cambios que se producen en el cerebro, en
el día a día también se producen cambios plásticos.