Los Fundamentos Del Acondicionamiento y El Aprendizaje - Traducción

7/10/21 15:55 Los fundamentos del acondicionamiento y el aprendizaje - PDFDrive.
com
Página 1
Página 4
2
3
Copyright © 2018 por la Asociación Americana de Psicología. Todos los derechos

reservado. Excepto según lo permitido por la Ley de derechos de autor de los Estados Unidos de 1976, no
parte de esta publicación puede ser reproducida o distribuida en cualquier forma o por cualquier
significa, que incluye, entre otros, el proceso de escaneo y digitalización, o
almacenado en una base de datos o sistema de recuperación, sin el permiso previo por escrito de
el editor. Texto original
means, including, but not limited to, the process of scanning and
Edición electrónica publicada en 2018. digitization, or
ISBN: 978-1-43382778-5 (edición electrónica). Sugiere una traducción mejor
Las opiniones y declaraciones publicadas son responsabilidad de los autores, y

Tales opiniones y declaraciones no representan necesariamente las políticas del
Asociacion Americana de Psicologia.
Publicado por
Asociacion Americana de Psicologia
750 First Street, NE

Washington, DC 20002
www.apa.org
Departamento de pedidos de la APA

PO Box 92984
Washington, DC 20090-2984
Teléfono: (800) 374-2721; Directo: (202) 336-5510
Fax: (202) 336-5502; TDD / TTY: (202) 336-6123
En línea: www.apa.org/pubs/books
Correo electrónico: order@apa.org
En el Reino Unido, Europa, África y Oriente Medio, las copias se pueden solicitar a
Grupo Eurospan
c / o Pegasus Drive
Parque empresarial Stratton
Biggleswade Bedfordshire
SG18 8TQ Reino Unido
Teléfono: +44 (0) 1767 604972
Fax: +44 (0) 1767 601640
Página 5
https://translate.googleusercontent.com/translate_f 1/282
7/10/21 15:56 Los fundamentos del acondicionamiento y el aprendizaje - PDFDrive.com
Fax: +44 (0) 1767 601640
En línea: https://www.eurospanbookstore.com/apa
Correo electrónico: eurospan@turpin-distribution.com
Diseñador de portada: Naylor Design, Washington, DC
Nombres de los datos de catalogación en publicación de la Biblioteca del Congreso : Domjan,

Michael, autor de 1947.
Título: Los fundamentos del condicionamiento y el aprendizaje / Michael Domjan.

Descripción: Cuarta edición. | Washington, DC: psicológico estadounidense
Asociación, [2018] | Edición revisada de The essentials of
condicionamiento y aprendizaje, c2005. | Incluye referencias bibliográficas.
Identificadores: LCCN 2017015947 | ISBN 9781433827785 | ISBN 1433827786
Asignaturas: LCSH: Respuesta condicionada. | Refuerzo (Psicología) |
Aprendizaje, Psicología del.
Clasificación: LCC BF319 .D653 2018 | DDC 153.1 / 526 — dc23 LC record
disponible en https://lccn.loc.gov/2017015947
Datos de catalogación en la publicación de la Biblioteca Británica Hay un registro CIP disponible

de la Biblioteca Británica.
Cuarta edición
http://dx.doi.org/10.1037/0000057-000
10 9 8 7 6 5 4 3 2 1
Página 6
Hacia Deborah
Página 7
Contenido
PREFACIO
1. Conceptos básicos y definiciones

Características fundamentales del aprendizaje
Aprendizaje y otras formas de cambio de comportamiento
Aprendizaje, desempeño y niveles de análisis
Una definición de aprendizaje
Observaciones naturalistas versus experimentales
El experimento de aprendizaje fundamental
El problema del control en los estudios del aprendizaje
El enfoque de proceso general para el estudio del aprendizaje
El uso de participantes no humanos en la investigación sobre el aprendizaje
Resumen
Términos técnicos
2. La estructura del comportamiento incondicionado
Modelado y homogéneo versus heterogéneo
Sustratos del comportamiento
El concepto del reflejo
Formas complejas de comportamiento provocado
Patrones de acción modal
Estímulos de signos
La organización de la conducta provocada
Factores motivacionales
Comportamiento apetecible y consumatorio
Sistemas de comportamiento
Resumen
Lecturas sugeridas
Página 8
Términos técnicos
3. Habituación y sensibilización
Efectos de la presentación repetida de una provocación
Estímulo
Características de los efectos de la habituación
Características de los efectos de sensibilización
La teoría del proceso dual de habituación y sensibilización
El sistema S – R y el sistema estatal
Implicaciones de la teoría del proceso dual
Resumen
Lecturas sugeridas
Términos técnicos
4. Condicionamiento pavloviano: conceptos básicos
Campana proverbial de Pavlov
Situaciones de condicionamiento contemporáneas
Acondicionamiento apetitivo
Condicionamiento aversivo o por miedo
La naturaleza de la respuesta condicionada
Modificaciones condicionadas de la respuesta incondicionada
Factores de estímulo en el condicionamiento clásico
Novedad de CS y efecto de inhibición latente
Relevancia y asociaciones selectivas de CS a EE. UU.
El problema de control en el condicionamiento pavloviano
Prevalencia del condicionamiento pavloviano
Resumen
Lecturas sugeridas
Términos técnicos
5. Relaciones de estímulo en el condicionamiento pavloviano
Relación temporal entre CS y EE. UU.

Procedimientos de acondicionamiento comunes
Efectos del intervalo CS-EE. UU.
Codificación temporal de cuándo ocurre en EE. UU.
Relación de señales entre CS y EE. UU.
Página 9
El efecto de bloqueo
Contingencia CS – EE. UU.
Relaciones de orden superior en el condicionamiento pavloviano:
Inhibición condicionada
Procedimientos de acondicionamiento inhibitorio
Medición del comportamiento de la inhibición condicionada
Facilitación condicionada
Asociaciones aprendidas en un procedimiento de facilitación condicionado
Resumen
Lecturas sugeridas
Términos técnicos
6. Mecanismos y teorías del condicionamiento pavloviano
¿Qué se aprende en el condicionamiento pavloviano?
¿Cómo se aprenden las asociaciones pavlovianas?
El modelo Rescorla-Wagner
Modelos atencionales de condicionamiento
Factores temporales y respuesta condicionada
La hipótesis del comparador
Resumen
Lecturas sugeridas
Términos técnicos
7. Condicionamiento instrumental u operante
Las tradiciones de Thorndike y Skinner
Consideraciones metodológicas
El aprendizaje inicial de un instrumental u operante
Respuesta
Aprender hacia dónde y para qué correr
Construyendo nuevas respuestas a partir de componentes familiares
Dar forma a nuevas respuestas
La importancia del refuerzo inmediato
Mecanismos asociativos en el condicionamiento instrumental
La Asociación R – O
La Asociación S – R y la Ley de Efecto de Thorndike
Página 10
La Asociación S – O
La Asociación S (R – O)
Implicaciones de las limitaciones biológicas en instrumentos
Acondicionamiento
Implicaciones para los mecanismos neuronales de instrumental
Acondicionamiento
Resumen
Lecturas sugeridas
Términos técnicos
8. Horarios de refuerzo
El récord acumulativo
Horarios simples de refuerzo
Horarios de proporciones
Horarios de intervalos
Mecanismos de ejecución del cronograma
Funciones de retroalimentación para programas de relación
Funciones de retroalimentación para horarios de intervalos
Funciones de retroalimentación y rendimiento del programa
Horarios concurrentes
Programaciones de cadena concurrente y autocontrol
Resumen
Lecturas sugeridas
Términos técnicos
9. Teorías del refuerzo
Thorndike y la ley del efecto
Teoría de reducción del casco y la transmisión
Refuerzos primarios
Reforzadores secundarios y propulsores adquiridos
Refuerzo sensorial
El principio de Premack
La revolución de Premack
Aplicaciones del principio de Premack
Problemas teóricos
Página 11
La hipótesis de la respuesta a la privación

Respuesta a la privación y la ley del efecto
Privación de respuesta y probabilidad de respuesta
La privación de respuesta y el lugar de refuerzo
Efectos
Asignación de respuestas y economía del comportamiento
Imponer una contingencia instrumental
Responder a las restricciones de programación
Contribuciones de la asignación de respuesta y el comportamiento
Ciencias económicas
Resumen
Lecturas sugeridas
Términos técnicos
10. Extinción de la conducta condicionada
Efectos de los procedimientos de extinción
Extinción y aprendizaje original
Recuperacion espontanea
El efecto de renovación
Restablecimiento de la excitación condicionada
Mejora del rendimiento de la extinción
Efectos de recompensa "paradójicos" en la extinción
Efecto de extinción por sobreentrenamiento
Magnitud del efecto de extinción de refuerzo
Efecto de extinción de refuerzo parcial
Mecanismos del efecto de extinción por refuerzo parcial
Resumen
Lecturas sugeridas
Términos técnicos
11. Castigo
Castigo efectivo e ineficaz
Cuando el castigo falla
Cuando el castigo triunfa
Evidencia de investigación sobre el castigo
Contingencia de respuesta-reforzador
Pagina 12
Contigüidad respuesta-reforzador
Intensidad del estímulo aversivo
Castigo señalado
El castigo y los mecanismos que mantienen al castigado
Respuesta
Castigo y refuerzo de conductas alternativas
Efectos paradójicos del castigo
¿Podemos y debemos crear una sociedad libre de castigos?
Alternativas al castigo abusivo
Se acabó el tiempo
Refuerzo diferencial de otras conductas
Resumen
Lecturas sugeridas
Términos técnicos
12. Aprendizaje de evitación
Preguntas dominantes en el análisis de la evitación
Aprendiendo
Orígenes del estudio del aprendizaje por evitación

Procedimientos contemporáneos de acondicionamiento de evitación
Evitación discriminada
Evitación no discriminada o libre
Teoría de la evitación de dos factores
Evidencia consistente con la teoría de dos factores
Evidencia contraria a la teoría de los dos factores
Señales temporales condicionadas en el aprendizaje de evitación
Aprendizaje sobre señales de seguridad y evitación
Extinción de la conducta de evitación
Evitación del aprendizaje y defensiva incondicionada
Comportamiento
Reacciones de defensa específicas de especies
El continuo de la inminencia depredadora
Resumen
Lecturas sugeridas
Términos técnicos
Página 13
13. Control de estímulo de la conducta

Medición del control de estímulos
Gradientes de generalización de estímulos
Generalización de estímulos y discriminación de estímulos
Conceptos contrastantes de la generalización de estímulos
Determinantes del control de estímulos: sensorial y
Variables motivacionales
Capacidad sensorial
Orientación sensorial
Intensidad o prominencia del estímulo
Factores motivacionales
Determinantes del control de estímulos: factores de aprendizaje
Condicionamiento pavloviano e instrumental
Capacitación sobre discriminación por estímulo
Múltiples programas de refuerzo
Determinantes de la precisión del control de estímulos
Discriminaciones interdimensionales versus intradimensionales
Entrenamiento de equivalencia de estímulo
Resumen
Lecturas sugeridas
Términos técnicos
14. Mecanismos de memoria
Etapas del procesamiento de la información
El procedimiento de emparejamiento con la muestra
Emparejamiento simultáneo versus retardado con la muestra
Controles de procedimiento para la memoria
Tipos de memoria
Referencia y memoria de trabajo

Decadencia de seguimiento frente a procesos de memoria activa
Memoria retrospectiva versus memoria prospectiva
Fuentes de fallas de memoria
Efectos de interferencia
Error de recuperación
Consolidación, reconsolidación y actualización de la memoria
Página 14
Resumen
Lecturas sugeridas
Términos técnicos
GLOSARIO
REFERENCIAS
SOBRE EL AUTOR
Página 15
Prefacio
El acondicionamiento y el aprendizaje son temas centrales que han dado forma a nuestra forma de pensar
e investigar problemas en muchas áreas de la psicología y disciplinas afines. los
El propósito de este libro es proporcionar un resumen conciso, actual y sofisticado.
de los fundamentos de acondicionamiento y aprendizaje para estudiantes y profesionales en
esas áreas.
Aunque este campo de acondicionamiento y aprendizaje tiene más de 100 años,
continúan haciéndose nuevos descubrimientos y nuevas aplicaciones de la investigación básica
seguir siendo explorado para resolver los principales problemas clínicos, como el tratamiento
de miedos y fobias, el desarrollo de procedimientos de entrenamiento para el autismo
Trastorno del espectro y discapacidades del desarrollo, y el tratamiento de la drogadicción.
adicción y otras formas de comportamiento compulsivo. Investigaciones recientes han llevado a
descripción más completa de los efectos del condicionamiento instrumental,
incluido el análisis económico de los efectos del condicionamiento instrumental. Considerable
También se han logrado nuevos avances en la investigación básica sobre el condicionamiento pavloviano,
extinción, consolidación de la memoria y reconsolidación de la memoria. Este libro
proporciona un resumen conciso y muy accesible de estas nuevas perspectivas.
Los conceptos de condicionamiento y aprendizaje se utilizan con frecuencia en la
neurociencias, psicología del desarrollo, psicofarmacología y
psicología comparada. Los investigadores en estas áreas están interesados en cómo
Los organismos no verbales aprenden, procesan y recuerdan información. Investigaciones
del aprendizaje y la cognición en sujetos no verbales invariablemente requieren el uso
acondicionamiento de procedimientos de alguna manera. Psicólogos del desarrollo, por
Por ejemplo, utilizan con frecuencia procedimientos de habituación y acondicionamiento instrumental para
estudiar la cognición infantil. Los programas de neurociencia a menudo incluyen un "núcleo conductual"
que se dedica a recopilar datos de comportamiento sobre el aprendizaje y la memoria para
complementar los datos de niveles de análisis más moleculares. Un objetivo importante de este
El libro es proporcionar un fácil acceso a los "elementos esenciales" del acondicionamiento y el aprendizaje.
para estudiantes y científicos que utilizan estos procedimientos y conceptos en su propio
Areas de especialización.
Los procedimientos básicos de habituación, condicionamiento clásico e instrumental
el acondicionamiento son familiares para muchos estudiantes y profesionales. Sin embargo, nuestro
La comprensión de estos procedimientos ha cambiado drásticamente en las últimas décadas,
Página 16
y como resultado, muchas presunciones comunes sobre el aprendizaje ya no son válidas.

¿Sabías, por ejemplo, que
La contigüidad entre un estímulo condicionado y uno incondicionado es
¿Ni necesario ni suficiente para el condicionamiento pavloviano?
En muchos casos, el resultado más importante del condicionamiento pavloviano es cómo
cambia las respuestas del organismo al estímulo incondicionado en lugar de
que el desarrollo de una nueva respuesta a un estímulo condicionado?
El condicionamiento instrumental no "fortalece" el instrumental
¿respuesta?
Los procedimientos de extinción dejan gran parte de la estructura asociativa de
comportamiento instrumental intacto?
¿El no recordar algo rara vez se debe al olvido?
Las memorias consolidadas no son permanentes, pero pueden cambiarse cuando se
se reactivan o recuperan?
Los estudios de los mecanismos básicos de condicionamiento se han movido fuertemente hacia el
neurociencias, con numerosos investigadores que estudian las bases neurales de
condicionamiento y aprendizaje. Sin embargo, no se pueden examinar los mecanismos neuronales.
de aprender sin estar bien informado sobre el condicionamiento y el aprendizaje
procedimientos y fenómenos a nivel de comportamiento. Algunos estudiantes de posgrado y
Los científicos de las neurociencias han tenido poca o ninguna formación en comportamiento
técnicas. Otros sólo están familiarizados con la pequeña cantidad de
técnicas que son pertinentes para los experimentos en los que están trabajando. Tal
el conocimiento limitado les impide lograr una visión más completa
de cómo el comportamiento se relaciona con los mecanismos neuronales. También limita su investigación.
a un número notablemente pequeño de procedimientos de aprendizaje. Este libro está destinado a
abordar este problema exponiendo a estos científicos al menos a los "elementos esenciales" de
condicionamiento y aprendizaje.
Los estudiantes (y profesionales) de psicología clínica y del desarrollo se enfrentan
desafíos similares. Estos investigadores también se basan en el condicionamiento y el aprendizaje.
procedimientos, pero su conocimiento a menudo se limita a procedimientos específicos, sin
comprender el contexto intelectual más amplio para esos procedimientos o
análisis teóricos contemporáneos de esos fenómenos. Una exposición tan limitada
al campo del condicionamiento y el aprendizaje en su conjunto impide que estos investigadores
de aprovechar al máximo los procedimientos de acondicionamiento para avanzar en sus áreas de investigación.
Por ejemplo, la terapia "estándar" para superar los miedos patológicos y
fobias implica alguna forma de extinción. La extinción es una de las más emocionantes
Página 17
áreas de investigación contemporánea en condicionamiento y aprendizaje, con numerosas nuevas

técnicas y perspectivas descubiertas en los últimos años. Sin embargo, pocos de estos tienen
se abrió camino en el plan de estudios de psicología clínica.
Otra área que está estrechamente relacionada con los estudios de condicionamiento y aprendizaje es
Análisis de comportamiento aplicado, que se originó en estudios de condicionamiento operante.
realizado por BF Skinner y sus descendientes intelectuales. Desafortunadamente,
Desde su surgimiento como un campo separado, el análisis de comportamiento aplicado no ha
mantuvo fuertes vínculos con la ciencia básica en la que se fundó. Para
Por ejemplo, muchas caracterizaciones del condicionamiento pavloviano en textos sobre aplicaciones
el comportamiento está seriamente desactualizado. Al hacer que las perspectivas contemporáneas
disponible en un formato breve y accesible, este libro puede animar a actualizar el
Raíces científicas del análisis de comportamiento aplicado.
Este libro puede servir como texto principal para un curso introductorio sobre
condicionamiento y aprendizaje. También puede servir como texto complementario para cursos de
neurociencia, psicología clínica, análisis de comportamiento aplicado, desarrollo
psicología y psicofarmacología.
las bases para un curso avanzado,Por último, el librocon
complementado se puede utilizar
artículos para proporcionar
de revistas y
otras lecturas asignadas. Para facilitar eso, cada capítulo termina con una lista de
lecturas sugeridas.
Como recurso adicional para los profesores, también he elaborado un
sitio web complementario con diapositivas de PowerPoint de muestra, preguntas de cuestionario y más
(ver http://pubs.apa.org/books/supp/domjan ).
Al preparar este libro, fui guiado por mis alumnos, quienes me han alentado
durante los últimos 45 años para seguir buscando formas de explicar conceptos más
simple y directamente. Esta cuarta edición incluye actualizaciones y aclaraciones del
texto que es demasiado numeroso para enumerarlo. También incluye numerosas referencias nuevas y
lecturas sugeridas.
Me gustaría agradecer a Chris Kelaher, Beth Hatch y a todos los demás en el
Asociación Americana de Psicología que trabajó en el libro con gran
profesionalismo y entusiasmo. También me gustaría agradecer a mi esposa, Deborah.
Stote, por su firme apoyo.
Página 19
18
Sabía usted que

el aprendizaje puede resultar en un aumento o una disminución en
respondiendo?
El aprendizaje puede no ser evidente en las acciones de un
¿organismo? Es posible que se requieran procedimientos de prueba especiales para ver
evidencia de aprendizaje.
el aprendizaje puede ser investigado a nivel de comportamiento, neuronal
circuitos y sistemas de neurotransmisores, o neuronas individuales
y sus sinapsis?
el aprendizaje es una causa de cambio de comportamiento? Por lo tanto, aprender
sólo se puede investigar con métodos experimentales que
identificar variables causales.
Los procedimientos de control son tan importantes en los estudios del aprendizaje como
entrenamiento o procedimientos experimentales?
La obtención de conocimientos es de gran interés porque es el medio principal por el cual

Los organismos hacen ajustes a largo plazo en su comportamiento para mejorar
en sintonía con el mundo en el que viven. El aprendizaje requiere flexibilidad en la forma de
responde al medio ambiente y por lo tanto se consideró evidencia de
inteligencia de Darwin y otros psicólogos comparativos tempranos (Darwin,
Página 20
1897; Romanes, 1882). Los científicos contemporáneos estudian el aprendizaje para obtener conocimientos
en cómo los mecanismos del comportamiento son alterados por la experiencia. Aprendiendo
Los procedimientos se utilizan a menudo en estudios clínicos, de desarrollo y cognitivos.
psicología, así como neurociencia del comportamiento y psicofarmacología.
El aprendizaje es una característica generalizada del comportamiento humano y es evidente en muchos
también otras especies animales. Se ha encontrado en criaturas tan diversas como la fruta.
moscas, babosas marinas, abejas, roedores, pájaros y monos. Por tanto, el aprendizaje es uno de
las características fundamentales del comportamiento.
Características fundamentales del aprendizaje

Las personas aprenden a reconocer a los amigos como diferentes a los extraños. Ellos aprenden como
sostener un teléfono y cómo contestarlo cuando suena o vibra. Ellos tambien aprenden
nadar, andar en bicicleta y evitar pisar baches. En todos estos casos,
el aprendizaje se identifica por un cambio en el comportamiento. Un nadador experimentado o
El ciclista se comporta de manera muy diferente a alguien que no ha aprendido a nadar o
Montar en bicicleta.
Aprender a nadar o andar en bicicleta implica aprender nuevas manos, piernas y
movimientos corporales y la coordinación de estos movimientos para lograr el equilibrio y
locomoción hacia adelante. Muchos, pero no todos, los casos de aprendizaje involucran la
adquisición de nuevas respuestas. También aprendemos a no hacer ciertas cosas. Niños
aprender a guardar silencio en la iglesia, a quedarse quieto cuando lo examina un médico, y
para no correr a la calle sin antes mirar para ver si es seguro. Aprendiendo a
inhibir o reprimir el comportamiento es a menudo tan importante como aprender nuevas respuestas.
Andar en bicicleta, por ejemplo, requiere aprender a pedalear y aprender a no
inclinarse demasiado hacia un lado o hacia el otro. Por tanto, el cambio de comportamiento que
utilizado para identificar el aprendizaje puede ser un aumento o una disminución en un particular
respuesta.
APRENDIZAJE Y OTRAS FORMAS DE CAMBIO DE COMPORTAMIENTO

Aunque todo el aprendizaje se identifica por algún tipo de cambio en el comportamiento, no todos
las instancias en las que se altera la conducta son instancias de aprendizaje (ver Figura 1.1 ).
Por lo tanto, es importante distinguir el aprendizaje de otras fuentes de comportamiento.
cambio.
Página 21
FIGURA 1.1
Posibles mecanismos que pueden resultar en cambios de comportamiento. Tenga en cuenta que el aprendizaje es solo
una de las varias fuentes posibles de cambio de comportamiento.
Una característica importante del aprendizaje que lo hace diferente de otras formas de
El cambio de comportamiento es que el aprendizaje es relativamente duradero. Esto sirve para
distinguir el aprendizaje de varios cambios de comportamiento a corto plazo o temporales.
La fatiga y la somnolencia pueden provocar grandes cambios de comportamiento generalizados.
(muchas de sus acciones se vuelven más lentas y menos vigorosas). Sin embargo, tal
los cambios son temporales y pueden revertirse con un buen descanso. Importante a corto plazo
Los cambios en el comportamiento también pueden ser causados por cambios en la motivación . Por ejemplo,
las personas son mucho más reactivas a los estímulos relacionados con la comida cuando tienen hambre
que después de una buena comida. Los cambios en las condiciones de estímulo también pueden causar
cambios de comportamiento generalizados pero a corto plazo. Si te mete una piedra en el zapato,
Página 22
Es probable que la incomodidad cambie la forma en que camina y puede alentarlo a

deténgase y vacíe su zapato. Pero es probable que la interrupción sea de corta duración; usted
reanudará su marcha habitual una vez que se retire la piedra. Aprender, por el contrario,
implica cambios a más largo plazo. La suposición es que una vez que se aprende algo,
será recordado por un período sustancial de tiempo. Por ejemplo, no eres
considera haber aprendido un nuevo concepto discutido en clase si no puede
recuérdalo al día siguiente.
Aunque el aprendizaje implica cambios duraderos en el comportamiento, no todos los
los cambios se deben al aprendizaje. Los cambios de comportamiento a largo plazo también pueden ser
producido por el crecimiento físico o la maduración . Los niños se vuelven más hábiles en
levantar objetos pesados y alcanzar un tarro de galletas en un estante alto a medida que envejecen.
Estos cambios son el resultado del crecimiento físico y la maduración más que del aprendizaje.
Los cambios de comportamiento debidos al aprendizaje y los cambios debidos a la maduración pueden ser
interrelacionados y difíciles de distinguir. A medida que un niño se vuelve más fuerte y más alto
con la edad, estos cambios madurativos facilitan el aprendizaje de nuevas habilidades.
Sin embargo, una diferencia importante entre el aprendizaje y la maduración es que
La maduración no requiere práctica con cosas específicamente relacionadas con la habilidad.
que se está adquiriendo. Un niño será más capaz de alcanzar estantes altos a medida que
ella envejece, ya sea que alguna vez practique o no alcanzar las cookies. La práctica es
no es necesario para la maduración, pero es necesario para el aprendizaje.
La práctica es obviamente necesaria para aprender una habilidad como nadar o montar
bicicleta. Uno no puede convertirse en un ciclista experto sin una amplia práctica.
con pedaleo, dirección y equilibrio. Se pueden aprender otras cosas muy rápidamente.
Un niño aprenderá a no tocar un leño ardiendo en una chimenea después de solo una dolorosa
encuentro. Independientemente de la cantidad de práctica involucrada, sin embargo, todo aprendizaje
Requiere alguna práctica o experiencia específicamente relacionada con el adquirido
comportamiento.
Otra diferencia entre la maduración y el aprendizaje es que el mismo
El proceso de maduración puede producir cambios de comportamiento en una variedad de situaciones.
A medida que un niño crece, podrá alcanzar estantes más altos, trepar a árboles más altos,
y atrapar mariposas que vuelan más alto del suelo. En contraste, el comportamiento
los cambios debidos al aprendizaje se limitan más a la respuesta practicada. Aprendiendo a
operar una estufa de cocina le ayudará a cocinar en el interior, pero no mejorará su
habilidad para hacer fuego para cocinar en un viaje de campamento. Esto no quiere decir que
aprender sobre una cosa no puede ayudarlo a hacer otra. Algunos
Puede ocurrir una generalización del aprendizaje. Sin embargo, la generalización del aprendizaje tiende
ser limitado. Lo que aprendes en una situación solo se generaliza a otras similares.
Página 23
situaciones. Por ejemplo, aprender a operar una estufa de gas en particular mejorará
su capacidad para trabajar con otras estufas similares, pero es posible que no ayude si está tratando de
Cocine con un horno de microondas.
Otro tipo de cambio a largo plazo que debe distinguirse del aprendizaje
es el cambio debido a la evolución . La evolución puede cambiar no solo los atributos físicos
de los organismos, sino también de su comportamiento. Además, los cambios evolutivos, como
aprendizaje, son el resultado de interacciones con el medio ambiente. Sin embargo,
Los cambios evolutivos ocurren a través de generaciones. Por el contrario, el aprendizaje crea
Cambios en el comportamiento mucho más rápidamente durante la vida de un individuo.
organismo.
Aunque el aprendizaje se distingue claramente de la evolución, el aprendizaje no es
duda el producto de procesos evolutivos. Considerando lo penetrante que es el aprendizaje
está en el reino animal, es seguro asumir que ha evolucionado en particular
nichos ambientales porque los organismos con la capacidad de aprender son más
exitoso en producir descendencia en esos entornos (Domjan, Mahometa, &
Matthews, 2012). La mayor aptitud reproductiva de los individuos con capacidad
aprender aumenta la probabilidad de que sus genes (y las bases genéticas de
aprendizaje) se transmitirá a las generaciones futuras. Este proceso evolutivo
produce cambios en los mecanismos de comportamiento de una generación a la
Siguiente. El aprendizaje, por el contrario, implica cambios en el comportamiento durante la
propia vida.
APRENDIZAJE, RENDIMIENTO Y NIVELES DE ANÁLISIS

Que se ha producido el aprendizaje sólo puede determinarse observando un cambio en
comportamiento; el cambio, sin embargo, solo puede ser evidente en condiciones especiales
circunstancias. Un estudiante de física, por ejemplo, puede no ser capaz de proporcionar un
definición adecuada de un quark, lo que sugiere que no ha aprendido el concepto.
Sin embargo, el mismo estudiante puede elegir la definición correcta de un
lista de posibilidades alternativas. Los niños pueden aprender muchas cosas sobre cómo conducir un
coche mirando a los adultos conducir. Pueden aprender lo que hace el volante y
Cuáles son las funciones del acelerador y los pedales de freno. Sin embargo, pueden mostrar
no hay evidencia de este conocimiento hasta que tengan la edad suficiente para tomar lecciones de manejo.
Estos ejemplos ilustran que el aprendizaje puede ser conductualmente silencioso, sin
Manifestación conductual visible. En tales casos, se deben utilizar procedimientos especiales.
para determinar lo que ha aprendido el individuo.
El aprendizaje puede no ser evidente en las acciones de un organismo para una variedad de
Página 24
razones. Una posibilidad es que lo que se aprende sea una relación entre estímulos
o eventos en el medio ambiente en lugar de una respuesta particular. Por ejemplo, nosotros
Puede aprender a asociar el color rojo con las fresas maduras. El aprendizaje de un
La asociación entre dos estímulos se llama aprendizaje de estímulo-estímulo , o SS
aprendiendo. Una asociación aprendida entre rojo y madurez no se reflejará en
lo que hacemos a menos que se nos asigne una tarea especial, como juzgar la madurez de
fresas según su color. El aprendizaje de SS generalmente no es evidente en el
acciones de un organismo a menos que se utilicen procedimientos de prueba especiales.
Las cosas que hace un individuo, las acciones observables de una persona, son colectivamente
referido como rendimiento . El rendimiento depende de muchas cosas, incluidas
motivación y las condiciones de estímulo u oportunidades de comportamiento proporcionadas por
el entorno. El aprendizaje es solo uno de los muchos factores que determinan
rendimiento. Puede que seas un excelente flautista, pero si no tienes el
oportunidad o la inclinación a tocar la flauta, nadie podrá decir qué
músico consumado eres.
Describo una serie de formas conductualmente silenciosas de condicionamiento y
aprender en los siguientes capítulos. Ejemplos de aprendizaje conductual silencioso
sugieren que el aprendizaje no se puede equiparar con un cambio de comportamiento. Bastante,
el aprendizaje implica un cambio en el potencial de hacer algo.
¿Dónde reside el cambio en el potencial de acción? El comportamiento es el
producto del sistema nervioso. Por tanto, el aprendizaje implica cambios duraderos.
en los mecanismos neuronales del comportamiento. De hecho, los primeros neurocientíficos, como Ivan
Pavlov, consideró los estudios conductuales del aprendizaje como estudios de cómo
funciona el sistema nervioso. Pavlov consideró los procedimientos de aprendizaje como técnicas para
la investigación de la función neural.
Debido a que el aprendizaje implica cambios en el sistema nervioso, puede ser
investigado en una variedad de niveles de análisis (ver Figura 1.2). Podemos estudiar
aprendizaje a nivel de cambios moleculares en las células nerviosas (o neuronas), y su
conexiones (o sinapsis). También podemos estudiar el aprendizaje a nivel de neural
sistemas, como sistemas de neurotransmisores y circuitos neuronales. Finalmente, podemos
Estudiar el aprendizaje a nivel de cambios en el comportamiento de organismos intactos.
FIGURA 1.2
Página 25
Niveles de análisis del aprendizaje. Los mecanismos de aprendizaje pueden investigarse en el

nivel organísmico, a nivel de circuitos neuronales y sistemas transmisores, y a nivel
de las células nerviosas (neuronas) y sus sinapsis.
Históricamente, los estudios del aprendizaje comenzaron a nivel del organismo intacto,
y el aprendizaje se ha investigado más extensamente a nivel conductual.
Sin embargo, con los recientes avances en las neurociencias, conceptos y términos que
han sido desarrollados para el análisis conductual del aprendizaje también han sido
aplicado a investigaciones a nivel de circuitos neurales y neurotransmisores
sistemas, así como a nivel celular y molecular. De hecho, los estudios de la
Los mecanismos neuronales del aprendizaje representan una de las mayores áreas de
investigación contemporánea en el aprendizaje. Un gran desafío en los próximos años será
ser integrar el conocimiento de los estudios de aprendizaje que se concentran en diferentes
niveles de análisis. Comprender cómo ocurre el aprendizaje a nivel conductual es
fundamental para esta integración (Delamater & Lattal, 2014). Este libro describe el
análisis conductual del aprendizaje.
UNA DEFINICIÓN DE APRENDIZAJE

Identifiqué una serie de características del aprendizaje en la discusión anterior.
El aprendizaje implica un cambio en los mecanismos potenciales o neuronales de la conducta.
Este cambio es relativamente duradero y es el resultado de la experiencia con

eventos ambientales específicamente relacionados con el comportamiento en cuestión. Estas
Las características se combinan en la siguiente definición:
Página 26
El aprendizaje es un cambio relativamente duradero en el potencial de participar en

un comportamiento particular que resulta de la experiencia con el medio ambiente
eventos relacionados específicamente con ese comportamiento.
Observaciones naturalistas versus experimentales

El comportamiento ocurre de muchas formas y en muchas situaciones. Básicamente, sin embargo, solo
Hay dos enfoques disponibles para el estudio del comportamiento, observaciones naturalistas
y observaciones experimentales. Las observaciones naturalistas implican observar y
medir el comportamiento tal como ocurre en condiciones naturales, en ausencia de
intervenciones o manipulaciones introducidas por el investigador. A diferencia de,
Las observaciones experimentales implican medir el comportamiento en condiciones
diseñado específicamente por el investigador para probar factores o variables particulares
que podría influir en el aprendizaje o el desempeño de la conducta.
Considere, por ejemplo, las actividades relacionadas con la búsqueda de alimentos por árbol.
ardillas La búsqueda de alimento se puede investigar mediante observaciones naturalistas. Uno
podría ver ardillas en un parque, por ejemplo, y contar con qué frecuencia recogían
una semilla, con qué frecuencia comieron la semilla de inmediato y con qué frecuencia enterraron la semilla
semilla para su posterior recuperación. Hacer tales observaciones a lo largo del día y a lo largo
temporadas proporcionaría información detallada sobre el comportamiento de búsqueda de
ardillas en ese parque. Sin embargo, tales observaciones no revelarían por qué la
las ardillas hicieron lo que hicieron. Observar a las ardillas sin ser molestadas no puede decirnos por qué
seleccionan un tipo de semilla en lugar de otro, por eso dedican más esfuerzo a
buscar alimento durante una parte del día que en otra, o por qué comen algunas semillas
de inmediato y enterrar a otros para comer más tarde. Las observaciones naturalistas no pueden proporcionar
respuestas a preguntas que investigan las causas del comportamiento. Ellos pueden ayudarnos
formular preguntas o hipótesis sobre por qué los animales hacen ciertas cosas, pero
Las observaciones naturalistas no pueden identificar variables causales.
Las causas del comportamiento solo se pueden descubrir mediante métodos experimentales.
Las observaciones experimentales requieren que el investigador manipule
medio ambiente de formas especiales que faciliten llegar a una conclusión causal. Utilizando
observaciones naturalistas, puede encontrar que las ardillas entierran más semillas en el otoño
que en el invierno. ¿Qué podría causar este resultado? Una posibilidad es que más
las semillas están disponibles en otoño que en invierno. Podríamos probar esta posibilidad al
comparando ardillas bajo dos condiciones diferentes. Bajo una condición, el
a las ardillas se les proporcionaría un exceso de comida esparciendo muchos cacahuetes en la
Página 27
zona de observación. Bajo la segunda condición, las ardillas no serían

provisto de cacahuetes adicionales. En todos los demás aspectos relevantes, las condiciones de prueba
sería lo mismo. La temperatura, los cambios de luz diurna de un día a otro y la
la extensión del follaje en los árboles sería idéntica. Dadas estas condiciones idénticas,
si las ardillas enterraran más semillas cuando la comida era abundante que cuando la comida era
escasa, podríamos concluir que el exceso de comida favorece o provoca el enterramiento de
semillas.
Aunque las observaciones experimentales nos permiten sacar conclusiones sobre la
causas del comportamiento, es importante darse cuenta de que no se pueden observar
directamente. Más bien, las causas deben inferirse de las diferencias en el comportamiento observado.
bajo diferentes condiciones experimentales. Cuando llegamos a la conclusión de que el exceso de comida
causa el enterramiento de semillas, no estamos describiendo algo que en realidad
observado. Lo que vimos en nuestro hipotético experimento es que las ardillas entierran
más semillas cuando la comida es abundante que cuando la comida es escasa. La conclusión de que
el exceso de comida causa el enterramiento de semillas es una inferencia a la que se llega comparando los dos
condiciones experimentales. Las conclusiones causales son inferencias basadas en un
comparación de dos (o más) condiciones experimentales.
Las observaciones naturalistas incontroladas pueden proporcionar una gran cantidad de descripciones
información sobre el comportamiento. Hemos aprendido mucho de los naturalistas
observaciones sobre la búsqueda de comida, el cortejo y el comportamiento sexual,
comportamiento, comportamiento de los padres y comportamiento defensivo y territorial. Considerando
que el aprendizaje es, en última instancia, también evidente en el comportamiento de los seres humanos y otros
animales, uno podría suponer que las técnicas de observación también pueden ser útiles en
el estudio del aprendizaje. De hecho, algunos han abogado por que las investigaciones detalladas de
El aprendizaje debe comenzar con observaciones naturalistas de los fenómenos de aprendizaje.
(Miller, 1985). Sin embargo, las observaciones naturalistas son inherentemente inadecuadas para
estudios de aprendizaje porque no pueden identificar variables causales.
El experimento de aprendizaje fundamental

Un aspecto crítico de la definición desarrollada en este capítulo es que el aprendizaje es un
resultado de experiencias pasadas. Como tal, el aprendizaje es una variable causal, una que
implica experiencia pasada con eventos ambientales relevantes. Para concluir que
aprendizaje ha ocurrido, tenemos que estar seguros de que el cambio de comportamiento que estamos
ver es causado por la experiencia pasada.
Como señalé anteriormente, las causas no se pueden observar directamente. En cambio, tienen que
Página 28
inferirse de observaciones experimentales. Esta idea tiene profundas implicaciones

para el estudio del aprendizaje. Dado que el aprendizaje es una variable causal, no se puede
observado directamente. Más bien, el aprendizaje sólo puede investigarse por medio de
manipulaciones experimentales que sirven para aislar una experiencia pasada específica como
causa de un cambio de comportamiento.
Concluir que un cambio en el comportamiento se debe a una experiencia pasada específica, o
aprendizaje, uno tiene que comparar individuos con y sin esa experiencia bajo
por lo demás circunstancias idénticas. La experiencia pasada específica es la
variable independiente (IV), y el cambio resultante en el comportamiento es la variable dependiente
variable (DV). Considere, por ejemplo, el hecho de que la mayoría de los niños de 8 años pueden
andar en bicicleta con destreza, mientras que los niños de 3 años no pueden. Un razonable
La interpretación es que los niños mayores son jinetes expertos porque han tenido
más tiempo para practicar la equitación. Es decir, el cambio de comportamiento de 3 a 8 años de
la edad puede deberse a la experiencia con las bicicletas. Para apoyar esta conclusión, es
no es suficiente para señalar el hecho de que los niños de 8 años son mejores ciclistas que los de 3 años.
Tal diferencia podría deberse al crecimiento físico y la maduración. Tampoco es
convincente señalar que los niños de 8 años pasan más tiempo en bicicleta que los de 3
años porque esto puede ser un efecto más que una causa de la mayor habilidad de
Niños de 8 años. Se debe realizar algún tipo de experimento para demostrar que
la conducción competente es el resultado de experiencias o aprendizajes pasados.
Una forma de demostrar que andar en bicicleta es una habilidad aprendida sería realizar
un experimento con niños de 3 años que nunca han montado en bicicleta. Nosotros
podría asignar a los niños al azar a uno de dos grupos de tratamiento: un
grupo experimental y un grupo de control. El grupo experimental recibiría
tres lecciones de una hora sobre andar en bicicleta. Este sería el IV. El grupo de control
también recibirían tres lecciones de 1 hora a través de las cuales se convertirían en
familiarizado con las bicicletas. Sin embargo, los niños del grupo de control no serían
enseñado a montar. Más bien, se les informaría sobre las diversas partes de una bicicleta y
cómo encajan las piezas. Al final de las lecciones, ambos grupos de niños
se pondría a prueba su habilidad para montar. La competencia en andar en bicicleta sería
el DV. Si se aprende la conducción competente a través de la práctica pertinente, entonces los niños
en el grupo experimental debe ser más competente que los niños en el
grupo de control.
El ejemplo anterior ilustra el experimento de aprendizaje fundamental (ver
Figura 1.3, panel izquierdo). Para concluir que un cambio de comportamiento es el resultado del aprendizaje,
tenemos que comparar el comportamiento de los individuos bajo dos condiciones. En el
condición experimental , a los participantes se les proporciona la información
Página 29
experiencia o formación medioambiental. En la condición de control , los participantes

no reciben la formación correspondiente, pero son tratados de forma idéntica en todos los demás aspectos.
La ocurrencia del aprendizaje se infiere de una comparación entre los dos
condiciones. No se puede concluir que el aprendizaje haya ocurrido observando solo
individuos que han adquirido la habilidad de interés. Más bien, conclusiones sobre
el aprendizaje requiere una comparación entre las condiciones experimentales y de control.
FIGURA 1.3
Dos versiones del experimento de aprendizaje fundamental. En el panel de la izquierda, dos grupos de
se comparan los individuos. El procedimiento de formación se proporciona a los participantes en el
grupo experimental pero no para los participantes del grupo de control. En el panel derecho, un
se observa a un solo individuo antes y durante el entrenamiento. El comportamiento del individuo durante
el entrenamiento se compara con lo que suponemos que habría sido su comportamiento sin entrenamiento.
EL PROBLEMA DE CONTROL EN ESTUDIOS DE APRENDIZAJE

¿Hay alguna consecuencia especial porque el aprendizaje solo se puede inferir de un
comparación entre individuos con un historial de entrenamiento particular y otros que
¿Falta esa historia? Sí, claro. Una consecuencia importante es que el aprendizaje
no se puede investigar utilizando observaciones naturalistas. Bajo natural
Circunstancias, los individuos con un historial de entrenamiento particular a menudo difieren en un
número de respetos de personas que no tienen la misma historia.
Por lo tanto, los requisitos del experimento de aprendizaje fundamental no son
satisfecho en circunstancias completamente naturales.
Una segunda consecuencia importante del hecho de que el aprendizaje requiere
Página 30
comparar una condición experimental con una condición de control es que el control
El procedimiento debe diseñarse con tanto cuidado como el procedimiento experimental. En
De hecho, algunas contribuciones históricas al estudio del aprendizaje no provienen de
análisis de procedimientos experimentales para producir aprendizaje, sino a partir de análisis de
procedimientos de control (p. ej., Church, 1964; Rescorla, 1967; véase también Papini y
Bitterman, 1990). Los diferentes procedimientos de entrenamiento requieren un control diferente
procedimientos. Discuto este tema con mayor detalle mientras examino varios tipos de
aprender en los siguientes capítulos. Por ahora, basta con decir que el diseño de un
El procedimiento de control está dictado por el aspecto particular de la experiencia pasada que uno
desea aislar como responsable del cambio de comportamiento de interés.
En el ejemplo de los niños que aprenden a andar en bicicleta, nos interesaba
si practicar la conducción es fundamental para convertirse en un ciclista habilidoso. Niños que
practicar la conducción también aprender mucho sobre cómo funciona una bicicleta (p. ej., cómo los pedales
hacer girar las ruedas). Por eso diseñamos el procedimiento para el control
grupo para que los niños de ese grupo aprendan sobre las partes de una bicicleta
y cómo esas partes van juntas. Sin embargo, los niños del grupo de control
no se les proporcionó práctica para sentarse en una bicicleta y pedalear. Por lo tanto, la
El diseño del procedimiento de control nos permitió aislar la práctica de la conducción como
factor crítico involucrado en aprender a andar en bicicleta.
Una tercera consecuencia importante del hecho de que el aprendizaje solo puede inferirse
de una comparación entre condiciones experimentales y de control es que el aprendizaje
generalmente se investiga con al menos dos grupos independientes de participantes, un
grupo experimental y un grupo de control. Un diseño experimental que involucra
comparar dos grupos separados de participantes se llama entre sujetos
diseño experimental .
Una excepción importante al tradicional experimento entre sujetos
El diseño se desarrolló en la tradición skinneriana de investigación del aprendizaje. Desollador
Abogó por la investigación extensa de sujetos individuales en lugar de grupos de
Participantes. Esto llevó al desarrollo de diseños experimentales de un solo sujeto.
(Sidman, 1960). Sin embargo, incluso los experimentos de un solo sujeto implican comparaciones
entre las condiciones experimentales y de control (ver Figura 1.3, panel derecho).
Básicamente, los experimentos de un solo sujeto requieren que el comportamiento del individuo sea
entendido lo suficientemente bien como para permitir suposiciones precisas sobre cómo el individuo
se habría comportado si no hubiera recibido un procedimiento de formación o intervención.
Considere, por ejemplo, un niño de 4 años que no puede atrapar una pelota.
arrojado a él. Si pasamos varias horas al día enseñándole al niño cómo atrapar un
pelota, se volverá competente en unos pocos días. De esto podemos concluir
Página 31
que el niño ha aprendido a atrapar una pelota. Nótese, sin embargo, que esta conclusión es
basado en nuestra suposición de que el niño no habría adquirido la habilidad por lo que
rápidamente si no hubiera recibido instrucción. Solo si tenemos el conocimiento suficiente
Para hacer esta suposición podemos inferir que el niño aprendió a atrapar la pelota.
Por tanto, el estudio del aprendizaje en materias individuales también implica una comparación
entre una condición experimental y una de control. La única diferencia es que el
La condición de control no la proporciona un grupo de control explícito, sino la evidencia.
obtenido de otras fuentes que nos da la confianza de que el comportamiento no se
han cambiado sin el procedimiento de formación.
EL ENFOQUE DE PROCESOS GENERALES PARA EL ESTUDIO DE

APRENDIENDO
Además de depender de técnicas experimentales, los investigadores del aprendizaje
normalmente utilizan un enfoque de proceso general. Tal enfoque asume que
Los fenómenos de aprendizaje son el producto de procesos fundamentales o básicos que
operan de la misma manera en diferentes situaciones de aprendizaje.
El enfoque de proceso general es común en ciencia e ingeniería. Para
Por ejemplo, al diseñar automóviles, los ingenieros asumen que los principios básicos de cómo
El funcionamiento del motor de combustión interna es prácticamente el mismo si el
El motor se utiliza para propulsar un pequeño sedán de cuatro puertas o un vehículo utilitario deportivo grande.
De manera análoga, se asume que los principios básicos involucrados en el aprendizaje
Ser el mismo si el aprendizaje implica que los nios aprendan a operar un
tableta de computadora o ratas que navegan por un laberinto para obtener comida. El proceso general
enfoque se centra en los puntos en común subyacentes a través de situaciones de aprendizaje, con
el objetivo de identificar los principios de aprendizaje universales.
La suposición de que las leyes de asociación universales y básicas son responsables de
Los fenómenos de aprendizaje no niegan la diversidad de estímulos que los diferentes animales pueden
conocer, la diversidad de respuestas que pueden aprender a realizar y las especies
diferencias en las tasas de aprendizaje. Se supone que la generalidad existe en las reglas o
procesos de aprendizaje, no en los contenidos o la velocidad del aprendizaje.
Si asumimos que existen reglas universales de aprendizaje, entonces deberíamos ser capaces de
descubrir esas reglas en cualquier situación en la que se produzca el aprendizaje. Por lo tanto, un
Una implicación metodológica importante del enfoque de proceso general es que
Las reglas generales de aprendizaje pueden descubrirse mediante el estudio de cualquier especie o respuesta.
sistema que exhibe aprendizaje. El enfoque de proceso general para el aprendizaje ha sido
desafiado por los descubrimientos de varias "limitaciones biológicas" que han
Página 32
alentó un enfoque más ecológico para el análisis del aprendizaje animal.

Sin embargo, incluso los estudios contemporáneos que incorporan una perspectiva ecológica
han tratado de identificar principios generales que son aplicables a todas las especies y
situaciones de aprendizaje (Krause & Domjan, 2017).
EL USO DE PARTICIPANTES NO HUMANOS EN INVESTIGACIONES SOBRE

APRENDIENDO
Muchos de los principios básicos del aprendizaje que describo en el curso de este libro
se establecieron por primera vez en una investigación con participantes animales no humanos y fueron
sólo más tarde se extendió a los humanos. Hay muchas ventajas de estudiar el aprendizaje.
en sujetos de laboratorio no humanos. Estos incluyen (a) un mejor conocimiento y control
de las experiencias de aprendizaje previas de los participantes de la investigación, (b) mayor
precisión y control sobre el entorno de aprendizaje y la administración de la
procedimientos de aprendizaje, (c) la capacidad de observar a los mismos individuos bajo
precisamente las mismas condiciones sobre repetidos entrenamientos y ensayos de prueba, (d)
conocimiento y capacidad para controlar la genética de los participantes, (e) mayor
control sobre las variables motivacionales que pueden afectar el aprendizaje, (f) una mejor oportunidad para
minimizar el papel del lenguaje, y (g) una mejor oportunidad de minimizar los esfuerzos del
participantes para complacer o disgustar al experimentador. Sin el uso de
animales de laboratorio como ratas y ratones, los científicos tampoco podrían
Desarrollar tareas y pruebas de comportamiento que son fundamentales para el estudio de la
neurobiología y neurofarmacología del aprendizaje y la memoria. Tales estudios son
comenzando a proporcionar tratamientos para enfermedades graves como el Alzheimer
enfermedad.
Aunque los animales de laboratorio no humanos proporcionan numerosas ventajas para
el estudio del aprendizaje, algunos han argumentado a favor de alternativas. Cuatro comunes
Se han propuesto alternativas: (a) investigación observacional, (b) estudio de plantas,
(c) estudiar cultivos de tejidos y (d) estudiar simulaciones por computadora. Como yo
como se ha dicho anteriormente, las tcnicas de observacin no implican el tipo de
manipulaciones experimentales precisas que son críticas para los estudios del aprendizaje.
Estudiar plantas no es una alternativa viable porque las plantas no tienen un
sistema, que es fundamental para el aprendizaje. Los cultivos de tejidos pueden ser útiles para aislar
el funcionamiento de procesos celulares específicos. Sin embargo, sin comportamiento
investigación que involucre organismos intactos, no se puede determinar la importancia de un
proceso celular particular para los cambios de comportamiento que caracterizan el aprendizaje en
el nivel organísmico. Finalmente, las simulaciones por computadora no pueden reemplazar los experimentos
Página 33
investigación porque primero tenemos que averiguar cómo se produce el aprendizaje en

organismos antes de que podamos construir una simulación de aprendizaje por computadora.
Resumen
Aunque el aprendizaje es una experiencia humana común, qué es y cómo debe ser
investigados no son obvios. El aprendizaje es evidente en un cambio de comportamiento, ya sea
la adquisición de una nueva respuesta o la supresión de una respuesta existente.
Sin embargo, no todos los casos de comportamiento alterado implican aprendizaje, y no todos
instancias de aprendizaje producen cambios inmediatamente observables en la conducta. los
El aprendizaje a término se restringe a los casos en los que hay un cambio duradero en el
potencial para participar en un comportamiento particular que resulta de una experiencia previa
con eventos ambientales específicamente relacionados con ese comportamiento.
Los mecanismos de aprendizaje pueden examinarse a nivel de organismos intactos, el
nivel de circuitos o sistemas neuronales, o el nivel de neuronas y sus sinapsis.
Sin embargo, dado que el aprendizaje es una variable causal, solo se puede investigar con
metodos experimentales. Las observaciones naturalistas pueden proporcionar sugerencias sobre
aprendizaje pero no puede proporcionar evidencia definitiva. El experimento de aprendizaje básico
implica comparar una condición experimental y una de control. El experimental
condición incluye el procedimiento de entrenamiento o la experiencia cuyos efectos se están
probado. La condición de control es similar pero omite el entrenamiento relevante
experiencia. El aprendizaje se infiere de una diferencia en los resultados entre los
condiciones experimentales y de control. Por esta razón, los procedimientos de control son tan
importante para los estudios del aprendizaje como lo son los procedimientos experimentales.
Los estudios del aprendizaje se han basado en un enfoque de proceso general, que
asume que diversos fenómenos de aprendizaje reflejan el funcionamiento de la universalidad
procesos elementales. Este enfoque de proceso general y otros conceptos y
Las consideraciones metodológicas han fomentado el uso de animales no humanos.
sujetos en experimentos de aprendizaje. Dada la naturaleza de los fenómenos de aprendizaje,
las alternativas al estudio de organismos intactos no son viables.
Términos técnicos
Experimento entre sujetos
Condición de control
Evolución
Página 34
Condición experimental
Observación experimental
Fatiga
Aprendiendo
Maduración
Motivación
Observación naturalista
Rendimiento
Práctica
Experimento de un solo sujeto
Aprendizaje de estímulo-estímulo
Página 35
Sabía usted que
el aprendizaje está restringido por la condición incondicionada o

comportamiento no aprendido?
El comportamiento incondicionado se organiza en complejos y
formas sistemáticas?
El comportamiento provocado organizado puede resultar en una conducta bien coordinada
¿interacciones sociales?
El comportamiento en un entorno complejo puede ser gobernado por
características de estímulo pequeñas y aisladas?
A veces, el estímulo más eficaz para provocar una
La respuesta no es un estímulo natural, sino un estímulo artificial.
Estímulo "supernormal"?
El comportamiento instintivo o tpico de la especie no es invariante sino
modulado por el estado motivacional del animal?
El aprendizaje permite a los organismos beneficiarse de la experiencia. A través del aprendizaje,

El comportamiento se puede alterar de manera que los individuos sean más efectivos en
interactuando con su entorno. Los animales pueden alimentarse de manera más eficaz
aprender dónde y cuándo es probable que haya alimentos disponibles (Stephens, Brown, &
Ydenberg, 2007). Pueden defenderse con más éxito si aprenden
Página 36
cuándo y dónde es probable que se encuentren con un depredador (p. ej., Hollis, 1999). Y
pueden ser más efectivos en sus respuestas sexuales y producir más descendencia
aprendiendo cuándo y dónde es probable que encuentren un potencial sexual
socio (Domjan & Akins, 2011).
Modelado y homogéneo versus heterogéneo

Sustratos del comportamiento
En todos los casos de aprendizaje, el comportamiento de un organismo es modificado o moldeado por
su experiencia previa. BF Skinner introdujo el término modelado en referencia
a un tipo particular de procedimiento de condicionamiento que describo con mayor detalle en
Capítulo 6 . Para nuestros propósitos actuales, es suficiente señalar que a través de
modelado, el comportamiento de un organismo se puede cambiar gradualmente para permitirle
realizar nuevas respuestas. Movimientos descoordinados de brazos y piernas de un niño, por
Por ejemplo, se puede moldear gradualmente para permitirle nadar rápidamente a través de una piscina.
Skinner eligió el término dar forma por analogía con la forma en que un escultor
gradualmente cambia y moldea un trozo de arcilla en un objeto reconocible (Skinner,
1953). Un escultor interesado en hacer una estatua de un cisne, por ejemplo, comienza
con un trozo de arcilla sin formar. Luego corta el exceso de arcilla aquí y allá.
y moldea lo que queda de formas especiales. A medida que este proceso continúa, un
El cisne reconocible emerge gradualmente. De manera análoga, el aprendizaje puede
cambiar o dar forma al comportamiento de un organismo, con el resultado de que el individuo
viene a responder de nuevas formas.
La analogía con moldear un bloque de arcilla en un cisne captura algunos de los
aspectos de cómo se cambia el comportamiento a través del aprendizaje. Sin embargo, la analogía tiene
un grave defecto. La arcilla es una sustancia homogénea que se puede moldear en
cualquier dirección con la misma facilidad. El comportamiento no es así. El comportamiento no puede ser
cambiado en cualquier dirección con la misma facilidad. Los cambios en el comportamiento ocurren en el
contexto de predisposiciones genéticamente programadas que hacen ciertos cambios
más fácil de producir que otros. Por ejemplo, es mucho más fácil entrenar animales para
abordar y manipular los estímulos relacionados con la comida (Hearst y Jenkins, 1974) de lo que es
entrenarlos para que se liberen o se retiren de los estímulos relacionados con la comida (Breland &
Breland, 1961; Timberlake, Wahl y King, 1982).
Los procedimientos de aprendizaje no dan forma a un nuevo comportamiento de la forma en que un escultor
da forma a la arcilla en un nuevo objeto. Una analogía más adecuada para el sustrato conductual de
el aprendizaje lo proporciona la madera en lugar de la arcilla (Rachlin, 1976). A diferencia de la arcilla,
Página 37
la madera tiene una consistencia heterogénea o desigual. Es granulado y tiene nudos.

Cortar con el grano es más fácil y da como resultado una línea más suave que cortar en contra
el grano, y cortar alrededor de los nudos es más fácil que cortarlos. Porque
de esta heterogeneidad, si está tallando una estatua en madera, tiene que pagar
prestar mucha atención a la orientación de la estatua en relación con el grano y los nudos
En el bosque. De manera análoga, los psicólogos del aprendizaje deben prestar mucha atención a
cómo las nuevas habilidades que están tratando de enseñar encajan con las preexistencias del organismo
tendencias conductuales. Este capítulo está dedicado a una descripción de estos
tendencias de comportamiento preexistentes.
Todas las instancias de aprendizaje reflejan una interacción entre la formación
procedimientos utilizados y comportamiento preexistente del individuo. Cambios traídos
acerca del aprendizaje no se aplican a un sustrato modificable homogéneamente.
Más bien, el aprendizaje se superpone a un comportamiento heterogéneo preexistente.
estructura. Por lo tanto, comprender cómo ocurre el aprendizaje requiere una apreciación
del sustrato conductual heterogéneo que los organismos aportan a un aprendizaje
situación.
La dependencia del aprendizaje de aspectos no aprendidos de la conducta ha sido
enfatizado en algunas áreas del aprendizaje más que en otras. La interacción entre
aspectos condicionados e incondicionados de la conducta ha sido el foco de
atención en estudios de condicionamiento pavloviano y aprendizaje de evitación (ver
Capítulos 4 y 12 ). Sin embargo, como veremos, las tendencias conductuales no aprendidas
también son importantes en muchas otras formas de aprendizaje.
El concepto del reflejo

La unidad más pequeña de comportamiento incondicionado es el reflejo. El concepto de reflejo
fue formulado por el filósofo francés René Descartes (1596-1650).
Descartes hizo numerosas contribuciones a la filosofía occidental, incluidas ideas
sobre comportamientos que hoy nos resultan familiares a la mayoría de nosotros, pero que fueron innovadores en el
siglo 17. Como otros filósofos de su tiempo, Descartes creía que
aspectos importantes del comportamiento humano eran voluntarios. Sin embargo, tambin estaba
impresionado con la naturaleza aparentemente automática e involuntaria de algunas acciones
y propuso el concepto de reflejo para caracterizar la conducta involuntaria.
Descartes basó su concepto del reflejo en estatuas animadas que vio en
parques públicos en Francia. Personajes animados sofisticados, como los creados
por Disney Studios, no estaban disponibles en la época de Descartes. Pero algunos de los parques
Página 38
Descartes frecuentaba estatuas cuyas extremidades se movían cuando alguien

caminó por. A través de una serie de palancas y vínculos, las extremidades y articulaciones del
estatua estaban conectados a escalones a lo largo de la pasarela cerca de la estatua.
Cada vez que alguien pisaba una de estas piedras, la presión sobre el paso-
la piedra fue transferida a la estatua, haciendo que su brazo o pierna se movieran.
Las estatuas en movimiento parecían realistas, y a Descartes le pareció que algunas
aspectos del comportamiento humano y animal eran similares al comportamiento del
estatuas. Descartes señaló que los animales y las personas también realizan ciertos
acciones en respuesta a estímulos ambientales particulares. Por ejemplo, rápidamente
retiramos el dedo cuando tocamos una estufa caliente, "instintivamente" nos estremecemos cuando
oímos un ruido repentino y extendimos el brazo cuando perdemos el equilibrio. Tal
las respuestas a estímulos particulares son ejemplos de comportamiento provocado .
Los movimientos de las estatuas que vio Descartes fueron provocados por el estímulo o
fuerza aplicada a los escalones asociados. Así, los movimientos fueron
Reflexiones del estímulo provocador. Descartes acuñó el término reflejo para capturar
esta idea de comportamiento es un reflejo de un estímulo provocador. Toda la unidad
desde la entrada del estímulo hasta la salida de la respuesta se denominó arco reflejo (ver Figura
2.1 ).
FIGURA 2.1
Página 39
Organización neuronal de reflejos simples. El estímulo ambiental para el reflejo.

respuesta activa una neurona sensorial, que transmite el mensaje sensorial a la columna
cable. Aquí los impulsos neuronales se transmiten a una interneurona, que a su vez pasa el
impulsos a la neurona motora. La neurona motora activa los músculos involucrados en el reflejo.
respuesta.
Los reflejos están involucrados en muchos aspectos del comportamiento importantes para mantener
funciones vitales críticas. Los reflejos respiratorios nos proporcionan una entrada de aire suficiente.
El reflejo de succión proporciona el primer contacto del recién nacido con la leche. Masticación,
la deglución y los reflejos digestivos son importantes para obtener nutrientes
a lo largo de la vida. Los reflejos posturales nos permiten mantener posiciones corporales estables,
y los reflejos de retraimiento nos protegen de fuentes focales de lesión.
Durante unos 250 años después de Descartes, los investigadores de los reflejos fueron principalmente
preocupado por cuestiones fisiológicas. Los científicos estudiaron los circuitos neuronales de
el arco reflejo, los mecanismos de conducción neural y el papel de los reflejos en
varios sistemas fisiológicos. Estas investigaciones continuaron a un ritmo acelerado
ritmo en el siglo XX. Además, se amplió la idea de comportamiento provocado
a formas de comportamiento más complejas. Gran parte de este trabajo se realizó en la nueva
campo emergente de la etología, que es una especialidad en biología que se ocupa de la
evolución y desarrollo de unidades funcionales de conducta (Baerends, 1988).
Formas complejas de comportamiento provocado

Los etólogos descubrieron que el comportamiento social complejo en varias especies se realiza
de componentes de respuesta que son provocados por estímulos sociales. Un espinoso macho
pez, por ejemplo, establece un pequeño territorio y construye un túnel de nido durante el
temporada de apareamiento. Una vez establecido el territorio, el acercamiento de un macho
El intruso provoca una respuesta defensiva agresiva del macho residente. En
Por el contrario, si una mujer entra en el territorio, el hombre residente se involucra en el noviazgo.
movimientos de natación en zigzag. Los movimientos en zigzag de cortejo estimulan la
hembra para seguir al macho residente hasta el túnel del nido. Una vez que la hembra está en el
túnel, con la cabeza en un extremo y la cola en el otro, el macho pincha la base
de la cola de la hembra. Esto hace que la hembra libere sus huevos. La hembra entonces
sale del nido y el macho entra y fertiliza los huevos. Después de eso, persigue
la hembra y ventila los huevos para proporcionar oxígeno hasta que los huevos eclosionan (ver
Tinbergen, 1952).
Página 40
En este complejo dúo conductual, el macho y la hembra tienen cada uno su propio
papel especial. Los estímulos proporcionados por la mujer desencadenan determinadas acciones por parte de
el macho residente (nadando en zigzag); el comportamiento del macho a su vez proporciona
estímulos que desencadenan otras respuestas por parte de la mujer (siguiendo el
macho residente en el nido); El comportamiento de la mujer conduce a más respuestas.
del macho; etcétera. El resultado es una secuencia de
respuestas sociales. La secuencia de comportamiento progresa solo si el comportamiento del hombre
proporciona la estimulación necesaria para obtener la siguiente respuesta de la mujer,
y viceversa. Si la respuesta de un participante no produce el siguiente
respuesta en su pareja, la secuencia de acciones se interrumpe, y el social
la interacción puede llegar a su fin.
PATRONES DE ACCIÓN MODAL

Las observaciones cuidadosas de los etólogos han revelado numerosos ejemplos de
comportamientos sociales y no sociales complejos que se componen de secuencias de
respuestas del tipo ilustrado por el comportamiento sexual de los espinosos. Provocado
Se ha demostrado que las respuestas están involucradas, entre otras cosas, en la construcción de nidos,
incubación, alimentación de los padres de las crías, aseo, búsqueda de comida y defensiva
comportamiento (Alcock, 2013). Cada unidad de comportamiento provocado se compone de un
respuesta característica y su correspondiente estímulo provocador.
Las unidades de comportamiento provocado que he estado discutiendo se denominan comúnmente
patrones de acción modal , o MAP. La frase patrón de acción se utiliza en lugar de
respuesta porque las actividades involucradas no se limitan a un solo músculo
movimiento, como un abrir y cerrar de ojos o la flexión de un músculo de la pierna. Provocado
respuestas involucradas en el aseo, la búsqueda de comida, el cortejo y el comportamiento de los padres
requieren un conjunto coordinado de varios músculos diferentes. La palabra modal se usa para
significa que la mayoría de los miembros de la especie realizan el patrón de acción en cuestión
y hacerlo de una manera muy similar. Un patrón de acción es una característica del
especies. Por ejemplo, los mamíferos lactantes se alimentan típicamente al amamantar, las gaviotas lactantes
Por lo general, se alimentan con la boca abierta y reciben comida de uno de los padres, y los pollos lactantes.
típicamente se alimentan picoteando pequeños puntos en el suelo. Porque la acción modal
Los patrones son característicos de una especie, son ejemplos de especies típicas
comportamiento.
Originalmente, los patrones de acción modal se llamaban patrones de acción fijos , para
enfatizar que son una característica estable de una especie. Sin embargo, las respuestas son
no “fijos” en el sentido de que ocurren exactamente de la misma manera cada vez. Porque
Página 41
Existe cierta variabilidad en las respuestas obtenidas de una ocasión a otra,

la frase "patrón de acción modal" ahora se usa con preferencia a "acción fija
patrón."
Los patrones de acción modal son evidentes en el comportamiento de todos los animales, incluyendo
seres humanos. Nuestras expresiones faciales (cómo sonreímos o expresamos enojo) son
Respuestas típicas de la especie provocadas por estímulos sociales y de otro tipo. Amamantamiento en bebés
es un patrón de acción modal, al igual que la masticación en las personas mayores. Como nos reconfortamos
entre sí también reflejan los patrones de acción modal típicos de las especies.
ESTIMULOS DE SEÑALES
Los patrones de acción modal ocurren en el contexto de conjuntos ricos y complejos de
estímulo. Considere, por ejemplo, una codorniz macho que se siente atraída sexualmente
a una mujer que aparece a la vista. La hembra es una fuente de una variedad de visual
pistas proporcionadas por el aspecto de su cabeza, cuello, torso y piernas y por su
movimientos. También puede proporcionar estimulación auditiva y olfativa, y si
se acerca lo suficiente al macho, proporciona estimulación táctil. Curiosamente,
la mayoría de estas señales no son críticas para provocar el comportamiento sexual en las codornices macho.
Determinar cuáles de los diversos estímulos proporcionados por una codorniz hembra son
suficiente para atraer a un hombre sexualmente motivado, los experimentadores probaron a los hombres con
tanto hembras vivas como modelos taxidérmicos de hembras (ver Figura 2.2 ). En uno
estudio (Domjan y Nash, 1988), por ejemplo, algunos de los modelos consistieron en
cabeza y cuerpo entero de una hembra. Otros modelos consistieron solo en la cabeza y
cuello de la hembra o simplemente el cuerpo sin cabeza. La figura 2.3 muestra el
tendencia de la codorniz macho a acercarse y permanecer cerca de estos diversos tipos de
estímulos femeninos.
FIGURA 2.2
Página 42
Fotografía de una codorniz hembra viva (A) y de un modelo taxidérmico de la cabeza y

cuello (B).
FIGURA 2.3
Página 43
Aproximación a la respuesta de un macho de codorniz sexualmente experimentado a una hembra viva y a la taxidermia.
modelos que constan de todo el cuerpo de una mujer, solo la cabeza y el cuello de una mujer, y un
cuerpo femenino sin cabeza y cuello. De “Control de estímulos del comportamiento social en
Codorniz japonesa macho, Coturnix coturnix Japonica ”, por M. Domjan y S. Nash, 1988,
Comportamiento animal , 36 , p. 1013. Copyright 1988 de Elsevier. Adaptado con permiso.
La codorniz macho respondió con igual vigor a un modelo taxidérmico completo de un

hembra como respondieron a una hembra viva. Este resultado muestra que las señales de movimiento
y los estímulos auditivos y olfativos proporcionados por una mujer viva no son necesarios para
provocar la respuesta de aproximación. Los machos también respondieron enérgicamente solo a los
señales visuales de la cabeza y el cuello de una mujer. De hecho, se acercaron a la cabeza y ...
modelo de cuello casi tanto como respondieron a un modelo femenino completo. Esta
es un resultado notable. Evidentemente, la codorniz macho puede identificar a una hembra por medio de
solo las señales visuales de la cabeza y el cuello de la hembra. El resto de su cuerpo, su
llamadas, su olor, sus movimientos, todo esto es innecesario.
El conjunto restringido de estímulos que se requieren para provocar un patrón de acción modal.
se llama señal de estímulo . En lo que respecta a la codorniz macho, la cabeza de la hembra
y el cuello son la "señal" de que es mujer. Se han obtenido resultados similares
con pavos (Schein & Hale, 1965).
Un estímulo de signo es a menudo una parte notablemente pequeña de las señales que normalmente
preceder a un patrón de acción modal. La respuesta de picoteo de los polluelos de gaviota, por
ejemplo, es provocada por una mancha roja prominente en la cuenta de su padre o madre (ver
Figura 2.4 ). La forma puntiaguda del billete de los padres, junto con este prominente
lugar, estimula a los polluelos a picotear el pico de los padres, lo que hace que el padre
alimentar al polluelo regurgitando comida. Otros aspectos del padre (la forma de
su cabeza, sus ojos, cómo aterriza en el borde del nido, los ruidos que hace)
no son importantes (Tinbergen y Perdeck, 1950).
FIGURA 2.4
Página 44
El estímulo de la señal para la respuesta de picoteo de los polluelos de gaviota es una mancha roja cerca de la punta del
factura de los padres.
Los modelos artificiales se utilizan típicamente para aislar el estímulo de signo que es crítico
para provocar una respuesta conductual. Una vez que se ha identificado un estímulo de signo,
se puede aumentar en tamaño e intensidad para producir una respuesta aún mayor. Tal
Las formas exageradas de estímulos desencadenantes naturales se denominan estímulos supranormales .
Los estímulos de signos también son prominentes en el control de varios aspectos de la
comportamiento, y las empresas se han vuelto muy hábiles para mejorar el
eficacia de estas señales mediante la creación de estímulos sobrenaturales (Barrett, 2010). los
el sabor del azúcar y la grasa, por ejemplo, son señales de estímulo para la selección de alimentos humanos y
ingestión. La industria alimentaria ha aprovechado este hecho para incrementar las ventas en
aumentar el contenido de azúcar y grasa de varios productos alimenticios. La creacion de
Los estímulos sobrenaturales también son el objetivo de la industria cosmética, aumentar la sexualidad.
atractivo. De manera similar, la violencia excesiva en los juegos de computadora
Página 45
implica el uso de estímulos supernormales que provocan un comportamiento agresivo.
La organización de la conducta provocada

Si cada patrón de acción refleja o modal se produjo automáticamente siempre que su
Se encontró un estímulo provocador, el comportamiento sería algo desorganizado.
Las respuestas provocadas no ocurren independientemente unas de otras. Más bien, son
organizado de formas especiales. Como veremos en los capítulos siguientes, algunos de estos
La organización es el resultado del aprendizaje y la experiencia. Aquí describo aspectos de
organización conductual que no son obviamente un producto del aprendizaje.
FACTORES MOTIVACIONALES
Un factor destacado que sirve para coordinar los patrones de acción modal es la
estado motivacional del organismo. En numerosas especies, por ejemplo, el cortejo
y las respuestas sexuales ocurren solo durante la temporada de reproducción, o solo en la
presencia de niveles suficientemente altos de hormonas sexuales. De hecho, la necesaria
las condiciones pueden ser aún más restrictivas. Los espinosos machos cortejan a las hembras solo si
están en época de cría y previamente establecieron un territorio y
construyó un nido. Estas condiciones previas sirven para preparar o crear la motivación para
comportamiento de cortejo.
Se han identificado factores motivacionales para una variedad de acciones modales.
patrones, incluida la agresión, la alimentación y varios aspectos de los padres y
comportamiento sexual. El estado motivacional prepara el escenario para un patrón de acción modal,
la ocurrencia real de lo cual es luego desencadenada por un estímulo de signo. En un sentido,
el estímulo de signo libera el patrón de acción modal cuando el animal está en una
estado motivacional particular. Por esta razón, un estímulo de signo también es a veces
referido como un estímulo liberador.
Los etólogos consideraron que el estado motivacional del organismo es uno de los
los factores clave involucrados en la organización de la conducta (por ejemplo, Lorenz, 1981).
Utilizando conceptos motivacionales, formularon un modelo influyente de cómo
Los patrones de acción están organizados, lo que se conoce como modelo hidráulico de comportamiento. los
modelo hidráulico asume que ciertos factores conducen a la acumulación de un
tipo de motivación o impulso. El término hidráulico se usó por analogía con un
motor hidráulico, en el que la acumulación de presión hace que los pistones se muevan hasta
la presión se libera o se disipa. El impulso del hambre, por ejemplo, se crea
Página 46
por el gasto de energía y la utilización de nutrientes. Este impulso a su vez

induce la atención selectiva a los estímulos relacionados con los alimentos y reduce el umbral para
activar patrones de acción modal relacionados con los alimentos. Una vez que se encuentra y se come la comida, el
Se descarga el estado motivacional de hambre. Así, el estado motivacional facilita
patrones de acción modal relacionados con la alimentación, y la oportunidad de realizar esos
respuestas a su vez reduce el estado motivacional.
COMPORTAMIENTO APPETITIVO Y CONSUMIDOR

El comportamiento provocado también se organiza secuencialmente. Ciertas respuestas tienden a ocurrir
antes que otros. Los etólogos caracterizaron la secuencia de respuesta involucrada en la
la descarga de un estado de accionamiento consta de dos componentes principales. El primero de
este es el comportamiento apetitivo. En el caso del sistema de alimentación, el apetito
El comportamiento consiste en respuestas involucradas en la búsqueda de un trozo de comida.
El comportamiento apetitivo es bastante variable y ocurre en respuesta a condiciones espaciales generales.
señales. Por ejemplo, al buscar un trozo de comida, una ardilla se centrará en
Señales espaciales que ayudan a identificar árboles y arbustos que pueden contener nueces y frutas.
El comportamiento apetitivo tiende a ocurrir en un área amplia e involucra una variedad de
posibles actividades. Durante el curso de su búsqueda de alimento, la ardilla puede cruzar
césped abierto, trepar por rocas, trepar árboles, saltar de una rama de árbol a
otro, y así sucesivamente.
Una vez que la ardilla encuentra una nuez comestible, su comportamiento se vuelve mucho más
estereotipado y restringido. Ahora la ardilla permanece en un lugar, se sienta en su
patas traseras y cola, toma la nuez con sus patas delanteras, la abre y mastica y
traga la comida. Estas actividades típicas de las especies más estereotipadas son
ejemplos de conducta consumatoria porque completan o consuman la
secuencia de respuesta. Los patrones de acción modal consumatorios terminan con la respuesta
secuencia porque estas respuestas descargan la motivación o el estado de impulso.
En el sistema de alimentación, la conducta consumatoria implica el consumo de
comida, pero la aparente similitud en la redacción en este caso es simplemente una coincidencia.
En el sistema de conducta sexual, la conducta consumatoria consiste en la
Respuestas copulatorias o coitales que sirven para completar una interacción sexual. En el
sistema de comportamiento defensivo, el comportamiento consumatorio consiste en la huelga circa
Respuestas que hace un animal cuando no solo es amenazado sino atacado físicamente.
por un depredador (ver Capítulo 12).
Otra forma de pensar sobre el comportamiento apetitivo y consumatorio es que
El comportamiento apetitivo consiste en actividades que permiten que un organismo entre en
Página 47
contacto con los estímulos de signos que provocarán los patrones de acción modal que permiten
completando la secuencia de respuesta. Por ejemplo, el comportamiento sexual apetitivo.
del macho implica la búsqueda de una hembra. Una vez que se encuentra a la hembra, la
Los estímulos proporcionados por ella provocan una gama más restringida de cortejo y copulación.
respuestas. Estas respuestas copulatorias o coitales luego descargan la motivación para
participar en un comportamiento sexual, consumando o poniendo fin al comportamiento sexual
secuencia.
SISTEMAS DE COMPORTAMIENTO
Investigaciones recientes sobre la estructura del comportamiento incondicionado han sugerido que
Las secuencias de comportamiento provocadas deben subdividirse en más que solo los dos
categorías de respuesta (respuestas apetitivas y consumatorias) proporcionadas por
etología clásica. Timberlake (2001), por ejemplo, caracterizó la alimentación
sistema que consta de al menos tres componentes (ver Figura 2.5). De acuerdo a
este punto de vista más detallada, la secuencia de la conducta alimentaria comienza con el general,
Modo de búsqueda en el que el animal reacciona a las características generales del entorno.
con respuestas que le permitan entrar en contacto con una variedad de potenciales
fuentes de alimento. Una abeja, por ejemplo, puede volar por todas partes en busca de arbustos.
u otras plantas con flores.
FIGURA 2.5
Componentes del sistema de comportamiento alimentario. Comienza la secuencia del comportamiento de alimentación
con una búsqueda general de posibles sitios de comida. Una vez que un sitio de comida potencial ha sido
identificado, el animal realiza una búsqueda focal de ese sitio. Al encontrar la comida, el
el animal participa en las respuestas de manipulación e ingestión de alimentos.
Una vez que un animal ha identificado una fuente potencial de alimento, cambia a un
modo de respuesta más restringido, el modo de búsqueda focal . En el modo de búsqueda focal,
la abeja se concentrará en un arbusto, yendo de flor en flor. Sobre
Al encontrar una flor específica, la abeja cambiará a la manipulación de alimentos y
modo de ingestión. Este último modo de respuesta es similar al que se refirieron los etólogos.
Página 48
como conducta consumatoria y consiste en las respuestas necesarias para extraer el néctar
de la flor e ingiera el néctar.
Los sistemas de comportamiento se han descrito para una variedad de funciones que
los organismos tienen que lograr en sus vidas: cuidar a los jóvenes, acicalarse,
defensa y reproducción. Como veremos, los sistemas de comportamiento son muy relevantes
para predecir las manifestaciones conductuales del aprendizaje. Varias características de
Los sistemas de comportamiento son importantes en los estudios contemporáneos del aprendizaje:
1. Los sistemas de comportamiento generalmente consisten en una secuencia de tres o más modos de
comportamiento, en lugar de solo comportamiento apetitivo y consumatorio. los
El organismo se mueve de un modo de respuesta a otro (búsqueda general de
búsqueda focal) dependiendo de los eventos ambientales que encuentre.
2. La secuencia de modos de respuesta es lineal. Un animal se mueve típicamente de
un modo de respuesta al siguiente sin omitir ningún paso en la secuencia. A
La ardilla no puede manipular la comida, por ejemplo, sin antes haber encontrado
la comida en su modo de búsqueda focal.
3. Aunque la secuencia de respuesta es lineal, no es unidireccional. Un animal
puede ir hacia adelante o hacia atrás en la secuencia dependiendo de la
circunstancias. Si el comportamiento de búsqueda focal de una ardilla no tiene éxito en
localizando nueces, la ardilla volverá a su modo de búsqueda general.
4. Dado que las secuencias de respuesta están ordenadas de forma lineal, también son
organizado en el tiempo. Las respuestas generales de búsqueda de alimento tienden a ocurrir más lejos en el tiempo.
desde el final de la secuencia del comportamiento de alimentación que las respuestas de ingestión.
Debido a esto, las variables temporales en el aprendizaje están relacionadas con factores temporales.
en sistemas de comportamiento preexistentes.
5. Finalmente, cada modo de respuesta involucra no solo respuestas características sino
también mayor sensibilidad o atención a determinados tipos de estímulos. En el
modo de búsqueda general, es probable que una abeja forrajera esté buscando flores
arbustos en lugar de arbustos que no tienen flores. En la búsqueda focal
modo, tiende a centrarse en dónde están las flores en el arbusto que ha elegido para
busca y qué flor está lista para cosechar para obtener néctar. Finalmente, en la comida-
En el modo de manipulación, se centrará en la parte de la flor que contiene el néctar.
Por lo tanto, varios modos de comportamiento difieren no solo en términos de los tipos de
respuesta que están involucradas, sino también en los tipos de estímulos que guían la
comportamiento.
Página 49
Resumen
Todas las instancias de aprendizaje reflejan una interacción entre los procedimientos de formación.
que se utilizan y las estructuras de comportamiento preexistentes del individuo. Por lo tanto,
comprender cómo se produce el aprendizaje requiere una apreciación de los
Mecanismos de comportamiento. El comportamiento incondicionado no es homogéneo y
modificable en cualquier dirección pero tiene su propia estructura determinada. Lo más simple
La unidad de conducta incondicionada es el reflejo, que consiste en una provocación específica.
estímulo y la correspondiente respuesta provocada. Formas más complejas de provocado
El comportamiento,
mediante estímulos deestudiado
signos opor etólogos,
estímulos implica patrones
liberadores. de acción
Los etólogos modal quefactores
identificaron son provocados
motivacionales
involucrado en el control de los patrones de acción modal y señaló que provocó
El comportamiento consiste en una secuencia predecible de actividades que comienza con
respuestas apetitivas y termina con una conducta consumatoria. Estas ideas tienen
se ha extendido en las conceptualizaciones contemporáneas de los sistemas de conducta. A
El sistema de comportamiento es un conjunto de modos de respuesta que se activa de forma coordinada.
moda para lograr un resultado conductual importante, como nutrición, defensa,
o reproducción. Los modos de respuesta se organizan secuencialmente, y cada
El modo de respuesta se caracteriza por respuestas particulares y una mayor sensibilidad.
a tipos particulares de estímulos.
Lecturas sugeridas
Baerends, GP (1988). Etología. En RC Atkinson, RJ Herrnstein, G.
Lindzey y RD Luce (Eds.), Manual de Stevens de experimentos
psicología (Vol. 1, págs. 765–830). Nueva York, NY: Wiley.
Barrett, D. (2010). Estímulos supernormales: cómo los impulsos primarios invadieron sus
propósito evolutivo. Nueva York, NY: Norton.
Timberlake, W. (2001). Modos motivacionales en sistemas de comportamiento. En RR
Mowrer & SB Klein (Eds.), Manual de teorías de aprendizaje contemporáneas
(págs. 155-209). Mahwah, Nueva Jersey: Erlbaum.
Tinbergen, N. (1951). El estudio del instinto. Oxford, Inglaterra: Clarendon Press.
Términos técnicos
Comportamiento apetitoso
Página 50
Sistema de comportamiento
Comportamiento consumatorio
Comportamiento provocado
Etología
Modo de búsqueda focal
Modo de búsqueda general
Modelo hidraulico
Patrón de acción modal
Reflejo
Arco reflejo
Estímulo liberador
Signo de estímulo
Comportamiento típico de la especie
Página 51
Sabía usted que

El comportamiento reflexivo no es automático e invariante, pero puede
aumentar o disminuir como resultado de la experiencia?
el vigor de la conducta provocada se modifica al oponerse
procesos de habituación y sensibilización?
La conducta provocada está determinada no sólo por la provocación
estímulo sino también por otros eventos encontrados recientemente?
los efectos de habituación son evidentes en la disminución de la respuesta;
¿Los efectos de sensibilización son evidentes en una mayor respuesta?
Los efectos de habituación y sensibilización están determinados por
la intensidad y frecuencia del estímulo provocador?
La habituación es más específica para el estímulo provocador de lo que es
¿sensibilización?
¿La habituación es una propiedad inherente de todo comportamiento provocado?
La sensibilización refleja una influencia moduladora en el
mecanismos de comportamiento provocado?
H abiendo considera la estructura de la conducta condicionada en el capítulo 2 , se

ahora están listos para examinar algunas de las formas en que se puede cambiar el comportamiento
o modificado por la experiencia. Comenzamos con los fenómenos de habituación y
Página 52
sensibilización porque estos fenómenos son dos de los más simples y más
formas comunes de cambio de comportamiento. También es importante considerar la habituación
y sensibilización temprana en un relato de aprendizaje porque la habituación y
La sensibilización puede ocurrir en cualquiera de los procedimientos de aprendizaje más complejos que son
descrito en los capítulos siguientes.
La habituación y la sensibilización se han investigado más extensamente en
sistemas reflejos. Un reflejo es una respuesta bastante simple que ocurre como reacción a un
estímulo provocador específico. La succión, por ejemplo, se produce fácilmente en un recién nacido.
bebé colocando un objeto con forma de pezón en la boca del bebé. Como señalé en
Capitulo 2, el concepto de reflejo fue formulado originalmente por Descartes, quien
asumió que los reflejos tienen dos características principales. Primero, Descartes creía que el
El vigor de la respuesta provocada está directamente relacionado con la intensidad de la provocación.
estímulo. De hecho, pensó que la energía requerida para la respuesta refleja era
proporcionada por el estímulo provocador. En segundo lugar, creía que una respuesta refleja
siempre ocurrirá cuando se presente su estímulo provocador. Para Descartes,
los reflejos eran reacciones "automáticas" o inevitables a los estímulos provocados.
Descartes tenía razón al señalar que ciertas acciones son provocadas por
provocando estímulos. Pero se equivocaba al caracterizar los reflejos como invariantes y
energizados por sus estímulos provocadores. Sin embargo, sus puntos de vista continúan dominando
cómo piensan los laicos sobre los reflejos. La gente suele considerar que los reflejos son
automático y fijo. De hecho, el término reflexivo se utiliza a veces como sinónimo
para automático. Sin embargo, los científicos han demostrado que esta visión de los reflejos es
incorrecto. Como veremos en este capítulo, el comportamiento provocado y reflexivo puede ser
notablemente flexible. Las respuestas a un estímulo provocador pueden aumentar (mostrando
sensibilización) o disminución (mostrando habituación), dependiendo de la
circunstancias.
¿Por qué debería ser modificable el comportamiento reflexivo? ¿Por qué necesitamos habituación?
y sensibilización? Básicamente, estos procesos nos ayudan a evitar responder a los estímulos.
que son irrelevantes y nos permiten enfocar nuestras acciones en cosas que son importantes.
La habituación y la sensibilización modulan nuestras respuestas reflejas y aumentan la
eficiencia de nuestras interacciones con el medio ambiente. Humanos y no humanos
Los animales viven en entornos complejos que proporcionan muchas formas de estimulación, todos
el tiempo. Incluso durante una actividad aparentemente sin incidentes como sentarse tranquilamente en un
silla, una persona es bombardeada por visuales, auditivos, olfativos, táctiles e internos
estímulos fisiológicos. Todos estos son capaces de provocar respuestas, pero si
todos hicimos (como Descartes pensó originalmente), estaríamos reaccionando a muchas cosas
que no son importantes. Sin habituación y sensibilización, el comportamiento sería
Página 53
totalmente esclavizado a las vicisitudes del medio.

Considere, por ejemplo, la respuesta de orientación . Miramos y giramos hacia
estímulos visuales y auditivos novedosos (p. ej., alguien que entra en la habitación). Sin embargo, si
todos los estímulos en nuestro entorno debían provocar una respuesta de orientación,
estaría desperdiciando gran parte de nuestro esfuerzo mirando aquí, allá y en todas partes. Muchos
los estímulos no son lo suficientemente importantes como para merecer nuestra atención. Mientras hablaba con
alguien en la sala de estar, no necesitamos orientarnos a los sonidos de un refrigerador
tarareando de fondo o un coche pasando por la calle. Habituación y
La sensibilización sirve para modular nuestra capacidad de respuesta. Se aseguran de que respondamos
vigorosamente a algunos estímulos mientras ignora otros.
En el capítulo 2 , señalé que el vigor de la conducta provocada está determinado por
factores motivacionales y que la secuencia de respuestas provocadas está determinada por
la estructura inherente del sistema de comportamiento que se activa. También noté en
pasando que los sistemas de respuesta a veces se organizan por aprendizaje y
experiencia. La habituación y la sensibilización son los primeros principios conductuales que
consideraremos que sirven para organizar comportamientos basados en la experiencia.
Efectos de la presentación repetida de una provocación

Estímulo
Las relaciones que describo aquí para habituación y sensibilización son
características generales que pueden observarse para casi cualquier forma de provocación
comportamiento. Los procedimientos de habituación se utilizan ampliamente en estudios de la visión infantil.
atención (Colombo & Mitchell, 2009). El método experimental básico es
ilustrado en Figura 3.1 . El bebé está sentado cómodamente frente a una pantalla que
se utiliza para presentar estímulos visuales. Cuando aparece un estímulo en la pantalla, el
el bebé mira la pantalla. La atención visual del bebé se mide por el tiempo
cuánto tiempo sus ojos permanecen fijos en el estímulo antes de cambiar su mirada
en otra parte. El tiempo que el bebé mira el estímulo depende de lo que
estímulo es y con qué frecuencia se ha presentado.
FIGURA 3.1
Página 54
Montaje experimental para el estudio de la atención visual en bebés. El bebé está sentado al frente.
de una pantalla que se utiliza para presentar diversos estímulos visuales. Cuánto tiempo mira el bebé al
pantalla antes de desviar la mirada hacia otra parte se mide en cada prueba.
Figura 3.2 muestra los resultados de un experimento sencillo que se llevó a cabo con
dos grupos de bebés de 4 meses (Bashinski, Werner y Rudy, 1985). Para cada
grupo, un estímulo visual de 10 segundos se presentó ocho veces, con un
intervalo entre ensayos. La complejidad del estímulo visual difería para el
dos grupos. Un patrón de tablero de ajedrez de 4 × 4 se presentó a un grupo y un
Al otro grupo se le presentó un patrón de tablero de ajedrez de 12 × 12 más complejo.
Observe que la duración de la fijación visual provocada por cada estímulo no fue
invariante o "automático". Más bien, el tiempo de fijación cambió de diferentes maneras.
dependiendo del estímulo. Con el patrón complejo de 12 × 12, la fijación aumentó
de la Prueba 1 a la Prueba 2, luego se negó a partir de entonces. Con el patrón 4 × 4 más simple,
la fijación visual disminuyó de una prueba a otra.
FIGURA 3.2
Página 55
El tiempo de fijación visual para dos grupos de bebés a los que se les presentó un estímulo visual en ocho
ensayos sucesivos. El estímulo fue un patrón de tablero de ajedrez de 12 × 12 para un grupo y un
Patrón de tablero de ajedrez 4 × 4 para el otro grupo. De "Determinantes de la visión infantil
Fijación: evidencia para una teoría de dos procesos ”, por HS Bashinski, JS Werner y J.
W. Rudy, 1985, Journal of Experimental Child Psychology , 39 , pág. 588. Copyright 1985 por
Elsevier. Reproducido con permiso.
Una disminución en el vigor de la conducta provocada se denomina efecto de habituación . En

Por el contrario, un aumento en la capacidad de respuesta se denomina efecto de sensibilización . Habituación
fue evidente a lo largo del experimento con el patrón de tablero de ajedrez de 4 × 4.
La habituación también fue evidente con el patrón 12 × 12 desde el Ensayo 2 al Ensayo 8, pero
la sensibilización ocurrió desde el Ensayo 1 al Ensayo 2.
Otra preparación experimental común para el estudio de la habituación y
la sensibilización implica la respuesta de sobresalto . La respuesta de sobresalto es repentina.
movimiento o estremecimiento causado por un nuevo estímulo. Si alguien rompiera un globo
Página 56
detrás de ti (haciendo un fuerte estallido), de repente encorvabas tu

hombros y tire de su cuello. El sobresalto es una reacción humana común en una variedad
de culturas (Simons, 1996). El movimiento brusco que caracteriza al sobresalto
El reflejo se puede medir fácilmente, lo que ha fomentado numerosos estudios de
habituación y sensibilización del reflejo de sobresalto en una variedad de especies (p. ej.,
Davis, Antoniadis, Amaral y Winslow, 2008; Halberstadt y Geyer, 2009).
Un sonido repentino pero suave puede causarle un sobresalto las primeras veces
se produce, pero dejará de responder rápidamente al sonido. Los resultados similares son
obtenido con estímulos táctiles suaves. Cuando te pones por primera vez un cómodo par de
zapatos, siente la suave presión de los zapatos contra sus pies. Sin embargo, incluso
aunque la presión táctil permanece, su reacción se habitúa rápidamente; pronto tú
ignorará por completo que está usando los zapatos.
Si el estímulo táctil es más intenso (porque el zapato no calza tan bien),
Será más difícil acostumbrarse y el patrón de respuesta puede ser
similar a lo que vimos en la Figura 3.2 , con la atención visual de los bebés a un 12
× 12 patrón de tablero de ajedrez. En tales casos, la respuesta aumenta al principio y luego
declina. Se obtienen resultados similares con el reflejo de sobresalto si el
El estímulo es un tono intenso.
Si el estímulo provocador es muy intenso, pueden producirse repeticiones del estímulo
en un aumento sostenido en la respuesta. Si un guijarro en su zapato está creando una intensa
presión, su irritación aumentará con la exposición continua a ese estímulo,
y esto durará mientras el guijarro permanezca en su zapato. Del mismo modo, un
Puede producirse un aumento sostenido de la respuesta de sobresalto si el estímulo provocador es un
ruido intenso. Es posible que los soldados y civiles en una zona de guerra nunca se acostumbren a la
sonido de disparos cercanos.
Como ilustran estos ejemplos, el comportamiento provocado puede cambiar en una variedad de
formas con repeticiones del estímulo provocador. A veces la respuesta muestra un
disminución constante o efecto de habituación. En otros casos, se produce un efecto de sensibilización.
al principio, seguido de una disminución en las respuestas. El comportamiento provocado también puede mostrar
evidencia de sensibilización sostenida.
CARACTERÍSTICAS DE LOS EFECTOS DE HABITUACIÓN

Se ha descubierto que numerosos factores influyen en el curso de la habituación y
efectos de sensibilización. Aquí considero algunas de las principales variables.
Página 57
Efectos del cambio de estímulo

Quizás la característica más importante de la habituación es que es específica de la
estímulo particular que se ha presentado repetidamente. Si un nuevo estímulo es
presentado, la respuesta habituada se recuperará, con el grado de recuperación
determinado por la similitud del nuevo estímulo con el habituado. Estímulo
la especificidad es una característica definitoria de la habituación (Rankin et al., 2009).
La especificidad del estímulo de la habituación resulta ser una propiedad muy útil
para ayudar a descartar la fatiga como posible causa de la disminución de la respuesta. Respuesta
La fatiga es un culpable obvio cuando la respuesta disminuye con repetidos
estimulaciones. Sin embargo, si la habituación se debiera a la fatiga, el participante
no responder incluso cuando se cambió el estímulo provocador. La recuperacion de
responder que ocurre con un cambio en el estímulo provocador descarta la respuesta
fatiga y es una de las pruebas que indican que la habituación refleja un
proceso neural central en lugar de cambios en los mecanismos motores periféricos.
Las pruebas con estímulos novedosos se llevan a cabo de forma rutinaria en estudios de habituación.
con bebés. Los bebés pueden dejar de mirar un estímulo visual por una variedad de
razones. Pueden cansarse o estar inquietos o pueden quedarse dormidos. Para estar seguro de que
siguen prestando atención y participando activamente en el experimento, novedoso
se introducen estímulos. Los resultados del experimento se consideran válidos solo si
los nuevos estímulos producen la recuperación de la respuesta habituada.
Los investigadores han aprovechado la especificidad de estímulo de la habituación.
para estudiar una amplia gama de problemas en la percepción y cognición infantil (Colombo &
Mitchell, 2009). Antes de que puedan hablar, los bebés no pueden decirnos con palabras
qué estímulos consideran similares y cuáles son diferentes.
Sin embargo, pueden proporcionar respuestas a tales preguntas en sus respuestas a las pruebas.
estímulos que siguen a la habituación.
La tarea de habituación infantil se ha utilizado, por ejemplo, para determinar
si los bebés de 5 meses perciben las posturas corporales basadas en un enfoque holístico
representación del cuerpo o representaciones de partes individuales del cuerpo. En uno
experimento (Hock, White, Jubran y Bhatt, 2016), los bebés fueron los primeros
habituado a la imagen de una persona en una postura particular ( Figura 3.3A ) oa una
brazo desconectado y una pierna presentada en posiciones similares (Figura 3.3B). Después
habituación, un brazo de la persona se presentó en una posición nueva, con un
cambio similar en el brazo desconectado. Los infantes mostraron recuperación del
Respuesta de atención visual solo con la imagen de la persona en una nueva postura.
(Figura 3.3A). No reconocieron el brazo desconectado presentado en un nuevo
Página 58
posicionarse como un nuevo estímulo ( Figura 3.3B). Este resultado sugiere que los bebés
estaban procesando posturas corporales basadas en una representación holística del cuerpo
en lugar de sus partes.
FIGURA 3.3
Especificidad de estímulo de la habituación. Los bebés se habituaron por primera vez a la imagen de una persona.
en una postura particular (Panel A) o en un brazo y una pierna desconectados presentados en similar
posiciones (Panel B). Después de la habituación, los bebés fueron evaluados con un cambio en el
posición del brazo. Los bebés mostraron recuperación de la respuesta de atención visual solo
cuando el brazo era parte de una persona. De “The Whole Picture: Holistic Body Posture
Reconocimiento en la infancia ”, por A. Hock, H. White, R. Jubran y RS Bhatt, 2016,
Psychonomic Bulletin & Review , 23 , pág. 428. Copyright 2016 de Springer. Adaptado con
permiso.
Página 59
Efectos del tiempo sin estimulación

Los efectos de la habituación suelen ser temporales. Se disipan o se pierden con el paso del tiempo
sin presentación del estímulo provocador. Una pérdida del efecto de habituación es
evidente en una recuperación de responder. Esto se ilustra en la Figura 3.4.. Porque el
la recuperación de la respuesta se produce por un período sin estimulación (un período de descanso),
el fenómeno se llama recuperación espontánea .
FIGURA 3.4
Recuperación espontánea de una respuesta habituada. Un período de descanso sin estímulos.

presentaciones ocurrieron entre los puntos A y B, lo que provocó una recuperación de la
respuesta habituada. Los datos son hipotéticos.
La recuperación espontánea es una característica común de la habituación (Rankin et al.,

2009). Si su compañero de cuarto enciende la radio mientras está estudiando, puede
fíjese en él al principio, pero luego llegará a ignorar el sonido si no es demasiado alto.
Sin embargo, si la radio se apaga durante una hora o dos y luego se vuelve a encender
de nuevo, lo notarás de nuevo. El grado de recuperación espontánea está relacionado con
la duración del período sin que suene la radio. Períodos más largos sin
La presentación del estímulo provocador da como resultado una mayor recuperación de la respuesta.
Página 60
Se produce una recuperación cada vez menos espontánea con repeticiones de lo espontáneo.
procedimiento de recuperación. ¿Cuánto tiempo de descanso se requiere para observar
La recuperación espontánea de la habituación varía según las diferentes situaciones. Para
ejemplo, la habituación de la respuesta de la novedad al gusto muestra poca espontaneidad
recuperación incluso después de una semana o dos.
Los animales, incluidas las personas, son cautelosos al ingerir alimentos o bebidas que
tiene un sabor desconocido. Este fenómeno se conoce como neofobia del sabor . Sabor
La neofobia probablemente evolucionó porque las cosas que tienen un sabor nuevo o desconocido pueden
seremos venenosos. Con la exposición repetida a un nuevo sabor, el neofóbico
la respuesta se atenúa. El café, por ejemplo, a menudo provoca una aversión
respuesta en un niño que lo prueba por primera vez. Sin embargo, después de tomar café
sin efectos nocivos, la respuesta neofóbica del niño se verá disminuida o
habituado. Una vez que esto ha ocurrido, es probable que la habituación sea duradera.
Habiéndose acostumbrado al sabor del café, es poco probable que una persona
experimentar una respuesta neofóbica incluso si pasa un par de semanas sin
tomando café. Los estudios con ratas de laboratorio no han mostrado

recuperación de la neofobia del sabor durante períodos de hasta 17 y 24 días (Domjan,
1976).
Los efectos de la habituación se han clasificado según exhiban
Recuperacion espontanea. Casos en los que se produce una recuperación espontánea sustancial
se denominan habituación a corto plazo , mientras que los casos en los que
la recuperación espontánea que no ocurre se llama habituación a largo plazo . Pequeño-
la habituación a largo plazo y a largo plazo no se excluyen mutuamente. A veces ambos
Se observan efectos. Los efectos de habituación a largo plazo son efectos de aprendizaje genuinos
porque satisfacen el criterio de durabilidad. Por el contrario, a corto plazo
Los efectos de habituación proporcionan evidencia menos convincente de aprendizaje porque son
menos duradero.
Efectos de la frecuencia de estímulo

La frecuencia de un estímulo se refiere a la frecuencia con la que se repite el estímulo en un
período de tiempo determinado: la frecuencia con la que se produce el estímulo por minuto, por ejemplo.
Cuanto mayor sea la frecuencia del estímulo, menor será el período de descanso entre
repeticiones del estímulo. Como vimos en el fenómeno de la espontánea
recuperación, la duración del descanso entre estimulaciones puede influir significativamente
respondiendo. Debido a que las frecuencias de estímulo más altas permiten
recuperación entre ensayos, la respuesta generalmente disminuye más rápidamente con más
Página 61
presentaciones frecuentes del estímulo (Davis, 1970). Una forma de reducir

habituación es aumentar sustancialmente cuánto tiempo ocurre entre
repeticiones de un estímulo provocador.
Efectos de la intensidad del estímulo

La habituación también está determinada por la intensidad del estímulo provocador. En
En general, la respuesta disminuye más lentamente si el estímulo provocador es más intenso.
(Rankin et al., 2009). Por ejemplo, las ratas de laboratorio tardan más en perder su
respuesta neofóbica a un sabor fuerte que a un sabor débil (Domjan & Gillan,
1976).
Efectos de la exposición a un segundo estímulo

Una de las características notables de una respuesta habituada es que no es
determinado sólo por el estímulo provocador. El nivel de respuesta también es
influenciado por otros estímulos que el organismo encuentra en ese momento. En particular,
La exposición a un nuevo estímulo puede resultar en la recuperación de la respuesta cuando el
se reintroduce el estímulo previamente habituado. Este fenómeno se llama
deshabituación (Rankin et al., 2009).
Los resultados de un experimento sobre la deshabituación se resumen en la Figura
3.5 . La fijación visual de los bebés humanos se midió en respuesta a un 4 × 4
patrón de tablero de ajedrez (Kaplan, Werner y Rudy, 1990). Como era de esperar, la repetición
del estímulo visual resultó en una disminución o habituación de la respuesta de mirada
de los infantes. Después de la Prueba 8, se presentó un tono (1000 Hz, 75 dB) como
estímulo deshabitado
que la presentación deljunto
tonocon el patrón
provocó una de tablero de ajedrez. Figura
recuperación significativa de3.5 muestra
la fijación visual al
Patrón 4 × 4. La respuesta al estímulo visual habituado original fue así
realzado por la presentación del tono deshabitado.
FIGURA 3.5
Página 62
Deshabitación de una respuesta habituada. La fijación visual en los bebés se habituó a un

estímulo de tablero de ajedrez presentado en las Pruebas 1 a 8. Presentación de un tono con el
El estímulo visual provocó la deshabituación de la respuesta atencional durante una
ensayo de prueba (T). De Advances in Infancy Research (Vol.6, p. 98), por C. Rovee-Collier y
LP Lipsitt (Eds.), 1990, Norwood, Nueva Jersey: Ablex. Copyright 1990 de Elsevier. Adaptado con
permiso.
El fenómeno de la deshabituación es útil para descartar la adaptación sensorial.

como causa de habituación. La adaptación sensorial es una reducción en la eficacia de un
receptor sensorial para responder a la estimulación. Si la disminución en la respuesta a la
El estímulo visual en la Figura 3.5 se había debido a la adaptación sensorial de la
sistema, la presentación de un tono deshabitado no habría producido
recuperación de la respuesta de atención visual. La deshabituación, junto con el estímulo
especificidad de la habituación, indica que la habituación refleja un neural central
proceso en lugar de cambios en los mecanismos sensoriales o motores periféricos.
Desafortunadamente, el término deshabituación se usa de manera inconsistente en la investigación.
literatura. En estudios con bebés humanos, el término deshabituación se usa para referirse
Página 63
a la recuperación de una respuesta habituada que ocurre cuando el estímulo habituado es

cambia y se prueba un nuevo estímulo (p. ej., Kavšek, 2013). En contraste, en
investigación con otras especies y sistemas de respuesta, la deshabituación está reservada para
casos en los que la introducción de un segundo estímulo produce una recuperación en
respondiendo al estímulo habituado original. Este último uso fue defendido
de Thompson y Spencer (1966) en su obra fundamental que proporcionó la
fundamentos de la investigación contemporánea sobre la habituación. La distinción entre
la especificidad del estímulo de la habituación y la deshabituación sigue siendo importante en
neurociencia contemporánea (Rankin et al., 2009).
CARACTERÍSTICAS DE LOS EFECTOS DE SENSIBILIZACIÓN

Los efectos de sensibilización están influenciados por la misma intensidad y tiempo de estímulo.
factores que gobiernan los fenómenos de habituación. En general, mayor sensibilización
Los efectos (mayores incrementos en la respuesta) ocurren con estímulos de provocación más intensos.
(Groves, Lee y Thompson, 1969).
Al igual que la habituación, los efectos de sensibilización pueden ser a corto o largo plazo (p. Ej.,
Davis, 1974). La sensibilización a corto plazo decae en función del tiempo sin
presentaciones del estímulo. A diferencia de la decadencia de la habituación a corto plazo, que
se llama recuperación espontánea , la desintegración de la sensibilización a corto plazo no tiene
nombre especial. No se llama recuperación espontánea porque la respuesta disminuye
(en lugar de recuperarse) a medida que la sensibilización se disipa. En contraste con el corto plazo
sensibilización, la sensibilización a largo plazo es evidente incluso después de períodos apreciables
sin estimulación. Como fue el caso de la habituación a largo plazo, a largo plazo
Los efectos de sensibilización satisfacen el criterio de durabilidad del aprendizaje, mientras que los
los efectos de sensibilización a largo plazo no lo hacen.
Un aspecto importante en el que la sensibilización es diferente de la habituación es
que la sensibilización no es tan específica para un estímulo en particular. Como señalé anteriormente,
La habituación producida por la exposición repetida a un estímulo no será evidente si
el estímulo se modifica sustancialmente. Por el contrario, la sensibilización no es tan estímulo
específico. Por ejemplo, la respuesta de sobresalto a un estímulo auditivo breve y fuerte puede
sensibilizarse mediante la exposición a un estímulo que provoque miedo. El sobresalto potenciado por el miedo ha
ha sido bien documentado en estudios con ambos animales de laboratorio (Davis et al.,
2008) y participantes humanos (Bradley, Moulder y Lang, 2005). En una similar
moda, la experiencia de la enfermedad aumenta o sensibiliza el sabor de la neofobia
respuesta, y una vez sensibilizada la neofobia del sabor, los participantes muestran
mayor meticulosidad a una variedad de diferentes estímulos gustativos (Domjan, 1977).
Página 64
La teoría del proceso dual de la habituación y

Sensibilización
Hasta ahora, he descrito los fenómenos conductuales de habituación y
sensibilización. No he discutido qué procesos o maquinaria subyacentes
podría producir estos efectos conductuales. Aquí consideramos una teoría prominente de
habituación y sensibilización, la teoría del proceso dual de Groves y Thompson
(1970). Aunque la teoría se propuso hace algún tiempo, sigue siendo relevante
(Thompson, 2009). La teoría se basó en estudios neurofisiológicos de
habituación y sensibilización, pero puede describirse como cercano al nivel de un
teoría del comportamiento.
La teoría del proceso dual se basa en dos procesos subyacentes, una habituación
proceso y un proceso de sensibilización. Desafortunadamente, los procesos tienen el mismo
nombres como los fenómenos conductuales que describí anteriormente. Sin embargo, la habituación
y los procesos de sensibilización son distintos de la habituación y la sensibilización
fenómenos o efectos. Los fenómenos de habituación y sensibilización son desempeño
efectos; son cambios observables en el comportamiento. En contraste, la habituación y
Los procesos de sensibilización se refieren a los eventos neuronales subyacentes que son responsables
para los cambios de comportamiento observados.
EL SISTEMA S – R Y EL SISTEMA ESTATAL

Según la teoría del proceso dual, los procesos de habituación y sensibilización
operan en diferentes partes del sistema nervioso. Uno de estos se llama S – R
sistema ; el otro se llama sistema estatal . El sistema S – R es el camino más corto
en el sistema nervioso entre un estímulo provocador y el resultado provocado
respuesta. El sistema S – R corresponde al arco reflejo de Descartes. Es el
mínima maquinaria fisiológica involucrada en un reflejo. Mínimamente, la S – R
sistema consta de tres neuronas: la sensorial (o aferente ) neurona , una
interneurona y una neurona eferente (o motora ) . El estímulo provocador activa
la neurona aferente. La neurona aferente a su vez activa la interneurona, que
luego activa la neurona eferente. La neurona eferente forma una sinapsis con la
músculos involucrados en hacer la respuesta provocada y desencadena el comportamiento
respuesta.
El sistema de estados consta de todos los procesos neuronales que no son parte integral
del sistema S – R pero influyen en la capacidad de respuesta del sistema S – R. Espinal
Los reflejos, por ejemplo, consisten en una neurona aferente que hace sinapsis con una
Página 65
interneurona en la médula espinal y una neurona eferente que se extiende desde la médula espinal
cordón al músculo relevante (ver Figura 2.1). Este es el sistema S – R de una columna
reflejo. Sin embargo, la médula espinal también contiene vías neurales que ascienden al
cerebro y los que descienden del cerebro. Estos ascendentes y descendentes
Las fibras sirven para modular los reflejos espinales y componen el sistema estatal para la columna vertebral.
reflejos.
Después de que uno comprende la distinción entre el sistema S – R y el estado
sistema, el resto de la teoría del proceso dual es bastante simple. Como señalé anteriormente, el
La teoría del proceso dual presupone la existencia de habituación separada y
procesos de sensibilización. Un aspecto crítico de la teoría se refiere a dónde estos
se ubican los procesos. Se supone que el proceso de habituación tiene lugar en el S–
R, mientras que se supone que el proceso de sensibilización tiene lugar en el estado
sistema.
Los procesos de habituación y sensibilización no son directamente evidentes en el
comportamiento del organismo. Más bien, el comportamiento observable refleja el efecto neto de
estos procesos. Los procesos de habituación y sensibilización sirven como oponentes
mecanismos que modulan la capacidad de respuesta refleja. Siempre que el proceso de habituación
es más fuerte que el proceso de sensibilización, el efecto neto es una disminución en el comportamiento
producción. Esto se ilustra en el panel izquierdo de la Figura 3.6.. Ocurre lo contrario si
el proceso de sensibilización es más fuerte que el proceso de habituación. En ese evento,
el efecto neto de los dos procesos es un aumento de la producción conductual. Este es
ilustrado en el panel derecho de Figura 3.6 .
FIGURA 3.6
Página 66
Mecanismos de la teoría del proceso dual de habituación y sensibilización. El rayado

Las líneas indican la fuerza del proceso de habituación (H) y sensibilización (S) a través
Ensayos. Las líneas continuas indican los efectos netos (o combinados) de estos dos procesos. En el
panel izquierdo, el proceso de habituación se vuelve más fuerte que el proceso de sensibilización,
lo que conduce a una disminución progresiva en la respuesta. En el panel derecho, el
El proceso de sensibilización se vuelve más fuerte que el proceso de habituación, lo que conduce a una
incremento progresivo en la respuesta.
Después de ser activado, tanto el proceso de habituación como la sensibilización

se supone que el proceso decae con el tiempo. Esta suposición de decadencia temporal es
necesario para explicar la habituación a corto plazo y la sensibilización a corto plazo
efectos.
IMPLICACIONES DE LA TEORÍA DEL DUAL PROCESO

Como el arco reflejo de Descartes, el sistema S – R es el mínimo o más primitivo
mecanismo de comportamiento provocado. Por lo tanto, el sistema S – R se activa cada
vez que se presenta un estímulo provocador. Porque el proceso de habituación opera
en el sistema S – R, cada activación del sistema S – R da como resultado una cierta acumulación de
el proceso de habituación. Esto hace que la habituación sea una característica universal de
comportamiento. Siempre que se presenta un estímulo provocador, el proceso de habituación es
activado hasta cierto punto.
La universalidad del proceso de habituación no significa que un decremento
en responder siempre será observado. Si es evidente un efecto de habituación
dependerá de si el proceso de habituación se contrarresta mediante la activación de
el proceso de sensibilización. Otro factor importante es el intervalo entre
presentaciones sucesivas del estímulo provocador. Si este intervalo es lo suficientemente largo,
habituación creada por la presentación de estímulo anterior tendrá la oportunidad de
decaer antes de que se repita el estímulo, y una disminución en la respuesta no será
observado. Por otro lado, si el intervalo entre presentaciones de estímulos es demasiado
corto para permitir la descomposición del proceso de habituación, una disminución en la respuesta será
ocurrir.
A diferencia del proceso de habituación, el proceso de sensibilización no siempre es
involucrado cuando se presenta un estímulo provocador. La sensibilización ocurre en el estado
sistema. El sistema estatal modula la capacidad de respuesta del sistema S – R, pero no es
esencial para la ocurrencia de la conducta provocada. Puede ocurrir un comportamiento provocado
a través del sistema S – R solo. Por tanto, la sensibilización no es un
propiedad de la conducta provocada.
Página 67
¿Cuándo se activa el proceso de sensibilización? Una forma informal de pensar

esto es que la sensibilización representa la excitación. Se produce sensibilización o excitación si el
El organismo encuentra un estímulo que es particularmente intenso o significativo. usted
puede excitarse por un ruido fuerte e inesperado o por alguien que le dice en un
voz suave que un amigo cercano resultó gravemente herido en un accidente. El sistema estatal
y los procesos de sensibilización son activados por estímulos intensos o significativos.
El proceso de sensibilización puede ser activado por el mismo estímulo que provoca
la respuesta refleja de interés. Este es el caso si una intensa o significativa
El estímulo se utiliza como estímulo provocador. El panel derecho de la Figura 3.6 ilustra
tal situacion. En ese ejemplo, el estímulo provocador produjo una sustancial
grado de sensibilización, con el resultado de que el efecto conductual neto fue un
aumento en la respuesta.
El proceso de sensibilización también puede ser activado por algún evento diferente al
provocando estímulo. Debido a que el sistema estatal está separado del sistema S – R, el
El sistema de estado puede ser activado por estímulos que no están registrados en el sistema S – R.
de la respuesta que se está midiendo. Esta es una característica crítica de la doble
teoría del proceso y otro aspecto en el que la sensibilización es diferente de
habituación. A diferencia de la habituación, la sensibilización no se produce necesariamente
por el estímulo que provoca el interés.
El hecho de que los procesos de sensibilización y habituación pueden ser activados por
diferentes estímulos permiten que la teoría del proceso dual explique una serie de
fenómenos, incluida la deshabituación. Como señalé anteriormente (ver Figura 3.5 ), el
La presentación de un estímulo deshabitado puede resultar en la recuperación de un
respuesta. En el ejemplo resumido en la Figura 3.5 , la presentación de un tono
provocó la recuperación de la respuesta de fijación visual habituada a un tablero de ajedrez
patrón. Según la teoría del proceso dual, esto ocurrió porque el tono
activó el sistema estatal y produjo suficiente sensibilización para superar la
acumulación previa de habituación al estímulo visual. En otras palabras,
La deshabituación se produce por la adición del proceso de sensibilización a un
situación de comportamiento en lugar de la reversión o debilitamiento de la habituación
proceso. (Para otra evidencia que apoya esta interpretación, vea Groves &
Thompson [1970] y Thompson [2009].)
La teoría del proceso dual tiene un éxito notable en la caracterización de
habituación a largo
no está diseñado plazo
para y efectos
explicar de sensibilización
la habituación a corto
a largo plazo plazo.
y la Sin embargo,
sensibilización la teoría
a largo fue
plazo.
Las explicaciones de habituación y sensibilización a largo plazo suelen incluir
mecanismos de aprendizaje asociativo, que discuto en los capítulos 4 hasta 6.
Página 68
Resumen
Comúnmente se considera que el comportamiento reflexivo o provocado es un comportamiento automático y
consecuencia invariante del estímulo provocador. Contrariamente a esta noción, repitió
presentaciones de un estímulo provocador pueden resultar en una disminución monótona en
respuesta (un efecto de habituación), un aumento en la respuesta (una sensibilización
efecto) seguido de una disminución o un aumento sostenido en la respuesta. Hasta ahora
de ser invariante, el comportamiento provocado es notablemente sensible a diferentes formas
de experiencia previa. La magnitud de los efectos de habituación y sensibilización.
depende de la intensidad y frecuencia del estímulo provocador. Respondiendo
provocado por un estímulo también puede ser alterado por la presentación previa de un
evento diferente (como en el fenómeno de la deshabituación).
Muchos de los hallazgos relacionados con la habituación y la sensibilización pueden ser
explicado por la teoría del proceso dual, que sostiene que los procesos que
producen una disminución de la respuesta en el sistema S – R, mientras que los procesos
que producen sensibilización ocurren en el sistema estatal. El sistema S – R está activado
cada vez que se presenta un estímulo provocador, haciendo de la habituación un universal
propiedad de la conducta provocada. La sensibilización, por el contrario, se produce sólo cuando la
organismo encuentra un estímulo que es lo suficientemente intenso o significativo para
activar el sistema estatal. A través de sus efectos aditivos, los procesos de
la habituación y la sensibilización sirven para modular el vigor de la conducta provocada.
Lecturas sugeridas
Colombo, J. y Mitchell, DW (2009). Habituación visual infantil. Neurobiología
de Aprendiendo y la memoria , 92 , 225–234.
http://dx.doi.org/10.1016/j.nlm.2008.06.002
Epstein, LH, Temple, JL, Roemmich, JN y Bouton, ME (2009).
La habituación como determinante de la ingesta alimentaria. Revisión psicológica , 116 ,
384–407. http://dx.doi.org/10.1037/a0015074
Kavšek, M. (2013). El modelo comparador de habituación visual infantil y
deshabituación: conocimientos recientes. Psicobiología del desarrollo , 55 , 793–808.
http://dx.doi.org/10.1002/dev.21081
Rankin, CH, Abrams, T., Barry, RJ, Bhatnagar, S., Clayton, DF, Colombo,
J.,. . . Thompson, RF (2009). Habituación revisada: una actualización y
descripción revisada de las características de comportamiento de la habituación.
Página 69
Neurobiología de Aprendiendo y la memoria , 92 , 135-138.

Términos técnicos
Neurona aferente
Deshabituación
Neurona eferente
Sabor neofobia
Efecto de habituación
Interneurona
Habituación a largo plazo
Sensibilización a largo plazo
Neurona motora
Orientación de la respuesta
Sistema S – R
Efecto de sensibilización
Neurona sensorial
Habituación a corto plazo
Sensibilización a corto plazo
Respuesta de sobresalto
Sistema Estatal
Página 70
Sabía usted que

Pavlov vio el condicionamiento clásico como una técnica para
estudiando el cerebro?
El condicionamiento clásico no se limita a glandular y visceral.
respuestas?
la respuesta condicionada no siempre es como la incondicionada
¿respuesta?
Los estímulos condicionados se vuelven parte del sistema de comportamiento.
activado por el estímulo incondicionado?
El condicionamiento no solo da como resultado nuevas respuestas a la
estímulo condicionado, pero también cambia la forma en que los organismos
interactuar con el estímulo incondicionado?
qué estímulo puede servir como un estímulo condicionado en
el condicionamiento clásico depende del estímulo incondicionado
que se usa?
el aprendizaje asociativo es posible en el control aleatorio
¿procedimiento?
El acondicionamiento pavloviano está involucrado en una amplia gama de
comportamientos, incluyendo preferencias y aversiones, miedos y
fobias, tolerancia a las drogas y adicción, y maternas y
Página 71
comportamiento sexual?
Me n Capítulo 3, Describí las formas en que el comportamiento cambia por la experiencia con
estímulos individuales. La habituación requiere presentar el mismo estímulo una y otra vez.
una vez más y, a veces, se lo denomina aprendizaje de estímulo único . Estamos ahora
listo para considerar cómo los organismos aprenden a unir cosas, cómo aprenden a
asociar un evento con otro. El aprendizaje asociativo es diferente del
aprendizaje por estímulo en el que el cambio en el comportamiento que se desarrolla a un estímulo
depende de cuándo ocurrió ese estímulo previamente en relación con un segundo
estímulo. El aprendizaje asociativo implica aprender sobre combinaciones de estímulos.
La primera forma de aprendizaje asociativo que consideraremos es pavloviano o
condicionamiento clásico.
Campana proverbial de Pavlov

Los elementos básicos del condicionamiento pavloviano o clásico son familiares para la mayoría de
estudiantes. Los relatos suelen describir un experimento apócrifo en el que
El profesor Pavlov tocó una campana justo antes de dar un poco de comida en polvo a los perros.
que estaba probando. Los perros estaban flojos y enganchados a un
aparato que permitió a Pavlov medir cuánto salivaban. Al principio el

los perros solo salivaban cuando se les daba la comida en polvo. Sin embargo, despus de
varias pruebas con la campana emparejada con la comida, los perros también vinieron a
salivar cuando sonó la campana.
La historia del profesor Pavlov entrenando a sus perros para salivar con una campana es útil
por introducir vocabulario técnico importante. Un estímulo como la comida
polvo que provoca la respuesta de interés sin entrenamiento previo se llama un
estímulo incondicionado , o EE . UU . La salivación provocada por la comida en polvo es una
ejemplo de una respuesta incondicionada , o UR . La campana es un ejemplo de
estímulo condicionado , o CS , y la salivación que se desarrolla a la campana se llama
la respuesta condicionada , o CR .
La campana proverbial de Pavlov ilustra el aprendizaje asociativo porque la salivación
la campana depende de presentar la campana en combinación con comida en polvo.
Tocar el timbre cada vez que el perro está a punto de recibir un poco de comida, presumiblemente
resulta en una asociación de la campana con la comida. Una vez que la campana se ha convertido
asociado a la comida, el perro comienza a responder a la campana como si fuera comida; eso
saliva cuando escucha la campana.
Página 72
Aunque la campana de Pavlov es familiar y útil para presentar los aspectos técnicos
términos usados para describir el condicionamiento pavloviano o clásico, la historia es
engañoso de varias formas. Primero, Pavlov rara vez, si es que alguna vez, usó una campana en su
experimentos. Se llevaron a cabo demostraciones iniciales de condicionamiento clásico.
con CS visuales (la vista de la comida que se iba a poner en la boca del perro)
en lugar de señales auditivas. En segundo lugar, la historia sugiere que el condicionamiento clásico
Implica principalmente la modificación de las respuestas visceral y glandular. BF
Skinner elevó esta implicación a un axioma, postulando que el clásico
El acondicionamiento solo puede modificar las respuestas glandulares y viscerales (p. ej., Skinner,
1953). Sin embargo, investigaciones posteriores han demostrado que esta suposición es
injustificado (Domjan, 2016). El acondicionamiento pavloviano puede producir muchos tipos de
CR, incluso acercarse a una señal de comida o acercarse a la taza de comida, tanto
de los cuales son respuestas esqueléticas en lugar de glandulares o viscerales.
Situaciones de condicionamiento contemporáneas

Aunque el condicionamiento clásico se descubrió en estudios de saliva
acondicionamiento con perros, los perros ya no se utilizan en tales experimentos, y
la salivación rara vez es la respuesta condicionada. En cambio, palomas, ratas,
conejos y estudiantes universitarios suelen participar en los experimentos, y varios
Las respuestas esqueléticas y fisiológicas están condicionadas. En algunos contemporáneos
Situaciones de condicionamiento pavloviano, EE. UU. Es un estímulo deseable o apetitivo,
como comida. Estas preparaciones se utilizan para estudiar el acondicionamiento apetitivo . En otra
situaciones, un evento desagradable o aversivo se utiliza como EE. UU. Tales preparativos
se utilizan para estudiar el condicionamiento aversivo o por miedo .
ACONDICIONAMIENTO APETITIVO
El acondicionamiento apetitivo se investiga con frecuencia con palomas y laboratorios.
ratas. Las palomas que sirven en experimentos de acondicionamiento apetitivo tienen un poco de hambre
y se prueban en una pequeña cámara experimental llamada caja Skinner (ver Figura
4.1 ). El CS es un punto circular de luz que se proyecta sobre un pequeño disco de plástico o
pantalla táctil encima de una taza de comida. Los picotazos en la luz se detectan automáticamente. los
El procedimiento de acondicionamiento consiste en encender la luz de la llave durante unos segundos y
luego presentando una pequeña cantidad de comida.
Página 73
FIGURA 4.1
Ensayo típico para acondicionar el seguimiento de señales o la autoformación en palomas. El condicionado

El estímulo (CS) es la iluminación de un pequeño disco circular o tecla de picoteo durante 6 segundos. los
El estímulo incondicionado (EE. UU.) es el acceso a la comida durante 4 segundos. Los ensayos CS-US se repiten,
con un intervalo entre ensayos de aproximadamente 1 minuto.
Después de varios emparejamientos de la luz clave con la comida, las palomas llegan a
acercarse y picotear la tecla cuando está encendida (Hearst y Jenkins, 1974; Tomie,
Brooks y Zito, 1989). El enfoque condicionado y el comportamiento de picoteo se desarrollan
incluso si la luz de la tecla se encuentra a cierta distancia del vaso de comida (Boakes, 1979).
La luz se convierte en una señal de comida y las palomas van donde está la luz.
situado. Por lo tanto, este tipo de respuesta condicionada se denomina seguimiento de señales.
Debido a que el procedimiento da como resultado que las palomas picoteen la tecla de respuesta sin
entrenamiento elaborado o modelado por el experimentador, el procedimiento también se llama
autoformado .
Las ratas de laboratorio también se utilizan en estudios de acondicionamiento pavloviano con alimentos.
como EE. UU. Si se utiliza una señal auditiva como CS que se presenta antes de cada comida
parto, las ratas se acercan y buscan la taza de comida como el CR a la señal auditiva
(Meyer, Cogan y Robinson, 2014). Este tipo de comportamiento se conoce como meta.
seguimiento porque el CR rastrea la ubicación del objeto objetivo o la comida. Firmar
El seguimiento y seguimiento de objetivos también se han encontrado en el condicionamiento sexual con
Página 74
codorniz domesticada, donde el CS viene a señalar el acceso a un potencial sexual

socio (Burns y Domjan, 2001).
Si el seguimiento de señales o el seguimiento de objetivos se desarrolla a medida que el CR depende de la
CS que se emplea y otros detalles del procedimiento de acondicionamiento. Además,
existen diferencias individuales significativas que determinan qué tipo de
ocurre el comportamiento condicionado. Estas diferencias individuales se han descubierto
en estudios con ratas utilizando un aparato de palanca retráctil (Flagel, Akil y Robinson,
2009). En estos experimentos, la extensión de una palanca de respuesta en el
La cámara experimental se utilizó como CS. Cada prueba de acondicionamiento comenzaba con
extensión de la palanca de respuesta, seguida de la entrega de comida en una taza de comida
(ver Figura 4.2 para un ejemplo de una rata en un aparato de presión de palanca). Con este
procedimiento, aproximadamente un tercio de las ratas desarrollaron seguimiento de signos y se acercaron
e hizo contacto con la palanca. Otro tercio de las ratas mostró seguimiento de objetivos
y se acercó y buscó en la taza de comida. Los sujetos restantes mostraron un
combinación de estas respuestas.
FIGURA 4.2
Rata en un experimento de supresión condicionada. Pulsando la palanca de respuesta de vez en cuando

produce una bolita de comida. Periódicamente se presenta un tono que termina en un breve shock.
a través del piso de rejilla. La rata viene a suprimir la presión de la palanca durante el tono.
Página 75
Las diferencias individuales en el seguimiento de señales frente al seguimiento de objetivos han atraído a una
mucho interés porque son reflejos de diferencias individuales en el
propensión a adquirir motivación incentivada. La motivación de los incentivos juega un papel importante
papel en las adicciones donde la exposición a las señales de la droga de elección hace que el
obtención de un reforzador del apetito irresistible. Individuos adictos a
alcohol, por ejemplo, encuentran irresistible la necesidad de beber cuando ven u huelen un
bebida alcoholica. Para ellos, la vista y el olor del alcohol se ha convertido en un fuerte
estímulo incentivador. Las respuestas a la vista y el olor del alcohol son seguimiento de señales.
CR (Zito y Tomie, 2014). Una investigación fascinante ha demostrado que el individuo
Las diferencias en el seguimiento de señales y el seguimiento de objetivos se basan genéticamente y están relacionadas con
diferencias neurobiológicas asociadas con la impulsividad y el abuso de drogas (Flagel
et al., 2011).
ACONDICIONAMIENTO AVERSIVO O POR MIEDO

El acondicionamiento aversivo se ha investigado extensamente utilizando el parpadeo
respuesta. El parpadeo es un componente temprano del reflejo de sobresalto. Parpadeo
El condicionamiento se desarrolló por primera vez con participantes humanos (véase Kimble, 1961, págs.
55–59). Una suave bocanada de aire en un ojo sirvió como EE. UU., Y una luz sirvió como
CS. Después de varios emparejamientos de la luz con el soplo de aire, la luz llegó a
provocar una respuesta condicionada de parpadeo. Posteriormente, técnicas para estudiar
El acondicionamiento del parpadeo también se desarrolló para su uso con ratas y conejos albinos.
para facilitar las investigaciones de la neurofisiología del aprendizaje. Con estos
especie, la irritación de la piel cerca de un ojo sirve como EE. UU., y una breve visión o
señal auditiva sirve como CS. Los emparejamientos de CS y US dan como resultado un condicionado
respuesta de parpadeo cuando se presenta el SC (Gormezano, Kehoe y Marshall,
1983).
Otra técnica de laboratorio común para estudios de condicionamiento aversivo
es el condicionamiento del miedo. Este procedimiento, que normalmente se lleva a cabo con ratas o ratones, requiere
ventaja del hecho de que los animales (incluidas las personas) tienden a quedarse inmóviles,
o congelarse, cuando tienen miedo. Un tono o luz sirve como CS, y un breve
el choque aplicado a través de un piso de rejilla sirve como EE. UU. Después de algunos emparejamientos de
tono o luz con el impacto, el CS llega a provocar una respuesta de congelación. En el
En una postura de congelación, la rata presenta una falta total de movimiento, excepto para respirar (N.
S. Jacobs, Cushman y Fanselow, 2010).
En una variante del condicionamiento del miedo conocida como supresión condicionada
procedimiento, las ratas se colocan en una cámara experimental que tiene una palanca de respuesta
Página 76
que está continuamente presente (en lugar de insertarse en la cámara como una señal
por comida). Se entrena a las ratas para que presionen la palanca para obtener una pastilla de comida. La comida es
luego se proporciona solo de forma intermitente para las presiones de palanca, lo que mantiene a las ratas presionando
la palanca a un ritmo constante. Después de que la presión de la palanca esté bien establecida, aversivo
Se introducen los ensayos de acondicionamiento. En cada una de estas pruebas, un tono o CS ligero es
presentado durante un minuto, seguido de una breve descarga en el pie. Dentro de unos pocos
ensayos de acondicionamiento, la presentación del CS da como resultado la supresión de la
respuesta reforzada al presionar la palanca. El grado de supresión de la presión de la palanca proporciona
una medida de cuánto miedo se ha condicionado al CS (Ayres, 2012).
La naturaleza de la respuesta condicionada

En los experimentos de acondicionamiento salival de Pavlov, el CR (salivación a un CS) fue un
respuesta visceral glandular similar en forma a la RU (salivación a la comida
polvo). Estas características del CR se consideraron universales.
características del condicionamiento clásico durante gran parte del siglo XX.
El condicionamiento pavloviano se consideró principalmente un mecanismo para
ajustar las respuestas fisiológicas y glandulares al medio ambiente a través de
experiencia (Skinner, 1938), y se asumió que la RC siempre sería similar a la
UR (por ejemplo, Mackintosh, 1974). Sin embargo, ninguno de estos supuestos es válido para
las situaciones de laboratorio que se utilizan comúnmente en la investigación contemporánea sobre
Acondicionamiento pavloviano.
El seguimiento de señales, el seguimiento de objetivos y las respuestas condicionadas de parpadeo son
respuestas esqueléticas en lugar de glandulares. En el acondicionamiento de parpadeo, el CR es
similar a la UR. Pero este no es el caso del condicionamiento del miedo. Aqui el pie
choque que sirve como EE. UU. provoca un sobresalto vigoroso y una respuesta de salto, pero el
CS llega a provocar una respuesta de congelación contrastante. En muchas situaciones pavlovianas,
el CR no es similar a las respuestas que obtienen los EE. UU.
Si no podemos asumir que el CR siempre será similar al UR, ¿cómo se puede
predecimos qué tipo de comportamiento se desarrollará con el condicionamiento pavloviano?
Ésta sigue siendo una cuestión desafiante. Un enfoque prometedor para responder a la
La pregunta se basa en la identificación de sistemas de comportamiento preexistentes que pueden
ser activado por un procedimiento de acondicionamiento pavloviano.
Introduje el concepto de sistemas de comportamiento en el Capítulo 2 . El concepto es
relevante para la presente discusión porque los EE. UU. en un condicionamiento pavloviano
procedimiento activa el sistema de comportamiento relevante para ese EE. UU. Presentaciones de
Página 77
alimento a un animal hambriento activar el sistema de alimentación, presentaciones de shock

activar el sistema de comportamiento defensivo, y las presentaciones de un EE. UU. sexual activan
el sistema de comportamiento reproductivo. La RC que se desarrolla depende de cómo la CS
se incorpora al sistema de comportamiento activado por los EE. UU. (Domjan &
Krause, en prensa).
El sistema de alimentación, por ejemplo, implica una secuencia de modos de respuesta.
comenzando con la búsqueda general y luego pasando a la búsqueda focal y la ingestión o
comportamiento consumatorio (ver Figura 4.3). Si se presenta un CS antes que el animal
recibe cada porción de comida, el CS se incorporará a uno de los
modos de respuesta del sistema de comportamiento alimentario, que a su vez determinará
qué tipo de RC realizará el organismo (Timberlake, 2001). Si el CS
se incorpora al modo de búsqueda focal, el CR consistirá en
respuestas de búsqueda como seguimiento de señales o seguimiento de objetivos (Wasserman, Franklin y
Hearst, 1974). Por el contrario, si el CS se incorpora al ingestivo,
modo de respuesta consumatoria, la RC implicará manipular y masticar el
CS (Boakes, Poli, Lockwood y Goodall, 1978).
FIGURA 4.3
Sistemas de comportamiento y condicionamiento pavloviano. Procedimientos de acondicionamiento con alimentos como

Los estímulos incondicionados (EE. UU.) involucran el sistema de alimentación. Como resultado de los emparejamientos de
estímulo condicionado (CS) con la comida, el CS se incorpora a la alimentación
sistema y llega a provocar respuestas relacionadas con los alimentos.
En el condicionamiento aversivo, la naturaleza de la RC está determinada por la

sistema de comportamiento defensivo (Rau & Fanselow, 2007). Choque de pie utilizado en estudios
de miedo condicionado es una fuente externa de dolor, muy parecido a ser mordido por un
depredador, y la respuesta al impacto es similar a la respuesta a la mordedura.
Cuando una rata es mordida por una serpiente, salta al aire. Del mismo modo, las ratas saltan cuando
reciben una breve descarga en el pie. La respuesta defensiva de la rata a un
El ataque inminente o posible es diferente de su respuesta al ataque en sí. Si
una rata ve u huele una serpiente que está a punto de atacar, la rata se congela. En el miedo
Página 78
procedimiento de acondicionamiento, el CS señala un ataque inminente. Por lo tanto, el CS

viene a provocar la congelación del comportamiento defensivo.
Debido a que el CS generalmente precede a la presentación de un EE. UU. En un Pavloviano
procedimiento de condicionamiento, las respuestas al CS son respuestas anticipatorias. Qué
El tipo de anticipación apropiado depende de cuánto tiempo tenga que esperar durante
se presenta la CS antes de los EE. UU. Por lo tanto, el intervalo entre el inicio de
la CS y el inicio de los EE. UU. es fundamental para determinar la naturaleza de la RC. En
condicionamiento aversivo, por ejemplo, un intervalo CS-US largo da como resultado
ansiedad, mientras que un intervalo corto CS-US resulta en miedo o pánico condicionado
(Waddell, Morris y Bouton, 2006). En condicionamiento sexual, un largo CS-US
intervalo activa el modo de búsqueda general, mientras que un intervalo corto CS-US
activa el modo de búsqueda focal (Akins, 2000).
Modificaciones condicionadas de lo incondicionado

Respuesta
En la discusión anterior, seguí la práctica común de hablar sobre
El condicionamiento pavloviano como aprender a anticipar un evento biológicamente significativo,
los Estados Unidos. ¿Por qué los organismos deberían responder anticipando algo? Que es
la ventaja de la anticipación? El valor de anticipar un evento significativo es
que puede lidiar con ese evento de manera más efectiva cuando ocurra. Esta sugerencia
que el condicionamiento pavloviano debería alterar la forma en que los organismos interactúan con los EE. UU.
De hecho, ese es el caso. Existe un creciente cuerpo de evidencia que confirma que
La presentación de un SC altera la forma en que los organismos interactúan con los EE. UU.
Una de las primeras áreas de investigación en las que se encontró el condicionamiento pavloviano
cambiar la forma en que los organismos interactúan con los EE. UU. es el acondicionamiento de drogas. Cuando nosotros
tomar una droga por motivos recreativos o terapéuticos, nos centramos en su
efectos farmacológicos o incondicionados. Sin embargo, también hay una fuerte
componente acondicionador porque las drogas se administran típicamente mediante un ritual
de algún tipo. Los efectos farmacológicos de la cafeína o una copa de vino, para
Por ejemplo, están precedidos por el olor y el sabor de las bebidas y el particular
lugar o hora del día en que se ingieren los medicamentos. Olor, gusto y otras señales.
relacionados con la función de administración de fármacos como CS que se asocian con la
efectos farmacológicos incondicionados de la cafeína y el alcohol.
Las drogas son perjudiciales para el funcionamiento fisiológico normal o fisiológico.
homeostasis. Con administraciones repetidas de un fármaco, el cuerpo llega a
Página 79
Anticipar estos efectos disruptivos y aprender a hacer ajustes compensatorios.

en previsión de la droga. Los ajustes anticipatorios son provocados por la
señales condicionadas y sirven para atenuar el impacto del fármaco una vez ingerido.
A través de este proceso, el impacto de la droga se reduce gradualmente, un resultado
conocida como tolerancia a las drogas .
Una implicación importante de estos mecanismos de aprendizaje es que la tolerancia a un
El medicamento se puede revertir si se toma en un lugar nuevo o en ausencia del
señales habituales de administración de fármacos. Una extensa investigación ha confirmado esto
predicción, así como muchas otras implicaciones del modelo de condicionamiento de
tolerancia a las drogas (Siegel, 2008). Una consecuencia desafortunada de la reversión de
La tolerancia a las drogas es que las dosis familiares de una droga que antes no eran letales.
se vuelven potencialmente mortales si el fármaco se toma en ausencia del fármaco habitual-
señales de administración (Siegel, 2016).
El modelo de condicionamiento de la tolerancia a los fármacos no es solo de
significado. También apoya la idea de que el condicionamiento pavloviano sirve para
modificar la forma en que los organismos responden a los EE. UU. Esta nueva perspectiva ha sido
documentado en una variedad de situaciones de condicionamiento pavloviano, incluido el miedo
condicionamiento, condicionamiento defensivo y condicionamiento sexual (Domjan, 2005).
En el condicionamiento sexual de la codorniz macho, por ejemplo, un CS se empareja con acceso
a una mujer sexualmente receptiva y la consiguiente cópula o coito. Con repetido
emparejamientos, el CS adquirirá propiedades motivacionales de incentivo y provocará signos
seguimiento. Sin embargo, un resultado más importante es que la exposición a un CS sexual
cambia significativamente la forma en que el macho copula con la hembra. El CS sexual
reduce la latencia del macho para iniciar la cópula, aumenta las respuestas de cortejo,
aumenta la eficiencia de la conducta copulatoria y mejora la liberación de
espermatozoides y fertilización de óvulos (Domjan & Akins, 2011). Todos estos
Los cambios en el comportamiento representan cambios en la forma en que el hombre interactúa con los EE. UU.,
que en este caso es una pareja sexual femenina.
Factores de estímulo en el condicionamiento clásico

Los primeros investigadores del condicionamiento pavloviano asumieron que casi cualquier
El estímulo que el organismo podría detectar podría usarse eficazmente como un SC. Esta
la suposición ha resultado ser incorrecta. En esta sección, describo dos factores
que determinan la efectividad de un CS: la novedad del CS y la naturaleza de
los Estados Unidos.
Página 80
LA NOVEDAD DE CS Y EL EFECTO DE INHIBICIÓN LATENTE

La novedad de un estímulo es un factor poderoso que determina su impacto conductual. Como
vimos en el Capítulo 3 , las exposiciones repetidas a un estímulo pueden resultar en una
efecto de habituación, lo que hace que los estímulos muy familiares sean menos efectivos para provocar
reacciones conductuales vigorosas que los estímulos nuevos. La habituación también puede reducir la
efectividad de un estímulo que luego se usa como CS en un condicionamiento pavloviano
procedimiento. Este fenómeno se llama efecto de inhibición latente (Lubow &
Weiner, 2010).
Los estudios del efecto de inhibición latente se suelen realizar en dos fases,
la fase de preexposición y la fase de acondicionamiento. En la fase de preexposición,
los participantes reciben presentaciones repetidas del estímulo que se utilizará
más tarde como el CS. Por ejemplo, un tono que posteriormente se emparejará con la comida.
puede presentarse varias veces durante la fase de preexposición. Durante esto
fase, el tono se presenta por sí mismo, sin EE. UU. Después de la preexposición
fase, el tono se empareja con la comida de EE. UU., utilizando el clásico convencional
procedimientos de acondicionamiento. El resultado típico es que la preexposición al CS retrasa la
desarrollo posterior de condicionada respondiendo al tono.
El efecto de preexposición a CS se ha interpretado como un reflejo
Procesos. Presentaciones repetidas de un tono (por ejemplo) durante el
Se supone que la fase de preexposición reduce la atención del participante al tono,
y esto a su vez se supone que interrumpe el condicionamiento pavloviano posterior de la
tono (por ejemplo, Schmajuk, 2010). Debido a la participación de atencionales
procesos, el efecto de inhibición latente se ha vuelto popular como técnica para
estudiar los mecanismos y trastornos cerebrales como la esquizofrenia que involucran
déficits de atención (Lubow, 2011).
ASOCIACIONES SELECTIVAS Y PERTINENTES CS-EE. UU.

La efectividad de un estímulo como CS en el condicionamiento pavloviano también depende
en los EE. UU. que se utiliza. Como señalé anteriormente, las presentaciones de una comida estadounidense (p. Ej., Comida) sirven
para activar el sistema de comportamiento relevante para ese EE. UU. Por lo tanto, el comportamiento de alimentación
El sistema se activa cuando la comida se presenta repetidamente a una paloma hambrienta. Como yo
previamente enfatizado, cada sistema de conducta está asociado con su propio
conjunto distintivo de respuestas. Los sistemas de comportamiento también se caracterizan por
reactividad mejorada a un conjunto distintivo de estímulos. Las palomas, por ejemplo, tienden a
localizar la comida a simple vista y estar muy en sintonía con las señales visuales cuando se alimentan
Página 81
el sistema está activado. Esto hace que las señales visuales sean especialmente efectivas en pavloviano.
acondicionamiento con comida para palomas.
La primera evidencia clara de que la efectividad de un CS depende de los EE. UU.
que se utilizó se obtuvo en estudios de acondicionamiento de aversión en ratas de laboratorio.
El fenómeno de supresión condicionada ilustra un tipo de aversión
acondicionamiento. Aquí un tono o luz se empareja con shock, con el resultado de que el
CS adquiere propiedades aversivas. Otro tipo de condicionamiento de la aversión es el gusto.
aprendizaje de la aversión . Aquí, un sabor nuevo es seguido por una enfermedad postingestiva (p. Ej.,
un caso leve de intoxicación alimentaria), y el organismo aprende una aversión a la novela
sabor como resultado.
Los fenómenos de aprendizaje de supresión condicionada y aversión al gusto
demostrar que las señales auditivas y visuales y las señales gustativas son muy eficaces
como CS. Curiosamente, sin embargo, son efectivos solo en combinación con sus
propio particular de EE. UU. (ver Figura 4.4). Las ratas no aprenden fácilmente una aversión a un
señal auditiva o visual emparejada con la enfermedad, ni aprenden fácilmente una aversión a
una señal gustativa emparejada con la conmoción (García y Koelling, 1966). Tales resultados ilustran
el fenómeno de relevancia CS-US , o asociación selectiva . El García
El efecto de asociación selectiva de Koelling se encontró con un gran escepticismo cuando se
informaron, pero gran parte de ese escepticismo ha sido puesto a descansar por posteriores
investigación que ha confirmado el fenómeno en una variedad de contextos y bajo
circunstancias que han descartado diversas interpretaciones alternativas (Domjan,
2015).
FIGURA 4.4
Página 82
Procedimiento y resultados del experimento de García y Koelling (1966) que demuestra

asociaciones selectivas en el aprendizaje por aversión.
Al igual que las ratas de laboratorio, las personas también aprenden las aversiones a los estímulos de forma selectiva.
Las personas que experimentan alguna forma de enfermedad gastrointestinal tienen más probabilidades de
aprenden una aversión a un alimento nuevo que comieron justo antes de enfermarse de lo que son
para aprender una aversión a otros tipos de estímulos que puedan haber encontrado.
De acuerdo con el efecto de asociación selectiva, las personas no informan haber adquirido un
aversión a la comida si se lastiman en un accidente físico o si desarrollan una
erupción cutánea irritante (Logue, Ophir y Strauss, 1981; Pelchat y Rozin, 1982).
Solo las experiencias de enfermedad son efectivas para inducir una aversión a la comida.
Desde la demostración inicial del efecto de asociación selectiva en la aversión
aprendizaje, estos efectos también se han encontrado en otras formas de aprendizaje. Para
Por ejemplo, Shapiro, Jacobs y LoLordo (1980) encontraron que las palomas son más
Es probable que asocie un estímulo visual que un estímulo auditivo con la comida.
Sin embargo, cuando las aves están condicionadas por el shock, la señal auditiva es más
Es probable que se condicione que la señal visual. Asociaciones selectivas también
ocurren en el condicionamiento del miedo de los primates (Mineka y Öhman, 2002). Monos y
La gente aprende a tener miedo de ver serpientes con más facilidad que ver serpientes.
flores. Esto parece ser el resultado de una predisposición evolutiva. Mejorado
Se ha observado sensibilidad a la vista de serpientes en bebés humanos tan jóvenes como
8 a 14 meses de edad (LoBue & DeLoache, 2010).
El problema de control en el condicionamiento pavloviano

La característica crítica del condicionamiento pavloviano es que implica la formación de
una asociación entre un CS y un EE. UU. Por tanto, ante cualquier cambio de comportamiento
puede atribuirse al condicionamiento pavloviano, hay que demostrar que el efecto
no se produce por otros factores que no involucren una asociación.
Para promover el desarrollo de una asociación, los condicionados y los EE. UU.
para ser presentados en combinación entre sí. Es particularmente eficaz, para
ejemplo, presentar la CS justo antes de la presentación de los EE. UU. en cada
ensayo de acondicionamiento. (Tengo más que decir sobre esto en el Capítulo 5.) Además
Por lo general, se necesitan varias pruebas de acondicionamiento para obtener un efecto de aprendizaje. Por lo tanto, un
El procedimiento de acondicionamiento pavloviano implica presentaciones repetidas de los CS y
EE. UU. Sin embargo, como vimos en el Capítulo 3, las presentaciones repetidas de estímulos pueden
Página 83
también dan lugar a efectos de habituación y sensibilización. Esto implica que la habituación
y los efectos de sensibilización pueden ocurrir durante el curso del acondicionamiento pavloviano.
Efectos de habituación y sensibilización debidos a CS y US repetidos
las presentaciones no dependen de la formación de una asociación entre el CS
y US y, por lo tanto, no constituyen un condicionamiento pavloviano. Habituación
Los efectos típicamente son de poca preocupación porque la habituación da como resultado una disminución
responder, mientras que el condicionamiento pavloviano implica una mayor respuesta a
el CS. El aumento de la respuesta al CS puede deberse a la sensibilización
como resultado de la exposición al CS o de la deshabituación o sensibilización resultante de
Presentaciones en Estados Unidos. Deben utilizarse procedimientos de control para descartar tales
efectos de sensibilización en estudios de acondicionamiento pavloviano.
Una solución universalmente aplicable y aceptable al problema de control en
No se ha encontrado condicionamiento pavloviano. En cambio, una variedad de controles
Se han utilizado procedimientos, cada uno con sus propias ventajas y desventajas. En
un procedimiento, los efectos de sensibilización al CS se evalúan presentando repetidamente
el CS por sí mismo. Dicho procedimiento, llamado control solo con CS , es inadecuado
porque no tiene en cuenta la posibilidad de una mayor respuesta a
el CS debido a los efectos de la deshabituación o sensibilización de los EE. UU. Otro control
El procedimiento implica presentar repetidamente a los EE. UU. por sí mismos (el control solo de EE. UU. )
para medir la sensibilización inducida por EE. UU. Este procedimiento, sin embargo, no
considere los posibles efectos de sensibilización debido a las presentaciones repetidas de CS.
En 1967, Rescorla propuso una ingeniosa solución, conocida como el azar
procedimiento de control , que pareció superar las deficiencias del CS solo
y controles exclusivos de EE. UU. En el procedimiento de control aleatorio, CS y US son ambos
presentados repetidamente, pero en momentos aleatorios en relación con los demás. Lo aleatorio
El tiempo de las presentaciones de CS y EE. UU. tiene la intención de prevenir la formación de un
asociación entre ellos sin interferir con los procesos de sensibilización.
El procedimiento de control aleatorio se hizo popular poco después de su introducción,
pero cuando los investigadores comenzaron a examinarlo en detalle, descubrieron algunos
dificultades (Papini y Bitterman, 1990). Los estudios demostraron que este procedimiento
no carece del todo de efecto, o es neutral, en la producción de aprendizaje. De asociación
el aprendizaje puede desarrollarse en un procedimiento de control aleatorio (por ejemplo, Kirkpatrick & Church,
2004). Una fuente de ese aprendizaje es que las presentaciones aleatorias de CS y EE. UU.
permitir instancias ocasionales en las que la CS se presenta junto con la
NOSOTROS. Si estos emparejamientos ocasionales entre CS y EE. UU. Ocurren al principio de una secuencia de CS aleatoria
y presentaciones estadounidenses, puede desarrollarse una respuesta condicionada (Benedict y Ayres,
1972).
Página 84
El aprendizaje asociativo también puede resultar cuando EE. UU. Se presenta sin el
CS en un procedimiento de control aleatorio. En tales casos, se presenta a EE. UU.
con las señales contextuales de fondo de la cámara experimental. Estas
Las señales de fondo fueron ignoradas durante gran parte del desarrollo temprano de
Teoría del condicionamiento pavloviano. Sin embargo, investigaciones más recientes han demostrado que
La presentación repetida de un EE. UU. en ausencia de una CS explícita puede resultar en
condicionamiento sustancial de las señales de fondo (Balsam y Tomie, 1985).
Aunque no hay un procedimiento de control completamente satisfactorio para Pavlovian
acondicionamiento está disponible, el procedimiento de control discriminativo es un
estrategia. Este procedimiento se resume en la Figura 4.5 . El control discriminativo
implica dos CS, un CS + y un CS - . Los dos CS pueden ser, por ejemplo, un breve
tono y una breve luz. En la mitad de los ensayos, el CS + se presenta y se empareja con el
NOSOTROS. (El signo + indica que EE. UU. Se presenta con la CS).
los ensayos restantes, el CS - se presenta, y los EE. UU. no ocurren. (El - signo
indica que se omite EE. UU.). Los ensayos CS + y CS - se alternan aleatoriamente. Para
la mitad de los participantes, el tono sirve como CS + y la luz como CS - ;
para los participantes restantes, estas asignaciones de estímulo se invierten.
FIGURA 4.5
Diagrama del procedimiento de control discriminativo para el condicionamiento pavloviano. Dos tipos de
los ensayos ocurren en alternancia aleatoria. En algunos ensayos, un estímulo condicionado, el CS +, es
emparejado con el estímulo incondicionado (EE. UU.). En los ensayos restantes, otro condicionó
El estímulo, el CS−, se presenta solo. Respuesta condicionada más fuerte a CS + que a
CS− es evidencia de aprendizaje asociativo más que alguna forma de sensibilización.
¿Qué pasaría si las presentaciones de EE. UU. Solo sensibilizaran respondiendo a

las CS de luz y tono? La sensibilización no se basa en una asociación y, por lo tanto, no
Página 85
no depende de la combinación de un estímulo con EE. UU. Por tanto, la sensibilización es

Se espera que mejore la respuesta tanto al CS + como al CS - . Si solo sensibilización

ocurrido en el procedimiento de control discriminativo, los participantes responderían
al CS + y CS - de manera similar.
¿Qué tal el aprendizaje asociativo? En contraste con la sensibilización, asociativo
el aprendizaje debe ser específico para el estímulo que se combina con los EE. UU. Por lo tanto,
el aprendizaje asociativo debería elevar la respuesta al CS + más que al CS - .
Mayor respuesta al CS + que al CS - en el control discriminativo
proporciona una fuerte evidencia de aprendizaje asociativo.
El procedimiento de control discriminativo permite la evaluación de la asociación
efectos dentro de un solo grupo de sujetos (basado en cómo esos sujetos responden
diferente al CS + y al CS - ). Otro enfoque que se utiliza con frecuencia es
el procedimiento de control no apareado . En este procedimiento, se presentan la CS y la US
repetidamente, pero las presentaciones de estímulo se programan deliberadamente para que el
CS y US nunca ocurren juntos o en el mismo ensayo. Este procedimiento es
administrado a un grupo de control, que se compara con un grupo experimental
que recibe el CS emparejado con EE. UU. Mayor respuesta en el grupo emparejado
comparado con el grupo no apareado se considera evidencia de asociación
Acondicionamiento pavloviano.
Prevalencia del condicionamiento pavloviano

El condicionamiento clásico se investiga típicamente en situaciones de laboratorio.
Sin embargo, no tenemos que saber mucho sobre el condicionamiento clásico para darnos cuenta
que también es común fuera del laboratorio. El condicionamiento clásico es más
Es probable que se desarrolle cuando un evento (el SC) ocurre de manera confiable poco antes de otro.
(los Estados Unidos). Esto sucede en muchas áreas de la vida. La mayoría de los estímulos que encontramos
ocurren en una secuencia temporal ordenada debido a las limitaciones físicas de
causalidad. Algunas cosas simplemente no pueden suceder antes de que ocurran otras.
Las instituciones sociales y las costumbres también aseguran que los eventos ocurran de manera confiable.
secuencia. Siempre que un estímulo precede de forma fiable a otro, el clásico
el condicionamiento puede tener lugar, lo que le permite predecir lo que sucederá a continuación en
la base de eventos antecedentes que sirven como CS.
Un área de investigación que ha sido de particular interés es cómo las personas llegan
juzgar un evento como la causa de otro. En estudios de juicio causal humano,
Los participantes están expuestos a sucesos repetidos de dos eventos (p. ej., imágenes de un
Página 86
flor en flor y una regadera presentada brevemente en la pantalla de una computadora) en

varios arreglos temporales. En una disposición, por ejemplo, el riego
siempre puede ocurrir antes de la flor; en otro, ocurre en momentos aleatorios
relativo a la flor. Tras observar numerosas presentaciones de ambos objetos,
Se pide a los participantes de la investigación que indiquen su juicio en cuanto a la fuerza de
la relación causal entre ellos.
Los estudios de juicio causal humano son análogos a los estudios de Pavlovian
condicionamiento en que ambos implican experiencias repetidas con dos eventos y
respuestas basadas en la medida en que esos dos eventos están relacionados con una
otro. En vista de estas similitudes, cabría esperar que exista una considerable
común entre los resultados del juicio causal y el condicionamiento pavloviano
experimentos. Esa expectativa
2005), lo que sugiere ha sido confirmada
que los mecanismos en numerosos
asociativos pavlovianosestudios
pueden(Allan,
desempeñar un papel en la
numerosos juicios informales de causalidad que todos hacemos en el curso de nuestro
vidas.
Describí anteriormente en este capítulo cómo el condicionamiento pavloviano puede resultar en
la adquisición del miedo. Los mecanismos del condicionamiento del miedo son de considerable
interés debido al papel del condicionamiento del miedo en los trastornos de ansiedad, fobias,
y trastorno de pánico (Craske, Hermans y Vansteenwegen, 2006; Oehlberg y
Mineka, 2011). Como ya mencioné, el condicionamiento pavloviano también está involucrado
en tolerancia y adicción a las drogas (Siegel, 2008). Señales que acompañan de manera confiable
La administración de fármacos puede llegar a provocar respuestas relacionadas con el fármaco a través de
acondicionamiento. Al discutir este tipo de aprendizaje por parte de los adictos al crack, el Dr.
Scott Lukas del McLean Hospital en Massachusetts describió los efectos de las drogas
estímulos condicionados diciendo que "estas señales activan los recuerdos relacionados con el crack,
y los adictos responden como los perros de Pavlov ”(Newsweek Staff, 2001, p. 40).
El condicionamiento pavloviano también está involucrado en las respuestas materna e infantil.
durante la lactancia. El amamantamiento implica una estimulación mutua para el bebé y la madre.
Para amamantar con éxito, la madre debe sostener al bebé en una posición especial,
que proporciona estímulos táctiles especiales tanto para el bebé como para la madre. los
Los estímulos táctiles experimentados por el bebé pueden condicionarse para provocar
orientación y respuestas de succión por parte del bebé (Blass, Ganchrow y
Steiner, 1984). Las señales olfativas que experimenta el bebé también se vuelven
condicionado durante los episodios de lactancia. Los bebés llegan a preferir la lactancia asociada
señales, con la preferencia evidente hasta un año después del episodio de acondicionamiento
(Delaunay-El Allam et al., 2010).
El condicionamiento pavloviano también es importante para aprender sobre situaciones sexuales.
Página 87
Las observaciones clínicas indican que el comportamiento sexual humano puede ser moldeado por
experiencias de aprendizaje, pero la evidencia experimental más extensa de sexualidad
El acondicionamiento se ha obtenido en estudios con animales de laboratorio (Domjan &
Akins, 2011). En estos estudios, los hombres suelen participar como participantes, y EE. UU.
es proporcionada por la vista de una mujer sexualmente receptiva o por
acceso a una mujer. Los sujetos llegan a acercarse a estímulos que señalan la disponibilidad
de una pareja sexual. La presentación de un CS sexualmente también facilita varios
aspectos del comportamiento reproductivo. Después de la exposición a un CS sexual, los machos son
más rápido para realizar respuestas copulatorias, competir con más éxito con otros
machos para acceder a una hembra, muestran más comportamiento de cortejo, liberan más
cantidades de esperma, muestran niveles aumentados de testosterona y luteinizante
hormona y producir más descendencia.
Resumen
Aunque los estudios del condicionamiento pavloviano comenzaron con el condicionamiento de
salivación y otras respuestas glandulares en perros, investigaciones contemporáneas
centrarse en condicionar las respuestas esqueléticas en el seguimiento de signos, condicionamiento del miedo y
acondicionador de parpadeo. Estas investigaciones han demostrado que diferentes tipos de
Las RC pueden desarrollarse, dependiendo de la naturaleza de la CS y del sistema de comportamiento.
activado por los EE. UU.
Debido a que el condicionamiento pavloviano implica el aprendizaje de una asociación
entre una CS y una US, cambios de comportamiento debido a la mera repetición de la CS y

Estados Unidos tiene que ser excluido. El procedimiento de control aleatorio no es efectivo en este
consideración porque puede resultar en aprendizaje asociativo. Aunque un
no se dispone de un procedimiento de control satisfactorio, el control discriminativo y
los procedimientos de control no apareados son razonablemente efectivos. En el discriminativo
procedimiento de control, un CS se empareja con los EE. UU. y se presenta otro CS
sin EE. UU. La respuesta diferencial a las dos EC proporciona evidencia de
aprendizaje asociativo. En el procedimiento de control no apareado, el CS se presenta en
momentos en los que es seguro que Estados Unidos no ocurrirá.
El condicionamiento pavloviano puede ocurrir dondequiera que un evento preceda de manera confiable
otro. Los ejemplos incluyen juicios de causalidad, tolerancia a las drogas y adicción,
amamantar y amamantar, y aprender a predecir posibles encuentros sexuales.
Página 88
Lecturas sugeridas
Bouton, ME, Mineka, S. y Barlow, DH (2001). Una teoría del aprendizaje moderna
perspectiva sobre la etiología del trastorno de pánico. Psychological Review , 108 , 4–
32. http://dx.doi.org/10.1037/0033-295X.108.1.4
Domjan, M. (2005). Acondicionamiento pavloviano: una perspectiva funcional. Anual
Revisar de psicología , 56 , 179–206.
http://dx.doi.org/10.1146/annurev.psych.55.090902.141409
Flagel, SB, Akil, H. y Robinson, TE (2009). Diferencias individuales en el
atribución de la prominencia del incentivo a las señales relacionadas con la recompensa: implicaciones para
adiccion. Neurofarmacología , 56 (Supl. 1), 139-148.
Papini, MR y Bitterman, ME (1990). El papel de la contingencia en la clásica
acondicionamiento. Psychological Review , 97 , 396–403.
Siegel, S. (2008). Aprendizaje y sabiduría del cuerpo. Aprendizaje y comportamiento ,
36 , 242-252. http://dx.doi.org/10.3758/LB.36.3.242
Términos técnicos
Acondicionamiento apetitivo
Aprendizaje asociativo
Autoformación
Acondicionamiento aversivo
Relevancia CS – EE. UU.
Respuesta condicionada (CR)
Estímulo condicionado (CS)
Supresión condicionada
Control discriminativo
Inhibición latente
Control aleatorio
Asociación selectiva
Seguimiento de señales
Caja desolladora
Aprendizaje de aversión al(UR)
Respuesta incondicionada gusto
Estímulo incondicionado (EE. UU.)
Procedimiento de control no emparejado
Página 89
Sabía usted que

retrasando el estímulo incondicionado (EE. UU.) un poco después del inicio
del estímulo condicionado (CS) produce evidencia más fuerte
de condicionamiento que presentar el CS y el US
¿simultaneamente?
una brecha de solo medio segundo entre la CS y la EE. UU. puede
perturbar seriamente el condicionamiento del miedo excitador?
las aversiones al gusto se pueden aprender con un retraso de varias horas
entre las CS y las CS?
La contigüidad CS-EE. UU. No es necesaria ni suficiente para
¿Acondicionamiento pavloviano?
diferentes contingencias CS-US producen diferentes niveles de
respuesta condicionada debido a las diferencias en el
condicionamiento de las señales contextuales?
Además de las asociaciones CS-US, los organismos pueden aprender
relaciones de orden superior en las que un CS señala cómo un segundo
¿CS se emparejará con EE. UU.?
Me n Capítulo 4, Presenté el condicionamiento pavloviano como un tipo de aprendizaje que

implica establecer una asociación entre dos estímulos, el condicionado
Página 90
el estímulo (CS) y el estímulo incondicionado (EE. UU.). Para dos estímulos o eventos para
asociarse entre sí, tienen que estar relacionados entre sí en
de alguna manera. En el presente capítulo, describo varias relaciones que pueden existir
entre una CS y EE. UU. También describo cómo las diferentes relaciones de estímulo determinan
lo que se aprende en el condicionamiento pavloviano.
Relación temporal entre CS y EE. UU.

Históricamente, la relación más prominente en el condicionamiento pavloviano es la
Relación temporal entre el CS y el EE. UU., cuando en el tiempo ocurren los estímulos.
en relación con los demás. Al pensar en varios arreglos temporales que son
posible entre un CS y un EE. UU., considere un cruce de ferrocarril en una carretera.
Los cruces de ferrocarril tienen luces intermitentes que indican que un tren está a punto de llegar. En
En este ejemplo, las luces intermitentes son el CS, y el tren que cruza la calle es el
NOSOTROS.
PROCEDIMIENTOS COMUNES DE ACONDICIONAMIENTO

Acondicionamiento Simultáneo
Quizás el arreglo temporal más simple es la presentación de una CS y una US
al mismo tiempo. Tal procedimiento se llama condicionamiento simultáneo y
implica contigüidad temporal perfecta , o coincidencia, entre CS y EE. UU. (ver
Figura 5.1). Debido a que el acondicionamiento simultáneo acerca el CS tan
posible para los EE. UU., uno podría suponer que sería el más eficaz
relación temporal para producir aprendizajes asociativos. Sorprendentemente, simultáneo
el condicionamiento rara vez produce una fuerte evidencia de aprendizaje. Por ejemplo,
El acondicionamiento simultáneo no produce una respuesta de parpadeo al CS (M.
C. Smith, Coleman y Gormezano, 1969).
FIGURA 5.1
Página 91
Procedimientos para acondicionamiento simultáneo, retardado y de trazas. Una prueba de acondicionamiento

(que implica una presentación del estímulo condicionado [CS] y el estímulo incondicionado
[EE. UU.]) Se muestra para cada procedimiento. En un experimento típico, la prueba de acondicionamiento es
repetido hasta que se desarrolle evidencia de aprendizaje.
Usando la analogía del cruce de ferrocarril, si se usara acondicionamiento simultáneo,

las luces intermitentes se encenderían cuando el tren ya estuviera en el cruce. En esto
caso, la luz intermitente no proporcionaría ninguna información nueva o predictiva
sobre la llegada del tren. No podías evitar ser atropellado por el tren.
respondiendo a las luces intermitentes. Por tanto, el condicionamiento simultáneo no conduce
a una respuesta condicionada anticipatoria. Sin embargo, un CS presentó
simultáneamente con el choque adquiere propiedades aversivas, que son evidentes si
uno mide la retirada o evasión del CS (Esmorís-Arranz, Pardo-
Vázquez y Vásquez-García, 2003).
Acondicionamiento retardado
La mayor parte de la evidencia del aprendizaje asociativo proviene de un tipo de procedimiento en
que la CS comienza poco antes de los EE. UU. en cada ensayo (Schneiderman &
Gormezano, 1964). Tal procedimiento se llama condicionamiento retardado porque el
EE. UU. Se retrasa después del inicio de la CS (consulte el panel central de la Figura 5.1 ).
Observe que en el procedimiento de acondicionamiento retardado, el CS permanece presente hasta
Página 92
ocurre en EE. UU., sin una brecha entre los estímulos. Medidas comunes de
acondicionamiento (parpadeo condicionado, seguimiento de señales y seguimiento de objetivos, y
congelación condicionada) reflejan la anticipación de los EE. UU. y se observan fácilmente
con un procedimiento de acondicionamiento retardado.
Las señales de advertencia en los cruces de ferrocarril suelen utilizar un acondicionamiento retardado.
procedimiento. Las luces intermitentes comienzan antes de que el tren llegue al cruce,
permitiéndole anticipar que el tren llegará pronto. El mas efectivo
El procedimiento de acondicionamiento retrasado es aquel en el que el CS comienza poco antes de la
NOSOTROS. Desafortunadamente, ese no suele ser el caso de los cruces de ferrocarril. Las luces
comienzan a parpadear algún tiempo antes de la llegada del tren, no inmediatamente antes
llega el tren. Esto anima a la gente a cruzar las vías rápidamente antes de que
aparece el tren. El uso de un intervalo más corto entre la señal y la llegada de
el tren desalentaría comportamientos tan riesgosos.
Acondicionamiento de trazas
La introducción de una brecha entre el CS y los EE. UU. Cambia un condicionamiento retrasado
procedimiento en acondicionamiento de trazas . Un ensayo de acondicionamiento de trazas se presenta en el
panel inferior de la Figura 5.1 en contraste con la prueba de acondicionamiento retardado que se muestra
en el panel. del medio. La brecha entre la CS y los EE. UU. Se llama rastro.
intervalo
Usando nuestro ejemplo de cruce de ferrocarril, un procedimiento de acondicionamiento de trazas
ser uno en el que las luces intermitentes terminaron 5 o 10 segundos antes que el tren
llegó. Si supieras que las luces intermitentes terminarían antes de que llegara el tren,
sería menos probable que se mantuviera alejado de las vías cuando las luces comenzaran a parpadear.
Más bien, evitaría las pistas cuando se apagaran las luces intermitentes.
La introducción de una brecha o intervalo de seguimiento entre la CS y los EE. UU. Puede
Reducir drásticamente el grado de respuesta condicionada que se desarrolla. En un
En un experimento temprano sobre el condicionamiento del miedo, Kamin (1965) descubrió que al introducir un
El intervalo de seguimiento de tan solo medio segundo redujo significativamente el nivel de
respuesta condicionada que ocurrió. Desde el trabajo de Kamin (1965),
Los investigadores han encontrado pruebas más sólidas de condicionamiento de trazas en una serie de
diferentes situaciones de aprendizaje. El acondicionamiento de trazas es de considerable interés
porque requiere un proceso que acorte la brecha en el tiempo entre el CS y el
NOSOTROS. Este proceso de puenteo de tiempo no es necesario para el acondicionamiento retardado.
Las investigaciones de las bases neurales del condicionamiento de trazas han identificado varios
formas en las que los circuitos neuronales requeridos para el acondicionamiento de trazas son diferentes
Página 93
de aquellos que están involucrados en el condicionamiento retardado (Kalmbach, Ohyama,

Kreider, Riusech y Mauk, 2009; Raybuck y Lattal, 2014).
EFECTOS DEL INTERVALO CS-EE. UU.

Otra relación temporal que es crítica para el aprendizaje asociativo es cuánto
pasa el tiempo entre el inicio de la CS y la presentación de los EE. UU. en cada
ensayo de acondicionamiento. El intervalo entre el inicio de la CS y el momento en que EE. UU.
presentado se denomina intervalo CS-US o intervalo entre estímulos .
Como señalé anteriormente, en muchas situaciones de condicionamiento, hay poca evidencia de
aprendizaje con acondicionamiento simultáneo, donde el intervalo CS-US es cero.
La respuesta condicionada es más probable con procedimientos de acondicionamiento retrasados,
donde el intervalo CS-US es mayor que cero. Sin embargo, los beneficios de retrasar
los Estados Unidos después del inicio de la CS son limitados. A medida que el intervalo CS-US se vuelve
cada vez más, la evidencia de que el aprendizaje disminuye. Que tan rápido respondiendo
disminuye a medida que aumenta el intervalo CS-US depende del sistema de respuesta que
está siendo condicionado.
La figura 5.2 ilustra los efectos del intervalo CS-US en tres condicionamientos
preparativos. El panel de la izquierda representa datos del condicionamiento de la nictitante.
respuesta de la membrana de los conejos. La membrana nictitante es un párpado secundario.
presente en muchas especies. Como el cierre del párpado primario, el cierre del
La membrana nictitante puede ser provocada incondicionalmente por una bocanada de aire en el ojo.
Se obtienen los mejores resultados en el acondicionamiento de la respuesta de la membrana nictitante
con intervalos CS-US de 0,2 a 0,5 segundos. Si el intervalo CS-US es más corto, menos
se desarrolla la respuesta condicionada. Además, la respuesta condicionada disminuye
rápidamente, ya que el intervalo CS-US se extiende más allá de medio segundo. Poco si alguno
el aprendizaje es evidente si el intervalo CS-US es de más de 2 segundos.
FIGURA 5.2
Página 94
Fuerza de la respuesta condicionada en función del estímulo condicionado (CS) -

intervalo de estímulo incondicionado (EE. UU.) en el condicionamiento de la respuesta de la membrana nictitante de
conejos (datos de Schneiderman y Gormezano [1964] y MC Smith, Coleman y
Gormezano [1969]), supresión condicionada (datos de Kamin [1965]) y sabor-
aprendizaje por aversión (datos de JC Smith y Roll [1967]).
El condicionamiento del miedo o la supresión condicionada representa un intermedio

caso. El miedo más fuerte se aprende con un intervalo CS-US que es menor que un
minuto, pero el aprendizaje también puede ocurrir con intervalos CS-US en el rango de 2 a 3
minutos.
El aprendizaje durante los intervalos CS-EE. UU. Más largos se observa en el aprendizaje de aversión al gusto.
En el procedimiento de aversión al gusto condicionado, la ingestión de un nuevo sabor
comida (o bebida) da como resultado algún tipo de enfermedad o malestar interoceptivo (Lin,
Arthurs y Reilly, 2017; Reilly y Schachtman, 2009). El sabor novedoso es el
CS, y la experiencia de la enfermedad sirve como EE. UU.
Se puede aprender una aversión al gusto incluso si la experiencia de la enfermedad se retrasa
varias horas después de la ingestión del nuevo sabor. Este fenómeno fue el primero
documentado por John García y sus asociados (por ejemplo, García, Ervin y Koelling,
1966) y se denomina aprendizaje con retraso prolongado porque representa el aprendizaje con CS–
Intervalos de EE. UU. Que son mucho más largos que los intervalos que admitirán
condicionamiento del parpadeo o supresión condicionada. Sin embargo, como figura 5.2
ilustra, incluso con el aprendizaje de aversión al sabor, una respuesta menos condicionada es
observado con intervalos CS-US más largos.
Página 95
CODIFICACIÓN TEMPORAL DE CUANDO OCURRE ESTADOS UNIDOS

Las diferencias en el aprendizaje que ocurren entre simultáneo, retardado y seguimiento.
condicionamiento y los efectos de intervalo CS-US que acabo de describir ilustran que
El condicionamiento pavloviano es muy sensible a los factores temporales. Un creciente y
Una impresionante línea de evidencia indica que los participantes aprenden mucho sobre el
hora precisa en la que se presenta EE. UU. en relación con la CS. Este tipo de aprendizaje
se llama codificación temporal (Molet & Miller, 2014). Evidencia de codificación temporal
indica que el condicionamiento pavloviano implica más que una simple "asociación"
entre la CS y EE. UU. Más bien, el condicionamiento pavloviano implica aprender
información precisa sobre cuándo ocurren los EE. UU. en relación con otros eventos en el
medio ambiente. De hecho, algunos han sugerido que este tipo de aprendizaje temporal es
más central para lo que ocurre en el condicionamiento pavloviano que el concepto familiar
de una asociación CS-EE. UU. (Balsam, Drew y Gallistel, 2010).
Conductores que cruzan una vía de ferrocarril cuando las luces en el cruce comienzan a
flash están demostrando codificación temporal. Han aprendido no solo que el
las luces intermitentes están asociadas con la llegada del tren, pero también la duración de las luces
están encendidos antes de que llegue el tren. Conocimiento de la sincronización del tren.
La llegada anima a los conductores a cruzar las vías antes de que las luces se hayan encendido muy
largo. Desafortunadamente, el aprendizaje de información temporal precisa requiere un poco de
práctica. En un cruce de ferrocarril, el aprendizaje temporal inadecuado puede tener consecuencias fatales.
Consecuencias.
Relación de señales entre CS y EE. UU.

En la sección anterior, describí algunas de las formas en que el
La relación entre CS y EE. UU. es importante en el condicionamiento pavloviano. Otro
factor importante es la relación de señal, o relación de información, entre el CS
y nosotros. En general, la respuesta condicionada se desarrolla más rápidamente con
Procedimientos en los que el CS proporciona información confiable sobre la ocurrencia.
de los Estados Unidos. En estos casos, la CS sirve como una señal confiable para EE. UU.
En el procedimiento típico de acondicionamiento retardado, cada prueba de acondicionamiento
Consiste en la presentación de la CS, seguida brevemente por la presentación de la
NOSOTROS. Además, los EE. UU. No ocurren a menos que estén precedidos por la CS. Por lo tanto,
Las ocurrencias de los EE. UU. se pueden predecir perfectamente a partir de las ocurrencias de la CS.
La CS señala perfectamente las ocurrencias de los EE. UU., Lo que resulta en una rápida adquisición de
una respuesta condicionada al CS.
Página 96
EL EFECTO BLOQUEO
¿Cómo podría interrumpirse la relación señal entre la CS y los EE. UU.? Una forma es
para presentar al CS objetivo con otra señal que ya predice los EE. UU. Si hay
otra señal que ya predice los EE. UU., el CS objetivo será redundante, y
es posible que no aprenda mucho al respecto. Si uno de sus pasajeros ya ha señalado
que su cochepasajero
El segundo está a punto de quedarse
es redundante y essin gasolina,
menos una advertencia
probable que controlesimilar de unde su
gran parte
atención. Esta idea, desarrollada por primera vez de forma experimental por Kamin, ha llegado a ser
conocido como efecto de bloqueo (Kamin, 1969).
Kamin estudió el efecto de bloqueo utilizando la supresión condicionada
procedimiento con ratas de laboratorio, pero el fenómeno puede ilustrarse más
efectivamente con un ejemplo hipotético de aprendizaje humano de aversión al gusto. Nos deja
suponga que es alérgico a los camarones y se enferma levemente cada vez que come
camarón. Debido a estas experiencias, adquieres una aversión al sabor de
camarón. En una ocasión especial, su pastor lo invita a una cena privada,
y el plato principal son camarones servidos con una verdura al vapor que no
recuerda haber comido antes. Porque no quieres ofender a tu anfitrión, comes
algo de verduras y camarones. La verdura sabe bastante bien, pero
terminas enfermándote un poco después de la comida.
¿Atribuirá su enfermedad al camarón o al vegetal nuevo que comió?
Dado su historial de reacciones negativas al camarón, es probable que atribuya su
enfermedad del camarón y puede que no adquiera aversión a la verdura. En esto
situación, la presencia del camarón previamente acondicionado bloquea la
condicionamiento de la nueva verdura a pesar de que la nueva verdura era tan
estrechamente emparejado con la enfermedad de EE. UU.
El efecto de bloqueo muestra que lo que las personas aprenden sobre un CS es
influenciado por la presencia de otras señales que fueron previamente condicionadas con
los mismos Estados Unidos. Los CS que Kamin usó en sus experimentos seminales fueron una luz y un
ruido de banda ancha (ver Figura 5.3). Para el grupo de bloqueo, el ruido CS fue el primero
condicionado emparejándolo con choque de pie un número suficiente de veces para producir
fuerte supresión condicionada a esta señal auditiva. En la siguiente fase del
experimento, los CS de ruido y luz se presentaron simultáneamente, terminando en
el shock de Estados Unidos. Un grupo de control también recibió el compuesto de luz y ruido emparejado
con shock, pero para este grupo, el ruido no había sido previamente condicionado.
Para el grupo de control, el ruido y la luz fueron ambos estímulos novedosos. El foco de
el experimento fue sobre cuánto miedo se condicionó a la nueva luz CS.
Página 97
Debido al condicionamiento previo del ruido en el grupo de bloqueo, menos

supresión condicionada desarrollada a la luz en el grupo de bloqueo que en el
grupo de control.
FIGURA 5.3
Diagrama del procedimiento de bloqueo en un experimento de supresión condicionada. Durante

Fase 1, un estímulo condicionado por ruido (CS) se condiciona con choque de pie en el
grupo experimental hasta que el ruido produzca la máxima supresión condicionada. los
El grupo de control no recibe un procedimiento de acondicionamiento en la Fase 1. En la Fase 2, ambos
Los grupos reciben ensayos de acondicionamiento en los que el ruido CS se presenta junto con un
novedoso CS ligero, y el compuesto de ruido-luz se combina con choque. Finalmente, durante el
Se mide la fase de prueba, respondiendo a la luz presentada sola. Menos condicionado
la supresión ocurre a la luz en el grupo experimental que en el grupo de control.
El fenómeno del bloqueo es importante porque ilustra que el tiempo

La contigüidad entre un CS y un EE. UU. no es suficiente para el éxito de Pavlovian
acondicionamiento. También es importante una fuerte relación de señal. La relación temporal
entre la nueva luz CS y la descarga de EE. UU. fue idéntica para el bloqueo y
los grupos de control. Sin embargo, la fuerte supresión condicionada se desarrolló sólo
si la luz no se presentó con el ruido previamente acondicionado. El anterior
El acondicionamiento del ruido redujo la relación de señal entre la luz y el impacto.
e interrumpió el condicionamiento del miedo a la luz.
CONTINGENCIA CS – EE. UU.

Históricamente, un enfoque importante para caracterizar la relación de señales entre
Página 98
a CS y US ha sido en términos de la contingencia entre los dos estímulos

(Rescorla, 1967). La "contingencia" entre dos eventos es una formal
caracterización de la medida en que la presencia de un estímulo puede servir como
una base para predecir al otro. La contingencia CS-EE. UU. Se define en términos de
dos probabilidades (ver Figura 5.4 ). Uno de ellos es la probabilidad de que EE. UU.
ocurrir dado que se ha presentado el CS [ p (US / CS)]; el otro es el
probabilidad de que ocurra EE. UU. dado que la CS no ha sucedido
[ p (US / noCS)].
FIGURA 5.4
Contingencia entre un estímulo condicionado (CS) y un estímulo incondicionado (EE. UU.).
La contingencia entre una CS y EE. UU. Está determinada por la probabilidad de que ocurra el EE. UU.
dado que el CS ha ocurrido (representado en el eje horizontal) y la probabilidad de
el caso de EE. UU. dado que el CS no ha ocurrido (representado en el eje vertical).
Cuando las dos probabilidades son iguales (la línea de 45 °), la contingencia CS-US es cero.
Una situación en la que EE. UU. Siempre se da con el CS y nunca por sí solo.
ilustra una perfecta contingencia positiva entre la CS y los EE. UU. Humo, para
ejemplo, siempre indica que algo se está quemando. Por tanto, la presencia de
EE. UU. (fuego) se puede predecir perfectamente a partir de la presencia del CS (humo). En
Página 99
Por el contrario, una situación en la que EE. UU. ocurre cuando el CS está ausente pero nunca
ocurre en los ensayos con el CS ilustra una perfecta contingencia negativa. En esto
caso, la CS señala la ausencia de los EE. UU. Si usa bloqueador solar cuando está en
la playa, es probable que evite las quemaduras solares que de otro modo se producirían
pasar un día en la playa. El bloqueador solar indica la ausencia de un
bronceado. Finalmente, si EE. UU. Ocurre con la misma frecuencia con y sin el SC, el
Se dice que la contingencia CS-EE. UU. Es cero. Cuando la contingencia entre el CS
y EE. UU. es cero, la CS no proporciona información útil sobre si EE. UU.
ocurra o no. Este es el caso si un perro ladra indiscriminadamente, esté o no
es un intruso presente. Una contingencia cero CS-EE. UU. También es característica de la
procedimiento de control aleatorio que describí en el Capítulo 4 .
Originalmente, se pensaba que la contingencia entre una CS y EE. UU. Determinaba
la formación de asociaciones CS-US directamente. Desde entonces, se ha vuelto más
común considerar la contingencia CS / US como una variable de procedimiento que predice
cuánto se desarrollará la respuesta condicionada. Análisis contemporáneos de
Los efectos de contingencia se han centrado en el condicionamiento de las señales de fondo que
están presentes en cualquier situación en la que un organismo se encuentra repetidamente
presentaciones de estímulos discretos condicionados e incondicionados. Procedimientos
que involucran diferentes contingencias CS-US dan como resultado diferentes grados de contexto
acondicionamiento.
Considere, por ejemplo, un procedimiento que implique una contingencia cero CS-EE. UU.
Dicho procedimiento implicará presentaciones de los EE. UU. Por sí mismos, presentaciones de
el CS en sí mismo, y presentaciones ocasionales del CS junto con los EE. UU.
Los ensayos solo en los EE. UU. Pueden resultar en un condicionamiento del fondo o contexto
claves en las que se lleva a cabo el experimento. La presencia de estos condicionados
Las señales contextuales de fondo pueden bloquear el condicionamiento futuro de lo explícito.
CS en las pocas ocasiones en que el CS se empareja con los EE. UU. (Tomie, Murphy,
Fath y Jackson, 1980) o interrumpir el desempeño de la respuesta condicionada
a través de un proceso de comparación, que discuto en el Capítulo 6 .

En los ejemplos de condicionamiento pavloviano que he discutido hasta ahora, el enfoque de
el interés estaba en cómo una CS se relaciona directamente con un EE. UU. Ahora pasemos a más
relaciones de estímulo complejas en el condicionamiento pavloviano. En un estímulo de orden superior
Página 100
relaciones, el foco de interés no está en cómo una CS señala a EE. UU., sino en cómo uno
CS proporciona información sobre la relación entre una segunda CS y EE. UU.
Por lo tanto, el término relación de estímulo de orden superior se refiere a la señalización o
modulación de un emparejamiento CS-US simple por otro CS. La frase adjetiva
se utiliza un orden superior porque uno de los elementos de esta relación es un CS-US
unidad asociativa. Al considerar las relaciones de estímulo de orden superior, primero discuto
inhibición condicionada o escenario de ocasión negativa. Luego paso a la
Fenómeno de facilitación o establecimiento de ocasiones positivas.
PROCEDIMIENTOS DE ACONDICIONAMIENTO INHIBIDORIO

La inhibición condicionada fue la primera relación de señal de orden superior en ser ampliamente
investigado. Los conceptos de inhibición son prominentes en varias áreas de
fisiología. Siendo fisiólogo, Pavlov estaba interesado no solo en los procesos
que activan la conducta, pero también en los que son responsables de la inhibición de
respondiendo. Esto lo llevó a investigar la inhibición condicionada. Él consideró el
condicionamiento de la inhibición para ser tan importante como el condicionamiento de
excitación (Pavlov, 1927).
En los procedimientos de condicionamiento excitador, el CS se convierte en una señal para el
inminente presentación de los Estados Unidos. En el condicionamiento inhibitorio, por el contrario, el CS
de interés se convierte en una señal de la ausencia de EE. UU. Sin embargo, esto solo ocurre
en circunstancias especiales porque normalmente la ausencia de algo no tiene
particular importancia psicológica. Si te digo de la nada que tengo
decidió no darle mil dólares, no es probable que se enoje,
porque no tenías ninguna razón para esperar que alguna vez te diera tanto
dinero. Si la ausencia de algo no es psicológicamente significativa, un CS
no puede convertirse en una señal para ese no evento. Para un acondicionamiento inhibitorio exitoso,
la ausencia de Estados Unidos tiene que ser destacada o importante.
Puedo hacerte decepcionar por no recibir mil dólares diciéndote
que ha participado en un concurso de sorteos y ha sido seleccionado como
el ganador de un premio de mil dólares. La ausencia de algo es
psicológicamente poderoso si tiene razones para creer que el evento tomará
lugar. En los procedimientos de acondicionamiento inhibitorio, se hace la ausencia de EE. UU.
sobresaliente por condicionamiento excitador que crea una expectativa positiva de que EE. UU.
ocurrira.
Página 101
El procedimiento estándar de inhibición condicionada

El procedimiento estándar de inhibición condicionada es análogo a una situación en
que se introduce algo que impide un resultado que de otro modo
ocurrir. Un semáforo en rojo en una intersección con mucho tráfico es una señal de peligro potencial (el
NOSOTROS). Sin embargo, si un oficial de policía le indica que debe cruzar la intersección
a pesar de la luz roja (tal vez porque los semáforos no funcionan bien),
probablemente no tendrá un accidente. La luz roja y los gestos del oficial
juntos no es probable que los siga el peligro. Los gestos inhiben o bloquean
su vacilación para cruzar la intersección debido a la luz roja.
El procedimiento estándar de inhibición condicionada implica dos CS diferentes
(A y B) y un EE. UU. (Ver Figura 5.5 ). En el ejemplo de un tráfico defectuoso
luz, el estímulo A era el semáforo en rojo y el estímulo B era el
gesto para que cruce la intersección. En experimentos de laboratorio, el estímulo A
podría ser una luz, un estímulo B un tono, y Estados Unidos una breve conmoción. En algunos ensayos,
el estímulo A está emparejado con EE. UU. Estos ensayos se representan como A + (A más),
con el signo "+" que indica emparejamientos con EE. UU. Como resultado de las pruebas A + , el
El participante llega a esperar los EE. UU. cuando se encuentra con el estímulo A.
etapa para el condicionamiento inhibitorio.
FIGURA 5.5
El procedimiento estándar para la inhibición condicionada. En los ensayos A +, el estímulo A se empareja con
el estímulo incondicionado (EE. UU.). En los ensayos AB−, el estímulo B se presenta con el estímulo A,
y se omite EE. UU. El procedimiento es eficaz para condicionar la inhibición del estímulo B.
En los ensayos de condicionamiento inhibitorio, el estímulo B se presenta con el estímulo A

(formando el estímulo compuesto AB), pero EE. UU. no ocurre. Estos ensayos
Página 102
se representan como AB - (AB menos), con el signo "-" indicando la ausencia de

los Estados Unidos. La presencia de estímulos A en el AB - ensayos crea la expectativa de que
Estados Unidos ocurrirá. Esto hace que la ausencia de Estados Unidos sea psicológicamente significativa.
y sirve para condicionar las propiedades inhibidoras del estímulo B.
Normalmente, los ensayos A + y AB - se presentan en un orden entremezclado en el
procedimiento estándar de acondicionamiento inhibitorio. A medida que avanza el entrenamiento, el estímulo A
adquiere gradualmente propiedades excitatorias condicionadas y el estímulo B se convierte en un
inhibidor condicionado (Campolattaro, Schnitker y Freeman, 2008). Generalmente,
el condicionamiento excitador de A se desarrolla más rápido que el condicionamiento inhibitorio
de B porque el condicionamiento inhibitorio depende del aprendizaje previo de un EE.
expectativa.
Contingencia negativa CS – EE. UU.

El procedimiento de acondicionamiento inhibitorio estándar (A + , AB - ) es especialmente eficaz

en hacer de B un inhibidor condicionado, pero hay otros inhibidores exitosos
procedimientos de acondicionamiento también. En el procedimiento de contingencia negativo CS-EE. UU.,
por ejemplo, solo se usa un CS explícito (por ejemplo, un tono), junto con un EE. UU. (ver
Figura 5.6 ). El tono y los EE. UU. Ocurren en momentos irregulares, con la estipulación
que Estados Unidos no se presenta si el tono se ha producido recientemente. Esta estipulación
establece una contingencia negativa entre el tono CS y EE. UU. Se asegura
que p (US / CS) será menor que p (US / noCS) y sirve para hacer que el CS sea un
inhibidor condicionado.
FIGURA 5.6
Procedimientos de contingencia negativa para producir inhibición condicionada. El incondicionado

El estímulo (EE. UU.) se presenta en momentos aleatorios por sí mismo, pero no si el estímulo condicionado
(CS) ha ocurrido recientemente.
Considere a un niño que periódicamente es molestado por sus compañeros de clase cuando el
Página 103
el maestro está fuera del salón. Esto es similar a obtener periódicamente una aversión
estímulo o EE. UU. Cuando el maestro regrese, el niño puede estar seguro de que no
ser molestado. El profesor sirve así como un CS - , señalando un período libre de
acoso. La presencia del maestro señala la ausencia de Estados Unidos.
¿Qué proporciona el contexto excitador para el condicionamiento inhibitorio del tono?
¿CS en el procedimiento de contingencia negativa? Porque EE. UU. Ocurre cuando la CS
está ausente, las señales contextuales de fondo de la situación experimental se vuelven
asociado con los EE. UU. Esto permite entonces el condicionamiento de inhibidores.
propiedades a la CS. La ausencia de EE. UU. Cuando ocurre la CS en este
El contexto excitador convierte al SC en un inhibidor condicionado.
MEDICIÓN DEL COMPORTAMIENTO DE CONDICIONADOS

INHIBICIÓN
Las manifestaciones conductuales del condicionamiento excitador son bastante obvias.
Los organismos vienen a dar una nueva respuesta, la respuesta condicionada, al SC.
¿Qué sucede en el caso de la inhibición condicionada? Un inhibidor condicionado
El estímulo tiene efectos conductuales que son opuestos a los efectos conductuales de un
señal excitadora condicionada. Un inhibidor condicionado suprime o inhibe
respuesta condicionada excitadora. Desafortunadamente, los procedimientos especiales son a menudo
necesario para ver esta supresión de respuesta.
Considere, por ejemplo, la respuesta de parpadeo de los conejos. Los conejos parpadean mucho
con poca frecuencia, quizás una o dos veces por hora. Un estímulo inhibitorio condicionado
(CS - ) suprime activamente el parpadeo. Pero debido a que los conejos rara vez parpadean
circunstancias ordinarias, la supresión del parpadeo durante una cesárea - es difícil de
detectar.
Prueba de suma de inhibición

La inhibición del parpadeo sería fácil de determinar si la tasa basal de parpadeo
fueron elevados. Si los conejos parpadean 60 veces por hora y presentamos un
estímulo inhibitorio condicionado (CS - ), el parpadeo debe disminuir sustancialmente
por debajo de la tarifa de 60 por hora. Por tanto, el problema de medir el condicionado
la inhibición se puede resolver elevando la tasa de respuesta inicial de comparación.
¿Cómo se puede elevar la tasa de respuesta inicial? Quizás el más simple
La forma es condicionar otro estímulo como una señal excitadora condicionada (CS + ).
Página 104
Una respuesta sustancial debe ser evidente cuando esta nueva señal excitadora (CS + ) es
presentado por sí mismo. Usando esto como línea de base, podemos probar los efectos de un
estímulo inhibitorio condicionado (CS - ) presentando el CS - al mismo tiempo que
el CS + . Esta estrategia de prueba se llama prueba de suma para condicionadas
inhibición.
Figura 5.7 presenta resultados hipotéticos de una prueba de suma. Darse cuenta de
se observa una respuesta considerable cuando el CS + se presenta solo. Añadiendo
un estímulo inhibidor condicionado (CS - ) al CS + resulta en mucho menos
respondiendo que cuando el CS + se presenta solo. Este es el resultado esperado
si el CS - ha adquirido propiedades inhibitorias. Sin embargo, la presentación del CS -
podría interrumpir la respuesta simplemente creando una distracción. Esta posibilidad es
evaluados en la prueba de la suma en la determinación de cómo responde a la CS + es
cambiado cuando un estímulo neutral sin antecedentes de excitación o
Se presenta el entrenamiento inhibitorio. Tal estímulo neutral está representado por CS 0 en
Figura 5.7.
FIGURA 5.7
Procedimiento y resultados hipotéticos para la prueba de suma de inhibición condicionada. Sobre
algunos ensayos, un estímulo excitador condicionado (CS +) se presenta solo, y un alto nivel
de respuesta condicionada. En los otros ensayos, el CS + se presenta con un
Página 105
estímulo inhibidor condicionado (CS-) o un estímulo neutro (CS0). El hecho de que el CS−
interrumpe la respuesta al CS + mucho más que CS0 es evidencia de la condición condicionada
propiedades inhibidoras del CS−.
En los resultados que se muestran en la Figura 5.7, CS 0 reduce la respuesta al CS + a

poco. Esto refleja los efectos de distracción de agregar cualquier estímulo al CS + . los
La reducción en la respuesta es mucho mayor, sin embargo, cuando se presenta el CS -
con el CS + . Este resultado muestra que el CS - tiene inhibidores condicionados
propiedades (RP Cole, Barnet y Miller, 1997).
Prueba de inhibición de retardo de adquisición

La prueba de suma es una prueba de inhibición basada en el rendimiento. Lo básico
la suposición es que el desempeño de la conducta condicionada excitadora será
suprimido por un estímulo inhibitorio condicionado. Un segundo enfoque popular para
la medición de la inhibición condicionada es una prueba de adquisición o aprendizaje. Esta
La prueba se basa en la suposición de que las propiedades inhibitorias condicionadas
interferir con la adquisición de propiedades excitadoras de ese estímulo. Por eso,
esto se llama prueba de retardo de adquisición .
La prueba de retardo de adquisición implica comparar las tasas de
condicionamiento excitador para dos grupos de participantes. El mismo CS (p. Ej., Un
tono) se utiliza en ambos grupos. Para el grupo experimental, primero se entrena el tono
como inhibidor condicionado. Para el grupo de comparación, se utiliza un procedimiento de control.
durante esta etapa que deja el tono relativamente "neutral". (Por ejemplo, el tono
puede presentarse sin emparejar con los EE. UU.) En la segunda fase del experimento,
el tono está emparejado con los EE. UU. para ambos grupos de participantes, y el
Se observa el desarrollo de la respuesta excitadora al tono. Si es inhibitorio
condicionamiento fue exitoso en la primera etapa del experimento, excitador
La respuesta condicionada debe desarrollarse más lentamente en el grupo experimental.
que en el grupo de control durante la segunda etapa. Tradicionalmente, la suma
y las pruebas de retardo de adquisición se utilizaron en combinación para desarrollar
evidencia de inhibición condicionada (Rescorla, 1969). En la investigación contemporánea,
El uso de ambas pruebas ha dado paso a depender principalmente de la prueba de suma en
estudios de inhibición condicionada (p. ej., Harris, Kwok y Andrew, 2014).
Página 106

Facilitación condicionada
En las relaciones de estímulo de orden superior, el foco de interés no está en el
relación entre un CS (A) y los EE. UU., pero sobre cómo un segundo estímulo (B)
proporciona información sobre la relación A-EE. UU. (Schmajuk & Holland, 1998).
En un procedimiento de inhibición condicionada, el segundo estímulo B indica cuándo el
La relación A – EE. UU. No está en vigor. Sin el estímulo B, el estímulo A se empareja con
los Estados Unidos. Con el estímulo B, el estímulo A ocurre sin EE. UU. Bajo estos
circunstancias, el estímulo B se convierte en un inhibidor condicionado e indica cuándo
el participante no debe responder al estímulo A. Facilitación condicionada
implica la relación de orden superior opuesta. En este caso, el estímulo B indica
cuando el estímulo A se empareja con EE. UU.
Las diferencias entre facilitación e inhibición se ilustran en la Figura
5.8 . En la inhibición condicionada, el estímulo B ocurre en los ensayos cuando no se sigue A
por EE. UU. (AB → noUS, o AB - ), y B está ausente cuando A está emparejado con EE. UU.
(A → EE. UU. O A + ). Este arreglo se invierte en un procedimiento de facilitación. En
facilitación condicionada, el estímulo B ocurre en los ensayos cuando A se refuerza
(AB → US, o AB + ), y B está ausente en los ensayos cuando A no está reforzado
(A → noUS, o A - ). El resultado de un procedimiento de facilitación es que el participante
responde a A sólo cuando se ha presentado B (Holland, 1992). Estímulo B
Facilita la respuesta condicionada a A o crea la ocasión para responder a A.
FIGURA 5.8
Comparación de los tipos de ensayos que ocurren en procedimientos para inhibición condicionada y
facilitación condicionada. A y B representan dos estímulos condicionados diferentes. EE. UU. =
estímulo incondicionado.
Página 107
Las relaciones condicionales capturadas por el procedimiento de facilitación no están limitadas

a la investigación experimental. Considere la señal de tráfico "Resbaladizo cuando está mojado". La señal
indica que normalmente la carretera es segura pero que puede ser peligrosa cuando está
mojado. Estas circunstancias ejemplifican la relación básica de facilitación. En esto
Por ejemplo, los estímulos de la calzada están representados por "A", la humedad o la lluvia son
representado por "B", y el peligro es Estados Unidos. El peligro ocurre solo cuando las señales del
carretera se encuentran en combinación con lluvia (AB → EE. UU.). No hay peligro presente
cuando se encuentran señales de la carretera sin lluvia (A → noUS).
ASOCIACIONES APRENDIDAS EN CONDICIONES
PROCEDIMIENTO DE FACILITACIÓN
Los procedimientos utilizados para producir asociaciones de orden superior son complejos y dan como resultado
más de un tipo de asociación. En un procedimiento de facilitación, los ensayos AB + son
entremezclado con A - ensayos, y los EE. UU. solo se presentan en ensayos cuando el estímulo B
ocurre. Debido a que el estímulo A está emparejado con EE. UU. La mitad del tiempo, una asociación
se desarrolla entre el estímulo A y EE. UU. El estímulo B está emparejado con EE. UU. Cada uno
momento en que ocurre, lo que permite una asociación directa entre el estímulo B y el
NOSOTROS. Además de estas asociaciones directas con EE. UU., El estímulo B presumiblemente
viene a señalar cuándo el estímulo A será seguido por EE. UU. Que es el mas alto
asociación de pedidos. La tarea principal al estudiar la facilitación es determinar qué
aspecto del comportamiento refleja las asociaciones directas A – US y B – US o refleja la
Asociación B (A – US) de orden superior.
Tipos de respuestas condicionadas provocadas por los estímulos A y B

Una forma de determinar qué tipo de asociación es responsable del condicionamiento
La respuesta que ocurre en un experimento de facilitación es usar CS en el papel de A
y B que generan diferentes respuestas condicionadas. Este enfoque se utilizó
extensamente en muchos de los primeros estudios de facilitación en el acondicionamiento apetitivo
(Holanda, 1992).
Las ratas, por ejemplo, se reproducen en respuesta a una luz que se ha emparejado con la comida,
pero muestran una respuesta brusca a un tono emparejado con la comida (Holland, 1977).
Considere, entonces, lo que podría ocurrir con un procedimiento de facilitación que consiste en
Tono / Luz → Comida y Luz → Ensayos sin comida. Una asociación Light-Food
resultar en la cría cuando la luz se presenta en un ensayo de prueba. Si el tono ha llegado a
señalar a la asociación Light-Food, los participantes deben mostrar un aumento
Página 108
levantarse a la luz si se anuncia mediante la presentación del tono. Aviso,

Sin embargo, que la crianza facilitada en los ensayos Tone / Light no se puede atribuir a
una asociación del tono con la comida porque una asociación tono-comida produce
una respuesta condicionada de un tirón de cabeza, no una respuesta de crianza.
Otra estrategia para aislar la asociación B (A – US) de orden superior como la
fuente de respuesta facilitada al objetivo A implica el uso de antecedentes o
señales contextuales como el estímulo que establece la ocasión B.
responder a las señales de fondo o contextuales con cualquier manifestación evidente que se observe fácilmente
respuestas. Sin embargo, los participantes pueden aprender a acercarse a un estímulo objetivo A en el
contexto de un conjunto de estímulos de fondo pero no de otro (Leising, Hall, Wolf y
Ruprecht, 2015).
Una categoría particularmente interesante de claves contextuales o de fondo es
proporcionados por medicamentos que cambian cómo se siente. La investigación ha demostrado que subjetivo
Las sensaciones creadas por diversas drogas pueden servir como estímulos ocasionales que
indicar si un CS objetivo se emparejará (o no) con un EE. UU. (Bevins &
Murray, 2011). En estos estudios, algunas sesiones experimentales se llevan a cabo después
las ratas han sido inyectadas con un fármaco (estímulo B) y otras se llevan a cabo en
la ausencia de la droga. Durante las sesiones de medicamentos, se puede combinar una luz con comida,
proporcionando los ensayos AB → EE. UU. del procedimiento de facilitación (ver Figura 5.9 ).
Durante las sesiones no farmacológicas, el estímulo A se presenta pero no se combina con la comida,
proporcionando los ensayos A → noUS. El resultado típico es que el estado de la droga
facilita la respuesta condicionada por los alimentos al estímulo A.
FIGURA 5.9
Esquema de un procedimiento de facilitación en el que un estado de drogas actúa como el orden superior
estímulo que indica cuándo se combina una luz con una comida.
Efectos de la extinción del estímulo B

Una estrategia alternativa para distinguir entre las relaciones B-EE. UU. Y B (A-EE. UU.)
Página 109
en un procedimiento de facilitación implica probar los efectos de la extinción del estímulo

B. La extinción de B implica la presentación repetida del estímulo B por sí mismo (B-noUS).
Presentar el estímulo B sin EE. UU. Es contrario a una relación B-EE. UU. Y reduce
responder que depende de esa relación. (Tengo más que decir sobre la extinción en
Capítulo 10. ) Sin embargo, la presentación repetida del estímulo B por sí misma no es
contrario a una relación B (A – US). Lo contrario de B (A – US) es B (A – noUS), no B–
chirumen. Por lo tanto, la extinción del estímulo B no debería interrumpir la respuesta
mediada por una relación B (A – US).
Numerosos estudios han demostrado que la extinción de un creador de ocasiones o
facilitador (estímulo B) no reduce la eficacia de B en la modulación
responder a un estímulo objetivo A (p. ej., Holanda, 1989; Leising et al., 2015;
Rescorla, 1985). De hecho, la falta de sensibilidad de la facilitación y la ocasión
el ajuste a la extinción del estímulo modulador se considera una firma
característica del entorno de la ocasión.
Finalmente, debo señalar que los organismos no aprenden invariablemente una B (A – US)
relación como resultado de un procedimiento de facilitación. A veces, los procedimientos que involucran
combinación de ensayos AB-US y ensayos A-noUS dan como resultado el aprendizaje de un B-US
relación solamente; en otros casos, los participantes aprenden tanto una relación B-EE. UU. como una
Relación de orden B (A – US). Varios factores más allá del alcance del presente
discusión determinar si un procedimiento en particular favorece la adquisición de un
Relación B-EE. UU. O una relación B (A-EE. UU.) (Holland, 1992; Schmajuk & Holland,
1998).
Resumen
El condicionamiento pavloviano implica la formación de una asociación o conexión
entre dos eventos. Típicamente, los eventos son estímulos individuales, el CS y el
NOSOTROS. Sin embargo, en casos más complejos, uno de los eventos puede ser un modulador o
estímulo que establece la ocasión y el otro es una unidad asociativa CS-US. Estos casos
representan relaciones de orden superior.
El desarrollo de la respuesta condicionada es muy sensible a la
relación temporal entre la CS y los EE. UU. Procedimientos de acondicionamiento retrasados
producir la respuesta más vigorosa. Introduciendo un intervalo de seguimiento de tan poco como
medio segundo entre la CS y los EE. UU. puede interrumpir gravemente el desarrollo de
comportamiento condicionado. La respuesta condicionada también es una función del CS-US
intervalo, pero la relación cuantitativa precisa depende del sistema de respuesta
Página 110
que está siendo condicionado.

El condicionamiento pavloviano también es muy sensible a la relación señal entre
la CS y los EE. UU., es decir, la medida en que la CS proporciona información
sobre los Estados Unidos. Esto se ilustra con el fenómeno de bloqueo y con CS – US
efectos de contingencia. Originalmente, las variaciones en la contingencia entre CS y
Se consideró que EE. UU. Influía directamente en los procesos asociativos. Más reciente
La evidencia sugiere que diferentes grados de condicionamiento del contexto son responsables
para efectos de contingencia CS-EE. UU.
Se han investigado las relaciones de orden superior en el condicionamiento pavloviano.
dentro del contexto de la inhibición condicionada y la facilitación condicionada. En
inhibición condicionada, un estímulo modulador (estímulo B) indica cuando otro
CS (estímulo A) no está emparejado con EE. UU. El resultado es que B llega a
inhibir la respuesta condicionada que normalmente ocurre al estímulo A. En
facilitación condicionada, el estímulo modulador B indica cuando el estímulo A es
emparejado con los EE. UU. El resultado es que la respuesta condicionada ocurre solo
cuando el estímulo B está presente. Prueba de que los resultados reflejan el aprendizaje de una B (A – EE. UU.)
La relación de orden superior a menudo implica información relativa a la topografía de
la respuesta condicionada, los efectos de extinguir el estímulo B, o ambos.
Lecturas sugeridas
Holanda, PC (1992). Entorno de ocasión en acondicionamiento pavloviano. En G. Bower
(Ed.), La psicología del aprendizaje y la motivación (Vol. 28, págs. 69-125).
Orlando, FL: Prensa académica.
Lin, J.-Y., Arthurs, J. y Reilly, S. (2017). Aversiones al gusto condicionadas: De
venenos para el dolor a las drogas de abuso. Psychonomic Bulletin & Review , 24 , 335–
351. http://dx.doi.org/10.3758/s13423-016-1092-8
Molet, M. y Miller, RR (2014). Tiempo: un atributo del aprendizaje asociativo.
Conductual Procesos , 101 , 4-14.
http://dx.doi.org/10.1016/j.beproc.2013.05.015
Raybuck, JD y Lattal, KM (2014). Superando el intervalo: teoría y
neurobiología del acondicionamiento de trazas. Procesos conductuales , 101 , 103-111.
Urcelay, GP y Miller, RR (2014). Las funciones de los contextos en asociativo
aprendiendo. Conductual Procesos , 104 , 2-12.
Página 111
Términos técnicos
Efecto de bloqueo
Contingencia CS – EE. UU.
Intervalo CS – EE. UU.
Acondicionamiento retardado
Facilitación
Relación de estímulo de orden superior
Intervalo entre estímulos
Aprendizaje a largo plazo
Configuración de ocasión positiva
Prueba de retraso de la adquisición
Acondicionamiento simultáneo
Prueba de suma
Codificación temporal
Contigüidad temporal
Acondicionamiento de trazas
Intervalo de seguimiento
Página 112
Sabía usted que

El condicionamiento pavloviano normalmente no implica la
aprendizaje de un nuevo reflejo condicionado o estímulo-respuesta
(S – R) conexión sino más bien el aprendizaje de un nuevo estímulo–
conexión de estímulo (S – S)?
La respuesta condicionada puede aumentarse o disminuirse por
cambiar el valor del estímulo incondicionado (EE. UU.),
que es una intervención que no implica presentar el
estímulo condicionado (CS)?
de acuerdo con todos los modelos contemporáneos de aprendizaje, lo que
aprender acerca de un estímulo depende del valor asociativo de
otros estímulos presentes simultáneamente?
un CS puede perder fuerza asociativa aunque esté emparejado
con un nosotros?
Las teorías de la atención asumen que lo que sucede en un ensayo
determina cuánta atención se dedica a la CS en el
próxima prueba?
muchas teorías importantes del aprendizaje no consideran el tiempo en su
formulaciones?
la duración absoluta de la CS no es tan importante para
Página 113
aprendizaje como es la relación entre la duración del CS y el

intervalo entre presentaciones sucesivas en Estados Unidos?
La respuesta condicionada depende del valor asociativo de
el CS en comparación con el valor asociativo de otras señales que
estaban presentes en el momento en que se acondicionó el CS?
O rigurosamente, se consideró que el condicionamiento pavloviano era una forma simple de

aprendizaje que dependía sólo de emparejamientos de un estímulo condicionado (CS) con un
estímulo incondicionado (EE. UU.) y resultó en el condicionamiento de un nuevo reflejo.
Esta perspectiva ingenua ha resultado ser incorrecta en muchos sentidos. Retraso largo
el aprendizaje de la aversión al gusto, las asociaciones selectivas y el efecto de bloqueo, todos
desafíe la opinión de que el condicionamiento pavloviano es una forma simple de aprendizaje. En
Este capítulo, sigo documentando la riqueza y complejidad de Pavlovian
condicionamiento centrándose en los mecanismos y teorías subyacentes que
abordar esta forma de aprendizaje. Discuto dos cuestiones principales: (a) Qué se aprende
en el condicionamiento pavloviano, y (b) ¿cómo se aprende?
¿Qué se aprende en el condicionamiento pavloviano?

El resultado característico de un procedimiento de acondicionamiento pavloviano es que el
participante viene a realizar una respuesta condicionada (CR) cuando el CS es
presentado. ¿Qué mecanismo es el responsable de esta RC? Hay dos prominentes
alternativas. Según el primer mecanismo, el CS viene a provocar el CR
directamente. Esto se llama aprendizaje S – R y es el más simple de los dos mecanismos.
Los mecanismos S – R dominaron las teorías del aprendizaje hasta el "proceso cognitivo
revolución ”que arrasó con la psicología en la década de 1970. Esa revolución alentó
teorías más "cognitivas" del aprendizaje y la posibilidad de que a través de Pavlovian
El condicionamiento del CS viene a activar una representación de Estados Unidos. Que nosotros
la representación o memoria genera a su vez la RC. Este segundo mecanismo es
denominado S-S aprendizaje . Porque tanto los mecanismos de aprendizaje S – R como S – S pueden
generar el CR, ¿cómo podemos distinguirlos?
Según el mecanismo de aprendizaje S – R, el condicionamiento clásico conduce a
la formación de una asociación entre el CS y el CR. Como resultado de esto
Asociación CS-CR, la presentación del CS activa el CR directamente y
automáticamente. Tal aprendizaje de RS es lo que implica la noción tradicional de que
El condicionamiento pavloviano da como resultado el aprendizaje de una nueva respuesta refleja al CS.
Página 114
Cómo el aprendizaje S – S genera una respuesta condicionada es un poco más

Complicado. Según el mecanismo de aprendizaje S – S, el condicionamiento pavloviano
resulta en el aprendizaje de la asociación CS-US. Una vez adquirida esta asociación,
presentación de la CS activará una representación neuronal de los EE. UU. (ver Figura
6.1 ). Expresado informalmente, esto significa que al encontrarse con el CS, el
El participante empezará a pensar en EE. UU. Esta activación de los EE. UU.
la representación no genera una respuesta automáticamente. Más bien, ¿qué
El participante dependerá de su motivación para responder a los EE. UU.
tiempo.
FIGURA 6.1
Distinción entre aprendizaje de estímulo-respuesta (S-R) y estímulo-estímulo (S-S). En

Aprendizaje S – R, se establece una conexión o asociación directa entre lo condicionado
estímulo (CS) y la respuesta condicionada (CR) de modo que la CR se provoque directamente
tras la presentación de la CS. En el aprendizaje S – S, el CS activa una representación del
estímulo incondicionado (EE. UU.), que a su vez conduce a la RC.
Una técnica poderosa para diferenciar entre mecanismos S – R y S – S

fue popularizado por Robert Rescorla (1973) y es básicamente una prueba de
rendimiento. Lalaprueba
después de que implica
motivación delevaluar el vigor
individuo para de la respuesta
responder a loscondicionada
EE. UU. haya cambiado. En uno
tipo de experimento, por ejemplo, se reduce la motivación para responder a los EE. UU.
Esta manipulación se llama devaluación de EE. UU. (Ver Cuadro 6.1).
TABLA 6.1
Diseño y predicciones del estudio de devaluación de EE. UU.
Página 115
Considere, por ejemplo, un estudio del condicionamiento sexual pavloviano que fue
realizado con codornices macho domesticadas (Holloway y Domjan, 1993). Breve
la exposición a una CS ligera se combinó con el acceso a una hembra de ave una vez al día.
Inicialmente, el CS visual no provocó ningún comportamiento significativo. Sin embargo, porque
los machos estaban motivados sexualmente, siempre se acercaban fácilmente y
copularon con la hembra que fue liberada al final de cada prueba de acondicionamiento.
Con repetidos ensayos de acondicionamiento, los machos también comenzaron a acercarse al CS.
Después de 10 pruebas de acondicionamiento, el CS provocó un fuerte acercamiento o seguimiento de señales.
respuesta independientemente de dónde estuvieran los machos al comienzo del ensayo.
Según el mecanismo de aprendizaje S – R, la respuesta condicionada refleja
el establecimiento de una conexión directa entre el CS y el CR. Si tal
Se ha establecido una conexión directa, luego cambiando la motivación del animal para
realizar la respuesta incondicionada no debe influir en su condicionamiento
respondiendo. Por lo tanto, una interpretación S – R predice que una vez que la codorniz ha aprendido
la respuesta de enfoque sexual condicionado, la presentación de la CS provocará la
CR incluso si las aves ya no están motivadas sexualmente.
Holloway y Domjan (1993) probaron la predicción S – R reduciendo el sexo
unidad de un grupo de aves. La motivación sexual se redujo al cambiar la luz.
ciclo en el laboratorio para imitar las condiciones invernales, cuando las aves no se reproducen.
Los resultados del experimento se resumen en la Figura 6.2.. Contrariamente a
predicciones basadas en el mecanismo S – R, una reducción en la motivación sexual
respuesta condicionada reducida al CS visual.
FIGURA 6.2
Página 116
Efectos de la devaluación del estímulo incondicionado (EE. UU.) Sobre el enfoque sexual condicionado
comportamiento. Se realizaron tres sesiones de prueba a intervalos de 1 semana después de dos grupos de
codorniz había adquirido una respuesta de aproximación condicionada. Durante la fase de prueba, la sexualidad
la motivación de un grupo de aves se redujo. Esta devaluación de Estados Unidos produjo una disminución
en respuesta condicionada. Adaptado de "Condicionamiento del enfoque sexual: pruebas de
Devaluación del estímulo incondicionado mediante manipulaciones hormonales ”, por KS Holloway
y M. Domjan, 1993, Journal of Experimental Psychology: Animal Behavior Processes ,
19 , pág. 49. Copyright 1993 de la Asociación Americana de Psicología.
Los resultados resumidos en la Figura 6.2 indican que el aprendizaje S – S había

ocurrido en el experimento. El aprendizaje S – S no implica el aprendizaje de un
CR. Más bien, implica aprender una asociación entre la CS y los EE. UU. Una vez
se ha establecido la asociación CS-US, la presentación de la CS activa un
representación de los EE. UU. Esto a su vez conduce a una respuesta condicionada, pero solo
Página 117
si los participantes están motivados para responder a los EE. UU. En el experimento de la codorniz,
el CS provocó un comportamiento de aproximación condicionado, pero solo si las aves estaban
motivados sexualmente.
En el experimento anterior, la motivación para responder a los EE. UU. Se redujo
como prueba para el aprendizaje S – S. Otro enfoque es aumentar la motivación para responder
A los E.U. A esto se le llama inflación estadounidense . Si la respuesta condicionada está mediada por
S – S, la inflación de EE. UU. Da como resultado una mayor respuesta a la CS.

Aunque los estudios de la devaluación de EE. UU. Son más comunes que los estudios de EE. UU.
efectos de la inflación, ambos tipos de resultados se han obtenido en una variedad de diferentes
formas de condicionamiento pavloviano (p. ej., Delamater, Campese, LoLordo y
Sclafani, 2006; Fudim, 1978; Storsve, McNally y Richardson, 2012). Estas
Los resultados indican que el condicionamiento pavloviano implica típicamente el aprendizaje S – S
en lugar de aprender un nuevo reflejo S – R.
Una implicación particularmente interesante de estos hallazgos es que uno puede alterar
respuestas a una CS utilizando procedimientos que involucran manipulaciones que tienen como objetivo los EE. UU.
en lugar de la propia CS. La mayoría de las intervenciones clínicas que buscan reducir
Los CR desadaptativos implican cambiar las propiedades del CS mediante el uso de algo
como un procedimiento de extinción (ver Capítulo 10, este volumen). Devaluación de EE. UU.
los efectos sugieren una vía alternativa. Centrándose en cambiar el valor de EE. UU.
puede ser especialmente útil en situaciones clínicas donde el SC problemático no puede
ser fácilmente identificadas o manipuladas.
¿Cómo se aprenden las asociaciones pavlovianas?

A continuación, pasaremos a considerar los posibles mecanismos implicados en el aprendizaje de
Asociaciones pavlovianas. La era moderna en las teorías del aprendizaje asociativo fue
lanzado por el descubrimiento del efecto de bloqueo, que demostró que CS–
La contigüidad de Estados Unidos no es suficiente para aprender. El primer y más influyente moderno
La teoría del aprendizaje fue el modelo Rescorla-Wagner. Otros modelos y teorías
pronto siguió. Estas alternativas buscaban explorar diferentes formas de
caracterizar el aprendizaje y superar algunas de las deficiencias del
Modelo Rescorla – Wagner. Sin embargo, el modelo Rescorla-Wagner sigue siendo el
estándar contra el cual se evalúan otras teorías.
EL MODELO RESCORLA – WAGNER
Página 118
Debido a que el efecto de bloqueo fue fundamental para dar forma al desarrollo de
teoría contemporánea del aprendizaje, los conceptos básicos del efecto de bloqueo se revisan en
Figura 6.3 . Los participantes primero reciben un CS (A) emparejado con los EE. UU. Después
La respuesta condicionada a A está bien establecida, se agrega un nuevo estímulo (B),
y el compuesto A + B está emparejado con EE. UU. Se dice que el bloqueo ocurre si el
presencia del estímulo A previamente condicionado bloquea el condicionamiento del
nuevo estímulo agregado B.
FIGURA 6.3
Revisión del diseño de un experimento de bloqueo. En la Fase 1, el grupo experimental obtiene

estímulo A condicionado a la asíntota. En la Fase 2, tanto el experimental como el control
Los grupos reciben los estímulos A y B presentados simultáneamente y emparejados con los incondicionados.
estímulo (EE. UU.). Finalmente, se evalúa la respuesta de ambos grupos al estímulo B.
¿Por qué la presencia del estímulo A previamente condicionado bloquea la

adquisición de responder al estímulo B? Kamin (1969), quien originalmente
identificó el efecto de bloqueo, explicó el fenómeno al proponer que un EE. UU.
debe ser sorprendente para ser eficaz en la producción de aprendizaje. Si los EE. UU. Están señalados por
una CS de la que aprendiste anteriormente, EE. UU. no te sorprenderá y
por lo tanto, no estimulará el "esfuerzo mental" necesario para la formación de un
asociación. Los eventos esperados son cosas que el participante ya ha aprendido.
Por lo tanto, los eventos esperados no activarán procesos que conduzcan a un nuevo aprendizaje. Para
Para ser eficaz, Estados Unidos debe ser inesperado o sorprendente.
La idea de que la efectividad de un EE. UU. Está determinada por lo sorprendente que es
formó la base del modelo Rescorla-Wagner (Rescorla & Wagner, 1972;
Wagner y Rescorla, 1972). Con el uso de este modelo, las implicaciones de la
El concepto de sorpresa estadounidense se extendió a una amplia variedad de condicionamientos.
Página 119
fenómenos. El modelo Rescorla-Wagner tuvo un gran impacto en el campo de

condicionamiento y aprendizaje (Siegel & Allan, 1996) y continúa utilizándose en un
variedad de áreas de psicología, informática y neurociencia.
¿Qué significa decir que algo es sorprendente? Por definición, un
El evento es sorprendente si es diferente de lo esperado. Si esperas un pequeño
regalo para tu cumpleaños y consigue un coche, te sorprenderás mucho. Esto es análogo
a un inesperadamente grande EE. UU. Del mismo modo, si espera un automóvil y recibe una caja de
dulces, también te sorprenderás. Esto es análogo a un inesperadamente pequeño
NOSOTROS. Según el modelo de Rescorla-Wagner, un EE. UU. Inesperadamente grande es el
base para el condicionamiento excitador o incrementos en el valor asociativo. En contraste, un
inesperadamente pequeño EE. UU. es la base para el condicionamiento inhibitorio o disminuciones en
valor asociativo. Un componente crítico del modelo es la suposición de que cómo
sorprendido que esté por un EE. UU. depende de todas las señales que están presentes en un
ensayo de acondicionamiento.
Una fuerte respuesta condicionada indica una fuerte expectativa de que EE. UU.
ocurrirá, mientras que una respuesta condicionada débil indica una baja expectativa de
los Estados Unidos. Usando la magnitud de la RC como un proxy de la expectativa de EE. UU., Podemos
inferir que EE. UU. es muy sorprendente al comienzo del entrenamiento y en absoluto
sorprendente al final cuando la respuesta condicionada ha alcanzado una asíntota o
límite. Por tanto, la distancia de la asíntota del aprendizaje puede utilizarse como medida de
Sorpresa de Estados Unidos.
Se expresan las ideas básicas del modelo Rescorla-Wagner
matemáticamente usando λ para representar la asíntota de aprendizaje posible con
EE.UU. que se está utilizando y V para representar el valor asociativo de los estímulos
que preceden a los EE. UU. La sorpresa de Estados Unidos será entonces (λ - V).
Según el modelo de Rescorla-Wagner, la cantidad de aprendizaje en un determinado
Se supone que el ensayo es proporcional a (λ - V), o la sorpresa de EE. UU. El valor de
(λ - V) es grande al comienzo del aprendizaje porque V (el valor asociativo de la
estímulos que preceden a los EE. UU.) es cercana a cero en este punto. Por lo tanto, sustancial
Los incrementos en la fuerza asociativa ocurren durante las primeras pruebas de acondicionamiento. Como el
El valor asociativo de las señales que preceden a los aumentos de EE. UU., el término de diferencia
(λ - V) se reducirá y se producirá menos aprendizaje adicional.
Aprender en una prueba de condicionamiento dada es el cambio en el valor asociativo
de un estímulo. Este cambio se puede representar como ΔV. Usando estos símbolos, el
La idea de que el aprendizaje depende de lo sorprendente de los EE. UU. puede expresarse como
sigue:
ΔV = k (λ - V).
Página 120
ΔV = k (λ - V).
En esta ecuación, k es una constante relacionada con la prominencia de CS y US y

(λ - V) es una medida de la sorpresa de Estados Unidos. ΔV = k (λ - V) es la ecuación fundamental
del modelo Rescorla-Wagner.
Aplicación al efecto de bloqueo

Las ideas básicas del modelo Rescorla-Wagner predicen claramente el bloqueo
efecto. Al aplicar el modelo, es importante tener en cuenta que las expectativas de
EE.UU. se basan en todas las señales disponibles para el organismo durante la
ensayo de acondicionamiento. Como se ilustra en la Figura 6.3 , el diseño de bloqueo implica primero
condicionamiento extenso del estímulo A para que los participantes adquieran un perfecto
expectativa de que EE. UU. ocurrirá en base a la presentación del estímulo A.
Por tanto, al final de la Fase 1, V A es igual a la asíntota del aprendizaje (V A = λ).
En la Fase 2, el estímulo B se presenta junto con el estímulo A, y los dos CS
son seguidos por los EE. UU. Según el modelo de Rescorla-Wagner, no
El condicionamiento del estímulo B ocurrirá en la Fase 2 porque EE. UU. ahora está perfectamente
predicho por la presencia del estímulo A: (λ - V A + B) = 0.
El grupo de control recibe el mismo entrenamiento en la Fase 2, pero para ellos el
La presencia del estímulo A no genera expectativas de EE. UU. por lo tanto, el
EE. UU. Es sorprendente para el grupo de control en la Fase 2 y produce nuevos aprendizajes.
Pérdida de valor asociativo a pesar de los emparejamientos con EE. UU.

El modelo Rescorla-Wagner es consistente con hechos fundamentales de
el condicionamiento clásico como adquisición y el efecto de bloqueo. Sin embargo, gran parte de
la importancia del modelo proviene de sus inusuales predicciones. Uno de tales
predicción es que, en determinadas circunstancias, las propiedades condicionadas de
los estímulos disminuirán a pesar de los continuos emparejamientos con EE. UU. Eso es muy
contradictorio. ¿Por qué una CS debe perder valor asociativo si continúa siendo
emparejado con los EE. UU.? El modelo de Rescorla-Wagner predice que los estímulos perderán
valor asociativo cuando se emparejan con los EE. UU. si hay una sobreexpectación
de ese Estados Unidos.
El diseño de un experimento de sobreexpectación en EE. UU. Se describe en la Figura 6.4 . En
Fase 1, los estímulos A y B se combinan con el mismo EE. UU. (P. Ej., Un gránulo de comida)
en ensayos separados. Esto continúa hasta que cada uno de los estímulos A y B predicen perfectamente
Página 121
la única pastilla de comida EE. UU.,

A = oVV B = λ. Entonces se inicia la fase 2. En la Fase 2,
los estímulos A y B se presentan simultáneamente por primera vez, y el A + B
El compuesto de estímulo es seguido por la pastilla de alimento original de EE. UU.
FIGURA 6.4
Diseño del experimento de sobreexpectación. En la Fase 1, los participantes reciben los estímulos A y
B, cada uno emparejado con el estímulo incondicionado (EE. UU.; Una bolita de comida). En la Fase 2, los estímulos
A y B se presentan juntos, creando una expectativa de más de un gránulo de EE. UU.
Como consecuencia, los valores asociativos de los estímulos A y B disminuyen cada uno en la Fase 2.
Cuando los estímulos A y B se presentan simultáneamente al comienzo de la Fase 2,

Se supone que las expectativas basadas en los estímulos individuales se suman,
con el resultado de que dos gránulos de alimentos se pronostican como EE.AUU.
+ V (V
B = 2 λ).
Se trata de una sobreexpectación, porque EE. UU. Sigue siendo un solo alimento. Por lo tanto,
hay una discrepancia entre lo que se espera (dos pellets) y lo que ocurre
(una pastilla).
Al comienzo de la Fase 2, los participantes encuentran que Estados Unidos es sorprendentemente pequeño. Para
alinear sus expectativas de los EE. UU. con lo que realmente sucede en la Fase 2,
los participantes tienen que disminuir su expectativa de los EE. UU. en función de la
estímulos individuales A y B. Por lo tanto, se predice que los estímulos A y B perderán
Valor asociativo a pesar de las continuas presentaciones de la misma USA. La pérdida de
Se predice que el valor asociativo continuará hasta que la suma de las expectativas basadas
en A + B equivale a una pastilla de alimento. La pérdida prevista de RC para el individuo
Los estímulos A y B en el experimento de sobreexpectación son muy contradictorios, pero
ha sido verificado repetidamente (p. ej., Kehoe & White, 2004; Lattal & Nakajima,
1998; Sissons y Miller, 2009).
El modelo de Rescorla-Wagner trata el desarrollo de la inhibición condicionada como
Página 122
otra ilustración de las consecuencias de la sobreexpectación estadounidense. Considerar para

ejemplo, el procedimiento de acondicionamiento inhibitorio estándar (ver Figura 5.5). Esta
El procedimiento implica ensayos cuando se presentan los EE. UU. (ensayos reforzados) y ensayos
cuando se omite EE. UU. (juicios no reforzados). En ensayos reforzados, un condicionado
El estímulo excitador (CS + ) está emparejado con EE. UU. En ensayos no reforzados, el CS +
se presenta junto con el estímulo inhibitorio condicionado (CS - ).
FIGURA 6.5
Valores asociativos predichos de estímulo excitador condicionado (CS +) y condicionado

estímulo inhibitorio (CS−) durante el curso del entrenamiento de inhibición condicionada (panel izquierdo)
y extinción (panel derecho). Durante el entrenamiento de inhibición condicionada, cuando el CS + está
presentado solo, se empareja con el estímulo incondicionado (EE. UU.); en contraste, cuando el
CS + se presenta con CS−, se omite EE. UU. El valor asociativo neto de CS + y
CS− es la suma de los valores asociativos de los estímulos individuales. Durante la extinción, el
Los SC se presentan solos y los EE. UU. Nunca ocurren.
Aplicar el modelo Rescorla-Wagner a la inhibición condicionada
Página 123
procedimiento, es útil considerar los ensayos reforzados y no reforzados por separado.

Para anticipar con precisión a los EE. UU. En ensayos reforzados, el CS + tiene que ganar
propiedades excitadoras condicionadas. El condicionamiento excitador implica el
adquisición de valor asociativo positivo y cesa una vez que el organismo predice
Estados Unidos perfectamente en cada ensayo reforzado. Esto se ilustra en el panel izquierdo de
Figura 6.5.
En los ensayos no reforzados, ocurren tanto el CS + como el CS - . Una vez que el CS + ha
adquirió cierto grado de excitación condicionada (debido a su presentación en
ensayos reforzados), el organismo esperará los EE. UU. siempre que ocurra el CS + ,
incluso en juicios no reforzados. Sin embargo, EE. UU. No ocurre en
juicios no reforzados. Esto crea una sobreexpectación de EE. UU., Similar a la
ejemplo en la Figura 6.4. Para predecir con precisión la ausencia de EE. UU.
ensayos no reforzados, el valor asociativo del CS + y el valor del CS -
tiene que sumar cero (el valor representado por no US). Dado lo positivo
valor asociativo del CS + , la única forma de lograr una expectativa neta cero de
Estados Unidos sobre los ensayos no reforzados es hacer que el valor asociativo de la CS -
negativo. Así, el modelo de Rescorla-Wagner explica la inhibición condicionada por
asumiendo que el CS - adquiere un valor asociativo negativo (ver el panel izquierdo de
Figura 6.5).
Extinción de excitación e inhibición condicionadas

En un procedimiento de extinción, el CS se presenta repetidamente sin EE. UU. (I
tenemos mucho más que decir sobre la extinción en el Capítulo 10. ) Consideremos
predicciones del modelo Rescorla-Wagner para la extinción. Estas predicciones son
ilustrado en el panel derecho de la Figura 6.5. Cuando se presenta el CS + por primera vez
sin EE. UU. en extinción, habrá una sobreexpectación de EE. UU. (porque
EE. UU. se predice pero no ocurre). Con presentación continuada del CS +
por sí misma, la expectativa suscitada por el CS + se irá adaptando gradualmente
con la ausencia de EE.UU. por reducciones graduales en el valor asociativo de la
CS + . Este proceso continuará hasta que se reduzca el valor asociativo del CS +
a cero.
El modelo de Rescorla-Wagner predice un escenario análogo para la extinción
de inhibición condicionada. Al comienzo de la extinción, el CS - tiene negativo
valor asociativo. Se puede pensar que esto crea una subestimación de la
EE. UU.: El organismo predice menos de cero EE. UU. Que ocurre en los ensayos de extinción.
Página 124
Para alinear las expectativas con la ausencia de EE. UU., El asociativo negativo
valor del CS - se reduce gradualmente hasta que el CS - termina con cero asociativo
fuerza.
Problemas con el modelo Rescorla-Wagner

El modelo Rescorla-Wagner ha estimulado una gran cantidad de investigación y ha llevado a
el descubrimiento de muchos fenómenos nuevos e importantes en el condicionamiento clásico
(Siegel y Allan, 1996). Sin embargo, no es inesperado que el modelo también
tropezó con algunas dificultades desde que se propuso en 1972 (Miller, Barnet y
Grahame, 1995).
Una de las dificultades con el modelo que se hizo evidente desde el principio es que su
El análisis de la extinción de la inhibición condicionada es incorrecto. Como señalé
en la sección anterior (ver Figura 6.5 ), el modelo predice que repetidas
presentaciones de un inhibidor condicionado (CS - ) por sí mismo conducirá a la pérdida de
inhibición condicionada. Sin embargo, esto no ocurre (Witcher y Ayres, 1984;
Zimmer-Hart y Rescorla, 1974). De hecho, algunos investigadores han descubierto que
el no refuerzo repetido de un CS - puede mejorar su inhibición condicionada
propiedades (ver, por ejemplo, DeVito & Fowler, 1987; Hallam, Grahame, Harris, &
Miller, 1992). Curiosamente, un procedimiento eficaz para reducir el acondicionamiento
propiedades inhibidoras de un CS - no implica presentar el CS - en absoluto. Bastante,
implica extinguir las propiedades excitadoras del CS + con las que el CS -
se presentó durante el entrenamiento inhibitorio (Best, Dunn, Batson, Meachum y
Nash, 1985; Lysle y Fowler, 1985).
Otra dificultad es que el modelo de Rescorla-Wagner ve la extinción como
lo contrario de la adquisición, o el retorno del valor asociativo de un CS a cero.
Sin embargo, como discuto en el Capítulo 10 , un creciente cuerpo de evidencia indica que
la extinción no es simplemente la reversión de la adquisición. Más bien, la extinción parece
implican el aprendizaje de una nueva relación entre la CS y EE. UU. (es decir, que
Estados Unidos ya no sigue la CS).
MODELOS ATENCIONALES DE ACONDICIONAMIENTO

Dado que el condicionamiento clásico se ha estudiado durante aproximadamente un siglo, un
La teoría comprensiva debe dar cuenta de muchos hallazgos diversos. Ninguna teoría tiene
ha tenido un éxito total en la consecución de ese objetivo. Sin embargo, interesante
Página 125
Se siguen proponiendo y examinando nuevas ideas sobre el condicionamiento clásico.

Algunas de estas propuestas complementan el modelo Rescorla-Wagner. Otros son
incompatible con el modelo y mover el debate teórico en otras direcciones.
Los psicólogos norteamericanos han favorecido los mecanismos de aprendizaje como el
Modelo de Rescorla-Wagner que se enfoca en cambios en el valor sorpresa o
eficacia de los EE. UU. Por el contrario, los psicólogos británicos se han acercado
fenómenos como el efecto de bloqueo postulando cambios en qué tan bien
CS llama la atención. El supuesto general es que para que el condicionamiento
ocurra, los participantes deben prestar mucha atención a la CS. Procedimientos que interrumpen
Se espera que la atención al CS también interrumpa el aprendizaje (Mitchell & Le
Pelley, 2010).
Qué tan notable es un estímulo, o cuánta atención llama, se llama
la prominencia del estímulo . Las teorías de la atención difieren en sus supuestos sobre
lo que determina la prominencia de un CS en un ensayo determinado. Pearce y Hall (1980), por
Por ejemplo, asumió que cuánta atención dedica un participante a la CS en un
El juicio dado está determinado por lo sorprendente que fue Estados Unidos en el juicio anterior.
(ver también Hall, Kaye y Pearce, 1985; McLaren y Mackintosh, 2000).
Las personas tienen mucho que aprender si EE. UU. Les sorprendió en el
prueba. Por lo tanto, en tales condiciones, la prominencia de CS aumentará y
preste más atención a la CS en la próxima prueba. Por el contrario, si se siguió una CS
por un EE.UU. esperado, la atención a ese CS disminuirá.
Una característica importante de las teorías atencionales es que asumen que el
La sorpresa de los EE. UU. en un ensayo determinado altera el grado de atención
comandado por el CS en futuros ensayos. Por ejemplo, si la Prueba 10 termina en un
Para sorpresa de EE. UU., la prominencia de la CS aumentará de la Prueba 10 a la Prueba 11.
Por lo tanto, se supone que la sorpresa de EE. UU. Tiene solo una perspectiva prospectiva o proactiva.
influencia en la atención y el acondicionamiento. Esta es una diferencia importante con
Modelos de reducción de EE. UU. Como el modelo Rescorla-Wagner, en el que
La sorpresa de los EE. UU. en un ensayo determinado determina lo que se aprende en ese mismo
prueba.
La suposición de que los EE. UU. En un ensayo determinado pueden cambiar lo que se aprende
sobre un CS en el próximo ensayo ha recibido apoyo experimental (por ejemplo, Mackintosh,
Bygrave y Picton, 1977). Sin embargo, este mismo supuesto ha dificultado
para que los modelos de atención expliquen otros hallazgos. En particular, modelos atencionales
no puede explicar el bloqueo que ocurre en la primera prueba de la Fase 2 del
experimento de bloqueo (ver, por ejemplo, Azorlosa & Cicala, 1986; Balaz, Kasprow, &
Miller, 1982; Dickinson, Nicholas y Mackintosh, 1983). De acuerdo a
Página 126
modelos atencionales, el bloqueo ocurre porque en la Fase 2 del bloqueo

experimento, la falta de sorpresa de los EE.UU. reduce la atención a los añadidos
CS. Sin embargo, tal reducción en la prominencia puede ocurrir solo después de la primera Fase 2
prueba. Por tanto, los modelos atencionales no pueden explicar el bloqueo que se produce en
el primer ensayo de la Fase 2 del experimento de bloqueo.
FACTORES TEMPORALES Y RESPUESTA ACONDICIONADA

Ni el modelo Rescorla-Wagner ni los modelos de atención fueron diseñados para
explicar los efectos del tiempo en el condicionamiento. Sin embargo, el tiempo es obviamente un factor crítico.
factor. Una variable temporal importante es el intervalo CS-US. Como señalé en
Capítulo 5, los procedimientos con intervalos CS-US más largos producen menos respuestas (ver
Figura 5.2). Esta relación parece ser principalmente una característica de las respuestas
estrechamente relacionado con los EE. UU. (p. ej., búsqueda focal). Si comportamientos que son normalmente
más lejos de los EE. UU. se miden (p. ej., búsqueda general), la respuesta es
mayor con procedimientos que involucran intervalos CS-US más largos. Ambos hallazgos
ilustran que la duración del CS es un factor importante en el acondicionamiento.
Otra variable temporal importante es el intervalo entre sucesivos
Ensayos. Generalmente, se observa una respuesta más condicionada con procedimientos en
qué ensayos están más espaciados. Sin embargo, es de mayor interés el hecho de que
el intervalo entre ensayos y la duración del CS actúan en combinación para determinar
respondiendo. Numerosos estudios han demostrado que el factor crítico es el relativo
duración de estas dos variables temporales en lugar del valor absoluto de cualquiera
uno por sí mismo (Balsam & Gallistel, 2009).
Considérese, por ejemplo, un experimento de Holland (2000). El experimento
se llevó a cabo con ratas de laboratorio, y la comida presentada periódicamente en una taza fue
los Estados Unidos. Las presentaciones de la comida fueron señaladas por un CS auditivo. Inicialmente el
las ratas iban a la taza de comida solo cuando se entregaba la comida. Sin embargo, como
procedió el acondicionamiento, comenzaron a ir a la taza de comida tan pronto como escucharon
el CS auditivo. Así, se desarrolló el olfato de la taza de comida (una forma de búsqueda focal)
como el CR. Cada grupo fue acondicionado con una de dos duraciones de CS, ya sea 10
segundos o 20 segundos, y uno de los seis intervalos entre ensayos (que van desde 15
segundos a 960 segundos). Cada procedimiento podría caracterizarse en términos de
relación ( I / T ) entre el intervalo entre ensayos ( I ) y la duración del CS, que Holland
llamada duración del ensayo ( T ).
Los resultados del experimento se resumen en la Figura 6.6.. Tiempo usado
la nariz de la taza de comida durante el CS se muestra como una función del valor relativo de
Página 127
el intervalo entre ensayos ( I ) y la duración del ensayo ( T ) para cada grupo de sujetos.
Tenga en cuenta que respuesta condicionada estaba directamente relacionada con la I / T ratio. En cada
Relación I / T , los grupos que recibieron la CS de 10 segundos respondieron de manera similar a los
que recibió el CS de 20 segundos.
FIGURA 6.6
Porcentaje de tiempo que las ratas pasaron olfateando la taza de comida durante un estímulo condicionado auditivo (CS)
en acondicionamiento con una duración de prueba de 10 segundos o 20 segundos ( T ) y varios
Intervalos entre ensayos ( I ) que crearon relaciones I / T que van desde 1,5 a 48,0. Los datos se muestran en
relación con la respuesta durante los períodos de línea de base cuando el CS estaba ausente. De "Prueba y
Duraciones intertriales en el condicionamiento apetitivo en ratas ”, por PC Holland, 2000, Animal
Aprendizaje y comportamiento , 28 , pág. 125. Copyright 2000 de Springer. Adaptado con permiso.
Se han ofrecido varias interpretaciones de por qué la respuesta condicionada es

tan fuertemente determinada por la relación I / T (Gallistel y Gibbon, 2000; Jenkins,
Barnes y Barrera, 1981). Sin embargo, todos ellos captura la idea de que la I / T cociente
determina qué tan bien el CS reduce la ambigüedad sobre la próxima ocurrencia del
Estados Unidos (Balsam & Gallistel, 2009). La CS reduce la ambigüedad sobre los EE. UU. Si
proporciona mejor información sobre los EE. UU. que las señales de fondo de la
situación experimental. Con una relación I / T alta, el participante gasta mucho más
tiempo en el contexto experimental ( I ) que en presencia de la CS ( T ) antes de la
EE. UU. Ocurre. Esto hace que el CS sea mucho más informativo sobre la próxima aparición.
Página 128
de los EE. UU. que las señales contextuales de fondo y, por lo tanto, el CS llega a provocar
un alto nivel de respuesta condicionada. La ventaja informativa del CS
sobre el fondo, las señales contextuales se pierden si las duraciones de I y T son similares. Como un
En consecuencia, se desarrolla una respuesta menos condicionada al CS con relaciones I / T bajas.
Modelos informativos de aprendizaje que fueron diseñados para explicar los efectos de
la relación I / T se basa en experimentos que involucran múltiples ensayos de acondicionamiento
(para que el organismo pueda conocer las duraciones de I y T y las tasas de US
entrega durante cada uno de estos intervalos). Sin embargo, existe evidencia sustancial
que el condicionamiento pavloviano puede ocurrir en una sola prueba. El aprendizaje de una prueba ocurre
fácilmente en estudios de condicionamiento del miedo, aprendizaje de la aversión al gusto y
acondicionamiento. Los ejemplos de aprendizaje de una prueba son un desafío para la información
modelos de condicionamiento.
LA HIPÓTESIS DEL COMPARADOR

Los estudios de la relación I / T y los modelos informativos de aprendizaje han enfatizado
que la respuesta condicionada depende no solo de lo que sucede durante el CS
pero también sobre lo que sucede en la situación experimental en general. La idea que
Ambos factores influyen en lo que observamos en los experimentos de condicionamiento.
ha sido desarrollado con mayor detalle por Ralph Miller y sus colaboradores en el
hipótesis comparativa (RR Miller y Matzel, 1988; Stout y Miller, 2007).
La hipótesis del comparador es similar a los modelos informativos al suponer
que la respuesta condicionada depende de la relación entre el CS objetivo
y los EE. UU., así como en la relación entre otras señales en la situación
(por ejemplo, el contexto de fondo) y los EE. UU. La fuerza asociativa de otras señales
presente durante el entrenamiento con el CS objetivo es especialmente importante. Otro
La restricción de la hipótesis del comparador es que sólo permite la formación de
asociaciones excitadoras con los EE. UU. Si la respuesta condicionada refleja
Se supone que la excitación o inhibición está determinada por las fuerzas relativas de
excitación condicionada al objetivo CS en comparación con el valor excitador de la
señales contextuales que estaban presentes con el CS objetivo durante el entrenamiento.
El proceso de comparación está representado por el equilibrio en la Figura 6.7 . En esto
figura, se hace una comparación entre el valor excitador del objetivo CS y
el valor excitador de las otras señales que están presentes durante el entrenamiento de ese
CS. Si la excitación CS excede el valor excitador de las señales contextuales, la
El equilibrio de la comparación se inclinará a favor de la respuesta excitadora a la
objetivo CS. A medida que el valor excitador de las otras señales se vuelve más fuerte, el
Página 129
El equilibrio de la comparación será menos favorable para la respuesta excitadora.

De hecho, si el valor excitador de las señales contextuales se vuelve lo suficientemente fuerte,
la balanza puede eventualmente inclinarse a favor de la respuesta inhibitoria al CS diana.
FIGURA 6.7
Ilustración de la hipótesis del comparador. Responder al estímulo condicionado objetivo

(CS) está representado por la lectura del saldo. Si el valor excitador del CS objetivo
excede el valor excitador de las otras señales presentes durante el entrenamiento del CS objetivo,
la balanza se inclina a favor de la respuesta excitadora. Como el valor asociativo de la
Las señales contextuales aumentan, la comparación se vuelve menos favorable para excitadores.
responder y puede inclinarse a favor de la respuesta inhibitoria.
A diferencia de los modelos informacionales, la hipótesis del comparador enfatiza

asociaciones en lugar de tiempo. Una versión simplificada de la hipótesis del comparador,
presentado en la Figura 6.8 , involucra tres asociaciones diferentes. El primero
La asociación (Enlace 1 en la Figura 6.8 ) es entre el CS objetivo (X) y los EE. UU. los
La segunda asociación (Enlace 2) es entre el CS de destino (X) y el comparador
señales contextuales. Finalmente, existe una asociación entre los estímulos comparadores
Página 130
y EE. UU. (Enlace 3). Con todos estos enlaces en su lugar, cuando se presenta la CS,
activa la representación de EE. UU. directamente (a través del Enlace 1) e indirectamente (a través del
Enlaces 2 y 3). Una comparación entre las activaciones directas e indirectas del
La representación de EE. UU. Determina el grado de respuesta excitadora o inhibitoria
que se observa.
FIGURA 6.8
La estructura asociativa de la hipótesis del comparador. El estímulo condicionado objetivo

(CS) se representa como X. Las asociaciones excitadoras dan como resultado la activación de lo incondicionado
representación del estímulo (EE. UU.), ya sea directamente por el objetivo (Enlace 1) o indirectamente (a través de
Enlaces 2 y 3). De "Mecanismos comparadores e inhibición condicionada: condicionada
La preexposición al estímulo interrumpe la inhibición condicionada pavloviana, pero no explícitamente
Inhibición no emparejada ”, por BX Friedman, AP Blaisdell, M. Escobar y RR Miller,
1998, Journal of Experimental Psychology: Animal Behavior Processes , 24 , p. 454.
Copyright 1998 de la Asociación Americana de Psicología.
Página 131
Es importante señalar que la hipótesis del comparador no hace suposiciones.

sobre cómo se establecen las asociaciones. Más bien, describe cómo CS – US y
contexto: las asociaciones de EE. UU. determinan la respuesta al CS objetivo. Por lo tanto, a diferencia de
Modelos atencionales y de modificación de EE. UU., La hipótesis del comparador es una teoría
del rendimiento , no una teoría del aprendizaje.
Un corolario importante de la hipótesis del comparador es que la comparación
entre las asociaciones CS-US y context-US se realiza en el momento de la prueba para
respuesta condicionada. Como consecuencia de este supuesto, el comparador
hipótesis hace la inusual predicción de que la extinción del contexto - EE. UU.
Las asociaciones después del entrenamiento de un CS objetivo mejorarán la respuesta a ese objetivo.
CS. Esta predicción se ha confirmado repetidamente (p. Ej., Blaisdell, Gunther y
Miller, 1999). La modificación estadounidense y las teorías del aprendizaje atencional no pueden
explicar tales resultados.
El hecho de que la extinción poscondicionamiento de las señales contextuales mejora
responder a un CS objetivo indica que la respuesta a un CS objetivo puede modificarse
cambiando las propiedades de las señales de comparación. Este tipo de resultado se llama
efecto de revalorización. La investigación sobre la hipótesis del comparador ha identificado una
número creciente de efectos de revalorización. Una de las revalorizaciones más provocativas
efectos se refiere al efecto de bloqueo.
En la fase crítica del experimento de bloqueo, un nuevo estímulo (B) es
condicionado en presencia de un CS (A) previamente acondicionado. Porque
El estímulo A está presente cuando el estímulo B está siendo condicionado, el estímulo A sirve como
el comparador para el estímulo B. Según la hipótesis del comparador estímulo
B no provocará muchas respuestas condicionadas porque su comparador (estímulo
A) tiene una fuerza excitadora alta, lo que hace que el equilibrio se aleje del estímulo B.
La falta de respuesta al estímulo B refleja este tipo de comparación, una revalorización
La manipulación podría desenmascarar la respuesta al estímulo B. En particular, la
La hipótesis del comparador predice que los participantes aumentarán su respuesta a
estímulo B si el comparador (estímulo A) se extingue. Curiosamente, esto
La predicción se ha confirmado en varios experimentos (Blaisdell et al., 1999;
Boddez, Baeyens, Hermans y Beckers, 2011).
La hipótesis del comparador también se ha probado en estudios de condicionamiento
inhibición. La hipótesis atribuye la respuesta inhibitoria a situaciones en las que
la asociación del CS objetivo con los EE. UU. es más débil que la asociación de
señales contextuales con los EE. UU. Las claves contextuales en este caso son los estímulos que
proporcionan el contexto excitador para el condicionamiento inhibitorio. Curiosamente, el
hipótesis predice que la extinción de estos estímulos excitadores condicionados después
Página 132
El condicionamiento inhibitorio reducirá la respuesta inhibitoria. Por tanto, el comparador

La hipótesis es única al predecir que la extinción de la inhibición condicionada es mejor
logrado no presentando el CS , solo, sino extinguiendo las señales CS +
que proporcionó el contexto excitador para el condicionamiento inhibitorio. Esta inusual
La predicción ha sido confirmada en varios estudios (Best et al., 1985; Lysle &
Fowler, 1985). (Para efectos de revalorización adicionales, ver McConnell, Urushihara,
Y Miller, 2010; Miguez, Witnauer y Miller, 2012.)
Resumen
Muchos casos de condicionamiento pavloviano reflejan el aprendizaje de un S – S
asociación en lugar de una asociación S – R. Esta conclusión está respaldada por
experimentos que muestran que el vigor de la conducta condicionada puede incrementarse o
disminuido por cambios en el valor de los EE. UU. (inflación o devaluación de EE. UU.) después
adquisición. Se han propuesto una variedad de mecanismos para explicar pavloviano
aprendiendo. El modelo Rescorla-Wagner desarrolló la idea de que el
La sorpresa de los Estados Unidos es la fuerza impulsora que produce el aprendizaje y condujo a la
descubrimiento de numerosos fenómenos de aprendizaje novedosos. Modelos atencionales abordados
la misma amplia gama de fenómenos que el modelo Rescorla-Wagner, pero tenían
algunas de las mismas dificultades que ese modelo. Modelos informativos enfocados en
las variables temporales en los procedimientos de acondicionamiento, tales como el I / T Ratio. los
La hipótesis del comparador se ha extendido a una gama más amplia de fenómenos, pero
es una teoría del desempeño más que del aprendizaje. No proporciona un
explicación de cómo se adquieren las asociaciones en primer lugar. Todos estos
Los modelos han sido importantes para dirigir nuestra atención a previamente ignorados
aspectos del condicionamiento clásico y cada uno ha identificado importantes novedades
condicionando variables y manipulaciones.
Lecturas sugeridas
Balsam, PD y Gallistel, CR (2009). Mapas temporales e informatividad en
de asociación aprendiendo. Tendencias en neurociencia , 32 , 73–78.
http://dx.doi.org/10.1016/j.tins.2008.10.004
Delamater, AR, Campese, V., LoLordo, VM y Sclafani, A. (2006).
Efectos de devaluación del estímulo incondicionado en el sabor acondicionado por nutrientes
Página 133
preferencias. Journal of Experimental Psychology: Animal Behavior

Procesos , 32 , 295-306.
Hogarth, L., Dickinson, A. y Duka, T. (2010). Atención selectiva a
estímulos condicionados en el aprendizaje de la discriminación humana: desenredar los efectos
de predicción de resultados, valencia, excitación e incertidumbre. En CJ Mitchell y
ME Le Pelley (Eds.), Atención y aprendizaje asociativo (págs. 71–97).
Oxford, Inglaterra: Oxford University Press.
McLaren, IPL y Mackintosh, Nueva Jersey (2000). Un modelo elemental de
aprendizaje asociativo: I. Inhibición latente y aprendizaje perceptual. Animal
Learning & Behavior , 28 , 211–246. http://dx.doi.org/10.3758/BF03200258
Stout, SC y Miller, RR (2007). Recuperación a veces competitiva (SOCR): A
formalización de la hipótesis del comparador. Revisión psicológica , 114 ,
759–783. http://dx.doi.org/10.1037/0033-295X.114.3.759 [Corrección
publicado en 2008, Psychological Review , 115 , 82.]
Términos técnicos
Asíntota
Hipótesis del comparador
Relación I / T
Sobreexpectación
Aprendizaje S – R
Aprendizaje S – S
Prominencia
Devaluación de EE. UU.
Inflación de EE. UU.
Página 134
Sabía usted que
aprender una nueva respuesta instrumental a menudo implica poner
componentes de respuesta familiares en nuevas combinaciones?
La variabilidad en el comportamiento es una gran ventaja para aprender nuevos
respuestas?
Los efectos deletéreos del retraso del reforzamiento pueden ser
superar presentando un estímulo de marcado de inmediato
después de la respuesta instrumental?
La ley de efecto de Thorndike no implica una asociación
entre la respuesta instrumental y el refuerzo?
El condicionamiento instrumental puede resultar en el aprendizaje de tres
asociaciones binarias y una asociación de orden superior?
Asociaciones pavlovianas adquiridas en el condicionamiento instrumental
Los procedimientos pueden interrumpir el desempeño de instrumentos
respuestas, creando restricciones biológicas en instrumental
¿acondicionamiento?
las diversas asociaciones que se desarrollan en instrumental
condicionamientos son difíciles de aislar unos de otros, lo que
crea grandes problemas para el estudio de la neurofisiología de
aprendizaje instrumental?
Página 135
Los diversos procedimientos que describí hasta ahora (habituación, sensibilización y

Condicionamiento pavloviano) todos implican presentaciones de diferentes tipos de estímulos
según varios arreglos. Los procedimientos producen cambios en el comportamiento
— Aumenta y disminuye en la respuesta — como resultado de estas presentaciones
horarios. Aunque difieren de manera significativa, un importante factor común
característica de los procedimientos de habituación, sensibilización y acondicionamiento pavloviano es
que se administran independientemente de las acciones del organismo. Qué
que los participantes hacen como resultado de los procedimientos no influye en el estímulo
horarios de presentación.
En cierto sentido, los estudios de habituación, sensibilización y condicionamiento pavloviano
representan cómo los organismos aprenden sobre eventos que están fuera de su control.
Los ajustes a eventos incontrolables son importantes porque muchos aspectos de la
el medio ambiente están fuera de nuestro control. Qué día está programada una clase, cuánto dura
tarda en hervir un huevo, qué distancia hay entre las manzanas de la ciudad y cuándo
Las aperturas de las tiendas de comestibles están fuera de nuestro control. Aunque aprendiendo sobre
Los eventos incontrolables son importantes, no todo aprendizaje es de este tipo. Otro
Una categoría importante de aprendizaje involucra situaciones en las que la ocurrencia de un
evento significativo o estímulo incondicionado (EE. UU.) depende de la
comportamiento. Tales casos involucran condicionamiento instrumental u operante .
En los procedimientos de acondicionamiento instrumental, sea o no significativo
El estímulo o evento que ocurre depende del comportamiento del participante. Común
ejemplos de comportamiento instrumental incluyen tirar de las mantas para entrar en calor
cama, juntando ingredientes para hacer limonada, cambiando el canal de televisión a
encontrar un programa más interesante y saludar a alguien para recibir un saludo en
regreso. En todos estos casos, se requiere una respuesta particular para obtener un
estímulo o resultado consecuente. Porque la respuesta es fundamental en
Al producir el resultado, la respuesta se denomina comportamiento instrumental . los
resultado consecuente (la calidez, la sabrosa limonada, el programa de televisión, la
saludo recíproco) se conoce como el reforzador .
El comportamiento operante es un subconjunto especial del comportamiento instrumental que se define

por cómo el comportamiento cambia el medio ambiente. Por ejemplo, girar el pomo de una puerta
suficiente para abrir una puerta es una respuesta operante porque cambia el estado de
la puerta de estar cerrada a estar abierta. Al identificar instancias de esta operante
respuesta, no importa si el pomo de la puerta se gira con el derecho de una persona
mano, mano izquierda, yemas de los dedos o con un agarre completo de la perilla. Tales variaciones en
La topografía de respuesta se ignora en los estudios de comportamiento operante. El foco está en
Página 136
el cambio ambiental común que se produce por el comportamiento operante.

Un ejemplo común de comportamiento operante en la investigación con animales implica un
rata de laboratorio presionando una palanca de respuesta en una pequeña cámara experimental (ver
Figura 7.1 ). Si se ha producido o no una respuesta al presionar la palanca, se puede
determinado colocando un microinterruptor debajo de la palanca. En un experimento típico,
las presiones de la palanca con fuerza suficiente para activar el microinterruptor se cuentan como
instancias de la respuesta operante de presión de palanca. Si la rata presiona la palanca
con su pata derecha o izquierda o su nariz se ignora siempre que el microinterruptor esté
activado. Otro ejemplo común de comportamiento operante en la investigación con animales es un
paloma picoteando un disco o un estímulo en una pared. Varias formas de picotear son
ignorado siempre que los picotazos sean detectados por la pantalla táctil en la pared.
FIGURA 7.1
Una preparación de laboratorio común para el estudio de la conducta operante. El dibujo muestra
una rata en una cámara de presión de palanca. Hay una taza de comida debajo de la palanca.
Página 137
Las tradiciones de Thorndike y Skinner

Las tradiciones intelectuales del condicionamiento clásico fueron establecidas por un
figura dominante, Ivan Pavlov. En contraste, las tradiciones intelectuales de
El condicionamiento instrumental u operante tiene sus raíces en el trabajo de dos
Gigantes estadounidenses de la psicología del siglo XX, Edward L.Thorndike y BF
Skinner (ver Figuras 7.2 y 7.3, respectivamente). Los métodos empíricos así como
Las perspectivas teóricas de estos dos científicos eran sorprendentemente diferentes, pero
las tradiciones que cada uno de los fundadores ha perdurado hasta el día de hoy. Primero considero el
métodos experimentales distintivos utilizados por Thorndike y Skinner y luego anotar
algunas diferencias en sus perspectivas teóricas.
FIGURA 7.2
Página 138
Edward L. Thorndike. De Wikimedia Commons. Obtenido de

https://upload.wikimedia.org/wikipedia/commons/6/66/PSM_V80_D211_Edward_Lee_Th
orndike.png . En el dominio público.
FIGURA 7.3
Página 139
BF Skinner. De Wikimedia Commons. Obtenido de

https://commons.wikimedia.org/wiki/File:BF_Skinner_at_Harvard_circa_1950.jpg. En el
dominio publico.
CONSIDERACIONES METODOLÓGICAS
Thorndike estaba interesado en estudiar la "inteligencia" animal. Para hacer esto, él
diseñó una serie de cajas de rompecabezas para gatos jóvenes en un proyecto que se convirtió en su
Tesis doctoral (Thorndike, 1898). Se requirió un tipo diferente de respuesta para
Página 140
sal de cada caja. El rompecabezas consistía en descubrir cómo escapar de la caja.

Thorndike pondría un gatito en una caja de rompecabezas en sucesivas pruebas y
Mide cuánto tiempo tardó el gatito en salir de la caja y obtener un trozo de pescado.
En algunas cajas de rompecabezas, los gatitos tenían que dar solo un tipo de respuesta para obtener
hacia afuera (por ejemplo, girando un pestillo). En otros, se requirieron varias acciones, y estas tuvieron
a realizar en un orden particular. Thorndike descubrió que con pruebas repetidas,
los gatitos se volvieron cada vez más rápidos para escapar de la caja. Su escape
latencias disminuidas.
El método de ensayo discreto

Los experimentos de Thorndike ilustran el método de ensayo discreto utilizado en el estudio de
comportamiento instrumental. En el método de ensayo discreto, el participante tiene la
oportunidad de realizar la respuesta instrumental sólo en ciertos momentos (durante
ensayos discretos) según lo determinado por el experimentador. En el caso de Thorndike
experimentos, el gatito solo pudo realizar la respuesta de escape instrumental
después de que se colocó en una caja de rompecabezas. Cuando dio la respuesta requerida, fue
liberado de la caja. El siguiente juicio no comenzó hasta que Thorndike decidió
vuelve a poner el gatito en la caja.
El método de ensayo discreto fue adoptado posteriormente por investigadores que
utilizó laberintos de varios tipos para estudiar el condicionamiento instrumental. Los laberintos son
normalmente se utiliza con ratas y ratones de laboratorio. Fueron introducidos en el
artillería de investigación de científicos del comportamiento por Willard Small, quien construyó un laberinto
en un esfuerzo por imitar las estructuras en forma de túnel de las madrigueras subterráneas en
qué ratas viven (Small, 1900, 1901).
Un tipo común de laberinto es la pista de callejón recto (ver Figura 7.4). en un
pista de callejón recto, la rata se coloca primero en la casilla de salida. La puerta de la caja de inicio es
luego levantado para permitir que la rata vaya a la caja de gol en el otro extremo de la pista.
Al llegar a la caja de la meta, la rata recibe un pequeño trozo de comida y luego
eliminado hasta que llegue el momento de la siguiente prueba. La velocidad de correr desde el cuadro de inicio.
a la caja de gol se mide en cada intento. El aprendizaje da como resultado una mayor velocidad de
corriendo.
FIGURA 7.4
Página 141
Vista superior de una pista y un laberinto en T. S es el cuadro de inicio; G es el cuadro de gol.
Otro aparato común es la T-laberinto . Esto también tiene una caja de inicio. Después
el participante es liberado del cuadro de inicio, se le permite ir a una opción
punto, donde tiene que seleccionar uno u otro brazo de la T para entrar a continuación. La t-
maze, por lo tanto, es particularmente adecuado para medir el comportamiento de elección.
El método de ensayo discreto requiere numerosas manipulaciones. los
El experimentador tiene que recoger la rata, colocarla en la caja de inicio, esperar a que alcance
la caja de gol, retírelo de la caja de gol y luego colóquelo en un área de espera para
el intervalo entre ensayos. Otra característica distintiva del juicio discreto
El método es que se determina cuánto tiempo tiene que esperar el participante entre ensayos.
por el experimentador.
El método de operación libre

La principal alternativa al método de ensayo discreto para el estudio de instrumentos
Página 142
la conducta es el método libre-operante , desarrollado por BF Skinner (1938). Desollador

Hizo numerosas contribuciones, tanto metodológicas como conceptuales, al estudio
comportamiento, y estos dos tipos de contribuciones a menudo estaban interrelacionados. los
El método operante libre es un ejemplo de ello.
El desarrollo de Skinner del método libre-operante comenzó con un interés en
diseñando un laberinto automatizado para ratas, un laberinto en el que las ratas
volverá automáticamente al cuadro de inicio después de cada prueba. Tal aparato
tienen la ventaja obvia de que la rata sólo se manipulará al principio y
al final de una sesión de entrenamiento, liberando al experimentador para hacer otras cosas en
el ínterin. Un laberinto automatizado también permitiría que la rata en lugar de la
experimentador para decidir cuándo comenzar su próximo ensayo. Esto permitiría
investigación de no solo la rapidez con que la rata completó una respuesta instrumental
pero con qué frecuencia eligió realizar la respuesta. Por lo tanto, un laberinto automatizado
prometió proporcionar nueva información que no se pudo obtener con el
método de ensayo discreto.
Skinner probó varios enfoques para automatizar el laberinto de prueba discreta
procedimiento. Cada enfoque incorporó algunas mejoras en el anterior
diseño, pero a medida que avanzaba el trabajo, el aparato se parecía cada vez menos a un
laberinto (Skinner, 1956). El resultado final fue lo que ha llegado a conocerse como el
Caja desolladora, en la que una rata tiene que presionar una palanca para obtener un trozo de comida
se dejó caer en una taza de comida cerca de la palanca.
En el cuadro de Skinner, la respuesta de interés se define en términos del cierre
de un microinterruptor. La interfaz de la computadora ignora si la rata presiona el
palanca con una u otra pata o con la cola. Otra característica importante del
El cuadro Skinner es que la respuesta operante puede ocurrir en cualquier momento. El intervalo
entre respuestas sucesivas es determinada por el participante más que por el
experimentador. Dado que la respuesta operante se puede realizar en cualquier momento, el método
se llama método operante libre .
La principal ventaja conceptual del método operante libre es que
permite al participante iniciar repetidamente la respuesta instrumental. Desollador
centrado en este aspecto del comportamiento. Con qué frecuencia una rata inicia la respuesta operante
puede cuantificarse en términos de la frecuencia de la respuesta en un período dado de
tiempo, o la tasa de respuesta . La tasa de respuesta es la principal medida de
comportamiento en experimentos que utilizan el método libre operante.
El aprendizaje inicial de un instrumental u operante
Página 143
Respuesta
La gente suele pensar en el condicionamiento instrumental u operante como una técnica para
entrenar nuevas respuestas. Balancear un bate, lanzar una pelota de fútbol o jugar al
Todos los tambores implican respuestas instrumentales que los jugadores expertos aprenden a través de
práctica extensa. Sin embargo, ¿en qué sentido son nuevas estas respuestas? Lo hace
¿El condicionamiento instrumental siempre establece respuestas completamente nuevas?
Alternativamente, ¿el condicionamiento instrumental combina respuestas familiares en nuevos
formas, o establece una respuesta familiar en una nueva situación?
APRENDER DÓNDE Y PARA QUÉ CORRER

Considere, por ejemplo, una rata hambrienta que aprende a correr de un extremo de una pista a
el otro por un trozo de comida. Una rata ingenua experimentalmente es lenta para ejecutar el
longitud de la pista al principio. Sin embargo, esto no se debe a que entre en el
Experimente sin la habilidad motora de correr. No es necesario enseñar a las ratas a
corre, así como a los niños no es necesario que se les enseñe a caminar. Lo que tienen que ser enseñado
es dónde correr y para qué correr . En la pasarela de callejón recto, el instrumental
El procedimiento de acondicionamiento proporciona el control del estímulo y la motivación para la
ejecución de respuesta. No establece la ejecución como una nueva respuesta en el
repertorio del participante.
CONSTRUYENDO NUEVAS RESPUESTAS DE FAMILIAR

COMPONENTES
La respuesta instrumental de presionar una palanca es un poco diferente a la de correr. Un
La rata experimentalmente ingenua probablemente nunca ha encontrado una palanca antes y
nunca realizó una respuesta de presión de palanca. A diferencia de la carrera, la presión de la palanca debe ser
aprendido en la situación experimental. Pero, ¿tiene que aprenderse de
¿rasguño? Difícilmente.
Una rata no entrenada no es tan ingenua a la hora de presionar una palanca como podría pensarse.
La presión de la palanca consta de varios componentes: equilibrio sobre las patas traseras,
levantando una o ambas patas delanteras, extendiendo una pata hacia adelante sobre la palanca, y luego
bajando la pata con fuerza suficiente para presionar la palanca y activar la
micro interruptor. Las ratas realizan respuestas muy parecidas a estas en varios momentos mientras
explorando sus jaulas, explorándose unos a otros o manipulando gránulos de comida. Qué
que tienen que aprender en la situación de condicionamiento operante es cómo poner los diversos
Página 144
componentes de respuesta juntos para crear la nueva respuesta de presión de palanca.

Presionar una palanca es una nueva respuesta solo en el sentido de que implica una nueva
combinación de componentes de respuesta que ya existen en el
repertorio. En este caso, el condicionamiento instrumental implica la construcción o
síntesis de una nueva unidad de comportamiento a partir de componentes de respuesta preexistentes
(Balsam, Deich, Ohyama y Stokes, 1998).
FORMANDO NUEVAS RESPUESTAS

¿Se puede utilizar también el condicionamiento instrumental para condicionar respuestas completamente nuevas?
—Respuestas que un individuo nunca realizaría sin instrumentos
¿acondicionamiento? Seguramente. El acondicionamiento instrumental se utiliza para dar forma
hazañas notables de rendimiento en deportes, patinaje sobre hielo, ballet y música
rendimiento: hazañas que casi desafían a la naturaleza. Se puede entrenar a un perro policía para trepar
una barrera vertical de 12 pies, un velocista puede aprender a correr una milla en 4 minutos, y un
El golfista profesional puede aprender a conducir una pelota 200 yardas de un solo golpe. Tales respuestas son
notables porque no se parecen a nada que alguien pueda hacer sin especial
capacitación.
En un procedimiento de acondicionamiento instrumental, el individuo tiene que realizar el
respuesta requerida antes de que se entregue el resultado o el reforzador. Dado este
restricción, ¿cómo se pueden utilizar los procedimientos instrumentales para condicionar las respuestas que
nunca ocurren por su cuenta? El aprendizaje de respuestas completamente nuevas es posible
debido a la variabilidad del comportamiento. La variabilidad es quizás la más obvia
característica del comportamiento. Los organismos rara vez hacen lo mismo dos veces exactamente en
misma manera. La variabilidad de respuesta generalmente se considera una maldición porque
refleja falta de precisión y dificulta la predicción del comportamiento. Sin embargo, para
aprendiendo nuevas respuestas, la variabilidad es una bendición.
Con acondicionamiento instrumental, la entrega de un reforzador (p. Ej., Una pastilla de
comida) no da como resultado la repetición de la misma respuesta exacta que produjo la
reforzador. Si una rata, por ejemplo, se refuerza con una bolita de comida para presionar un
palanca con una fuerza de 2 gramos, no presionará la palanca exactamente con esa fuerza
después de eso. A veces responderá con menos presión, otras veces con más.
El primer panel en la Figura 7.5 muestra lo que la distribución de respuestas podría
se ve como en un experimento donde la presión de la palanca se refuerza solo si una fuerza
se utiliza más de 2 gramos. Observe que muchas, pero no todas, las respuestas
exceder el criterio de 2 gramos. Algunas de las respuestas superan una fuerza de 3 gramos,
pero ninguno excede los 4 gramos.
Página 145
FIGURA 7.5
Frecuencia de respuestas al presionar la palanca que involucran varios grados de fuerza. En el primer panel,
sólo las respuestas de más de 2 gramos de fuerza dieron como resultado la liberación del reforzador. En el
En el segundo panel, solo se reforzaron las respuestas superiores a 3 gramos en vigor. En el tercero
panel, solo se reforzaron las respuestas superiores a 4 gramos en vigor. (Los datos son
hipotético.)
Debido a que la variabilidad en el comportamiento incluye respuestas tan contundentes como 3

gramos, podemos cambiar el criterio de respuesta para que el reforzador sea ahora solo
siempre que la rata presiona la palanca con una fuerza superior a 3 gramos. Después
Página 146
varias sesiones con este nuevo requisito de fuerza, la distribución de las prensas de palanca
tendrá un aspecto parecido al que se muestra en el segundo panel de la Figura 7.5 .
La respuesta sigue siendo variable después del cambio en el requisito de respuesta.
Al aumentar el requisito de fuerza, la distribución de la fuerza se desplaza hacia la derecha de modo que
la mayoría de las prensas de palanca ahora superan los 3 gramos. Una consecuencia de esto
cambio es que la rata presiona ocasionalmente la palanca con una fuerza de 4 gramos o
más. Tenga en cuenta que estas respuestas son completamente nuevas. Ellos no ocurrieron
originalmente.
Debido a que ahora tenemos respuestas que exceden los 4 gramos, podemos aumentar la
requisito de respuesta de nuevo. Podemos cambiar el procedimiento para que ahora la comida
La pastilla se administra solo para respuestas que tienen una fuerza de al menos 4 gramos. Esta voluntad
dar lugar a un cambio adicional de la distribución de fuerza a valores aún más altos, como se muestra en
el tercer panel de la Figura 7.5 . Ahora la mayoría de las respuestas superan los 4 gramos y
a veces la rata presiona la palanca con una fuerza superior a 5 gramos. Respuestas
con tanta fuerza son muy diferentes de lo que empezó a hacer la rata.
El procedimiento que acabo de describir se llama modelado . El modelado se usa cuando el
El objetivo es condicionar las respuestas instrumentales que no están en el
repertorio conductual existente. El nuevo comportamiento se forma imponiendo un
serie progresiva de requisitos de respuesta. La respuesta progresiva
Los requisitos toman gradualmente al participante de su repertorio conductual inicial.
a la respuesta objetivo deseada (p. ej., Deich, Allan y Zeigler, 1988; Galbicka,
1988; Pear y Legris, 1987; Stokes, Mechner y Balsam, 1999).
Al establecer un procedimiento de modelado, el rendimiento final deseado debe ser
claramente definido. Esto establece el objetivo o el punto final del procedimiento de modelado. Próximo,
El repertorio conductual existente del participante debe documentarse para que
el punto de partida se comprende bien. Finalmente, una secuencia de pasos de entrenamiento debe
estar diseñado para llevar al participante desde su comportamiento inicial hasta el objetivo final
respuesta. La secuencia de pasos de entrenamiento implica aproximaciones sucesivas a
la respuesta final. Por lo tanto, la conformación se define típicamente como el refuerzo
de aproximaciones sucesivas.
Dar forma es útil no solo para entrenar respuestas completamente nuevas, sino también para
entrenar nuevas combinaciones de componentes de respuesta existentes. Montando una bicicleta,
por ejemplo, involucra tres componentes principales de respuesta: dirección, pedaleo y
mantener el equilibrio. Los niños que aprenden a montar suelen empezar por aprender a pedalear.
Pedalear es una nueva respuesta. No se parece a nada que pueda haber hecho un niño
antes de montar en bicicleta. Permitir que el niño aprenda a pedalear sin tener
para mantener el equilibrio, un niño comienza en un triciclo o una bicicleta con ruedas de entrenamiento. Tiempo
Página 147
aprendiendo a pedalear, es poco probable que el niño preste mucha atención a la dirección y
Necesitará ayuda para asegurarse de que no conduzca hacia un arbusto o se salga de la acera.
Una vez que el niño ha aprendido a pedalear, está listo para combinar esto con
direccion. Solo después de que el niño haya aprendido a combinar el pedaleo con la dirección
ella lista para agregar el componente de saldo. Agregar el componente de saldo es el
la parte más difícil de la tarea. Es por eso que los padres a menudo esperan hasta que un niño sea competente.
en andar en bicicleta con ruedas de apoyo antes de dejarla andar sin ellas.
La importancia del refuerzo inmediato

El condicionamiento instrumental es básicamente un proceso de selección de respuestas. La respuesta
(o combinación única de componentes de respuesta) que da como resultado la entrega de
el reforzador se selecciona de la diversidad de acciones que realiza el organismo en
la situación. Es fundamental para este proceso de selección de respuesta que el reforzador sea
entregado inmediatamente después de la respuesta deseada o objetivo. Si el reforzador es
retrasado, otras actividades están obligadas a intervenir antes que el reforzador, y una de las
Estas otras actividades pueden reforzarse en lugar de la respuesta objetivo (ver Figura
7.6 ).
FIGURA 7.6
Diagrama de refuerzo inmediato y retardado de la respuesta objetivo RX. R1, R2, R3,
y R4 representan diferentes actividades del organismo. O representa la entrega del
reforzador. Observe que cuando el refuerzo se retrasa después de la RX, ocurren otras respuestas.
más cerca del reforzador.
La entrega de un reforzador primario inmediatamente después de la respuesta objetivo no es

siempre practico. Por ejemplo, la oportunidad de ir a un patio de recreo sirve como un
reforzador eficaz para niños en la escuela primaria. Sin embargo, sera
Página 148
perturbador para permitir que un niño salga afuera cada vez que termina un problema de matemáticas. A
Un enfoque más práctico es darle al niño una estrella por cada problema completado,
y luego permitir que estas estrellas se intercambien por la oportunidad de ir a la
patio de recreo. Con tal procedimiento, el reforzador principal (acceso a la
patio de recreo) se retrasa después de la respuesta instrumental, pero la instrumental
La respuesta es seguida inmediatamente por un estímulo (la estrella) que se asocia con
el reforzador principal.
Un estímulo que está asociado con un reforzador primario se llama
reforzador condicionado o secundario . La entrega de un reforzador condicionado
inmediatamente después de que la respuesta instrumental supere la ineficacia de
refuerzo retrasado en el acondicionamiento instrumental (p. ej., Winter & Perkins,
mil novecientos ochenta y dos).
La ineficacia del refuerzo retrasado también puede superarse mediante
presentando un estímulo de marcado inmediatamente después de la respuesta objetivo. Una marca
El estímulo no es un reforzador condicionado y no proporciona información sobre un
oportunidad futura de obtener refuerzo primario. Más bien, es una breve presentación visual o
señal auditiva que distingue la respuesta objetivo de las otras actividades que
Es probable que el participante actúe durante un intervalo de retraso. De esta forma, el marcado
El estímulo hace que la respuesta instrumental sea más memorable y ayuda a superar
el efecto deletéreo del retardo del reforzador (Lieberman, McIntosh y Thomas,
1979; BA Williams, 1999).
Mecanismos asociativos en el condicionamiento instrumental

Habiendo discutido los principales problemas de procedimiento en el condicionamiento instrumental, a continuación
considere los mecanismos asociativos subyacentes. El condicionamiento instrumental es
típicamente se distingue del condicionamiento pavloviano sobre la base de procedimientos
diferencias. Se requiere una respuesta para la entrega del reforzador en instrumental.
acondicionamiento, pero no en el acondicionamiento pavloviano. Las dos formas de condicionamiento
también puede distinguirse sobre la base de algunas (pero no todas) de las asociaciones
que se aprenden en condicionamiento instrumental y pavloviano.
LA ASOCIACIÓN R – O
Metodológicamente, los eventos más obvios en el condicionamiento instrumental son los
respuesta instrumental y el reforzador. La respuesta puede estar representada por R
Página 149
y el resultado de respuesta o reforzador por O . Al pensar en relaciones que

se aprenden en condicionamiento instrumental, una asociación entre el instrumental
respuesta y el reforzador puede ser el primero que se le ocurra. Este es
llamado la asociación R-O .
Aunque existe una fuerte evidencia de asociaciones R – O (Colwill & Rescorla,
1990; Hogarth y Chase, 2011; Ostlund, Winterbauer y Balleine, 2008), un R – O
asociación por sí misma no es suficiente para explicar la ocurrencia de instrumentos
comportamiento. Una asociación R – O significa que la ejecución de R activa la memoria de
O. Una asociación R – O entra en juego cuando se realiza la respuesta, pero que
no nos dice por qué ocurre la respuesta en primer lugar. Por lo tanto, un R – O
la asociación no es suficiente para explicar el inicio de una respuesta instrumental.
LA ASOCIACIÓN S – R Y LA LEY DE EFECTO DE THORNDIKE

Comenzando con los primeros esfuerzos teóricos, los investigadores eran conscientes de que
Hay más en una situación de condicionamiento instrumental que simplemente la respuesta
y su resultado reforzador. Thorndike señaló que los organismos experimentan una
conjunto único de estímulos cuando realizan una respuesta instrumental. En
En los experimentos de Thorndike, estos estímulos fueron proporcionados por la caja del rompecabezas en
que se colocó a un participante al comienzo de una prueba de entrenamiento. Cada caja de rompecabezas
tenía características distintivas. Una vez que un participante fue asignado a una caja de rompecabezas,
Experimentó un conjunto único de señales cada vez que realizó el escape requerido
respuesta. Esos estímulos pueden ser representados por S .
Thorndike propuso que durante el curso del condicionamiento instrumental, un
La asociación llega a establecerse entre la respuesta R y la
estímulos ambientales S (ver Figura 7.7 ). De hecho, Thorndike creía que este S–
La asociación R fue lo único que se aprendió en el condicionamiento instrumental.
Resumió su pensamiento en la ley del efecto , que establece que los instrumentos
El aprendizaje implica la formación de una asociación entre los instrumentos
respuesta R y los estímulos S en presencia de los cuales se realiza la respuesta.
El reforzador entregado después de la respuesta sirve para fortalecer o "estampar" la
Asociación S – R.
FIGURA 7.7
Página 150
Diagrama de la asociación S – R en condicionamiento instrumental.
La ley de efecto de Thorndike es contraria a la intuición y, a menudo, incorrectamente.

caracterizada. Tenga en cuenta que de acuerdo con la ley del efecto, el condicionamiento instrumental
no implica aprender a asociar la respuesta con el reforzador. Lo hace
no implica el establecimiento de una asociación R – O o el aprendizaje sobre la
reforzador. Más bien, el condicionamiento instrumental da como resultado sólo el establecimiento de
una asociación S – R. El resultado reforzador O es significativo simplemente como catalizador.
para el aprendizaje de la asociación S – R pero no es parte de esa asociación.
La ley del efecto es una adaptación del concepto de comportamiento provocado a
aprendizaje instrumental. El comportamiento provocado es una respuesta a un estímulo particular. En
De manera análoga, la ley del efecto considera la respuesta instrumental R a
ser una respuesta al contexto del estímulo S. La ley del efecto proporcionó así una
explicación causal directa de la conducta instrumental.
Aunque se propuso hace más de un siglo, la ley del efecto sigue siendo
prominente en los análisis contemporáneos del comportamiento. Porque S viene a producir R

sin ningún proceso que intervenga, la asociación S – R de la ley del efecto ha
llegar a ser considerado como el mecanismo principal responsable de la habitual
acciones que las personas realizan automáticamente sin pensarlo mucho o deliberar
como cepillarse los dientes o tomar un sorbo de café por la mañana (Duhigg, 2012; Wood &
Neal, 2007).
Un área importante de investigación contemporánea en la que Thorndike's S – R
El mecanismo juega un papel importante es el análisis de la adicción a las drogas y otras formas.
de comportamiento compulsivo (Hogarth, Balleine, Corbit y Killcross, 2013; Zapata,
Minney y Shippenberg, 2010). Sentarse en un bar y beber un trago de whisky es
una respuesta instrumental. Las drogas de abuso se consumen inicialmente debido a su
efectos reforzantes. Sin embargo, con el uso habitual, el consumo de drogas se convierte en un
reacción automática a las señales asociadas con el comportamiento. Un alcohólico sentado en un
bar con un trago de whisky frente a él no puede resistirse a tomar un trago. los
La naturaleza compulsiva de la adicción a las drogas refleja el control SR de la conducta.
Página 151
El juego compulsivo y el comportamiento sexual compulsivo tienen características similares.

Una vez que se encuentran las señales relevantes para el comportamiento, el mecanismo S – R
domina las intenciones cognitivas o la "fuerza de voluntad" para abstenerse.
LA ASOCIACIÓN S – O
Aunque la relación S-R es convincente, no opera de forma aislada.
Otra relación importante que tiene profundas raíces en el estudio de los instrumentos
El comportamiento es la relación entre los estímulos antecedentes S y el reforzador.
resultado O (ver Figura 7.8). Debido a que la respuesta instrumental R da como resultado
entrega del reforzador O en presencia de las señales contextuales particulares S, S
sirve como una señal confiable para O. Esto da como resultado el aprendizaje de la S – O
asociación (Hull, 1930, 1931).
FIGURA 7.8
Diagrama de la asociación S – O en el condicionamiento instrumental.
La asociación S – O es muy parecida a un estímulo condicionado pavloviano:

asociación de estímulo incondicionado (CS-US) y tiene algunos de los mismos
consecuencias de comportamiento. Por ejemplo, el establecimiento de la asociación S – O
resulta en respuestas condicionadas pavlovianas provocadas por S. Más importante
para comprender el comportamiento instrumental, la asociación S – O significa que
Los procesos pavlovianos contribuyen al control de la respuesta instrumental
(Rescorla y Solomon, 1967). Estas contribuciones se estudian típicamente en
Experimentos de transferencia instrumental pavloviana (Holmes, Marchand y Coutureau,

2010).
Los experimentos de transferencia instrumental pavloviana se han vuelto comunes en
neurociencia del comportamiento como una forma de estudiar los efectos de la motivación de incentivos en
respuesta instrumental. Estos experimentos suelen tener dos fases de formación.
Página 152
y una fase de prueba de transferencia. Una fase de entrenamiento implica acondicionamiento instrumental
(p. ej., palanca de refuerzo presionando con comida). La segunda fase de formación implica
Acondicionamiento pavloviano (p. Ej., Emparejar un tono CS con comida). Como resultado de la
Acondicionamiento pavloviano, el tono vendrá a activar la memoria de la comida y
de ese modo crea un incentivo para comer. Los efectos de esa motivación de incentivo son
evidente durante la prueba de transferencia cuando la presentación del tono pavloviano es
se encontró que aumenta la presión de la palanca reforzada con alimentos.
Anteriormente hablé de otro ejemplo de transferencia instrumental pavloviana
cuando describí el procedimiento de supresión condicionada como una técnica para
estudiar el condicionamiento del miedo (véase el Capítulo 4 de este volumen). En el condicionado
procedimiento de supresión, se encuentra que un CS pavloviano emparejado con shock suprime
palanca presionando para comida. Esto es lo contrario de lo que ocurre si el CS pavloviano es
emparejado con comida. Los resultados contrastantes ilustran que un CS pavloviano puede
Facilitar o suprimir la respuesta instrumental a la comida dependiendo del grado
para el cual las propiedades incentivadoras del CS pavloviano son compatibles con el
propiedades incentivadoras del reforzador instrumental (alimento).
LA ASOCIACIÓN S (R – O)
Las tres relaciones de eventos que hemos considerado hasta ahora — R – O, S – R y S – O —
son asociaciones binarias o directas entre pares de elementos del instrumental
situación condicionante. Otra forma en que S, R y O pueden relacionarse en
condicionamiento instrumental es a través de una relación de orden superior que puede ser referida
a como la asociación S (R – O) (véase la Figura 7.9 ). Uno de los primeros científicos en
Reconocer la relación S (R – O) fue BF Skinner (1969).
FIGURA 7.9
Diagrama de la asociación S (R – O) en el condicionamiento instrumental.
Página 153
Diagrama de la asociación S (R – O) en el condicionamiento instrumental.
Skinner enfatizó que en el condicionamiento instrumental, la presentación de

el reforzador O depende de la ocurrencia previa de la respuesta R, no de
la ocurrencia previa de S. La relación R – O, sin embargo, está en efecto sólo en el
presencia de S. Por lo tanto, sugirió que una relación de orden superior se convierte en
establecido en el que S señala la existencia de la contingencia R – O o establece la
ocasión para la asociación R – O. Skinner se refirió a esto como tres plazo
contingencia . La contingencia de tres términos se puede representar como S (R – O). los
La relación S (R – O) en el condicionamiento instrumental es análoga al orden superior
Relación B (A-US) en el condicionamiento pavloviano, que describí en Capítulo 5 .
Investigaciones experimentales de la estructura asociativa de instrumentos
condicionamiento han proporcionado evidencia de las cuatro asociaciones que he
descritos: R – O, S – R, S – O y S (R – O). Por tanto, la conducta instrumental no es un
Forma "simple" de aprendizaje, pero implica una serie de relaciones diferentes, todas
que contribuyen al control de la respuesta instrumental de diferentes formas.
Implicaciones de las limitaciones biológicas en

Condicionamiento instrumental
Comprender la estructura asociativa del condicionamiento instrumental ayuda a
resolver algunos problemas perdurables en el aprendizaje instrumental. En algunos de Thorndike
cajas de rompecabezas, los gatitos tenían que bostezar o rascarse para poder salir
(Thorndike, 1911). El aprendizaje avanzó lentamente en estos cuadros. Incluso después
entrenamiento extenso, los gatitos no bostezaban vigorosamente y de buena fe
respuestas; más bien, realizaron bostezos abortivos rápidos. Thorndike obtenido
resultados similares cuando se pidió a los gatitos que se rascaran para poder salir
De la caja. En este caso, los gatitos hicieron intentos rápidos y poco entusiastas de rascarse
ellos mismos. Estos ejemplos ilustran el hallazgo general de que el cuidado personal y
Las respuestas de acicalamiento son difíciles de condicionar con el refuerzo de alimentos.
Otra categoría de comportamiento instrumental que es difícil de condicionar
El refuerzo alimentario es el lanzamiento de una moneda o ficha. Dos de los graduados de Skinner
estudiantes, Keller Breland y Marian Breland, quedaron fascinados con la
posibilidades de adiestramiento animal y montar una empresa que suministrase
animales para ver en parques de atracciones, escaparates de grandes almacenes y zoológicos.
Como parte de su negocio, los Breland entrenaron a numerosas especies de animales para
Página 154
hacer varias cosas entretenidas (Breland & Breland, 1961).

Para una exhibición, intentaron que un cerdo tomara una moneda y la dejara caer en un
alcancía para obtener comida. Aunque el cerdo hizo lo que se suponía que debía hacer unos pocos
veces, a medida que avanzaba el entrenamiento, se volvió reacio a lanzar la moneda y la arraigó
a lo largo del suelo. Este comportamiento de enraizamiento llegó a predominar, y el
El proyecto tuvo que ser abandonado. Los Breland se refirieron a esto como "mala conducta"
porque era contrario al resultado que debería haber ocurrido basado en
principios de condicionamiento instrumental. Otros se refirieron posteriormente a ejemplos
de comportamientos como las limitaciones biológicas del aprendizaje .
Varios factores son probablemente responsables de las limitaciones al aprendizaje que
Se han encontrado en el acondicionamiento del comportamiento de aseo y liberación de monedas.
(Shettleworth, 1975). Uno de los factores más importantes parece ser la
desarrollo de asociaciones S – O en estos procedimientos de acondicionamiento instrumental
(Timberlake, Wahl y King, 1982). En la tarea de lanzamiento de monedas, la moneda se convierte en
asociado con el reforzador de alimentos y sirve como estímulo S en el S – O
asociación. En el refuerzo instrumental del aseo, se proporciona el estímulo S
por las señales contextuales de la situación condicionante. Porque las asociaciones S – O
son muy parecidas a las asociaciones pavlovianas entre una CS y una estadounidense, pavloviana
Las respuestas condicionadas relacionadas con el reforzador llegan a ser provocadas por S.
Las respuestas pavlovianas condicionadas con la comida consisten en acercarse y
manipulando el estímulo condicionado. Estas respuestas anticipadoras de alimentos son
incompatible con el cuidado personal y el aseo personal. También son incompatibles con
soltar y, por lo tanto, retirar de una moneda que ha venido a señalar la
disponibilidad de alimentos.
Implicaciones para los mecanismos neuronales de instrumental

Acondicionamiento
La complejidad de la estructura asociativa del aprendizaje instrumental presenta
serios desafíos para los científicos que intentan descubrir los mecanismos neurales y
el circuito neuronal subyacente al comportamiento instrumental. Esto es diferente a la situación.
para el acondicionamiento pavloviano. Como vimos en los Capítulos 4 y 5 , hay dos simples
y formas más complejas de condicionamiento pavloviano. Formas simples de pavloviano
el condicionamiento excitador está mediado simplemente por una asociación S – S. Mas complejo
las formas implican relaciones de orden superior, B (A – US). Sin embargo, uno puede examinar el
mecanismos neuronales de asociaciones S – S con procedimientos que no involucran
Página 155
relaciones de orden superior B (A – EE. UU.). Desafortunadamente, tal simplificación de procedimiento es

no es posible en estudios de condicionamiento instrumental.
El aprendizaje instrumental implica asociaciones binarias (S – R, S – O y R – O), como
así como la relación S (R – O) de orden superior. Además, no se puede diseñar un
procedimiento de condicionamiento instrumental que involucra una de estas asociaciones para
la exclusión de los demás. Por ejemplo, no se puede diseñar un instrumento
procedimiento que permite asociaciones S – O sin permitir también asociaciones R – O,
porque la entrega de O contingente en R es una característica inherente de instrumental
acondicionamiento. Tampoco se puede crear un procedimiento instrumental que permita S – R
asociaciones sin permitir también asociaciones R – O y S (R – O). Finalmente, uno
no puede diseñar un procedimiento que solo dé como resultado una asociación R – O porque como
Tan pronto como uno define una respuesta, también ha definido un conjunto de señales S que ocurren
cuando se da la respuesta.
La única forma de aislar una de las asociaciones con exclusión de las demás
es mediante el uso de diseños experimentales complejos que mantienen todos menos uno de los
asociaciones constantes (Colwill & Rescorla, 1990). Por ejemplo, podemos entrenar
dos grupos de participantes con procedimientos que producen idénticos S – R y S – O
asociaciones, pero diferentes asociaciones R – O. Descubriendo cómo con éxito
variar una
desafío. asociación
Esa puede sermanteniendo todas las
una de las razones pordemás
las queiguales puede
sabemos ser un
mucho másfactor
sobreimportante
el
mecanismos del condicionamiento pavloviano de lo que conocemos sobre el
mecanismos de condicionamiento instrumental.
Resumen
En el condicionamiento instrumental, la entrega de un evento biológicamente significativo o
reforzador depende de la ocurrencia previa de una instrumental u operante especificada
respuesta. El comportamiento instrumental puede ser una respuesta preexistente que el
El organismo tiene que actuar en una nueva situación, un conjunto de respuestas familiares
componentes que el organismo tiene que juntar en una combinación desconocida,
o una actividad que es completamente nueva para el organismo. Aprendizaje exitoso en cada
caso requiere entregar el reforzador inmediatamente después del instrumental
respuesta o proporcionar un reforzador condicionado o marcar un estímulo inmediatamente
después de la respuesta.
El condicionamiento instrumental fue examinado por primera vez por Thorndike, quien desarrolló
procedimientos de ensayo discreto que le permitieron medir cómo la latencia de un
Página 156
La respuesta instrumental cambia con sucesivos ensayos de entrenamiento. Los esfuerzos de Skinner
automatizar un procedimiento de prueba discreta lo llevó a desarrollar el libre operante
método, que permite medir la probabilidad o tasa de un instrumento
comportamiento. Tanto los procedimientos de prueba discreta como los de operación libre constan de tres
componentes: estímulos contextuales S, la respuesta instrumental R y la
resultado del reforzador O. El refuerzo de R en presencia de S permite
establecimiento de cuatro tipos de asociaciones: S – R, S – O, R – O y S (R – O)
asociaciones. Debido a que estas asociaciones no pueden aislarse unas de otras,
investigar la neurofisiología del aprendizaje instrumental es mucho más
difícil que estudiar la neurofisiología del condicionamiento pavloviano.
Además, la asociación S – O puede crear serias limitaciones de respuesta en
condicionamiento instrumental.
Lecturas sugeridas
Chance, P. (1999). Las cajas de rompecabezas de Thorndike y los orígenes del experimento
análisis de comportamiento. Revista del análisis experimental de la conducta , 72 ,
433–440. http://dx.doi.org/10.1901/jeab.1999.72-433
Hogarth, L., Balleine, BW, Corbit, LH y Killcross, S. (2013). De asociación
Mecanismos de aprendizaje que sustentan la transición del consumo de drogas recreativas.
a la adicción. Annals of the New York Academy of Sciences , 1282 , 12-24.
http://dx.doi.org/10.1111/j.1749-6632.2012.06768.x
Holmes, NM, Marchand, AR y Coutureau, E. (2010). Pavloviano a
transferencia instrumental: una perspectiva neuroconductual. Neurociencia y
Bioconductual Reseñas , 34 , 1277–1295.
http://dx.doi.org/10.1016/j.neubiorev.2010.03.007
Neuringer, A. (2004). Variabilidad reforzada en animales y personas: implicaciones
por adaptado acción. americano psicólogo , 59 , 891–906.
http://dx.doi.org/10.1037/0003-066X.59.9.891
Wood, W. y Neal, DT (2007). Una nueva mirada a los hábitos y al hábito-objetivo
interfaz. Psicológico Revisión , 114 , 843–863.
http://dx.doi.org/10.1037/0033-295X.114.4.843
Términos técnicos
Reforzador condicionado
Página 157
Restricciones al aprendizaje
Método de ensayo discreto
Método operante libre
Comportamiento instrumental
Condicionamiento instrumental
Ley de efecto
Estímulo marcado
Comportamiento operante
Condicionamiento operante
Caja de rompecabezas
Asociación R – O
Tasa de respuesta
Reforzador
Asociación S – O
Asociación S – R
Asociación S (R – O)
Reforzador secundario
Formación
Pasarela recta
Laberinto en T
Página 158
Sabía usted que
Los programas de refuerzo determinan las tasas y patrones de

respondiendo?
Los programas de proporciones producen tasas de respuesta más altas que
horarios de intervalo?
Los programas de intervalos no proporcionan el reforzador automáticamente.
después del paso de un intervalo de tiempo particular?
Los efectos de programación están relacionados con la función de retroalimentación que
caracteriza cada programa de refuerzo?
algunos programas de refuerzo se centran en la elección y
proporcionar refuerzo para dos (o más) respuestas
¿alternativas?
la ley de concordancia describe el comportamiento de elección? De acuerdo a
la ley de emparejamiento, tasas relativas de respuesta igual relativa
tasas de refuerzo.
El autocontrol se investiga utilizando programas de cadena concurrente.
de refuerzo?
el valor de una recompensa disminuye en función de cuánto tiempo
tienes que esperar por ello?
Página 159
E JEMPLOS de condicionamiento instrumental se describen en el capítulo 7 de la

implicación de que el resultado de refuerzo se entrega cada vez que se requiere
ocurre una respuesta instrumental. Situaciones de la naturaleza en las que existe una
El vínculo causal entre una respuesta instrumental y un reforzador se acerca a este
ideal. Casi cada vez que abre el grifo, sale agua corriente; La mayoría de
el momento en que envía un mensaje de texto a un amigo, se entrega; y la mayor parte del tiempo
compras una pieza de pastelería atractiva y terminas con algo sabroso para comer.
Sin embargo, incluso en estos casos, la relación entre hacer la respuesta y
conseguir el reforzador no es perfecto. La tubería principal de agua de su casa puede romperse,
es posible que el teléfono no funcione correctamente y que los pasteles estén rancios. En muchos instrumentales
situaciones de condicionamiento, no todas las apariciones de la respuesta instrumental son
exitoso en la producción del reforzador.
Si una ocurrencia particular de la respuesta instrumental da como resultado la
reforzador puede depender de una variedad de factores. A veces la respuesta tiene que ser
repetido varias veces antes de que se entregue el reforzador. En otras situaciones,
la respuesta solo se refuerza después de que haya pasado un cierto tiempo. En todavia
En otros casos, tanto la repetición de respuestas como el paso del tiempo son críticos. los
La regla que especifica qué ocurrencia de la respuesta instrumental se refuerza es
llamado programa de refuerzo .
Los horarios de refuerzo han sido de gran interés porque
determinar muchos aspectos de la conducta instrumental (Ferster y Skinner, 1957;
Jozefowiez y Staddon, 2008). La tasa y el patrón de respuesta, así como
persistencia en extinción, están todas determinadas por el programa de reforzamiento.
Los cambios aparentemente triviales en un programa de refuerzo pueden producir profundos
cambios en la frecuencia con la que un organismo responde y cuando se involucra en una
actividad en lugar de otra. Los horarios de refuerzo también determinan la
persistencia de la conducta instrumental en extinción, cuando el refuerzo no es
Ya no está disponible.
El récord acumulativo
La tasa y el patrón de respuesta producido por varios programas de
Los refuerzos se investigan típicamente utilizando procedimientos operantes libres.
Las computadoras están programadas para registrar ocurrencias de la respuesta operante (p. Ej.,
presión de palanca en ratas), así como para determinar qué presión de palanca está reforzada.
Página 160
Las sesiones de entrenamiento duran aproximadamente una hora cada día y, por lo general, numerosas sesiones.
están provistos. Después de una dilatada experiencia con un horario particular de
refuerzo, la tasa y el patrón de respuesta se estabilizan. Los resultados son
convenientemente representado en términos de un registro acumulativo .
Un registro acumulativo es un tipo especial de gráfico en el que el eje horizontal
representa el paso del tiempo y el eje vertical representa el total o
número acumulado de respuestas que se han producido hasta un punto particular en
tiempo (ver Figura 8.1 ). Si el participante no responde por un tiempo, su total o
El número acumulado de respuestas permanece igual, y la línea resultante en el
El registro acumulativo es plano, como entre los puntos A y B en la figura 8.1 . Cada
La respuesta se suma al total anterior. Así, cada vez que el participante responde,
el registro acumulativo sube un poco. Porque las respuestas no se pueden quitar,
el récord acumulativo nunca baja.
FIGURA 8.1
Registro acumulativo utilizado para representar patrones de respuesta a lo largo del tiempo. No hay
responder entre los puntos A y B. Se produce una baja tasa de respuesta entre los puntos B
y C. Se produce una mayor tasa de respuesta de los puntos C y D, y la respuesta cesa después de
punto D.
Página 161
La pendiente del registro acumulativo tiene un significado especial. La pendiente es

calculado dividiendo el desplazamiento vertical entre dos puntos en un gráfico
por el desplazamiento horizontal entre esos dos puntos. Desplazamiento vertical
en un registro acumulativo refleja el número de respuestas, y horizontal
el desplazamiento refleja el tiempo. Por tanto, la pendiente de un registro acumulativo representa
respuestas por unidad de tiempo, o la tasa de respuesta . Bajos índices de respuesta
producir una pendiente poco profunda en el registro acumulativo (por ejemplo, del punto B al punto C
en la Figura 8.1 ). Las tasas de respuesta más altas dan como resultado una pendiente más pronunciada (p. Ej., Desde el punto C
al punto D en Figura 8.1 ).
Horarios simples de refuerzo

En programas simples de reforzamiento, ¿qué ocurrencia de la respuesta es
reforzado depende del número de repeticiones de la respuesta, ya que el
último reforzador o cuánto tiempo ha pasado desde el último reforzador. Si el
El número de repeticiones de la respuesta es el factor crítico que determina
refuerzo, el procedimiento se llama programa de proporciones . Si el momento de la
respuesta dado que el último reforzador es el factor crítico, el procedimiento se llama
horario de intervalo . En cualquier caso, el participante no recibe el reforzador.
a menos que responda.
HORARIOS DE RATIO
En los programas de proporción, lo único que determina si una respuesta es
reforzado es el número de repeticiones de la respuesta que el participante ha
realizado desde el último reforzador. Cuánto tiempo tarda el participante en hacer
esas respuestas no importan. Hay dos versiones básicas de programas de proporciones,
fijo y variable.
En un programa de proporción fija , el participante debe repetir la respuesta un tiempo fijo.
número de veces por cada entrega del reforzador. Por ejemplo, cada obra
La hoja en una clase de matemáticas de tercer grado puede tener cuatro problemas, y los estudiantes pueden
reciben una estrella por cada hoja de trabajo que completen. Este sería un ratio fijo-4
programa de refuerzo, abreviado como FR 4.
Los programas de razón fija ocurren en situaciones en las que siempre hay un
cantidad de esfuerzo requerido para completar un trabajo u obtener el reforzador. Comprobación
la asistencia a una clase mediante la lectura de la lista requiere leer el mismo número de
Página 162
nombres cada vez. Llamar a alguien por teléfono requiere poner el mismo
número de dígitos en el teléfono cada vez. Subir un tramo de escaleras requiere
subiendo el mismo número de escaleras cada vez. Todos estos son ejemplos de
Horarios de razón fija.
El lado izquierdo de la Figura 8.2 ilustra el patrón estable de responder que
resulta de reforzar la conducta en un programa de reforzamiento de proporción fija. los
las marcas de trama en los registros representan la entrega del reforzador. Dos caracteristicas
del patrón de respuesta FR son dignos de mención. Primero, observe que después de cada eclosión
marca o refuerzo, la tasa de respuesta es cero. El participante deja de responder.
A esto se le llama la pausa posterior al refuerzo . Después de la pausa posterior al reforzamiento, un
se produce una tasa alta y constante de respuesta hasta la próxima entrega del
reforzador. A esto se le llama ejecución de relación .
FIGURA 8.2
Resultados típicos del entrenamiento en un programa de refuerzo de proporción fija y proporción variable.
Los datos se obtuvieron con palomas picoteando una tecla de respuesta en una proporción fija (FR) 120
y programa de refuerzo alimentario de proporción variable (VR) 360. Las marcas de trama indican
cuando se entregó el reforzador. Datos de Ferster y Skinner (1957).
Como se ilustra en la Figura 8.2 , los programas de razón fija producen una
patrón de respuesta. O el participante no responde en absoluto (en el
Página 163
pausa posterior al reforzamiento), o responde a un ritmo constante y alto (en la proporción

correr). La duración de la pausa posterior al refuerzo está determinada por la relación
requisito. Los requisitos de relación más altos dan como resultado pausas posteriores al cumplimiento más largas
(DC Williams, Saunders y Perone, 2011).
Un programa de razón variable es similar a un programa de razón fija en que el único
El requisito de refuerzo es dar un cierto número de respuestas,
independientemente del tiempo que lleve hacerlo. La diferencia entre fijo y
programas de razón variable es que en un programa de razón variable, el número de
las respuestas requeridas varían de una entrega de reforzador a la siguiente.
Al practicar golf, por ejemplo, la pelota proporciona un refuerzo.
entrando en la taza. En ocasiones, puede meter la pelota en la taza la primera
tratar. Más a menudo, tendrás que golpear la pelota varias veces antes de tener éxito.
Que la pelota entre en la taza depende solo de que usted golpee la pelota con el
holgazanear. El tiempo que tardes entre columpios es irrelevante. Esto, entonces, es una razón
calendario. Pero el número de respuestas de put requeridas varía de un putt
verde a otro, lo que lo convierte en un programa de proporción variable.
Un programa de relación variable se abrevia como VR. Si en promedio necesitas golpear
la pelota tres veces para meterla en la taza, estarías en un programa de VR 3 de
reforzamiento. El resultado típico de un programa de razón variable se ilustra en la
panel derecho de la Figura 8.2 . A diferencia de los programas de razón fija, los programas de razón variable
producir una tasa de respuesta constante y alta, sin pausas predecibles
(Crossman, Bonem y Phelps, 1987).
HORARIOS DE INTERVALOS
A diferencia de los programas de razón, donde el paso del tiempo es irrelevante, en el intervalo
horarios, el tiempo es un factor crítico. Específicamente, si una respuesta se refuerza
depende de cuándo se produce la respuesta después del inicio del ciclo de intervalo. Al igual que con
programas de proporción, hay dos tipos prominentes de programas de intervalo, fijos y
variable.
En un programa de intervalo fijo, debe transcurrir una cantidad fija de tiempo antes de que
la respuesta puede reforzarse. Los programas de intervalo fijo ocurren en situaciones en las que
se necesita una cierta cantidad de tiempo para preparar o configurar el reforzador.
Considere, por ejemplo, preparar un postre de gelatina (p. Ej., Gelatina). Después de la
Los ingredientes están mezclados, la gelatina debe enfriarse en el refrigerador durante un cierto tiempo.
cantidad de tiempo antes de que esté listo para comer. En este ejemplo, el instrumental
La respuesta es sacar la gelatina del refrigerador para comerla. Si toma la gelatina
Página 164
si sale demasiado pronto, será aguado y su respuesta no se verá reforzada.

No se reforzarán los intentos de comer la gelatina antes de que se solidifique. Otro
Una característica importante de este ejemplo (y de los programas de intervalos en general) es que
Una vez que el reforzador está listo, permanece disponible hasta que el individuo responde a
obtenerlo. Cuando la gelatina esté lista, no es necesario que la coma de inmediato. Será
allí para usted incluso si espera para comerlo al día siguiente.
En un programa de reforzamiento de intervalos fijos, una cantidad fija de tiempo debe
pasar antes de que el reforzador esté disponible. Sin embargo, el reforzador no es
proporcionado automáticamente al final del intervalo fijo. Para obtener el reforzador,
se debe dar la respuesta instrumental especificada. Las primeras respuestas no tienen
consecuencia. No hacen que el reforzador esté listo antes, ni dan como resultado
una falta. Finalmente, el reforzador se puede obtener en cualquier momento después de haber sido fijado.
hasta. En un programa de intervalo simple, el participante no tiene que responder dentro de
un período determinado una vez que el reforzador está disponible.
Los horarios de intervalo fijo se abrevian FI, seguidos de un número
indicando la duración del intervalo fijo durante el cual responder no es
reforzado. La figura 8.3 muestra los datos obtenidos de una paloma picoteando una tecla de respuesta.
en un programa de refuerzo alimentario FI de 4 minutos de duración libre. En este horario,
la entrega del reforzador al final de un intervalo fijo comienza el siguiente ciclo.
Cuatro minutos después del inicio del ciclo, el reforzador vuelve a estar disponible.
y se entrega si la paloma pica la tecla de respuesta.
FIGURA 8.3
Página 165
Resultados típicos del entrenamiento en un programa de intervalo fijo (FI) y de intervalo variable (VI) de
reforzamiento. Los datos se obtuvieron con palomas picoteando una tecla de respuesta en un FI 4-
programa de refuerzo alimentario de 2 minutos y VI de 2 minutos. Las marcas de trama indican cuando
se entregó el reforzador. Datos de Ferster y Skinner (1957).
El patrón de responder en un horario de intervalo fijo es similar a lo que

ocurre en un programa de proporción fija. Hay poca o ninguna respuesta al principio.
del intervalo fijo. Debido a que el intervalo comienza justo después de la entrega del
reforzador anterior, la falta de respuesta aquí se llama un refuerzo posterior
pausa. La respuesta aumenta a medida que se acerca el final del intervalo, con el
participante que responde a un ritmo elevado justo cuando finaliza el intervalo fijo. Eficiente
responder en un horario de intervalo fijo requiere precisión en la percepción del tiempo. Para
Por esa razón, los programas de intervalos fijos se utilizan con frecuencia para estudiar los aspectos cognitivos.
mecanismos implicados en la sincronización (Balci et al., 2009).
Los programas de intervalo variable son similares a los programas de intervalo fijo excepto
que la cantidad de tiempo que se necesita para configurar el reforzador varía de una prueba a otra.
La respuesta de verificar si un maestro ha terminado de calificar tu
el papel se refuerza con un programa de intervalo variable. Se necesita algo de tiempo para calificar a
papel, pero el tiempo que tarda varía de una ocasión a otra. Comprobando a
ver si su papel ha sido calificado se refuerza solo después de un tiempo
pasado desde el inicio del ciclo de programación. Respuestas tempranas (comprobando antes del
el papel ha sido clasificado) no están reforzados. Por el contrario, puedes obtener tu calificación
en cualquier momento después de que el trabajo haya sido calificado.
Página 166
Los programas de intervalo variable se abrevian VI, seguidos de un número

indicando la duración media de los intervalos durante los cuales no se responde
reforzado. La figura 8.3 muestra los datos obtenidos de una paloma picoteando una tecla de respuesta.
en un programa de refuerzo alimentario de 2 minutos de VI libre operante. En este horario,
el reforzador estuvo disponible en promedio 2 minutos después del inicio de cada
ciclo de programación.
Responder en horarios de intervalo variable es similar a responder en RV
horarios de refuerzo. En ambos casos, se produce una tasa constante de comportamiento, con
sin pausas predecibles o cambios en la frecuencia. Sin embargo, los programas de intervalos tienden a
producen tasas de respuesta más bajas que las programaciones de razón.
En programas de intervalos simples, una vez que el reforzador está disponible,
permanece allí hasta que el individuo responde y lo obtiene. Entonces comienza el ciclo
otra vez. Verificar sus mensajes de texto, por ejemplo, está en una variable-
horario de intervalo. Los mensajes llegan en momentos impredecibles. Comprobando para ver
si tiene algún mensaje nuevo, no recibe un mensaje antes o
producir más mensajes. Además, una vez que se ha enviado un mensaje,
no es necesario que lo lea de inmediato. Permanecerá disponible incluso si espera varios
horas para leerlo.
Los programas de intervalos simples se pueden modificar para que una vez que el reforzador haya
configurado, permanece disponible solo durante un período de tiempo limitado. Esta limitada
El intervalo se denomina formalmente retención limitada. Por ejemplo, se necesita una cierta cantidad
de tiempo para hornear una hoja de galletas. Sin embargo, una vez transcurrido el tiempo requerido,
si no saca las galletas del horno, se quemarán. Por lo tanto, hornear está en un
programa de intervalo fijo con una retención limitada. El reforzador se "retiene" por un tiempo limitado.
período de tiempo después de que esté disponible, y la respuesta debe ocurrir durante
este período de espera se reforzará. Agregar una reserva limitada a un programa de intervalos
aumenta la tasa de respuesta, siempre que la espera no sea tan corta que el
El participante frecuentemente pierde por completo el reforzador.
Mecanismos de ejecución del cronograma

Un concepto clave involucrado en el análisis de los mecanismos de los efectos del horario es el
función de retroalimentación que caracteriza el horario. Entrega de un reforzador en un
El procedimiento instrumental puede verse como retroalimentación para la respuesta instrumental.
Los programas de refuerzo determinan cómo se organiza esta retroalimentación. De una sola mano
Describir la disposición es mostrar cómo la tasa de refuerzo obtenida es
Página 167
relacionado con la tasa de respuesta. Esta relación es la función de retroalimentación.
FUNCIONES DE RETROALIMENTACIÓN PARA HORARIOS DE RATIO

Las funciones de retroalimentación para los programas de proporciones son quizás las más fáciles de entender. en un
cronograma de proporción, qué tan pronto (y con qué frecuencia) se refuerza el organismo es
determinado sólo por la rapidez con que se realiza el número requerido de respuestas.
Cuanto más rápido el individuo complete el requisito de relación, más rápido obtendrá el
reforzador.
La figura 8.4 muestra ejemplos de funciones de retroalimentación para varias razones.
horarios. En un programa FR 1 o de refuerzo continuo, el participante es
reforzado para cada ocurrencia de la respuesta instrumental. Por lo tanto, la tasa
de refuerzo es igual a la tasa de respuesta. Esto da como resultado una retroalimentación
función con una pendiente de 1.0.
FIGURA 8.4
Funciones de retroalimentación para programas de reforzamiento de proporciones. Tenga en cuenta que cada comentario
la función es una línea recta. Por eso, cada aumento en la tasa de respuesta resulta en
Página 168
la función es una línea recta. Por eso, cada aumento en la tasa de respuesta resulta en
un aumento correspondiente en la tasa de refuerzo. FR = ratio fijo.
Si se requiere más de una respuesta para el refuerzo, la tasa de

El refuerzo será menor que la tasa de respuesta, y la pendiente de la
La función de retroalimentación será menor que 1.0. Por ejemplo, en un programa FR 5 de
refuerzo, el participante recibe un refuerzo por cada quinta respuesta.
En estas circunstancias, la tasa de refuerzo es una quinta parte de la tasa de
responder, y la pendiente de la función de retroalimentación es 0.2. Independientemente de su pendiente,
la función de retroalimentación para un programa de proporciones es siempre una línea recta. Para esto
razón, un aumento en la tasa de respuesta siempre produce un aumento en la tasa
de refuerzo. Esto es cierto para los programas de razón fija y variable.
FUNCIONES DE RETROALIMENTACIÓN PARA HORARIOS DE INTERVALOS

Los programas de intervalos tienen funciones de retroalimentación que difieren notablemente de las de
programas de proporciones. La figura 8.5 muestra la función de retroalimentación para un VI de 3 minutos
horario de refuerzo. En tal horario, el reforzador se vuelve disponible
en promedio 3 minutos después de la última vez que se entregó. Por lo tanto, no importa
con qué frecuencia o con qué rapidez responde el organismo, el número máximo de
reforzadores que puede obtener está limitado a 20 por hora.
FIGURA 8.5
Página 169
Función de retroalimentación para un programa de refuerzo de intervalo variable de 3 minutos.

Se supone que la respuesta se distribuye aleatoriamente en el tiempo. Note que no importa cuan
rápidamente el organismo responde, su tasa máxima de refuerzo es de 20 por hora.
Al igual que con los programas de proporciones, si el participante no responde en

un programa de intervalos, no obtendrá ningún refuerzo. Incrementos en la tasa de
responder por encima de cero aumentará sus posibilidades de obtener cualquier refuerzo
volverse disponible. Hasta cierto punto, por lo tanto, el aumento de la respuesta va acompañado
por mayores tasas de refuerzo. Sin embargo, una vez que el participante responde a menudo
suficiente para obtener los 20 reforzadores que se pueden obtener cada hora, más
el aumento de la tasa de respuesta no tendrá ningún beneficio adicional. Por lo tanto, la retroalimentación
función para un programa de intervalo se vuelve plana una vez que el máximo posible
Se ha alcanzado la tasa de refuerzo.
FUNCIONES DE RETROALIMENTACIÓN Y RENDIMIENTO DEL PROGRAMA

Uno de los hechos sorprendentes sobre el comportamiento instrumental es que los programas de razón
producir tasas de respuesta considerablemente más altas que los programas de intervalo, incluso si
la tasa de refuerzo es comparable en los dos casos (Raia, Shillingford,
Miller y Baier, 2000; Reynolds, 1975). ¿Por qué los programas de proporción producen mayores
tasas de respuesta que los horarios de intervalo se relaciona con las diferencias en sus respectivos
funciones de retroalimentación. Porque la función de retroalimentación para un programa de intervalos
Página 170
alcanza un máximo con una tasa particular de respuesta, aumenta en el

La tasa de respuesta más allá de ese punto no proporciona ningún beneficio adicional. Por lo tanto, los aumentos en
La tasa de respuesta no se refuerza diferencialmente más allá de un punto particular en
horarios de intervalo. Por el contrario, no existe tal límite con los programas de proporción. En proporción
horarios, los aumentos en la tasa de respuesta siempre dan como resultado tasas más altas de
reforzamiento. No hay límite para el refuerzo diferencial de tasas más altas.
de responder. Por lo tanto, los programas de razón pueden producir tasas más altas de respuesta
porque tales programas refuerzan diferencialmente altas tasas de respuesta sin límite.
Aunque las funciones de retroalimentación han jugado un papel importante en los esfuerzos para
explican el rendimiento del cronograma, tienen algunas limitaciones conceptuales. Uno
El problema serio es que las funciones de retroalimentación a veces son difíciles de
caracterizar. Esto es particularmente cierto para los programas basados en intervalos. En intervalo
horarios, el refuerzo depende no sólo de la tasa de respuesta sino también de
cómo se distribuyen las respuestas en el tiempo. La función de retroalimentación para un VI 3-
horario de minutos presentado en la Figura 8.5 asume que las respuestas se distribuyen
al azar en el tiempo. Otros supuestos pueden alterar la porción creciente inicial de
la función de retroalimentación. Sin embargo, a pesar de tales complicaciones, los investigadores han
Me pareció útil pensar en el rendimiento del cronograma determinado en última instancia por
cómo los programas de refuerzo proporcionan retroalimentación para el comportamiento instrumental.
Horarios concurrentes
En cada uno de los horarios de refuerzo considerados hasta ahora, el participante pudo
realizar la respuesta instrumental especificada o no. Solo una respuesta
manipulandum (una palanca o una tecla de picoteo), y sólo las respuestas en
que manipulandum fueron medidos y registrados. Porque los procedimientos no
proporcionan diferentes alternativas de respuesta, no parecen implicar una elección.
Sin embargo, es interesante que todas las situaciones de condicionamiento instrumental implican una elección.
Con horarios simples, la opción es realizar la respuesta especificada por el
programa de refuerzo o para hacer otra cosa que no es parte de la
experimentar.
Los investigadores se han convencido de que una comprensión completa de
El comportamiento instrumental requiere comprender por qué los organismos eligen participar
en una respuesta en lugar de otra. Desafortunadamente, los horarios simples de
los reforzamientos no son buenos para analizar los mecanismos de elección. En simple
horarios, la alternativa a la respuesta instrumental, el "algo más" el
Página 171
individuo podría hacer, está mal especificado y no se mide. Estas deficiencias

se remedian en horarios concurrentes. Horarios concurrentes de reforzamiento
proporcionar respuestas alternativas claramente definidas y medidas. Por lo tanto,
Los horarios concurrentes son más apropiados para estudiar cómo los organismos eligen
participar en una actividad en lugar de otra.
Como puede sospechar, el hecho de que haga una cosa u otra depende de la
beneficios que se derivan de cada actividad. En la terminología del condicionamiento, ¿cómo
a menudo participa en la actividad A en comparación con la actividad B dependerá de la
programa de refuerzo que está en efecto para la respuesta A, en comparación con el
programa de refuerzo en efecto para la respuesta B. En un patio de recreo, Joe podía
jugar con Peter, a quien le gusta jugar juegos físicos vigorosos, o Joe podría jugar
con Matt, que prefiere jugar tranquilamente en el arenero. Si Joe no recibe mucho
disfrute jugando con Peter, puede ir a jugar con Matt. Concurrente
Los horarios se utilizan para modelar este tipo de situación de elección en el laboratorio.
En un programa concurrente, al menos dos alternativas de respuesta, A y B, son
disponible (ver Figura 8.6). Responder a la alternativa A se refuerza en una
programa de refuerzo (por ejemplo, VI 5 minutos), mientras que responder en B es
reforzado en un horario diferente (por ejemplo, VR 15). Ambas alternativas de respuesta (y
sus correspondientes programas de refuerzo) están disponibles al mismo tiempo, y
el participante puede cambiar de una actividad a otra en cualquier momento. Porque el
dos opciones están disponibles al mismo tiempo, el procedimiento se llama concurrente
horario .
FIGURA 8.6
Diagrama de un programa concurrente de reforzamiento. Picoteando la tecla de respuesta a la izquierda

se refuerza en un programa de refuerzo de intervalo variable (VI) de 5 minutos. Picoteando el
La tecla de respuesta de la derecha se refuerza en una relación variable (VR) 15 programa de
Página 172
La tecla de respuesta de la derecha se refuerza en una relación variable (VR) 15 programa de

reforzamiento. Las dos alternativas están siempre disponibles.
Numerosos factores determinan cómo los organismos distribuyen su comportamiento.

entre dos alternativas de respuesta. Estos incluyen el esfuerzo requerido para hacer
cada respuesta, el esfuerzo y el tiempo necesarios para cambiar de una respuesta a
el otro, el atractivo del reforzador proporcionado para cada respuesta, y la
programa de refuerzo en vigor para cada respuesta. Los experimentos tienen que ser
Diseñado cuidadosamente para que se puedan estudiar los efectos de estos diversos factores.
sin confundirse con otras características de la situación de elección.
Los estudios de laboratorio de esquemas concurrentes a menudo se llevan a cabo con
palomas. Una pared de la cámara experimental tiene dos teclas de respuesta.
colocado aproximadamente a la altura de la cabeza del pájaro. Un comedero del que el pájaro
puede obtener el grano se centra debajo de las dos teclas. Este arreglo tiene la
ventaja de que las dos respuestas requieren el mismo esfuerzo. Aunque picotea en el
Las teclas derecha e izquierda están reforzadas en diferentes horarios, el reforzador en cada
caso es el mismo tipo de comida. Otra ventaja es que la paloma puede fácilmente
cambiar de una respuesta a la otra porque las dos teclas de respuesta están ubicadas
cerca unos de otros.
Si se requiere un esfuerzo similar para las alternativas de respuesta, si el mismo
El reforzador se usa para ambas respuestas, y si se cambia de un lado al otro
es bastante fácil, la distribución de respuestas entre las dos alternativas
dependen únicamente del programa de refuerzo en vigor para cada respuesta.
La investigación ha demostrado que las decisiones que se toman en estas circunstancias están bien
caracterizado por la ley de emparejamiento , que fue originalmente identificada por Herrnstein
(1970). De acuerdo con la ley de emparejamiento, la tasa relativa de respuesta en un
alternativa de respuesta es igual a la tasa relativa de refuerzo obtenida con
esa alternativa de respuesta. Por ejemplo, si el 70% de las respuestas se realizan en el
lado izquierdo de una cámara de dos llaves, el 70% de todos los reforzadores se obtendrán a la izquierda
lado. (Para revisiones de la ley de concordancia, ver Dallery & Soto, 2013; Grace &
Hucks, 2013.)
En una situación de elección concurrente, los organismos tienden a igualar las tasas relativas de
respondiendo a tasas relativas de reforzamiento. Se producen desviaciones del emparejamiento si

las alternativas de respuesta requieren diferentes grados de esfuerzo, si son diferentes
se utilizan reforzadores para cada alternativa de respuesta, o si se cambia de una
la respuesta al otro se hace más difícil. Los efectos de estos factores han
se ha incorporado a lo que se conoce como la ley de emparejamiento generalizada
Página 173
(WM Baum, 1974).

La ley de emparejamiento ha hecho una contribución importante a nuestra comprensión de
cómo se controla el comportamiento mediante programas de refuerzo. La ley de emparejamiento tiene
nos mostró que cómo reaccionan los individuos cuando se establece un programa de refuerzo
para una respuesta depende de las actividades alternativas que están disponibles y la
horarios de refuerzo que están en vigor con esas actividades alternativas.
Esta conclusión básica tiene profundas implicaciones para las aplicaciones de instrumentos
acondicionamiento (EA Jacobs, Borrero y Vollmer, 2013). Los profesores suelen centrarse
en una respuesta particular que están tratando de enseñar (por ejemplo, completar matemáticas
problemas). Sin embargo, rápidamente descubren que el esfuerzo invertido en esta respuesta
depende de la disponibilidad de respuestas alternativas y fuentes alternativas de
reforzamiento. Si a los estudiantes se les permite jugar juegos en sus teléfonos celulares,
es mucho menos probable que trabajen en problemas matemáticos.
Programaciones de cadena concurrente y autocontrol

En un horario concurrente, las diversas alternativas de respuesta están disponibles en el
Mismo tiempo. Esto permite al participante alternar entre
alternativas en cualquier momento y con relativa facilidad. Muchas situaciones son así. usted
puede ir y venir fácilmente entre los programas de entretenimiento que ve en
televisión. También puede tener una variedad de opciones sobre qué hacer
entretenimiento el fin de semana. Puede ir a un concierto, ir a un juego de pelota o ir
a cenar con amigos. Sin embargo, en este caso, una vez que haya comprado su
entradas y entró en la sala de conciertos, las otras alternativas ya no son
disponible. Las características básicas de tales situaciones de elección se capturan en la
laboratorio mediante el diseño de un programa de refuerzo de cadena concurrente . en un
programa de cadena concurrente, una vez que elija un curso de acción en particular, otros
las posibles actividades dejan de estar disponibles.
Un cronograma de cadena concurrente tiene dos etapas o enlaces. Cada prueba comienza con
el enlace de elección, durante el cual están disponibles las diversas alternativas de elección. Una vez
se realiza una selección durante el enlace de elección, el procedimiento se mueve al terminal
enlace, que solo tiene la alternativa seleccionada por el participante. El participante
permanece en el enlace de la terminal durante el resto de la prueba. Por lo tanto, la cadena de corriente
El horario implica elección con compromiso.
Los programas de cadena concurrente se pueden utilizar para investigar si la variabilidad en
los resultados se prefieren a la previsibilidad, ya sea que la variedad sea de hecho el condimento de
Página 174
vida. Figura 8.7 describe un procedimiento para estudiar esta cuestión en palomas. Las aves
tener acceso a dos teclas de picoteo. El picoteo en uno se refuerza en un VI 3 min
programa de refuerzo, mientras que picotear en la otra tecla se refuerza en un
Programación FI de 3 min. El programa FI es altamente predecible, mientras que el VI
horario no lo es, pero la tasa general de refuerzo es la misma para los dos
alternativas. El enlace de elección proporciona acceso a cada alternativa, pero una vez que
participante ha hecho su selección, está "atascado" con esa alternativa hasta que el resto
del juicio. La investigación de procedimientos de cadena concurrente de este tipo ha
indicó una preferencia por la alternativa de horario variable (Andrzejewski et al.,
2005).
FIGURA 8.7
Diagrama de un programa de refuerzo en cadena concurrente. Durante el Choice Link, el

El participante puede seleccionar el intervalo variable (VI) de 3 minutos o el intervalo fijo (FI) 3-
horario de minutos. La elección de una alternativa mueve al participante al Terminal Link en
que solo está disponible la alternativa elegida.
Los horarios de cadena concurrente también se utilizan con frecuencia para estudiar el autocontrol.
El autocontrol está involucrado cuando puede elegir entre una alternativa que
proporciona una pequeña recompensa rápidamente en comparación con una opción que proporciona una recompensa mayor pero
con un retraso considerable. ¿Opta por tener un pedazo de pastel que proporcione
gratificación inmediata o renunciar al postre a favor de un estilo de vida más saludable
cuyos beneficios se retrasan mucho más? ¿Te rindes a la tentación de
salir con amigos por la noche o quedarse en casa para estudiar para un próximo
prueba, que te permitirá tener éxito en la escuela y conseguir un mejor trabajo en un año o
Página 175
¿dos? Gaste sus dólares ganados con tanto esfuerzo en videojuegos interesantes que pueda
disfrutar de inmediato o guardar ese dinero para acumular ahorros y poder comprar un
coche el año que viene? Nos encontramos con tales elecciones de autocontrol con frecuencia en nuestro día a día.
vidas.
El autocontrol se modela en laboratorios de comportamiento utilizando una cadena concurrente
calendario. Durante el enlace de elección, tenemos la opción de elegir gastar el
noche con amigos o quedarse en casa para estudiar. Una vez que hayamos elegido uno o el
otra delaestas
ya sea alternativas,
pequeña nos trasladamos
recompensa inmediata oallaenlace terminal enretrasada.
gran recompensa el que experimentamos
Experimental
Los estudios han confirmado lo que todos sabemos: es más tentador ir por el
recompensa inmediata más pequeña que esperar la gran recompensa retrasada. Por que es
¿ese?
Es fundamental para las explicaciones del autocontrol en el contexto de los horarios de
El refuerzo es el concepto de que cuanto más tiempo tengas que esperar por un reforzador, la
menos valioso es. El descuento del valor de la recompensa por el tiempo de espera se denomina
función de descuento por retraso (Vanderveldt, Oliveira y Green, 2016). En laboratorio
estudios de la función de descuento por demora con participantes humanos, individuos
Se les pide que elijan entre cantidades hipotéticas de dinero. Preferirías
$ 5 ahora o $ 5 mañana? Para la mayoría de las personas, esta es una decisión fácil: obviamente
preferirían recibir los $ 5 ahora en lugar de mañana. Esto indica que el
El valor de $ 5 se reduce al tener que esperar un día para obtener el dinero. Porque
retrasar una recompensa reduce su valor, la gente tiende a seleccionar pequeñas cantidades inmediatas
recompensas sobre recompensas retrasadas más grandes.
No todo el mundo descuenta el valor de las recompensas futuras en el mismo grado
(Odum y Baumann, 2010). Las funciones de descuento por demora más pronunciadas indican una mayor
pérdida percibida del valor de la recompensa en función del tiempo de espera. Individuos con
Las funciones de descuento por demoras pronunciadas tienden a mostrar menos autocontrol. Esta
La relación ha sido de particular interés en los estudios sobre el uso indebido de drogas y las drogas.
adicción (Bickel, Koffarnus, Moody y Wilson, 2014). La elección de consumir
una droga recreativa es un problema de autocontrol. ¿Tomas la droga y disfrutas de su
efectos inmediatos o seleccionar otra actividad (estudiar, invertir en personal
relaciones, desarrollo de habilidades en deportes o música) cuyos beneficios son más
¿demorado? Los adictos a las drogas eligen la droga y los adictos serios toman esta decisión
incluso si les cuesta el trabajo, el matrimonio y la salud física.
Los estudios han demostrado que los adictos a las drogas tienen una mayor demora en el descuento.
funciones que los no adictos, incluso después de haber abandonado la droga de su elección
(MacKillop et al., 2011; Yi, Mitchell y Bickel, 2010). Los adictos son impulsados por
Página 176
lo que está reforzando en este momento en lugar de lo que pueden hacer para mejorar su
vive en el futuro. Se puede sugerir que la incapacidad de ver el valor del futuro
recompensas es una consecuencia de la adicción a las drogas. Sin embargo, la investigación experimental
con animales de laboratorio ha demostrado que la brusquedad del retraso de un individuo
La función de descuento predice la propensión a desarrollar adicción a las drogas.
(Carroll, Anker, Mach, Newman y Perry, 2010). En un notable longitudinal
estudio de niños en Nueva Zelanda, el grado de autocontrol evidente antes de los 10
años de edad fue predictivo de una mejor salud, niveles de ingresos más altos, tasas más bajas de
consumo de drogas y tasas más bajas de conducta delictiva más de dos décadas después (Moffitt
et al., 2011).
Resumen
Los horarios de refuerzo son de interés porque, en muchos casos, responder
no produce un reforzador cada vez. Una respuesta puede reforzarse después de una
se ha producido un número fijo o variable de respuestas (programas FR y VR) o
después de que haya pasado una cantidad de tiempo fija o variable desde el último reforzador (FI
yjusto
VI horarios).
antes de laLos programas
entrega de intervalos
del reforzador y unaypausa
proporciones fijos producen
justo después una respuesta rápida
del reforzamiento.
Los programas de intervalos y proporciones variables producen tasas de respuesta constantes. En general,
Los programas de razón producen tasas de respuesta más altas que los programas de intervalo. Esta
La diferencia está relacionada con las funciones de retroalimentación contrastantes para los dos tipos de
horarios.
Los programas de refuerzo también pueden implicar una elección entre dos o más
actividades, cada una asociada con su propio programa de refuerzo. en un
programa concurrente, dos (o más) alternativas de respuesta están disponibles en el
mismo, y el participante tiene la oportunidad de cambiar entre respuesta
alternativas en cualquier momento. Responder en horarios concurrentes se caracteriza por
la ley de emparejamiento. Un programa de cadena concurrente también proporciona dos respuestas
alternativas, pero en este caso, una vez que se selecciona una de las respuestas, la otra
La alternativa ya no está disponible. Los horarios de cadena concurrente se utilizan para estudiar
autocontrol. El autocontrol está determinado por la rapidez con que el valor de un reforzador
se descuenta por el tiempo que tiene que esperar, lo que se denomina retraso
función de descuento.
Página 177
Lecturas sugeridas
Cole, MR (1999). Control molar y molecular en intervalo variable y
Horarios de razón variable. Revista del análisis experimental de la conducta ,
71 , 319–328. http://dx.doi.org/10.1901/jeab.1999.71-319
Dallery, J. y Soto, PL (2013). Descripción cuantitativa del medio ambiente
relaciones de comportamiento. En GJ Madden (Ed.), Manual de conducta de la APA
análisis: Vol. 1. Métodos y principios (págs. 219–250). Washington DC:
Asociacion Americana de Psicologia.
Jozefowiez, J. y Staddon, JER (2008). Comportamiento operante. En JH Byrne
(Ed.), Aprendizaje y memoria: Una referencia integral: Vol. 1. Aprendizaje
teoría y comportamiento (págs. 75-102). Oxford, Inglaterra: Elsevier.
Vandervelt, A., Oliveira, L. y Green, L. (2016). Descuento por retraso: paloma, rata,
humano: ¿importa? Journal of Experimental Psychology: Animal
Aprendizaje y cognición , 42 , 141-162. http://dx.doi.org/10.1037/xan0000097
Términos técnicos
Programación de cadena concurrente
Programa concurrente
Registro acumulativo
Función de descuento por retraso
Función de retroalimentación
Programa de intervalo fijo
Programa de proporción fija
Programa de intervalos
Ley de coincidencia
Pausa posterior al reforzamiento
Razón de ejecución
Programa de proporciones
Programa de refuerzo
Autocontrol
Programa de intervalo variable
Programa de razón variable
Página 178
Sabía usted que
¿No es necesario que los reforzadores reduzcan un impulso o necesidad biológica?

¿Las respuestas, así como los estímulos, pueden servir como reforzadores?
de acuerdo con las perspectivas contemporáneas, el refuerzo no
¿No “fortalecer” la respuesta instrumental?
Los procedimientos de acondicionamiento instrumental no solo aumentan la
tasa de la respuesta instrumental; también disminuyen la tasa
de la respuesta reforzadora?
Los procedimientos de acondicionamiento instrumental restringen cómo un
El organismo distribuye su comportamiento entre su respuesta.
¿alternativas?
Los efectos de refuerzo son un subproducto de la nueva respuesta.
elecciones que hace un organismo cuando sus actividades son
restringido por un procedimiento de condicionamiento instrumental?
el efecto de un procedimiento de acondicionamiento instrumental depende
sobre todas las actividades de un participante y cómo estas
se organizan actividades? Un factor importante es el
disponibilidad de sustitutos para la actividad reforzadora.
La economía del comportamiento se desarrolló a partir de los esfuerzos para utilizar
conceptos económicos para comprender mejor cómo
Página 179
Los procedimientos de condicionamiento provocan una redistribución de la conducta.

entre las posibles opciones de respuesta?
I n el capítulo 8 , discutí varios tipos de procedimientos de condicionamiento instrumental

y sus resultados de comportamiento. No hay duda de que los procedimientos de refuerzo
puede producir cambios dramáticos en el comportamiento, y estos cambios son mucho más
complejo que simplemente un aumento en la probabilidad de una respuesta. Diferente
Los programas de refuerzo producen diferentes patrones de ejecución de respuesta y
hace una pausa y también determina las opciones entre las alternativas de respuesta. El problema que doy vuelta
lo siguiente es cómo el refuerzo causa estos efectos. Esa pregunta es abordada por
una discusión de las teorías del reforzamiento.
Todas las buenas teorías tienen que ser consistentes con los hallazgos que pretenden
explicar. Además, las buenas teorías deberían estimular nuevas investigaciones que sirvan para
evaluar y aumentar la precisión de la teoría. Las buenas teorías también proporcionan
nuevos conocimientos y formas de pensar sobre fenómenos familiares.
La historia del desarrollo de las teorías del reforzamiento es un maravilloso
ejemplo de creatividad en la ciencia. La historia está salpicada de ejemplos de pequeños
refinamientos en el pensamiento que alinearon una teoría particular con nuevos datos.
La historia también incluye nuevas salidas dramáticas y nuevas formas de pensar sobre
reforzamiento. Y hay casos interesantes en los que cambios incrementales en
El pensamiento culminó en importantes perspectivas nuevas sobre el problema.
Una teoría del reforzamiento debe responder a dos preguntas sobre instrumental
acondicionamiento. Primero, tiene que decirnos qué hace que algo sea un reforzador o cómo
¿Podemos predecir si algo será un reforzador eficaz? Segundo, un buen
la teoría tiene que decirnos cómo un reforzador produce sus efectos. Tiene que decirnos que
son los mecanismos responsables de un aumento en la probabilidad de
respuesta reforzada.
Thorndike y la ley del efecto

Thorndike pronto proporcionó la primera teoría sistemática del reforzamiento.
después de su descubrimiento del condicionamiento instrumental (Bower & Hilgard, 1981).
Según Thorndike, un reforzador positivo es un estímulo que produce un
"Satisfactoria situación". Sin embargo, Thorndike no pasó a decirnos por qué
algo fue "satisfactorio". Por lo tanto, su respuesta a nuestra primera pregunta: "¿Qué
¿Hace algo efectivo como reforzador? ”- no fue muy esclarecedor.
Página 180
Se puede determinar si un estímulo, como una palmadita en la cabeza para un perro,

es un "satisfactorio" al ver si el perro aumenta una respuesta que resulta en
ser acariciado. Sin embargo, tal evidencia no revela por qué una palmada en la cabeza es
un reforzador. Al llamar a los reforzadores "satisfactores", Thorndike proporcionó una etiqueta para
reforzadores, pero no nos dio una explicación de lo que hace que algo
eficaz como reforzador.

Thorndike fue algo más comunicativo en la segunda pregunta: "¿Cómo
¿Un reforzador produce un aumento en la probabilidad de que el reforzado
¿respuesta?" Su respuesta fue proporcionada en la ley del efecto . Como señalé en el Capítulo 7,
según la ley del efecto, un reforzador establece una asociación o
conexión entre la respuesta instrumental R y los estímulos S en el
presencia de la cual se refuerza la respuesta. El reforzador produce una S – R
asociación (ver Figura 9.1 ).
FIGURA 9.1
Diagrama de la ley de efecto de Thorndike. El reforzador o resultado de la respuesta O actúa

hacia atrás para fortalecer la asociación S – R (estímulo-respuesta).
La ley del efecto explica cómo el refuerzo aumenta el futuro.

probabilidad de la respuesta instrumental. Debido a la asociación S – R que es
establecido por el reforzamiento, el estímulo S viene a evocar el instrumental
respuesta R, de la misma manera que una respuesta provocada es producida por su
provocando estímulo. El mecanismo básico de la ley del efecto se consideró un
explicación razonable para una mayor respuesta instrumental y aceptada por
principales teóricos del comportamiento durante los próximos 50 años. Esta amplia aceptación
Es notable porque los mecanismos de la ley no fueron detallados en mucho
detalle.
Aunque la ley del efecto predice un aumento de la respuesta instrumental en el
entorno de entrenamiento, lo hace a través de un poco de magia en lugar de un buen
proceso establecido. Thorndike no dijo mucho sobre cómo puede actuar un reforzador.
Página 181
retroactivamente para fortalecer una asociación entre la respuesta y los estímulos en

la presencia de la cual se hizo la respuesta. Esa parte de la ley del efecto había
para ser tomado por fe. Además, a pesar de la amplia aceptación de la ley
de efecto durante los próximos 50 años, nadie ha llenado el vacío dejado por Thorndike.
El mecanismo a través del cual un reforzador actúa hacia atrás en el tiempo para fortalecer
queda por especificar una asociación S – R.
Teoría de reducción del casco y la transmisión

El siguiente gran teórico que consideraremos es Clark Hull (ver Amsel y Rashotte,
1984, para una revisión de la teoría de Hullian). Hull aceptó el mecanismo S – R del
ley del efecto y se concentró en la cuestión de que Thorndike había
ignorado, es decir, "¿Qué hace que algo sea eficaz como reforzador?" Contestar
esta pregunta, Hull hizo uso del concepto de homeostasis , que había sido
desarrollado para explicar el funcionamiento de los sistemas fisiológicos.
Según el modelo homeostático, los organismos defienden un estado estable con

respecto a las funciones biológicas críticas. Considere, por ejemplo, la ingesta de alimentos (ver
Figura 9.2). Para sobrevivir, los organismos deben mantener un suministro estable u óptimo de
nutrientes. Desafíos de la privación de alimentos al estado nutricional del organismo
y crea una necesidad de comida. La consecuencia psicológica de esto es la
estado de hambre motivacional o impulsivo, que puede reducirse mediante la ingestión de
comida. Según Hull, la comida es un reforzador eficaz porque reduce la
impulso de hambre. De manera más general, Hull propuso que lo que hace que un estímulo
reforzante es su eficacia en la reducción de un estado de impulsión. Por tanto, su teoría es
llamada la teoría de la reducción de impulsos del reforzamiento.
FIGURA 9.2
Página 182
Ilustración de los mecanismos de refuerzo de la reducción del impulso utilizando el hambre como
ejemplo. Las entregas del reforzador de alimentos se indican con asteriscos.
REFUERZOS PRIMARIOS
Los ejemplos comunes de laboratorio de refuerzo instrumental son consistentes con
Teoría de reducción de impulsión de Hull. La privación leve de alimentos se usa habitualmente para hacer
alimento un reforzador eficaz para animales de laboratorio en situaciones experimentales.
De manera similar, la falta de agua leve hace que el agua sea un reforzador eficaz. Las ratas lo harán
presione una palanca de respuesta para obtener calor cuando estén en un ambiente frío.
Por el contrario, presionarán la palanca para obtener aire frío en un ambiente cálido.
Procedimientos de privación y otras circunstancias que desafían a una
El sistema homeostático crea estados de impulso y estímulos que reducen estos estados de impulso.
son reforzadores efectivos de la conducta instrumental.
La teoría de la reducción de impulsos de Hull proporciona una explicación exitosa de los reforzadores.
como comida y agua. Estímulos que son efectivos para reducir una necesidad biológica.
sin entrenamiento previo se denominan reforzadores primarios . Sin embargo, si la teoría de Hull
sólo podía caracterizar reforzadores que reducen los impulsos biológicos primarios,
sería bastante limitado. Muchos reforzadores eficaces no satisfacen un criterio biológico.
conducir o necesitar. Puede que el olor a comida italiana lo refuerce, pero el olor
de comida no reduce el hambre. Del mismo modo, un billete de $ 20 no reduce un riesgo biológico.
impulso o necesidad, pero es un reforzador muy eficaz.
REFUERZOS SECUNDARIOS Y MOTORES ADQUIRIDOS
Página 183
La teoría de Hull se ha extendido con éxito a estímulos como el olor a comida.

agregando el principio del condicionamiento pavloviano. Como uno come repetidamente un
comida salada, el olor de esa comida se asocia con la reducción de
hambre a través del condicionamiento pavloviano. Esto hace que el aroma de la comida sea
reforzador condicionado o reforzador secundario . El concepto de condicionado
El refuerzo aumenta el alcance de la teoría de Hull a los estímulos que no reducen un
estado impulsor directamente, pero obtienen sus propiedades de refuerzo a través de la asociación con
un reforzador primario.
Otra extensión de la teoría de Hull más allá de los impulsos biológicos primarios
implicaba el concepto de un estado de impulsión condicionado. Estímulos que se asocian
con un estado de impulso primario se supone que provocan un impulso condicionado o adquirido
conducir . Se supone que la reducción de un impulso condicionado o adquirido refuerza
de la misma manera que la reducción de un estado de impulso primario o biológico.
El concepto de impulso condicionado o adquirido se ha utilizado ampliamente en
el análisis del comportamiento motivado por aversión. Puedes perder el equilibrio y
caer en una escalera mecánica en movimiento. Si la caída es lo suficientemente severa, puede tener miedo.
de escaleras mecánicas. Tal miedo condicionado es un ejemplo de un condicionado o adquirido
conducir. Según la teoría de reducción de impulsos de Hull, una reducción en la intensidad de
el impulso adquirido se reforzará. Por tanto, cualquier respuesta que le permita
para escapar del miedo condicionado a las escaleras mecánicas se reforzará. Caminando
lejos de la escalera mecánica y el uso de un ascensor se verá reforzado por la reducción de
el miedo condicionado provocado por la escalera mecánica. (Tengo más que decir sobre estos
mecanismos cuando hablo de la conducta de evitación en el capítulo 12 ).
El concepto de impulso condicionado o adquirido también es crítico en el análisis
de la adicción a las drogas. Las señales asociadas a las drogas provocan motivación de incentivo para participar en
comportamientos asociados con la adquisición y el consumo de un medicamento, como
alcohol o cocaína (Anselme y Robinson, 2016). Anteriormente hablé de tales
motivación de incentivos en el Capítulo 7. Motivación incentivada por drogas
las señales asociadas tiene sus raíces en el concepto de impulsos adquiridos de Hull.
REFUERZO SENSORIAL
Aunque la teoría de Hull se extendió con éxito a situaciones que no
implican impulsos biológicos primarios, la teoría no podría explicar todos los casos de
reforzamiento. Por ejemplo, los investigadores han descubierto que las ratas se mantienen en la oscuridad.
presionará una palanca de respuesta para encender una luz, y las ratas se mantendrán en un lugar iluminado
La cámara presionará una palanca de respuesta para producir períodos de oscuridad.
Página 184
Los chimpancés realizarán respuestas instrumentales que no son reforzadas por nada.
más que la oportunidad de ver un tren de juguete eléctrico moverse por una vía.
Todos estos son ejemplos de refuerzo sensorial . En muchas situaciones, sensorial
La estimulación sin relación aparente con una necesidad biológica o un estado de impulso puede servir
como un reforzador eficaz (véase Berlyne, 1969). Música, bellas pinturas y
otras obras de arte son ejemplos de reforzadores sensoriales para los seres humanos.
El creciente peso de la evidencia del refuerzo sensorial, junto con la
éxito de conceptualizaciones alternativas de reforzamiento, condujo a la
abandono de la teoría de reducción de impulsos de Hull. Como veremos, las teorías que
surgieron eran muy creativas e implicaban nuevas formas radicales de pensar sobre
las cuestiones del refuerzo instrumental.
El principio de Premack
La era moderna en la teoría del reforzamiento fue iniciada por el trabajo de David
Premack, quien abordó el refuerzo desde una perspectiva completamente diferente.
Al igual que Hull, Premack consideró preguntas básicas como por qué la comida es un
reforzador para ratas presionando una palanca de respuesta. Sin embargo, en lugar de pensar en el
reforzador como una bolita de comida, pensaba en el reforzador como el acto de comer el
comida. Para Premack, la pregunta no era qué hace que la comida sea un estímulo reforzador.
pero qué hace que comer sea una actividad de refuerzo. Premack enmarcó las cuestiones de
refuerzo en términos de respuestas, no en términos de estímulos o nutrición
sustancias (Premack, 1965).
¿Qué hace que comer sea diferente de presionar una palanca de respuesta en un estándar?
¿Caja desolladora? Son posibles muchas respuestas. La rata tiene que aprender a presionar la palanca,
pero no tiene que aprender a comer. Comer puede ocurrir no solo en la caja Skinner
pero en cualquier lugar la rata encuentra comida. Comer implica un conjunto especial de músculos y
activa los procesos digestivos. Otra diferencia entre comer y presionar un
es que una rata privada de comida en una caja Skinner tiene muchas más probabilidades de comer que
presionar la palanca si tiene libre acceso a ambas actividades. Premack se centró en
esta última diferencia y la elevó a un principio general.
Según Premack, la condición previa crítica para el refuerzo no es una
impulsa el estado o la motivación de incentivo. Más bien, es la existencia de dos respuestas
que difieren en su probabilidad cuando el organismo tiene libre acceso a ambos
ocupaciones. Dadas dos de esas respuestas, Premack propuso que la oportunidad de
realizar la respuesta de mayor probabilidad servirá como un reforzador para la menor
Página 185
respuesta de probabilidad . Esta afirmación general pasó a ser conocida como Premack's
principio . Un nombre más descriptivo para él es el principio de probabilidad diferencial .
Según el principio de probabilidad diferencial, la naturaleza específica de la
las respuestas instrumentales y reforzadoras no importan. Ninguno de los dos tiene que
implica comer o beber, y el organismo no necesita tener hambre ni sed. los
El único requisito es que una respuesta sea más probable que la otra. Dado tal
probabilidad de respuesta diferencial, la respuesta más probable servirá como
reforzador para la respuesta menos probable.
LA REVOLUCIÓN PREMACK
El principio de Premack tomó por asalto a la comunidad científica. Por primera vez,
Los científicos comenzaron a pensar seriamente en los reforzadores como respuestas en lugar de como
estímulos especiales. Premack no estaba preocupado por cómo una respuesta podría haber
llegará a ser más probable que otro. Lo único que importaba era que el
La respuesta reforzadora es más probable que la respuesta instrumental. Premack's
principio liberó a los psicólogos de las garras de las visiones de estímulo de
refuerzo y puntos de vista del refuerzo arraigados en necesidades e impulsos biológicos.
Además, el principio de Premack proporcionó una herramienta conveniente para la aplicación de
procedimientos de acondicionamiento instrumental en una variedad de entornos educativos,
incluyendo hogares, aulas, hospitales psiquiátricos, centros de retraso mental,
e instituciones correccionales (Danaher, 1974).
APLICACIONES DEL PRINCIPIO DE PREMACK

En todos los entornos educativos, se anima a los estudiantes a aprender y realizar nuevos
respuestas. El objetivo es lograr que los estudiantes hagan cosas que no hacían antes.
y cosas que no harían sin un estímulo o entrenamiento especial. En otra
En palabras, el objetivo es aumentar la probabilidad de respuestas de baja probabilidad.
Los procedimientos de acondicionamiento instrumental son ideales para lograr esto. Pero
el maestro primero tiene que encontrar un reforzador eficaz. Retener el almuerzo de un estudiante
de modo que la comida pueda usarse como reforzador no es socialmente aceptable y sería
crear mucho resentimiento. Los dulces y otras golosinas comestibles son efectivos
reforzadores para niños pequeños sin privación de alimentos, pero no son buenos para
ellos nutricionalmente.
El principio de Premack proporciona una salida a este dilema (Danaher, 1974).
Según Premack, un reforzador es cualquier actividad en la que el participante sea más probable
Página 186
para participar que la respuesta instrumental. A algunos estudiantes les puede gustar jugar
videojuego; otros pueden disfrutar de pasar tiempo en el patio de recreo; aún otros pueden
disfruta ayudando al maestro. Cualquiera que sea la respuesta de alta probabilidad, la
El principio de Premack sugiere que uno puede aprovecharlo fomentando la
que el estudiante participe en una actividad menos probable. Todo lo que hay que hacer es proporcionar acceso
a la respuesta de alta probabilidad solo si el estudiante realiza primero la
comportamiento de probabilidad.
Considere, por ejemplo, un niño con trastorno del espectro autista que muestra
alguna forma de comportamiento perseverante (p. ej., manipular repetidamente el mismo
objeto). Los estudios han demostrado que la oportunidad de realizar un trabajo tan perseverante
Las respuestas se pueden utilizar como refuerzo en los esfuerzos por enseñar comportamientos más deseables.
tales como aritmética simple y habilidades lingüísticas (Charlop, Kurtz y Casey, 1990;
Hanley, Iwata, Thompson y Lindberg, 2000).
PROBLEMAS TEÓRICOS
El principio Premack ha sido muy influyente, pero no deja de
complicaciones. Un problema importante implica la medición o el cálculo de
probabilidades de respuesta. Todos tenemos un sentido intuitivo de lo que significa decir que
una respuesta es más probable que otra, pero asignando un valor numérico preciso
a la probabilidad de una respuesta puede ser difícil. Además, la probabilidad de una
La respuesta dada puede cambiar inesperadamente. Un joven puede disfrutar nadando en
por la mañana, pero no más tarde el mismo día.
Los problemas asociados con el uso de probabilidades de respuesta para identificar
Los reforzadores se pueden evitar en entornos aplicados con el uso de una economía de fichas.
(Kazdin, 1985; Matson y Boisjoli, 2009). En tal sistema, los estudiantes reciben
tokens o puntos para realizar determinadas respuestas instrumentales objetivo. los
Luego, los estudiantes pueden intercambiar sus puntos por varias oportunidades de respuesta (p. ej.,
jugar un videojuego, ver una película, leer un cómic o ir a la
patio de recreo), dependiendo de lo que quieran hacer en ese momento y cuántas
puntos que han acumulado. Si se dispone de una amplia gama de actividades reforzadoras
disponible a cambio de tokens, no es necesario obtener medidas precisas de
la probabilidad de cada respuesta reforzadora o preocupación por las fluctuaciones en
preferencias de reforzador.
Las economías de fichas evitan los problemas asociados con la medición de la respuesta
probabilidades, pero no resuelven un problema conceptual importante con Premack
principio, es decir, que es meramente una prescripción o regla para identificar
Página 187
reforzadores. No nos dice cómo funcionan los reforzadores. Responde la pregunta

"¿Qué hace que algo sea efectivo como reforzador?" pero no responde a la
pregunta "¿Cómo produce un reforzador un aumento en la probabilidad de
respuesta reforzada? "
La hipótesis de la respuesta a la privación

Timberlake y Allison (1974) siguieron los pasos de Premack al pensar
sobre los reforzadores como respuestas más que como estímulos. Su punto de partida, como
Premack, fue descubrir qué hace que una respuesta instrumental sea diferente
de una respuesta reforzadora. Sin embargo, su consideración de esta cuestión llevó
ellos por un camino diferente. Timberlake y Allison sugirieron que la crítica
La diferencia entre las respuestas instrumentales y reforzadoras es que el participante
tiene libre acceso a la respuesta instrumental, pero no puede realizar la
respuesta reforzadora.
En una caja Skinner típica, por ejemplo, la rata puede presionar la palanca de respuesta en
en cualquier momento, pero no está en libertad de comer gránulos de comida en ningún momento. Comer puede
ocurren solo después de que la rata ha presionado la palanca, e incluso entonces la rata solo puede comer
el único gránulo de comida que se proporciona. Timberlake y Allison (1974) sugirieron
que estas restricciones en la respuesta del reforzador hacen que comer sea un
reforzador. En su opinión, las situaciones de condicionamiento instrumental privan al
participante de libre acceso a la respuesta reforzadora. Por esta razón, la
Propuesta de Timberlake-Allison, el próximo gran avance en las teorías de
refuerzo, se denomina hipótesis de privación de respuesta .
LA PRIVACIÓN DE RESPUESTA Y LA LEY DE EFECTO

La hipótesis de la privación de respuesta captura una idea importante. La idea es
obvio si uno considera lo que sucedería si no hubiera restricciones sobre
comiendo para una rata en una caja Skinner. Imagine una situación en la que la rata recibe un
suministro de comida para la semana cada vez que presiona la palanca de respuesta. De acuerdo a
Según la ley de efecto de Thorndike, la comida de una semana debería ser muy satisfactoria.
estado de cosas y, por lo tanto, debería resultar en un fuerte vínculo S-R y una gran
aumento de la presión de la palanca. Pero esto apenas tiene sentido desde el punto de vista de la rata
vista. Una predicción más sensata es que si la rata recibe el suministro de una semana de
comida por cada presión de palanca, presionará la palanca de respuesta aproximadamente una vez a la semana,
Página 188
cuando su suplemento alimenticio se agota.

De acuerdo con la hipótesis de la privación de respuesta, lo que hace que la comida sea un
reforzador eficaz no es que la comida satisfaga el hambre o que comer sea un
respuesta de probabilidad. Más bien, el factor crítico es que un instrumento
El procedimiento de acondicionamiento impone una restricción a la alimentación. Si la respuesta de privación
se elimina, la respuesta instrumental no aumentará; la respuesta instrumental
no será reforzado.
PRIVACIÓN DE RESPUESTA Y PROBABILIDAD DE RESPUESTA

Observe que la hipótesis de privación de respuesta no requiere el cálculo
de probabilidades de respuesta. Por tanto, la hipótesis de la privación de respuesta evita la
primer defecto del principio de Premack. Para aplicar la privación de respuesta, uno
simplemente tiene que determinar la tasa de una respuesta durante un período de referencia en el
ausencia de restricciones y luego limitar el acceso a la respuesta del reforzador a
por debajo de ese nivel de referencia (Klatt y Morris, 2001). Esto ha hecho que la respuesta
hipótesis de privación una herramienta popular para crear reforzadores efectivos en aplicaciones
situaciones.
Una predicción interesante de la hipótesis de la privación de respuesta es que incluso
una respuesta de baja probabilidad puede servir como un evento de refuerzo. La oportunidad para
realizar una respuesta de baja probabilidad se puede utilizar para reforzar una mayor probabilidad
comportamiento si el acceso a la respuesta de baja probabilidad está restringido por debajo de su
baja tasa de referencia. Tal predicción es contraria al principio de Premack pero tiene
ha sido confirmado por evidencia experimental (Allison & Timberlake, 1974;
Eisenberger, Karpman y Trattner, 1967).
LA PRIVACIÓN DE RESPUESTA Y EL LUGAR DE

EFECTOS DE REFUERZO
Además de evitar los problemas relacionados con la respuesta informática
probabilidades, la hipótesis de la privación de respuesta cambió el lugar de la
explicación del refuerzo. En teorías anteriores, el reforzamiento se explicaba en
términos de factores que estaban fuera del propio procedimiento de condicionamiento instrumental.
Con la teoría de la reducción de impulsos, el factor externo involucró procedimientos que
estableció un estado de unidad. Con el principio de Premack, el factor externo involucrado
las probabilidades de referencia diferenciales del reforzador y el instrumental
respuestas. En contraste, con la hipótesis de la privación de respuesta, el locus de
Página 189
El refuerzo depende de cómo el procedimiento de condicionamiento instrumental restringe

las actividades del organismo. Esta fue una idea nueva. Nunca antes había alguien
sugirió que los efectos de refuerzo están determinados por las restricciones de respuesta
que son una característica inherente de todos los procedimientos de acondicionamiento instrumental.
La hipótesis de la privación de respuesta movió nuestra comprensión de
refuerzo hacia adelante en el sentido de que evitó algunos de los problemas de Premack
principio. Sin embargo, al igual que el principio de Premack, la privación de respuesta
La hipótesis solo proporcionó una respuesta a la pregunta "¿Qué hace que algo
eficaz como reforzador? " La respuesta a la otra pregunta importante, "¿Cómo
reforzador producir un aumento en la probabilidad de la respuesta reforzada? "
Tuve que esperar a examinar cómo el condicionamiento instrumental cambia la forma en que los individuos
distribuir su comportamiento entre varias opciones de respuesta.
Asignación de respuestas y economía del comportamiento

La hipótesis de la privación de respuesta ayudó a redefinir el problema básico en
condicionamiento instrumental como un problema de asignación de respuestas . Decreciente
El acceso a la respuesta reforzadora crea una redistribución de comportamientos tal que
la respuesta reforzadora ocurre con menos frecuencia y la respuesta instrumental ocurre
más a menudo. Si el condicionamiento instrumental implica un cambio en la respuesta
asignación, qué causa el cambio y cuáles son las reglas que gobiernan estos
¿cambios? Los esfuerzos para responder a estas preguntas alentaron a los científicos a importar
conceptos desde el estudio de la microeconomía hasta el análisis de instrumentos
comportamiento (Allison, 1989; Timberlake, 1980, 1984) y ayudó a establecer el
campo de la economía del comportamiento.
La economía básicamente se ocupa de la asignación de recursos entre varios
opciones. Un recurso importante es el dinero, que se distribuye entre varios bienes.
y servicios que el dinero puede comprar. En una situación de condicionamiento instrumental, el
El recurso es el comportamiento, que puede asignarse entre varias opciones de respuesta. A
concepto económico central en los análisis de cómo la gente elige gastar su dinero
es el concepto de un punto de dicha . Como el término implica, el punto de dicha se refiere a un
la distribución ideal o preferida de los recursos monetarios del individuo entre los
bienes y servicios que la persona desee adquirir.
Una situación de condicionamiento instrumental simple incluye dos respuestas obvias
opciones, la respuesta instrumental y la respuesta reforzadora. El comportamiento
El punto de dicha puede definirse como la distribución ideal o preferida de los comportamientos.
Página 190
entre estas dos opciones de respuesta cuando no hay limitaciones o restricciones

en cualquier actividad. El punto de felicidad conductual es el preferido del individuo.
opciones de respuesta antes de que se imponga un procedimiento de condicionamiento instrumental.
Considere, por ejemplo, una adolescente llamada Kim. Dejada a sus propios dispositivos
Durante el transcurso de un día de 24 horas, Kim podría pasar 4 horas hablando con
enviar mensajes de texto a amigos, 1,5 horas comiendo, 2 horas conduciendo, 10 horas durmiendo, 3 horas
jugando videojuegos, 3 horas escuchando música y media hora haciendo
Trabajo escolar. Esta distribución de actividades constituiría la felicidad conductual
punto para Kim. Observe que en el punto de la dicha, Kim dedica solo media hora cada uno.
día para hacer el trabajo escolar.
IMPOSICIÓN DE CONTINGENCIA INSTRUMENTAL

Es posible que los padres de Kim quieran introducir un procedimiento de acondicionamiento instrumental para
aumentar la cantidad de tiempo que Kim dedica al trabajo escolar. Podrían hacer esto por
restringir su acceso a la música. Por ejemplo, podrían exigir que Kim gaste un
minuto haciendo el trabajo escolar por cada minuto que llega a escuchar música.
Ante la contingencia instrumental, escuchar música y hacer los deberes
eran actividades independientes. Cuánto tiempo pasó Kim en una actividad tuvo poco
que ver con la cantidad de tiempo que pasó con el otro. Una vez que el instrumental
Se introduce el procedimiento de acondicionamiento, esta independencia se pierde.
Se ilustra el punto de felicidad conductual de Kim por escuchar música y estudiar
en el cuadrante superior izquierdo de la Figura 9.3 . Ante la contingencia instrumental,
Kim dedica mucho más tiempo a la música que a estudiar. Exigirle que haga un
minuto de tarea por cada minuto de escucha de música vincula las dos actividades
juntos de una manera especial. Ahora el tiempo dedicado a la tarea debe ser igual al tiempo invertido
en la música. Esta relación, ilustrada por la línea de 45 ° en la Figura 9.3, se llama
línea de programación . Con el procedimiento de acondicionamiento instrumental en vigor, Kim puede
ya no distribuye sus respuestas como lo hizo en el punto de felicidad conductual. Aviso
que la línea del horario no pasa por el punto de felicidad conductual. Por lo tanto,
la contingencia instrumental es un desafío al punto de felicidad conductual.
FIGURA 9.3
Página 191
Ilustración del enfoque de regulación conductual del condicionamiento instrumental. La dicha

El punto representa cuánto tiempo pasa un adolescente estudiando y escuchando música en el
ausencia de un procedimiento de acondicionamiento instrumental o restricción de programación. El horario
La línea representa cuánto tiempo puede dedicar la persona a cada actividad cuando está
Se requiere dedicar 1 minuto a estudiar por cada minuto dedicado a escuchar música.
¿Cómo responderá Kim al desafío a su punto de felicidad creado por

el horario de reforzamiento que se ha impuesto? Conducta economica
asume que los desafíos al punto de dicha desencadenarán mecanismos de ajuste
que mueven las asignaciones de respuesta hacia el punto de dicha. Curiosamente,
Sin embargo, todas las estrategias posibles para regresar al punto de felicidad conductual.
implica algún costo o desventaja. Si Kim elige escuchar música durante tanto tiempo
como a ella le gustaría (idealmente, 3 horas al día), tendría que hacer mucho más
trabajo escolar de lo que le gusta. Por otro lado, si pasara tan poco tiempo haciendo
el trabajo escolar que prefiera (media hora al día), tendría que conformarse con
mucha menos música de la que le gusta.
Los procedimientos de acondicionamiento instrumental limitan las opciones de respuesta. Ellos
Página 192
interrumpir el libre flujo de la conducta e interferir con la forma en que un organismo selecciona
entre sus alternativas de respuesta disponibles. Además, la mayoría de los casos son como
Kim en que el procedimiento de condicionamiento instrumental no permite la
participante para volver al punto de felicidad conductual. Lo máximo que se puede lograr
es moverse hacia el punto de la dicha bajo las limitaciones del instrumental
procedimiento de acondicionamiento.
RESPONDER A LAS RESTRICCIONES DE HORARIO

Cómo un organismo avanza hacia su punto de felicidad conductual después
se ha impuesto una contingencia instrumental depende de los costos y beneficios
de varias opciones. Gran parte de la economía del comportamiento se dedica al análisis de
tales compensaciones de costo / beneficio (Hursh, Madden, Spiga, DeLeon y Francisco,
2013). La forma en que uno se enfrenta a este problema depende de la actividad que se desee
rendirse para defender al otro. Si hacer el trabajo escolar es mucho más desagradable para
Kim que la posible pérdida de tiempo para escuchar música, entonces no aumentará su
mucho trabajo escolar, pero renunciará al tiempo dedicado a escuchar música. A diferencia de,
si la posible pérdida de tiempo musical es mucho más aversiva para Kim que aumenta
esfuerzo dedicado al trabajo escolar, ella se ajustará a la restricción impuesta por el
procedimiento de acondicionamiento instrumental aumentando sustancialmente el tiempo
se dedica al trabajo escolar.
Como sugiere el análisis anterior, navegar por los costos y beneficios de

diferentes formas de volver al punto de dicha depende del grado de
flexibilidad asociada a una actividad u otra. Los economistas se refieren a esto como
elasticidad de la demanda . Hay relativamente poca flexibilidad en la cantidad de gasolina
la gente compra para hacer funcionar sus coches. Los precios más altos no dan como resultado una gran caída
en las compras de gas, lo que indica que las compras de gas muestran poca elasticidad de demanda.
Por el contrario, un aumento en el precio de los dulces provocará una fuerte caída en
compras, demostrando que la compra o consumo de dulces es mucho más
elástico. Uno de los sellos distintivos de la adicción a las drogas es la falta de flexibilidad en
consumo de la droga, lo que ilustra bajos niveles de elasticidad de la demanda en ese
caso.
Si Kim insiste en escuchar música durante 3 horas al día, pase lo que pase, está
mostrando poca elasticidad en la demanda de escuchar música y tendrá que
aumentar sustancialmente sus estudios para defender su acceso preferido a la música. La mayor
El factor que determina la elasticidad de la demanda es la disponibilidad de sustitutos. A
sustituto es un producto o actividad que proporciona algunos de los mismos beneficios o
Página 193
satisfacción como el artículo original. Hay poca elasticidad de la demanda de gasolina.

porque no podemos usar nada más para operar nuestros autos. En contraste, muchos
hay sustitutos disponibles para los dulces. Si los dulces se vuelven demasiado caros, uno puede cambiar
a comer galletas o helados que son igualmente dulces.
Un factor particularmente importante que determina cómo responde un individuo a
Las restricciones de horario es la disponibilidad de sustitutos para la actividad reforzadora.
(Green y Freed, 1993; Murphy, Correia y Barnett, 2007). Instrumental
Los procedimientos de acondicionamiento son poderosos solo si no hay sustitutos disponibles para el
actividad reforzadora. Si a Kim le encanta la música y no puede obtener la misma satisfacción
de cualquier otro tipo de actividad, la música será un poderoso reforzador. En esto
caso, ella se ajustará al procedimiento instrumental con un gran aumento en
Trabajo escolar. Por el contrario, si jugar videojuegos es un buen sustituto de escuchar
a la música, la contingencia instrumental tendrá poco efecto sobre la cantidad
el trabajo escolar que hace Kim. En cambio, ella responderá a la restricción del horario
sustituir los videojuegos por escuchar música, sin tener que aumentar la
mucho tiempo que dedica al trabajo escolar.
La economía del comportamiento sugiere que se debe tener mucho cuidado al evaluar la
disponibilidad de sustitutos en el diseño de una aplicación práctica de instrumentos
principios de condicionamiento. Desafortunadamente, estos sustitutos pueden no ser claramente
evidente antes de que se imponga una contingencia instrumental. Los padres de Kim, por
Por ejemplo, puede que no sepa que Kim considera que los videojuegos son satisfactorios.
sustituto de escuchar música. De hecho, es posible que Kim no sea consciente de esto.
antes, la contingencia instrumental vincula el estudio con la escucha de música. Para
Por esta razón, es importante monitorear la gama completa de actividades del individuo.
cuando se impone un procedimiento de condicionamiento instrumental para producir un
cambio de comportamiento.
CONTRIBUCIONES DE ASIGNACIÓN DE RESPUESTA Y

CONDUCTA ECONOMICA
Pensar en el condicionamiento instrumental como un problema de asignación de respuestas
guiado por conceptos económicos ha avanzado nuestra comprensión al alentar
pensar en el condicionamiento instrumental y el refuerzo dentro del contexto de
todo el repertorio conductual del participante. Asignación de respuesta y comportamiento
La economía centra la atención en el hecho de que el condicionamiento instrumental
los procedimientos no operan en un vacío conductual. Más bien, instrumental
los procedimientos de acondicionamiento interrumpen el libre flujo de la conducta; ellos interfieren con
Página 194
cómo los individuos asignan su comportamiento entre las opciones de respuesta disponibles.
Los conceptos económicos conductuales también nos dicen que los efectos de los instrumentos
el condicionamiento no se limita a cambios en la tasa de la respuesta instrumental.
Las restricciones de programación también pueden producir cambios en las actividades que son sustitutos
para la actividad de refuerzo.
La economía del comportamiento nos anima a pensar en el comportamiento instrumental
desde una perspectiva más amplia que las conceptualizaciones anteriores. Nos anima a
considerar todas las actividades de un participante: cómo se organizan y cómo
esa organización determina los efectos de las restricciones de programación. Este enfoque es
muy lejos de la perspectiva más limitada de estímulo-respuesta que dominaba
teorías anteriores del reforzamiento. Sin embargo, trae consigo desafíos de
su propio. Es difícil predecir un efecto de refuerzo a menos que conozcamos todos los
Características de la organización conductual de un individuo que influyen en su
respuestas a una restricción de horario.
Resumen
Una teoría del reforzamiento tiene que decirnos (a) qué hace que algo sea un reforzador
y (b) cómo el reforzador produce sus efectos. Las primeras teorías asumieron que
los reforzadores eran tipos especiales de estímulos. Según el más influyente de
estas teorías, un estímulo se reforzará si es eficaz para reducir un impulso
estado. La teoría de la reducción de impulsos fue dominante durante varias décadas, pero se encontró con algunos
dificultades (p. ej., no podía explicar el refuerzo sensorial) y fue reemplazado
por las teorías de respuesta del reforzamiento. Entre los más destacados se encontraba
El principio de Premack, según el cual un reforzador no es un reductor de impulsos.
estímulo sino más bien la oportunidad de dar una respuesta cuya línea de base
La probabilidad es mayor que la probabilidad de referencia de la respuesta instrumental.
El principio de Premack sigue formando la base de numerosas aplicaciones de
refuerzo en entornos clínicos y educativos. Sin embargo, las deficiencias del
principio estimuló el siguiente desarrollo teórico, la privación de respuesta
hipótesis. Según esta hipótesis, la oportunidad de realizar una respuesta
será un reforzador eficaz si el procedimiento de acondicionamiento instrumental restringe
acceso a esa actividad por debajo de su tasa de referencia. La respuesta de privación
La hipótesis cambió el foco de atención de los reforzadores como estímulos especiales o
respuestas a cómo un procedimiento de condicionamiento instrumental restringe la
actividades del organismo y crea una nueva asignación de respuestas entre los
Página 195
opciones de comportamiento del individuo. Analizar los procesos que son importantes en
la reasignación de la conducta fue facilitada por el uso de conceptos de
economía, y esto condujo al establecimiento del campo de la conducta
ciencias económicas.
La economía del comportamiento sugiere que los organismos tienen una preferencia u óptima
distribución de actividades en cualquier situación dada. La introducción de un
El procedimiento de acondicionamiento instrumental interrumpe esta distribución de respuesta óptima,
o punto de felicidad conductual. La interrupción activa cambios en la asignación de respuesta.
en un esfuerzo por defender el punto de dicha. Normalmente, el cambio en la respuesta
La asignación implica un aumento en la respuesta instrumental y una disminución en la
tasa de la respuesta del reforzador. El alcance de estos cambios está determinado por el
elasticidad de cada respuesta y disponibilidad de sustitutos del reforzador
respuesta.
Lecturas sugeridas
Allison, J. (1983). Conducta economica. Nueva York, NY: Praeger.
Anselme, P. y Robinson, MJF (2016). "Querer", "gustar" y su
relación con la conciencia. Journal of Experimental Psychology: Animal
Aprendizaje y cognición , 42 , 123–140.
Hursh, SR, Madden, GJ, Spiga, R., DeLeon, I. y Francisco, MT (2013).
La utilidad traslacional de la economía del comportamiento: el análisis experimental
de consumo y elección. En GJ Madden (Ed.), Manual APA de
análisis del comportamiento: Vol. 2. Traducir los principios a la práctica (págs. 191–224).
Washington, DC: Asociación Americana de Psicología.
Matson, JL y Boisjoli, JA (2009). La economía de fichas para niños con
discapacidades intelectuales y / o autismo: una revisión. Investigación en desarrollo
Discapacidades , 30 , 240–248. http://dx.doi.org/10.1016/j.ridd.2008.04.001
Timberlake, W. y Farmer-Dougan, VA (1991). Refuerzo en aplicado
Configuración: Averiguar con anticipación qué funcionará. Boletín psicológico ,
110 , 379–391. http://dx.doi.org/10.1037/0033-2909.110.3.379
Términos técnicos
Unidad adquirida
Punto de felicidad conductual
Página 196
Unidad acondicionada
Reforzador condicionado
Principio de probabilidad diferencial
Teoría de la reducción de impulsos
Estado de la unidad
Ley de efecto
Principio de Premack
Reforzador primario
Asignación de respuesta
Hipótesis de privación de respuesta
Línea de programación
Reforzador secundario
Refuerzo sensorial
Página 197
Sabía usted que
extinción no solo disminuye la respuesta, sino que también aumenta la
variabilidad del comportamiento?
La extinción implica aprender a inhibir un
respuesta condicionada pero deja intacto mucho de lo que fue
aprendido previamente?
El comportamiento extinguido puede reaparecer bajo una amplia gama de
circunstancias, creando desafíos para las terapias conductuales
basado en la extinción?
gran parte de la investigación contemporánea se dedica a encontrar formas de
¿Aumentar la eficacia de los procedimientos de extinción?
la inesperada ausencia de refuerzo produce
¿frustración?
el programa de refuerzo que estaba en vigor durante
La adquisición determina la persistencia del comportamiento durante
¿extinción?
usar más refuerzo durante el entrenamiento no
Aumentar necesariamente la persistencia de la conducta en
¿extinción? La respuesta puede disminuir más rápidamente en
extinción después de un entrenamiento más extenso, después de un entrenamiento con un
Página 198
reforzador más grande, o después del entrenamiento con intermitentes en lugar

que refuerzo continuo.
S O ahora, nuestra discusión de condicionamiento clásico e instrumental se ha centrado

sobre varios aspectos de la adquisición y el mantenimiento de la conducta condicionada.
El aprendizaje es importante porque proporciona la flexibilidad necesaria sobre cómo los individuos
interactuar con su entorno. Pero si el comportamiento aprendido es una adaptación a un
entorno cambiante, entonces la pérdida de la conducta condicionada debería ser tan
prevaleciente como su adquisición. Los programas de refuerzo no permanecen necesariamente
en efecto a lo largo de la vida de un individuo. Respuestas que tienen éxito en una
Un momento en la vida puede dejar de ser útil a medida que cambian las circunstancias. Niños, para
ejemplo, son elogiados por dibujar crudas representaciones de personas y objetos en
guardería, pero el mismo tipo de dibujo no se considera apropiado si
dibujado por un estudiante de secundaria.
La adquisición de la conducta condicionada implica procedimientos en los que un
Se presenta un resultado reforzante o un estímulo incondicionado (EE. UU.). Extinción
implica omitir el reforzador, o EE. UU. En condicionamiento clásico, extinción
implica presentaciones repetidas del estímulo condicionado (CS) sin EE. UU.
En el condicionamiento instrumental, la extinción implica dejar de presentar el
reforzador cuando el individuo da la respuesta instrumental. Lo tipico
El resultado de un procedimiento de extinción es que la respuesta condicionada disminuye. Por lo tanto,
la extinción parece ser lo opuesto a la adquisición. De hecho, así es como
La extinción se ha caracterizado en las teorías tradicionales del aprendizaje, como la
Modelo Rescorla-Wagner (ver Capítulo 6 , este volumen). Sin embargo, como la evidencia
que se describe en el presente captulo, este punto de vista de la extincin es
defectuoso.
Es importante distinguir la extinción del olvido. Aunque ambos
implican la pérdida de la respuesta condicionada, el olvido de los resultados del paso de
tiempo. La extinción, por el contrario, se produce como consecuencia de presentaciones repetidas.
del CS solo o instancias repetidas de la respuesta instrumental sin el
reforzador. A diferencia del olvido, la extinción se produce por un procedimiento particular,
no meramente el paso del tiempo.
Aunque la investigación sobre la extinción se originó hace unos cien años,
La extinción sigue siendo un área importante de la investigación contemporánea a nivel de ambos
comportamiento y mecanismos neuronales (Delamater y Westbrook, 2014; Lattal, St.
Peter y Escobar, 2013; Todd, Vurbic y Bouton, 2014). Investigación contemporánea
está motivado por los esfuerzos para comprender mejor varios fenómenos novedosos de extinción
Página 199
y por los esfuerzos para desarrollar procedimientos terapéuticos más efectivos para el tratamiento
de miedos y fobias inadaptados (Dunsmoor, Niv, Daw y Phelps, 2015;
Gillihan y Foa, 2011; Maren, 2011; Maren y Holmes, 2016).
Efectos de los procedimientos de extinción

Imagínese ansioso por llegar a casa después de un arduo día de trabajo y
descubrir que su llave ya no abre la puerta de entrada. Esto ilustra el
procedimiento básico de extinción. Una respuesta previamente reforzada (girando la llave
en la cerradura) ya no es eficaz para producir el refuerzo (abrir la puerta).
Una ausencia tan inesperada de refuerzo produce tanto emocionales como
efectos conductuales. La emoción que sientes al descubrir que tu llave ya no
funciona es la frustración y quizás la ira. Lo más probable es que no te rindas después
su primer intento de abrir la puerta, pero lo intentará varias veces más, tal vez
moviendo la llave de diferentes maneras. Si ninguna de estas variaciones de respuesta funciona,
eventualmente dejará de intentarlo.
Este ejemplo ilustra dos efectos conductuales básicos de la extinción. Lo mas
obvio es que la respuesta disminuye cuando la respuesta ya no resulta en
reforzamiento. Este es el principal efecto conductual de la extinción, y el efecto
que ha ocupado la mayor parte de la atención de los científicos. El otro importante
La consecuencia conductual de la extinción es un aumento en la variabilidad de la respuesta.
(Neuringer, Kornell y Olufs, 2001). Cuando tu llave no pudo abrir la puerta
En el primer intento, movió la tecla de varias maneras en un esfuerzo por hacerla funcionar.
Esto refleja el aumento en la variabilidad de respuesta que se produce por la extinción.
Además de estos efectos conductuales, la extinción a menudo también involucra
componentes. La frustración y la ira ocurren si se retiene un reforzador del apetito,
y el alivio se produce si se retiene una aversión de EE. UU.
Extinción y aprendizaje original

Aunque la extinción produce importantes efectos conductuales y emocionales, sí
No revertir los efectos de la adquisición. Evidencia de que la extinción no borra
lo que se aprendió originalmente se ha obtenido a través de estudios de
efectos de recuperación, renovación, reinstalación y devaluación reforzadora.
Comprender los mecanismos de estos fenómenos es de considerable interés en
tanto investigación básica como traslacional.
Página 200
RECUPERACION ESPONTANEA
El procedimiento básico para la extinción siguiendo el condicionamiento pavloviano implica
presentando repetidamente el CS por sí mismo. Esto hace que el procedimiento de extinción
en el condicionamiento pavloviano similar al procedimiento estándar para la habituación.
Por lo tanto, no es sorprendente que muchas características conductuales de la habituación sean
también se encuentra en extinción. Una característica destacada de la habituación es que muestra
Recuperacion espontanea. Si se introduce un período sustancial de descanso después de una serie de
ensayos de habituación, se observa que la respuesta habituada regresa o se recupera.
Pavlov descubrió un fenómeno similar en extinción después de Pavlov
acondicionamiento. El hallazgo básico se ilustra en la Figura 10.1.. Durante la adquisición,
la respuesta condicionada aumenta en función de las pruebas. En extinción
responder declina. Luego se instituye un período de descanso, seguido de
ensayos de extinción. Observe que la respuesta es más alta después del período de descanso que
estaba al final de la primera serie de ensayos de extinción. Esta recuperación de la conducta es
llamada recuperación espontánea porque no requiere una intervención especial
además del paso del tiempo (Rescorla, 2004).
FIGURA 10.1
Ilustración de recuperación espontánea después de la extinción. Durante la fase de adquisición,

la respuesta condicionada aumenta. En la siguiente fase de extinción, respondiendo
desciende al bajo nivel observado al inicio de la fase de adquisición. Un período de descanso es entonces
introducido durante el cual se suspenden las pruebas de entrenamiento. Esto resulta en un temporal
recuperación de la conducta condicionada. Los datos son hipotéticos.
Página 201
La recuperación espontánea generalmente no restaura la respuesta al alto nivel.

eso fue evidente durante la adquisición. Sin embargo, el hecho de que responder se recupere
en alguna medida es evidencia de que la extinción suprimió en lugar de eliminar la
respuesta condicionada. Esto indica que la extinción no revierte la
procesos de adquisición o desaprendizaje producidos. La recuperación espontánea es uno de
las razones por las que los malos hábitos o los miedos inadaptados pueden volver después de los esfuerzos
extinguirlos.
EL EFECTO RENOVACIÓN
Otra fuerte evidencia de que la extinción no resulta en el desaprendizaje es
el fenómeno de renovación identificado por Mark Bouton y sus colegas
(Bouton y Woods, 2008). La renovación se refiere a la recuperación de la adquisición.
rendimiento cuando las señales contextuales que estaban presentes durante la extinción son
cambió. El cambio puede ser un regreso al contexto de la adquisición original o un
cambiar a un contexto "neutral". La renovación es particularmente problemática para el comportamiento.
terapia porque significa que los miedos irracionales que se extinguen en el contexto
de la oficina de un terapeuta puede regresar cuando el cliente se va a otro lugar. Similar,
un mal hábito de drogas que se extingue en un centro de tratamiento residencial puede ser
Renovado cuando el cliente regresa a casa.
El efecto de renovación se descubrió durante el curso de la investigación sobre transferencia
de entrenamiento (Bouton, 1993). La pregunta básica en estos estudios era cómo aprender
que ocurre en una situación se transfiere a otras circunstancias o contextos. Para
Por ejemplo, si aprende algo en un dormitorio ruidoso, ¿ese aprendizaje
¿Transfiere a un aula tranquila en la que tienes que hacer un examen? Un igualmente
cuestión importante se refiere a la transferencia de la extinción. Si se lleva a cabo la extinción
en una situación para que el CS ya no provoque una respuesta en ese contexto,
la CS también es ineficaz para provocar la RC en otras situaciones?
La investigación sobre el efecto de renovación se realizó originalmente con laboratorios
ratas, pero el fenómeno se ha extendido desde entonces a los participantes humanos
(Vervliet, Baeyens, Van den Bergh y Hermans, 2013). Un esquema
La representación de los resultados de un experimento de renovación se presenta en la Figura 10.2.
En la primera fase del experimento, los participantes recibieron capacitación de adquisición en
un lugar en particular, denominado Contexto A. El contexto A puede ser un experimento
cámara o habitación que se distingue por un nivel particular de iluminación, olor y
piso. Como era de esperar, la respuesta condicionada aumenta durante la
fase de adquisición. Luego, los participantes se mueven a otro experimento
Página 202
cámara (Contexto B), en la que la iluminación, el olor y el suelo son diferentes.

La extinción se lleva a cabo en este contexto alternativo. Como es habitual, respondiendo
disminuye con repetidos ensayos de extinción. Al final del experimento, el
Los participantes vuelven al Contexto A para ver si los efectos de la extinción
llevado a cabo en el Contexto B transferir de nuevo al Contexto A.
FIGURA 10.2
Ilustración del efecto de renovación. Los participantes adquieren originalmente la respuesta condicionada
en el contexto A. Luego reciben entrenamiento de extinción en el contexto B, lo que resulta en un
declive de la respuesta condicionada. En la tercera fase, se devuelven al contexto A
para las pruebas. La respuesta condicionada se "renueva" cuando los participantes vuelven a
Contexto A. Los datos son hipotéticos.
Si la extinción implica el desaprendizaje de una respuesta condicionada (RC), entonces

devolver a los participantes al Contexto A después de la extinción en el Contexto B no debería
resultar en la recuperación de la conducta condicionada. Contrariamente a esa predicción,
la respuesta se restablece cuando los participantes vuelven al contexto A. Al igual que con
recuperación espontánea, es posible que la restauración del rendimiento no sea completa. Pero
incluso el retorno parcial de la respuesta condicionada indica que la extinción en
El contexto B no se transfiere completamente al contexto de entrenamiento original. Bastante,
La respuesta condicionada se "renueva" al regresar al contexto del original.
capacitación.
El efecto de renovación se produce porque el recuerdo de la extinción es específico de
las señales que estuvieron presentes durante la fase de extinción. Por lo tanto, un cambio de distancia
Página 203
del contexto de extinción interrumpe la recuperación del recuerdo de la extinción,

con el resultado de que el comportamiento de extinción ya no es evidente. Pero por qué debería
este comportamiento de restauración característico de la adquisición original? Para dar cuenta de eso,
hay que hacer la suposición adicional de que el rendimiento de la adquisición original
se generaliza de un contexto a otro más fácilmente que la extinción
rendimiento. De hecho, este es el caso. Observe que en la figura 10.2, Participantes
respondieron tan vigorosamente al comienzo de la fase de extinción en el Contexto B como
tenía al final de la fase de adquisición en el contexto A. Esto ilustra que un cambio
en contexto no interrumpe el desempeño de la adquisición. Solo interrumpe la extinción
rendimiento.
¿Por qué la adquisición original se ve mínimamente interrumpida (si es que lo hace) por un
cambio de contexto, mientras que el desempeño de la extinción es muy específico del contexto?
Bouton (1993, 1994) sugirió que las señales contextuales sirven para eliminar la ambigüedad
importancia de un CS. Esta función es similar a la función del contexto semántico
en desambigar el significado de una palabra. Considere la palabra corte. Cortar podría referirse
al procedimiento físico de crear dos piezas, como en "El chef cortó las zanahorias".
Alternativamente, podría referirse a eliminar a un jugador de un equipo, como en "Johnny fue
cortado del equipo después del primer juego ". El significado de la palabra cortar depende de
el contexto semántico.
Conducir el condicionamiento excitador y luego la extinción con un CS hace que el
CS ambiguo porque el CS podría significar una (adquisición) estadounidense inminente o
la ausencia de Estados Unidos (extinción). Esta ambigüedad hace que el CS sea más
susceptible de control contextual. Después del entrenamiento de adquisición solo, el CS no es
ambiguo porque solo significa una cosa (entrega inminente en EE. UU.). Tal
Por lo tanto, CS no es tan susceptible al control contextual como uno que ha sido sometido
tanto adquisición como extinción.
El efecto de renovación tiene importantes implicaciones para la terapia conductual y
lamentablemente, estas implicaciones son bastante preocupantes. Sugiere que incluso si un
El procedimiento terapéutico es eficaz para extinguir un miedo patológico o una fobia.
en la relativa seguridad del consultorio de un terapeuta, el miedo condicionado puede regresar cuando
el cliente encuentra el miedo CS en un contexto diferente. Igualmente problemático es
que los efectos del condicionamiento excitador se generalizan fácilmente de un contexto a otro.
otro (ver Figura 10.2). Así, si adquieres un miedo patológico en una
situación, es probable que ese miedo lo atormente en una variedad de otros lugares. Pero si tu
superar su miedo en un entorno o contexto particular, este beneficio no
generalizar con la misma facilidad. El efecto de renovación significa que los problemas creados por
es probable que el condicionamiento sea mucho más generalizado que las soluciones o
Página 204
remedios para esos problemas. (Para un análisis más detallado de las implicaciones de la
efecto de renovación para la terapia conductual, ver Bouton, 2014).
RESTABLECIMIENTO DE LA EXCITACIÓN ACONDICIONADA

Otro procedimiento que sirve para restablecer la respuesta a un CS extinguido es
llamado reinstalación . El fenómeno de la reinstalación se ilustra en la Figura 10.3.
La primera fase incluye emparejamientos CS-EE. UU., Que dan como resultado la adquisición de un
CR pavloviano. A esto le siguen las presentaciones de CS solo y la extinción del
CR. Una vez que la respuesta ha disminuido en extinción, el participante está expuesto a
Estados Unidos por sí mismo. Esta presentación solo en EE. UU. Da como resultado la recuperación de excitadores
respondiendo a la CS. La recuperación inducida por EE. UU. De responder a la CS es
llamado reinstalación.
FIGURA 10.3
Ilustración del efecto de reinstalación. Después del entrenamiento de adquisición y extinción, los sujetos
recibir exposiciones al estímulo incondicionado (EE. UU.) solo. Esto es seguido por
pruebas de respuesta al estímulo condicionado (CS). Las presentaciones solo en EE. UU.
producir recuperación en respuesta a la CS. Los datos son hipotéticos.
Considere, por ejemplo, aprender a tener aversión a las papas fritas porque tiene
enfermo en un viaje después de comer patatas fritas. Entonces tu aversión se extingue por
Página 205
mordisqueando papas fritas sin enfermarse en varias ocasiones. De hecho,

en realidad, puede recuperar el placer de las papas fritas debido a esto
experiencia de extinción. El fenómeno de la reinstalación sugiere que si
si se enfermara de nuevo por alguna razón, su aversión a las papas fritas
Regrese incluso si su enfermedad no fue causada por lo que comió. (Para un análogo
estudio con ratas de laboratorio, ver Schachtman, Brown y Miller, 1985.)
Al igual que con la renovación, la reinstalación es un fenómeno problemático para el comportamiento.
terapia. La terapia conductual a menudo implica tratar de que los clientes dejen de hacer
cosas que les resultan problemáticas. La extinción es una técnica eficaz para
Reducir el comportamiento. Sin embargo, debido a la reinstalación, las respuestas que son
extinguido con éxito durante el curso de la intervención terapéutica puede repetirse
si el individuo vuelve a encontrarse con EE. UU. Por ejemplo, la reinstalación ha sido
desarrollado como modelo para la recaída después del tratamiento por adicción a las drogas (Bossert,
Marchant, Calu y Shaham, 2013). El tratamiento por adicción a las drogas generalmente incluye
un componente de extinción que sirve para extinguir las señales que provocan ansias de drogas.
La extinción de estas señales también reduce las respuestas instrumentales involucradas en la
adquisición y consumo de la droga. Sin embargo, un encuentro "libre" con el
fármaco puede revertir estos beneficios terapéuticos a través del fenómeno de
reinstalación.
Mejora del rendimiento de la extinción

Los fenómenos de recuperación espontánea, renovación y reinstalación muestran que
La respuesta condicionada no se elimina mediante procedimientos de extinción, pero puede
recuperarse en diversas circunstancias. Esto se debe a que la extinción no
eliminar los mecanismos que generan la conducta condicionada. Por ejemplo,
Los procedimientos de extinción no eliminan el estímulo-resultado (S – O) y la respuesta–
asociaciones de resultados (R – O) (Delamater, 2012; Rescorla, 1993). Extinción
opera estableciendo un proceso inhibitorio que suprime la respuesta
sin eliminar los procesos que originalmente fueron responsables de la
comportamiento condicionado (Bouton, Trask y Carranza-Jasso, 2016). Dado que
importancia de la extinción para la terapia conductual, un área importante de
La investigación contemporánea es encontrar formas de mejorar la inhibición de la respuesta que es
creado por procedimientos de extinción.
Una estrategia relativamente simple para mejorar la extinción es realizar más
ensayos de extinción. Aumentar el número de ensayos de extinción produce más
Página 206
supresión de la conducta condicionada en una variedad de situaciones de aprendizaje (p. ej.,
Leung, Bailey,
El intervalo Laurent
entre y Westbrook,
sucesivos 2007).
ensayos de Sin embargo,
extinción unaimportante.
también es variable relacionada, la como
Tanto básico
La investigación aplicada ha demostrado que aumentar el intervalo entre ensayos en extinción
reduce la recuperación espontánea y, por lo tanto, produce una supresión más duradera
de conducta condicionada (Tsao y Craske, 2000; Urcelay, Wheeler y Miller,
2009).
Otro procedimiento que ayuda a reducir la recuperación (o recaída) de la extinción.
es llevar a cabo la extinción en una variedad de contextos . Este procedimiento es particularmente
eficaz para reducir el efecto renovador. El efecto de renovación refleja el contexto
especificidad de la extinción: la respuesta apagada reaparece cuando los participantes
se trasladan del contexto de la extinción a otro lugar. Conduciendo
extinción en varios contextos (o ubicaciones) diferentes, la especificidad del contexto de
la extinción se puede reducir. Al igual que con el efecto de espaciamiento de ensayos, la eficacia de
Reducir la renovación llevando a cabo la extinción en múltiples contextos ha sido
confirmado en la investigación con animales de laboratorio y participantes humanos (p. ej.,
Bandarian Balooch y Neumann, 2011; Thomas, Vurbic y Novak, 2009).
Una tercera estrategia para mejorar el desempeño de extinción es sugerida por un
Análisis de recuperación de la memoria del problema de la extinción. Individuos que tienen
experimentado tanto la adquisición como la extinción tienen recuerdos en competencia que guían
Su comportamiento. El recuerdo de la adquisición estimula la respuesta condicionada,
mientras que el recuerdo de la extinción desalienta la respuesta. Este analisis
sugiere que el rendimiento de extinción puede mejorarse proporcionando un recordatorio
señales de extinción (Laborda y Miller, 2012). Un tono o una luz que está presente.
sólo durante la extinción, las pruebas pueden llegar a servir como un recordatorio de la extinción.
La presentación de un estímulo de este tipo se puede utilizar para activar la memoria de
extinción.
Se ha descubierto que presentar un recordatorio de extinción reduce
recuperación espontánea y el efecto de renovación en una variedad de experimentos
situaciones (Brooks, 2000; Brooks & Bouton, 1993). Señales de recordatorio para la extinción
También se ha descubierto que mejoran la eficacia de la terapia de exposición. Para
Por ejemplo, en un estudio de terapia de exposición por miedo a las arañas, los participantes que
se animó a pensar en el contexto del tratamiento mostró mucho menos miedo en
situaciones novedosas que los participantes que no recibieron esta activación de memoria
instrucción (Mystkowski, Craske, Echiverri y Labus, 2006).
La última estrategia para mejorar el desempeño de extinción que describo es
basado en investigaciones recientes que indican que los recuerdos no son permanentes, pero pueden ser
Página 207
actualizado a través de un proceso llamado reconsolidación. Investigaciones recientes han demostrado

que los recuerdos consolidados no son rígidos ni permanentes. Más bien, la activación de
un recuerdo lo devuelve a un estado maleable y flexible en el que puede ser alterado
antes de que sea devuelto o reconsolidado en una forma a largo plazo (Alberini &
LeDoux, 2013). (Tengo más que decir sobre la actualización o reconsolidación de la memoria
en Capítulo 14.)
Si los recuerdos reactivados son susceptibles de cambiar antes de ser
reconsolidación, podríamos diseñar procedimientos de extinción que produzcan
cambios más permanentes en cómo se recuerda una CS. Esta línea de pensamiento llevó
a la predicción de que la extinción inicial puede mejorar la eficacia a largo plazo de
procedimientos de extinción. Un ensayo de priming consiste en presentar un
CS condicionado para activar la memoria del condicionamiento (memoria que el CS
será seguido por EE. UU.). Una vez activada la memoria de adquisición,
se vuelve susceptible al cambio. Por tanto, realizar una serie de ensayos de extinción
en este punto debería crear una nueva memoria (que el CS no esté emparejado con los EE. UU.),
y esta nueva memoria debe ser la que se consolide y se
almacenado permanentemente.
Estas consideraciones sugieren que los procedimientos de extinción serían más
efectivas si fueran precedidas por una prueba de cebado que devuelva la memoria de
acondicionamiento a una forma flexible. Esta predicción se ha confirmado en la investigación.
con participantes humanos y ratas de laboratorio en estudios de extinción de
miedo condicionado (Monfils, Cowansage, Klann y LeDoux, 2009; Schiller et al.,
2010). En estos experimentos se utilizó un procedimiento de extinción estándar. los
La sesión de extinción fue precedida por una sola prueba de CS para activar el miedo
memoria y moverlo a un estado flexible en el que sea susceptible a
modificación antes de ser reconsolidado. Realización de la extinción después
la reactivación de la memoria del miedo con un solo ensayo de CS se extinguió
más duradero, como lo demuestran los niveles reducidos de recuperación espontánea,
renovación y reinstalación. Sin embargo, este efecto se produjo solo si el cebado
El ensayo de CS solo se presentó 10 minutos o 1 hora antes de la sesión de extinción.
Si la prueba de cebado precedió a la sesión de extinción en 6 horas, no hay mejora
de extinción se observó, presumiblemente porque al final de las 6 horas, el
La ventana de reconsolidación ya no estaba abierta.
Estudios iniciales que muestran que el cebado o la reactivación de un CR puede mejorar la
Los efectos de la extinción fueron intrigantes y estimularon numerosas actividades de seguimiento.
experimentos con animales de laboratorio y participantes humanos. El original
Los hallazgos se han replicado, pero no todos los esfuerzos para mejorar la extinción con un
Página 208
Los tratamientos de reactivación han tenido éxito (Auber, Tedesco, Jones, Monfils y
Chiamulera, 2013). No obstante, los resultados albergan la esperanza de que la preparación y
Se pueden desarrollar manipulaciones de reactivación que aumentarán la efectividad.
de la terapia de exposición en el tratamiento de fobias y miedos inadaptados.
La traducción clínica exitosa de la investigación básica requerirá aprender más
sobre las condiciones de frontera del efecto de cebado de extinción (Kroes, Schiller,
LeDoux y Phelps, 2016).
Efectos de recompensa "paradójicos" en la extinción

Como señalé anteriormente, la extinción no degrada las asociaciones S – O y R – O sino
ocurre debido al establecimiento de un nuevo proceso inhibitorio de respuesta. Qué
¿Causa esa inhibición de la respuesta? ¿Por qué debería inhibir el no reforzamiento
respondiendo? Al responder a esta pregunta, es importante tener en cuenta que
La extinción implica un tipo especial de no reforzamiento, a saber,
no reforzamiento después de una historia de reforzamiento. No refuerzo sin
tal historia previa no es extinción sino más bien como habituación. Esto es un
distinción importante porque la ausencia de un reforzador positivo es aversiva
sólo después de una historia de reforzamiento.
Los efectos emocionales del no reforzamiento dependen críticamente de la
historia previa del individuo. Si tu pareja nunca te hizo café por la mañana,
no te decepcionará si el café no está listo cuando te levantes. Si tu
nunca recibió una mesada, no se sentirá decepcionado si no recibe
uno. Es solo la omisión de una recompensa esperada lo que crea decepción o
frustración. Se presume que estos efectos emocionales juegan un papel crítico en la
Disminución del comportamiento que se produce en la extinción.
Como mencioné al comienzo de este capítulo, la extinción implica tanto
efectos conductuales y emocionales. La reacción emocional, técnicamente llamada
frustración , surge de la frustración que ocurre cuando un reforzador esperado es
no disponible. El no refuerzo frente a la expectativa de recompensa es
se supone que desencadena una reacción frustrante aversiva incondicionada (Amsel, 1958).
Esta emoción aversiva sirve para desalentar la respuesta durante el transcurso de
extinción a través del establecimiento de un proceso que inhibe condicionado
responder (Rescorla, 2001).
Si la disminución de la respuesta en extinción se debe a los efectos frustrantes de
la inesperada ausencia de refuerzo, entonces uno esperaría más rápido
Página 209
extinción después del entrenamiento que establece mayores expectativas de recompensa. Este es
de hecho es el caso y ha dado lugar a una serie de efectos de recompensa paradójicos .
Los efectos de recompensa paradójicos no llaman mucho la atención en la actualidad.
investigación, pero son comunes en la experiencia diaria y es importante considerar
en aplicaciones de principios de reforzamiento en varios entornos (p. ej., niños
crianza).
EFECTO DE EXTINCIÓN DEL SOBRE ENTRENAMIENTO

Uno de los efectos de recompensa paradójicos implica los efectos de extensas
formación reforzada sobre la extinción posterior. Proporcionar más formación con
el refuerzo aumenta la expectativa de recompensa. Por eso, cuando
se introduce la extinción, los efectos frustrantes de la falta de refuerzo también serán
mayor que. Si la disminución de la respuesta en extinción se debe a los efectos frustrantes
sin recompensa, el entrenamiento de refuerzo más extenso debería producir más rápido
extinción. Esta predicción ha sido confirmada (ver Figura 10.4 ) y se llama
efecto de extinción del sobreentrenamiento (Ishida & Papini, 1997).
FIGURA 10.4
Ilustración del efecto de extinción por sobreentrenamiento. Durante la adquisición, dos grupos reciben
refuerzo continuo para realizar una respuesta instrumental. El sobreentrenamiento
el grupo se entrena hasta que alcanza la asíntota, y luego el entrenamiento continúa para
Página 210
el grupo se entrena hasta que alcanza la asíntota, y luego el entrenamiento continúa para
Ensayos. Por el contrario, el grupo de control se entrena solo hasta que alcanza la asíntota. Ambos
los grupos luego reciben pruebas de extinción. Responder declina más rápidamente para el
grupo sobreentrenado que para el grupo de control. Los datos son hipotéticos.
El efecto de extinción del sobreentrenamiento es "paradójico" porque implica menos

respuestas en extinción después de un entrenamiento de refuerzo más extenso. Pensando
casualmente, uno podría suponer que un entrenamiento de refuerzo más extenso
crear una respuesta “más fuerte”, una que sea más resistente a la extinción. Pero, de hecho,
ocurre lo contrario, especialmente cuando la formación implica una formación continua
reforzamiento. Cuanto más te acostumbras a recibir refuerzos,
más rápidamente se rendirá ante la falta de refuerzo.
MAGNITUD DEL REFUERZO EFECTO EXTINCIÓN

Otro efecto de recompensa paradójico que refleja mecanismos similares es el
efecto de extinción de magnitud de refuerzo . Este fenómeno refleja el hecho
que la respuesta disminuye más rápidamente en la extinción después del refuerzo con un
reforzador más grande (ver Figura 10.5), especialmente si la formación implica una
refuerzo (Hulse, 1958; Wagner, 1961). La magnitud del refuerzo
El efecto de extinción también se explica fácilmente en términos de los efectos frustrantes de
sin recompensa. La falta de refuerzo tiende a ser más frustrante si el individuo ha
llegar a esperar una gran recompensa que si el individuo espera una pequeña recompensa.
Considere dos escenarios: en uno, recibe $ 300 por mes de sus padres
para ayudar con gastos imprevistos en la universidad; en el otro, recibe solo $ 50 por
mes. En ambos casos, sus padres suspenden los pagos cuando abandona
escuela por un semestre. Esta falta de refuerzo será más aversiva si tuvieras
llegar a esperar la mayor asignación mensual.
FIGURA 10.5
Página 211
Ilustración del efecto de extinción de magnitud de recompensa. Durante la fase de adquisición, uno
grupo de participantes se refuerza (en un programa de refuerzo continuo) con un pequeño
recompensa (S), mientras que otro grupo se refuerza con una recompensa grande (L). Ambos grupos entonces
recibir juicios de extinción. Durante la fase de extinción, la respuesta disminuye más rápidamente para el grupo.
L que para el grupo S. Los datos son hipotéticos.
Sobre la base de una simple aplicación de la ley de efecto de Thorndike, uno podría
predecir que proporcionar un reforzador más grande para cada ocurrencia de un instrumento
La respuesta creará una asociación S-R más fuerte y, por lo tanto, producirá más
respuesta persistente en extinción. La magnitud de la extinción del refuerzo.
El efecto nos dice que el resultado será todo lo contrario. Aumentando el tamaño y
La frecuencia del reforzador lleva a los participantes a dejar de intentarlo más rápidamente.
cuando se encuentran con fallas o falta de refuerzo. Como con el sobreentrenamiento
efecto de extinción, la magnitud del efecto de extinción de refuerzo es más
prominente después de un refuerzo continuo en lugar de intermitente.
EFECTO DE EXTINCIÓN DEL REFUERZO PARCIAL

Un factor clave que determina el vigor tanto del comportamiento como del emocional.
efectos de un procedimiento de extinción es el programa de refuerzo que está en
efecto antes de que se introduzca la extinción. Varias características sutiles de refuerzo.
Los horarios pueden influir en la persistencia del comportamiento durante la extinción.
Sin embargo, la característica de horario dominante que determina los efectos de extinción
es si la respuesta instrumental se refuerza cada vez que ocurre
( refuerzo continuo ) o solo algunas de las veces que ocurre ( intermitente o
refuerzo parcial ). El hallazgo general es que la extinción es mucho más lenta y
Página 212
implica menos reacciones de frustración si el refuerzo parcial en lugar de

El refuerzo continuo estaba en vigor antes de la introducción de la extinción.
procedimiento (ver Figura 10.6). Este fenómeno se denomina parcial-
efecto de extinción de refuerzo (PREE; ver Horsley, Osborne, Norman y Wells,
2012, para un ejemplo humano reciente). El PREE es el más extenso
investigó el efecto de recompensa paradójico.
FIGURA 10.6
Ilustración del efecto de extinción por refuerzo parcial. Durante la fase de adquisición,
un grupo de participantes recibe refuerzo continuo (CRF), mientras que otro
el grupo recibe refuerzo parcial (PRF). Luego, ambos grupos reciben entrenamiento de extinción.
Durante la fase de extinción, la respuesta disminuye más rápidamente para el grupo CRF que para el
Grupo PRF. Los datos son hipotéticos.
La persistencia en responder que es creada por el refuerzo intermitente.

puede ser notable. Los jugadores habituales son esclavos del refuerzo intermitente.
Las ganancias ocasionales les animan a seguir apostando durante largas series.
de pérdidas o incumplimiento. El refuerzo intermitente también puede tener
Consecuencias indeseables en la crianza de los hijos. Considere, por ejemplo, un niño que viaja en un
carrito de la compra mientras el padre está comprando. El niño le pide al padre que compre un
pedazo de caramelo. El padre dice que no. El niño pregunta una y otra vez y luego
comienza a tener una rabieta porque el padre sigue diciendo que no. En esto
punto, es probable que el padre ceda para evitar la vergüenza pública. Por finalmente
comprando el caramelo, el padre habrá proporcionado un refuerzo intermitente para
Página 213
las repetidas demandas de dulces. El padre también habrá reforzado la

comportamiento de rabieta. El refuerzo intermitente de las solicitudes de dulces
Aumentar la persistencia del niño en pedir dulces durante futuras compras.
MECANISMOS DEL REFUERZO PARCIAL

EFECTO DE EXTINCIÓN
Quizás la explicación más obvia del PREE es que la introducción de
La extinción es más fácil de detectar después de un refuerzo continuo que después de una
reforzamiento. Si no recibe el reforzador después de cada respuesta durante
entrenamiento, es posible que no se dé cuenta de inmediato cuando se omiten los reforzadores
en conjunto durante la extinción. La ausencia de refuerzo es presumiblemente mucho
más fácil de detectar después de un refuerzo continuo. Esta explicación del PREE es
llamada hipótesis de discriminación .
Aunque la hipótesis de discriminación tiene sentido intuitivamente, el PREE es
no tan sencillo. En una ingeniosa prueba de la hipótesis de discriminación,
Jenkins (1962) y Theios (1962) entrenaron por primera vez a un grupo de animales con
refuerzo y otro con refuerzo continuo. Ambos grupos entonces
recibió una fase de refuerzo continuo antes de que se introdujera la extinción
(ver Tabla 10.1). Porque el procedimiento de extinción se introdujo de inmediato
después del entrenamiento de refuerzo continuo para ambos grupos, la extinción debería haber
ha sido igualmente notable o discriminable para ambos. Sin embargo, los participantes que
inicialmente recibieron entrenamiento de refuerzo parcial fueron más lentos para extinguir su
comportamiento. Estos resultados indican que la persistencia de la respuesta producida por
El refuerzo no proviene de una mayor dificultad para detectar el inicio de
extinción. Más bien, parece que los participantes aprenden algo duradero de
refuerzo parcial que se traslada a través de una fase de continuo
reforzamiento. El refuerzo parcial parece enseñar a los participantes a no darse por vencidos
la cara del fracaso, y esta persistencia aprendida se conserva incluso si
posteriormente experimente una serie ininterrumpida de éxitos.
TABLA 10.1
Diseño del experimento Jenkins / Theios para probar la discriminación
Hipótesis
Página 214
¿Qué aprenden los participantes durante el refuerzo parcial que los hace
más persistente ante una racha de mala suerte o fracaso? Numeroso
Se han realizado experimentos complicados para responder a esta pregunta. Estas
los estudios indican que el refuerzo parcial promueve la persistencia de dos maneras.
Una explicación, la teoría de la frustración , se basa en lo que las personas aprenden sobre la
efectos emocionales de la no recompensa durante el entrenamiento de refuerzo parcial. El otro
explicación, teoría secuencial , se basa en lo que los individuos aprenden sobre el
recuerdo de la no recompensa.
Teoría de la frustración
Según la teoría de la frustración, la persistencia en la extinción resulta del aprendizaje
algo inusual, es decir, continuar respondiendo cuando espera ser
no reforzado o frustrado (Amsel, 1992; Papini, 2003). Teoría de la frustración
asume que el refuerzo intermitente resulta en aprender a responder en la cara
del incumplimiento esperado. Sin embargo, este aprendizaje requiere una considerable
cantidad de experiencia con el refuerzo intermitente.
La teoría de la frustración caracteriza el aprendizaje que ocurre durante el curso de
refuerzo intermitente en términos de etapas (ver Figura 10.1). Parcial
El refuerzo implica ensayos recompensados y no recompensados. Ensayos recompensados
llevan a los individuos a esperar un refuerzo, mientras que los ensayos no recompensados los llevan a
esperar la ausencia de recompensa. En consecuencia, el refuerzo intermitente conduce
que los individuos esperen recompensa y no recompensa. Al principio, la expectativa de
recompensa anima a los participantes a responder, mientras que la expectativa de
la falta de recompensa desalienta la respuesta. Por lo tanto, al comienzo del entrenamiento, las personas que reciben
Los refuerzos intermitentes están en conflicto sobre qué hacer. Sus expectativas
Fomentar tendencias de respuesta opuestas. Sin embargo, a medida que continúa el entrenamiento, este
el conflicto se resuelve a favor de responder.
Página 215
ANEXO 10.1
Etapas de adquisición en la teoría de la frustración
Refuerzo parcial
Etapa I. Expectativa de recompensa → Responder
Expectativa de no recompensa → No responda
Estadio II. Expectativa de recompensa → Responder
Expectativa de no recompensa → Responder
Refuerzo continuo
Etapa I. Expectativa de recompensa → Responder
Estadio II. Expectativa de recompensa → Responder
La resolución del conflicto se produce porque en el típico

programa de refuerzo, el refuerzo no es predecible. por lo tanto, el
La respuesta instrumental termina reforzándose en algunos de los ensayos cuando la
participante no esperaba recompensa. Como resultado de tales episodios, el instrumental
la respuesta se condiciona a la expectativa de no recompensa. De acuerdo a
teoría de la frustración, esta es la clave para una respuesta persistente en la extinción. Con
entrenamiento suficiente, el refuerzo intermitente da como resultado el aprendizaje para hacer
respuesta instrumental en previsión de la falta de recompensa. En cierto sentido, intermitente
el refuerzo nos enseña a seguir adelante frente al fracaso anticipado. Una vez
la respuesta se ha condicionado a la expectativa de no recompensa,
la respuesta persiste cuando se introduce la extinción.
Por el contrario, no hay nada sobre la experiencia de continuo
refuerzo que anima a las personas a responder cuando esperan
sin recompensa. Con el refuerzo continuo, uno solo aprende a esperar recompensa y
para hacer la respuesta instrumental cuando se activa esta expectativa de recompensa.
El refuerzo continuo no enseña a los participantes a hacer lo instrumental
respuesta cuando no esperan recompensa y, por lo tanto, no produce
persistencia en extinción.
Teoría secuencial
La teoría secuencial fue propuesta por Capaldi (1967, 1971) y se basa en gran medida en
ideas que involucran la memoria. Asume que los individuos pueden recordar si
fueron reforzados para realizar la respuesta instrumental en el pasado reciente.
Recuerdan tanto los ensayos recientemente recompensados como los no recompensados. los
La teoría asume además que durante el entrenamiento de refuerzo intermitente, la
Página 216
el recuerdo de la falta de recompensa se convierte en una señal para realizar la respuesta instrumental.
Según la teoría secuencial, esto produce persistencia en extinción. Precisamente
cómo sucede esto depende en gran medida de la secuencia de recompensa (R) y
ensayos sin recompensa (N) que se administran en el refuerzo intermitente
calendario. Por eso la teoría se etiqueta como secuencial .
Considere la siguiente secuencia de ensayos: RNNRRNR. En esta secuencia el
El participante es recompensado en la primera prueba, no recompensado en las siguientes dos pruebas, luego
recompensado dos veces, luego no recompensado, y luego recompensado de nuevo. El cuarto y ultimo
Los ensayos son críticos en este programa y, por lo tanto, están subrayados. En el cuarto
prueba, el participante se refuerza después de recibir no recompensa en los dos anteriores
Ensayos. Se supone que el participante recuerda los dos ensayos sin recompensa.
cuando se refuerza en la cuarta prueba. Por eso, el recuerdo de dos
Los ensayos sin recompensa se convierten en una señal para responder. Respondiendo ante la
El recuerdo de la falta de recompensa se refuerza de nuevo en la última prueba. En este ensayo, el
El participante es reforzado por responder durante la memoria de un no premiado.
prueba. Después de suficientes experiencias como estas, el participante aprende a responder
siempre que recuerde no haberse reforzado en los ensayos anteriores. Esta
el aprendizaje crea la persistencia de la respuesta instrumental en extinción.
Algunos han considerado que la teoría de la frustración y la teoría secuencial compiten
explicaciones del PREE. Dado que los dos mecanismos se propusieron originalmente,
sin embargo, se ha obtenido un gran e impresionante cuerpo de evidencia en apoyo de
de cada teoría. Por lo tanto, es inapropiado considerar una teoría como correcta y
el otro como incorrecto. Más bien, las dos teorías identifican dos formas en las que las
el refuerzo puede promover la persistencia. Los mecanismos de memoria pueden hacer más
una contribución cuando las pruebas de entrenamiento no están separadas por largos intervalos entre pruebas
(reduciendo así la dificultad de recordar el resultado de la anterior
prueba). En contraste, el aprendizaje emocional descrito por la teoría de la frustración es menos
sensible a los intervalos entre ensayos y, por lo tanto, proporciona una mejor explicación de la
PREE cuando se utilizan ensayos de entrenamiento muy espaciados. Sin embargo, el prudente
La conclusión es que ambos mecanismos contribuyen a la persistencia en la mayoría de situaciones.
En la terapia de exposición para fobias y miedos inadaptados, la persistencia de
responder en extinción se considera un mal resultado. Sin embargo, la persistencia en
el rostro del no reforzamiento es un rasgo envidiable en muchas otras áreas de la vida.
Los jugadores de béisbol exitosos tienen que seguir haciendo swing en los lanzamientos a pesar de que
golpean la pelota menos de un tercio de las veces. Éxito en los negocios, la ciencia y
la política a menudo surge de la perseverancia ante los repetidos fracasos.
Página 217
Resumen
Los procedimientos de refuerzo no siempre son permanentes. El estudio de la extinción
nos dice qué sucede cuando una respuesta ya no se refuerza o una CS no es
más tiempo emparejado con un EE. UU. La extinción produce dos cambios de comportamiento importantes:
una disminución en el CR y un aumento en la variabilidad de la respuesta. Estos cambios
Dependen de las circunstancias previas de refuerzo. El sobreentrenamiento y el
El uso de un reforzador más grande produce disminuciones más rápidas en la respuesta durante
extinción, especialmente con refuerzo continuo. Por el contrario, parcial o
El refuerzo intermitente ralentiza la disminución de la respuesta.
La disminución en la respuesta que ocurre con la extinción puede parecerse a la
opuesto a la adquisición, pero fenómenos como la recuperación espontánea, la renovación,
y el restablecimiento indican que la extinción no borra los efectos de
formación de adquisición. La extinción tampoco borra las asociaciones R – O y S – O.
Más bien, la extinción implica el aprendizaje de un proceso de inhibición de respuesta basado
sobre los efectos frustrantes y aversivos de la falta de recompensa. Aunque la extinción no
no eliminan la respuesta condicionada, se producen mayores supresiones de la conducta
con repeticiones del procedimiento de extinción, espaciamiento de los juicios de extinción,
llevar a cabo la extinción en múltiples contextos, proporcionando señales que reactivan la
memoria de extinción y sesiones de preparación de extinción con un ensayo solo con CS.
Lecturas sugeridas
Amsel, A. (1992). Teoría de la frustración: un análisis del aprendizaje disposicional y
memoria. Cambridge, Inglaterra: Cambridge University Press.
Bouton, ME (2014). Por qué el cambio de comportamiento es difícil de mantener. Preventivo
Medicina , 68 , 29–36. http://dx.doi.org/10.1016/j.ypmed.2014.06.010
Capaldi, EJ (1971). Memoria y aprendizaje: un punto de vista secuencial. En WK
Honig y PHR James (Eds.), Memoria animal (págs. 115-154). Orlando, FL:
Prensa académica.
Maren, S. y Holmes, A. (2016). Estrés y miedo a la extinción.
Neuropsicofarmacología , 41 , 58–79.
http://dx.doi.org/10.1038/npp.2015.180
Todd, TP, Vurbic, D. y Bouton, ME (2014). Conductual y
Mecanismos neurobiológicos de extinción en pavloviano e instrumental.
aprendiendo. Neurobiología del aprendizaje y la memoria , 108 , 52–64.
Página 218
Términos técnicos
Refuerzo continuo
Hipótesis de discriminación
Extinción
Olvidar
Frustración
Teoría de la frustración
Asociación inhibitoria S – R
Refuerzo intermitente
Efecto de extinción de magnitud de refuerzo
Efecto de extinción por sobreentrenamiento
Efecto de recompensa paradójico
Refuerzo parcial
Efecto de extinción de refuerzo parcial
Cebado de extinción
Reinstalación
Renovación
Teoría secuencial
Página 219
Sabía usted que

¿El castigo no tiene por qué implicar dolor físico?
cuando se aplica correctamente, el castigo puede producir
supresión de la conducta en un solo ensayo?
la efectividad del castigo se reduce sustancialmente por
¿Impartir el castigo de forma intermitente o con retraso?
un castigo leve por una ofensa inicial puede inmunizar al
individuo al castigo subsiguiente?
un castigo severo por una ofensa inicial puede sensibilizar al
individuo al castigo subsiguiente?
la efectividad del castigo aumenta en gran medida por
refuerzo
El castigopositivo
facilita de la conducta
la respuesta si alternativa?
da una señal positiva.
refuerzo o si la respuesta castigada es una forma de escape
¿comportamiento?
cuando una persona castiga a otra por enojo o frustración,
los parámetros del castigo efectivo suelen ser violados,
y no se producen cambios constructivos en el comportamiento?
Al discutir el condicionamiento instrumental hasta este punto, me he basado principalmente en
Página 220
en ejemplos de refuerzo positivo, ejemplos en los que el instrumental

La respuesta da como resultado la entrega de un evento apetitivo o "agradable". Instrumental
El comportamiento también puede ser modificado por eventos aversivos o "desagradables". Quizás el
El procedimiento de control aversivo más simple es el castigo . En un procedimiento de castigo,
un evento aversivo se entrega dependiendo de la ejecución de un instrumento
respuesta. El resultado esperado o típico es la supresión del castigado.
comportamiento. Sin embargo, el grado de supresión de la respuesta depende de numerosos
factores, muchos de los cuales no son intuitivamente obvios.
El castigo es probablemente el tema más controvertido en el condicionamiento y
aprendiendo. Evoca visiones de crueldad y abuso, y es el único
procedimiento condicionante cuya aplicación está regulada por la ley. Sin embargo,
el castigo no tiene por qué implicar formas inusuales de crueldad física o dolor. A
una variedad de eventos aversivos se han utilizado eficazmente como resultados de castigo,
incluyendo reprimendas verbales, multas monetarias, colocación en un rincón de tiempo muerto o
espacio de tiempo fuera, pérdida de privilegios ganados o reforzadores positivos, deméritos, varios
procedimientos de restitución, e incluso agua nebulizada o un chorrito de jugo de limón en el
boca. Una descarga eléctrica leve se utiliza como estímulo aversivo en la investigación con animales.
porque su intensidad y duración se pueden controlar con precisión. Se usa el choque
rara vez, si es que alguna vez, con personas, y solo en circunstancias extremas.
Las preocupaciones sociales y la falta de financiación de la investigación han desalentado la investigación sobre
castigo en los últimos años, pero hemos aprendido mucho de los experimentos sobre
castigo que se llevaron a cabo anteriormente. El escenario para el debate sobre el castigo
fue establecido por Thorndike a principios del siglo XX. Thorndike (1932) afirmó que
El castigo es ineficaz para producir cambios significativos y duraderos en
comportamiento y, por lo tanto, no debe utilizarse. Sobre la base de sus propios estudios,
Skinner (1953) adoptó un punto de vista similar. Argumentó que deberíamos hacer
todos los esfuerzos para eliminar el uso del castigo en la sociedad porque el castigo es
cruel e ineficaz. Si el castigo es cruel no se puede decidir por medios
de evidencia empírica. Sin embargo, la afirmación de que el castigo es ineficaz puede
examinado experimentalmente. Contrariamente a las primeras afirmaciones de Thorndike y
Skinner, la investigación sistemática ha indicado que el castigo puede ser muy eficaz
en la supresión de la conducta, siempre que el castigo se aplique correctamente.
Castigo efectivo e ineficaz

La observación casual sugiere que Thorndike y Skinner pueden haber estado en lo cierto
Página 221
al decir que el castigo es ineficaz. Las infracciones a las leyes de tránsito son sancionadas.
por multas y otras consecuencias desagradables. Sin embargo, la gente sigue
conduzca a través de los semáforos en rojo y, a menudo, conduzca más rápido que el límite de velocidad indicado. Calificación-
niños en edad escolar regañados por un maestro por no haber completado sus deberes
no necesariamente terminan su próxima tarea a tiempo. Y un traficante de drogas
arrestado por vender cocaína o heroína es probable que vuelva a vender drogas una vez
sale de la cárcel.
En contraste con los ejemplos anteriores, el castigo a veces es notablemente
eficaz. Un niño que accidentalmente recibe una descarga eléctrica mientras juega con un
outlet nunca volverá a meter los dedos en un enchufe. Una persona que cae
y se lastima corriendo por una pasarela mojada, disminuirá la velocidad la próxima vez que
tiene que negociar la pasarela bajo la lluvia. Alguien que vuelca una canoa por
inclinarse demasiado hacia un lado será mucho más cuidadoso para no quedarse en el medio
de la canoa después de eso.
Por qué el castigo es muy eficaz para reprimir el comportamiento en algunos casos
pero no otros ha sido objeto de una extensa investigación de laboratorio, realizada
principalmente con ratas y palomas en la década de 1960 (Azrin y Holz, 1966; Church, 1969).
En este capítulo, describo los principales hallazgos de estos experimentos y relaciono
a situaciones que la gente encuentra en su vida diaria. Tenga en cuenta, sin embargo,
que los fundamentos empíricos de mis afirmaciones provienen principalmente de la investigación con
animales de laboratorio. Consideremos primero los casos en los que falla el castigo.
CUANDO FALLA EL CASTIGO

¿Por qué los conductores a menudo exceden el límite de velocidad a pesar de que el exceso de velocidad puede resultar en un
¿multa? El castigo en la aplicación de las leyes de tránsito es similar al castigo en
gran parte del sistema de justicia penal y en muchas situaciones sociales. En todos estos
casos, el castigo es administrado por un individuo en lugar de ser un
consecuencia ambiental automática de una respuesta. A diferencia de una canoa, que se inclina
automáticamente cuando alguien se inclina demasiado hacia un lado, los conductores no
obtienen automáticamente una multa cuando conducen demasiado rápido. Un oficial de policía tiene que detectar
la transgresión, y un oficial de la corte tiene que juzgar la severidad de la
infracción y decidir qué pena aplicar. Exigir a los oficiales que detecten el
respuesta para ser castigado y administrar el estímulo aversivo puede hacer
castigo ineficaz por una variedad de razones.
Una consecuencia de necesitar un oficial de policía para detectar a los que conducen a exceso de velocidad es que
los conductores no son atrapados cada vez que exceden el límite de velocidad. De hecho, el
Página 222
las posibilidades de ser atrapado son bastante escasas. Un conductor puede exceder el límite de velocidad 50
veces o más sin ser atrapado por cada vez que su velocidad es registrada por un
oficial de patrulla. Por tanto, el castigo es muy intermitente. En la rara ocasión
cuando se detecta un conductor que está acelerando, es probable que no se detecte
de inmediato, pero solo después de que haya ido demasiado rápido durante algún tiempo. Por lo tanto,
El castigo se retrasa después del inicio de la conducta dirigida a
castigo. Se producen más retrasos en el castigo porque las multas no tienen que ser
pagado de inmediato. La parte culpable suele tener una semana o dos para pagar la multa.
Las multas de tráfico también se pueden apelar, y una apelación puede demorar varios meses.
Si la apelación no tiene éxito, es probable que se imponga el castigo por la primera infracción.
bastante suave. El conductor probablemente solo tendrá que pagar una multa. Más severo
las sanciones se imponen únicamente si el conductor recibe una multa repetida por exceso de velocidad. Por lo tanto,
El castigo es inicialmente leve y aumenta en severidad solo después de repetidos
ofensas. Esta escalada gradual de la severidad del castigo es un factor fundamental.
característica de cómo se administra el castigo en nuestra sociedad. Para la mayoría de formas de
conducta ilegal, la primera o la segunda ofensa no se tratan con tanta dureza como la quinta o
sexta transgresión. Nos tomamos en serio el castigar a alguien solo después de repetidas
ofensas.
Otra razón por la que el castigo no es eficaz para desalentar el exceso de velocidad es que
Los conductores a menudo pueden saber cuándo su velocidad está a punto de ser medida por una patrulla.
oficial. En algunas ciudades, la ubicación de los puntos de control de radar se anuncia en el
radio cada mañana. La presencia de un oficial también es obvia por el
marcas distintivas de los coches patrulla. Algunos conductores tienen detectores de radar en sus
coches que señalan la presencia de una patrulla de radar. Coches patrulla y detectores de radar
proporcionar estímulos discriminativos para el castigo. Por lo tanto, el castigo es a menudo
señalado por un estímulo discriminativo. (Ver tabla 11.1 .)
TABLA 11.1
Características del castigo
Por conducir demasiado rápido Para meter los dedos en un tomacorriente
Ocurre de forma intermitente Ocurre cada vez

Demorado Inmediato
Estímulo aversivo de baja intensidad al principio Estímulo aversivo de alta intensidad cada vez
Señalado por un estímulo discriminativo No señalado
Página 223
CUANDO EL CASTIGO TIENE ÉXITO

En contraste con la ineficacia del castigo para desalentar el exceso de velocidad, ¿por qué
¿El castigo funciona tan bien para disuadir a un niño de meterse los dedos?
en una toma de corriente? Un niño que recibe una descarga eléctrica mientras juega con un tomacorriente
Es poco probable que lo vuelva a hacer nunca y, de hecho, puede desarrollar un gran miedo a las salidas.
¿Cuáles son las diferencias críticas en las contingencias de castigo involucradas en
conduciendo demasiado rápido y jugando con una toma de corriente?
Primero, el castigo ocurre consistentemente por meter los dedos en un
enchufe. Cada vez que lo hagas, te sorprenderás. Si tocas una salida
y entra en contacto con los electrodos, seguro que recibirá una descarga. los
La configuración física de la salida garantiza que se aplica el castigo.
cada vez.
En segundo lugar, el castigo es inmediato . Tan pronto como se ponga en contacto con el
electrodos, te sorprendes. No hay un elaborado proceso de detección o decisión.
involucrado para retrasar la entrega del estímulo aversivo.
En tercer lugar, el castigo es intenso por la primera transgresión . La salida no
le dará una advertencia la primera vez que toque los electrodos. La primera ofensa es
tratado con la misma severidad que el décimo. Cada vez que haces
la respuesta, obtienes un shock intenso.
Finalmente, el castigo no se limita a las ocasiones en que un oficial de policía u observador
está mirando. Por tanto, el castigo no es señalado por un estímulo discriminativo.
No hay luz ni timbre que le indique cuándo el tomacorriente estará "caliente". No importa
quién está presente en la habitación o qué más puede estar pasando, metiendo los dedos en
la salida te sorprenderá. El castigo severo e inmediato siempre está en
efecto para cada aparición de la respuesta objetivo.
Evidencia de investigación sobre el castigo

Todos los factores que caracterizan el castigo por tocar los electrodos en
Se ha descubierto que una toma de corriente es importante en la conducción cuidadosa.
investigación de laboratorio. Además, la investigación ha identificado varios factores adicionales
que determinan fuertemente la efectividad del castigo. Irónicamente, gran parte de la
La investigación se realizó bajo el liderazgo de uno de los exalumnos de Skinner,
Nathan Azrin (Azrin y Holz, 1966). Se realizaron estudios complementarios en
un programa de investigación dirigido por Church (1969). Azrin usó palomas por mucho
de su investigación, mientras que Church utilizó ratas de laboratorio. Contrariamente a los primeros
Página 224
afirmaciones de Thorndike y Skinner, estos experimentos demostraron que

El castigo puede ser una técnica muy eficaz para producir resultados rápidos y prolongados.
Cambios en el comportamiento a término.
CONTINGENCIA DE RESPUESTA-REFUERZO
El castigo es similar al refuerzo positivo en el sentido de que implica un
contingencia entre la respuesta instrumental y el reforzador. los
El reforzador se administra solo si el organismo ha realizado previamente el objetivo.
respuesta. La principal diferencia entre castigo y positivo
El refuerzo es que el resultado de la respuesta es más aversivo que
estímulo apetitivo.
Como ocurre con otros procedimientos de condicionamiento instrumental, una variable fundamental
en el castigo está la contingencia de respuesta-reforzador . Esto se refiere a la medida
a lo que la entrega del estímulo aversivo depende de la ocurrencia previa de la
respuesta objetivo. Si se administra un estímulo aversivo independientemente del
respuesta objetivo, el procedimiento es una forma de condicionamiento aversivo pavloviano
en lugar de castigo. Como vimos en el Capítulo 4 de este volumen, pavloviano
El condicionamiento aversivo da como resultado el condicionamiento del miedo, que resulta en
congelación y una supresión general de la conducta en curso.
Los procedimientos de castigo a veces también producen una supresión general de
comportamiento continuo. Sin embargo, este no es un resultado inevitable, y el castigo
también produce una supresión conductual específica de la respuesta objetivo (Camp,
Raymond y Church, 1967; Goodall, 1984). La especificidad del comportamiento
la supresión producida por el castigo depende de la contingencia entre los
respuesta objetivo
contingencia, y el reforzador
más específica es la aversivo.
respuestaCuanto más fuerte
de supresión sea lapor
producida respuesta-reforzador
castigo.
RESPUESTA-REFUERZO CONTIGUIDAD
Como describí anteriormente para el refuerzo positivo, la respuesta-refuerzo
La contingencia es solo un aspecto de la relación entre una respuesta instrumental
y un reforzador. Otro factor importante es el intervalo entre el objetivo
respuesta y entrega del reforzador. En un procedimiento de castigo, este es el
intervalo entre la respuesta objetivo y la consecuencia aversiva.
La contigüidad respuesta-reforzador es tan importante con el castigo como lo es
Página 225
con refuerzo positivo. El castigo es más eficaz si el aversivo

El estímulo se presenta sin demora después de la respuesta objetivo (Camp, Raymond,
E Iglesia, 1967). Si el castigo se retrasa después de la respuesta objetivo, algunos
puede ocurrir supresión de la conducta (debido al condicionamiento pavloviano de
temor). Sin embargo, la supresión de la respuesta no será específica del castigado.
respuesta y puede que no sea tan completa.
INTENSIDAD DEL ESTIMULO AVERSIVO

Como cabría sospechar, los efectos del castigo que suprimen la respuesta son
directamente relacionado con la intensidad del estímulo aversivo. Investiga con ratas y
palomas ha demostrado que las bajas intensidades de castigo sólo producen leves
supresión de la conducta. Por el contrario, las supresiones dramáticas de la conducta resultan
del uso de estímulos aversivos intensos (Azrin, 1960). Más importante aún, el
Los efectos de la intensidad del castigo dependen de la experiencia previa del participante.
experiencia con el castigo. En general, los individuos tienden a responder a una nueva
nivel de castigo de manera similar a cómo respondieron durante encuentros anteriores
con castigo.
Los efectos históricos de la exposición al castigo pueden conducir a
resultados inesperados. Considere, por ejemplo, las personas que están inicialmente expuestas
a una baja intensidad de castigo. Los estímulos aversivos débiles producen sólo leves, si
cualquiera, supresión de responder. Animales expuestos a castigos de baja intensidad
habituarse al estímulo aversivo y aprender a seguir respondiendo con poca
interrupción en su comportamiento. Esta respuesta persistente frente a leves
El castigo continúa cuando se producen intensidades más altas de estimulación aversiva.
introducido (Azrin, Holz y Hake, 1963; NE Miller, 1960). Como resultado, el
los individuos continúan respondiendo cuando aumenta la intensidad del castigo. En
En cierto sentido, la exposición a una estimulación aversiva leve sirve para inmunizar a los individuos.
contra los efectos de un castigo más intenso (ver Figura 11.1).
FIGURA 11.1
Página 226
Efectos inmunizantes de experiencias previas con castigo leve. Durante la Fase 1, un grupo
de los participantes está expuesto a un castigo leve, mientras que a otro grupo se le permite
responder sin castigo. Durante la Fase 2, ambos grupos reciben un castigo intenso.
Los datos son hipotéticos.
Curiosamente, un historial de exposición a castigos intensos puede tener el

efecto contrario. La exposición inicial a un castigo intenso puede aumentar el impacto de
castigo leve posterior (ver Figura 11.2 ). Aversivo de alta intensidad
La estimulación produce una dramática supresión de la respuesta castigada, y esta
la supresión severa de la respuesta persiste cuando la intensidad de la aversión
el estímulo se reduce posteriormente (Church, 1969). Por lo tanto, castigo leve
produce una supresión mucho más severa de la conducta en individuos que han
recibido anteriormente un castigo intenso que en las personas que no fueron
castigado previamente. La exposición a un castigo intenso sensibiliza al participante a
posterior estimulación leve aversiva.
FIGURA 11.2
Página 227
Efectos sensibilizantes de la experiencia con castigo intenso. Durante la Fase 1, un grupo de

Los participantes están expuestos a un castigo intenso mientras que a otro grupo se le permite
responder sin castigo. Durante la Fase 2, ambos grupos reciben un castigo leve.
Los datos son hipotéticos.
CASTIGO SEÑALIZADO
Algunas contingencias de castigo siempre están vigentes. Sin embargo, más comúnmente,
la contingencia del castigo solo tiene efecto en presencia de estímulos particulares,
que generalmente son proporcionados por la persona que administra el castigo
procedimiento. Si el castigo es señalado por un estímulo distintivo, el procedimiento es
llamado castigo discriminativo . Un niño, por ejemplo, puede ser reprendido por
corriendo por la sala cuando sus padres están en casa, pero no cuando ella
los abuelos están a cargo. En este caso, el castigo se señalaría mediante señales.
asociado con la presencia de los padres del niño. Los padres serían
estímulos discriminativos para el castigo.
Como puede sospechar, una niña reprendida por sus padres pero no por ella
Los abuelos evitarán correr por la sala cuando sus padres estén
casa, pero no mostrará tal moderación cuando los abuelos estén a cargo.
Los procedimientos de castigo discriminatorio dan como resultado la supresión discriminativa de
comportamiento (Dinsmoor, 1952). Responder se suprime en presencia de
el estímulo discriminativo, pero continúa sin cesar cuando el discriminativo
el estímulo está ausente.
El control discriminativo de una respuesta castigada puede resultar problemático. Un padre
puede intentar que un niño no use un lenguaje soez castigándolo cada vez que
Página 228
maldiciones. Esto puede disuadir a maldecir en presencia de los padres, pero no

Evite que el niño blasfeme con sus amigos o en la escuela. La supresión de
el lenguaje soez estará bajo control discriminativo, y el objetivo de los padres no
ser logrado.
En otros casos, el castigo discriminatorio no es problemático. Si un niño
comienza a hablar en voz alta durante un servicio religioso, es probable que reciba una reprimenda. Si
el procedimiento de castigo es efectivo, el niño dejará de hablar durante el
servicio, pero esto no le impedirá hablar con entusiasmo en otros lugares. Teniendo
la respuesta suprimida sólo bajo el control del estímulo discriminativo del
el servicio de la iglesia no es un problema.
EL CASTIGO Y LOS MECANISMOS QUE MANTENGAN EL

RESPUESTA CASTIGADA
Los procedimientos de castigo se aplican a las respuestas que ya ocurren para una
razón u otra. Normalmente, las respuestas castigadas se mantienen de alguna forma
de refuerzo positivo. Esto resulta ser muy importante porque los efectos
de castigo dependen del tipo de refuerzo y el horario de
refuerzo que respalda la respuesta objetivo.
Un niño puede hablar durante un servicio de la iglesia para llamar la atención o disfrutar del
camaradería que proviene de hablar con un amigo. Si el niño es reprendido
para hablar, la aversión de la reprimenda se opone al disfrute de
la atención y el compañerismo. El resultado del procedimiento de castigo.
depende de cómo el niño resuelva este problema de costo-beneficio. Investiga con
animales de laboratorio ha demostrado que, en general, el castigo será menos efectivo
si la respuesta objetivo se refuerza con frecuencia. El castigo es más efectivo si
la respuesta objetivo se refuerza solo de vez en cuando (Church & Raymond,
1967).
El resultado del castigo también depende del programa particular de
refuerzo positivo que mantiene la respuesta objetivo. Con variable y
programas de intervalos fijos, el castigo reduce el nivel general de respuesta pero
no cambia la distribución temporal del comportamiento (por ejemplo, Azrin y Holz,
1961). Por el contrario, si la respuesta instrumental se mantiene en una proporción fija
programa de refuerzo, el castigo tiende a aumentar el posreforzamiento
pausa (Azrin, 1959; Dardano & Sauerbrunn, 1964), con poco efecto en la proporción
correr.
Página 229
CASTIGO Y REFUERZO DE
COMPORTAMIENTO ALTERNATIVO
Como vimos en la sección anterior, el resultado de los procedimientos de castigo puede
Ser analizado en términos de los costos y beneficios relativos de realizar el objetivo.
respuesta. Este análisis de costo-beneficio involucra no solo la respuesta castigada sino
también otras actividades que el individuo pueda realizar. Una técnica poderosa para
Aumentar los efectos del castigo es proporcionar un refuerzo positivo para
algún otro comportamiento (Perry y Parke, 1975). Los padres exitosos conocen bien
este principio. Castigar a los niños en un largo viaje en automóvil por pelearse entre
en sí mismos es relativamente ineficaz si a los niños no se les da mucho más que hacer.
El castigo de las peleas es mucho más eficaz si va acompañado de una
actividad reforzada alternativa, como jugar un videojuego o ver un
película en una tableta de computadora en el automóvil.
EFECTOS PARADOXICOS DEL CASTIGO

Los factores que he descrito hasta ahora determinan en qué medida
el castigo suprimirá la respuesta objetivo. El castigo no sera muy
eficaz si la respuesta castigada se mantiene mediante un poderoso programa de
refuerzo positivo, si no hay refuerzo positivo para la alternativa
comportamiento, o si el castigo es leve, demorado e implica una respuesta débil -
contingencia reforzadora. Los parámetros de castigo débiles hacen que el castigo
ineficaz. En algunas circunstancias, el castigo puede incluso producir la
lo contrario de lo que se pretende: facilitación en lugar de supresión de la respuesta.
El castigo como señal de refuerzo positivo

La facilitación paradójica de responder puede ocurrir cuando el castigo sirve como
señal de refuerzo positivo (Holz y Azrin, 1961). Atención, por ejemplo,
es una poderosa fuente de refuerzo para los niños. Un niño puede ser ignorado por
sus padres la mayor parte del tiempo siempre y cuando no esté haciendo nada peligroso o
disruptivo. Si comienza a jugar con fósforos, recibe una severa reprimenda. Voluntad
el castigo suprime la respuesta objetivo en este caso? No es probable. Note que el
El niño recibe atención de sus padres solo después de que hace algo malo y es
siendo castigado. En estas circunstancias, el castigo puede convertirse en una señal para
atención o refuerzo positivo, con el resultado que el niño buscará
Página 230
el castigo como una forma de llamar la atención. Una de las cosas más difíciles para los padres
aprender es prestar atención a sus hijos cuando los niños no están haciendo
algo perturbador para que el castigo no se asocie con obtener
atención.
Castigo por comportamiento de escape

Los efectos paradójicos también pueden ocurrir si se aplica un castigo a una fuga.
respuesta. Una respuesta de escape sirve para terminar con un estímulo aversivo. Cuando una
respuesta termina un estímulo aversivo, aumentando así la probabilidad de
respuesta, el estímulo se llama reforzador negativo y la operación es
llamado refuerzo negativo . (Tengo más que decir sobre el refuerzo negativo
en Capítulo 12.)
El refuerzo negativo está muy restringido porque antes de que un organismo
puede poner fin a un estímulo aversivo, el estímulo aversivo debe estar presente. Por lo tanto,
una respuesta de escape siempre se realiza en presencia de un estímulo aversivo
(ver Figura 11.3). Esto hace que la presencia del estímulo aversivo sea una señal para la
respuesta de escape. El castigo de una respuesta de escape facilita más que
suprime la respuesta (p. ej., Dean y Pittman, 1991). Este efecto paradójico
ocurre porque el estímulo aversivo utilizado para castigar la respuesta es el mismo
estímulo que motivó la conducta en primer lugar. Por lo tanto, el escape
La respuesta persiste a pesar de que está siendo castigada.
FIGURA 11.3
Diagrama de un procedimiento de escape o refuerzo negativo. La respuesta de escape

ocurre durante el estímulo aversivo y resulta en su terminación.
Los efectos paradójicos del castigo no son comunes y no deberían
Página 231
animarnos a llegar a la conclusión de que el castigo produce impredecibles

resultados. Más bien, si se observa un efecto paradójico del castigo, uno debería
Examinar la situación cuidadosamente para determinar si el castigo ha llegado a
servir como una señal de refuerzo positivo. Si eso no parece probable, tal vez
la respuesta objetivo se reforzó previamente como una respuesta de escape.
¿Podemos y debemos crear una sociedad libre de

¿Castigo?
Como señalé al principio de este capítulo, tanto Thorndike como Skinner
abogaba por que no se utilizara el castigo, porque consideraban
castigo como ineficaz para producir cambios significativos y duraderos en
comportamiento. Su recomendación estuvo bien, pero su razonamiento fue incorrecto.
Los experimentos de laboratorio han demostrado que el castigo puede ser muy eficaz en
disminución del comportamiento instrumental. ¿Significa esto que debemos seguir adelante y
¿Usar el castigo siempre que estemos interesados en desalentar alguna actividad? O
¿Deberíamos trabajar para construir una sociedad completamente libre de castigos? Respuestas a estas
Las preguntas dependen en parte de lo que uno considera justo y ético.
conducta. Las cuestiones éticas están más allá del alcance de los principios del condicionamiento.
Y aprendiendo. Sin embargo, podemos considerar cómo la evidencia empírica sobre la
La efectividad del castigo puede informar las decisiones que tomamos sobre la sociedad.
usos del castigo.
Primero, ¿podemos crear un entorno libre de castigos? La respuesta a eso es
Bastante obvio. El castigo es una consecuencia inevitable de varios aspectos de la
el entorno físico y biológico en el que vivimos. Si maneja mal un
gato, el gato te arañará. Si no sostienes el vaso con firmeza mientras viertes
una jarra, se derramará y ensuciará. Si saca una olla del horno sin
un agarrador de ollas, te quemarás. Sería imposible rediseñar nuestro
medio ambiente para eliminar todas las fuentes de castigo.
Dado que el castigo no puede eliminarse por completo, ¿qué tipo de
¿Deberíamos tratar de deshacernos del castigo? ¿Sería sensato hacerlo? los
El tipo de castigo que la gente en nuestra cultura encuentra más objetable es el físico.
dolor infligido por una persona en un esfuerzo por controlar el comportamiento de otra.
Tenemos leyes contra el uso del castigo corporal en las escuelas. También tenemos
leyes contra el abuso infantil, el abuso conyugal y el abuso de ancianos. Tales leyes están justificadas
por motivos éticos y morales. ¿Tienen sentido también estas leyes a partir de la
Página 232
perspectiva de los principios empíricos del castigo? Creo que sí.

Las interacciones interpersonales que implican castigo requieren que un individuo
infligir dolor a otro. Un factor importante es la voluntad de la persona.
administrar el castigo para lastimar al receptor. Un padre puede afirmar ser
castigar a un niño por haber recibido una mala calificación en la escuela, o un esposo puede
decir que está castigando a su esposa por llegar tarde a casa. Sin embargo, si el
el castigo se relaciona a menudo con el estado emocional de la persona que
administra el castigo. Es más probable que las personas castiguen a alguien si
están frustrados y enojados. Si alguien está arremetiendo contra otra persona
de ira y frustración, los principios del castigo efectivo son probablemente los más lejanos
de su mente.
Si el castigo se administra por frustración y enojo, no es probable que
estar vinculado a una respuesta no deseada. Si una mala calificación en una tarea escolar
agrava a un padre solo cuando está frustrado y enojado, el castigo es
Probablemente sea intermitente. También es probable que ocurra un castigo frustrante con
Mucho retraso después de que se haya producido la respuesta objetivo. Un padre puede convertirse
abusivo cuando un niño trae a casa una mala boleta de calificaciones, a pesar de que las respuestas
que contribuyó a las malas calificaciones se produjo antes durante un período de semanas.
Otra desventaja es que el castigo frustrante a menudo es menor
control del estímulo discriminativo, sin que el estímulo discriminativo esté relacionado
al comportamiento castigado. Un padre puede sentirse molesto por una mala boleta de calificaciones
cuando sus recursos emocionales se ven afectados por dificultades en el trabajo,
salud o abuso de drogas. En estas circunstancias, la probabilidad de castigo
será señalado por la irritabilidad de los padres, y el niño aprenderá que puede
obtener su boleta de calificaciones firmada sin ser castigada si solo espera hasta el próximo
día o el fin de semana cuando su madre está de mejor humor.
Otro defecto del castigo frustrante es que rara vez se
acompañado de un refuerzo positivo de la conducta alternativa. Cuando un padre
castiga a un niño por irritabilidad y enojo, es probable que el padre no tenga la
presencia de ánimo para acompañar el castigo con un esfuerzo programático para
proporcionar refuerzo positivo para actividades más constructivas.
El castigo como acto de agresión y frustración viola muchas de las
parámetros de castigo efectivo y por lo tanto no produce constructivos
cambios en el comportamiento. Porque el castigo por frustración está mal relacionado con
el comportamiento específico, el castigo frustrante es abusivo y no puede justificarse
como un procedimiento sistemático de modificación de la conducta. Prohibiciones sociales contra
el uso del castigo sirve para reducir los casos de castigo que están motivados
Página 233
por la frustración y la ira en lugar de un esfuerzo programático reflexivo para promover

mejor comportamiento. (Para una discusión más detallada de los problemas relacionados con el uso de
castigo en la sociedad, ver Gershoff, 2013, 2016.)
Alternativas al castigo abusivo

El castigo abusivo no puede justificarse ni por motivos éticos ni empíricos.
Pero es probable que ocurran respuestas no deseadas en los hogares, las aulas y otros
ajustes.
¿castigo?¿Qué vamos a hacer connoellos?
Desafortunadamente, ¿Qué alternativas
hay respuestas fáciles. existen a los claro que
Ha quedado
cualquier procedimiento que se adopte para suprimir respuestas no deseadas, ese procedimiento
debe aplicarse como parte de un programa sistemático que considere no solo el
respuesta a ser suprimida, sino también las otras actividades otras fuentes de
refuerzo del cliente. Lo discutí en el capítulo 9 cómo los efectos de lo positivo
El refuerzo depende de un contexto conductual más amplio. Lo mismo es muy
mucho el caso del castigo.
SE ACABÓ EL TIEMPO
Una alternativa popular al castigo físico en entornos educativos es el tiempo:
procedimiento de salida (Hagopian, Dozier, Rooker y Jones, 2013). De hecho, muchos
las aulas tienen una silla de descanso donde un estudiante tiene que sentarse si está siendo
castigado. En un procedimiento de tiempo muerto, la consecuencia de hacer un
La respuesta no es un evento físicamente aversivo, sino un tiempo fuera de las fuentes de
reforzamiento. Un adolescente que está "castigado" durante una semana por haber tomado el
el automóvil familiar sin permiso se somete a una forma de procedimiento de tiempo muerto.
El tiempo fuera también se utiliza cuando se le dice a un niño que "vaya a su habitación" como una forma
de castigo.
Al igual que con otros procedimientos de acondicionamiento instrumental, la eficacia de
El tiempo de espera depende del retraso entre la respuesta objetivo y el tiempo de espera.
consecuencia. La efectividad del procedimiento también depende de cómo
consistentemente se aplica. Además, el tiempo muerto implica algunos
consideraciones. Para ser eficaz, el procedimiento debe resultar en una
reducción de la tasa de refuerzo positivo. Un niño que tiene muchas cosas divertidas.
hacer en su habitación no se desanimará al ser enviada a su habitación como una forma de
se acabó el tiempo.
Página 234
Otra consideración importante es la cantidad de refuerzo disponible.

antes de que se administrara el tiempo muerto en comparación con la cantidad de refuerzo
disponible en la situación de tiempo muerto. Es poco probable que el tiempo muerto reprima el comportamiento si
el individuo no está recibiendo mucho refuerzo positivo de todos modos. Un niño que es
no disfrutar de ningún aspecto de estar en un aula no experimentará una gran
pérdida de refuerzo cuando se le pone en tiempo muerto.
REFUERZO DIFERENCIAL DE OTROS COMPORTAMIENTOS

Otra alternativa al castigo abusivo es el refuerzo diferencial de otras
comportamiento (DRO). Un procedimiento de DRO implica una contingencia negativa entre un
respuesta objetivo y un reforzador. Anteriormente he hablado de que el aprendizaje
producido por una contingencia negativa en conexión con inhibitoria pavloviana
acondicionamiento. Allí la contingencia negativa estaba entre un condicionado
estímulo (CS) y un estímulo incondicionado (EE. UU.). El CS inhibitorio indicó
que Estados Unidos no ocurriría. En un procedimiento DRO, la contingencia negativa es
entre una respuesta instrumental objetivo y presentaciones de un refuerzo
estímulo. La aparición de la respuesta objetivo conduce a la omisión de la
reforzador.
En un procedimiento de DRO, el reforzador está programado para entregarse en el set
intervalos (por ejemplo, cada 30 segundos). La aparición de las causas de la respuesta objetivo
cancelación de estos reforzadores programados durante un período específico, o restablecimiento de
el intervalo entre reforzadores. Esta contingencia da como resultado la supresión del objetivo
respuesta. Porque el procedimiento de DRO implica una respuesta negativa - reforzador
contingencia y suprime la respuesta, el DRO a veces se llama negativo
castigo (Lattal, 2013).
Cancelar la asignación semanal de una adolescente porque se quedó fuera demasiado tarde
una noche es un ejemplo de un horario de DRO. La asignación se proporciona en un
regularmente. Sin embargo, la ocurrencia de una respuesta objetivo no deseada da como resultado
suspensión de la asignación por un período determinado.
DRO es diferente del procedimiento de tiempo de espera descrito en la sección anterior.
sección en varios aspectos. En un DRO, los reforzadores no se cancelan al tener el
El individuo va a una silla o sala de descanso específica. Más bien, anteriormente
Los reforzadores programados se omiten durante un cierto período de tiempo después de que el objetivo
respuesta. Otra diferencia importante es que en el procedimiento DRO los refuerzos
se proporcionan explícitamente cuando no se produce la respuesta objetivo. Por lo tanto, las actividades
además de la conducta objetivo, terminan reforzándose. Es por eso que el
Página 235
El procedimiento se llama refuerzo diferencial de otra conducta. No es asi

importa cuáles sean esos "otros" comportamientos. Porque los organismos siempre están haciendo
algo, las alternativas a la respuesta objetivo llegan a realizarse más
con frecuencia en un procedimiento de DRO (Jessel, Borrero y Becraft, 2015).
Un procedimiento de DRO es más difícil de administrar que el más común.
procedimiento de tiempo muerto porque requiere proporcionar un reforzador periódicamente cuando
la respuesta objetivo no se realiza. Para utilizar un procedimiento DRO, un conveniente
Se debe identificar el reforzador y se deben hacer arreglos para entregar el
reforzador periódicamente durante períodos prolongados de tiempo. Por lo tanto, el procedimiento DRO
requiere interactuar con el participante durante largos períodos de tiempo, incluso si el
no se produce respuesta de interés.
Resumen
En un procedimiento de castigo, se presenta un estímulo aversivo que depende de la
respuesta instrumental. El castigo es muy eficaz para reprimir al objetivo.
respuesta si se administra sin demora, a una alta intensidad desde el
comienzo, y cada vez que se da la respuesta objetivo. La efectividad de
El castigo se puede aumentar aún más proporcionando un refuerzo positivo para
actividades alternativas. La exposición a un castigo leve al principio puede resultar en
resistencia aprendida a los efectos supresores de un castigo más intenso, y
señalar el castigo puede limitar la supresión de la respuesta a la presencia del
señal. El castigo puede resultar en un aumento paradójico en la respuesta si sirve
como una señal de refuerzo positivo o si se aplica para escapar de la conducta que es
motivado aversivamente.
En la vida diaria, el uso del castigo a menudo se relaciona con el estado emocional de
la persona que administra el estímulo aversivo. Es probable que la gente use
castigo cuando están frustrados y enojados. Bajo estas circunstancias,
muchos de los parámetros del castigo efectivo son violados, con el resultado de que
no se producen cambios constructivos en el comportamiento. Problemas con el uso de
El castigo ha fomentado el uso de alternativas como el tiempo muerto y
refuerzo diferencial de otras conductas. Aplicación exitosa de cualquier
El procedimiento de supresión de respuesta requiere considerar no solo lo no deseado
respuesta, sino también otras actividades del individuo y otras fuentes de
reforzamiento.
Página 236
Lecturas sugeridas
Azrin, NH y Holz, WC (1966). Castigo. En WK Honig (Ed.), Operant
comportamiento: áreas de investigación y aplicación (págs. 380–447). Nueva York, NY:
Appleton-Century-Crofts.
Iglesia, RM (1969). Supresión de respuesta. En BA Campbell y RM
Church (Eds.), Castigo y comportamiento aversivo (págs. 111-156). Nuevo
York, Nueva York: Appleton-Century-Crofts.
Gershoff, ET (2013). Nalgadas y desarrollo infantil: ahora sabemos lo suficiente
para dejar de golpear a nuestros hijos. Perspectivas del desarrollo infantil , 7 , 113-137.
http://dx.doi.org/10.1111/cdep.12038
Jessel, J., Borrero, JC y Becraft, JL (2015). Refuerzo diferencial de
otro comportamiento aumenta el comportamiento no dirigido. Diario de comportamiento aplicado
Analysis , 48 , 402–416. http://dx.doi.org/10.1002/jaba.204
Términos técnicos
Refuerzo diferencial de otras conductas
Castigo discriminativo
Reforzamiento negativo
Castigo
Se acabó el tiempo
Página 237
Sabía usted que
la evitación es una forma de condicionamiento instrumental en el que

la respuesta instrumental impide la entrega de un
estímulo aversivo?
ninguna teoría importante asume que el comportamiento de evitación es
reforzado por la ausencia del estímulo aversivo evitado?
aunque la evitación es una forma de comportamiento instrumental,
Las teorías del aprendizaje de la evitación se basan en gran medida en conceptos de
¿Acondicionamiento pavloviano?
Se asumen varios aspectos importantes del aprendizaje de evitación.
implicar el aprendizaje de las señales temporales internas y
señales propioceptivas o de retroalimentación que acompañan al
respuesta de evitación?
El comportamiento de evitación está fuertemente determinado por el preexistente
sistema de comportamiento defensivo del organismo?
El castigo es solo una de las principales formas de condicionamiento instrumental que

implican estímulos aversivos. Otra forma de control aversivo es la evitación.
acondicionamiento. En los procedimientos de castigo, la ejecución del instrumental
La respuesta da como resultado la presentación de un estímulo aversivo. En evitación
Página 238
condicionamiento, la respuesta instrumental impide o bloquea la presentación de

el evento aversivo.
Hacemos muchas cosas que evitan que suceda algo malo. Sacar
la mano al acercarse a una puerta evita la incomodidad de entrar en un
puerta cerrada; revisar periódicamente la barbacoa evita que se quemen los hot dogs
puede estar asando a la parrilla; Reducir la velocidad durante la conducción evita una colisión con el
coche delante de ti; ponerse un abrigo evita que se enfríe cuando
salir. Todas estas son respuestas de evitación.
Porque ya he hablado de varios condicionamientos instrumentales
procedimientos, y porque las personas están muy familiarizadas con la evitación aprendiendo de
experiencia personal, uno podría suponer que los análisis del condicionamiento de evitación
sería bastante sencillo, si no evidente por sí mismo. Desafortunadamente, este no es el
caso. De hecho, el aprendizaje por evitación ha sido una de las formas más difíciles de
aprender a analizar y explicar. Debido a espinosos problemas conceptuales en
el aprendizaje de evitación, gran parte de la investigación ha sido impulsada por teóricos más bien
que consideraciones prácticas. Esto contrasta fuertemente con la investigación sobre
castigo, que ha estado dominado por consideraciones prácticas.
Preguntas dominantes en el análisis de la evitación

Aprendiendo
Los procedimientos de evasión son lo suficientemente claros: el participante realiza una
respuesta instrumental que evita la entrega de un estímulo aversivo.
Sin embargo, no está claro qué aspecto del procedimiento de evitación refuerza la
respuesta instrumental. Debido a que una respuesta de evasión exitosa evita
entrega del estímulo aversivo, se siguen respuestas de evitación exitosas
por nada. Mowrer y Lamoreaux (1942) señalaron que esto plantea una importante
pregunta teórica: ¿Cómo puede "nada" reforzar el comportamiento y producir
¿aprendiendo?
Se han ofrecido varias hipótesis y teorías para explicar cómo
“Nada” puede reforzar la respuesta de evitación. Las hipótesis y teorías
difieren de varias maneras. Sin embargo, todas las explicaciones principales rechazan la
idea de sentido común de que las respuestas de evitación ocurren porque previenen la
entrega del evento aversivo. Como veremos, una serie de ingeniosas propuestas
se han ofrecido en un esfuerzo por explicar el aprendizaje por evitación sin depender de
la idea teóricamente problemática de que "nada" es un reforzador.
Página 239
La segunda pregunta importante en el análisis de la conducta de evitación es: ¿Cómo se

¿Procesos de condicionamiento pavloviano implicados en el aprendizaje de evitación? Como tenemos
vistos, los procesos de condicionamiento pavloviano también se han discutido en análisis de
Comportamiento instrumental positivamente reforzado (ver Capítulo 7, este volumen).
Sin embargo, los conceptos de condicionamiento pavloviano no han dominado el pensamiento sobre
comportamiento instrumental positivamente reforzado tanto como han dominado
análisis del aprendizaje por evitación. Históricamente, el aprendizaje por evitación se consideraba
un caso especial de condicionamiento pavloviano. De hecho, hasta el día de hoy algunos relatos de
El aprendizaje de evitación considera el comportamiento de evitación como producto enteramente de
Mecanismos de acondicionamiento pavloviano.
Orígenes del estudio del aprendizaje por evitación

El aprendizaje de evitación fue investigado por primera vez por el científico ruso Bechterev
(1913), quien se propuso estudiar el condicionamiento del motor en lugar del glandular.
respuestas. El procedimiento que ideó Bechterev fue bastante simple. Le preguntó al humano
que los participantes coloquen un dedo sobre los electrodos metálicos que descansan sobre una mesa. Un leve
corriente podía pasar a través de los electrodos, y esto provocó un dedo
respuesta de retirada. Por lo tanto, la respuesta incondicional fue la retirada del dedo.
Para convertir la situación en una que implique condicionamiento clásico, Bechterev
presentó un breve estímulo de advertencia inmediatamente antes de la descarga en cada ensayo.
Como puede predecir, los participantes aprendieron rápidamente a levantar los dedos del
electrodos cuando se presentó el estímulo condicionado (CS), y este fue
medido como la respuesta condicionada.
Aunque Bechterev consideró que su técnica de retirada de dedos era una
forma conveniente de estudiar el condicionamiento pavloviano, una consideración más cuidadosa de
Este procedimiento muestra que, de hecho, fue un instrumento más que un pavloviano.
procedimiento. Recuerde que los electrodos descansaban sobre la superficie de una mesa; Ellos eran
no unido al dedo del participante. Por lo tanto, si el participante levantó su
dedo en respuesta a la CS, podría evitar por completo recibir una descarga. Esta
difiere de los procedimientos pavlovianos estándar, en los que la aparición de la
La respuesta condicionada no determina si el estímulo incondicionado
(EE. UU.) Se entrega. Bechterev había dado inadvertidamente el control a sus participantes
sobre la presentación de los Estados Unidos. Esto hizo que la tcnica de retirada del dedo fuera una
instrumental en lugar de un procedimiento de acondicionamiento pavloviano.
Página 240
Procedimientos contemporáneos de acondicionamiento de evitación

En la investigación contemporánea sobre la evitación se utilizan dos tipos de procedimientos
comportamiento. El procedimiento de evasión discriminada es un procedimiento de juicio discreto
que implica una señal de advertencia explícita. La evitación no discriminada
El procedimiento es un procedimiento operante libre y no implica una advertencia explícita.
estímulo.
EVITACIÓN DISCRIMINADA
Sin saberlo, Bechterev inventó lo que ha llegado a conocerse como el
procedimiento de evitación discriminado . En un procedimiento de evitación discriminado, el
La contingencia de respuesta-reforzador no siempre está en efecto. Más bien, respondiendo
previene la entrega del reforzador solo durante períodos discretos o pruebas cuando un
Se presenta CS o estímulo de advertencia. Como se ilustra en la Figura 12.1, lo que sucede
durante estos ensayos depende del comportamiento del participante. Si el participante
responde, el CS se apaga y el EE. UU. aversivo no se entrega. A diferencia de,
si el participante no responde durante la CS, la CS continúa presentándose
por su duración completa y termina con la presentación de los Estados Unidos aversivos. Por lo tanto, un
El procedimiento de evasión discriminada implica dos tipos de ensayos, ensayos de respuesta
y ensayos sin respuesta, y el EE. UU. aversivo solo ocurre en ensayos sin un
respuesta.
FIGURA 12.1
Diagrama del procedimiento de evitación discriminado o señalado. Si el organismo

responde durante la señal de advertencia o estímulo condicionado (CS), el condicionado
el estímulo se apaga y el estímulo aversivo incondicionado (EE. UU.) no se entrega. En
Por el contrario, si el organismo no responde durante la señal de advertencia o CS, el CS
Página 241
Por el contrario, si el organismo no responde durante la señal de advertencia o CS, el CS

continúa presentándose en toda su duración y termina con la presentación del aversivo
NOSOTROS.
Desde la investigación de Bechterev, el procedimiento de evitación discriminada ha sido

adaptado para su uso con animales de laboratorio. De hecho, la mayor parte de la investigación sobre el
Los mecanismos teóricos del aprendizaje de evitación se han realizado con laboratorio.
ratas. Por lo general, el EE. UU. Aversivo es una descarga eléctrica leve entregada a través de una red
suelo. El choque se utiliza porque su intensidad y duración pueden ser precisas
revisado. En algunos experimentos, se requiere que las ratas presionen una palanca de respuesta
durante una cesárea o estímulo de advertencia (una luz o tono) para evitar recibir la descarga.
Otros experimentos utilizan un aparato de caja de lanzadera en el que las ratas tienen que moverse
de un lado del aparato al otro para evitar golpes (ver Figura 12.2 ).
Cada prueba comienza con la presentación de un EC o un estímulo de advertencia (p. Ej., Una luz)
mientras la rata está a un lado del aparato. Si la rata se mueve al otro lado
antes del final de la CS, la CS se apaga y no se produce una descarga en ese
prueba. Si la rata no se mueve al otro lado antes de que termine el CS, el leve
Se aplica un choque y permanece encendido hasta que la rata escapa al otro lado.
FIGURA 12.2
Página 242
Caja lanzadera utilizada en estudios de aprendizaje por evitación. El animal tiene que cruzar de uno
compartimento al otro para evitar golpes leves a través del suelo de rejilla.
La caja de lanzadera se puede utilizar para implementar una vía unidireccional o una bidireccional
procedimiento de evitación. En un procedimiento de evasión unidireccional , el participante es
siempre colocados en el mismo compartimento al comienzo de cada prueba (por ejemplo, la izquierda
lado). Debido a que cada prueba comienza en el mismo lado (izquierda), la respuesta de evitación
Siempre implica ir en la misma dirección (de izquierda a derecha). Con este procedimiento,
el lado donde el participante comienza cada prueba es siempre potencialmente peligroso,
mientras que el otro lado siempre está a salvo. El animal nunca se sorprende en el
otro lado. Estas características hacen que la tarea de evitación unidireccional sea bastante fácil de aprender.
En un procedimiento de evasión bidireccional , las pruebas pueden comenzar en el lado izquierdo o en
el lado derecho, dependiendo del compartimento que ocupe el animal
cuándo está previsto que comience la próxima prueba. Si la rata comienza por la izquierda, debe ir a
el derecho a evitar el impacto. Si la rata comienza por la derecha, tiene que ir al lado izquierdo para
evitar el shock. Debido a que las pruebas pueden comenzar en cualquier lado, ambos lados de la caja de lanzadera
son potencialmente peligrosos. La falta de un lado seguro consistentemente hace que las dos
tarea de evitación de forma más difícil de aprender que el procedimiento unidireccional (Theios,
Lynch y Lowe, 1966).
Página 243
EVITACIÓN NO DISCRIMINADA O DE OPERACIÓN LIBRE

En los procedimientos de evitación discriminados, la respuesta es eficaz para prevenir la
estímulo aversivo sólo si la respuesta se produce durante el período de prueba, cuando el
se presenta un estímulo de advertencia. Respuestas realizadas durante el intervalo entre ensayos
no tienen ningún efecto. De hecho, los participantes pueden ser retirados del aparato.
durante el intervalo entre ensayos. En contraste con la prueba discreta tradicional
procedimientos, Sidman (1953) ideó un sistema no discriminado o libre operante
procedimiento de evitación .
El procedimiento operante libre de Sidman se desarrolló en el skinneriano u operante
tradicion. En esta tradición, los juicios no se limitan a períodos en los que un discreto
el estímulo está presente, y el participante puede repetir la respuesta instrumental en
cualquier momento. En un programa de proporción fija en un cuadro Skinner, por ejemplo, las respuestas
realizados en cualquier momento cuentan para completar el requisito de proporción. Sidman
extendió estas características de la metodología operante al estudio de la evitación
comportamiento.
En el procedimiento de evitación operante libre, un estímulo de advertencia explícito no es
utilizado, y no hay ensayos discretos. La respuesta de evitación se puede realizar
en cualquier momento, y responder siempre proporciona algún beneficio. Cambiando
el aceite de su automóvil es un ejemplo. Cambiar el aceite es una respuesta de evitación que
previene problemas del motor. Si espera hasta que se desarrollen los problemas,
encontrar reparaciones costosas. Lo mejor que puede hacer es cambiar el aceite antes de cualquier señal.
de dificultad del motor. El intervalo recomendado es cada 3,000 millas. Por lo tanto, cada
El cambio de aceite le permite obtener 3,000 millas de conducción sin problemas. Puedes cambiar el aceite
después de conducir solo 1,000 millas o conducir otras 800 millas antes del cambio de aceite.
Siempre que cambie el aceite antes de haber conducido 3,000 millas, siempre obtendrá
3,000 millas de conducción sin problemas. Cambiar el aceite de tu coche es solo uno
ejemplo de una práctica de seguridad o salud que implica hacer algo antes de las señales
de peligro son evidentes. Todos estos son ejemplos de evitación operante libre
contingencias.
En el laboratorio, los procedimientos de evitación operante libre utilizan una descarga breve que es
programado para ocurrir a intervalos establecidos. Por ejemplo, la descarga puede programarse
que ocurra cada 15 segundos en ausencia de una respuesta de evitación. Este es el
intervalo de choque-shock, o S-S intervalo . Realización de la respuesta de evitación
crea un período de seguridad, durante el cual no se administran descargas. El período seguro
puede ser de 30 segundos. Este es el intervalo respuesta-descarga, o intervalo R-S (ver
Figura 12.3). Si se produce una descarga al final del intervalo R – S o al final
Página 244
del intervalo S – S, no está precedido por una señal de advertencia explícita.
FIGURA 12.3
Diagrama de un procedimiento de evitación no discriminado o libre operante. Siempre y cuando el

animal no responde, se programa una breve descarga periódica, según lo establecido por el
intervalo choque-choque (S – S). Cada ocurrencia de la respuesta de evasión crea una
período sin choque, según lo establecido por el intervalo respuesta-choque (R-S).
Un aspecto importante de los procedimientos de evasión operante libre es que el R – S

El intervalo se restablece y comienza de nuevo cada vez que se realiza la respuesta de evasión.
Por lo tanto, si el intervalo R – S es de 30 segundos, cada respuesta restablece el intervalo R – S y
comienza de nuevo el período seguro de 30 segundos. Debido a esta característica, cada
la aparición de la respuesta de evitación proporciona algún beneficio, al igual que cada aceite
el cambio proporciona algún beneficio. Sin embargo, el grado de beneficio depende de
exactamente cuando se da la respuesta.
Si el participante responde cuando el intervalo R – S ya está en vigor, el R–
El intervalo S comenzará de nuevo y se perderá el tiempo restante en el reloj R – S. los
El beneficio neto de responder dependerá de si la respuesta ocurre temprano o
tarde en el intervalo R – S (ver Figura 12.4). Si el participante responde tarde en el
Intervalo R – S, solo perderá una pequeña cantidad de tiempo restante en el R – S
reloj, y el beneficio neto de responder será sustancial. Por el contrario, si el
participante responde temprano en el intervalo R – S, perderá mucho tiempo restante
en el reloj R – S, y el beneficio neto de responder será mucho menor. En
En cualquier caso, sin embargo, si el individuo logra responder antes del final de cada
Intervalo R – S, restablecerá todos los intervalos R – S y, por lo tanto, evitará con éxito
todos los choques.
Página 245
FIGURA 12.4
Efecto de repetir la respuesta de evitación al principio o al final de una respuesta: choque (R-S)
intervalo en un procedimiento de evitación operante libre. Los intervalos R – S están indicados por el
barras horizontales sombreadas. A la izquierda, la respuesta se repitió tarde en un intervalo R – S;
a la derecha, la respuesta se repitió al principio de un intervalo R – S. Note que el total
el tiempo sin choques es más largo si la respuesta se repite tarde en un intervalo R – S.
Teoría de la evitación de dos factores

La teoría más antigua e influyente de la evitación fue la teoría de dos factores de
aprendizaje de evitación propuesto originalmente por OH Mowrer (1947; véase también NE
Miller, 1951). La teoría de los dos factores fue la perspectiva teórica dominante
para los estudios del aprendizaje de la evitación durante gran parte del siglo XX, y sus principales
componentes siguen siendo importantes en la investigación contemporánea (por ejemplo, Maia, 2010) y
aplicación clínica (LeDoux y Gorman, 2001; van der Kolk, 2006). Según
Para la teoría de los dos factores, el aprendizaje por evitación implica tanto el aprendizaje clásico como el
procesos de condicionamiento instrumental (esos son los dos factores). Sin embargo,
Mowrer no describió ninguno de estos procesos de manera intuitiva
obvio.
Consideremos primero el componente de condicionamiento clásico. En lugar de
pensar en el condicionamiento clásico como directamente responsable de la evitación
respuesta (como pensaba Bechterev), Mowrer (1947) propuso que este proceso
resulta en el condicionamiento de un estado emocional llamado miedo. En juicios cuando el
la respuesta de evasión no ocurre, el estímulo de advertencia o CS se empareja con el
Estados Unidos aversivo, y esto da como resultado el condicionamiento del miedo al estímulo de advertencia.
El miedo condicionado es presumiblemente un estado desagradable o aversivo. Por lo tanto,
se supone que su reducción o eliminación es un refuerzo. La reducción del miedo trae
en juego el segundo proceso en la teoría de dos factores. En juicios cuando el
se hace una respuesta de evasión, la respuesta apaga el estímulo de advertencia y
Página 246
impide la entrega de los EE. UU. Se supone que apagar el estímulo de advertencia
resultado en la reducción del miedo condicionado, y se supone que esta reducción del miedo
proporcionar refuerzo para la respuesta de evitación. Por tanto, el segundo factor en la
La teoría de la evitación de dos factores es un condicionamiento instrumental de la evitación.
respuesta a través de la reducción del miedo.
Tenga en cuenta que de acuerdo con la teoría de los dos factores, el comportamiento de evitación no es
reforzado por "nada" que ocurre después de la respuesta de evitación. Más bien, el
el comportamiento se ve reforzado por la reducción del miedo. La reducción del miedo es una forma de negativo
refuerzo (eliminación de un estímulo aversivo dependiente de la conducta). los
La respuesta instrumental se considera una respuesta de escape, una respuesta que
escapa al miedo. En lugar de centrarse en el hecho de que el comportamiento de evitación previene
entrega de los Estados Unidos aversivos, la teoría de dos factores trata el comportamiento de evitación como un
caso especial de comportamiento de escape.
La teoría de los dos factores proporciona respuestas a muchas preguntas sobre la evitación.
aprendiendo. Las respuestas fueron innovadoras cuando se propusieron por primera vez y han
moldeó el curso de la investigación sobre el condicionamiento de evitación desde entonces. Según
Para la teoría, tanto los procesos pavlovianos como los instrumentales contribuyen a la evitación
aprendiendo. Además, los dos procesos son interdependientes. Antes del miedo
La reducción puede proporcionar un refuerzo instrumental para la respuesta de evitación,
El miedo primero tiene que condicionarse al estímulo de advertencia. Así, clásico
El condicionamiento del miedo es un requisito previo para el componente instrumental de los dos
teoría de los factores. El proceso instrumental depende de la integridad del pavloviano.
proceso de condicionamiento del miedo.
PRUEBAS CONSISTENTES CON LA TEORÍA DE LOS DOS FACTORES

La interdependencia de los componentes pavloviano e instrumental de los dos
La teoría de los factores tiene varias implicaciones importantes. Primero, si pavloviano condicionó el miedo
es la base del comportamiento de evitación, entonces la respuesta de evitación debería disminuir
con la extinción del miedo que se ha condicionado al estímulo de alerta
o CS. Esta predicción ha sido confirmada por numerosos estudios. En estos
experimentos, los participantes reciben exposiciones repetidas al estímulo de advertencia o
CS se presentó por sí solo después de la adquisición de la respuesta de evitación. La extincion
Los procedimientos normalmente se llevan a cabo utilizando protocolos pavlovianos estándar en los que
los participantes no pueden controlar la duración de las presentaciones de CS solo.
Pruebas posteriores de la respuesta de evitación muestran que el comportamiento de evitación es
significativamente reducido por la extinción pavloviana del miedo, con el grado de
Página 247
disminución de la respuesta determinada por la duración total de las presentaciones de CS solo

(M. Baum, 1970; Schiff, Smith y Prochaska, 1972). Estos hallazgos de laboratorio
Proporcionar la base empírica para la terapia de exposición, que es el tratamiento estándar.
para el comportamiento de evitación desadaptativo, como lavarse las manos compulsivamente.
Una segunda predicción importante de la teoría de los dos factores es que la reducción del miedo
debe ser eficaz para reforzar la conducta instrumental incluso si el miedo no fue
adquirido en un procedimiento de evitación señalizado. Esta predicción también ha sido
confirmado en numerosos estudios llamados experimentos de escape del miedo . En estos
estudios, el miedo condicionado se establece inicialmente utilizando un estándar pavloviano
procedimiento de acondicionamiento, sin un componente instrumental o de evitación. Para
Por ejemplo, un tono o una luz pueden combinarse repetidamente con una descarga
Circunstancias en las que los participantes no pueden escapar o evitar el impacto. En el
siguiente fase del experimento, el CS pavloviano se presenta en cada ensayo, pero ahora
los participantes tienen la oportunidad de terminar la CS haciendo un
respuesta instrumental (presionando una palanca de respuesta o yendo de un lado de un
caja de lanzadera a la otra). El dato de interés es el aumento de la probabilidad
de la respuesta instrumental que se produce en estas circunstancias. Tal
aumento se observa de forma rutinaria, lo que indica que la reducción del miedo es un eficaz
reforzador de la conducta instrumental (Cain & LeDoux, 2007; Esmorís-Arranz,
Pardo-Vázquez y Vázquez-García, 2003).
EVIDENCIA CONTRARIA A LA TEORÍA DE LOS DOS FACTORES

Otra implicación importante de la interdependencia de pavloviano e instrumental
procesos en la teoría de los dos factores es que el miedo condicionado y la evitación
responder debe estar altamente correlacionado. En particular, altos niveles de evitación
La respuesta debe ir acompañada de altos niveles de miedo provocados por la advertencia.
estímulo en el procedimiento de evitación. Curiosamente, esta predicción ha sido
frecuentemente refutado. A medida que aumenta la respuesta de evitación, el miedo a la advertencia
El estímulo o CS que señala el shock en realidad disminuye.
La disminución del miedo que acompaña al dominio de un procedimiento de evitación.
ha sido bien documentado en estudios con ambos animales de laboratorio (Mineka,
1979) y participantes humanos (por ejemplo, Lovibond, Saunders, Weidemann y
Mitchell, 2008). Los estudios con personas brindan una idea de por qué ocurre esto.
Los participantes humanos informan una disminución en la expectativa de shock a medida que ganan
habilidad para dar la respuesta de evasión. Una vez que sepa cómo prevenir
la conmoción, tiene pocas expectativas de que se produzca la conmoción si responde
Página 248
correctamente y, por lo tanto, su nivel de miedo disminuye.

La experiencia común también sugiere que existe poco miedo, si es que existe alguno, una vez que
la respuesta de evitación se aprende bien. Conducir un automóvil para que no se desvíe
fuera de la carretera es básicamente un comportamiento de evitación. Un conductor competente evita dejar
el automóvil se acerca demasiado al costado de la carretera o demasiado cerca de otro carril de tráfico
haciendo los ajustes de dirección adecuados. Aunque estos ajustes son
respuestas de evasión, los conductores competentes no muestran miedo mientras conducen su automóvil
condiciones normales de tráfico.
Señales temporales condicionadas en el aprendizaje de evitación

Hallazgos que son difíciles de explicar en términos de la teoría de dos factores de
la evitación ha fomentado modificaciones y adiciones a la teoría. Esfuerzos para
integrar nuevos hallazgos con la teoría a menudo ha implicado postular
estímulos y atribuir funciones importantes a estas señales internas.
La evitación no discriminada ha sido un desafío especial porque no
implican un estímulo de advertencia explícito, que juega un papel importante en el
teoría. Para superar esta dificultad, los investigadores han postulado que los
Las señales relacionadas con el paso del tiempo cumplen la función de un estímulo de advertencia en
procedimientos de evitación no discriminados (Anger, 1963).
Recuerde que en un procedimiento de evitación no discriminado, los choques ocurren en
tiempos predecibles. Los procedimientos de evasión operante libre se construyen a partir de dos
tipos de intervalos (intervalos S – S e intervalos R – S), ambos de los cuales son fijos
duración. En los intervalos S – S y R – S, el shock ocurre cuando los intervalos han
ha sido completado. Por lo tanto, el paso del tiempo predice cuándo será el próximo
se producirá un shock.
El aprendizaje de evitación operante libre se puede explicar en términos de dos factores
teoría asumiendo que los individuos usan el paso del tiempo como una señal de cuándo
ocurrirá el próximo choque. Los animales (incluidas las personas) son bastante buenos en
responder sobre la base del paso del tiempo (Church, 2012; Crystal, 2012b).
Los estímulos de tiempo se conocen como señales temporales .
Las señales temporales características del final de los intervalos S – S y R – S son
diferente de las señales temporales características del comienzo de estos intervalos. A
Primero, los participantes probablemente no distinguen entre el principio y el final de
los intervalos S – S y R – S. Sin embargo, pronto aprenden la diferencia porque
Las señales temporales tempranas y tardías tienen consecuencias diferentes. Señales temporales que
Página 249
caracterizan el comienzo de los intervalos S – S y R – S nunca se emparejan con

choque. Si ocurre una descarga, siempre ocurre al final de estos intervalos. Como un
consecuencia de este refuerzo diferencial, los participantes pueden aprender a
distinguir las señales temporales tempranas y tardías.
Las señales temporales características del final de un intervalo S – S o R – S están emparejadas
con choque y presumiblemente adquirir propiedades aversivas condicionadas. Cada
La respuesta de evitación inicia un nuevo intervalo R – S y, por lo tanto, reduce la
aversión condicionada creada por señales temporales características del fin de
los intervalos S – S y R – S (consulte la Figura 12.5 ). De esta forma, una respuesta de evitación
puede resultar en la reducción del miedo condicionado y satisfacer el instrumental
componente de la teoría de dos factores.
FIGURA 12.5
La presunta aversión condicionada de las señales temporales durante la respuesta-choque (R-S)

e intervalos choque-choque (S – S) en un procedimiento de evitación operante libre. R = ocurrencia
de la respuesta de evitación; S = ocurrencia de un choque breve. Note los bajos niveles de
aversión condicionada al comienzo de cada intervalo S – S y R – S y niveles altos
de aversión al final de estos intervalos. Cada aparición de la respuesta siempre
reduce la aversión condicionada de las señales temporales porque cada respuesta inicia una
nuevo intervalo R – S.
Aprendizaje sobre señales de seguridad y evitación
Página 250
La siguiente explicación del aprendizaje por evitación que consideramos también se basa en un
consideración de las señales internas que los participantes pueden experimentar durante el curso
del condicionamiento de evitación. Sin embargo, en lugar de centrarse en las señales que predicen
peligro, esta cuenta se centra en las señales internas que señalan la ausencia de shock o
un período de seguridad. Se supone que tal señal de seguridad es un refuerzo para
respuesta instrumental (Dinsmoor, 2001).
En un procedimiento de evasión, los períodos de seguridad se predicen mejor por el
ocurrencia de la respuesta de evitación. Después de todo, el comportamiento de evitación cancela la
entrega de un estímulo aversivo. Sabemos por biología que los movimientos de
Los músculos y articulaciones que participan en la producción de respuestas pueden dar lugar a problemas internos.
señales propioceptivas . Estas señales también se denominan señales de retroalimentación de respuesta, o simplemente
señales de retroalimentación . Las señales de retroalimentación que son producidas por una respuesta de evitación.
son seguidos por un período predecible sin los Estados Unidos aversivos, un período predecible
período de seguridad. Como vimos en el Capítulo 5, estímulos que predicen de forma fiable la
la ausencia de una ecografía puede adquirir propiedades inhibitorias condicionadas pavlovianas.
Por lo tanto, las señales de retroalimentación generadas por las respuestas de evitación también pueden adquirir
Propiedades inhibidoras condicionadas pavlovianas.
La explicación de la señal de seguridad del aprendizaje de evitación se basa en estas ideas.
De acuerdo con la hipótesis de la señal de seguridad, las señales de retroalimentación de la evitación
respuesta adquieren propiedades inhibitorias condicionadas pavlovianas y, por lo tanto,
se convierten en señales de seguridad. En una situación que implique un peligro potencial, la seguridad
se supone que las señales son de refuerzo. Según la cuenta de la señal de seguridad,
El comportamiento de evitación se ve reforzado positivamente por la seguridad inhibitoria condicionada.
señales.
Aunque el concepto de señal de seguridad es similar a la hipótesis de la señal temporal
al depender de estímulos internos al organismo, ha sido más accesible para
verificación experimental. La cuenta de la señal de seguridad ha sido evaluada por
introducir un estímulo externo (por ejemplo, un tono breve) en el momento en que el interoceptivo
se presume que ocurre una señal de retroalimentación. Es decir, se presenta un tono breve cuando el
participante realiza la respuesta de evitación. Si la hipótesis de la señal de seguridad es
correcta, tal señal exteroceptiva debe adquirir condicionada inhibitoria
propiedades. Además, estas propiedades inhibidoras condicionadas deberían hacer que el
Los estímulos de retroalimentación son efectivos como reforzador positivo de la conducta instrumental.
Ambas predicciones han sido confirmadas (p. Ej., Cándido, González y de
Brugada, 2004; Morris, 1974, 1975). (Para un estudio de refuerzo de señales de seguridad
con participantes humanos, ver Angelakis y Austin, 2015.)
Una predicción menos obvia es que el aprendizaje de evitación debería ser facilitado por
Página 251
aumentando la relevancia de las señales de retroalimentación de señales de seguridad. De acuerdo con esto
predicción, la introducción de un estímulo de retroalimentación de respuesta externa (que es
presumiblemente más prominente que las señales propioceptivas internas) sustancialmente
facilita el aprendizaje de evitación (p. ej., D'Amato, Fazzaro y Etkin, 1968).
El proceso de la señal de seguridad no es incompatible con la teoría de dos factores de
evitación y no necesita ser visto como una alternativa a esa teoría. Bastante,
El refuerzo positivo a través de una señal de seguridad inhibitoria condicionada puede ser
considerado un tercer factor en el aprendizaje de evitación que opera en combinación con
condicionamiento clásico del miedo y refuerzo instrumental a través del miedo
reducción.
Extinción de la conducta de evitación

La extinción es bastante simple después de un refuerzo positivo: permites que la
que ocurra una respuesta instrumental, pero ya no presentas el reforzador. los
El resultado común es una disminución sustancial en la respuesta. La situación es
considerablemente más complicado después del acondicionamiento de evitación. Un enfoque para
la extinción del comportamiento de evitación es simplemente apagar el aparato de choque
que proporcionó los Estados Unidos aversivos durante el entrenamiento de evitación. Desafortunadamente, solo
apagar la fuente de la descarga rara vez funciona para extinguir la evasión
respondiendo. Los investigadores descubrieron desde el principio que la respuesta de evitación puede
persisten durante cientos de pruebas después de que se desactiva el aparato de choque (Solomon,
Kamin y Wynne, 1953). ¿Por qué pasa eso?
Como mencioné anteriormente, hay dos fuentes de refuerzo para la
respuesta de evitación. Uno es la reducción del miedo condicionado que ocurre cuando
la respuesta de evasión termina la señal de advertencia o CS. La segunda fuente
del refuerzo proviene de las propiedades inhibitorias condicionadas de la respuesta
señales de retroalimentación que señalan un período libre de conmociones. Ninguna de estas fuentes de
El refuerzo se elimina cuando la fuente de choque se desactiva después de evitarlo.
acondicionamiento.
Eliminar la reducción del miedo como fuente de refuerzo para la evitación.
comportamiento, tenemos que extinguir el miedo condicionado que es provocado por el
estímulo de advertencia o CS. Eso se puede lograr proporcionando repetidas
exposiciones a la CS se presentan solas. Sin embargo, los participantes no pueden ser
permitido terminar el CS. Las personas altamente capacitadas tienden a responder rápidamente
para apagar el estímulo de advertencia. Si se les permite hacer eso, no
Página 252
recibir suficiente exposición al estímulo de advertencia para extinguir gran parte del
miedo condicionado. Por lo tanto, bloquear la respuesta de evasión es con frecuencia una
componente requerido de la extinción del miedo después del entrenamiento de evitación (M. Baum, 1970).
En estudios con participantes humanos, el bloqueo de la respuesta de evitación provoca una
retorno del miedo y retorno de la expectativa de shock (Lovibond et al., 2008).
Sin duda, esto hace que la ausencia de shock sea más notoria y, por lo tanto, facilita
extinción.
Se proporciona la segunda fuente de refuerzo para la respuesta de evitación.
por las propiedades de la señal de seguridad de las señales de retroalimentación de respuesta. Tal señal de seguridad
las propiedades son mucho más difíciles de extinguir que el miedo condicionado. La seguridad
Las señales son esencialmente estímulos inhibidores condicionados. Desafortunadamente, sabemos
mucho menos sobre la extinción de la inhibición condicionada de lo que sabemos sobre
extinción de estímulos excitadores condicionados. Como señalé en el Capítulo 6,
presentando repetidamente un inhibidor condicionado o una señal de seguridad por sí mismo (sin un
EE.UU.) no extingue sus propiedades inhibitorias (Witcher & Ayres, 1984;
Zimmer-Hart y Rescorla, 1974). Otra complicación es que no tenemos
acceso directo a las señales de retroalimentación de respuesta que sirven como señales de seguridad en
aprendizaje de evitación. Debido a que estas señales son producidas por el participante
comportamiento, no están disponibles para el control experimental directo.
Otra estrategia para extinguir la respuesta de evitación es cambiar el
procedimiento para que la respuesta de evasión ya no impida la aversión de EE. UU.
Desafortunadamente, tal procedimiento mantendrá el miedo condicionado a la advertencia
estímulo, y como hemos visto, esta es una fuerte fuente de motivación para
evitación responder. Las dificultades para extinguir la conducta de evitación proporcionan
un desafío continuo para la terapia conductual.
Evitación del aprendizaje y defensiva incondicionada

Comportamiento
Como señalé en el Capítulo 2 , los procedimientos de aprendizaje no operan en una tabula rasa sino
se superponen a las tendencias de comportamiento preexistentes de un organismo,
tendencias que un organismo aporta a la situación de aprendizaje. Respuestas aprendidas
son el producto de una interacción entre los procedimientos de acondicionamiento utilizados y
estructura de comportamiento preexistente del organismo. La teoría de los dos factores y la seguridad
Los mecanismos de señal de evitación que describí anteriormente se basan en una vista simple
de lo que un organismo aporta a una situación de condicionamiento aversivo. Estos aprendizajes
Página 253
Los mecanismos solo requieren que un estímulo sea aversivo. Dado un incondicionado
estímulo aversivo, el miedo puede condicionarse a una señal que predice la
evento aversivo, la seguridad puede estar condicionada a una señal que predice la ausencia
del evento aversivo, y la reducción del miedo y la seguridad pueden servir como reforzadores para
cualquier respuesta instrumental.
REACCIONES DE DEFENSA ESPECÍFICAS DE ESPECIE

Resulta que las tendencias conductuales preexistentes que los organismos llevan a un
situaciones de condicionamiento de evitación son mucho más complejas de lo que acabo de
descrito. La exposición a un evento aversivo activa un rico repertorio conductual
que ha evolucionado para permitir a los organismos hacer frente al peligro de forma rápida y
efectivamente. Bolles (1970) señaló que un animal perseguido por un depredador
debe evitar el peligro con éxito la primera vez porque de lo contrario puede no ser
vivo para una segunda o tercera prueba. Las situaciones peligrosas requieren un afrontamiento eficaz
sin mucha práctica, por lo que Bolles sugirió que los organismos responden a
situaciones aversivas con una jerarquía de respuestas defensivas incondicionadas, que
él llamó reacciones de defensa específicas de especie (SSDR).
Los SSDR son respuestas como congelación, huida y lucha. Bolles
sugirió que qué SSDR particular ocurre depende de la naturaleza del
estímulo aversivo y las oportunidades de respuesta que brinda el entorno. Si
se dispone de un medio de escape familiar y eficaz, es más probable que el animal
intenta huir cuando encuentra el estímulo aversivo. Sin un escape familiar
ruta, la congelación será la respuesta defensiva predominante. En situaciones sociales,
puede predominar la lucha.
Debido a que los SSDR son provocados por las presentaciones iniciales de un
estímulo, dominan el comportamiento del organismo durante las primeras etapas
entrenamiento de evitación. Esto dificulta el uso de acondicionamiento aversivo.
procedimientos para condicionar respuestas que no están relacionadas con un SSDR. Corriendo para
ejemplo, es más compatible con SSDR que la cría. No es de extrañar, entonces,
que es mucho más fácil acondicionar a una rata para evitar el impacto corriendo que criándola
sobre sus patas traseras (Bolles, 1969).
EL CONTINUO DE LA INMINENCIA DEPREDATORIA

El concepto de SSDR alentó a los investigadores a considerar con mayor detalle la
estructura del sistema de comportamiento defensivo que se activa en aversivo
Página 254
situaciones condicionantes. Estas consideraciones llevaron a la idea de que los

Los comportamientos defensivos dependen no solo de si un estímulo aversivo es
encontrado sino la probabilidad o inminencia del encuentro. Los animales hacen uno
cosa cuando perciben una baja probabilidad de lesión o ataque y otras cosas
cuando la probabilidad de lesión es mayor. Variaciones en las respuestas defensivas
que son provocados por diferentes grados de peligro percibido constituyen el depredador
continuo de inminencia (Perusini y Fanselow, 2015; Rau y Fanselow, 2007).
El continuo de la inminencia depredadora se ha investigado más ampliamente
en ratas de laboratorio (Fanselow, 1994). Las ratas son presas de halcones y serpientes.
Se activan diferentes modos de comportamiento defensivo dependiendo del comportamiento de la rata.
probabilidad percibida de lesión (ver Figura 12.6 ). La respuesta previa al encuentro
El modo se activa si, durante el curso de su búsqueda, una rata deambula por un área
donde hay alguna posibilidad de encontrar una serpiente, pero la serpiente aún no ha sido
encontrado. En el modo de pre-encuentro, la rata puede moverse a un área más segura. Si un
no se dispone de un área más segura, la rata se volverá más cautelosa en su búsqueda de alimento. Eso
se aventurará a salir de su madriguera con menos frecuencia y comerá comidas más abundantes cuando lo haga.
salir (Fanselow, Lester y Helmstetter, 1988).
FIGURA 12.6
El continuo de la inminencia depredadora. Diferentes modos de comportamiento defensivo son

activado en diferentes niveles de inminencia depredadora. El modo pre-encuentro representa
el comportamiento defensivo de un animal antes de que se encuentre con un depredador. El depredador-
El modo de encuentro representa un comportamiento defensivo después de que el animal ha encontrado un
depredador. El modo de contacto con el depredador representa su comportamiento después de que el depredador ha
contacto físico.
Si las respuestas defensivas previas al encuentro no tienen éxito y la rata

encuentra la serpiente, se activará el modo de respuesta de encuentro con depredador. En
Página 255
En el modo de encuentro con depredador, la congelación es la respuesta predominante. Finalmente, si

este comportamiento defensivo tampoco tiene éxito y la serpiente ataca a la rata, la
Se activará el modo de respuesta de contacto de depredador. En el modo de contacto con el depredador,
la rata saltará repentinamente en el aire y atacará a la serpiente. A esto se le llama
circa respuesta a la huelga (ver Figura 12.6 ).
Un encuentro con el shock en un estudio de laboratorio activa el nivel más alto de
inminencia depredadora, el modo de respuesta depredador-contacto. El estímulo de advertencia
que ocurre antes de que los Estados Unidos aversivos activen el modo de encuentro con depredador.
Por lo tanto, podemos esperar respuestas como la congelación que son características de
el modo de encuentro depredador para desarrollar estímulos que se asocian con
un Estados Unidos aversivo. Por el contrario, las señales de seguridad deben provocar recuperaciones y
respuestas de relajación porque señalan la ausencia total de un depredador potencial.
Estas consideraciones ilustran que incluso cuando los organismos aprenden sobre una
situación, su comportamiento está fuertemente influenciado por la organización preexistente de
su sistema de comportamiento defensivo.
Resumen
Los estudios del aprendizaje de evitación se originaron en estudios de condicionamiento clásico y
se basó en métodos de prueba discreta en los que una señal de advertencia terminaba en una breve descarga
a menos que se haya hecho la respuesta de evasión. Posteriormente, evitación operante libre
Se desarrollaron procedimientos que no utilizaban señales de advertencia explícitas. A pesar de todo
qué método se utiliza, sin embargo, el aprendizaje por evitación es desconcertante porque la
La consecuencia de una respuesta de evitación es que no sucede nada. ¿Cómo puedo
¿“Nada” motiva el aprendizaje o refuerza una respuesta?
La primera gran explicación del aprendizaje por evitación, la teoría de los dos factores,
asumió que el comportamiento de evitación es el resultado de una interacción dinámica entre
condicionamiento clásico e instrumental. El condicionamiento clásico ocurre cuando el
El participante no logra dar la respuesta de evasión y la señal de advertencia es
seguido por los aversivos Estados Unidos. Por otro lado, el condicionamiento instrumental
ocurre cuando se da la respuesta de evasión porque esto termina la advertencia
señal y reduce el miedo condicionado. La investigación posterior identificó una tercera
factor, aprendizaje de señales de seguridad, que también contribuye al aprendizaje de evitación. Señales
que acompañan a la omisión de los EE. UU. en un procedimiento de evitación se convierten en seguridad
señales o inhibidores condicionados del miedo y proporcionan un refuerzo positivo para
la respuesta de evitación.
Página 256
Gran parte de la evidencia experimental sobre el aprendizaje por evitación es compatible

con la teoría de dos factores complementada por el aprendizaje de señales de seguridad, especialmente
cuando se tienen en cuenta las señales temporales y propioceptivas. Estas
Los mecanismos son difíciles de cambiar, creando problemas inusuales para los intentos de
extinguir la evitación respondiendo. Otra fuente de complicación en el estudio de
el aprendizaje de evitación es que los organismos (humanos y no humanos) han desarrollado una rica
Repertorio conductual defensivo incondicionado para hacer frente a eventos aversivos. los
La opinión actual es que los SSDR no condicionados están organizados por depredadores
inminencia, con diferentes modos de respuesta defensiva activados por diferentes niveles
del peligro percibido por un ataque depredador. Un relato completo de la evasión
El aprendizaje tiene que explicar cómo un procedimiento particular de condicionamiento de evitación
se integra en el sistema de comportamiento defensivo del organismo.
Lecturas sugeridas
32. http://dx.doi.org/10.1037/0033-295X.108.1.4
Cain, CK y LeDoux, JE (2007). Escape from fear: un comportamiento detallado
análisis de dos respuestas atípicas reforzadas por la terminación de CS. Diario de
Psicología experimental: procesos de comportamiento animal , 33 , 451-463.
http://dx.doi.org/10.1037/0097-7403.33.4.451
Dinsmoor, JA (2001). Estímulos inevitablemente generados por conductas que evitan
Las descargas eléctricas son inherentemente reforzadoras. Diario de lo experimental
Analysis of Behavior , 75 , 311–333. http://dx.doi.org/10.1901/jeab.2001.75-
311
Krypotos, A.-M., Effting, M., Kindt, M. y Beckers, T. (2015). Evitación
aprendizaje: Revisión de modelos teóricos y desarrollos recientes. Fronteras
en Conductual neurociencia , 9, Artículo 189.
http://dx.doi.org/10.3389/fnbeh.2015.00189
Perusini, JN y Fanselow, MS (2015). Perspectivas conductuales sobre el
distinción entre miedo y ansiedad. Aprendizaje y memoria , 22 , 417–425.
http://dx.doi.org/10.1101/lm.039180.115
Términos técnicos
Página 257
Estímulo aversivo
Evitación discriminada
Señal de retroalimentación
Evitación operante libre
Reforzamiento negativo
Evitación no discriminada
Evitación unidireccional
Inminencia depredadora
Señal propioceptiva
Intervalo R – S
Intervalo S – S
Señal de seguridad
Caja de transporte
Respuesta de defensa específica de la especie
SSDR
Señales temporales
Teoría de dos factores
Evitación bidireccional
Página 258
Sabía usted que

La respuesta diferencial se utiliza para identificar el control del comportamiento.
por un estímulo particular?
incluso los estímulos simples tienen muchas características o dimensiones?
control de la conducta por un estímulo de entrenamiento a menudo
generaliza a otros estímulos similares?
La generalización de estímulos y la discriminación de estímulos son
conceptos complementarios?
generalización del comportamiento de un estímulo a otro
depende del historial de entrenamiento del individuo con los estímulos?
El entrenamiento en discriminación produce respuestas diferenciales y
aumenta la precisión del control de estímulos?
El entrenamiento de equivalencia conduce a responder de la misma manera.
a estímulos físicamente diferentes?
El aprendizaje de palabras y conceptos perceptivos implica un
interacción entre aprender a discriminar y aprender a
¿generalizar?
A lo largo de este libro, hemos visto varios aspectos del comportamiento que son
controlado por estímulos antecedentes o eventos ambientales. Comportamiento provocado y
Página 259
responder que los resultados del condicionamiento pavloviano son ejemplos obvios.
La conducta instrumental también se puede considerar como una respuesta que ocurre debido a
la presencia de un estímulo antecedente. Como vimos en el capítulo 7 , un antecedente
El estímulo puede activar la respuesta instrumental directamente o puede activar un
representación de la relación respuesta-reforzador.
El control adecuado de los estímulos es una característica fundamental de los
comportamiento. Abrazar a alguien es una respuesta instrumental apropiada y es
reforzado por la aprobación social si el individuo es un amigo personal o familiar cercano
miembro. Abrazar a extraños no es apropiado y puede hacer que te abofetee
cara. Que un maestro abrace a un estudiante también puede ser inapropiado y puede resultar en
cese del puesto docente. Estos ejemplos ilustran que si un
La respuesta instrumental se refuerza depende de la situación en la que el
ocurre la respuesta. Sacar una barra de chocolate del estante y ponerla en su bolsillo es
está bien en su propia casa, pero podría acusarlo de robar si hace lo mismo
cosa en la tienda de la esquina.
Claramente, gran parte de la conducta aprendida ocurre debido a la presencia de
estímulos particulares o eventos ambientales. Hasta este punto, sin embargo, nuestro
La discusión sobre el aprendizaje ha dejado dos cuestiones críticas sobre el control de estímulos de
comportamiento sin respuesta. El primero se refiere a la medición del control de estímulos:
¿Cómo podemos determinar si un estímulo o característica específica del entorno
es responsable de una respuesta en particular y qué tan estrechamente está el comportamiento vinculado a
esa característica de estímulo? Una vez que sepamos cómo medir las diferencias de estímulo
control, podemos abordar la segunda cuestión, que se refiere a los determinantes de
control de estímulos. ¿Qué factores determinan qué estímulos ganarán control sobre un
respuesta particular y el grado o precisión del control del estímulo que se
¿logrado?
Medición del control de estímulos

Las preguntas sobre el control de estímulos surgen en parte debido a la complejidad de
eventos ambientales. Incluso algo tan simple como un semáforo es un complejo
estímulo con múltiples características. La luz roja en un semáforo tiene una función específica.
color, brillo, forma y posición. ¿Cómo averiguamos cuál de estos
características de estímulo es fundamental para controlar el comportamiento de un conductor, y qué
hace que esas características sean críticas? Una vez que se ha identificado una característica de estímulo, ¿cómo
¿Calculamos el grado de precisión involucrado en el control de la conducta por
Página 260
esa característica de estímulo?

La estrategia fundamental para determinar si una respuesta está controlada
por un estímulo particular es ver si las variaciones en ese estímulo producen
correspondientes cambios en la respuesta. Se dice que una respuesta está bajo control
de un estímulo particular si la respuesta se ve alterada por cambios en ese estímulo . A
El cambio en la respuesta relacionado con los cambios en un estímulo se llama diferencial.
respondiendo . Podemos identificar qué característica de estímulo es responsable del objetivo
comportamiento al ver si los cambios en esa característica de estímulo causan cambios en
respondiendo.
Los semáforos suelen estar dispuestos en forma vertical, con la luz roja en la parte superior.
y la luz verde en la parte inferior (ver Figura 13.1 ). ¿Qué característica es importante?
el color de la luz o su posición? ¿Se detienen los conductores cuando ven una luz roja?
¿Se detienen cuando se enciende la luz de arriba? Para determinar si el color
en lugar de que la posición sea importante en los semáforos, tenemos que probar el rojo y el verde
luces presentadas en la misma posición. Para determinar si la posición más bien
que el color es importante, tenemos que probar luces del mismo color en diferentes
posiciones.
FIGURA 13.1
Características de estímulo de los semáforos. Las luces difieren tanto en color como en posición.
Cuando variamos una característica de un estímulo mientras mantenemos todas las demás constantes,
estamos probando la importancia de una dimensión de estímulo particular para el comportamiento
en cuestión. Diferentes dimensiones de estímulo pueden ser importantes para diferentes
Página 261
conductores. Los conductores daltónicos deben concentrarse en la posición del

luz iluminada. Algunos otros conductores responden principalmente al color del tráfico.
luces. Otros probablemente responden tanto al color como a la posición del
luz. Por lo tanto, pueden producirse diferencias individuales sustanciales en el control de estímulos en
la misma situación.
Determinar si una característica de estímulo en particular es importante es la primera
paso en el análisis del control de estímulos. También nos puede interesar cómo
precisamente, el comportamiento está sintonizado con una característica de estímulo particular. Continuando con
el ejemplo del semáforo, supongamos que un conductor se detiene cada vez que ve una luz roja
semáforo. ¿Qué tono de rojo tiene que ser la luz? Para responder a esto
pregunta, tendríamos que probar el controlador con una gama de colores, incluyendo
varios tonos de rojo.
La longitud de onda de la luz roja se encuentra en el extremo más largo del espectro visual. Más corta
Las longitudes de onda de la luz aparecen menos rojas y más anaranjadas. Como la longitud de onda
se vuelve aún más corta, la luz parece cada vez más amarilla. Una prueba detallada de
El control de estímulos por diferentes colores requiere la presentación sistemática de luces de
diferentes longitudes de onda.
GRADIENTES DE GENERALIZACIÓN DEL ESTÍMULO

Pueden ocurrir varios resultados si una variedad de colores de prueba que van desde el rojo intenso hasta
Se presentan de color amarillo intenso. Si el conductor estuviera prestando mucha atención a
color, se detendría solo si la luz tuviera un color rojo perfecto. Luces con un tinte
de naranja no haría que el conductor se detuviera. Esta posibilidad está ilustrada por
Curva A en la figura 13.2. En el otro extremo, el conductor puede detenerse cuando ve
cualquier color que tenga incluso una vaga semejanza con el rojo. Esta posibilidad se ilustra
por la curva C en la figura 13.2 . La curva B muestra un resultado intermedio.
En estepero
color, caso,
la el comportamiento
respuesta deltan
no se limita conductor muestraa una
estrechamente sensibilidad
un tono considerable
particular a las
de rojo como en diferencias en
Curva A.
FIGURA 13.2
Página 262
Gradientes de generalización de estímulos hipotéticos que indican diferentes grados de control de

respondiendo con el color de un estímulo. La curva A ilustra el control de estímulo más fuerte mediante
color; La curva C ilustra el control de estímulo más débil por color.
Cada una de las curvas de la Figura 13.2 es un gradiente de generalización de estímulos . Nosotros
Encontré previamente el concepto de generalización de estímulos en conexión
con habituación (ver Figura 3.3). Se pueden obtener gradientes de generalización para
cualquier característica de estímulo: posición del estímulo, tamaño, brillo, forma, altura, etc.
adelante. Como figura 13.2 ilustra, los gradientes pueden ser muy pronunciados (Curva A) o
bastante superficial (curva C). La inclinación o pendiente del gradiente de generalización.
indica qué tan de cerca el comportamiento está controlado por la característica de estímulo que se
probado. Un gradiente de generalización pronunciado indica un fuerte control por parte del estímulo
característica o dimensión. Un gradiente de generalización plano o poco profundo indica débil
control de estímulos.
Página 263
FIGURA 13.3
Un hipotético gradiente de generalización para responder a estímulos de diferentes colores. Puntos 1

y 2 ilustran el fenómeno de la generalización de estímulos. Los puntos 1 y 3 ilustran la
Fenómeno de discriminación de estímulos.
GENERALIZACIÓN DEL ESTÍMULO Y ESTÍMULO

DISCRIMINACIÓN
Los gradientes de generalización de estímulos implican dos fenómenos importantes:
generalización y discriminación. En la generalización de estímulos , la respuesta que
ocurre con un estímulo también se observa cuando se presenta un estímulo diferente.
Puntos 1 y 2 en la Figura 13.3 ilustrar el fenómeno del estímulo
generalización. El comportamiento que ocurrió en el Punto 1 también ocurrió en el Punto 2, o
generalizado al punto 2. La generalización de la respuesta significa una respuesta similar
a diferentes estímulos.
La discriminación de estímulos es lo opuesto a la generalización de estímulos. Aquí
los cambios en un estímulo dan como resultado diferentes niveles de respuesta. Puntos 1 y 3 en
Figura 13.3 ilustrar el fenómeno de la discriminación de estímulos. Más
la respuesta ocurrió al estímulo en el Punto 1 que al estímulo en el Punto 3.
Así, el participante discriminó o distinguió entre los puntos 1 y 3.
Página 264
Responder en el punto 1 no se generalizó al punto 3.

La generalización y la discriminación son fenómenos complementarios. Un gran
trato de generalización entre estímulos significa que el participante responde a la
de la misma manera a estos estímulos, y por lo tanto hay poca discriminación. En contraste, un
gran cantidad de discriminación entre los estímulos significa que el participante es
responder de manera diferente a los estímulos y, por lo tanto, hay poca generalización
entre ellos.
CONCEPCIONES CONTRASTADAS DE ESTÍMULO

GENERALIZACIÓN
¿Por qué los individuos responden de manera similar a diferentes estímulos? Por que lo hacen
generalizar de un estímulo a otro? Pavlov favoreció un efecto de propagación
interpretación. Según esta idea, las respuestas condicionadas a un estímulo
generalizar a otras señales porque los efectos del entrenamiento se extienden desde el original
estímulo de entrenamiento a otros estímulos similares. Cuando un niño aprende por primera vez la palabra para
vaca, es probable que use la palabra vaca no solo cuando ve una vaca, sino también
cuando ve un toro, y tal vez incluso un caballo. Según la propagación de
interpretación del efecto, tal generalización se produce porque los toros y los caballos son
similar a las vacas, y la respuesta aprendida a las vacas se extiende a otros similares
animales.
La interpretación de la propagación del efecto fue cuestionada por Lashley y Wade
(1946), quien propuso que los organismos responden de manera similar a diferentes estímulos
porque no han aprendido a distinguir entre ellos. De acuerdo a esto
hipótesis, un niño usará la palabra vaca cuando vea vacas, toros y caballos
porque todavía no ha aprendido a distinguir entre estos animales. los
La hipótesis de Lashley-Wade sugiere que la generalización de estímulos puede ser limitada
mediante la formación adecuada. Describo evidencia que confirma esta predicción cuando
describir los factores de aprendizaje que determinan el grado de control de estímulos más adelante en
Este capítulo. Antes de llegar a eso, sin embargo, consideremos cómo las características de un
el estímulo y las características del organismo determinan el control del estímulo.
Determinantes del control de estímulos: sensorial y

Variables motivacionales
CAPACIDAD SENSORIAL
Página 265
Quizás el factor más obvio que determina si un estímulo particular

La característica que influirá en el comportamiento es la capacidad sensorial del organismo. Un
El organismo no puede responder a un estímulo si carece de los órganos de los sentidos necesarios para
detectar el estímulo. Las personas no pueden responder a las ondas de radio, ultravioleta.
luz, y suena por encima de unos 20.000 ciclos por segundo (cps) porque carecen
los órganos de los sentidos para detectar tales estímulos. Los perros pueden escuchar sonidos de muchas
frecuencia más alta que los seres humanos y, por lo tanto, son capaces de responder a
ultrasonidos que son inaudibles para las personas.
La capacidad sensorial establece un límite en los tipos de estímulos que pueden llegar a controlar
el comportamiento de un organismo. Sin embargo, la capacidad sensorial es simplemente una condición previa para
control de estímulos. No asegura que el comportamiento sea influenciado por un
característica de estímulo particular. Las personas con un sentido del olfato normal tienen la
capacidad para distinguir el aroma de varios vinos tintos diferentes. Sin embargo, para
alguien que rara vez bebe vino, todos los vinos tintos pueden oler bastante parecido.
ORIENTACIÓN SENSORIAL
Otro requisito previo para el control de estímulos es la orientación sensorial del
organismo. Para que un estímulo obtenga el control sobre algún aspecto de la
comportamiento, el estímulo debe ser accesible al órgano sensorial relevante. Sonidos
y los niveles generales de iluminación repartidos por todo el entorno. Por lo tanto,
Es probable que tales estímulos se encuentren ya sea que el individuo esté o no
orientado hacia la fuente del estímulo. Por esta razón, los tonos y la sobrecarga
las luces son estímulos populares en los experimentos de aprendizaje. En contraste, una visual localizada
La señal puede presentar un problema porque solo se ve si el individuo se enfrenta
hacia esto. Si está atento a las señales de tráfico en el lado derecho de una carretera,
puede pasar por alto un letrero colocado en el lado izquierdo.
INTENSIDAD O SALIENCIA DEL ESTÍMULO

En igualdad de condiciones, es más probable que el comportamiento quede bajo el control de
estímulos intensos o sobresalientes que los débiles (p. ej., Kamin, 1965). Intensidad del estímulo
es importante para la mayoría de las funciones biológicas, y estas incluyen el aprendizaje y
comportamiento. Los estímulos más intensos tienden a provocar un comportamiento más vigoroso y más
aprendizaje rápido. Además, la presencia de un estímulo intenso puede interferir con
el control del comportamiento mediante una señal más débil. Este fenómeno, identificado por primera vez por
Pavlov (1927), se conoce como ensombrecimiento . Un estímulo débil "b" puede ser
Página 266
condicionado efectivamente cuando se presenta por sí mismo en ensayos de condicionamiento.

Sin embargo, será evidente que se aprende menos acerca de "b" si se realiza el acondicionamiento
con un estímulo compuesto "Ab" que consiste en "b" presentado con un más
estímulo intenso "A" En este caso, el estímulo "A" puede eclipsar el
condicionamiento del estímulo "b".
FACTORES MOTIVACIONALES
La medida en que la conducta queda bajo el control de un estímulo particular es
también determinado por el estado motivacional del organismo. Factores motivacionales
en el control de estímulos de la conducta no se han investigado extensamente.
Sin embargo, la evidencia disponible indica que la atención se puede desviar
de un tipo de estímulo a otro por un cambio en la motivación o emocional
estado. En estos experimentos, se usa típicamente un estímulo compuesto que consiste en un
tono y una luz. Con un compuesto de tono tan ligero, ratas y palomas acondicionadas
con la comida como reforzador llegan a responder más a la luz que al tono. En
Por el contrario, los animales condicionados para evitar el dolor aprenden a responder más al tono
que a la luz (Foree y LoLordo, 1973; LoLordo, 1979).
El factor crítico que predispone el control del estímulo hacia la luz o el tono es
si el compuesto de tono claro adquiere un afectivo apetitivo o positivo
valencia o una valencia afectiva negativa o aversiva (Weiss & Panlilio, 2015). los
El estado motivacional provocado por los estímulos condicionados actúa como un filtro de estímulo que
predispone el control de estímulos a favor de señales visuales o auditivas. Cuando las palomas son
hambrientos y motivados para encontrar comida, son especialmente sensibles a las señales visuales. En
Por el contrario, cuando las palomas tienen miedo y están motivadas para evitar el peligro, son
especialmente sensible a las señales auditivas. Para otras especies, estas motivaciones
las influencias pueden tomar diferentes formas. Una especie que caza presas vivas por la noche,
por ejemplo, puede estar especialmente atento a las señales auditivas cuando está buscando
comida.
Determinantes del control de estímulos: factores de aprendizaje

Los procesos de aprendizaje no pueden enseñarle a responder a las microondas que están más allá
la capacidad de sus órganos de los sentidos. Sin embargo, los procesos de aprendizaje tienen mucho que ver
con cómo llega a responder a los estímulos que están dentro del rango de su
Sentidos. Pasaremos a estos mecanismos de aprendizaje a continuación. En general, el comportamiento viene
Página 267
bajo el control de un estímulo si ese estímulo se vuelve significativo para algunos

razón.
ACONDICIONAMIENTO PAVLOVANO E INSTRUMENTAL

Como comenté en el Capítulo 4, simples procedimientos de acondicionamiento pavloviano hacen una
estímulo inicialmente ineficaz y sin importancia (el estímulo condicionado [CS])
significativo al establecer una asociación entre ese evento y no condicionado
estímulo (EE. UU.). La importancia del estímulo también se puede establecer mediante
condicionamiento instrumental. En el caso de refuerzo positivo, el reforzador
(O, para el resultado) se presenta en función de una respuesta (R) en presencia de una
estímulo inicialmente neutro (S). La contingencia instrumental S – R – O de tres períodos
aumenta la importancia del estímulo S al establecer una asociación entre S
y el resultado de refuerzo O o al tener una señal de estímulo S cuando la respuesta
será reforzado (ver Capítulo 7). La situación es similar en el caso de
refuerzo (ver Capítulo 12). En el procedimiento de evitación discriminada, para
Por ejemplo, la respuesta instrumental da como resultado la evitación de la estimulación aversiva.
sólo si la respuesta ocurre en presencia de una señal de advertencia, que enciende el
señal de advertencia en un evento significativo.
Aunque los procedimientos sencillos de acondicionamiento pavloviano e instrumental sirven
para llevar el comportamiento bajo el control de estímulos o eventos particulares, no
determinar qué característica (s) de un estímulo se volverá más importante en
controlando el comportamiento condicionado. Considere, por ejemplo, un compuesto
estímulo con características auditivas y visuales. Ya sea visual o
El componente auditivo obtendrá un control predominante sobre la respuesta condicionada.
Dependerá de los factores sensoriales y motivacionales que describí en el
sección anterior. Si el participante tiene un agudo sentido de la vista pero deficiente audición,
predominará el componente visual. Si ambos sentidos son adecuados y el
El participante está motivado por el miedo, el componente auditivo puede ser más importante.
Sin embargo, si el componente visual es mucho más intenso o saliente que el
característica auditiva, el componente visual puede eclipsar la señal auditiva.
¿Qué hay de las características del estímulo que no se pueden distinguir sobre la base de
variables sensoriales y motivacionales? ¿Cómo pueden llegar a controlar el diferencial?
respondiendo? Considere, por ejemplo, un automóvil que tiene mucha gasolina y uno que está
a punto de quedarse sin gasolina. Hay poca diferencia entre estos dos tipos de coches.
en
La términos de la modalidad
única diferencia e intensidad
es la posición de los del
del indicador estímulos que
medidor deencuentra un conductor.
combustible, los
y esa diferencia
Página 268
puede ser de menos de una pulgada. Sin embargo, la diferencia en la posición del combustible
indicador entre tener suficiente gas y estar casi vacío es muy
importante para los conductores. Las personas también responden de manera muy diferente al ver la palabra
fuego en comparación con la palabra alquiler , aunque las características visuales de estos dos
las palabras son casi idénticas. ¿Cómo llegan a controlar estímulos tan similares
respuestas dramáticamente diferentes? La respuesta está en los procedimientos de acondicionamiento.
que proporcionan un refuerzo diferencial en presencia de diferentes estímulos.
CAPACITACIÓN EN DISCRIMINACIÓN DE ESTÍMULO

La variable de entrenamiento más importante que determina el grado de estímulo
El control es un entrenamiento de discriminación de estímulos . Entrenamiento de discriminación por estímulo
proporciona refuerzo diferencial en presencia de diferentes estímulos. Estímulo
El entrenamiento de discriminación se puede realizar con pavloviano o instrumental.
métodos. Los casos simples de condicionamiento pavloviano e instrumental involucran sólo
un SC o condición de estímulo. Por el contrario, el entrenamiento de discriminación de estímulos
requiere un mínimo de dos estímulos. El refuerzo diferencial está organizado por
proporcionar los EE. UU. o el reforzador en asociación con una de las señales, pero no la
otro.
Cualquiera de los dos estímulos que inicialmente son ineficaces para generar el condicionado o
La respuesta instrumental puede servir como estímulo en un procedimiento de discriminación. Uno de
las señales se llaman S + , y la otra se llama S - . Por ejemplo, S + y S -
pueden ser las letras f y h , un tono y un timbre, o una luz y un ruido. Cada ensayo
implica presentar solo uno de los estímulos discriminativos, y los ensayos con el S +
y la S - se presentan en una secuencia aleatoria.
En un procedimiento de discriminación pavloviano, cada presentación de S + se empareja
con los EE. UU. Por el contrario, EE. UU. Se omite en los juicios cuando ocurre la S - . Por tanto, S +
y S - están asociados con diferentes resultados o reforzamiento diferencial. S +
y S - pueden ser dos gatos naranjas, por ejemplo, uno bastante amigable y el otro
a distancia. El simpático gato (S + ) está emparejado con el placer táctil porque
se acerca y se frota contra la gente. El gato distante (S - ) no se acerca y
no permite que la gente la acaricie y, por lo tanto, no se combina con el tacto positivo
NOSOTROS.
Los resultados típicos de un procedimiento de entrenamiento de discriminación se ilustran en
Figura 13.4 . Al principio del entrenamiento, la respuesta condicionada llega a ser provocada por
la S + , y esta respuesta se generaliza a la S - . En esta etapa del aprendizaje, el
Página 269
El participante responde tanto al S + como al S - . Con discriminación continua
entrenamiento (y refuerzo diferencial), la respuesta a S + sigue aumentando,
mientras que responder a S - disminuye gradualmente. El resultado final es que el
El participante responde mucho más a S + que a S - . Se desarrolla una fuerte distinción
entre S + y S - . En este punto, se dice que los dos estímulos están discriminados.
FIGURA 13.4
Resultados típicos de un procedimiento de entrenamiento de discriminación pavloviana en el que S + se empareja con

un estímulo incondicionado y S− se presenta con la misma frecuencia solo. El condicionado
la respuesta que se desarrolla inicialmente a S + se generaliza a S−. Sin embargo, con continuado
formación, se desarrolla una fuerte discriminación entre S + y S−.
Consideremos nuevamente los gatos amistosos y distantes. Como comienzas a

asocia uno de los gatos con el placer táctil, cualquier afecto que desarrolles por
ella puede generalizar cuando te encuentres con el otro gato. Sin embargo, como tienes
encuentros agradables adicionales con un gato pero no con el otro, su afecto
porque el gato amistoso aumentará y su respuesta al gato distante disminuirá.
Página 270
Llegarás a distinguir un gato de otro.

El entrenamiento sobre discriminación se puede llevar a cabo de manera análoga utilizando
procedimientos de acondicionamiento instrumental. De nuevo necesitas dos estímulos, un S + y
una S - . El refuerzo diferencial se proporciona reforzando el instrumental
respuesta en presencia del S + pero no reforzando la respuesta en el
presencia de la S - . Por tanto, el procedimiento de discriminación consta de S + → R → O
ensayos y ensayos S - → R → noO. Al igual que con los procedimientos de discriminación pavloviana,
Durante las etapas iniciales del entrenamiento, la respuesta a las pruebas S + puede generalizarse a S - .
Sin embargo, eventualmente el participante responderá enérgicamente en los ensayos con el S +
y poco, si acaso, en los ensayos con el S - , como se muestra en Figura 13.4.
En la tradición skinneriana del análisis de la conducta, la nomenclatura estándar
para los estímulos discriminativos es un poco diferente. S + está representado por el símbolo S D ,
y se llama "ess dee" (para estímulo discriminativo ). En contraste, la S - es
representado por el símbolo S Δ y se llama "ess delta" (con el símbolo delta
indicando falta de refuerzo).
En todos los procedimientos de discriminación de estímulos, se asocian diferentes estímulos
con diferentes resultados. En los ejemplos anteriores, el refuerzo diferencial
fue proporcionado por la entrega versus la omisión de los EE. UU. o el reforzador. los
presencia versus ausencia de refuerzo representa un caso común pero especial
en los procedimientos de formación sobre discriminación. Cualquier forma de refuerzo diferencial puede
conducir al aprendizaje de una discriminación.
Los bebés, por ejemplo, aprenden rápidamente a diferenciar a mamá de papá. Esta
no ocurre porque mamá es una fuente de refuerzo, pero papá no. Ambos
Mamá y papá brindan placer al bebé, pero es probable que brinden
diferentes tipos de placer. Uno de los padres puede brindar más comodidad táctil y
refuerzo nutricional, mientras que el otro puede proporcionar principalmente sensorial
refuerzo en forma de cosquillas o rebotes. Cada tipo de reforzador es
consistentemente asociado con uno de los padres, y esto permite que el bebé aprenda
para discriminar entre los padres.
MÚLTIPLES HORARIOS DE REFUERZO

El refuerzo diferencial también se puede programar en términos de diferentes
horarios de refuerzo en presencia de diferentes estímulos. Por ejemplo, un
El horario de intervalo variable puede estar en efecto en presencia de un tono agudo
(Estímulo A), y un programa de intervalo fijo puede estar en efecto en presencia de un
Página 271
tono de tono bajo (estímulo B). Tal procedimiento se llama programa múltiple de
refuerzo . Como resultado del entrenamiento en un intervalo variable múltiple: fijo
programa de intervalos de refuerzo, los participantes llegarán a responder al estímulo
A de una manera típica de rendimiento de intervalo variable y responderá a
Estímulo B de una manera típica del rendimiento de intervalo fijo.
Un horario múltiple está en efecto mientras escuchas a diferentes instructores en
diferentes clases. El comportamiento de escucha se ve reforzado por la nueva información que
escuchar en cada clase. Algunos profesores dicen muchas cosas nuevas durante sus clases,
reforzando así el comportamiento de escucha en un horario denso de intervalo variable.
Otros profesores, como era de esperar, hacen solo cuatro o cinco puntos importantes durante una
disertar y dedicar unos 10 minutos a la elaboración de cada punto. Esto refuerza
comportamiento de escucha en lo que es similar a un horario de intervalo fijo. Cada programa de
El refuerzo está en efecto en presencia de los distintos estímulos de cada profesor.
y clase. En ambas clases, por lo tanto, el comportamiento de escucha se refuerza en un
horario múltiple. Por eso, su comportamiento de escucha cambia cuando
pasar de una clase a otra.
Determinantes de la precisión del control de estímulos

El refuerzo diferencial en presencia de S + y S - produce diferencial
respondiendo a esos estímulos. Curiosamente, estos efectos pueden extenderse más allá del
estímulos reales que se utilizan en el procedimiento de discriminación. El de gran alcance
Los efectos del entrenamiento en discriminación se identificaron por primera vez en un experimento histórico.
por Jenkins y Harrison (1960). Compararon el control del estímulo del picoteo
comportamiento en dos grupos de palomas (ver Tabla 13.1). El grupo D fue el primero
condicionado para discriminar entre la presencia y la ausencia de un tono. Estas
Las palomas fueron reforzadas para picotear una tecla de respuesta cada vez que un tono con un
frecuencia de 1000 Hz se activó (S + ) y no se reforzó cuando el tono
estuvo ausente (S - ). El grupo de control (Grupo C) recibió un refuerzo similar para
pulsando la tecla de respuesta, pero para ellos el tono estaba encendido continuamente durante el
sesiones de entrenamiento. Por tanto, el Grupo C no recibió refuerzo diferencial
asociado con el tono.
TABLA 13.1
Esquema del experimento de Jenkins y Harrison (1960)
Página 272
Capacitación Prueba
Grupo D: entrenamiento en discriminación Tonos de varias frecuencias

S + (tono de 1000 cps): picotazos → comida
S- (sin tono): picoteos → sin comida
Grupo C: formación sin discriminación Tonos de varias frecuencias
Tono de 1000 cps: picotazos → comida
Tono siempre presente durante el entrenamiento
Después de que tuvo lugar este entrenamiento contrastante, las respuestas de ambos grupos
se midieron en una prueba de generalización de estímulos. Tonos de varias frecuencias
fueron presentados durante la sesión de prueba. Los resultados se resumen en la Figura
13.5 . El grupo de control, Grupo C, que no recibió entrenamiento en discriminación,
respondió enérgicamente al tono que había estado presente durante el entrenamiento (los 1.000
Tono Hz). También respondieron vigorosamente a la mayoría de los otros tonos, que ellos
encontrado por primera vez durante la prueba de generalización. Así, en ausencia
del entrenamiento de discriminación, se obtuvo un gradiente de generalización bastante plano. Esta
indica que la frecuencia de los tonos no ganó mucho control sobre la
comportamiento de estas aves.
FIGURA 13.5
Página 273
Efectos del entrenamiento en discriminación sobre el control del comportamiento de picoteo de las palomas por parte del
frecuencia de diferentes tonos. Antes de la prueba de generalización, el Grupo D recibió
entrenamiento de discriminación en el que el S + era un tono de 1.000 Hz, y el S− era el
ausencia del tono. Por el contrario, el Grupo C solo recibió refuerzo por picar teclas en
la presencia del tono de 1000 Hz. Datos de Jenkins y Harrison (1960).
Los resultados fueron dramáticamente diferentes para las palomas del Grupo D, que
fueron entrenados por primera vez para discriminar entre la presencia y ausencia de los 1.000
Tono Hz. Estas aves mostraron un fuerte gradiente de generalización. Respondieron un
mucho al tono de 1000 Hz (el S + ), pero su comportamiento disminuyó rápidamente
cuando se presentaron tonos de otras frecuencias. Este es un resultado notable
porque los otros tonos no se habían presentado durante el entrenamiento de discriminación.
Ninguno de los otros tonos había servido como S - en el procedimiento de discriminación.
A pesar de que el Grupo D no se había encontrado con la falta de refuerzo en presencia de
tonos durante el entrenamiento, los tonos distintos del S + no admitieron mucho picoteo
comportamiento.
Los resultados presentados en la Figura 13.5 mostrar que la forma de una generalización
El gradiente se puede alterar drásticamente mediante el entrenamiento en discriminación. Discriminación
Página 274
El entrenamiento no solo produce una respuesta diferencial a S + y S , sino que también aumenta
la inclinación de los gradientes de generalización. Esto indica que la discriminación
El entrenamiento aumenta la precisión del control de estímulos y esta mayor precisión.
se extiende más allá de los estímulos específicos que se utilizan como S + y S - .
INTERDIMENSIONAL VERSUS INTRADIMENSIONAL

DISCRIMINACIONES
Hasta ahora hemos enfatizado la importancia del refuerzo diferencial en
procedimientos de formación sobre discriminación. La naturaleza de los estímulos S + y S - también
determina el resultado de la formación sobre discriminación. Las similitudes y
las diferencias entre S + y S - son especialmente importantes. Si S + y S - difieren en
En varios aspectos, la discriminación se denomina discriminación interdimensional .
Si S + y S - difieren sólo en un aspecto, la discriminación se llama
discriminación intradimensional .
Discriminaciones interdimensionales
Quizás las formas más comunes de entrenamiento en discriminación interdimensional son
procedimientos simples de acondicionamiento instrumental pavloviano o de ensayo discreto, aunque
generalmente no pensamos que esto involucre entrenamiento en discriminación. Un simple
El procedimiento pavloviano implica solo una cesárea y una ecografía. Presentaciones de la CS
finaliza en la entrega de los EE. UU. Por el contrario, los EE. UU. No se entregan cuando el CS es
ausente. Por lo tanto, la discriminación es entre los momentos en que el CS está presente y
momentos en los que el CS está ausente (el intervalo entre ensayos). Todas las características del CS
(su modalidad, intensidad y ubicación) sirven para distinguir el SC de su
ausencia. Por tanto, esta es una discriminación interdimensional.
El condicionamiento instrumental de ensayo discreto también implica un
discriminación entre las señales presentes durante una prueba y las señales presentes durante el
intervalo entre ensayos. Las palomas del Grupo D en la Figura 13.5 recibió tal
procedimiento. El picoteo se reforzó durante el tono de 1000 cps, pero no cuando el
el tono estaba ausente. Los períodos de refuerzo diferían del intervalo entre ensayos.
(cuando el tono estaba ausente) tanto en la intensidad como en la frecuencia de la audición
señales que escucharon las palomas.
También se pueden establecer discriminaciones interdimensionales entre estímulos discretos
sirviendo como S + y S - . La discriminación entre un semáforo rojo y verde I
Página 275
discutido anteriormente en este capítulo es una discriminación interdimensional porque

los semáforos rojo y verde difieren tanto en color como en posición. los
La discriminación aprendida por un bebé entre mamá y papá también es una
discriminación interdimensional. Mamá y papá difieren en muchos aspectos,
incluyendo características visuales, diferencias en cómo cada uno sostiene al bebé, diferencias en
voz, las diferencias en la hora del día es probable que cada uno interactúe con el bebé, y
pronto.
Discriminaciones intradimensionales
Las discriminaciones interdimensionales son eficaces para establecer el control de los estímulos.
Sin embargo, no establecen un alto grado de control sobre el comportamiento por parte de ningún
característica de estímulo particular. Por ejemplo, porque muchas cosas distinguen a mamá
de papá, es posible que el bebé no responda mucho a nadie que distinga
característica. La forma más eficaz de establecer el control mediante un estímulo específico.
característica es a través del entrenamiento de discriminación intradimensional (Jenkins & Harrison,
1960, 1962). En el entrenamiento de discriminación intradimensional, los estímulos asociados
con refuerzo diferencial difieren en un solo aspecto.
Muchas formas de desempeño experto involucran intradimensionales
discriminaciones. Leer, por ejemplo, requiere discriminar entre letras
que difieren en un solo aspecto. Las letras E y F difieren solo en la horizontal
tallo inferior, que está presente en E pero no en F. La diferencia física es muy
pequeñas, pero las consecuencias diferenciales en términos de significado pueden ser sustanciales.
Los pares de letras B y P y M y N son otros pares que son similares físicamente
pero difieren mucho en significado. Aprender a leer requiere aprender muchos
discriminaciones intradimensionales de este tipo.
Una de las cosas interesantes sobre el aprendizaje fino intradimensional
discriminaciones es que el participante probablemente no sea consciente de la
diferencia entre los estímulos al inicio del entrenamiento. Inicialmente, las letras E y
F puede parecerle lo mismo a un niño. El niño puede reconocer E y F como
diferente de O, pero es posible que no pueda distinguir la diferencia entre E y F.
el niño puede llegar a reconocer la diferencia visual entre las dos letras solamente
después de que le enseñaron a decir una cosa cuando se le muestra E y algo más cuando
mostrado F.Este ejemplo ilustra el principio general de que el diferencial
El refuerzo sirve para centrar la atención en las diferencias físicas que son
de lo contrario ignorado.
Se producen efectos similares en la adquisición de otras formas de experiencia. Niños
Página 276
Aprender a cantar puede no ser capaz de distinguir al principio cuando están cantando afinados o
fuera de tono. Sin embargo, esta habilidad se desarrolla a través del refuerzo diferencial de un
profesor. Del mismo modo, las bailarinas en ciernes aprenden a prestar mucha atención a
señales propioceptivas que indican la posición precisa de sus brazos y piernas, y
Los jugadores de billar aprenden a emitir juicios precisos sobre ángulos y trayectorias.
El entrenamiento en discriminación intradimensional trae el comportamiento bajo los
control de pequeñas variaciones en un estímulo, lo que sirve para aumentar la sensibilidad
a estas pequeñas variaciones de estímulo. Por lo tanto, la sensibilidad a las variaciones en
Los estímulos ambientales dependen no sólo de la capacidad sensorial sino también de la propia
historia de la formación en discriminación.
Entrenamiento de equivalencia de estímulo

Como hemos visto, los procedimientos de discriminación fomentan la respuesta diferencial y
aumentar la precisión del control de estímulos. Sin embargo, hay situaciones en
que se desea todo lo contrario, es decir, situaciones en las que físicamente diferentes
los estímulos deben tratarse de la misma manera. Considere, por ejemplo, la misma palabra
escrito en diferentes fuentes y tamaños. Si le preocupa el significado de
la palabra,
fuente debe tratar
o tamaño la palabra
en el que como Esto
está escrito. si tuviera el mismo
plantea significado
la pregunta: independientemente de la
¿hay aprendizaje
procedimientos que promueven responder a diferentes estímulos de la misma manera? Están
¿Existen procedimientos de aprendizaje que aumenten la generalización de los estímulos?
En un procedimiento de discriminación, los estímulos se tratan de manera diferente: tienen
diferentes consecuencias. El trato diferencial o significado de los estímulos
lleva a los organismos a responder a ellos como distintos entre sí. ¿Qué haría
¿Qué pasaría si dos estímulos fueran tratados de la misma manera o de manera equivalente? haría
tal procedimiento lleva a los organismos a responder a los estímulos como similares o
¿equivalente? La respuesta parece ser afirmativa. Al igual que el entrenamiento de la discriminación
fomenta la respuesta diferencial, el entrenamiento de equivalencia de estímulos fomenta
respuesta generalizada.
Hay varios enfoques para promover la generalización en lugar de
discriminación entre estímulos. Un enfoque es arreglar la misma consecuencia
para responder a varios estímulos físicamente diferentes. Esto se hace con frecuencia en
aprendizaje del concepto perceptual . Por ejemplo, se puede entrenar a las palomas para que respondan en un
de manera similar a diferentes fotografías, todas las cuales incluyen agua de alguna forma
(océano, lago, charco, arroyo). La estrategia básica de formación es reforzar la misma
Página 277
respuesta (picoteando una tecla de respuesta) en presencia de varias imágenes que contienen
agua, y no reforzar esa respuesta cuando fotografías sin agua
aparecer. Herrnstein, Loveland y Cable (1976) entrenaron tal discriminación
utilizando 500 a 700 fotografías de varias escenas en Nueva Inglaterra. Una vez el
las palomas aprendieron la discriminación agua / no agua, su comportamiento se generalizó a
fotografías novedosas que no se habían presentado durante el entrenamiento. (Para una mayor
discusión detallada del aprendizaje de conceptos perceptivos, ver Huber & Aust, 2012;
Wasserman, 2016.)
Organizar un resultado común para diferentes estímulos es una forma de establecer un
clase de equivalencia de estímulo. Otra técnica común es entrenar al mismo
respuesta a un conjunto de diferentes estímulos. Esto es esencialmente lo que hacen los padres cuando
entrenan a sus hijos para que digan la misma palabra ( fruta ) en respuesta a una variedad de
tipos de frutas (manzanas, peras, plátanos). La respuesta común sirve para crear una
clase de equivalencia entre los diversos ejemplos específicos que se asocian con
esa respuesta común (Urcuioli, 2013).
La equivalencia de estímulos es particularmente importante en el análisis y la formación de
habilidades lingüísticas. La palabra escrita banana , por ejemplo, deriva su significado de
el hecho de que está en una clase de equivalencia que incluye la palabra hablada banana como
así como una fotografía o dibujo de un plátano y un plátano real que puedas comer.
Todos estos estímulos físicamente diferentes se tratan como funcionalmente equivalentes y
intercambiables una vez que se ha aprendido el significado de la palabra. Por ejemplo,
deberías poder decir la palabra banana cuando veas la imagen de una, y
Debería poder seleccionar la imagen si se le pide que identifique la palabra
banano significa. (Para aplicaciones de entrenamiento de equivalencia en comportamiento aplicado
análisis, ver Rehfeldt, 2011.)
Resumen
Las personas tienen que aprender no solo qué hacer, sino cuándo y dónde hacerlo. Cuando
y donde se da una respuesta implica el control de estímulos de la conducta.
El control de estímulos se identifica mediante una respuesta diferencial y se puede
medido por la inclinación de los gradientes de generalización. La medida en que un
El estímulo influye en el comportamiento depende de factores de estímulo tales como sensorial
capacidad, orientación sensorial e intensidad del estímulo. El control de estímulos también
depende del estado afectivo o motivacional del individuo. Sin embargo, la mayora de las formas
del control de estímulos son el resultado del entrenamiento que facilita la discriminación
Página 278
entre estímulos o facilita la generalización entre estímulos.

El entrenamiento contra la discriminación puede involucrar interdimensiones o
intra estímulos dimensionales. El entrenamiento en discriminación intradimensional produce
control de estímulos más preciso que el entrenamiento interdimensional y es la base para
diversas formas de actuación experta. Sin embargo, aprender discriminaciones finas es
no siempre es útil. A veces tienes que aprender a tratar físicamente de manera diferente
objetos de la misma manera. Esto se logra mediante la equivalencia de estímulos
aprendiendo. La equivalencia de estímulos es importante en el aprendizaje de conceptos perceptivos,
aprendizaje de idiomas y varios aspectos del análisis de comportamiento aplicado.
Lecturas sugeridas
Rehfeldt, RA (2011). Hacia una tecnología de relaciones de estímulo derivadas: una
análisis de artículos publicados en el Journal of Applied Behavior Analysis ,
1992-2009. Journal of Applied Behavior Analysis , 44 , 109-119.
http://dx.doi.org/10.1901/jaba.2011.44-109
Urcuioli, PJ (2013). Control de estímulos y formación de clases de estímulos. En GJ
Madden (Ed.), Manual de análisis de la conducta de la APA: Vol. 1 . Métodos y
principios (págs. 361–386). Washington, DC: psicológico estadounidense
Asociación.
Wagner, AR (2008). Evolución de una teoría elemental de pavloviano.
acondicionamiento. Aprendiendo Y comportamiento , 36 , 253-265.
http://dx.doi.org/10.3758/LB.36.3.253
Wasserman, EA (2016). Conceptualización en palomas: la evolución de un
paradigma. Conductual Procesos , 123 , 4-14.
Términos técnicos
Respuesta diferencial
Discriminación interdimensional
Discriminación intradimensional
Múltiples horarios de refuerzo.
Eclipsar
Concepto perceptual
Página 279
S+
S-
Dimensión del estímulo
Discriminación de estímulos
Equivalencia de estímulo
Generalización de estímulos
Gradiente de generalización de estímulos
Página 280
Sabía usted que
el aprendizaje y la memoria están relacionados de manera integral?

Las tareas que prueban los mecanismos de memoria deben ser especialmente
diseñado para que no se puedan resolver sin el uso de
¿memoria?
los recuerdos no se desvanecen automáticamente a través de la degradación del rastro?
Más bien, el recuerdo se puede poner bajo el control de estímulos.
o control instruccional.
La memoria puede ser prospectiva e involucrar el futuro en lugar de
¿eventos pasados?
¿El no recordar algo rara vez se debe al olvido?
las fallas de memoria pueden ser causadas por recordar también
¿mucho?
Los aspectos aparentemente triviales de una situación de aprendizaje pueden ayudar a
recuperar lo aprendido?
La formación de la memoria implica procesos de consolidación en el
nivel de sinapsis, células nerviosas y circuitos neuronales?
Los recuerdos consolidados no son permanentes pero pueden ser
cambia cuando se recuperan o reactivan? Alterado
los recuerdos se reconsolidan.
Página 281
El aprendizaje y la memoria están relacionados de manera integral; uno no puede tener uno sin el
otro. De hecho, la investigación sobre los mecanismos de la memoria en animales hace un uso extensivo
de los procedimientos básicos de condicionamiento que describí en capítulos anteriores. Esta
hace que la discusión de la investigación de la memoria sea apropiada al final de un libro sobre
Procedimientos básicos de acondicionamiento. Sin embargo, surge una pregunta fundamental: si todos
El aprendizaje implica la memoria, lo que distingue los estudios de la memoria de los estudios de
¿aprendiendo? La respuesta es que los estudios de la memoria se centran en una etapa diferente de
procesamiento de información que estudios de aprendizaje.
Etapas del procesamiento de la información

La memoria implica los efectos retardados de la experiencia. Para experimentar con estímulos
y respuestas para influir en el comportamiento en un momento posterior, tienen que suceder tres cosas.
Primero, se debe adquirir y obtener información sobre los estímulos y las respuestas.
codificado en el sistema nervioso de alguna manera. Esta es la etapa de adquisición de
procesamiento de información. Una vez codificada, la información debe almacenarse para más tarde
usar. Esta es la etapa de retención del procesamiento de la información. Finalmente, cuando el
la información es necesaria al final del intervalo de retención, debe recuperarse
desde el almacenamiento. Esta es la etapa de recuperación .
La adquisición, retención y recuperación están involucradas en todos los estudios del aprendizaje como
así como todos los estudios de memoria. Sin embargo, ¿qué etapa es el foco de interés?
depende de si uno se ocupa principalmente de los procesos de aprendizaje o
procesos de memoria (ver Tabla 14.1 ). Los estudios de aprendizaje se centran en la adquisición
escenario. En los estudios de aprendizaje, las circunstancias de adquisición son manipuladas o
variadas mientras que las condiciones de retención y recuperación se mantienen constantes. Por
Por el contrario, en los estudios de memoria, las condiciones de adquisición se mantienen constantes.
mientras que el intervalo de retención y las condiciones de recuperación son variadas. Para hacer
Las cosas son un poco más complicadas, las tres etapas no son del todo independientes. Como
veremos, las condiciones de adquisición pueden determinar las circunstancias bajo
en el que se recupera un recuerdo (Urcelay & Miller, 2014). Sin embargo, tal
interacciones no socavan el modelo básico de procesamiento de información como
que implica la adquisición, retención y recuperación.
TABLA 14.1
Página 282
Diferencias entre experimentos de aprendizaje y experimentos de

Memoria
El procedimiento de emparejamiento con la muestra

Se han utilizado una variedad de técnicas para estudiar los mecanismos de la memoria en varios
especies. Los procedimientos de memoria a menudo requieren controles especiales para asegurar que el
El comportamiento del participante está determinado por su experiencia pasada más que por alguna
pista que se presenta inadvertidamente en la situación de prueba. Además, especial
los procedimientos deben diseñarse para aislar procesos de memoria particulares. Para
facilitar la ilustración de estas complejidades, describo en detalle la correspondencia
procedimiento de muestra , que es una de las técnicas más utilizadas y versátiles
para el estudio de los mecanismos de la memoria (Zentall & Smith, 2016).
En el procedimiento de emparejamiento con la muestra, el participante se expone primero a un
estímulo de muestra. Luego, la muestra se retira durante un intervalo de retención. Después de la
intervalo de retención, el participante recibe una prueba de memoria de opción múltiple.
Se presentan varias alternativas, una de las cuales es la misma que la muestra.
estímulo que se presentó al inicio del ensayo. Si el participante selecciona el
muestra previamente presentada, se refuerza.
El procedimiento de comparación con la muestra se puede utilizar para investigar la memoria de un
variedad de estímulos y se puede adaptar para abordar diversas preguntas de investigación. los
El procedimiento
humanos (Baron ydeMenich,
emparejamiento se ha utilizado
1985; Forestell y Herman,con especies
1988; tan diversas
Wallace, Steinert,como delfines, ratas y
Scobie y Spear, 1980), y el procedimiento se ha adaptado para varios tipos de
estímulos de muestra, incluidas señales visuales, auditivas y espaciales. Figura 14.1
ilustra una versión del procedimiento para usar con palomas. Aunque nuestro
la discusión se centra en la técnica de emparejamiento con la muestra, las cuestiones conceptuales
involucrados también son relevantes para todas las demás tareas de memoria.
FIGURA 14.1
Página 283
Ilustración de un ensayo de emparejamiento con la muestra. La prueba comienza con un círculo blanco en un toque.
pantalla que indica el inicio de la prueba. El estímulo de muestra (un triángulo) es entonces
presentado en la misma ubicación en la pantalla. A continuación, se apaga la muestra y se
comienza el intervalo de retención. Al final del intervalo de retención, el participante recibe dos
estímulos de prueba, uno de los cuales coincide con el estímulo de muestra. Respuestas al estímulo de prueba
que coincida con la muestra se refuerzan, como se indica con el asterisco.
Las palomas generalmente se prueban en una caja Skinner con un panel de estímulo en una
pared que permite la presentación de estímulos y también detecta respuestas de picoteo.
El panel de estímulos está programado para permitir la presentación de estímulos en tres
posiciones, generalmente dispuestas en una fila. Por ejemplo, los estímulos pueden ser tres
círculos del mismo tamaño llenos de varios colores o patrones. Cada prueba comienza
con una señal de inicio, que podría ser la iluminación de la posición central con un blanco
circulo. Un picoteo en la señal de inicio da como resultado la presentación del estímulo de muestra,
también en la posición central. En nuestro ejemplo, el estímulo de muestra es un triángulo.
Después de unos segundos, el estímulo de la muestra se apaga y un intervalo de retención
comienza. Al final del intervalo de retención, la paloma recibe dos estímulos de prueba,
uno a la izquierda y otro a la derecha. Uno de los estímulos de prueba es el mismo que el
muestra previamente presentada (un triángulo), mientras que la otra es diferente (una
cuadrado). Se refuerzan los picotazos en el estímulo correspondiente. Picotazos en la prueba alternativa
los estímulos no tienen ninguna consecuencia.
EMPAREJAMIENTO SIMULTÁNEO VERSUS RETARDADO CON LA MUESTRA

Como puede sospechar, la dificultad de un procedimiento de emparejamiento con muestra depende
Página 284
en parte sobre la duración del intervalo de retención (Grant, 1976). Facilitar

aprendizaje de una tarea coincidente, es útil comenzar a entrenar sin una retención
intervalo. Este procedimiento se denomina emparejamiento simultáneo con la muestra . En
coincidencia simultánea, después de la presentación de la señal de inicio, el estímulo de muestra se
presentado en la misma posición. Los estímulos de prueba se presentan a la izquierda y
lado derecho de la muestra, pero el estímulo de la muestra no se elimina. Porque el
El estímulo de muestra es visible al mismo tiempo que los estímulos de prueba, el procedimiento es
llamado coincidencia simultánea con la muestra.
Un procedimiento de emparejamiento simultáneo no es una buena prueba de memoria porque
el estímulo de muestra permanece presente durante el componente de elección de cada ensayo.
Pero esa característica facilita el aprendizaje de la tarea. Después de que los participantes hayan aprendido
para hacer la elección precisa en un procedimiento de emparejamiento simultáneo, una retención
Se puede introducir un intervalo entre la presentación de la muestra y la presentación.
de los estímulos de prueba, como se ilustra en la Figura 14.1 . Porque, en este caso, la prueba
los estímulos se retrasan después de la presentación de la muestra, el procedimiento se llama
coincidencia retrasada con la muestra .
CONTROLES DE PROCEDIMIENTO PARA MEMORIA

La introducción de un intervalo de retención requiere que el participante use lo que recuerda
sobre el estímulo de muestra para responder con precisión cuando las opciones de prueba son
presentado. Sin embargo, tener un intervalo de retención en el procedimiento no es suficiente
para asegurarse de que el participante esté usando la memoria basada en el estímulo de muestra. los
Los estímulos de muestra y prueba también deben variarse de una prueba a otra.
Considere, por ejemplo, un procedimiento en el que cada ensayo era exactamente el
igual que el ensayo ilustrado en Figura 14.1. Responder con precisión con repeticiones.
de esta prueba, la paloma simplemente tendría que aprender a picotear el estímulo izquierdo
posición durante el componente de elección de cada ensayo. La paloma no hubiera
recordar algo sobre la forma del triángulo que era la muestra en ese
prueba.
Obligar a los participantes a prestar atención y recordar información sobre el
estímulos específicos que se presentan en un procedimiento de emparejamiento, el estímulo de muestra
utilizado y la posición de los estímulos de prueba debe variar entre los ensayos de entrenamiento.
La figura 14.2 ilustra varios tipos de ensayos en un procedimiento de emparejamiento que involucra
dos pares de estímulos de forma, triángulo versus cuadrado y diamante versus pentágono.
Hay ocho tipos de prueba posibles que se muestran en la figura. Con cada muestra
estímulo, hay dos tipos de ensayos de prueba, uno con el estímulo correcto en el
Página 285
a la izquierda y uno con el estímulo correcto a la derecha. Si los ocho tipos de prueba son
variado aleatoriamente entre los ensayos durante el entrenamiento, el participante no puede ser
consistentemente exacto a menos que use información basada en la muestra para guiar su
selección del estímulo de prueba correcto.
FIGURA 14.2
Se utilizan ocho tipos de ensayos para asegurarse de que los participantes en una
procedimiento responden sobre la base de la información obtenida del estímulo de muestra.
Cada panel representa un tipo de ensayo diferente, con la muestra presentada en la parte superior y el
dos estímulos de elección que se presentan a continuación. La elección correcta se identifica con un asterisco.
Tipos de memoria
La memoria no es un proceso homogéneo. Hay diferentes tipos de memoria.
basado en el tipo de información que se recuerda, los tipos de manipulaciones
que influyen en la naturaleza de la memoria y su duración.
La experiencia humana común implica memoria declarativa , que es memoria para
eventos, ideas y otra información de la que podamos hablar o "declarar". Nosotros estamos
consciente de esos recuerdos y de los esfuerzos por recuperarlos. Entrando al
La contraseña correcta en su teléfono inteligente también requiere memoria, pero debe realizar
Página 286
esa tarea tan a menudo que ya no piensas en cada personaje individual. Ese
tipo de recuerdo automático e inconsciente de la información aprendida se llama
memoria procedimental . Acondicionamiento instrumental y pavloviano bien ensayado
las situaciones involucran memoria procedimental. En la presente sección, reviso la investigación
sobre la memoria de trabajo y de referencia y la memoria retrospectiva frente a la prospectiva
y también considere si la memoria implica la decadencia pasiva de lo aprendido
información o procesos psicológicos más activos.
REFERENCIA Y MEMORIA DE TRABAJO

¿Qué tipo de memoria se requiere para responder con éxito en una coincidencia con
procedimiento de muestra? En nuestra discusión de los controles procedimentales para la memoria,
estaban preocupados por asegurarse de que las respuestas a los estímulos de prueba en un
ensayo particular dependió de lo que el participante recordaba acerca de la muestra
estímulo que se presentó en ese ensayo. Pero esta información solo fue útil
hasta el final de la prueba. Recordar la muestra en un ensayo en particular no tenía
ayudar a responder en el próximo ensayo porque el próximo ensayo puede haber involucrado un
estímulo de muestra diferente. Memoria para la información necesaria para completar un
tarea o prueba se llama memoria de trabajo .
La memoria de trabajo es la retención de información necesaria para responder
con éxito en una prueba o tarea, pero no es útil para responder en posteriores
ensayos o tareas. Si está horneando un pastel y mezclando los ingredientes, comience con
una cierta cantidad de harina y luego agregue sal, azúcar y levadura en polvo. Porque
Todos estos ingredientes son blancos y pulverulentos, una vez que se han agregado al
mezclarlo no se puede distinguir a simple vista. Por lo tanto, debes recordar
si ya ha añadido el azúcar o la sal. Pero esa información es solo
útil hasta que termines de preparar la mezcla para pastel; no te ayudará a hornear el próximo
pastel. Por lo tanto, esta es una forma de memoria de trabajo.
Los procedimientos de control que comenté anteriormente (variaciones en la muestra
estímulo y en la ubicación del estímulo de elección correcta) asegúrese de que la coincidencia
Los procedimientos de muestra implican memoria de trabajo. Sin embargo, para responder
exitosamente, los participantes deben recordar más que solo información sobre el
muestra en un ensayo en particular. También deben recordar las características generales del
tareas de emparejamiento que permanecen constantes de un ensayo al siguiente. Por ejemplo, el
Las palomas deben recordar picotear la señal de inicio y picotear una de las pruebas.
estímulos después del intervalo de retención. Además, tienen que recordar que
las respuestas correctas se refuerzan y dónde obtener el reforzador una vez que está
Página 287
entregado. Estos datos son útiles en todos los ensayos. Tal recuerdo es
llamada memoria de referencia . La memoria de referencia implica la memoria para las características de un
tarea que permanece constante de una prueba a la siguiente. La memoria de referencia es de
duración considerablemente más larga que la memoria de trabajo.
Para hornear un pastel, debes recordar alguna información general sobre
Cocinando. Tienes que saber sobre moldes para pasteles, hornos, varios ingredientes y
cómo medir y mezclar esos ingredientes. Estas habilidades generales son útiles no
solo para el pastel que estás horneando, pero también para los pasteles futuros que puedas
quiero hacer. Por tanto, dicha información implica una memoria de referencia.
TRACE DECAY VERSUS PROCESOS DE MEMORIA ACTIVA

La memoria de trabajo y la memoria de referencia se distinguen por el tipo de
información que se retiene y por cuánto tiempo se recuerda la información.
Los mecanismos de memoria también se pueden distinguir por los tipos de procedimientos
que influyen en ellos. Una cuestión fundamental es si la memoria se rige por un
proceso de desintegración de trazas pasivas que conduce automáticamente al olvido con el tiempo o
implica mecanismos más complejos que pueden modificar la precisión del recuerdo.
De acuerdo con la hipótesis de desintegración de trazas, la presentación de un estímulo de muestra
activa un rastro neuronal que decae automáticamente después del final del estímulo.
La información sobre la muestra está disponible solo mientras la traza sea lo suficientemente
fuerte. Se asume que el desvanecimiento o decadencia gradual de la traza neural produce
recuerdo progresivamente menos preciso (Roberts y Grant, 1976). El concepto de rastro
El deterioro es una de las explicaciones más antiguas de la pérdida de memoria a lo largo del tiempo. Sin embargo, un
El crecienteecuerpo
incompleto de como
inexacto evidencia sugiere
relato que la simple
de la memoria idea de la desintegración de trazas es groseramente
y el olvido.
De acuerdo con la hipótesis de desintegración de trazas, la fuerza de una traza de estímulo es
determinada principalmente por su intensidad y duración (Grant, 1976). sin embargo, el
la precisión de la memoria también depende de las condiciones del entrenamiento. Somos mejores en
recordando cosas si sabemos que seremos probados con la información. Ese
es decir, el conocimiento de que se necesitará memoria mejora la capacidad de recordar. Dos lineas
de evidencia apoyan esta conclusión.
Una de las principales líneas de investigación ha demostrado que los procesos de memoria pueden llevarse a cabo
bajo control de estímulos. Estos estudios se realizaron originalmente con humanos
participantes a los que se les presentó una serie de elementos de estímulo. Algunos de los
Los elementos de la lista fueron seguidos por una indicación de recordar (la letra R), que indica que
el participante sería evaluado en ese elemento en una prueba de memoria posterior. Otro
Página 288
Los elementos de la lista fueron seguidos por una señal de olvido (la letra F), que indicaba que
el artículo no se incluiría en la prueba de memoria. Después del entrenamiento,
se evaluó la memoria de los participantes tanto para los elementos con claves R como F.
Los resultados mostraron una memoria mucho mejor para los elementos con indicación R que los elementos con indicación F
ítems (Johnson, 1994; MacLeod, 2012; M. Williams y Woodman, 2012). Esta
muestra que la memoria se puede poner bajo control de estímulos y no está determinada
por un simple mecanismo de desintegración de trazas.
Los estudiantes de mis clases a menudo me preguntan si lo que estamos cubriendo en clase
estará en la prueba. Al hacer esa pregunta, me piden que proporcione una R
cue o una cue F. Su suposición es que una señal R les permitirá activar
Procesos cognitivos que facilitarán la retención de la información.
La investigación sobre el olvido dirigido se ha extendido a especies no humanas como
bueno, lo que ha facilitado el examen de la base neural del efecto. En uno
estudio, por ejemplo, se entrenó a las palomas en un problema de emparejamiento con la muestra en
que el estímulo de la muestra fue seguido por un tono agudo o un tono bajo
tono agudo que indica que la memoria para el estímulo de muestra sería (o sería
no ser) probado. Las pruebas de sonda al final del experimento indicaron mejor
rendimiento para estímulos de muestra con pistas R que para estímulos de muestra con pistas F
(Milmine, Watanabe y Colombo, 2008; ver también Zentall y Smith, 2016).
El efecto de olvido dirigido muestra que los procesos de memoria pueden participar
(o no) artículo por artículo. Los aspectos más amplios de un procedimiento de formación pueden
también activan procesos de memoria en diferentes grados. Podemos ser entrenados para
recuerde algo por un período corto o por un período más largo. Esto era
demostrado en un importante experimento con palomas por Sargisson y White
(2001). Las aves fueron adiestradas en un estándar de emparejamiento retrasado con la muestra.
procedimiento. La prctica habitual en tales experimentos es utilizar un relativamente corto
intervalo de retardo entre el estímulo de la muestra y las alternativas de elección durante
entrenar y luego probar las aves con intervalos más largos durante las pruebas de memoria. los
El resultado típico es que la precisión de la memoria se deteriora rápidamente con un retraso mayor.
intervalos durante la serie de pruebas.
Sargisson y White (2001) se apartaron del protocolo de entrenamiento estándar por
utilizando intervalos de retardo de 4 y 6 segundos durante las pruebas de entrenamiento. Siguiente
entrenamiento con los intervalos de retraso más largos, el deterioro de la memoria
no se produjo el rendimiento que generalmente se observa con demoras de prueba más largas. Ese
es decir, las palomas aprendieron a recordar el estímulo de muestra durante retrasos más largos si
recibieron un procedimiento de formación que requería una mejor retención. Esto muestra que
la capacidad de retener información durante un período más largo es una habilidad que se puede entrenar
Página 289
dado el procedimiento de formación adecuado.
MEMORIA RETROSPECTIVA VERSUS PROSPECTIVA

Hasta ahora, hemos establecido que la tarea de emparejar la muestra implica tanto
memoria de trabajo y memoria de referencia, y que la memoria de trabajo es la mejor
caracterizado como un proceso activo más que pasivo. Otro tema importante
concierne al contenido de la memoria de trabajo, es decir, qué hace el organismo
recordar durante el intervalo de retención que le permite tomar la decisión correcta
al final de una prueba?
Memoria retrospectiva
La posibilidad más obvia es que la información sobre el estímulo de muestra sea
almacenados durante el intervalo de retención, lo que permite al participante seleccionar el
estímulo de prueba correcto. Presumiblemente, durante la prueba de elección al final del ensayo,
la memoria de la muestra se compara con cada una de las alternativas de elección para
determinar qué alternativa se parece mejor a la muestra. El participante entonces
selecciona el estímulo de prueba que mejor se adapta a la muestra.
Recordar los atributos del estímulo de la muestra es una forma de retrospectiva
la memoria . La memoria retrospectiva es la memoria de estímulos o eventos que fueron
encontrado en el pasado. Cuando pensamos en el contenido de la memoria,
Por lo general, piensa en eventos pasados. Sin embargo, la memoria retrospectiva de la muestra
El estímulo no es el único tipo de memoria que conducirá a un desempeño correcto en
un problema de coincidencia con la muestra.
Memoria prospectiva
Recuerde que, en el procedimiento de emparejamiento típico, un número limitado de tipos de ensayos se
repetido una y otra vez en orden aleatorio en todos los ensayos. Figura 14.2, por
ejemplo, ilustra un procedimiento en el que hay cuatro posibles estímulos de muestra:
un triángulo, un cuadrado, un diamante y un pentágono. Para cada muestra, hay un
estímulo de prueba correcto único. Debido a esto, el procedimiento de emparejamiento implica
pares de estímulos de prueba y muestra.
Representemos un estímulo de muestra como S y un estímulo de prueba como T.Diferentes
Los pares de estímulos de muestra-prueba se pueden representar como S1 – T1, S2 – T2, S3 – T3,
etcétera. Dados estos emparejamientos S – T, los participantes podrían seleccionar la opción correcta
Página 290
estímulo en una tarea de emparejamiento pensando en T después de la presentación de la muestra S
y almacenar esa información durante el intervalo de retención. Esto implica mantener
en la información de la memoria sobre un estímulo o acción de elección futura y se llama
memoria prospectiva . La memoria prospectiva es la memoria de un estímulo futuro o
respuesta.
Distinguir entre memoria retrospectiva y prospectiva

La memoria retrospectiva implica recordar el estímulo de muestra S durante la
intervalo de retención. La memoria prospectiva implica recordar el estímulo de prueba T
durante el intervalo de retención. ¿Cómo podemos distinguir entre estas posibilidades?
¿experimentalmente?
En los problemas de emparejamiento con la muestra que hemos considerado hasta ahora, la muestra
el estímulo S y el estímulo de prueba correcto T son iguales. Si la muestra es un
triángulo, el estímulo de prueba correcto también es un triángulo. Esto hace que sea imposible
decidir si la información almacenada durante el intervalo de retención se refiere
estímulo S o estímulo T. Para distinguir entre retrospectiva y prospectiva
memoria, tenemos que cambiar un poco el procedimiento de emparejamiento, de modo que T no sea
el mismo estímulo físico que S. Tal procedimiento se llama coincidencia simbólica para
muestra.
Un procedimiento de emparejamiento simbólico se ilustra en la Figura 14.3 . Cada fila
representa un tipo de ensayo diferente en el procedimiento. El procedimiento se basa en
relaciones simbólicas entre la muestra y los estímulos de prueba en lugar de la identidad
relación. En la Figura 14.3 , la respuesta a la cuadrícula horizontal se refuerza después de
presentación de un triángulo como el estímulo de muestra, y respondiendo a la vertical
La cuadrícula se refuerza después de la presentación de un cuadrado como muestra. En cierto sentido, el
la cuadrícula horizontal es un símbolo para la muestra del triángulo, y la cuadrícula vertical es un símbolo
símbolo de la muestra cuadrada. Relaciones simbólicas entre otras formas y
Los patrones visuales se muestran en la tercera y cuarta filas de la Figura 14.3 .
FIGURA 14.3
Página 291
Diagrama de un procedimiento simbólico de emparejamiento con muestra e ilustración de la diferencia

entre la memoria de trabajo retrospectiva y prospectiva. Cada fila muestra una prueba diferente
escribe. Los estímulos de prueba se muestran a la derecha de la muestra para cada tipo de prueba, y la
El estímulo de prueba correcto se indica con un asterisco.
Al igual que con el procedimiento de emparejamiento estándar, en una tarea de emparejamiento simbólico el
El estímulo de prueba correcto aparece con la misma frecuencia a la izquierda y a la derecha, y hay una
retraso entre la muestra y los estímulos de prueba. Por tanto, la tarea implica
memoria de trabajo, tal como lo hace el procedimiento estándar de comparación. Sin embargo, con
coincidencia simbólica, se recuerdan diferentes cosas dependiendo de si el
la memoria es retrospectiva o prospectiva. Las diferencias se muestran en el
columnas a la derecha de la Figura 14.3. En ensayos con el triángulo como muestra,
La memoria retrospectiva implica la retención de información sobre el triángulo. En
Por el contrario, la memoria prospectiva implica la retención de información sobre el
estímulo de prueba de cuadrícula horizontal, que es la elección correcta después de una muestra de triángulo.
En los ensayos con el cuadrado como muestra, la memoria retrospectiva implica
recordar el cuadrado, mientras que la memoria prospectiva implica recordar
la cuadrícula vertical.
Los estudios del procedimiento simbólico de comparación con la muestra han demostrado que
las palomas utilizan la memoria prospectiva en lugar de retrospectiva (p. ej., Roitblat, 1980;
Página 292
Santi y Roberts, 1985). La investigación que utiliza otros tipos de tareas de memoria también ha
proporcionó evidencia de memoria prospectiva (por ejemplo, Beran, Evans, Klein, &
Einstein, 2012; Crystal, 2012a; Roberts, 2012). Sin embargo, no todos los casos de
La memoria de trabajo implica la prospección o la memoria de eventos que se predice que
ocurrir en el futuro. Si los organismos recuerdan un evento pasado (retrospección) o
un evento futuro (prospección) depende de qué forma de memoria es más eficiente
en la resolución de una tarea en particular (Cook, Brown y Riley, 1985; Zentall, Steirn y
Jackson-Smith, 1990). Esto muestra que existe una flexibilidad considerable en lo que
la información se codifica en la memoria, dependiendo de las demandas de la tarea.
Fuentes de fallas de memoria

Todos nos encontramos con casos frustrantes en los que no podemos recordar
alguna cosa. Es posible que le hayan presentado a un nuevo empleado, pero cuando
encuentra a la persona varios días después, le cuesta recordar su nombre. usted
casualmente puede atribuir tales episodios al olvido. Curiosamente, sin embargo,
El olvido rara vez se usa para explicar casos de falla de la memoria en el campo científico.
literatura. Olvidar implica que aprendiste y codificaste el nombre de la persona.
cuando te presentaron por primera vez, pero el rastro de la memoria se ha desvanecido desde entonces y no
ya existe. Aunque eso pueda parecer plausible, el olvido es difícil de probar.
Hay otras explicaciones para la falla de la memoria, y estas cuentas alternativas
son más fáciles de probar.
La memoria puede fallar por diversas razones. Puede que no recuerdes
algo porque nunca aprendiste la información o nunca la codificaste correctamente
en primer lugar. La falla de la memoria también puede ser el resultado de una falla en la
recuperar información que se codificó o almacenó correctamente. También puede
se desempeña mal en una tarea de memoria porque recuerda varias cosas y está
incapaz de elegir correctamente entre estas alternativas. En las siguientes secciones,
describir varias explicaciones alternativas de la falla de la memoria, discutir un especial
forma de falla de la memoria llamada amnesia retrógrada , y considere la
estado del concepto de consolidación de la memoria.
EFECTOS DE INTERFERENCIA
Una de las fuentes más comunes de fallas de memoria es la interferencia de
información a la que estuvo expuesto antes o después del evento que está intentando
Página 293
recordar. Es posible que no recuerde el nombre de un nuevo empleado debido a la

otras personas que conoció por primera vez antes o después de esa persona en particular.
Los fallos de memoria debidos a interferencias se han investigado ampliamente en estudios.
con participantes humanos (Postman, 1971; Underwood, 1957) y no humanos
especies (p. ej., Killeen, 2001; Wright, Katz y Ma, 2012).
Hay dos tipos de efectos de interferencia dependiendo de si la fuente
de la interferencia tiene lugar antes o después del objetivo, incluso cuando está intentando
para recordar (ver Anexo 14.1 ). Si los estímulos extraños que perturban la memoria
ocurren antes del evento objetivo, el fenómeno se llama interferencia proactiva .
En la interferencia proactiva, los estímulos interferentes actúan hacia adelante, o de manera proactiva, para
interrumpir la memoria para el evento de destino. Considere, por ejemplo, ir a una sociología
clase que se ocupa de la cuestión del castigo desde el punto de vista del penal
sistema y luego asistir a una clase de psicología en la que se discute el castigo
desde la perspectiva de los procedimientos de condicionamiento. Estarías experimentando
interferencia proactiva si lo que aprendiste en la clase de sociología interrumpió tu
memoria del análisis psicológico del castigo.
ANEXO 14.1
Distinción entre interferencia proactiva y retroactiva
Interferencia proactiva
Eventos extraños → Tarea objetivo → Prueba de memoria
Interferencia retroactiva
Tarea objetivo → Eventos extraños → Prueba de memoria
Las alteraciones de la memoria también pueden funcionar en la dirección opuesta. Algo tu

encontrar más tarde puede actuar al revés para interrumpir su memoria de algo que
aprendido antes. A esto se le llama interferencia retroactiva . Puede que estés en una fiesta
por ejemplo, cuando habla primero con Jane y luego con Mary. Cuando piensas en el pasado
en la experiencia del día siguiente, es posible que tenga dificultades para recordar lo que
discutido con Jane debido a sus posteriores discusiones con Mary. En esto
caso, su conversación
recuerdo de hablar concon Mary actúa al revés o retroactivamente para interrumpir su
Jane.
Tanto la interferencia proactiva como la retroactiva se han investigado en animales.
estudios que utilizan procedimientos diferidos de emparejamiento con la muestra. La interferencia proactiva puede
ocurrir si los ensayos se programan juntos en el entrenamiento de emparejamiento con la muestra.
Página 294
Recuerde que los ensayos sucesivos en un procedimiento de emparejamiento involucran diferentes muestras
estímulos. Con intervalos breves entre ensayos, lo que ocurre en un ensayo puede producir
interferencia proactiva para interrumpir el rendimiento en la próxima prueba (Edhouse & White,
1988; Jitsumori, Wright y Shyan, 1989). Una explicación de este efecto es que
los participantes rinden mal no porque recuerden muy poco, sino porque
recuerdan demasiado. Según esta interpretación, la interferencia proactiva
es causado por recordar lo que sucedió en el juicio anterior, lo que crea
confusión sobre la elección correcta en el ensayo actual.
Se ha investigado la interferencia retroactiva en la comparación de muestras
procedimientos presentando estímulos extraños durante el intervalo de retraso entre
presentación del estímulo muestral y las alternativas de elección. Lo extraño
El estímulo puede ser proporcionado aumentando el nivel de iluminación en el
cámara experimental, haciendo varias características de la cámara experimental
más visible. Tal manipulación típicamente interrumpe la precisión de la coincidencia
desempeño (Grant, 1988). En contraste con la interferencia proactiva, que resulta
de recordar demasiado, la interferencia retroactiva parece ser el resultado de una
no recordar o recuperar la información requerida. Sin embargo, el preciso
Los mecanismos de interferencia retroactiva continúan bajo investigación (Calder &
White, 2014; Blanco y marrón, 2011).
FALLO DE RECUPERACIÓN
Los estudios de interferencia proactiva y retroactiva ilustran dos causas diferentes de
bajo rendimiento en una tarea de memoria. Otro factor más que contribuye a
La falla de la memoria es la incapacidad de un individuo para recuperar de manera efectiva la información que
que aprendió previamente. En principio, esta fuente de fallos de memoria es fácil de probar.
Si el bajo rendimiento en una tarea de memoria se debe a una falla en la recuperación, entonces los procedimientos
que faciliten la recuperación deberían facilitar el rendimiento. La recuperación de información es
facilitado por la exposición a estímulos que estaban previamente asociados con el objetivo
información. Estos estímulos se denominan señales de recuperación .
Las características notablemente insignificantes del medio ambiente pueden convertirse en
asociado con una tarea de aprendizaje y facilitar la recuperación de información relevante para
esa tarea. En un estudio (Borovsky y Rovee-Collier, 1990), por ejemplo, 6-
Los bebés de un mes recibieron un procedimiento de acondicionamiento instrumental en sus
parque infantil en casa (ver Figura 14.4 ). Cada bebé fue colocado en un asiento para bebés en el
parque con un móvil colocado en el techo a plena vista. El móvil fue gentilmente
unido a un pie del bebé con una cinta de raso. Al mover su pie, el
Página 295
el bebé podría hacer que el móvil se mueva. Así, la respuesta instrumental fue una pierna
movimiento, y el reforzador era el movimiento del móvil.
FIGURA 14.4
Situación experimental utilizada por Borovsky y Rovee-Collier (1990) para estudiar los efectos de
señales de recuperación de la memoria de los bebés humanos para una tarea de acondicionamiento instrumental. los
La respuesta instrumental fue mover una pierna, y el reforzador fue el movimiento consecuente.
de un móvil situado en la vista del bebé.
Los bebés adquirieron fácilmente la respuesta al movimiento de las piernas, pero mostraron poca
evidencia de aprendizaje si fueron evaluados 24 horas después. ¿Este deterioro de
El rendimiento refleja la falta de aprendizaje o codificación eficaz de los instrumentos
contingencia, o no recuperar lo aprendido el día anterior? Si el
La respuesta instrumental no se aprendió de manera efectiva en primer lugar, luego hay
Página 296
nada que se pueda hacer para contrarrestar el pobre desempeño que se evidencia las 24 horas
más tarde. Por el contrario, si la falta de memoria se debió a un error de recuperación, entonces la
La presentación de señales de recuperación o recordatorio debe restaurar la interpretación.
¿Cuál podría ser una señal de recuperación eficaz para los bebés en esta situación?
Borovsky y Rovee-Collier (1990) encontraron que el patrón del forro de tela que
cubierto los lados del corralito sirvió como una señal de recuperación efectiva para el
respuesta instrumental. A veces, el forro del parque tenía un patrón de rayas;
en otras ocasiones, el forro tenía un patrón cuadrado. Bebés para quienes el rayado
patrón que estaba en el corralito durante el entrenamiento respondieron mejor 24 horas después si
fueron probados con el forro rayado que si fueran probados con el forro cuadrado.
Los resultados inversos se obtuvieron con lactantes en los que se utilizó el otro revestimiento.
durante el entrenamiento original.
Los resultados de este experimento son notables porque no se hizo nada para
Dirija la atención de los bebés a los forros de la cuna. El cuadrado y rayado
Los patrones eran familiares para los bebés, y los patrones no eran predictivos de
reforzamiento. Sirvieron como pistas de fondo incidentales en lugar de como
estímulos discriminativos. Sin embargo, el patrón presente durante el entrenamiento original
se asoció con la tarea instrumental y ayudó a recuperar información
sobre la tarea durante la prueba de memoria 24 horas después.
Se ha encontrado que una variedad de estímulos son efectivos como señales de recuperación en
Varias situaciones de aprendizaje, incluida la exposición a un estímulo condicionado (CS)
sin refuerzo de la exposición al estímulo incondicionado, señales internas
inducida por drogas psicoactivas, y la exposición a la S - en una discriminación
procedimiento (Spear & Riccio, 1994). Además, se ha encontrado que las señales de recuperación
revertir una variedad de fenómenos que se caracterizan por bajos niveles de
respuesta condicionada, como extinción, inhibición latente, ensombrecimiento y
bloqueo (Urcelay y Miller, 2008).
Consolidación, reconsolidación y memoria

Actualizando
Para que algo sea recordado durante mucho tiempo, un cambio relativamente permanente
tiene que ocurrir en el sistema nervioso. La traducción de un episodio de aprendizaje en un
La memoria a largo plazo requiere el proceso de consolidación de la memoria . Memoria
La consolidación implica cambios celulares y moleculares a nivel de neural.
sinapsis (Hernandez & Abel, 2008). También implica cambios en los circuitos neuronales.
Página 297
y sistemas neuronales (McKenzie & Eichenbaum, 2011). Ambos tipos de

los cambios tardan en finalizar, pero la consolidación sináptica se produce más rápido que
consolidación en circuitos neuronales.
Antes de que una memoria se consolide por completo, se encuentra en un estado flexible o maleable en
que se puede interrumpir o cambiar. De hecho, las hipótesis sobre la memoria
La consolidación generalmente se prueba mediante la introducción de manipulaciones que interrumpen la
proceso de consolidación. Por ejemplo, tratamiento con un inhibidor de la síntesis de proteínas.
o choque electroconvulsivo después de que un episodio de aprendizaje interrumpe el recuerdo posterior de ese
ensayo de acondicionamiento (McGaugh, 2000; McGaugh y Herz, 1972). sin embargo, el
La fuente de interrupción tiene que ocurrir poco después de la prueba de acondicionamiento antes de la
Se ha completado el proceso de consolidación. Este período limitado cuando un recuerdo
es susceptible de interrupción se denomina ventana de consolidación.
La visión tradicional de la consolidación de la memoria era que una vez
El proceso de consolidación se ha completado a nivel de sinapsis neuronales y
circuitos neuronales, la memoria se solidificó y fue permanente. Después de que un recuerdo fuera
consolidado, ya no podría ser interrumpido por la inhibición de proteínas
síntesis o la administración de choque electroconvulsivo. A previamente
La memoria consolidada podría recuperarse para ayudar a lidiar con situaciones actuales.
La recuperación o recuerdo mueve la memoria de un estado inactivo o almacenado a
un estado activo en el que la memoria puede guiar decisiones y comportamientos. Sin embargo,
la suposición era que mover la memoria a un estado activo no hizo nada para
cambiar la memoria original. Porque el recuerdo original se mantuvo bonito
muy intacto, cada intento de recuperación operaba en el original consolidado
memoria (ver Figura 14.5 ).
FIGURA 14.5
Visión tradicional del aprendizaje y la consolidación de la memoria. Una vez que un nuevo recuerdo ha sido
Página 298
Visión tradicional del aprendizaje y la consolidación de la memoria. Una vez que un nuevo recuerdo ha sido
consolidado, está disponible para su recuperación, pero se suponía que dejaba el contenido de
la memoria original sin cambios.
La visión tradicional de que la consolidación de la memoria crea una

la memoria ha sido desafiada por el fenómeno de la reconsolidación . Cuando una
la memoria se reactiva o recupera, la información se mueve de su estado inactivo
(o almacenado) a un estado activo. En este estado activo, la memoria puede ser
modificado o cambiado, y estas modificaciones pueden incorporarse en un
nueva forma de la memoria a largo plazo a través del proceso de reconsolidación
(Auber, Tedesco, Jones, Monfils y Chiamulera, 2013). Curiosamente,
La reconsolidación parece involucrar algunos de los mismos mecanismos neuronales que
consolidación original (McKenzie & Eichenbaum, 2011; Nader & Hardt, 2009).
El concepto de reconsolidación se ilustra en la Figura 14.6.. Original
El aprendizaje y la consolidación de ese aprendizaje establecen la primera forma de un
memoria, algo que podemos etiquetar como Forma 1.0. La recuperación de ese recuerdo hace
la memoria sujeta a alteración, y estos cambios luego se reconsolidan en
una forma modificada de la memoria a largo plazo, que podemos etiquetar como Forma 1.1.
Este proceso de recuperación y reconsolidación de la memoria se repite potencialmente
cada vez que se recuerda un recuerdo, con la consecuencia de que el
La memoria de un evento se modifica sustancialmente como resultado de repetidos
esfuerzos para recordar ese evento.
FIGURA 14.6
Visión contemporánea del aprendizaje, consolidación y reconsolidación de la memoria. Cuando una

La memoria se recupera, se vuelve lábil y susceptible de reconsolidación, lo que permite
cambios en el contenido de la memoria a largo plazo con cada episodio de recuperación.
Página 299
La investigación reciente sobre la reconsolidación ha revolucionado la forma en que pensamos sobre

Mecanismos de memoria. Tradicionalmente, consideramos que la memoria es como un
fotografía que no cambia cada vez que sacas la foto y la miras.
El concepto de reconsolidación sugiere que cuando miras una fotografía y
luego devuélvalo al almacenamiento, la foto que almacena puede haber sido modificada por
sus pensamientos y reacciones actuales al respecto. En principio, cada vez que miras un
foto y devuélvala al almacenamiento a largo plazo, podría cambiarse de alguna manera.
Anteriormente describí cómo se ha utilizado el concepto de reconsolidación para
diseñar un procedimiento que produzca una extinción más efectiva del miedo condicionado
(consulte el Capítulo 10 de este volumen). En ese procedimiento, el recuerdo del miedo condicionado
se activa mediante una única prueba de CS sola. Esta reactivación de la memoria presumiblemente
mueve el miedo condicionado a un estado maleable tal que una serie de extinciones
Los ensayos son entonces más efectivos para cambiar la memoria previa de la
miedo condicionado. Sin embargo, la serie de extinciones debe realizarse dentro del
ventana de consolidación (p. ej., Monfils, Cowansage, Klann y LeDoux, 2009). Si
las pruebas de extinción se retrasan 6 horas después de la reactivación de la memoria,
no produjo un efecto de extinción mejorado.
No todos los recuerdos reactivados se modifican durante el proceso de recuperación. Si el
La memoria recordada no va acompañada de nuevos elementos (o alguna forma de
error de predicción), no es probable que active procesos de reconsolidación (Sevenster,
Beckers y Kindt, 2013). Queda mucho por descubrir sobre la
Circunstancias que hacen que un recuerdo sea susceptible de modificación a largo plazo y
las condiciones de frontera de tales modificaciones. Sin embargo, el hecho de que
Los recuerdos a término son susceptibles de alteración nos ayuda a comprender mejor cuán falsos
y los recuerdos distorsionados se desarrollan a través de esfuerzos repetidos por recordar (Hardt,
Einarsson y Nader, 2010). El concepto de reconsolidación también es alentador
la búsqueda de nuevas formas de cambiar los recuerdos a largo plazo que son la fuente de
Problemas clínicos recalcitrantes, como el trastorno por estrés postraumático y la drogadicción.
adicción (Kroes, Schiller, LeDoux y Phelps, 2016; Schwabe, Nader y
Pruessner, 2014).
Resumen
El aprendizaje y la memoria están relacionados de manera integral. Los estudios de aprendizaje se centran en
etapa de adquisición del procesamiento de la información, mientras que los estudios de la memoria se centran en
las etapas de retención y recuperación. La memoria de trabajo se utiliza para retener información.
Página 300
que se requiere el tiempo suficiente para completar una prueba o un trabajo. Por el contrario, la referencia
La memoria involucra aspectos de la tarea o prueba que permanecen constantes desde una
ocasión a la siguiente. Los primeros estudios consideraban que la memoria era pasiva y
retrospectivo. Sin embargo, la evidencia más reciente sugiere que en muchos casos
memoria involucra procesos activos y que la información almacenada puede involucrar
eventos futuros (prospectivos) en lugar de eventos pasados (retrospectivos).
Los estudios de lo que las personas olvidan pueden decirnos tanto sobre la memoria
mecanismos como estudios de desempeño exitoso. Puede ocurrir un fallo de memoria
debido a interferencias proactivas o retroactivas o debido a fallas en la recuperación.
La interferencia proactiva a menudo se debe a recordar tanto lo útil como lo irrelevante.
información y no poder seleccionar entre estos. Interferencia retroactiva
puede deberse a interrupciones de los procesos de ensayo necesarios para una memoria exitosa.
Sin embargo, un ensayo adecuado no garantiza una buena memoria. Información que es
retenido correctamente puede no recuperarse durante una prueba de memoria. Señales de recuperación,
algunas de las cuales pueden ser características aparentemente triviales de la situación de entrenamiento,
Facilitar el rendimiento de la memoria en casos de error de recuperación.
Establecer una memoria a largo plazo implica procesos de consolidación que
operan a nivel de neuronas y circuitos neurales. Sin embargo, un consolidado
la memoria no es inmune a la modificación. Vuelve el recuerdo de un recuerdo
la memoria a un estado activo en el que se puede modificar, y aquellos
Las modificaciones se pueden incorporar a la memoria antigua a través de un proceso llamado
reconsolidación. Con recuerdos repetidos, aspectos significativos de un recuerdo.
puede modificarse y consolidarse. Este tipo de actualización de memoria puede crear errores
recuerdos, que pueden ser problemáticos. Sin embargo, la investigación sobre la actualización de la memoria
también puede permitir a los científicos desarrollar tratamientos más efectivos para formas de
psicopatología que se basa en los recuerdos desadaptativos.
Lecturas sugeridas
Alberini, CM y LeDoux, JE (2013). Reconsolidación de la memoria. Actual
Biología , 23 , R746 – R750. http://dx.doi.org/10.1016/j.cub.2013.06.046
Schwabe, L., Nader, K. y Pruessner, JC (2014). Consolidación de humanos
memoria: mecanismos cerebrales y relevancia clínica. Psiquiatría biológica ,
76 , 274–280. http://dx.doi.org/10.1016/j.biopsych.2014.03.008
Spear, NE y Riccio, DC (1994). Memoria: Fenómenos y principios.
Boston, MA: Allyn & Bacon.
Página 301

Zentall, TR y Smith, AP (2016). Coincidencia retrasada con la muestra: una herramienta para
evaluar la memoria y otros procesos cognitivos en palomas. Conductual
Procesos , 123 , 26–42. http://dx.doi.org/10.1016/j.beproc.2015.07.002
Términos técnicos
Etapa de adquisición
Consolidación
Coincidencia retrasada con la muestra
Procedimiento de emparejamiento con la muestra
Interferencia proactiva
Memoria prospectiva
Reconsolidación
Memoria de referencia
Intervalo de retención
Señal de recuperación
Etapa de recuperación
Interferencia retroactiva
Memoria retrospectiva
Coincidencia simultánea con la muestra
Memoria de trabajo
Página 302
Glosario
UN IMPULSO CQUIRED : Una fuente de motivación para el comportamiento instrumental causado por
la presentación de un estímulo previamente condicionado con un primario,
o incondicionado, reforzador.
UNA ETAPA DE ADQUISICIÓN : La primera etapa necesaria para el desempeño de la memoria en la que
la información sobre los estímulos y las respuestas está codificada en el sistema nervioso
de alguna manera.
UNA NEURONA FERENTE : una neurona que transmite mensajes de los órganos de los sentidos al
sistema nervioso central.
UN COMPORTAMIENTO PPETITIVO : El componente inicial del comportamiento típico de una especie.
secuencia. El comportamiento apetitivo es variable, ocurre en respuesta a condiciones espaciales generales.
señales, y sirve para poner al organismo en contacto con estímulos liberadores que
provocar respuestas consumatorias.
UN ACONDICIONAMIENTO PPETITIVO : Un tipo de acondicionamiento en el que el incondicionado
El estímulo o reforzador es un evento agradable o un estímulo que el participante tiende a
Acercarse.
UN APRENDIZAJE SOCIATIVO : Aprender en qué evento (un estímulo o una respuesta)
se vincula a otro, de modo que el primer evento activa una representación de
el segundo.
UN SÍNTOTO : El límite del aprendizaje, donde no ocurren más cambios en
respuesta condicionada.
UNA UTOSHAPING : Ver seguimiento de señales.
UN ACONDICIONAMIENTO VERSIVO : Un tipo de acondicionamiento en el que el incondicionado
El estímulo o reforzador es un evento desagradable, un estímulo que provoca aversión
y respuestas de abstinencia.
Página 303
UN ESTÍMULO VERSIVO : Estímulo nocivo o desagradable que provoca aversión y / o

respuestas de abstinencia.
PUNTO DE FELICIDAD B EHAVIORAL : La distribución preferida de actividades en ausencia
de restricciones o limitaciones impuestas por un condicionamiento instrumental
procedimiento.
B SISTEMA DE COMPORTAMIENTO : Una secuencia de modos de respuesta y los correspondientes
mecanismos de control conductual y neurobiológico que se activan en un
de manera coordinada para lograr una función particular, como la alimentación o la defensa
contra la depredación.
B ntre-sujetos Experimento : Un diseño experimental en el que dos o más
Se comparan grupos independientes de participantes. El foco está en las diferencias
en el desempeño de los grupos separados más que en el comportamiento de
participantes individuales.
B EFECTO BLOQUEO : Interferencia con el condicionamiento de un nuevo estímulo
debido a la presencia de un estímulo previamente condicionado durante el entrenamiento
ensayos para el nuevo estímulo.
C OMPARATOR HIPÓTESIS : La idea de que la respuesta condicionada depende de una
comparación entre la fuerza asociativa del estímulo condicionado (CS)
y la fuerza asociativa de otras señales que estuvieron presentes durante el entrenamiento de
el CS objetivo.
C PROGRAMA AlActivarRegistro-CADENA : Un programa de reforzamiento que consiste en
dos componentes dispuestos en secuencia. Durante el enlace de elección , el participante
tiene dos alternativas disponibles simultáneamente. Selección del uno de esos
opciones proporciona esa alternativa (el enlace de terminal ) pero hace que la otra
no disponible hasta el final de la prueba.
C AlActivarRegistro PROGRAMA : Un procedimiento de refuerzo en la que el participante
puede optar por responder en uno de dos o más programas de refuerzo simples
que están disponibles simultáneamente. Los horarios concurrentes permiten
medición de elección entre alternativas de horarios simples.
C ONDITIONED UNIDAD : Una unidad de estado inducido por la presentación de un estímulo que
fue previamente condicionado con un reforzador primario, o incondicionado.
Igual que la unidad adquirida.
C ONDITIONED INHIBICIÓN : Un tipo de condicionamiento pavloviano en la que el
El estímulo condicionado se convierte en una señal de la ausencia de lo incondicionado.
estímulo.
REFUERZO C ONDICIONADO : Un estímulo que se convierte en un reforzador eficaz.
debido a su asociación con un reforzador primario o incondicionado.
Página 304
C ONDITIONED RESPUESTA : respuesta A que viene a ser hecho a la acondicionado

estímulo como resultado del condicionamiento clásico.
C ONDITIONED STIMULUS : Un estímulo que inicialmente no provoca un acondicionado
respuesta o activar una representación de un estímulo incondicionado pero viene
para hacerlo después de emparejamientos con un estímulo incondicionado. CS abreviado.
C ONDITIONED SUPRESIÓN : Un procedimiento de condicionamiento pavloviano aversivo en
cuya respuesta condicionada se mide por la supresión de positividad
comportamiento instrumental reforzado.
C ONSOLIDACIÓN : Los procesos neurobiológicos por los que se
la información se codifica en una forma relativamente permanente en el sistema nervioso
sistema.
C ONSTRAINTS en el aprendizaje : Las limitaciones en el aprendizaje que resulta de la
historia evolutiva del organismo.
C COMPORTAMIENTO ONSUMMATORY : Comportamiento que trae una secuencia de comportamiento elicitada
hasta su finalización; comportamiento que consuma o finalice una secuencia de provocada
respuestas.
C ONTINGENCIA : La medida en que la ocurrencia de un evento depende de la
otros, y viceversa.
C ONTINUOUS REFUERZO : horario A de refuerzo en la que cada
la ocurrencia de la respuesta instrumental produce el reforzador. Abreviado
CRF.
C CONTROL CONDICIÓN : Una condición en la cual los participantes no reciben una formación
procedimiento, pero son tratados de la misma manera en todos los demás aspectos como participantes que
Están entrenados. El rendimiento en la condición de control se compara con
rendimiento en la condición experimental en el experimento de aprendizaje básico.
INTERVALO CS – US : Igual que el intervalo entre estímulos.
RELEVANCIA CS – EE. UU . : Aprendizaje facilitado que ocurre con ciertas combinaciones
de estímulos condicionados e incondicionados (p. ej., gusto y enfermedad) comparados
con otras combinaciones (p. ej., sabor y shock).
REGISTRO C UMULATIVO : Una representación gráfica del número acumulativo de
ocurrencias de una respuesta particular en función del paso del tiempo. los
la distancia horizontal en el registro representa el tiempo, la distancia vertical
representa el número total de respuestas que se han producido hasta un determinado
punto en el tiempo, y la pendiente representa la tasa de respuesta.
FUNCIÓN DE DESCUENTO D ELAY : La pérdida en el valor de una recompensa como función
de cuánto tiempo hay que esperar para obtener la recompensa.
ACONDICIONAMIENTO D ELAYADO : Un procedimiento de acondicionamiento pavloviano en el que el
Página 305
El estímulo condicionado comienza antes que el estímulo incondicionado en cada ensayo.

EMPAREJAMIENTO D ELIADO CON LA MUESTRA : Un procedimiento en el que los participantes
reforzado para responder a un estímulo de prueba que es el mismo que una muestra
estímulo que se presentó algún tiempo antes.
PRINCIPIO DE PROBABILIDAD D IFERENCIAL : Consulte el principio de Premack.
REFUERZO D IFERENCIAL DE OTROS COMPORTAMIENTOS : Un
procedimiento de acondicionamiento en el que se administra periódicamente un reforzador positivo,
pero solo si el participante no logra realizar una respuesta en particular. Abreviado
DRO.
RESPUESTA D IFERENCIAL : Responder de diferentes maneras o a diferentes ritmos en
la presencia de diferentes estímulos.
D IRECTED OLVIDO : Control de estímulos de la memoria, logra mediante la presentación de una
señal que indica cuándo se requerirá (o no) que el participante recuerde
alguna cosa.
MÉTODO D ISCRETE-TRIAL : Un método de condicionamiento instrumental en el que el
El participante puede realizar la respuesta instrumental solo durante el tiempo especificado.
períodos, generalmente determinados por la ubicación del participante en un
cámara experimental o mediante la presentación de un estímulo de prueba.
EVITACIÓN D ISCRIMINADA : Un procedimiento de condicionamiento de evitación en el que la
La aparición de un estímulo incondicionado aversivo se indica mediante una advertencia.
señal o estímulo condicionado. Responder durante el estímulo condicionado
termina ese estímulo y previene la entrega de la aversión
HIPÓTESIS DE D ISCRIMINACIÓN : Hipótesis que atribuye la
efecto de extinción de refuerzo (extinción más lenta después de refuerzo parcial
que después del refuerzo continuo) a la falta de detección o discriminación de
el procedimiento de extinción después del refuerzo parcial.
CONTROL D ISCRIMINATIVO : Un procedimiento de control para el acondicionamiento pavloviano en
cuál estímulo condicionado (el CS + ) se empareja con el incondicionado
estímulo, mientras que otro estímulo condicionado (el CS - ) se presenta sin
el estímulo incondicionado. El desarrollo de responder durante el CS +
pero no durante el CS - se considera evidencia de condicionamiento pavloviano.
CASTIGO D ISCRIMINATIVO : Un tipo de procedimiento de castigo en el que
Las respuestas son castigadas en presencia de un estímulo particular, pero no cuando
ese estímulo está ausente.
D ISABITUACIÓN : Recuperación de una respuesta habituada producida por el
presentación de un fuerte estímulo extraño o no relacionado.
Página 306
D ISINHIBICIÓN : Recuperación de una respuesta condicionada parcialmente extinguida.

producido por la presentación de un nuevo estímulo.
D RIVE REDUCCIÓN THEORY
Los reforzadores : teoríaporque
son efectivos A de refuerzo
reducen según la cual
un estado de impulso y devuelven el
participante de la homeostasis.
ESTADO D RIVE : Un estado motivacional que existe cuando un sistema no está en su
nivel homeostático. El retorno del sistema a su nivel homeostático reduce la
estado de la unidad.
E FERENTE NEURONA : Neurona que transmite impulsos desde el sistema nervioso central.
sistema a los músculos.
COMPORTAMIENTO E LICITADO : Un comportamiento específico o patrón de acción que ocurre de manera confiable.
ante la presentación de un estímulo particular (su estímulo provocador).
E THOLOGY : una especialización en biología que se ocupa del análisis de especies-
patrones de comportamiento típicos que evolucionan en hábitats naturales.
E VOLUCIÓN : Cambio en un rasgo físico o de comportamiento que ocurre en
generaciones sucesivas debido al éxito reproductivo diferencial.
E Xperimental CONDICIÓN : Una condición en la cual los participantes reciben una formación
procedimiento. El rendimiento en la condición experimental se compara con
rendimiento en la condición de control en el experimento de aprendizaje básico.
OBSERVACIÓN E XPERIMENTAL : Observación del comportamiento en condiciones
diseñado específicamente por un investigador para probar factores o variables particulares
que pueda influir en el aprendizaje o el desempeño del participante.
E XTINCIÓN (EN ACONDICIONAMIENTO CLÁSICO) : Reducción de una respuesta aprendida que
ocurre porque el estímulo condicionado ya no está emparejado con el
estímulo incondicionado. Además, el procedimiento de presentar repetidamente una
estímulo condicionado sin el estímulo incondicionado.
E XTINCIÓN (EN ACONDICIONAMIENTO INSTRUMENTAL) : Reducción del instrumental
respuesta que ocurre porque la respuesta ya no es seguida por la
reforzador. Además, el procedimiento de no reforzar más el instrumental
respuesta.
F ACILITACIÓN : Un procedimiento de acondicionamiento pavloviano en el que un condicionado
El estímulo se presenta en los ensayos cuando un segundo estímulo se empareja con un
estímulo incondicionado pero no en ensayos cuando se presenta el segundo estímulo
solo. En tal procedimiento, una cue designa cuando otra cue será
reforzado.
F ATIGA : Una disminución temporal en el comportamiento causada por el uso repetido o excesivo.
de los músculos involucrados para realizar la conducta.
Página 307
F EEDBACK CUE : Un estímulo que resulta de la ejecución de una respuesta.

F eedback FUNCIÓN : La relación entre las tasas de respuesta y las tasas de
refuerzo permitido por un programa de refuerzo particular.
F ixed-intervalo de programación : Un programa de refuerzo en el que el refuerzo es
entregado para la primera respuesta que se produce después de un período de tiempo fijo
tras el último refuerzo o el inicio de la prueba.
F ixed-RATIO PROGRAMA : Un programa de refuerzo en el que un número fijo de
las respuestas deben realizarse para que se refuerce la siguiente respuesta.
F LAVOR NEOPHOBIA : Aversión causada por la falta de familiaridad con el sabor de un
nueva comida.
MODO DE BÚSQUEDA F OCAL : Un modo de respuesta en el sistema de alimentación que se activa
una vez que se ha identificado una fuente potencial de alimento.
F ORGETAR : Pérdida de información adquirida por el paso del tiempo.
F REE-operante EVITAR : Igual que la evitación nondiscriminated.
F REE-operante MÉTODO : Un método de condicionamiento instrumental que permite
repeticiones de la respuesta instrumental en cualquier momento, en contraste con la discreta-
método de prueba.
F RUSTRACIÓN : Una reacción emocional aversiva que resulta de lo inesperado
ausencia de refuerzo.
TEORÍA DE LA F RUSTRACIÓN : Una teoría del efecto de extinción por refuerzo parcial
según el cual la extinción es más lenta después del refuerzo parcial porque el
La respuesta instrumental se condiciona a la anticipación de la frustración.
sin recompensa.
MODO DE BÚSQUEDA G ENERAL : El modo de respuesta inicial del sistema de alimentación en
que el organismo reacciona a las características generales del medio ambiente con
respuestas que le permitan entrar en contacto con una variedad de fuentes potenciales
de comida.
EFECTO H ABITUACIÓN : Disminución progresiva del vigor de un
respuesta que puede ocurrir con presentaciones repetidas del estímulo provocador.
H IGHER ORDEN STIMULUS RELACIÓN : Una relación en la que una señales de estímulo una
relación entre otros dos estímulos en lugar de señalar solo la presencia
o ausencia de otro estímulo. En una relación pavloviana de orden superior, uno
El estímulo condicionado señala si otro estímulo condicionado está emparejado.
con un estímulo incondicionado.
NIVEL H OMEOSTÁTICO : El nivel óptimo o defendido de un sistema fisiológico.
H IDRÁULICA MODELO : modelo A en etología según la cual ciertos factores conducen
a la acumulación de un tipo particular de motivación o impulso que aumenta la
Página 308
probabilidad de patrones de acción modal correspondientes. Desempeño de aquellos

Los patrones de acción modal reducen o descargan el estado motivacional.
I NHIBITORY S – R ASSOCIATION : Una asociación S – R en la que la presentación de la
el estímulo inhibe la respuesta asociada.
COMPORTAMIENTO I NSTRUMENTAL : Un comportamiento o combinación de respuestas que
eficaz para producir una consecuencia o reforzador particular.
CONDICIONAMIENTO I NSTRUMENTAL : Condicionamiento que resulta de la relación
entre el comportamiento y sus consecuencias.
Me NTERDIMENSIONAL DISCRIMINACIÓN : Una discriminación entre dos estímulos que
difieren en varios aspectos.
I NTERMITTENT REFUERZO : horario A de refuerzo en el que sólo
se refuerzan algunas de las ocurrencias de la respuesta instrumental. los
La respuesta instrumental se refuerza ocasionalmente o de forma intermitente. También llamado
Refuerzo parcial.
I NTERNEURONA : neurona de la médula espinal que transmite impulsos de
(o sensoriales) a neuronas eferentes (o motoras).
INTERVALO DE I NTERSTIMULUS : El intervalo en un condicionamiento retrasado pavloviano
procedimiento entre el inicio del estímulo condicionado y el inicio del
HORARIO I NTERVAL : Un programa de refuerzo en el que una respuesta es
reforzado solo si ocurre más de un período de tiempo establecido después de la última
entrega del reforzador.
Me NTRADIMENSIONAL DISCRIMINACIÓN : Una discriminación entre estímulos que
difieren en una sola característica del estímulo, como el color, el brillo o el tono.
RELACIÓN I / T : Relación entre el intervalo entre ensayos ( I ) y la duración del
estímulo condicionado o tiempo de prueba ( T ) en el condicionamiento retardado pavloviano
procedimientos.
INHIBICIÓN L ATENTE : Retraso del condicionamiento pavloviano que se produce porque
de exposiciones repetidas o presentaciones del estímulo condicionado por sí mismo
antes de los emparejamientos CS-EE. UU.
L AW OF E FFECT : Un mecanismo para el comportamiento instrumental, propuesto por
Thorndike, según el cual el refuerzo de una respuesta instrumental
refuerza la asociación entre la respuesta y el estímulo en el
presencia de la que se produjo la respuesta.
L GANANCIA : Un cambio perdurable en los mecanismos de comportamiento que implica
estímulos específicos o respuestas que resultan de experiencias previas con aquellos
estímulos y respuestas.
Página 309
APRENDIZAJE CON RETRASO LARGO : Un procedimiento de condicionamiento clásico en el que el

El estímulo condicionado se presenta mucho antes que el estímulo incondicionado en
cada prueba de acondicionamiento.
L habituación ONG-TERM : Un tipo de habituación que es dura un día o más y
muestra una recuperación espontánea.
SENSIBILIZACIÓN A LARGO PLAZO : una forma de sensibilización que es persistente y lenta
decaer.
M AGNITUD DEL REFUERZO EFECTO DE EXTINCIÓN : Menos persistencia de
comportamiento instrumental en extinción después del entrenamiento con un reforzador grande que
después de entrenar con un pequeño reforzador.
M Arking ESTÍMULO : Una breve señal visual o auditiva presenta después de una
respuesta instrumental que hace que la respuesta instrumental sea más memorable
y ayuda a superar el efecto perturbador del refuerzo retrasado.
M VER LA LEY : regla A de la conducta instrumental, propuesto por Herrnstein,
según el cual la tasa relativa de respuesta en una respuesta particular
alternativa es igual a la tasa relativa de refuerzo para esa respuesta
alternativa.
M VER LA A LA MUESTRA PROCEDIMIENTO : Un procedimiento en el que los participantes están
reforzado para seleccionar un estímulo que corresponda a la muestra presentada en
ese juicio.
M ATURATION : Un cambio en el comportamiento causado por física o fisiológica
desarrollo.
PATRÓN DE ACCIÓN M ODAL : Un patrón de respuesta que ocurre en casi el mismo
moda la mayor parte del tiempo y en la mayoría de los miembros de una especie. Acción modal
Los patrones se utilizan a menudo como unidades básicas de comportamiento en las investigaciones etológicas.
de comportamiento.
M OTIVACIÓN : Estado hipotético que aumenta la probabilidad de que se produzca una
conjunto de actividades o activa un sistema de comportamientos que funciona para satisfacer un
objetivo, como la alimentación, la defensa depredadora, el cuidado infantil o la cópula.
NEURONA M OTOR : Igual que la neurona eferente.
M MÚLTIPLES programa de reforzamiento : procedimiento A en el que diferentes
Los programas de refuerzo están en efecto en presencia de diferentes estímulos.
presentado en sucesión. Generalmente, cada estímulo viene a evocar un patrón de
responder que corresponde al programa de refuerzo que está en efecto en
la presencia de ese estímulo.
OBSERVACIÓN N ATURALISTA : Observación del comportamiento tal como ocurre bajo
condiciones, en ausencia de intervenciones o manipulaciones introducidas por el
Página 310
investigador.
REFUERZO N EGATIVO : Un procedimiento de acondicionamiento instrumental en el que
existe una contingencia negativa entre la respuesta instrumental y una
estímulo aversivo. Si se realiza la respuesta instrumental, el aversivo
se termina el estímulo; si no se realiza la respuesta instrumental, la
el estímulo aversivo no se apaga.
N egative REFORZADOR : Igual que el estímulo aversivo .
N ONDISCRIMINATED EVITAR : Un procedimiento de condicionamiento de evitación en el que
el estímulo aversivo no es señalado por una señal de advertencia externa. Más bien, el
El estímulo aversivo está programado para que ocurra periódicamente, según lo establecido por el intervalo S – S.
Cada ocurrencia de la respuesta de evasión impide la entrega de la
estímulo aversivo durante un período fijo, que se denomina intervalo R – S.
EVITACIÓN O NE-WAY : Un procedimiento de acondicionamiento de evitación en el que el
La respuesta requerida para evitar un choque es siempre cruzar desde un compartimento de
una caja de lanzadera a la otra en la misma dirección.
O PERANT COMPORTAMIENTO : Comportamiento que se define por el efecto que produce en el
medio ambiente. Los ejemplos incluyen presionar una palanca y abrir una puerta. Alguna
La secuencia de movimientos que presiona la palanca o abre la puerta constituye
una instancia de ese comportamiento operante particular.
O PERANT ACONDICIONADO : forma A de condicionamiento instrumental en el que la
La respuesta requerida para el refuerzo es una respuesta operante, identificada por su
efecto en la manipulación del medio ambiente de alguna manera.
O RIENTING RESPUESTA : Una reacción a un nuevo estímulo que normalmente implica
volviéndose hacia la fuente del estímulo.
O VEREXPECTATION : expectativa de un estímulo no condicionado que es mayor que
lo que realmente ocurre. La sobreexpectación suele producirse entrenando a cada uno de los
dos estímulos condicionados por separado con el mismo estímulo incondicionado y
luego presentando esos dos estímulos condicionados al mismo tiempo.
O VERSHADOWING : Interferencia con el condicionamiento de un estímulo debido a la
presencia simultánea de otro estímulo más fácil de condicionar.
O VERTRAINING EXTINCION EFECTO : Menos persistencia de la conducta instrumental
en extinción después de un entrenamiento extenso con refuerzo (sobreentrenamiento) que
después de solo niveles moderados de entrenamiento de refuerzo.
P ARADOXICAL RECOMPENSA EFECTO : Un fenómeno en el que hay más
respondiendo en extinción después del entrenamiento con menos, más intermitentes o
reforzadores más pequeños.
P ARTIAL REFUERZO : horario A de refuerzo en la que sólo algunos
Página 311
Se refuerzan las ocurrencias de la respuesta instrumental. También llamado
refuerzo intermitente.
P ARTIAL-EXTINCION DE REFUERZO EFECTO : Mayor persistencia de
respuesta instrumental en extinción después de refuerzo parcial (intermitente)
entrenamiento que después del entrenamiento de refuerzo continuo. PREE abreviado.
P ERCEPTUAL CONCEPTO : Respuesta de la misma manera a un conjunto de diferentes físicamente
estímulos (por ejemplo, imágenes de varios tipos de perros) que pertenecen al mismo
categoría perceptual (perro).
P ENDIMIENTO : conductas observables de un organismo o actividades en un determinado
tiempo.
P ERSISTENCIA : La ejecución continuada de una respuesta instrumental después de una
Se ha introducido el procedimiento de extinción.
P ositivo MOTIVO AJUSTE : Igual que la facilitación.
P OSTREINFORCEMENT PAUSA : Una pausa en la respuesta que se produce normalmente después de
la entrega del reforzador o al comienzo de una prueba en relación fija y fija-
programas de intervalos de refuerzo.
P RÁCTICA : Repetición de una respuesta o comportamiento, por lo general con la intención de
mejorando el desempeño.
INMINENCIA P REDATORIA : La probabilidad percibida de ser atacado por un
depredador. Se supone que las diferentes respuestas de defensa típicas de las especies son
realizado frente a diferentes grados de inminencia depredadora.
PRINCIPIO DE P REMACK : Dadas dos respuestas con diferentes probabilidades de referencia
de ocurrencia, la oportunidad de realizar la respuesta de mayor probabilidad
reforzar o aumentar el rendimiento del comportamiento de menor probabilidad.
P RIMARY REFORZADOR : Un reforzador que es eficaz sin acondicionamiento previo.
INTERFERENCIA P ROACTIVA : Interrupción de la memoria por exposición a estímulos antes
el evento para ser recordado.
SEÑAL P ROPRIOCEPTIVA : Un estímulo de retroalimentación de respuesta interna que surge de
el movimiento de un músculo y / o articulación.
MEMORIA P ROSPECTIVA : Memoria de un plan de acción futura. También llamado
prospección.
P UNISHMENT : Un tipo de procedimiento de acondicionamiento instrumental en el que
La ocurrencia de la respuesta instrumental da como resultado la entrega de una reacción aversiva.
estímulo.
CAJA P UZZLE : Un tipo de cámara experimental utilizada por Thorndike para estudiar
condicionamiento instrumental. El participante fue puesto en la cámara y tuvo que
realizar un comportamiento específico para ser liberado y obtener un reforzador.
Página 312
ASOCIACIÓN R – O : Una asociación entre la respuesta instrumental (R) y

el reforzador o resultado de la respuesta (O).
INTERVALO R – S : El intervalo entre la aparición de una respuesta de evasión
y la próxima presentación programada del estímulo aversivo en un
procedimiento de evitación no discriminado.
R ANDOM CONTROL : Un procedimiento de control para el acondicionamiento pavloviano en el que el
Los estímulos condicionados e incondicionados se presentan en momentos aleatorios relativos
el uno al otro.
R ATE de responder : Una medida de con qué frecuencia se repite una respuesta en una unidad
de tiempo, por ejemplo, el número de respuestas que ocurren por minuto.
R ATIO
pausaRUN : La tasa
posterior alta y constante
al refuerzo de respuesta
en programas observada
de refuerzo después
de razón fija. de
La la
relación de ejecución
finaliza cuando se ha realizado el número necesario de respuestas, resultando
en la entrega del reforzador.
HORARIO DE R ATIO : Un programa de refuerzo en el que el refuerzo depende
sólo en el número de respuestas que realiza el participante, independientemente de
cuando ocurren estas respuestas.
R ECONSOLIDACIÓN : La consolidación de una memoria reactivada (como contrasta
con consolidación de una memoria recién adquirida).
R EFERENCIA MEMORIA : La retención de la información de fondo de un participante
necesita terminar una tarea o responder con éxito en una situación. (Comparar con
memoria de trabajo. ) R EFLEX : Unidad de comportamiento provocado que involucra un
evento ambiental y su correspondiente respuesta específica provocada.
ARCO R EFLEX : Estructuras neurales, que consisten en la neurona aferente (sensorial),
interneurona y neurona eferente (motora), que permiten que un estímulo provoque una
respuesta refleja.
R EINFORCER : un estímulo cuya entrega poco después de una respuesta aumenta
la probabilidad futura de esa respuesta; también llamado resultado.
R EINSTATEMENT : Recuperación de responder a un estímulo excitador extinguido
producido por exposiciones al estímulo incondicionado.
R ELEASING ESTÍMULO : Igual que el estímulo señal.
R ENOVACIÓN : Recuperación de la excitación respondiendo a un estímulo extinguido
producido por un cambio de las señales contextuales que estaban presentes durante
extinción.
R ASIGNACIÓN DE RESPUESTA : La distribución de las respuestas instrumentales entre las
Varias opciones disponibles en la situación.
R ESPUESTA PRIVACIÓN HIPÓTESIS : Una explicación de refuerzo
Página 313
según el cual el acceso reducido a una respuesta particular es suficiente para

Haga de la oportunidad de realizar esa respuesta un reforzador positivo eficaz.
PRUEBA DE R ETARDACIÓN DE ADQUISICIÓN : procedimiento de prueba que identifica un estímulo
como un inhibidor condicionado si ese estímulo es más lento para adquirir condicionado
propiedades excitatorias que un estímulo de comparación neutral.
INTERVALO DE R ETENCIÓN : El período de tiempo entre la adquisición de información
y una prueba de memoria para esa información.
R ETRIEVAL CUE : Un estímulo relacionado con una experiencia que facilita la retirada de
otra información relacionada con esa experiencia.
R ETRIEVAL ETAPA : La tercera etapa necesaria para rendimiento de la memoria en la que
la información que se ha retenido se recupera del almacenamiento para su uso actual.
INTERFERENCIA R ETROACTIVA : Interrupción de la memoria por exposición a estímulos.
después del evento para ser recordado.
MEMORIA R ETROSPECTIVA : Memoria de un hecho vivido previamente.
S + : un estímulo discriminativo que señala la disponibilidad de refuerzo para un

respuesta instrumental.
S - : Un estímulo discriminativo que señala la ausencia de refuerzo para un
respuesta instrumental.
ASOCIACIÓN S – O : una asociación entre un estímulo (S) en presencia de
en el que se refuerza una respuesta instrumental y el reforzador o respuesta
resultado (O).
ASOCIACIÓN S – R : una asociación entre un estímulo y una respuesta, que permite
presentación del estímulo para provocar la respuesta.
APRENDIZAJE S – R : El aprendizaje de una asociación entre un estímulo y un
respuesta, con el resultado de que el estímulo llega a provocar la respuesta.
SISTEMA S – R : La vía neuronal más corta para el comportamiento provocado que conecta el
órganos de los sentidos estimulados por un estímulo y los músculos implicados en
respuesta provocada.
ASOCIACIÓN S (R – O) : Una relación de orden superior en el condicionamiento instrumental
situaciones, según las cuales un estímulo discriminativo o contextual (S)
activa una asociación entre la respuesta instrumental y el reforzador
(R – O).
INTERVALO S – S : El intervalo entre presentaciones sucesivas del aversivo
estímulo en un procedimiento de evitación no discriminado cuando la evitación
no se realiza la respuesta.
APRENDIZAJE S – S : Igual que el aprendizaje por estímulo-estímulo.
S EGURIDAD SIGNAL : Un estímulo que las señales de la ausencia de un evento aversivo.
Página 314
S ALIENCIA : La calidad de un estímulo que lo hace efectivo para atraer la atención.

y comportamiento controlador. Los estímulos más intensos suelen ser más destacados.
S CHEDULE LÍNEA : la línea A en un gráfico de las tasas de instrumental y reforzador
respuestas que indican cuánto acceso a la actividad reforzadora se proporciona para
Varias tasas de respuesta instrumental en un programa particular de
reforzamiento.
S CHEDULE DE REFUERZO : Un programa o regla que determina qué
la ocurrencia de una respuesta instrumental u operante es seguida por la entrega de
el reforzador.
S ECONDARY REFORZADOR : Igual que el refuerzo condicionado.
S ELECCIÓN ASOCIACIONES : Asociaciones que se forman más fácilmente entre
una combinación de estímulos condicionados e incondicionados que entre otros
combinaciones.
S ELF-CONTROL : La elección de una gran recompensa retrasada sobre una inmediata pero
recompensa menor.
S ENSITIZATION EFECTO : Un aumento en el vigor de la conducta suscitó que pueden
resultado de presentaciones repetidas del estímulo provocador o una intensa
evento no relacionado.
NEURONA S ENSORIA : Igual que la neurona aferente.
REFUERZO S ENSORY : Refuerzo proporcionado por la presentación de un
estímulo no relacionado con una necesidad o impulso biológico.
TEORÍA S EQUENCIAL : una teoría del efecto de extinción por refuerzo parcial
según el cual la extinción se retarda después del refuerzo parcial porque
la respuesta instrumental se condiciona al recuerdo de la falta de recompensa.
S HAPING : Refuerzo de aproximaciones sucesivas a un objetivo instrumental
respuesta, que normalmente se utiliza para condicionar respuestas que no están en el
repertorio de comportamiento existente. Dar forma depende de la disponibilidad conductual.
S HORT PLAZO habituación : Un efecto de habituación que dura un tiempo relativamente corto
período de tiempo, a veces menos de un minuto.
S HORT PLAZO SENSIBILIZACIÓN : Una forma de sensibilización que dura un tiempo relativamente corto
período de tiempo, a veces menos de un minuto.
S HUTTLE BOX : Aparato para el estudio de la conducta de evitación que consta de
dos compartimentos adyacentes. La respuesta de evitación implica pasar de
un compartimento al otro (es decir, ir de un compartimento a otro).
ESTÍMULO S IGN : La característica específica de un objeto o animal que provoca una
patrón de acción en otro organismo.
SEGUIMIENTO DE S IGN : Una forma de condicionamiento clásico apetitivo en el que un
Página 315
El estímulo sirve como estímulo condicionado. Durante el transcurso de

condicionamiento, el participante llega a acercarse (seguir) y a veces
manipular el estímulo condicionado.
ACONDICIONAMIENTO S IMULTÁNEO : Un procedimiento de acondicionamiento pavloviano en el que
el estímulo condicionado y el estímulo incondicionado se presentan
simultáneamente en cada prueba de acondicionamiento.
EMPAREJAMIENTO S IMULTÁNEO CON LA MUESTRA : procedimiento en el que los participantes
reforzado para responder a un estímulo de prueba que es el mismo que una muestra
estímulo. La muestra y los estímulos de prueba se presentan al mismo tiempo.
S INGLE-SUJETO Experimento : Un tipo de experimento en el que el aprendizaje es
investigado a través de la observación extensa del comportamiento de un solo
individual. El comportamiento del individuo debe entenderse suficientemente bien para
permitir suposiciones precisas sobre cómo se habría comportado el participante si
él o ella no había recibido el procedimiento de formación.
CAJA S KINNER : Una pequeña cámara experimental provista de algo
El participante puede manipular repetidamente, como una palanca de respuesta o un joystick.
Esto permite al participante realizar una respuesta particular repetidamente sin
ser retirado de la situación experimental. La cámara también tiene un
mecanismo que puede proporcionar un reforzador, como una bolita de comida o un sorbo de
jugo.
S pecies ESPECÍFICOS reacciones de defensa : respuestas de los individuos típicas de la especie
actuar en situaciones aversivas. Las respuestas pueden incluir congelación, huida o
luchando.
S pecies-comportamiento típico : Comportamiento que es característico de la mayoría de los miembros de
una especie en particular.
S PONTANEOUS RECUPERACIÓN : Recuperación de una respuesta producida por un período de descanso
después de la habituación o extinción.
SSDR: abreviatura de reacción de defensa específica de especie.
RESPUESTA S TARTLE : Un salto repentino o tensión de los músculos que puede ocurrir
cuando se presenta un estímulo inesperado.
S TATE SISTEMA : estructuras neuronales que determinan el nivel general del organismo de
capacidad de respuesta o disposición para responder.
DIMENSIÓN DE S TIMULUS : La característica (por ejemplo, el color) que distingue una serie de
estímulos en una prueba de generalización de estímulos.
S timulus DISCRIMINACIÓN : responder diferencial en presencia de dos o
más estímulos.
EQUIVALENCIA DE S TIMULUS : Responder a estímulos físicamente distintos en el mismo
Página 316
moda debido a experiencias previas comunes con los estímulos.

GENERALIZACIÓN DE S TIMULUS : La ocurrencia de la conducta aprendida a través de
habituación o condicionamiento en presencia de estímulos que son diferentes de
el estímulo particular que se utilizó durante el entrenamiento.
S timulus GENERALIZATION GRADIENTE : Un gradiente de responder que puede ser
observado si los participantes son evaluados con estímulos que difieren cada vez más de
el estímulo que se utilizó durante el entrenamiento.
APRENDIZAJE DE S TIMULUS-ESTIMULUS : El aprendizaje de una asociación entre dos
estímulos, de manera que la presentación del primer estímulo activa un
representación del segundo.
S PISTA DE CALLEJÓN RECTO : Un callejón recto con una casilla de inicio en un extremo y una portería.
caja en el otro. Los animales se colocan en la casilla de inicio al comienzo de una prueba.
y se le permitió correr hacia el área de gol.
PRUEBA DE S UMACIÓN : Prueba de inhibición condicionada en la que se responde a una
La señal excitadora presentada simultáneamente con un inhibidor condicionado es
en comparación con responder a la señal excitadora presentada sola (o con una
estímulo neutral). El inhibidor condicionado suprime la respuesta que es
de lo contrario observado a la señal excitadora.
APRENDIZAJE DE AVERSIÓN DEL T ASTE : Un tipo de acondicionamiento pavloviano en el que el gusto
de un alimento nuevo sirve como estímulo condicionado y la enfermedad sirve como
estímulo incondicionado. Las aversiones gustativas se pueden aprender incluso si la enfermedad es
retrasado varias horas después de la exposición al sabor.
CODIFICACIÓN T EMPORAL : Codificación de los parámetros temporales específicos de un
procedimiento de acondicionamiento; aprendiendo no solo que el CS está emparejado con los EE. UU. sino que
exactamente cuando ocurre EE. UU. en relación con la CS.
CONTIGUIDAD T EMPORAL : La ocurrencia simultánea de dos o más eventos.
CUES T EMPORALES : Estímulos relacionados con el paso del tiempo.
T IME-OUT : Un período durante el cual la oportunidad de obtener refuerzos es
remoto. Esto puede implicar la remoción del participante de la situación en
qué reforzadores pueden obtenerse.
T -MAZE : Un laberinto con una caja de inicio que se abre a un callejón recto, al final de
que el participante puede girar a la derecha oa la izquierda para llegar al cuadro de meta.
ACONDICIONAMIENTO T RACE : Un procedimiento de acondicionamiento clásico en el que el
El estímulo incondicionado se presenta en cada ensayo después del condicionado.
el estímulo ha finalizado durante un breve período.
T RACE INTERVAL : El intervalo entre el final del estímulo condicionado y
el comienzo del estímulo incondicionado en un procedimiento de acondicionamiento de trazas.
Página 317
El intervalo de seguimiento suele ser mucho más corto que el intervalo entre ensayos.
TEORÍA DEL FACTOR T WO : Una teoría del aprendizaje por evitación que involucra dos formas de
condicionamiento: (a) condicionamiento pavloviano del miedo a un estímulo que señala
estimulación aversiva y (b) condicionamiento instrumental de la evitación
respuesta mediante la reducción del miedo.
T WO-WAY EVITAR : Un procedimiento para evitar la lanzadera en la que los ensayos puede comenzar en
cualquier compartimento de una caja de transporte; la respuesta de evitación consiste en ir
ida y vuelta del compartimento ocupado al desocupado
compartimiento.
U NCONDITIONED RESPUESTA : respuesta A que se produce a un estímulo sin el
necesidad de entrenamiento o acondicionamiento previo.
U NCONDITIONED STIMULUS : Un estímulo que provoca vigorosas de responder en el
ausencia de formación previa. Estados Unidos abreviado.
T NPAIRED CONTROL DE PROCEDIMIENTO : procedimiento de control A para el condicionamiento clásico
en el que tanto el estímulo condicionado como el estímulo incondicionado son
presentados periódicamente pero nunca juntos.
DEVALUACIÓN DE ESTADOS UNIDOS : Un procedimiento que reduce la eficacia o el valor de un
estímulo incondicionado para provocar un comportamiento incondicionado.
INFLACIÓN DE ESTADOS UNIDOS : procedimiento que aumenta la eficacia o el valor de un
estímulo incondicionado para provocar un comportamiento incondicionado.
HORARIO V ARIABLE-INTERVALO : Un programa de refuerzo en el que el
El reforzador se proporciona para la primera respuesta que se produce después de una cantidad variable.
de tiempo desde el último reforzador.
HORARIO DE RATIO V ARIABLE : Un programa de refuerzo en el que el número
de las respuestas necesarias para obtener el reforzador varía de una prueba a otra. los
El valor del cronograma se refiere al número promedio de respuestas requeridas para
reforzamiento.
W MEMORIA DE TRABAJO : La retención de la información que se necesita sólo para
realizar la tarea en cuestión, en contraste con la memoria de referencia, que
implica información de fondo que también es necesaria para futuras tareas similares.
Página 318
Referencias
Akins, CK (2000). Efectos de las señales específicas de la especie y el intervalo CS-US en

la topografía de la respuesta sexualmente condicionada. Aprendizaje y
Motivación , 31 , 211-235. http://dx.doi.org/10.1006/lmot.2000.1050
Alberini, CM y LeDoux, JE (2013). Reconsolidación de la memoria. Actual
Biología , 23 , R746 – R750. http://dx.doi.org/10.1016/j.cub.2013.06.046
Alcock, J. (2013). Comportamiento animal: un enfoque evolutivo (décima ed.).
Sunderland, MA: Sinauer Associates.
Allan, LG (2005). Introducción al "Aprendizaje de relaciones contingentes"
[Especial asunto]. Aprendiendo Y comportamiento 3, 3 , 127-129.
http://dx.doi.org/10.3758/BF03196057
Allison, J. (1983). Economía del comportamiento . Nueva York, NY: Praeger.
Allison, J. (1989). La naturaleza del refuerzo. En SB Klein y RR Mowrer
(Eds.), Teorías contemporáneas del aprendizaje: teoría del condicionamiento instrumental
y el impacto de las limitaciones biológicas en el aprendizaje (págs. 13–39). Hillsdale,
NJ: Erlbaum.
Allison, J. y Timberlake, W. (1974). Sacarina instrumental y contingente
lamiendo en ratas: respuesta de privación y refuerzo. Aprendizaje y
Motivation , 5 , 231–247. http://dx.doi.org/10.1016/0023-9690(74)90029-0
Amsel, A. (1958). El papel de la no recompensa frustrante en la recompensa discontinua
situaciones. Psicológico Boletín , 55 , 102-119.
http://dx.doi.org/10.1037/h0043125
Amsel, A. (1992). Teoría de la frustración: un análisis del aprendizaje disposicional y
la memoria . Cambridge, Inglaterra: Cambridge Universidad Presionar.
http://dx.doi.org/10.1017/CBO9780511665561
Página 319
Amsel, A. y Rashotte, ME (1984). Mecanismos de comportamiento adaptativo: Clark

Trabajos teóricos de L. Hull, con comentarios . Nueva York, NY: Columbia
Prensa Universitaria.
Andrzejewski, ME, Cardinal, CD, Field, DP, Flannery, BA, Johnson, M.,
Bailey, K. y Hineline, PN (2005). Elecciones de las palomas entre intervalo fijo
y programas de intervalos aleatorios: ¿utilidad de la variabilidad? Diario de la
Experimental Análisis de comportamiento , 83 , 129-145.
http://dx.doi.org/10.1901/jeab.2005.30-04
Angelakis, I. y Austin, JL (2015). Mantenimiento de comportamientos de seguridad mediante
estímulos producidos por la respuesta. Modificación de la conducta , 39 , 932–954.
http://dx.doi.org/10.1177/0145445515610314
Ira, D. (1963). El papel de las discriminaciones temporales en el refuerzo de
Comportamiento de evitación de Sidman. Revista del Análisis Experimental de
Behavior , 6 , 477–506. http://dx.doi.org/10.1901/jeab.1963.6-s477
Anselme, P. y Robinson, MJF (2016). "Querer", "gustar" y su
relación con la conciencia. Journal of Experimental Psychology: Animal
Aprendizaje y cognición , 42 , 123–140. http://dx.doi.org/10.1037/xan0000090
Auber, A., Tedesco, V., Jones, CE, Monfils, MH y Chiamulera, C. (2013).
Extinción posterior a la recuperación como interferencia de la reconsolidación: metodológica
problemas o condiciones de frontera? Psicofarmacología , 226 , 631–647.
http://dx.doi.org/10.1007/s00213-013-3004-1
Ayres, JJB (2012). Supresión condicionada. En NM Seel (Ed.),
Enciclopedia de las ciencias del aprendizaje (págs. 749–751). Nueva York, NY:
Springer Science.
Azorlosa, JL y Cicala, GA (1986). Bloqueo de la supresión condicionada
con 1 o 10 ensayos compuestos. Aprendizaje y comportamiento de los animales , 14 , 163-167.
http://dx.doi.org/10.3758/BF03200051
Azrin, NH (1959). Castigo y recuperación durante el desempeño de proporción fija.
Journal of the Experimental Analysis of Behavior , 2 , 301-305.
Azrin, NH (1960). Efectos de la intensidad del castigo durante el intervalo variable
reforzamiento. Journal of the Experimental Analysis of Behavior , 3 , 123-142.
Azrin, NH y Holz, WC (1961). Castigo durante el intervalo fijo
reforzamiento. Journal of the Experimental Analysis of Behavior , 4 , 343–347.
Azrin, NH y Holz, WC (1966). Castigo. En WK Honig (Ed.), Operant
Página 320
comportamiento: áreas de investigación y aplicación (págs. 380–447). Nueva York, NY:

Azrin, NH, Holz, WC y Hake, DF (1963). Castigo de proporción fija.
Baerends, GP (1988). Etología. En RC Atkinson, RJ Herrnstein, G.
Lindzey y RD Luce (Eds.), Manual de psicología experimental de Stevens
(Vol. 1, págs. 765–830). Nueva York, NY: Wiley.
Balaz, MA, Kasprow, WJ y Miller, RR (1982). Bloqueo con un solo
ensayo compuesto. Aprendizaje y comportamiento de los animales , 10 , 271–276.
Balci, F., Gallistel, CR, Allen, BD, Frank, KM, Gibson, JM y Brunner,
D. (2009). Adquisición de respuesta máxima: ¿Qué se aprende? Conductual
Balsam, PD, Deich, JD, Ohyama, T. y Stokes , PD (1998). Orígenes de lo nuevo
comportamiento. En W. O'Donohue (Ed.), Terapia de aprendizaje y conducta (págs. 403–
420). Boston, MA: Allyn y Bacon.
Balsam, PD, Drew, MR y Gallistel, C. R. (2010). Tiempo y asociado
aprendiendo. Revisiones comparativas de cognición y comportamiento , 5 , 1–22.
http://dx.doi.org/10.3819/ccbr.2010.50001
Balsam, PD y Gallistel, CR (2009). Mapas temporales e informatividad en
de asociación aprendiendo. Tendencias en Ne urosciences , 32 , 73–78.
http://dx.doi.org/10.1016/j.tins.2008.10.004
Balsam, PD y Tomie, A. (Eds.). (1985). Contexto y condicionamiento . Hillsdale,
NJ: Erlbaum.
Bandarian Balooch, S. y Neumann, DL (2011) . Efectos de múltiples contextos
similitud de contexto sobre la renovación de la conducta condicionada extinguida en
un diseño ABA con humanos. Aprendizaje y motivación , 42 , 53–63.
http://dx.doi.org/10.1016/j.lmot.2010.08.008
Baron, A. y Menich, SR (1985). Tiempos de reacción de hombres jóvenes y mayores:
Efectos de las muestras compuestas y una señal de preelección sobre el emparejamiento retrasado
actuaciones de muestra. Revista del análisis experimental de la conducta , 44 ,
1-14. http://dx.doi.org/10.1901/jeab.1985.44-1
Barrett, D. (2010). Estímulos supernormales: cómo los impulsos primarios invadieron sus
propósito evolutivo . Nueva York, NY: Norton.
Bashinski, HS, Werner, JS y Rudy, JW (1985). Determinantes del lactante
Fijación visual: evidencia de una teoría de dos procesos . Diario de Experimental
Niño psicología , 39 , 580–598. http://dx.doi.org/10.1016/0022-
Página 321
0965 (85) 90058-X

Baum, M. (1970). Extinción de la evitación respondiendo a través de la respuesta
prevención (inundación). Psicológico Boletín , 74 , 276–284.
http://dx.doi.org/10.1037/h0029789
Baum, WM (1974). Sobre dos tipos de desviación de la ley de concordancia: Sesgo
e incoherente. Revista del análisis experimental de la conducta , 22 ,
Bechterev, VM (1913). Objetivo de lapsychologie . París, Francia: Alcan.
Benedict, JO y Ayres, JJB (1972). Factores que afectan el condicionamiento en el
procedimiento de control verdaderamente aleatorio en la rata. Revista de comparativos y
Psicología fisiológica , 78 , 323–330. http://dx.doi.org/10.1037/h0032296
Beran, MJ, Evans, TA, Klein, ED y Einstein, GO (2012). Rhesus
monos ( Macaca mulatta ) y monos capuchinos ( Cebus apella ) recuerda
respuestas futuras en una tarea informatizada. Diario de Experimental
Psicología: Animal ComportamientoProcesos , 38 , 233–243.
http://dx.doi.org/10.1037/a0027796
Berlyne, DE (1969). El valor de recompensa de la estimulación indiferente. En J. Tapp
(Ed.), Refuerzo y comportamiento (págs. 178-214). Nueva York, NY: Académico
Presionar. http://dx.doi.org/10.1016/B978-0-12-683650-9.50012-1
Mejor, MR, Dunn, DP, Batson, JD, Meachum, CL y Nash, SM (1985).
Extinción de la inhibición condicionada en el aprendizaje de la aversión al sabor: efectos de
prueba repetida y extinción del elemento excitador. Diario trimestral
de Psicología Experimental B: Psicología comparada y fisiológica ,
37 , 359–378. http://dx.doi.org/10.1080/14640748508401175
Bevins, RA y Murray, JE (2011). Estímulos internos generados por abusados
sustancias: papel del condicionamiento pavloviano y sus implicaciones para las drogas
adiccion. En TR Schachtman & S. Reilly (Eds.), Aprendizaje asociativo y
teoría del condicionamiento: aplicaciones humanas y no humanas (págs. 270-289). Nuevo
York, NUEVA YORK: Oxford Universidad Presionar.
http://dx.doi.org/10.1093/acprof:oso/9780199735969.003.0084
Bickel, WK, Koffarnus, MN, Moody, L. y Wilson, AG (2014). los
proceso conductual y neuroeconómico de descuento temporal: un candidato
marcador conductual de adicción. Neurofarmacología , 76 (Parte B), 518-527.
Blaisdell, AP, Gunther, LM y Miller, RR (1999). Recuperación del bloqueo
logrado extinguiendo el bloqueo CS. Aprendizaje y comportamiento animal , 27 ,
63–76. http://dx.doi.org/10.3758/BF03199432
Blass, EM, Ganchrow, JR y Steiner, JE (1984). Acondicionamiento clásico en
Página 322
humanos recién nacidos de 2 a 48 horas de edad. Comportamiento y desarrollo infantil , 7 , 223–

235. http://dx.doi.org/10.1016/S0163-6383(84)80060-0
Boakes, RA (1979). Interacciones entre procesos tipo I y tipo II
involucrando rienda positiva para el cemento. En A. Dickinson y RA Boakes (Eds.),
Mecanismos de aprendizaje y motivación (págs. 233–268). Hillsdale, Nueva Jersey:
Erlbaum.
Boakes, RA, Poli, M., Lockwood, MJ y Goodall, G. (1978). Un estudio de
mala conducta: Refuerzo de fichas en la rata. Diario de lo experimental
Analysis of Behavior , 29 , 115-134. http://dx.doi.org/10.1901/jeab.1978.29-
115
Boddez, Y., Baeyens, F., Hermans, D. y Beckers, T. (2011). El escondite
de revalorización retrospectiva: la recuperación del bloqueo depende del contexto en
aprendizaje causal humano. Journal of Experimental Psychology: Animal
Procesos de comportamiento , 37 , 230-240. http://dx.doi.org/10.1037/a0021460
Bolles, RC (1969). Evitación y aprendizaje de escape: adquisición simultánea
de diferentes respuestas. Revista de fisiología y comparativa
Psicología , 68 , 355–358. http://dx.doi.org/10.1037/h0027536
Bolles, RC (1970). Reacciones de defensa específicas de la especie y aprendizaje de evitación.
Psychological Review , 77 , 32–48. http://dx.doi.org/10.1037/h0028589
Borovsky, D. y Rovee-Collier, C. (1990). Restricciones contextuales de la memoria
recuperación a los seis meses. Child Development , 61 , 1569-1583.
http://dx.doi.org/10.2307/1130765
Bossert, JM, Marchant, Nueva Jersey, Calu, DJ y Shaham, Y. (2013). los
modelo de restablecimiento de la recaída farmacológica: hallazgos neurobiológicos recientes,
temas de investigación emergentes e investigación traslacional. Psicofarmacología ,
229 , 453–476. http://dx.doi.org/10.1007/s00213-013-3120-y
Bouton, ME (1993). Recuperación de contexto, tiempo y memoria en la interferencia
paradigmas del aprendizaje pavloviano. Psychological Bulletin , 114 , 80-99.
http://dx.doi.org/10.1037/0033-2909.114.1.80
Bouton, ME (1994). Condicionando, recordando y olvidando. Diario de
http://dx.doi.org/10.1037/0097-7403.20.3.219
Bouton, ME (2014). Por qué el cambio de comportamiento es difícil de mantener. Preventivo
Medicina: una revista internacional dedicada a la práctica y la teoría , 68 , 29–
36. http://dx.doi.org/10.1016/j.ypmed.2014.06.010
Página 323
32. http://dx.doi.org/10.1037/0033-295X.108.1.4
Bouton, ME, Trask, S. y Carranza-Jasso, R. (2016). Aprendiendo a inhibir el
respuesta durante la extinción instrumental (operante). Diario de Experimental
Psicología: aprendizaje y cognición animal , 42 , 246-258.
http://dx.doi.org/10.1037/xan0000102
Bouton, ME y Woods, AM (2008). Extinción: Mecanismos de comportamiento y
sus implicaciones. En JH Byrne (Ed.), Teoría y comportamiento del aprendizaje: Vol. 1.
Aprendizaje y memoria: una referencia completa (págs. 151-172). Oxford,
Inglaterra: Elsevier.
Bower, GH y Hilgard, ER (1981). Teorías del aprendizaje (5ª ed.).
Englewood Cliffs, Nueva Jersey: Prentice Hall.
Bradley, MM, Moulder, B. y Lang, PJ (2005). Cuando las cosas buenas van mal:
La fisiología refleja de la defensa. Psychological Science , 16 , 468–473.
Breland, K. y Breland, M. (1961). El mal comportamiento de los organismos. americano
Psicólogo , 16 , 681–684. http://dx.doi.org/10.1037/h0040090
Brooks, DC (2000). Las señales de extinción recientes y remotas reducen
recuperación. The Quarterly Journal of Experimental Psychology , 53 , 25–58.
http://dx.doi.org/10.1080/027249900392986
Brooks, DC y Bouton, ME (1993). Una señal de recuperación para la extinción atenúa
Recuperacion espontanea. Journal of Experimental Psychology: Animal Behavior
Procesos , 19 , 77–89. http://dx.doi.org/10.1037/0097-7403.19.1.77
Burns, M. y Domjan, M. (2001). Topografía de condicionada espacialmente dirigida
responder: Efectos del contexto y la duración del ensayo. Diario de Experimental
Psicología: Animal ComportamientoProcesos , 27 , 269-278.
http://dx.doi.org/10.1037/0097-7403.27.3.269
Cain, CK y LeDoux, JE (2007). Escape from fear: un comportamiento detallado
análisis de dos respuestas atípicas reforzadas por la terminación de CS. Diario de
http://dx.doi.org/10.1037/0097-7403.33.4.451
Calder, A. y White, K. (2014). En busca de consolidación de la memoria a corto plazo
en animales no humanos. Aprendizaje y comportamiento , 42 , 83–92.
http://dx.doi.org/10.3758/s13420-013-0127-5
Camp, DS, Raymond, GA y Church, RM (1967). Relación temporal
entre respuesta y castigo. Revista de psicología experimental , 74 ,
114-123. http://dx.doi.org/10.1037/h0024518
Campolattaro, MM, Schnitker, KM y Freeman, JH (2008). Cambios en
inhibición durante el acondicionamiento diferencial del parpadeo con un mayor entrenamiento.
Página 324
Aprendizaje y comportamiento , 36 , 159-165. http://dx.doi.org/10.3758/LB.36.2.159

Cándido, A., González, F. y de Brugada, I. (2004). Señales de seguridad de
Aprendizaje de evitación, pero no a partir de un pase de entrenamiento de acondicionamiento clásico en yugo.
pruebas de suma y de retardo para la inhibición. Procesos de comportamiento ,
66 , 153–160. http://dx.doi.org/10.1016/j.beproc.2004.01.011
Capaldi, EJ (1967). Una hipótesis secuencial de aprendizaje instrumental. En KW
Spence & JT Spence (Eds.), La psicología del aprendizaje y la motivación
(Vol. 1, págs. 67-156). Orlando, FL: Prensa académica.
Capaldi, EJ (1971). Memoria y aprendizaje: un punto de vista secuencial. En WK
Honig y PHR James (Eds.), Animal Memory (págs. 115-154). Orlando, FL:
Prensa académica.
Carroll, ME, Anker, JJ, Mach, JL, Newman, JL y Perry, JL (2010).
Retrasar el descuento como predictor del abuso de drogas. En GJ Madden y WK
Bickel (Eds.), Impulsividad: La ciencia conductual y neurológica de
descuento (págs. 243-271). Washington, DC: psicológico estadounidense
Asociación. http://dx.doi.org/10.1037/12069-009
Chance, P. (1999). Las cajas de rompecabezas de Thorndike y los orígenes del experimento
análisis de comportamiento. Revista del análisis experimental de la conducta , 72 ,
Charlop, MH, Kurtz, PF y Casey, FG (1990). Usar comportamientos aberrantes como
reforzadores para niños autistas. Journal of Applied Behavior Analysis , 23 ,
163-181. http://dx.doi.org/10.1901/jaba.1990.23-163
Iglesia, RM (1964). Efecto sistemático del error aleatorio en el control en yugo
diseño. Psicológico Boletín , 62 , 122-131.
http://dx.doi.org/10.1037/h0042733
Iglesia, RM (1969). Supresión de respuesta. En BA Campbell y RM
Church (Eds.), Castigo
Nueva York: y comportamiento aversivo (págs. 111-156). Nueva York,
Iglesia, RM (2012). Conductista, cognitivo, biológico y cuantitativo
explicaciones de la sincronización. En TR Zentall y EA Wasserman (Eds.), The
Manual de Oxford de cognición comparada (págs. 409–433). Nueva York, NY:
Oxford Universidad Presionar.
http://dx.doi.org/10.1093/oxfordhb/9780195392661.013.0022
Church, RM y Raymond, GA (1967). Influencia del horario de positivo
refuerzo de la conducta castigada. Revista de comparativos y
Psicología fisiológica , 63 , 329–332. http://dx.doi.org/10.1037/h0024382
Cole, MR (1999). Control molar y molecular en intervalo variable y
Página 325
Horarios de razón variable. Revista del análisis experimental de la conducta ,

71 , 319–328.
Cole, RP, Barnet, RC y Miller, RR (1997). Una evaluación de condicionada
inhibición definida por la estrategia de dos pruebas de Rescorla. Aprendizaje y
Motivación , 28 , 323–341. http://dx.doi.org/10.1006/lmot.1997.0971
Colombo, J. y Mitchell, DW (2009). Habituación visual infantil. Neurobiología
de Aprendiendo y la memoria , 92 , 225–234.
Colwill, RM y Rescorla, RA (1990). Evidencia de la estructura jerárquica
del aprendizaje instrumental. Aprendizaje y comportamiento de los animales , 18 , 71–82.
http://dx.doi.org/10.3758/BF03205241
Cook, RG, Brown, MF y Riley, DA (1985). Procesamiento de memoria flexible
por ratas: Uso de información prospectiva y retrospectiva en el laberinto radial.
Journal of Experimental Psychology: Animal Behavior Processes , 11 , 453–
469. http://dx.doi.org/10.1037/0097-7403.11.3.453
Craske, MG, Hermans, D. y Vansteenwegen, D. (Eds.). (2006). Miedo y
aprendizaje: de los procedimientos básicos a las implicaciones clínicas . Washington DC:
Asociacion Americana de Psicologia. http://dx.doi.org/10.1037/11474-000
Crossman, EK, Bonem, EJ y Phelps, BJ (1987). Una comparación de
patrones de respuesta en programas de razón fija, variable y aleatoria. Diario de
los Experimental Análisis de comportamiento 48, , 395–406.
Crystal, JD (2012a). Cognición prospectiva en ratas. Aprendizaje y motivación ,
43 , 181-191. http://dx.doi.org/10.1016/j.lmot.2012.05.006
Crystal, JD (2012b). Sensibilidad al tiempo: implicaciones para la representación de
tiempo. En TR Zentall & EA Wasserman (Eds.), The Oxford handbook of
cognición comparada (págs. 434–450). Nueva York, NY: Universidad de Oxford
Presionar.
Dallery, J. y Soto, PL (2013). Descripción cuantitativa del medio ambiente
relaciones de comportamiento. En GJ Madden (Ed.), Manual de conducta de la APA
análisis: Vol. 1. Métodos y principios (págs. 219–250). Washington DC:
D'Amato, MR, Fazzaro, J. y Etkin, M. (1968). Respuesta anticipada y
discriminación de evitación como factores en el condicionamiento de evitación. Diario de
Psicología experimental , 77 , 41–47. http://dx.doi.org/10.1037/h0025763
Danaher, BG (1974). Fundamentos teóricos y aplicaciones clínicas de la
Principio de Premack: revisión y crítica. Terapia de comportamiento , 5 , 307–324.
Página 326
http://dx.doi.org/10.1016/S0005-7894(74)80001-8
Dardano, JF y Sauerbrunn, D. (1964). Un estímulo aversivo como correlativo
contador de bloque en el rendimiento FR. Revista del Análisis Experimental de
Behavior , 7 , 37–43. http://dx.doi.org/10.1901/jeab.1964.7-37
Darwin, C. (1897). La descendencia del hombre y la selección en relación al sexo . Nuevo
Davis, M. (1970). Efectos de la variabilidad y la duración del intervalo entre estímulos en
habituación de respuesta de sobresalto en la rata. Revista de comparativos y
Psicología fisiológica , 72 , 177-192. http://dx.doi.org/10.1037/h0029472
Davis, M. (1974). Sensibilización de la respuesta de sobresalto de la rata por ruido. Diario de
Comparativo y Fisiológico psicología , 87 , 571–581.
http://dx.doi.org/10.1037/h0036985
Davis, M., Antoniadis, EA, Amaral, DG y Winslow, JT (2008). Acústico
reflejo de sobresalto en monos rhesus: una revisión. Reseñas en Neurociencias , 19 ,
171-185. http://dx.doi.org/10.1515/REVNEURO.2008.19.2-3.171
Dean, SJ y Pittman, CM (1991). Comportamiento auto punitivo: un análisis revisado.
En MR Denny (Ed.), Miedo, evitación y fobias (págs. 259-284).
Hillsdale, Nueva Jersey: Erlbaum.
Deich, JD, Allan, RW y Zeigler, HP (1988). Diferenciación conjuntiva
de boquiabierto durante el picoteo de la llave reforzada con la comida en la paloma. Aprendizaje animal y
Behavior , 16 , 268-276. http://dx.doi.org/10.3758/BF03209076
Delamater, AR (2012). Problemas en la extinción de un estímulo-resultado específico
asociaciones en el condicionamiento pavloviano. Procesos conductuales , 90 , 9-19.
Delamater, AR, Campese, V., LoLordo, VM y Sclafani, A. (2006).
Efectos de devaluación del estímulo incondicionado en el sabor acondicionado por nutrientes
preferencias. Journal of Experimental Psychology: Animal Behavior
Procesos , 32 , 295-306. http://dx.doi.org/10.1037/0097-7403.32.3.295
Delamater, AR y Lattal, KM (2014). El estudio del aprendizaje asociativo:
Mapeo de los niveles de análisis psicológico a neuronal. Neurobiología de
Aprendizaje y memoria , 108 , 1–4. http://dx.doi.org/10.1016/j.nlm.2013.12.006
Delamater, AR y Westbrook, RF (2014). Psicológico y neuronal
mecanismos de extinción experimental: una revisión selectiva. Neurobiología de
Aprendiendo y la memoria , 108 , 38–51.
Delaunay-El Allam, M., Soussignan, R., Patris, B., Marlier, L. y Schaal, B.
(2010). Memoria duradera de un olor adquirido en el pecho de la madre.
Página 327
Ciencia del desarrollo , 13 , 849–863. http://dx.doi.org/10.1111/j.1467-

7687.2009.00941.x
DeVito, PL y Fowler, H. (1987). Aumento de la inhibición condicionada a través de
un tratamiento de extinción. Aprendizaje y comportamiento de los animales , 15 , 448–454.
http://dx.doi.org/10.3758/BF03205055
Dickinson, A., Nicholas, DJ y Mackintosh, Nueva Jersey (1983). Un reexamen de
bloqueo de un ensayo en la supresión condicionada. El diario trimestral de
Experimental psicología , 35 , 67–79.
http://dx.doi.org/10.1080/14640748308400914
Dinsmoor, JA (1952). Una discriminación basada en el castigo. El trimestral
diario de Experimental psicología , 4, 27–45.
http://dx.doi.org/10.1080/17470215208416601
Dinsmoor, JA (2001). Estímulos inevitablemente generados por conductas que evitan
Las descargas eléctricas son inherentemente reforzadoras. Diario de lo experimental
311
Domjan, M. (1976). Determinantes de la mejora de la ingesta de agua aromatizada
por exposición previa. Journal of Experimental Psychology: Animal Behavior
Procesos , 2 , 17-27. http://dx.doi.org/10.1037/0097-7403.2.1.17
Domjan, M. (1977). Atenuación y mejora de la neofobia para comestibles.
sustancias. En LM Barker, MR Best y M. Domjan (Eds.), Learning
mecanismos en la selección de alimentos (págs. 151-179). Waco, TX: Universidad de Baylor
Presionar.
Domjan, M. (2005). Acondicionamiento pavloviano: una perspectiva funcional. Anual
Revisar de psicología , 56 , 179–206.
http://dx.doi.org/10.1146/annurev.psych.55.090902.141409
Domjan, M. (2015). El efecto de asociación selectiva García-Koelling: A
perspectiva histórica y personal. Revista internacional de comparativos
Psicología , 28 . Obtenido de http://escholarship.org/uc/item/5sx993rm
Domjan, M. (2016). Comportamiento provocado versus emitido: es hora de abandonar el
distinción. Journal of the Experimental Analysis of Behavior , 105 , 231–245.
http://dx.doi.org/10.1002/jeab.197
Domjan, M. y Akins, CK (2011). Aplicaciones del acondicionamiento pavloviano para
comportamiento sexual y reproducción. En TR Schachtman & S. Reilly (Eds.),
Teoría del condicionamiento y aprendizaje asociativo: humanos y no humanos
aplicaciones (págs. 507–531). Nueva York, NY: Oxford University Press.
Página 328
Domjan, M. y Gillan, D. (1976). Papel de la novedad en la aversión por

soluciones de sacarina cada vez más concentradas. Fisiología y comportamiento , 16 ,
537–542. http://dx.doi.org/10.1016/0031-9384(76)90211-0
Domjan, M. y Krause, M. (en prensa). Generalidad de las leyes del aprendizaje: de
limitaciones biológicas a las perspectivas ecológicas. En JH Byrne (Ed.),
Teoría del aprendizaje y la conducta: Vol. 1. Aprendizaje y memoria: A
referencia completa (2ª ed.). Oxford, Inglaterra: Elsevier.
Domjan, M., Mahometa, MJ y Matthews, RN (2012). Aprendiendo en intimidad
Conexiones: Fertilidad condicionada y su papel en la competencia sexual.
Socioafectivo Neurociencia Y psicología , 2, 17333.
http://dx.doi.org/10.3402/snp.v2i0.17333
Domjan, M. y Nash, S. (1988). Control de estímulos del comportamiento social en hombres
Codorniz japonesa, Coturnixcoturnixjaponica . Comportamiento animal , 36 , 1006-1015.
http://dx.doi.org/10.1016/S0003-3472(88)80060-5
Duhigg, C. (2012). El poder del hábito . Nueva York, NY: Random House.
Dunsmoor, JE, Niv, Y., Daw, N. y Phelps, EA (2015). Repensar
extinción. neurona , 88 , 47–63.
http://dx.doi.org/10.1016/j.neuron.2015.09.028
Edhouse, WV y White, KG (1988). Fuentes de interferencia proactiva en
memoria animal. Journal of Experimental Psychology: Animal Behavior
Eisenberger, R., Karpman, M. y Trattner, J. (1967). ¿Qué es lo necesario y
condición suficiente para el refuerzo en la situación de contingencia? Diario de
Psicología experimental , 74 , 342-350. http://dx.doi.org/10.1037/h0024719
Epstein, LH, Temple, JL, Roemmich, JN y Bouton, ME (2009).
La habituación como determinante de la ingesta alimentaria humana. Revisión psicológica ,
116 , 384–407. http://dx.doi.org/10.1037/a0015074
Esmorís-Arranz, FJ, Pardo-Vázquez, JL y Vázquez-García, GA (2003).
Efectos diferenciales del estímulo condicionado directo o simultáneo
intervalos de estímulo incondicionados en el sistema de comportamiento defensivo del
Rata de Noruega ( Rattus norvegicus ). Journal of Experimental Psychology: Animal
Procesos de comportamiento , 29 , 334–340. http://dx.doi.org/10.1037/0097-
7403.29.4.334
Fanselow, MS (1994). Organización neuronal del sistema de comportamiento defensivo.
responsable del miedo. Psychonomic Bulletin & Review , 1 , 429–438.
http://dx.doi.org/10.3758/BF03210947
Fanselow, MS, Lester, LS y Helmstetter, FJ (1988). Cambios en la alimentación
Página 329
y patrones de forrajeo como estrategia defensiva contra los depredadores: un laboratorio

simulación mediante estimulación aversiva en una economía cerrada. Diario de la
Experimental Análisis de comportamiento , 50 , 361–374.
Ferster, CB y Skinner, BF (1957). Horarios de refuerzo . Nueva York,
Nueva York: Appleton-Century-Crofts. http://dx.doi.org/10.1037/10627-000
Flagel, SB, Akil, H. y Robinson, TE (2009). Diferencias individuales en el
atribución de la prominencia del incentivo a las señales relacionadas con la recompensa: implicaciones para
adiccion. Neurofarmacología , 56 (Supl. 1), 139-148.
http://dx.doi.org/10.1016/j.neuropharm.2008.06.027
Flagel, SB, Clark, JJ, Robinson, TE, Mayo, L., Czuj, A., Willuhn, I.,. . .
Akil, H. (2011). Un papel selectivo de la dopamina en el aprendizaje de estímulo-recompensa.
Nature , 469 , 53–57. http://dx.doi.org/10.1038/nature09588
Foree, DD y LoLordo, VM (1973). Atención en la paloma: diferencial
efectos de los procedimientos de obtención de alimentos frente a los de evitar el impacto. Diario de
Comparativo y Fisiológico psicología , 85 , 551–558.
http://dx.doi.org/10.1037/h0035300
Forestell, PH y Herman, LM (1988). Coincidencia retrasada de materiales visuales
por un delfín nariz de botella ayudado por símbolos auditivos. Aprendizaje animal y
Behavior , 16 , 137-146. http://dx.doi.org/10.3758/BF03209056
Friedman, BX, Blaisdell, AP, Escobar, M. y Miller, RR (1998).
Mecanismos comparadores e inhibición condicionada: estímulo condicionado
la preexposición interrumpe la inhibición condicionada pavloviana, pero no explícitamente
inhibición indiferente. Journal of Experimental Psychology: Animal Behavior

Fudim, OK (1978). Preacondicionamiento sensorial de sabores con formalina
producida necesidad de sodio. Journal of Experimental Psychology: Animal
Procesos de comportamiento , 4 , 276–285. http://dx.doi.org/10.1037/0097-
7403.4.3.276
Galbicka, G. (1988). Diferenciar el comportamiento de los organismos. Diario de la
Experimental Análisis de comportamiento , 50 , 343–354.
Gallistel, CR y Gibbon, J. (2000). Tiempo, ritmo y acondicionamiento.
Psychological Review , 107 , 289–344. http://dx.doi.org/10.1037/0033-
295X.107.2.289
García, J., Ervin, FR y Koelling, RA (1966). Aprendizaje con retraso prolongado
de reforzamiento. Psiconómico la ciencia , 5, 121–122.
Página 330
http://dx.doi.org/10.3758/BF03328311
García, J. y Koelling, RA (1966). Relación de la señal con la consecuencia en
evitación aprendiendo. Psiconómico la ciencia , 4, 123-124.
http://dx.doi.org/10.3758/BF03342209
Gershoff, ET (2013). Nalgadas y desarrollo infantil: ahora sabemos lo suficiente
para dejar de golpear a nuestros hijos. Perspectivas del desarrollo infantil , 7 , 133-137.
http://dx.doi.org/10.1111/cdep.12038
Gershoff, ET (2016). ¿Debería el castigo físico de los padres a los niños
considerado una fuente de estrés tóxico que afecta el desarrollo del cerebro? Familia
Relations , 65 , 151-162. http://dx.doi.org/10.1111/fare.12177
Gillihan, SJ y Foa, EB (2011). Miedo a la extinción y al procesamiento emocional.
teoría: una revisión crítica. En TR Schachtman & S. Reilly (Eds.), Asociativo
Teoría del aprendizaje y el condicionamiento: aplicaciones humanas y no humanas (págs.
27–43). Nuevo York, NUEVA YORK:Oxford Universidad Presionar.
Goodall, G. (1984). Aprendizaje debido a la contingencia respuesta-shock en señalizado
castigo. Revista trimestral de psicología experimental B: comparativo
y Fisiológico psicología , 36 , 259-279.
http://dx.doi.org/10.1080/14640748408402206
Gormezano, I., Kehoe, EJ y Marshall, BS (1983). Veinte años de clásica
condicionando la investigación con el conejo. En JM Sprague y AN Epstein
(Eds.), Progreso en psicobiología y psicología fisiológica (Vol.10, pp.
197-275). Orlando, FL: Prensa académica.
Grace, RC y Hucks, AD (2013). La asignación de comportamiento operante. En GJ
Madden (Ed.), Manual de análisis de la conducta de la APA: Vol. 1. Métodos y
Grant, DS (1976). Efecto del tiempo de presentación de la muestra sobre la coincidencia de retardo prolongado
en los Paloma. Aprendiendo y La motivación , 7 , 580–590.
http://dx.doi.org/10.1016/0023-9690(76)90008-4
Grant, DS (1988). Fuentes de interferencia visual en la coincidencia retardada con
muestra con palomas. Journal of Experimental Psychology: Animal Behavior
Green, L. y Freed, DE (1993). La sustituibilidad de los reforzadores. Diario de
los Experimental Análisis
http://dx.doi.org/10.1901/jeab.1993.60-141 de comportamiento 60
, , 141-158.
Groves, PM, Lee, D. y Thompson, RF (1969). Efectos del estímulo
Página 331
frecuencia e intensidad de habituación y sensibilización en gato espinal agudo.

Physiology & Behavior , 4 , 383–388. http://dx.doi.org/10.1016/0031-
9384 (69) 90194-2
Groves, PM y Thompson, RF (1970). Habituación: una teoría de proceso dual.
Hagopian, LP, Dozier, CL, Rooker, GW y Jones, BA (2013).
Evaluación y tratamiento de problemas de conducta graves. En GJ Madden (Ed.),
Manual de análisis del comportamiento de la APA: Vol. 2. Traducir principios a
práctica (págs. 353–386). Washington, DC: psicológico estadounidense
Halberstadt, AL y Geyer, MA (2009). Habituación y sensibilización de
sobresalto acústico: influencias opuestas de la familia de la dopamina D1 y D2
receptores. Neurobiología del aprendizaje y la memoria , 92 , 243–248.
Hall, G., Kaye, H. y Pearce, JM (1985). Atención e inhibición condicionada.
En RR Miller & NE Spear (Eds.), Procesamiento de información en animales:
Inhibición condicionada (págs. 185-207). Hillsdale, Nueva Jersey: Erlbaum.
Hallam, SC, Grahame, NJ, Harris, K. y Miller, RR (1992). De asociación
estructura subyacente a la suma negativa mejorada después de operaciones
extinción de un inhibidor pavloviano. Aprendizaje y motivación , 23 , 43–62.
http://dx.doi.org/10.1016/0023-9690(92)90022-E
Hanley, GP, Iwata, BA, Thompson, RH y Lindberg, JS (2000). A
análisis de componentes de la "estereotipia como refuerzo" de la conducta alternativa.
diario de Aplicado Comportamientoanálisis , 33 , 285-297.
Hardt, O., Einarsson, E. Ö. Y Nader, K. (2010). Un puente sobre aguas turbulentas:
La reconsolidación como vínculo entre la memoria cognitiva y neurocientífica
tradiciones de investigación. Revisión anual de psicología , 61 , 141-167.
http://dx.doi.org/10.1146/annurev.psych.093008.100455
Harris, JA, Kwok, DWS y Andrew, BJ (2014). Inhibición condicionada
y tasa de refuerzo. Journal of Experimental Psychology: Animal
Aprendizaje y cognición , 40 , 335–354. http://dx.doi.org/10.1037/xan0000023
Hearst, E. y Jenkins, HM (1974). Seguimiento de señales: el estímulo-reforzador
relación y acción dirigida . Austin, TX: Sociedad Psiconómica.
Hernández, PJ y Abel, T. (2008). El papel de la síntesis de proteínas en la memoria.
consolidación: Progreso en medio de décadas de debate. Neurobiología del aprendizaje y
Memory , 89 , 293–311. http://dx.doi.org/10.1016/j.nlm.2007.09.010
Página 332
Herrnstein, RJ (1970). En la ley del efecto. Diario de lo experimental

243
Herrnstein, RJ, Loveland, DH y Cable, C. (1976). Conceptos naturales en
palomas. Journal of Experimental Psychology: Animal Behavior Processes , 2 ,
285-302. http://dx.doi.org/10.1037/0097-7403.2.4.285
Hock, A., White, H., Jubran, R. y Bhatt, RS (2016). La imágen completa:
Reconocimiento holístico de la postura corporal en la infancia. Boletín Psiconómico y
Review , 23 , 426–431. http://dx.doi.org/10.3758/s13423-015-0902-8
Hogarth, L., Balleine, BW, Corbit, LH y Killcross, S. (2013). De asociación
Mecanismos de aprendizaje que sustentan la transición del consumo de drogas recreativas.
a la adicción. Annals of the New York Academy of Sciences , 1282 , 12-24.
Hogarth, L. y Chase, HW (2011). Control paralelo dirigido a objetivos y habitual
de la búsqueda humana de drogas: implicaciones para la vulnerabilidad a la dependencia. Diario de
http://dx.doi.org/10.1037/a0022913
Hogarth, L., Dickinson, A. y Duka, T. (2010). Atención selectiva a
estímulos condicionados en el aprendizaje de la discriminación humana: desenredar los efectos
de predicción de resultados, valencia, excitación e incertidumbre. En CJ Mitchell y
ME Le Pelley (Eds.), Atención y aprendizaje asociativo (págs. 71–97).
Oxford, Inglaterra: Oxford University Press.
Holanda, PC (1977). Estímulo condicionado como determinante de la forma del
Respuesta condicionada pavloviana. Revista de psicología experimental:
Procesos de comportamiento animal , 3 , 77-104. http://dx.doi.org/10.1037/0097-
7403.3.1.77
Holanda, PC (1989). La extinción de características mejora la transferencia del entorno de la ocasión.
Animal Aprendiendo Y comportamiento , 17 , 269-279.
http://dx.doi.org/10.3758/BF03209799
Holanda, PC (1992). Entorno de ocasión en acondicionamiento pavloviano. En DL
Medin (Ed.), Psicología del aprendizaje y la motivación (Vol. 28, págs. 69-125).
San Diego, CA: Academic Press.
Holanda, PC (2000). Duraciones de prueba y entre pruebas en acondicionamiento apetitivo en
ratas. Animal Aprendiendo Y comportamiento ,28 , 121-135.
http://dx.doi.org/10.3758/BF03200248
Hollis, KL (1999). El papel del aprendizaje en lo agresivo y reproductivo.
Comportamiento del guramis azul, Trichogaster trichopterus . Biología ambiental
of Fishes , 54 , 355–369. http://dx.doi.org/10.1023/A:1007529628117
Página 333
Holloway, KS y Domjan, M. (1993). Condicionamiento del enfoque sexual: pruebas de

devaluación de estímulos incondicionados mediante manipulaciones hormonales. Diario de
Psicología experimental: procesos de comportamiento animal , 19 , 47–55.
http://dx.doi.org/10.1037/0097-7403.19.1.47
Holmes, NM, Marchand, AR y Coutureau, E. (2010). Pavloviano a
transferencia instrumental: una perspectiva neuroconductual. Neurociencia y
Bioconductual Reseñas , 34 , 1277–1295.
http://dx.doi.org/10.1016/j.neubiorev.2010.03.007
Holz, WC y Azrin, NH (1961). Propiedades discriminatorias del castigo.
Horsley, RR, Osborne, M., Norman, C. y Wells, T. (2012). Alta frecuencia
los jugadores muestran una mayor resistencia a la extinción después de una
reforzamiento. Conductual Cerebro Investigación , 229 , 438–442.
http://dx.doi.org/10.1016/j.bbr.2012.01.024
Huber, L. y Aust, U. (2012). Una teoría de características modificada como una explicación de la paloma.
categorización visual. En TR Zentall y EA Wasserman (Eds.), The Oxford
manual de cognición comparada (págs. 497–512). Nueva York, NY: Oxford
Universidad Presionar.
http://dx.doi.org/10.1093/oxfordhb/9780195392661.013.0026
Hull, CL (1930). El conocimiento y la finalidad como mecanismos del hábito. Psicológico
Review , 37 , 511–525. http://dx.doi.org/10.1037/h0072212
Hull, CL (1931). Atracción de metas y dirección de ideas concebidas como hábito
fenómenos. Psicológico Revisión , 38 , 487–506.
http://dx.doi.org/10.1037/h0071442
Hulse, SH, Jr. (1958). Cantidad y porcentaje de refuerzo y duración
del confinamiento de la meta en el condicionamiento y la extinción. Diario de Experimental
Hursh, SR, Madden, GJ, Spiga, R., DeLeon, I. y Francisco, MT (2013).
La utilidad traslacional de la economía del comportamiento: el análisis experimental
de consumo y elección. En GJ Madden (Ed.), Manual APA de
Ishida, M. y Papini, MR (1997). Efectos del sobreentrenamiento de ensayos masivos sobre
comportamiento de extinción y reversión en tortugas (Geoclemys reevesii) . los
Revista Trimestral de Psicología Experimental B: Comparativa y
Fisiológico psicología , 50 , 1-16.
Página 334
http://dx.doi.org/10.1080/027249997393619
Jacobs, EA, Borrero, JC y Vollmer, TR (2013). Aplicaciones traslacionales
de modelos de elección cuantitativa. En GJ Madden (Ed.), Manual APA de
Washington, CORRIENTE americano
CONTINUA: Psicológico Asociación.
http://dx.doi.org/10.1037/13938-007
Jacobs, NS, Cushman, JD y Fanselow, MS (2010). El exacto
medición de la memoria del miedo en el condicionamiento pavloviano: resolución de
problema de línea de base. Revista de métodos de neurociencia , 190 , 235-239.
http://dx.doi.org/10.1016/j.jneumeth.2010.04.029
Jenkins, HM (1962). Resistencia a la extinción cuando el refuerzo parcial es
seguido de refuerzo regular. Revista de psicología experimental , 64 ,
441–450. http://dx.doi.org/10.1037/h0048700
Jenkins, HM, Barnes, RA y Barrera, FJ (1981). ¿Por qué depende la autoformación?
en el espaciado de prueba. En CM Locurto, HS Terrace y J. Gibbon (Eds.),
Teoría de la autoconformación y el condicionamiento (págs. 255–284). Nueva York, NY:
Prensa académica.
Jenkins, HM y Harrison, RH (1960). Efecto de la formación sobre discriminación en
generalización auditiva. Revista de psicología experimental , 59 , 246-253.
http://dx.doi.org/10.1037/h0041661
Jenkins, HM y Harrison, RH (1962). Gradientes de inhibición de generalización
siguiendo el aprendizaje de discriminación auditiva. Diario de lo experimental
Analysis of Behavior , 5 , 435–441. http://dx.doi.org/10.1901/jeab.1962.5-435
Jessel, J., Borrero, JC y Becraft, JL (2015). Refuerzo diferencial de
otro comportamiento aumenta el comportamiento no dirigido. Diario de comportamiento aplicado
Analysis , 48 , 402–416. http://dx.doi.org/10.1002/jaba.204
Jitsumori, M., Wright, AA y Shyan, MR (1989). Acumulación y liberación de
Interferencia proactiva en un mono rhesus. Diario de Experimental
Psicología: Animal ComportamientoProcesos , 15 , 329–337.
http://dx.doi.org/10.1037/0097-7403.15.4.329
Johnson, HM (1994). Procesos de olvido intencional exitoso.
Psychological Bulletin , 116 , 274-292. http://dx.doi.org/10.1037/0033-
2909.116.2.274
Jozefowiez, J. y Staddon, JER (2008). Comportamiento operante. En JH Byrne
(Ed.), Teoría y comportamiento del aprendizaje: Vol. 1. Aprendizaje y memoria: A
referencia completa (págs. 75-102). Oxford, Inglaterra: Elsevier.
http://dx.doi.org/10.1016/B978-012370509-9.00087-5
Página 335
Kalmbach, BE, Ohyama, T., Kreider, JC, Riusech, F. y Mauk, MD

(2009). Interacciones entre la corteza prefrontal y el cerebelo reveladas por
acondicionamiento de párpados. Aprendizaje y memoria , 16 , 86–95.
http://dx.doi.org/10.1101/lm.1178309
Kamin, LJ (1965). Características temporales y de intensidad del condicionado
estímulo. En WF Prokasy (Ed.), Condicionamiento clásico (págs. 118-147). Nuevo
Kamin, LJ (1969). Previsibilidad, sorpresa, atención y acondicionamiento. En BA
Campbell & RM Church (Eds.), Castigo y comportamiento aversivo (págs.
279-296). Nueva York, NY: Appleton-Century-Crofts.
Kaplan, PS, Werner, JS y Rudy, JW (1990). Habituación, sensibilización,
y atención visual infantil. En C. Rovee-Collier y LP Lipsitt (Eds.),
Avances en la investigación sobre la infancia (Vol. 6, págs. 61-109). Norwood, Nueva Jersey: Ablex.
Kavšek, M. (2013). El modelo comparador de habituación visual infantil y
deshabituación: conocimientos recientes. Psicobiología del desarrollo , 55 , 793–808.
http://dx.doi.org/10.1002/dev.21081
Kazdin, AE (1985). La economía simbólica. En RM Turner y LM Ascher
(Eds.), Evaluación de los resultados de la terapia conductual (págs. 225–253). Nueva York, NY:
Saltador.
Kehoe, EJ y White, NE (2004). Sobreexpectación: Pérdida de respuesta durante
Estímulo sostenido compuesto en la membrana nictitante del conejo.
preparación. Aprendiendo Y la memoria , 11 , 476–483.
http://dx.doi.org/10.1101/lm.77604
Killeen, PR (2001). Escribir y sobrescribir la memoria a corto plazo. Psiconómico
Bulletin & Review , 8 , 18–43. http://dx.doi.org/10.3758/BF03196137
Kimble, GA (1961). Acondicionamiento y aprendizaje de Hilgard y Marquis (2do
ed.). Nueva York, NY: Appleton-Century-Crofts.
Kirkpatrick, K. y Church, RM (2004). Aprendizaje temporal en control aleatorio
procedimientos. Journal of Experimental Psychology: Animal Behavior
Klatt, KP y Morris, EK (2001). El principio de Premack, respuesta
privación y establecimiento de operaciones. The Behavior Analyst , 24 , 173–180.
Krause, MA y Domjan, M. (2017). Perspectivas etológicas y evolutivas

sobre el condicionamiento pavloviano. En J. Call (Ed.), APA handbook of comparative
psicología: Vol. 2. Percepción, aprendizaje y cognición (págs. 247–266).
Kroes, MCW, Schiller, D., LeDoux, JE y Phelps, EA (2016).
Página 336
Enfoques traslacionales dirigidos a la reconsolidación. Temas actuales en

Conductual Neurociencias , 28 , 197–230.
http://dx.doi.org/10.1007/7854_2015_5008
Krypotos, A.-M., Effting, M., Kindt, M. y Beckers, T. (2015). Evitación
aprendizaje: Revisión de modelos teóricos y desarrollos recientes. Fronteras en
Neurociencia del comportamiento , 9 . El artículo , 189 , 1-16.
Laborda, MA y Miller, RR (2012). Los recuerdos reactivados compiten por
expresión después de la extinción pavloviana. Procesos conductuales , 90 , 20-27.
Lashley, KS y Wade, M. (1946). La teoría pavloviana de la generalización.
Lattal, KA (2013). Los cinco pilares del análisis experimental del comportamiento. En
GJ Madden (Ed.), Manual de análisis de comportamiento de la APA: Vol. 1. Métodos y
Lattal, KA, St. Peter, C. y Escobar, R. (2013). Extinción operante:
Eliminación y generación de comportamiento. En GJ Madden (Ed.), APA
manual de análisis de la conducta: Vol. 2. Traducir los principios a la práctica
(págs. 77-107). Washington, DC: Asociación Americana de Psicología.
Lattal, KM y Nakajima, S. (1998). Sobre la expectativa en pavloviano apetitivo
y acondicionamiento instrumental. Aprendizaje y comportamiento de los animales , 26 , 351–360.
http://dx.doi.org/10.3758/BF03199227
LeDoux, JE y Gorman, JM (2001). Un llamado a la acción: Superar la ansiedad
a través del afrontamiento activo. The American Journal of Psychiatry , 158 , 1953-1955.
http://dx.doi.org/10.1176/appi.ajp.158.12.1953
Leising, KJ, Hall, JS, Wolf, JE y Ruprecht, CM (2015). Ocasión
entorno durante una tarea de búsqueda espacial con palomas. Diario de Experimental
Psicología: aprendizaje y cognición animal , 41 , 163-178.
http://dx.doi.org/10.1037/xan0000048
Leung, HT, Bailey, GK, Laurent, V. y Westbrook, RF (2007). Rápido
La readquisición del miedo a un contexto completamente extinguido es reemplazada por
deterioro transitorio con entrenamiento adicional de extinción. Diario de
http://dx.doi.org/10.1037/0097-7403.33.3.299
Lieberman, DA, McIntosh, DC y Thomas, GV (1979). Aprendiendo cuando
la recompensa se retrasa: una hipótesis de marcado. Diario de Experimental
Psicología: Animal ComportamientoProcesos , 5, 224–242.
Página 337
http://dx.doi.org/10.1037/0097-7403.5.3.224
Lin, J.-Y., Arthurs, J. y Reilly, S. (2017). Aversiones al gusto condicionadas: De
venenos para el dolor a las drogas de abuso. Psychonomic Bulletin & Review , 24 , 335–
351.
LoBue, V. y DeLoache, JS (2010). Detección superior de amenazas relevantes
estímulos en infancia. De desarrollo la ciencia , 13 , 221–228.
http://dx.doi.org/10.1111/j.1467-7687.2009.00872.x
Logue, AW, Ophir, I. y Strauss, KE (1981). La adquisición del gusto
aversiones en los seres humanos. Investigación y terapia del comportamiento , 19 , 319–333.
http://dx.doi.org/10.1016/0005-7967(81)90053-X
LoLordo, VM (1979). Asociaciones selectivas. En A. Dickinson y RA Boakes
(Eds.), Mecanismos de aprendizaje y motivación (págs. 367–398). Hillsdale, Nueva Jersey:
Erlbaum.
Lorenz, KZ (1981). Los fundamentos de la etología . Nueva York, NY: Springer.
http://dx.doi.org/10.1007/978-3-7091-3671-3
Lovibond, PF, Saunders, JC, Weidemann, G. y Mitchell, CJ (2008).
Evidencia de la expectativa como mediadora de la evitación y la ansiedad en un
modelo de laboratorio de aprendizaje de evitación humana. El diario trimestral de
Experimental psicología , 61 , 1199–1216.
http://dx.doi.org/10.1080/17470210701503229
Lubow, RE (2011). Procesos atencionales aberrantes en la esquizofrenia como
reflejado en los datos de inhibición latente. En TR Schachtman & S. Reilly (Eds.),
Teoría del condicionamiento y aprendizaje asociativo: humanos y no humanos
aplicaciones (págs. 152-167). Nueva York, NY: Oxford University Press.
Lubow, RE y Weiner, I. (Eds.). (2010). Inhibición latente: cognición,
Neurociencia y aplicaciones a la esquizofrenia . Cambridge, Inglaterra:
Prensa de la Universidad de Cambridge. http://dx.doi.org/10.1017/CBO9780511730184
Lysle, DT y Fowler, H. (1985). Inhibición como proceso "esclavo": desactivación
de inhibición condicionada a través de la extinción de la excitación condicionada.
Journal of Experimental Psychology: Animal Behavior Processes , 11 , 71-94.
http://dx.doi.org/10.1037/0097-7403.11.1.71
MacKillop, J., Amlung, MT, Few, LR, Ray, LA, Sweet, LH y Munafò,
MR (2011). Retraso en el descuento de recompensas y comportamiento adictivo: una meta-
análisis. Psicofarmacología , 216 , 305–321.
http://dx.doi.org/10.1007/s00213-011-2229-0
Mackintosh, Nueva Jersey (1974). La psicología del aprendizaje animal . Oxford, Inglaterra:
Página 338
Prensa académica.
Mackintosh, Nueva Jersey, Bygrave, DJ y Picton, BMB (1977). Locus del efecto
de un reforzador sorprendente en la atenuación del bloqueo. El trimestral
diario de Experimental psicología , 29 , 327–336.
http://dx.doi.org/10.1080/14640747708400608
MacLeod, CM (2012). Olvido dirigido. En NM Seel (Ed.), Enciclopedia
de las ciencias del aprendizaje (págs. 993–995). Nueva York, NY: Springer.
Maia, televisión (2010).Aprendiendo
evitación. Teoría de dos factores,
Y modelo actor-crítico y ,condicionada
comportamiento 38 , 50–67.
http://dx.doi.org/10.3758/LB.38.1.50
Maren, S. (2011). Buscando una mente impecable: extinción, desconsolidación y
borradura de temor memoria. neurona , 70 , 830–845.
Maren, S. y Holmes, A. (2016). Estrés y miedo a la extinción.
Neuropsicofarmacología , 41 , 58–79.
http://dx.doi.org/10.1038/npp.2015.180
Matson, JL y Boisjoli, JA (2009). La economía de fichas para niños con
discapacidad intelectual y / o autismo: una revisión. Investigación en desarrollo
Discapacidades , 30 , 240–248. http://dx.doi.org/10.1016/j.ridd.2008.04.001
McConnell, BL, Urushihara, K. y Miller, RR (2010). Contrastando
predicciones de la hipótesis del comparador extendido y la adquisición centrada
modelos de aprendizaje relativos a la revalorización retrospectiva. Diario de
http://dx.doi.org/10.1037/a0015774
McGaugh, JL (2000). Memoria: un siglo de consolidación. Ciencia , 287 ,
248-251. http://dx.doi.org/10.1126/science.287.5451.248
McGaugh, JL y Herz, MJ (1972). Consolidación de la memoria . San Francisco,
CA: Albion.
McKenzie, S. y Eichenbaum, H. (2011). Consolidación y reconsolidación:
Dos vidas de ¿recuerdos? neurona , 71 , 224–233.
McLaren, IPL y Mackintosh, Nueva Jersey (2000). Un modelo elemental de
aprendizaje asociativo: I. Inhibición latente y aprendizaje perceptual. Animal
Learning & Behavior , 28 , 211–246. http://dx.doi.org/10.3758/BF03200258
Meyer, PJ, Cogan, ES y Robinson, TE (2014). La forma de un condicionado
El estímulo puede influir en el grado en que adquiere incentivo motivacional
propiedades. PLoS uno , 9 (6), e98163.
Página 339
http://dx.doi.org/10.1371/journal.pone.0098163
Miguez, G., Witnauer, JE y Miller, RR (2012). El papel de contextual
asociaciones en la producción del déficit de adquisición de refuerzo parcial.
Journal of Experimental Psychology: Animal Behavior Processes , 38 , 40-51.
http://dx.doi.org/10.1037/a0024410
Miller, DB (1985). Aspectos metodológicos en el estudio ecológico del aprendizaje.
En TD Johnston & AT Pietrewicz (Eds.), Problemas en el estudio ecológico de
aprendizaje (págs. 73–95). Hillsdale, Nueva Jersey: Erlbaum.
Miller, NE (1951). Impulsos y recompensas que se pueden aprender. En SS Stevens (Ed.),
Manual de psicología experimental (págs. 435–472). Nueva York, NY: Wiley.
Miller, NE (1960). Aprender a resistir el dolor y el miedo: efectos de
sobreaprendizaje, exposición y exposición recompensada en contexto. Diario de
Miller, RR, Barnet, RC y Grahame, Nueva Jersey (1995). Evaluación de la
Modelo Rescorla – Wagner. Psychological Bulletin , 117 , 363–386.
http://dx.doi.org/10.1037/0033-2909.117.3.363
Miller, RR y Matzel, LD (1988). La hipótesis del comparador: una respuesta
regla para la expresión de asociaciones. En GH Bower (Ed.), La psicología
de aprendizaje y motivación (págs. 51–92). Orlando, FL: Prensa académica.
Milmine, M., Watanabe, A. y Colombo, M. (2008). Correlatos neuronales de
olvido dirigido en la corteza prefrontal aviar. Neurociencia del comportamiento ,
122 , 199-209. http://dx.doi.org/10.1037/0735-7044.122.1.199
Mineka, S. (1979). El papel del miedo en las teorías del aprendizaje de evitación, inundaciones,
y extinción. Psicológico Boletín , 86 , 985–1010.
http://dx.doi.org/10.1037/0033-2909.86.5.985
Mineka, S. y Öhman, A. (2002). Fobias y preparación: el selectivo,
naturaleza automática y encapsulada del miedo. Psiquiatría biológica , 52 , 927–
937. http://dx.doi.org/10.1016/S0006-3223(02)01669-4
Mitchell, CJ y Le Pelley, ME (Eds.). (2010). Atención y asociativo
aprendizaje . Oxford, Inglaterra: Oxford University Press.
Moffitt, TE, Arseneault, L., Belsky, D., Dickson, N., Hancox, RJ,
Harrington, H.,. . . Caspi, A. (2011). Un gradiente de autocontrol infantil
predice la salud, la riqueza y la seguridad pública. Procedimientos de la Nacional
Academia de Ciencias de los Estados Unidos de América , 108 , 2693–2698.
http://dx.doi.org/10.1073/pnas.1010076108
Molet, M. y Miller, RR (2014). Tiempo: un atributo del aprendizaje asociativo.
Conductual Procesos , 101 , 4-14.
Página 340
Monfils, MH, Cowansage, KK, Klann, E. y LeDoux, JE (2009).
Límites de extinción-reconsolidación: clave para la atenuación persistente del miedo
recuerdos. Science , 324 , 951–955. http://dx.doi.org/10.1126/science.1167975
Morris, RGM (1974). Inhibición condicionada pavloviana del miedo durante
comportamiento de evitación de shuttlebox. Aprendizaje y motivación , 5 , 424–447.
http://dx.doi.org/10.1016/0023-9690(74)90002-2
Morris, RGM (1975). Preacondicionamiento de propiedades de refuerzo a un
estímulo de retroalimentación exteroceptiva. Aprendizaje y motivación , 6 , 289-298.
http://dx.doi.org/10.1016/0023-9690(75)90029-6
Mowrer, OH (1947). Sobre la naturaleza dual del aprendizaje: una reinterpretación de
"Condicionamiento" y "resolución de problemas". Harvard Educational Review , 17 ,
102–150.
Mowrer, OH y Lamoreaux, RR (1942). Acondicionamiento y señal de evitación
duración: Estudio de motivación secundaria y recompensa [Monografía].
Monografías psicológicas , 54 (247).
Murphy, JG, Correia, CJ y Barnett, NP (2007). Económico conductual
enfoques para reducir el consumo de alcohol por parte de los estudiantes universitarios. Comportamientos adictivos , 32 ,
2573-2585. http://dx.doi.org/10.1016/j.addbeh.2007.05.015
Mystkowski, JL, Craske, MG, Echiverri, AM y Labus, JS (2006).
Restablecimiento mental del contexto y retorno del miedo en el miedo a las arañas.
Participantes. Comportamiento terapia , 37 , 49–60.
http://dx.doi.org/10.1016/j.beth.2005.04.001
Nader, K. y Hardt, O. (2009). Un único estándar para la memoria: el caso de
reconsolidación. Naturaleza Reseñas neurociencia , 10 , 224–234.
http://dx.doi.org/10.1038/nrn2590
Neuringer, A. (2004). Variabilidad reforzada en animales y personas: implicaciones
por adaptado acción. americano psicólogo , 59 , 891–906.
http://dx.doi.org/10.1037/0003-066X.59.9.891
Neuringer, A., Kornell, N. y Olufs, M. (2001). Estabilidad y variabilidad en
extinción. Journal of Experimental Psychology: Animal Behavior Processes ,
27 , 79–94. http://dx.doi.org/10.1037/0097-7403.27.1.79
Personal de Newsweek. (2001, 12 de febrero). Cómo comienza todo dentro de tu cerebro.
Newsweek , pág. 40. Obtenido de http://www.newsweek.com/how-it-all-
comienza-dentro-de-tu-cerebro-155189
Odum, AL y Baumann, AAL (2010). Descuento por retraso: estado y rasgo
variable. En GJ Madden y WK Bickel (Eds.), Impulsividad: el comportamiento
Página 341
y ciencia neurológica del descuento (págs. 39–65). Washington DC:

Oehlberg, K. y Mineka, S. (2011). Acondicionamiento del miedo y atención a la amenaza: una
Enfoque integrador para comprender la etiología de los trastornos de ansiedad. En t.
R. Schachtman & S. Reilly (Eds.), Aprendizaje asociativo y condicionamiento
teoría: aplicaciones humanas y no humanas (págs. 44–78). Oxford, Inglaterra,
y Nuevo York, NUEVA YORK: Oxford Universidad Presionar.
Ostlund, SB, Winterbauer, NE y Balleine, BW (2008). Teoría de la recompensa
sistemas. En JH Byrne (Ed.), Teoría y comportamiento del aprendizaje: Vol. 1. Aprendizaje
y memoria: una referencia completa (págs. 701–720). Oxford, Inglaterra:
Elsevier. http://dx.doi.org/10.1016/B978-012370509-9.00089-9
Papini, MR (2003). Psicología comparada de la sorprendente no recompensa. Cerebro,
Comportamiento y evolución , 62 , 83–95. http://dx.doi.org/10.1159/000072439
Papini, MR y Bitterman, ME (1990). El papel de la contingencia en la clásica
acondicionamiento. Psicológico Revisión , 97 , 396–403.
http://dx.doi.org/10.1037/0033-295X.97.3.396
Pavlov, I. (1927). Reflejos condicionados (GV Anrep, Trans.). Londres, Inglaterra:
Prensa de la Universidad de Oxford.
Pear, JJ y Legris, JA (1987). Dar forma mediante el seguimiento automático de un arbitrario
respuesta operante. Journal of the Experimental Analysis of Behavior , 47 , 241–
247. http://dx.doi.org/10.1901/jeab.1987.47-241
Pearce, JM y Hall, G. (1980). Un modelo para el aprendizaje pavloviano: variaciones en
la eficacia de los estímulos condicionados pero no de los incondicionados.
Psychological Review , 87 , 532–552. http://dx.doi.org/10.1037/0033-
295X.87.6.532
Pelchat, ML y Rozin, P. (1982). El papel especial de las náuseas en la adquisición.
de comida no le gusta por humanos. apetito , 3, 341–351.
http://dx.doi.org/10.1016/S0195-6663(82)80052-4
Perry, DG y Parke, RD (1975). Castigo y respuesta alternativa
el entrenamiento como determinantes de la inhibición de la respuesta en los niños. Genético
Monografías de psicología , 91 , 257-279.
Perusini, JN y Fanselow, MS (2015). Perspectivas neuroconductuales sobre el
distinción entre miedo y ansiedad. Aprendizaje y memoria , 22 , 417–425.
http://dx.doi.org/10.1101/lm.039180.115
Cartero, L. (1971). Transferencia, interferencia y olvido. En JW Kling & L.
A. Riggs (Eds.), Woodworth y la psicología experimental de Schlosberg (3er.
Página 342
ed., págs. 1019-1132). Nueva York, NY: Holt, Rinehart y Winston.

Premack, D. (1965). Teoría de refuerzo. En D. Levine (Ed.), Nebraska
simposio sobre motivación (Vol. 13, págs. 123–180). Lincoln: Universidad de
Prensa de Nebraska.
Rachlin, H. (1976). Comportamiento y aprendizaje (págs. 102-154). San Francisco, CA:
WH Freeman.
Raia, CP, Shillingford, SW, Miller, HL, Jr. y Baier, PS (2000).
Interacción de factores procedimentales en el desempeño humano en horarios en yugo.
Revista del análisis experimental de la conducta , 74 , 265-281.
Rankin, CH, Abrams, T., Barry, RJ, Bhatnagar, S., Clayton, DF, Colombo,
J.,. . . Thompson, RF (2009). Habituation revisited: Un actualizado y revisado
descripción de las características conductuales de la habituación. Neurobiología de
Aprendiendo y la memoria , 92 , 135-138.
Rau, V. y Fanselow, MS (2007). Neurobiológico y neuroetológico
perspectivas sobre el miedo y la ansiedad. En LJ Kirmayer, R. Lemelson y M. Barad
(Eds.), Comprensión del trauma: integración biológica, clínica y cultural
perspectivas (págs. 27–40). Cambridge, Inglaterra: Cambridge University Press.
http://dx.doi.org/10.1017/CBO9780511500008.005
Raybuck, JD y Lattal, KM (2014). Superando el intervalo: teoría y
neurobiología del acondicionamiento de trazas. Procesos conductuales , 101 , 103-111.
Rehfeldt, RA (2011). Hacia una tecnología de relaciones de estímulo derivadas: una
análisis de artículos publicados en la revista de análisis de comportamiento aplicado,
1992-2009. Journal of Applied Behavior Analysis , 44 , 109-119.
Reilly, S. y Schachtman, TR (Eds.). (2009). Aversión al gusto condicionada:
Procesos conductuales y neuronales . Nueva York, NY: Oxford University Press.
Rescorla, RA (1967). Acondicionamiento pavloviano y su adecuado control
procedimientos. Psicológico Revisión , 74 , 71–80.
http://dx.doi.org/10.1037/h0024109
Rescorla, RA (1969). Inhibición condicionada pavloviana. Boletín psicológico ,
72 , 77–94. http://dx.doi.org/10.1037/h0027760
Rescorla, RA (1973). Efecto de la habituación estadounidense después del acondicionamiento. diario
de Psicología Comparada y Fisiológica , 82 , 137-143.
http://dx.doi.org/10.1037/h0033815
Página 343
Rescorla, RA (1985). Inhibición y facilitación condicionadas. En RR Miller y

NE Spear (Eds.), Procesamiento de información en animales: inhibición condicionada
(págs. 299–326). Hillsdale, Nueva Jersey: Erlbaum.
Rescorla, RA (1993). Preservación de asociaciones respuesta-resultado mediante
extinción. Animal Aprendiendo Y comportamiento21, , 238–245.
http://dx.doi.org/10.3758/BF03197988
Rescorla, RA (2001). Extinción experimental. En RR Mowrer y SB Klein
(Eds.), Teorías contemporáneas del aprendizaje (págs. 119-154). Mahwah, Nueva Jersey:
Erlbaum.
Rescorla, RA (2004). Recuperacion espontanea. Aprendizaje y memoria , 11 , 501–
509. http://dx.doi.org/10.1101/lm.77504
Rescorla, RA y Solomon, RL (1967). Teoría del aprendizaje de dos procesos:
Relaciones entre condicionamiento pavloviano y aprendizaje instrumental.
Psychological Review , 74 , 151-182. http://dx.doi.org/10.1037/h0024475
Rescorla, RA y Wagner, AR (1972). Una teoría del condicionamiento pavloviano:
Variaciones en la efectividad del refuerzo y no refuerzo. En un.
H. Black & WF Prokasy (Eds.), Condicionamiento clásico II: Investigación actual
y teoría (págs. 64–99). Nueva York, NY: Appleton-Century-Crofts.
Reynolds, GS (1975). Una cartilla de condicionamiento operante . Glenview, IL: Scott
Foresman.
Roberts, WA (2012). Evidencia de la cognición futura en animales. Aprendizaje y
Motivación , 43 , 169–180. http://dx.doi.org/10.1016/j.lmot.2012.05.005
Roberts, WA y Grant, DS (1976). Estudios de memoria a corto plazo en el
paloma utilizando el procedimiento de emparejamiento diferido con la muestra. En DL Medin, W.
A. Roberts y RT Davis (Eds.), Procesos de memoria animal (págs. 79-112).
Roitblat, HL (1980). Códigos y procesos de codificación en paloma a corto plazo.
memoria. Animal Aprendiendo Y comportamiento 8, , 341–351.
http://dx.doi.org/10.3758/BF03199615
Romanes, GJ (1882). Inteligencia animal . Nueva York, NY: Appleton.
Santi, A. y Roberts, WA (1985). Representación prospectiva: los efectos de
Mapeo variado de estímulos de muestra para estímulos de comparación y ensayo diferencial
resultados en la memoria de trabajo de las palomas. Aprendizaje y comportamiento animal , 13 ,
103-108. http://dx.doi.org/10.3758/BF03199261
Sargisson, RJ y White, KG (2001). Generalización del emparejamiento diferido a
muestra después del entrenamiento con diferentes retrasos. Diario de lo experimental
Análisis de la conducta , 75 , 1-14. http://dx.doi.org/10.1901/jeab.2001.75-1
Página 344
Schachtman, TR, Brown, AM y Miller, RR (1985). Reinstalación-

indujo la recuperación de una asociación sabor-LiCl después de la extinción. Animal
Aprendizaje y comportamiento , 13 , 223–227. http://dx.doi.org/10.3758/BF03200013
Schein, MW y Hale, EB (1965). Estímulos que provocan comportamiento sexual. En FA
Beach (Ed.), Sexo y comportamiento (págs. 440–482). Nueva York, NY: Wiley.
Schiff, R., Smith, N. y Prochaska, J. (1972). Extinción de la evitación en ratas como
función de duración y número de ensayos bloqueados. Revista de comparativa
y Fisiológico psicología , 81 , 356–359.
http://dx.doi.org/10.1037/h0033540
Schiller, D., Monfils, MH, Raio, CM, Johnson, DC, LeDoux, JE y
Phelps, EA (2010). Prevenir el regreso del miedo en humanos usando
reconsolidación actualizar mecanismos. la naturaleza ,463 , 49–53.
http://dx.doi.org/10.1038/nature08637
Schmajuk, NA (2010). Mecanismos en el condicionamiento clásico: un proceso computacional
enfoque . Cambridge, Inglaterra: Cambridge Prensa Universitaria.
http://dx.doi.org/10.1017/CBO9780511711831
Schmajuk, NA y Holland, PC (Eds.). (1998). Configuración de la ocasión: asociativo
aprendizaje y cognición en animales . Washington, DC: psicológico estadounidense
Schneiderman, N. y Gormezano, I. (1964). Condicionamiento del nictitante
membrana del conejo en función del intervalo CS-US. Diario de
Comparativo y Fisiológico psicología , 57 , 188-195.
http://dx.doi.org/10.1037/h0043419
Schwabe, L., Nader, K. y Pruessner, JC (2014). Consolidación de humanos
memoria: mecanismos cerebrales y relevancia clínica. Psiquiatría biológica , 76 ,
274–280. http://dx.doi.org/10.1016/j.biopsych.2014.03.008
Sevenster, D., Beckers, T. y Kindt, M. (2013). El error de predicción gobierna
amnesia inducida farmacológicamente por miedo aprendido. Science , 339 , 830–833.
http://dx.doi.org/10.1126/science.1231357
Shapiro, KL, Jacobs, WJ y LoLordo, VM (1980). Estímulo-reforzador
interacciones en el condicionamiento pavloviano de palomas: implicaciones para la selectividad
asociaciones. Animal Aprendiendo Y comportamiento8, , 586–594.
http://dx.doi.org/10.3758/BF03197773
Shettleworth, SJ (1975). Refuerzo y organización del comportamiento en
hámsters dorados: Hambre, medio ambiente y refuerzo alimentario. Diario de
http://dx.doi.org/10.1037/0097-7403.1.1.56
Página 345
Sidman, M. (1953). Acondicionamiento de evitación con choque breve y sin

exteroceptivo advertencia señal. la ciencia , 118 , 157-158.
http://dx.doi.org/10.1126/science.118.3058.157
Sidman, M. (1960). Tácticas de investigación científica . Nueva York, NY: Basic Books.
Siegel, S. (2008). Aprendizaje y sabiduría del cuerpo. Aprendizaje y comportamiento ,
36 , 242-252. http://dx.doi.org/10.3758/LB.36.3.242
Siegel, S. (2016). El misterio de la sobredosis de heroína. Direcciones actuales en
Psychological Science , 25 , 375–379.
Siegel, S. y Allan, LG (1996). La amplia influencia de la Rescorla–
Modelo Wagner. Psychonomic Bulletin & Review , 3 , 314–321.
http://dx.doi.org/10.3758/BF03210755
Simons, RC (1996). ¡Abucheo! Cultura, experiencia y reflejo de sobresalto . Nuevo
York, Nueva York: Oxford University Press.
Sissons, HT y Miller, RR (2009). Sobreexpectación y concentración de ensayos.
Journal of Experimental Psychology: Animal Behavior Processes , 35 , 186–
196. http://dx.doi.org/10.1037/a0013426
Skinner, BF (1938). El comportamiento de los organismos: un análisis experimental .
Nueva York, NY: Appleton-Century-Crofts.
Skinner, BF (1953). Ciencia y comportamiento humano . Nueva York, NY: Macmillan.
Skinner, BF (1956). Un caso de estudio en método científico. Psicólogo estadounidense ,
11 , 221-233. http://dx.doi.org/10.1037/h0047662
Skinner, BF (1969). Contingencias de refuerzo: un análisis teórico .
Nueva York, NY: Appleton-Century-Crofts.
Pequeño, WS (1900). Un estudio experimental de los procesos mentales de la rata: I.
los americano diario de psicología , 11 , 133-164.
http://dx.doi.org/10.2307/1412267
Pequeño, WS (1901). Un estudio experimental de los procesos mentales de la rata:
II. los americano diario de psicología , 12 , 206–239.
http://dx.doi.org/10.2307/1412534
Smith, JC y Roll, DL (1967). Trazar el acondicionamiento con rayos X como aversivo.
estímulo. Ciencia psiconómica , 9 , 11-12.
Smith, MC, Coleman, SR y Gormezano, I. (1969). Condicionamiento clásico de
respuesta de la membrana nictitante del conejo al revés, simultáneo y
intervalos CS-US hacia adelante. Revista de fisiología y comparativa
Psicología , 69 , 226-231. http://dx.doi.org/10.1037/h0028212
Solomon, RL, Kamin, LJ y Wynne, LC (1953). Evitación traumática
aprendizaje: Los resultados de varios procedimientos de extinción con perros. diario
Página 346
of Annormal Psychology , 48 , 291-302. http://dx.doi.org/10.1037/h0058943

Spear, NE y Riccio, DC (1994). Memoria: Fenómenos y principios .
Boston, MA: Allyn & Bacon.
Stephens, DW, Brown, JS y Ydenberg, RC (Eds.). (2007). Forrajeo:
Comportamiento y ecología . Chicago, IL: University of Chicago Press.
http://dx.doi.org/10.7208/chicago/9780226772653.001.0001
Stokes, PD, Mechner, F. y Balsam, PD (1999). Efectos de diferentes
procedimientos de adquisición sobre la variabilidad de la respuesta. Aprendizaje y comportamiento animal ,
27 , 28–41. http://dx.doi.org/10.3758/BF03199429
Storsve, AB, McNally, GP y Richardson, R. (2012). Renovación y
Restablecimiento de la respuesta condicionada pero no incondicionada.
después de la habituación del estímulo incondicionado. Procesos de comportamiento ,
90 , 58–65. http://dx.doi.org/10.1016/j.beproc.2012.03.007
Stout, SC y Miller, RR (2007). Recuperación a veces competitiva (SOCR): A
formalización de la hipótesis del comparador. Psychological Review , 114 , 759–
783 [Corrección publicada en 2008. Psychological Review , 115 , 82].
http://dx.doi.org/10.1037/0033-295X.114.3.759.
Theios, J. (1962). El efecto de refuerzo parcial sostenido a través de bloques de
refuerzo continuo. Revista de psicología experimental , 64 , 1–6.
http://dx.doi.org/10.1037/h0046302
Theios, J., Lynch, AD y Lowe, WF, Jr. (1966). Efectos diferenciales del shock
intensidad en el acondicionamiento de evitación de ida y vuelta. Diario de
Thomas, BL, Vurbic, D. y Novak, C. (2009). Extensa extinción en múltiples
contextos elimina la renovación del miedo condicionado en ratas. Aprendizaje y
Motivación , 40 , 147-159. http://dx.doi.org/10.1016/j.lmot.2008.10.002
Thompson, RF (2009). Habituación: una historia. Neurobiología del aprendizaje y
Memory , 92 , 127-134. http://dx.doi.org/10.1016/j.nlm.2008.07.011
Thompson, RF y Spencer, WA (1966). Habituación: un fenómeno modelo
para el estudio de sustratos neuronales del comportamiento. Revisión psicológica , 73 ,
16–43. http://dx.doi.org/10.1037/h0022681
Thorndike, EL (1898). Inteligencia animal: un estudio experimental de la
proceso de asociación en animales [Monografía]. Revisión psicológica
Monografías , 2 (8).
Thorndike, EL (1911). Inteligencia animal: estudios experimentales . Nueva York,
Nueva York: Macmillan. http://dx.doi.org/10.5962/bhl.title.55072
Thorndike, EL (1932). Los fundamentos del aprendizaje . Nueva York, NY:
Página 347
Teachers College Press. http://dx.doi.org/10.1037/10976-000

Timberlake, W. (1980). Una teoría del equilibrio molar del desempeño aprendido. En
GH Bower (Ed.), La psicología del aprendizaje y la motivación (Vol.14, págs.
1-58). Orlando, FL: Prensa académica. http://dx.doi.org/10.1016/S0079-
7421 (08) 60158-9
Timberlake, W. (1984). Regulación del comportamiento y desempeño aprendido: algunos
malentendidos y desacuerdos. Revista del Análisis Experimental de
Behavior , 41 , 355–375. http://dx.doi.org/10.1901/jeab.1984.41-355
Timberlake, W. (2001). Modos motivacionales en sistemas de comportamiento. En RR
Mowrer & SB Klein (Eds.), Manual de teorías de aprendizaje contemporáneas
(págs. 155-209). Mahwah, Nueva Jersey: Erlbaum.
Timberlake, W. y Allison, J. (1974). Privación de respuesta: un análisis empírico
enfoque de la interpretación instrumental. Psychological Review , 81 , 146-164.
http://dx.doi.org/10.1037/h0036101
Timberlake, W., Wahl, G. y King, D. (1982). Estímulo y respuesta
contingencias en el mal comportamiento de las ratas. Diario de Experimental
Psicología: Animal Comportamiento Procesos , 8, 62–85.
http://dx.doi.org/10.1037/0097-7403.8.1.62
Tinbergen, N. (1951). El estudio del instinto . Oxford, Inglaterra: Clarendon Press.
Tinbergen, N. (1952). El comportamiento del espinoso. Scientific American , 187 ,
22-26. http://dx.doi.org/10.1038/scientificamerican1252-22
Tinbergen, N. y Perdeck, AC (1950). Sobre la situación de estímulo liberando el
respuesta de mendicidad en el polluelo de gaviota argéntea ( Larus argentatus
argentatus Pont.). comportamiento , 3, 1-39.
http://dx.doi.org/10.1163/156853951X00197
Todd, TP, Vurbic, D. y Bouton, ME (2014). Conductual y
Mecanismos neurobiológicos de extinción en pavloviano e instrumental.
aprendiendo. Neurobiología del aprendizaje y la memoria , 108 , 52–64.
Tomie, A., Brooks, W. y Zito, B. (1989). Seguimiento de señales: la búsqueda de recompensas.
En SB Klein & RR Mowrer (Eds.), Teorías contemporáneas del aprendizaje:
El condicionamiento pavloviano y el estado de la teoría del aprendizaje (págs. 191-223).
Tomie, A., Murphy, AL, Fath, S. y Jackson, RL (1980). Retraso de
autoformado después del preentrenamiento con alimentos impredecibles: efectos de
cambiar el contexto entre la formación previa y las pruebas. Aprendizaje y
Motivation , 11 , 117-134. http://dx.doi.org/10.1016/0023-9690(80)90024-7
Página 348
Tsao, JCI y Craske, MG (2000). Momento del tratamiento y retorno del miedo:
Efectos de programas de exposición masivos, uniformes y espaciados en expansión.
Terapia de comportamiento , 31 , 479–497. http://dx.doi.org/10.1016/S0005-
7894 (00) 80026-X
Underwood, BJ (1957). Interferencia y olvido. Revisión psicológica , 64 ,
49–60. http://dx.doi.org/10.1037/h0044616
Urcelay, GP y Miller, RR (2008). Recuperación de la memoria. En JH Byrne
(Ed.), Teoría y comportamiento del aprendizaje: Vol. 1. Aprendizaje y memoria: A
referencia completa (págs. 53–74). Oxford, Inglaterra: Elsevier.
http://dx.doi.org/10.1016/B978-012370509-9.00075-9
Urcelay, GP, Wheeler, DS y Miller, RR (2009). Espaciamiento de los ensayos de extinción
alivia la renovación y la recuperación espontánea. Aprendizaje y comportamiento , 37 , 60–
73. http://dx.doi.org/10.3758/LB.37.1.60
Urcuioli, PJ (2013). Control de estímulos y formación de clases de estímulos. En GJ
Madden (Ed.), Manual de análisis de la conducta de la APA: Vol. 1. Métodos y
van der Kolk, BA (2006). Implicaciones clínicas de la investigación en neurociencia en
Trastorno de estrés postraumático. Annals of the New York Academy of Sciences , 1071 , 277–293.
http://dx.doi.org/10.1196/annals.1364.022
Vanderveldt, A., Oliveira, L. y Green, L. (2016). Descuento por retraso: Paloma,
rata, humano, ¿importa? Journal of Experimental Psychology: Animal
Aprendizaje y cognición , 42 , 141-162. http://dx.doi.org/10.1037/xan0000097
Vervliet, B., Baeyens, F., Van den Bergh, O. y Hermans, D. (2013). Extinción,
generalización y retorno del miedo: una revisión crítica de la investigación de la renovación en
humanos. Biológico psicología , 92 , 51–58.
http://dx.doi.org/10.1016/j.biopsycho.2012.01.006
Waddell, J., Morris, RW y Bouton, ME (2006). Efectos del núcleo del lecho de
las lesiones de la estría terminal en la ansiedad condicionada: condicionamiento aversivo
con estímulos condicionales de larga duración y reinstauración del miedo extinguido.
Neurociencia del comportamiento , 120 , 324–336. http://dx.doi.org/10.1037/0735-
7044.120.2.324
Wagner, AR (1961). Efectos de la cantidad y porcentaje de refuerzo y
número de ensayos de adquisición sobre acondicionamiento y extinción. Diario de
Página 349
Psicología experimental , 62 , 234–242. http://dx.doi.org/10.1037/h0042251

Wagner, AR (2008). Evolución de una teoría elemental de pavloviano.
acondicionamiento. Aprendiendo Y comportamiento , 36 , 253-265.
http://dx.doi.org/10.3758/LB.36.3.253
Wagner, AR y Rescorla, RA (1972). Inhibición en el condicionamiento pavloviano:
Aplicación de una teoría. En RA Boakes & MS Halliday (Eds.), Inhibition
y aprendizaje (págs. 301–335). Londres, Inglaterra: Academic Press.
Wallace, J., Steinert, PA, Scobie, SR y Spear, NE (1980). Estímulo
modalidad y memoria a corto plazo en ratas. Aprendizaje y comportamiento de los animales , 8 , 10–
16. http://dx.doi.org/10.3758/BF03209724
Wasserman, EA (2016). Conceptualización en palomas: la evolución de un
paradigma. Conductual Procesos , 123 , 4-14.
Wasserman, EA, Franklin, SR y Hearst, E. (1974). Apetitivo pavloviano

contingencias y aproximación versus retirada a estímulos condicionados en
palomas. Revista de Psicología Comparada y Fisiológica , 86 , 616–
627. http://dx.doi.org/10.1037/h0036171
Weiss, SJ y Panlilio, LV (2015). Hedónica y las "asociaciones selectivas":
Limitaciones biológicas al aprendizaje. Revista internacional de comparativos
Psicología , 28 . Obtenido de http://escholarship.org/uc/item/1102v2b8
White, KG y Brown, GS (2011). Revertir el curso del olvido.
Journal of the Experimental Analysis of Behavior , 96 , 177–189.
Williams, BA (1999). Competencia asociativa en condicionamiento operante:
Bloqueando la asociación respuesta-reforzador. Boletín Psiconómico y
Review , 6 , 618–623. http://dx.doi.org/10.3758/BF03212970
Williams, DC, Saunders, KJ y Perone, M. (2011). Pausa extendida por
humanos en múltiples programas de razón fija con variada magnitud de reforzador
y requisitos de respuesta. Revista del análisis experimental de la conducta ,
95 , 203–220. http://dx.doi.org/10.1901/jeab.2011.95-203
Williams, M. y Woodman, GF (2012). Olvido dirigido y dirigido
recordando en la memoria de trabajo visual. Diario de Experimental
Psicología: aprendizaje, memoria y cognición , 38 , 1206-1220.
http://dx.doi.org/10.1037/a0027389
Winter, J. y Perkins, CC (1982). Refuerzo inmediato en recompensa retrasada
aprendizaje en palomas. Revista del análisis experimental de la conducta , 38 ,
169-179. http://dx.doi.org/10.1901/jeab.1982.38-169
Página 350
Witcher, ES y Ayres, JJB (1984). Una prueba de dos métodos de extinción.

Inhibición condicionada pavloviana. Aprendizaje y comportamiento de los animales , 12 , 149-156.
http://dx.doi.org/10.3758/BF03213134
Wood, W. y Neal, DT (2007). Una nueva mirada a los hábitos y al hábito-objetivo
interfaz. Psicológico Revisión , 114 , 843–863.
http://dx.doi.org/10.1037/0033-295X.114.4.843
Wright, AA, Katz, JS y Ma, WJ (2012). Cómo ser proactivo
interferencia: lecciones de la memoria animal. Ciencias psicológicas , 23 , 453–
458. http://dx.doi.org/10.1177/0956797611430096
Yi, R., Mitchell, SH y Bickel, WK (2010). Retrasar descuento y sustancia
abuso-dependencia. En GJ Madden y WK Bickel (Eds.), Impulsividad: la
ciencia conductual y neurológica del descuento (págs. 191-211).
Washington, CORRIENTE americano
CONTINUA: Psicológico Asociación.
http://dx.doi.org/10.1037/12069-007
Zapata, A., Minney, VL y Shippenberg, TS (2010). Cambio de dirigido a objetivos
a la búsqueda habitual de cocaína después de una experiencia prolongada en ratas. El diario de
neurociencia , 30 , 15457–15463.
http://dx.doi.org/10.1523/JNEUROSCI.4072-10.2010
Zentall, TR y Smith, AP (2016). Coincidencia retrasada con la muestra: una herramienta para
evaluar la memoria y otros procesos cognitivos en palomas. Conductual
Zentall, TR, Steirn, JN y Jackson-Smith, P. (1990). Estrategias de memoria en
Realización de palomas de una tarea analógica de laberinto de brazos radiales. Diario de
http://dx.doi.org/10.1037/0097-7403.16.4.358
Zimmer-Hart, CL y Rescorla, RA (1974). Extinción de pavloviano
inhibición condicionada. Revista de fisiología y comparativa
Zito, B. y Tomie, A. (2014). La cola del mapache: secretos de la adicción .
Princeton, Nueva Jersey: ZT Enterprises.
Página 351
Sobre el Autor
Michael Domjan, PhD, es profesor de psicología en la Universidad de Texas.

en Austin, donde ha enseñado el aprendizaje a estudiantes de pregrado y posgrado.
durante cuatro décadas. También se desempeñó como director de departamento de 1999 a 2005 y fue
el director fundador del Centro de Investigación de Imágenes de 2005 a 2008. El Dr.
Domjan se destaca por su enfoque funcional del condicionamiento clásico, que él
Ha realizado estudios sobre el condicionamiento sexual y el aprendizaje de la aversión al gusto. Su
La investigación fue seleccionada para un Premio MERIT por el Instituto Nacional de Mental
Salud. El Dr. Domjan es un ex presidente de la Sociedad Pavloviana y también sirvió
Página 352
como presidente de la Society for Behavioral Neuroscience and Comparative

Psicología de la Asociación Americana de Psicología (APA). En 2014, él
recibió el Premio a las Contribuciones Científicas Distinguidas DO Hebb de
APA División 6 (Society for Behavioral Neuroscience and Comparative
Psicología). El Dr. Domjan también disfruta tocando la viola y es el director de la
Proyecto Tertis / Pavlov, que consta de una serie de minilecturas (disponibles en
YouTube) que describen cómo el aprendizaje está involucrado en la experiencia musical y
rendimiento.

Los Fundamentos Del Acondicionamiento y El Aprendizaje - Traducción

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Los Fundamentos Del Acondicionamiento y El Aprendizaje - Traducción

Cargado por

Copyright:

Formatos disponibles

7/10/21 15:55 Los fundamentos del acondicionamiento y el aprendizaje - PDFDrive.

Copyright © 2018 por la Asociación Americana de Psicología. Todos los derechos

ISBN: 978-1-43382778-5 (edición electrónica). Sugiere una traducción mejor

Las opiniones y declaraciones publicadas son responsabilidad de los autores, y

750 First Street, NE

Departamento de pedidos de la APA

Diseñador de portada: Naylor Design, Washington, DC

Nombres de los datos de catalogación en publicación de la Biblioteca del Congreso : Domjan,

Título: Los fundamentos del condicionamiento y el aprendizaje / Michael Domjan.

Datos de catalogación en la publicación de la Biblioteca Británica Hay un registro CIP disponible

1. Conceptos básicos y definiciones

Relación temporal entre CS y EE. UU.

La hipótesis de la respuesta a la privación

Orígenes del estudio del aprendizaje por evitación

13. Control de estímulo de la conducta

Referencia y memoria de trabajo

y como resultado, muchas presunciones comunes sobre el aprendizaje ya no son válidas.

áreas de investigación contemporánea en condicionamiento y aprendizaje, con numerosas nuevas

Sabía usted que

La obtención de conocimientos es de gran interés porque es el medio principal por el cual

Características fundamentales del aprendizaje

APRENDIZAJE Y OTRAS FORMAS DE CAMBIO DE COMPORTAMIENTO

Es probable que la incomodidad cambie la forma en que camina y puede alentarlo a

APRENDIZAJE, RENDIMIENTO Y NIVELES DE ANÁLISIS

Niveles de análisis del aprendizaje. Los mecanismos de aprendizaje pueden investigarse en el

UNA DEFINICIÓN DE APRENDIZAJE

Este cambio es relativamente duradero y es el resultado de la experiencia con

El aprendizaje es un cambio relativamente duradero en el potencial de participar en

Observaciones naturalistas versus experimentales

zona de observación. Bajo la segunda condición, las ardillas no serían

El experimento de aprendizaje fundamental

inferirse de observaciones experimentales. Esta idea tiene profundas implicaciones

experiencia o formación medioambiental. En la condición de control , los participantes

EL PROBLEMA DE CONTROL EN ESTUDIOS DE APRENDIZAJE

EL ENFOQUE DE PROCESOS GENERALES PARA EL ESTUDIO DE

alentó un enfoque más ecológico para el análisis del aprendizaje animal.

EL USO DE PARTICIPANTES NO HUMANOS EN INVESTIGACIONES SOBRE

investigación porque primero tenemos que averiguar cómo se produce el aprendizaje en

Sabía usted que

el aprendizaje está restringido por la condición incondicionada o

El aprendizaje permite a los organismos beneficiarse de la experiencia. A través del aprendizaje,

Modelado y homogéneo versus heterogéneo

la madera tiene una consistencia heterogénea o desigual. Es granulado y tiene nudos.

El concepto del reflejo

Descartes frecuentaba estatuas cuyas extremidades se movían cuando alguien

Organización neuronal de reflejos simples. El estímulo ambiental para el reflejo.

Formas complejas de comportamiento provocado

PATRONES DE ACCIÓN MODAL

Existe cierta variabilidad en las respuestas obtenidas de una ocasión a otra,

Fotografía de una codorniz hembra viva (A) y de un modelo taxidérmico de la cabeza y

La codorniz macho respondió con igual vigor a un modelo taxidérmico completo de un

implica el uso de estímulos supernormales que provocan un comportamiento agresivo.

La organización de la conducta provocada

por el gasto de energía y la utilización de nutrientes. Este impulso a su vez

COMPORTAMIENTO APPETITIVO Y CONSUMIDOR

Sabía usted que

H abiendo considera la estructura de la conducta condicionada en el capítulo 2 , se

totalmente esclavizado a las vicisitudes del medio.

Efectos de la presentación repetida de una provocación

Una disminución en el vigor de la conducta provocada se denomina efecto de habituación . En

detrás de ti (haciendo un fuerte estallido), de repente encorvabas tu

CARACTERÍSTICAS DE LOS EFECTOS DE HABITUACIÓN

Efectos del cambio de estímulo