Está en la página 1de 51

CAPÍTULO

6
Control aversivo de la conducta

1 Distingue entre castigo positivo y negativo.


2 Investiga el refuerzo negativo como la base de la evasión y la evitación.
3 Descubre cómo la reducción de los estímulos aversivos regula la evitación.
4 Indagar acerca de la indefensión aprendida inducida por estímulos aversivos ineludibles.
5 Distinguir entre agresión desplazada y agresión de contracontrol.

6 Aprende sobre la coerción y sus efectos secundarios negativos en nuestra sociedad.

Los estímulos aversivos son eventos o sucesos de los que los organismos escapan, evaden o evitan. Las
picaduras de insectos, los ataques físicos, los malos olores, la luz brillante y los ruidos muy fuertes son
eventos comunes que los organismos están dispuestos a evadir sobre la base de la filogenia; es decir,
son estímulos aversivos naturales. Escapar o evitar estos estímulos aversivos primarios fue adaptativo,
presumiblemente porque los animales, que actuaban para eliminar o prevenir el contacto con estos
eventos, sobrevivían y se reproducían con mayor frecuencia. En otras palabras, los organismos no
aprenden a reaccionar ante algunos estímulos aversivos; Están biológicamente preparados para evitar
o escapar de tales eventos.
Otros estímulos adquieren propiedades aversivas cuando se asocian con eventos aversivos
primarios durante la vida de un animal. Para las personas, los estímulos aversivos condicionados (Save)
incluyen amenazas verbales, críticas públicas, una calificación reprobatoria, un ceño fruncido y
desaprobación verbal. Para afectar el comportamiento, estos eventos generalmente dependen de un
historial de castigo. Un bebé de 1 semana no se ve afectado por la desaprobación, como un movimiento
de cabeza. Sin embargo, cuando el niño tiene 2 años, el gesto puede evitar que el niño arranque páginas
de su libro favorito. Los animales también aprenden respuestas a estímulos condicionados como
188 Control aversivo de la conducta
eventos aversivos. La gente suele gritar "¡No!" cuando las mascotas se portan mal, y este estímulo
auditivo acaba reduciendo la probabilidad de la respuesta que sigue (por ejemplo, masticar su nueva
silla).

Yogur: 10.4324/9781003202622-6
CONTROL AVERSIVO EN LA VIDA COTIDIANA
Control aversivo, elefantes y abejas

Se dice que los elefantes huyen de los ratones, pero las investigaciones indican que es más probable
que escapen de los sonidos de las abejas africanas (King, Douglas-Hamilton y Vollrath, 2011). El "zumbido" de
las abejas se condiciona como un estímulo aversivo cuando es seguido por picaduras de abejas dentro de la
trompa del elefante, un evento aparentemente extremadamente doloroso, con hinchazón que puede durar
semanas. En Kenia, los agricultores y los elefantes a menudo están en conflicto por los cultivos que los elefantes
saquean y destruyen.
Los rumores entre los guardabosques sugerían que los elefantes evitan los árboles con colmenas, lo
que llevó a King y sus colegas a probar los efectos conductuales de una grabación de 4 minutos de
sonidos de abejas con 17 manadas de elefantes en las reservas nacionales de Buffalo Springs y Samburo
en Kenia. El "zumbido" funcionó cuando 16 de las 17 manadas salieron corriendo, y una manada incluso
corrió a través de un río para escapar (Figura 6.1). En promedio, los elefantes se alejaron 64 m de los
altavoces cuando
Control aversivo de la conducta 189

Figura 6.1
Se muestra una manada de elefantes africanos. Estos rebaños a menudo invaden los cultivos de los agricultores, comiéndose los
cultivos y destruyendo la propiedad. Los sonidos de las abejas y la presencia de colmenas mantienen alejados a los elefantes, según
la historia de condicionamiento de los elefantes que involucran picaduras de abejas en el interior de las trompas.
Fuente: Shutterstock.

Se reproducían sonidos de "zumbido", pero solo a 20 m cuando se reproducía el sonido de ruido blanco
aleatorio. El equipo para reproducir los sonidos de las abejas es demasiado caro (piense en los cables
de extensión que se necesitarían) para los agricultores. Sin embargo, las colmenas con abejas reales
son una alternativa factible que también proporciona a los agricultores alimentos adicionales e ingresos
por la miel. Los científicos colocaron colmenas cada 10 m a lo largo de una "valla de colmenas" de 1.700
m en granjas del norte de Kenia, que fueron Por lo general, solo están protegidos por barreras de
arbustos espinosos. En un período de 2 años, solo un elefante se rompió a través de la valla de la
colmena, en comparación con 31 invasiones a través de las barreras espinosas. La evidencia sugiere
que las abejas y su "zumbido" son un elemento disuasorio para los elefantes que se acercan a un
espacio, presumiblemente como resultado de una historia condicionada de picaduras de abejas y
aprendizaje social.
190 Control aversivo de la conducta
Control aversivo del comportamiento humano

El hecho de que los elefantes escapen de las abejas y las eviten ilustra que una gran cantidad del
comportamiento animal puede estar regulado por estímulos aversivos naturales. Los seres humanos
también utilizan y organizan ampliamente los estímulos aversivos para controlar el comportamiento de
los demás a nivel individual, social e institucional.
En el mundo físico, el castigo es un hecho de la vida. Con respecto al mundo social, Sidman (2001) ha documentado
nuestra excesiva dependencia de la coerción para controlar el comportamiento humano. El uso excesivo
y la apología del castigo por parte de algunos grupos se ilustra con las palizas a los niños como forma
de disciplina. En 2010, CBS News informó de la muerte a golpes de Lydia Schatz, de 7 años, por parte
de sus padres adoptivos. Las golpizas a Lydia y a su hermana de 11 años, que se recuperó de sus heridas,
irónicamente tuvieron lugar en Paradise, California. El informe decía:
Hace tres años, Kevin Schatz y su esposa Elizabeth hicieron algo tan noble que una estación de
televisión local los presentó; la pareja decidió adoptar a tres niños de Liberia. Ahora, están
acusados de matar a uno de los niños porque pronunció mal una palabra... Los fiscales dicen que
la pareja de California usó tubos de plástico de un cuarto de pulgada para matar a golpes a su hija
adoptiva de siete años. Al parecer, la idea la tomaron de un grupo cristiano fundamentalista, que
promueve esto como una forma de entrenar a los niños para que sean obedientes. El fiscal de
distrito del condado de Butte, Mike Ramsey, dijo que durante varias horas Elizabeth sujetó a la niña
de 7 años y Kevin la golpeó docenas de veces en la parte posterior del cuerpo, lo que le causó
daños masivos en los tejidos.
(Martínez, 2010; CBS News)

Posteriormente, la pareja se declaró culpable y Kevin Schatz fue sentenciado a 22 años de prisión
por asesinato, tortura y delito menor de crueldad hacia un niño. Elizabeth Schatz recibió una sentencia
de 13 años y 4 meses por homicidio voluntario, infligir lesiones corporales ilegales
castigo y delito menor de crueldad hacia un niño (historia completa en el video de CNN; Tuckman, 2011).
Lamentablemente, esta es solo una historia de muchas. En Estados Unidos, en 2019, los Centros para
el Control y la Prevención de Enfermedades informan de que 1 de cada 7 niños ha sufrido maltrato
infantil (en su mayoría negligencia y abuso físico). Ese mismo año murieron 1.840 niños (es decir, cinco
niños por día), y es probable que este tipo de abuso no se denuncie. Durante la primera parte de la
pandemia de COVID-19, si bien las visitas a la sala de emergencias relacionadas con el abuso infantil
disminuyeron, las tasas de hospitalización relacionadas con el abuso infantil aumentaron. Los factores
estresantes añadidos del cierre de escuelas, el aprendizaje a distancia, la pérdida de
Es probable que los ingresos y el aislamiento social hayan contribuido a ello (Swedo et al., 2020).
El uso del castigo y el control aversivo en la crianza de los hijos, desafortunadamente, ha sido
históricamente una práctica generalizada en la cultura estadounidense, y está bien documentado (ver
Gershoff, 2002
y Straus, 2001 sobre el uso del castigo corporal en Estados Unidos; también Park, 2002 describe
Control aversivo de la conducta 191
0.55

0.5

0.45

0.4

0.35

0.3

0.25

0.2
1990 1995 2000 2005 2010 2015 2020
Año

Figura 6.2
La prevalencia de padres en los EE. UU. que usan nalgadas en los últimos 30 años. El uso de nalgadas ha disminuido en los últimos
años.
Fuente: Datos basados en un estudio de Mehus, C. J. y Patrick, M. E. (2021). Prevalencia de nalgadas en muestras nacionales de EE. UU. de padres
de 35 años de 1993 a 2017. Revista de la Asociación Médica Americana de Pediatría. 2021; 175(1):92– 93. doi:10.1001/ jamapediatrics.2020.2197

la dificultad de aislar los efectos del castigo parental de un "paquete" de tácticas disciplinarias). Sin
embargo, el uso del castigo físico y específicamente de las nalgadas ha disminuido bastante en los
últimos 30 años como táctica disciplinaria a medida que han surgido más investigaciones sobre sus
efectos nocivos (Mehus y Patrick, 2021). La figura 6.2 muestra esta disminución.
Control aversivo y violencia doméstica
En los Estados Unidos, el control aversivo y el castigo no solo ocurren en las relaciones entre padres e
hijos, sino que también son aspectos prevalentes de la violencia doméstica entre parejas (véase la figura
6.3). La violencia doméstica generalmente involucra a una persona que usa tácticas físicamente
coercitivas que aumentan en intensidad para controlar el comportamiento de la víctima. Estas formas
de controlar a los demás son ilegales y dañinas. Alguien que se involucra en este tipo de
comportamiento debe buscar terapia para aprender formas prosociales de resolver problemas,
comunicarse e interactuar con sus seres queridos. Desafortunadamente, esto no sucede con la
suficiente frecuencia.
Una persona nunca merece ser controlada o castigada a través de medios violentos o
emocionalmente abusivos. Por lo tanto, dejar la relación es una opción conductual razonable cuando hay
violencia doméstica. Sin embargo, muchas víctimas permanecen en relaciones abusivas (Miller, Lund y
Weatherly, 2012). Es importante, entonces, entender las contingencias de por qué una víctima puede elegir
quedarse o dejar a una pareja doméstica abusiva. La investigación muestra que la dinámica de la violencia
doméstica, también llamada "ciclo de violencia", opera para aumentar la efectividad del refuerzo para
permanecer en la relación y, al mismo tiempo, aumenta el castigo por irse. Esta complejidad puede dificultar que
alguien salga de una situación abusiva.
192 Control aversivo de la conducta
Consideremos las condiciones que podrían aumentar las probabilidades de permanecer en una relación
abusiva que son relevantes para el abusador. Después de un episodio abusivo, puede haber un

Figura 6.3
La violencia doméstica es una forma extrema de control aversivo.

"luna de miel" o período de reconciliación y comportamiento de remordimiento por parte del


perpetrador. Un análisis conductual sugiere que este cambio errático en el comportamiento del abuso
al afecto intenso y el dolor sirve como refuerzo intermitente para permanecer en la relación y aumenta
las posibilidades de que quedarse se vuelva resistente a la extinción, lo que aumenta la probabilidad
de que la víctima elija permanecer en la relación abusiva. Permanecer en la relación abusiva también
puede mantenerse mediante el refuerzo negativo, que surge de un patrón de conflicto y tensión
crecientes seguido de un período de "enfriamiento" con reducción de la amenaza inmediata (para más
información sobre el refuerzo negativo y el refuerzo condicionado en el ciclo de violencia, véase Miller
et al., 2012). Por lo tanto, el refuerzo positivo intermitente y el refuerzo negativo operan para establecer
y mantener la permanencia de la víctima en la relación abusiva.
Las víctimas de violencia doméstica a menudo informan que el abuso no ocurrió repentinamente
de la noche a la mañana y que el perpetrador fue amable, cortés y considerado. En estos escenarios, el
abuso puede comenzar con formas menos graves de abuso verbal (p. ej., insultos, empujones) que
pueden aumentar en gravedad a bofetadas o golpes, y finalmente a formas muy graves, como golpear,
quemar, violar o torturar a la víctima. Una implicación aquí es que las formas menos intensas de control
aversivo por parte del abusador pueden ser inicialmente efectivas para reducir el comportamiento (por
ejemplo, lograr que la víctima cumpla con sus demandas), pero a medida que la víctima está expuesta,
se necesitan formas más severas para el cumplimiento. Esto representa uno de los efectos secundarios
de los estímulos aversivos que se discutirán más adelante en el capítulo. Además, es posible que estas
formas graves ya no sean funcionales para obtener el cumplimiento, sino que pueden usarse para dañar
a la víctima y causar sufrimiento.
Control aversivo de la conducta 193
Aunque puede ser difícil entender las razones (reforzadores positivos y negativos) para permanecer
en una relación abusiva, también se deben considerar los costos de respuesta para el comportamiento
alternativo, como dejar la relación. Estos costos pueden dificultar la salida de la relación. Los costos de
la partida incluirían el esfuerzo y la capacidad de obtener alimentos, refugio y seguridad; Esto puede
ser especialmente difícil cuando los niños viven en el hogar. También hay "costos sociales" impuestos
por los posibles juicios y el comportamiento de la familia, los amigos o el clero. También existe el temor
sobre el daño potencial que podría ser causado por la persecución y la intimidación por parte del
abusador. En general, la violencia doméstica implica una compleja interacción de contingencias
conductuales tanto dentro como fuera de la relación abusiva. Las intervenciones conductuales a
menudo se centran en cambiar las condiciones que influyen en el comportamiento de estadía/salida de
la víctima mediante la alteración de las contingencias y el cambio De esta manera, la mayoría
de las personas que se encuentran en el campo de las operaciones (Miller et al., 2012).
Lamentablemente, el comportamiento del perpetrador es con menos frecuencia el foco del cambio de
comportamiento en estas situaciones; Esta sería un área importante para que los analistas del
comportamiento la examinen.

CONTINGENCIAS DE LA PENA
Dada la aceptación y omnipresencia del castigo en nuestra sociedad, es notable que hoy en día haya
muy poca investigación básica sobre el control aversivo y la mejor manera de minimizar sus efectos secundarios
y reducir su prevalencia (Catania, 2008). La mayoría de los estudios sobre los principios básicos del castigo (y el
refuerzo negativo) se llevaron a cabo entre la década de 1950 y principios de la de 1980, momento en el que los
estudios sobre el castigo casi se detuvieron. Una de las principales razones de esto fue la enmienda de 1985 a la
Ley de Bienestar Animal del USDA, pautas federales que tenían implicaciones para el uso de experimentos con
animales. Esta enmienda esbozó una serie de protecciones para los animales, una de las cuales fue que los
comités de ética de las instituciones que utilizan animales en la investigación (como las universidades o las
escuelas de medicina) deben evaluar los protocolos de investigación antes de que se pueda realizar la
investigación para garantizar que cualquier dolor o angustia animal que ocurra sea justificable, minimizado o
mitigado (considere, por ejemplo, las pruebas con animales en tratamientos para el cáncer). También ha habido
cambios en los valores culturales para el uso de animales en la investigación, incluido el movimiento activista
por los derechos de los animales. Estos dos acontecimientos históricos dificultaron la realización de
experimentos sobre el castigo, ya que el uso de animales con procedimientos de castigo era considerado por
muchos como inhumano. En este capítulo, presentamos los hallazgos acumulados sobre el castigo y otras formas
de control aversivo, asumiendo que este conocimiento sobre los efectos y efectos secundarios del control
aversivo es una mejor estrategia para mejorar la condición humana que no tener ninguna investigación o datos.
Notarás que muchos de estos estudios se realizaron entre las décadas de 1950 y 1980.
Si bien es tentador asumir que el término castigo significa disciplina de algún tipo, el término se
usa de manera diferente en el análisis del comportamiento. Cuando una contingencia conductual resulta en una
disminución en la tasa de respuesta, la contingencia se define como, y se denomina, castigo. Cualquier evento o
estímulo que disminuya la tasa de comportamiento operante se denomina castigador. Llegados a este punto,
ahora hablamos de las contingencias del castigo; El reforzamiento negativo se aborda más adelante en este
capítulo (véase también Hineline y Rosales-Ruiz, 2013, capítulo sobre el castigo y el refuerzo negativo en el
Manual de Análisis de la Conducta de la APA).
194 Control aversivo de la conducta
Muchas operaciones, aparte de una contingencia de castigo, reducen la frecuencia del
comportamiento y la tasa de respuesta. Estos incluyen la saciedad, la extinción, el contraste conductual,
el agotamiento, la restricción, el compromiso previo y los programas alternativos de refuerzo más ricos.
Cada uno de estos procedimientos se discute a lo largo de este libro de texto. El castigo se define cuando
un evento depende de la ocurrencia de una respuesta específica y la probabilidad de esa respuesta se
reduce. Si se presenta una pequeña descarga eléctrica o un tono fuerte que depende de la presión de
la palanca, y la presión repetida de la palanca ha producido descargas o tal vez el tono fuerte, es menos
probable que la rata presione la palanca. El efecto y la contingencia se denominan castigo positivo.

Figura 6.4
Contingencias aversivas de refuerzo y castigo (adaptado de la figura 4.3 del capítulo 4). Cuando un estímulo o evento sigue a la
conducta operante, entonces la conducta aumenta o disminuye en frecuencia. Es esta relación entre comportamiento y
consecuencia la que define la contingencia.

Castigo positivo

El castigo positivo ocurre cuando se presenta un estímulo después de una operante y la operante
disminuye en frecuencia. La contingencia del castigo positivo se muestra en la celda 2 de la figura 6.4.
Cuando un padre reprende a un niño por correr a la calle y el niño deja de hacerlo, esto es un castigo
positivo. Por supuesto, técnicamente, las reprimendas funcionan como castigo solo si disminuyen la
probabilidad de correr hacia la calle. Este es un punto importante porque en el lenguaje habitual se
habla de castigo sin tener en cuenta sus efectos en la conducta. Por ejemplo, puedes gritar y discutir
con otra persona cuando exprese una posición política en particular. Tus gritos son un castigo positivo
solo si la otra persona deja (o disminuye) de hablar de política. De hecho, la persona puede aumentar
su ritmo de conversación política (como suele suceder en las discusiones). En este caso, en realidad has
reforzado en lugar de castigar la discusión contigo. Así, el castigo positivo se define como una
disminución de la conducta operante producida por la presentación de un estímulo que le sigue. Según
esta definición funcional, el castigo siempre funciona.

La sobrecorrección como castigo positivo


En el análisis conductual aplicado, la sobrecorrección es un procedimiento de castigo positivo que
utiliza la "restitución" para reducir o eliminar el comportamiento destructivo o agresivo. Se requiere
que la persona que emite respuestas agresivas o destructivas "restaure la situación perturbada a un
estado muy mejorado" (Foxx y Azrin, 1973, p. 15). Por lo tanto, un niño o adolescente que hace un
Control aversivo de la conducta 195
berrinche arrojando juguetes y objetos por toda su habitación y derriba muebles puede sobrecorregir
los efectos ambientales de sus acciones reorganizando los juguetes y muebles de toda la habitación y
disculpándose con los miembros de la familia. La sobrecorrección también puede implicar una práctica
positiva, lo que requiere que el niño o adolescente practique intensamente una forma corregida de la
acción.
La sobrecorrección incluye procedimientos adicionales como el refuerzo diferencial de conductas
alternativas o la extinción, que contribuyen a la eficacia de la sobrecorrección como
paquete de intervención. Por ejemplo, Azrin, Besalel-Azrin y Azrin (1999) recomiendan proporcionar
elogios, atención y otras formas de refuerzo al alumno cada vez que pueda realizar
"espontáneamente" un comportamiento apropiado durante actividades similares. Es
importante tener en cuenta
que se debe hacer una distinción sobre si el comportamiento desafiante es "deliberado" o el resultado
de un déficit de habilidades (Azrin, Besalel-Azrin, & Azrin, 1999). La práctica positiva puede ser efectiva porque
el esfuerzo adicional es aversivo y desalienta el comportamiento desafiante futuro si el comportamiento es
deliberado. Si el comportamiento es el resultado de un aprendizaje insuficiente, la práctica intensiva del
comportamiento correcto debe tomar el lugar del comportamiento desafiante. Hasta la fecha, un análisis
detallado de los componentes del "paquete" no ha sido un enfoque principal de la investigación conductual
aplicada. Sin embargo, los análisis críticos y las revisiones de la sobrecorrección sugieren que se debe tener
cuidado al implementar la sobrecorrección y que solo debe ser implementada por expertos dada su naturaleza
punitiva y su potencial de efectos secundarios (por ejemplo, respuestas de escape, reacciones emocionales y
agresión provocada u operante) (Miltenberger y Fuqua, 1981).
Es importante señalar que el comportamiento que se castiga se mantiene típicamente mediante el
refuerzo antes de ser castigado. Cuando el comportamiento castigado se detiene, la densidad de
refuerzo en la vida de una persona también disminuye. Por lo tanto, la vida a menudo empeora con el
uso del castigo en un programa de tratamiento. Una estrategia consiste en organizar fuentes
alternativas de refuerzo de alta densidad con formas socialmente apropiadas de obtenerlas siempre
que el castigo se utilice como
parte de un programa de tratamiento, incluidos los programas que utilizan la sobrecorrección (Cautela, 1984).

Castigo negativo

El castigo negativo se representa en la celda 4 de la figura 6.4. Cuando se elimina un estímulo continuo
que depende de una respuesta y esta eliminación da como resultado una disminución en la tasa de
comportamiento, la contingencia se denomina castigo (u omisión) negativo. En otras palabras, si el
organismo responde, el estímulo se elimina y el comportamiento disminuye. Un niño está viendo la
televisión, pero si corre, la televisión se apaga. Un conductor ha ganado dinero y es multado por exceso
de velocidad (se le quita el dinero). En estos casos, los estímulos (es decir, la televisión o el dinero) se
eliminan en función de la conducta, y la conducta disminuye.
El castigo negativo a menudo se confunde con la extinción. La extinción se produce cuando una
respuesta previamente reforzada ya no produce refuerzo. En este caso, una respuesta ha producido un
refuerzo; La extinción de esa respuesta está en vigor cuando se interrumpe la respuesta → la
contingencia del reforzador. Una paloma puede picotear una llave para alimentarse, pero cuando se
programa la extinción, el picoteo ya no produce refuerzo alimenticio. Del mismo modo, es posible que
196 Control aversivo de la conducta
a un niño se le permita transmitir su programa de televisión favorito después de completar las tareas.
Pero si el Wi-Fi no funciona, la contingencia ya no está vigente y hacer la tarea está en extinción.
En otro ejemplo, el refuerzo continuo podría ser comer con la familia (la comida y la buena
conversación son los reforzadores). Las respuestas pueden incluir hablar con una hermana, pasar
comida alrededor de la mesa o revisar las publicaciones en las redes sociales. Revisar las publicaciones
en las redes sociales puede resultar en que un miembro de la familia le diga que renuncie a su teléfono
inteligente (castigo negativo, suponiendo una disminución en la verificación de las redes sociales).
Renunciar a tu teléfono reduce tu tendencia a revisar las publicaciones en las redes sociales la próxima
vez que comas con tu familia.
Tiempo de espera del refuerzo como castigo negativo
En términos de comportamiento, renunciar a su teléfono es un tiempo de espera para el refuerzo
positivo, suponiendo que el procedimiento reduzca la revisión de las publicaciones en las redes sociales durante
la cena. Con el tiempo fuera, el adolescente pierde el acceso al refuerzo positivo durante un período específico
(hasta la próxima comida familiar) por participar en el comportamiento indeseable. En el aula, el tiempo de
espera puede implicar exclusión o no exclusión (Cooper, Heron y Heward, 2007). En el tiempo de espera sin
exclusión, el estudiante no se retira físicamente de la situación. El tiempo de espera por no exclusión ocurre
cuando el maestro utiliza la ignorancia planificada de la conducta, la retirada de un reforzador positivo específico
o la entrega a la persona de una ficha de tiempo de espera intercambiada más tarde por un período de tiempo
de espera. El tiempo de espera de exclusión, por otro lado, implica colocar a la persona en un espacio separado
de los demás (y el refuerzo asociado), como la sala de tiempo de espera, un espacio dividido para el tiempo de
espera. Otro ejemplo podría ser colocar al estudiante infractor en un pasillo estéril de la escuela.
Para que un procedimiento de tiempo fuera efectivo en un aula, el profesor debe asegurarse de
que las actividades del aula sean reforzantes para el estudiante en primer lugar, definir las respuestas
que conducen al tiempo fuera y decidir el método a utilizar (no exclusión o exclusión). Además, se debe
especificar la duración máxima del tiempo de espera (generalmente un período breve), se deben
establecer los criterios de salida y se debe obtener el permiso para usar el tiempo de espera de las
partes relevantes, como el director de la escuela y los padres. Además, el regreso del niño al aula para
las actividades regulares puede usarse como refuerzo para el buen comportamiento durante el tiempo
fuera. Como en todas las intervenciones conductuales, el profesor debe llevar registros precisos para
evaluar la eficacia del procedimiento.
Costo de respuesta como castigo negativo
El costo de respuesta es otro procedimiento de castigo negativo en el que se eliminan los reforzadores
condicionados (fichas) en función de la conducta, y la conducta disminuye. En los seres humanos, las
contingencias comunes de respuesta a los costos implican la pérdida de dinero o privilegios por
desobediencia.
Y esta pérdida disminuye la ruptura de las reglas. Por ejemplo, Bartlett y sus colegas (2011) utilizaron el costo de
respuesta para disminuir la saliva en un niño de 8 años con autismo. Los investigadores probaron
primero una condición de refuerzo no contingente en la que el niño tenía acceso a juguetes y
reforzadores preferidos. La saliva disminuyó en esta afección en relación con el valor basal; sin embargo,
sigue ocurriendo a un ritmo socialmente inaceptable. Luego, los investigadores probaron la condición
de costo de respuesta en la que el niño perdió el acceso a una radio de juguete preferida que dependía
de escupir. Descubrieron que esta afección era eficaz para disminuir los escupitajos a niveles cercanos
Control aversivo de la conducta 197
a cero. Es importante destacar que los investigadores intentaron un procedimiento basado en el
refuerzo para el comportamiento socialmente apropiado antes de implementar el costo de respuesta.
El costo de respuesta también se puede organizar mediante reforzadores de tokens, que posteriormente se
sustraído o eliminado después de una respuesta. Conyers et al. (2004) llevaron a cabo un estudio para reducir las
conductas disruptivas de 25 niños en edad preescolar. Utilizaron un diseño multielemento para
comparar la condición de refuerzo diferencial de otro comportamiento (DRO, por sus siglas en inglés),
en la que los niños ganarían fichas por no participar en conductas disruptivas, y el costo de respuesta,
en el que los niños perderían fichas por participar en conductas disruptivas. Encontraron que ambas
condiciones eran efectivas para disminuir el comportamiento disruptivo; sin embargo, el costo de
respuesta fue más efectivo. Los investigadores recomendaron usar una combinación de ambas
características para disminuir los efectos secundarios del comportamiento emocional. La investigación
en el laboratorio con palomas que utilizan diodos emisores de luz (LED) como fichas intercambiadas
para acceder a los alimentos ha respaldado los hallazgos en humanos. Las aves muestran supresión del
comportamiento por contingencias de respuesta y costos y efectos similares a los castigos tradicionales,
tales como
electrochoque eléctrico (Pietras y Hackenberg, 2005).

Condiciones que influyen en la eficacia del castigo

A diferencia del refuerzo, las contingencias de castigo no enseñan ni condicionan nuevas conductas que
sustituyan a la conducta castigada. Las contingencias del castigo por sí solas eliminan o, más a menudo,
suprimen temporalmente la tasa de conducta operante. En esta sección, describimos algunas de las
condiciones que aumentan la efectividad del castigo como un procedimiento de reducción de la
conducta.
Una cosa fundamental que hay que recordar sobre el castigo es que la respuesta a ser castigada
siempre se mantiene mediante un programa de refuerzo. Por lo tanto, un programa de castigo
generalmente se superpone a un programa de refuerzo. Esto significa que realmente estamos
investigando los efectos del castigo aplicado a la conducta mantenida por algún programa de refuerzo
positivo, y los resultados pueden reflejar ambas contingencias. ¿Qué ganará más en términos de influir
en el comportamiento: el programa de refuerzo o castigo?

Intensidad del castigo


Considere el siguiente escenario. Mike ha comprado un nuevo sistema de audio para el hogar y su amigo
Joe y la hija de 2 años de Joe vienen de visita. El niño está comiendo una gota de mantequilla de maní
y se dirige directamente al nuevo equipo. Nervioso, Mike mira a su amigo, quien le dice: "Emily, no
toques, ese es el nuevo sistema de audio de Mike". El niño continúa tocando las perillas de control en
el sistema de alta gama de Mike, y Joe dice más enfáticamente: "¡Por favor, déjalo en paz!" Emily todavía
está untando mantequilla de maní en la inversión de Mike, por lo que Joe mira a su hijo y dice en voz
alta: "¡Dije que detenga eso!" Emily no se detiene, y ahora es amenazada con "¡Si no te detienes, te
daré una nalgada!" Emily sigue jugando con los mandos del sistema de audio. Desesperado, Joe le da a
Emily un ligero golpecito en la parte inferior, que ella ignora. En esta circunstancia, los presuntos
castigadores se introducen a baja intensidad y se incrementan gradualmente. Tales acciones enseñan
al niño a hacer caso omiso de las peticiones tempranas de los padres y que las "amenazas vacías" no
198 Control aversivo de la conducta
tienen sentido. Por supuesto, la mejor solución para el problema del sistema de audio sería limpiar las
manos del niño o colocar el equipo fuera de su alcance, lo que se denomina prevención de respuesta.
La investigación del laboratorio nos muestra que si se va a utilizar el castigo, es más efectivo cuando
se introduce a una intensidad moderada a alta en la primera ocasión. Generalmente, el castigo de
mayor intensidad resulta en una mayor supresión de la respuesta. El castigo positivo de baja intensidad
puede dejar el comportamiento relativamente poco afectado, y el receptor solo molesto, mientras que
los valores más altos del castigador pueden cambiar permanentemente el comportamiento (Appel y
Peterson,
1965). Varios experimentos han demostrado que el castigo intenso puede eliminar por completo la
respuesta (Appel, 1961; Storms, Boroczi y Broen, 1962). Una implicación interesante es que una vez que se
produce la supresión completa de la respuesta, es poco probable que el comportamiento se recupere durante
algún tiempo, incluso cuando se retira la contingencia del castigo. Esto se debe a que el organismo deja de
responder y nunca entra en contacto con el entorno cambiado, lo que suele ser deseable. Por otro lado, un
organismo puede responder de nuevo cuando el refuerzo está disponible después de que se haya retirado el
castigo. En estas condiciones, el comportamiento, por supuesto, puede recuperarse rápidamente a los niveles
previos al castigo. Estas observaciones llevaron a Skinner y a otros a sugerir que el castigo por sí mismo sólo
produce una supresión temporal de la conducta.
Skinner se opuso al uso del castigo para regular el comportamiento. En repetidas ocasiones
argumentó en contra del uso del castigo y, en cambio, a favor del uso del refuerzo positivo. Recuerde,
sin embargo, que tanto el refuerzo como el castigo se definen funcionalmente por un cambio en la
conducta; Si la tasa de respuesta no cambia, no se puede decir que se haya producido ni el refuerzo ni
el castigo.

Inmediatez del castigo


El castigo es más efectivo para reducir las respuestas cuando sigue de cerca el comportamiento (Azrin, 1956; Cohen,
1968). Este efecto puede pasarse por alto fácilmente porque el castigo a menudo genera un comportamiento
emocional que puede interrumpir las respuestas operantes. En otras palabras, cuando se introduce por primera vez,
el castigo positivo provoca un comportamiento reflejo que previene la aparición de un comportamiento operante.
Observe a un niño (o adulto) que acaba de ser castigado severamente por hacer ruidos groseros. Es probable que
vea al niño sentarse en silencio, posiblemente llorar o apartar la mirada de los demás. En el lenguaje común, podemos
decir que el niño está haciendo pucheros o humillado, pero en realidad lo que está sucediendo es que el
comportamiento emocional reflexivo está interrumpiendo todo el comportamiento operante. Si el castigo sigue
inmediatamente por hacer ruidos groseros (el comportamiento objetivo), esos ruidos (así como muchas otras
respuestas operantes) disminuirían en frecuencia. Sin embargo, hacer ruidos no se vería relativamente afectado si el
castigo no siguiera de cerca la respuesta objetivo.
Algunas investigaciones en animales también apoyan que el castigo suprime el comportamiento a
través de la obtención de reflejos. Azrin (1956), por ejemplo, castigó inmediatamente las respuestas de
algunas ratas, mientras que otro grupo recibió un castigo tardío. Después de la primera hora de
exposición al castigo positivo, el castigo inmediato frente al castigo tardío marcó una gran diferencia:
las respuestas que se castigaron después de un retraso se recuperaron sustancialmente, pero cuando
el castigador se entregó de inmediato, las respuestas a menudo se eliminaron por completo. Una
interpretación de esto es que la introducción del castigo inmediato genera respuestas que pueden
interrumpir el comportamiento operante. Sin embargo, con el castigo diferido, la contingencia de
Control aversivo de la conducta 199
refuerzo para el comportamiento objetivo (una presión de barra, por ejemplo) se contacta de inmediato
y con el tiempo puede anular los efectos del castigador. Por lo tanto, el castigo es más efectivo cuando
se entrega inmediatamente después de la respuesta.
Cronograma de castigo
En general, el castigo positivo es más efectivo cuando se administra después de cada respuesta (a
(Zimmerman y Ferster, 1963) en lugar de
(Filby y Appel, 1966). Azrin, Holz y Hake (1963) entrenaron palomas para picotear una llave en un programa VI de 3
minutos de refuerzo alimentario. Una vez que la respuesta fue estable, los choques se presentaron
después de 100, 200, 300, 500 o 1,000 picotazos clave. La tasa de respuesta disminuyó sustancialmente
incluso cuando el castigo se aplicó después de 1.000 respuestas. A medida que aumentaba la tasa de
castigo, disminuía el número de respuestas por hora. En otras palabras, a medida que se castigaban más
respuestas, la tasa operante disminuía. El castigo continuo (FR 1) produjo la mayor supresión de la
respuesta. El efecto máximo es similar a lo que sucede cuando se aumenta la intensidad del castigador.
Por lo tanto, para maximizar la supresión de las respuestas, la administración frecuente a alta intensidad
es más eficaz. En particular, con el castigo de alta intensidad, la supresión de la respuesta a menudo
ocurre con pocos castigadores, tal vez solo uno.
Los patrones de tasa de respuesta en varios programas de castigo (FR, FI, VI y VR) suelen ser
opuestos a los patrones producidos en programas similares de refuerzo positivo. Por ejemplo, un
programa de castigo FI cuando se superpone a un programa VI de refuerzo para el picoteo de las
palomas produce una vieira inversa (recuerde que el refuerzo FI a menudo produce un patrón de
festoneado). A cada aparición del castigador le sigue una tasa inmediatamente alta de picoteo que
disminuye gradualmente a medida que se acerca el momento del siguiente castigo (Azrin, 1956).
En resumen, el castigo es más efectivo cuando es intenso, inmediatamente después de la respuesta
y bajo un horario continuo.

Reducción de la eficacia del refuerzo positivo


El castigo suprime más la conducta cuando el refuerzo positivo que mantiene la respuesta se reduce
simultáneamente en efectividad. Azrin, Holz y Hake (1963) entrenaron palomas para picotear una llave
en un programa VI de 3 minutos de refuerzo alimentario. Después de que la respuesta fuera estable,
introdujeron una descarga por cada 100 respuestas. Las aves fueron expuestas al programa de refuerzo
más castigo en varios niveles de privación de alimento. Recuerde que la privación de alimentos es una
operación de establecimiento que debería aumentar el picoteo de la llave de la comida (y aumentar la
efectividad de refuerzo de la comida). Con menor privación, el castigo prácticamente detuvo la
respuesta de las aves. Sin embargo, cuando se les privaba más de alimentos, el castigo era menos
efectivo y era más probable que se mantuviera la tasa de respuesta.
Estos hallazgos pueden tener implicaciones prácticas. El castigo se utiliza a menudo con la
esperanza de reducir la frecuencia del comportamiento humano indeseable. Pero hay efectos
secundarios de la regulación punitiva de la conducta, que se discutirán más adelante en este capítulo,
lo que sugiere que estas técnicas deben usarse con cuidadosa consideración y precaución. El uso de
estímulos aversivos, especialmente el shock, tiene una historia controvertida y es un tema de
importancia en el análisis contemporáneo de la conducta. Describiremos estas cuestiones en una
sección posterior de este libro de texto.
200 Control aversivo de la conducta
Organizar alternativas de respuesta
Una forma sencilla de hacer que el castigo sea más efectivo o innecesario es darle a una persona otra
forma de obtener refuerzo. Cuando se dispone de una alternativa de respuesta reforzada, incluso los niveles
moderados de castigo suprimen la conducta. De hecho, ¡a veces ni siquiera se requiere un castigador! Para
utilizar un procedimiento alternativo de respuesta, es esencial identificar las consecuencias que mantienen la
conducta objetivo. A continuación, a la persona (o animal en un laboratorio) se le da otra forma de obtener el
mismo reforzador o uno preferido. Herman y Azrin (1964) hicieron que la gente presionara bajo un programa VI
de refuerzo. Cada vez que se presionaba la palanca, se producía un molesto zumbido, pero el procedimiento solo
reducía ligeramente la tasa de respuesta. Finalmente, a las personas se les dio otra opción de respuesta que no
producía el zumbido; Rápidamente cambiaron a esa alternativa y se eliminaron las respuestas castigadas.
Imagina que hay una tienda de conveniencia (un reforzador) en el medio de la cuadra directamente
detrás de tu casa. A menudo caminas hacia la tienda, pero si giras a la izquierda para dar la vuelta a la
manzana, te cruzas con un perro encadenado que se abalanza y te gruñe. En cambio, si giras a la
derecha, no adelantas al perro. Es obvio que la mayoría de las personas, después de la experiencia con
estas contingencias, elegirían la ruta impune a la tienda. Sin embargo, si girar a la derecha conduce a
un camino que no lo lleva a la tienda, puede continuar caminando junto al perro que se abalanza. En
realidad, por supuesto, podrías caminar por el otro lado de la calle o conducir hasta la tienda, estas
también son respuestas alternativas impunes.

NUEVAS DIRECCIONES: EPIGENÉTICA EN EL CONDICIONAMIENTO DE RETENCIÓN DEL MIEDO

En el Capítulo 1, describimos brevemente el campo de rápido crecimiento de la epigenética y su relevancia


para la retención del aprendizaje temprano (ver "Nuevas direcciones: mecanismos epigenéticos y retención del
aprendizaje temprano"). Recordemos que las experiencias de aprendizaje a veces son retenidas por mecanismos
epigenéticos a nivel celular. La metilación del ADN y la acetilación de histonas tensan y aflojan, respectivamente, la
estructura de la cromatina que envuelve los genes, lo que permite diferencias en la expresión génica (transcripción y
traducción) sin ninguna alteración de la secuencia de ADN. Las diferencias en la expresión génica instigadas por el
ambiente (externo e interno) que opera sobre mecanismos moleculares y epigenéticos, cambian las interconexiones
neuronales relacionadas con el comportamiento, un proceso conocido como neuroplasticidad (Johansen, Cain, Ostroff y
LeDoux, 2011). Aquí presentamos una descripción no técnica de algunas de las evidencias de los efectos epigenéticos en
la retención del miedo en el aprendizaje. Nuestra descripción general se basa en una revisión
De Tendencias en Neurociencia por Kwapis y Wood (2014).
A menudo es adaptativo para los organismos retener o recordar experiencias de aprendizaje aversivas.
Para estudiar la regulación epigenética del aprendizaje y la memoria, los neurocientíficos conductuales han
adoptado un protocolo simple y bien caracterizado de condicionamiento del miedo del respondiente. En la
fase de entrenamiento, a los animales (a menudo ratones) se les presenta un tono (CS) seguido de una
pequeña descarga en el pie (US) en un lugar específico (cámara blanca o contexto) y se utiliza la congelación
como respuesta al miedo (CR). Los circuitos neuronales del condicionamiento básico del miedo han sido
investigados (Johansen et al., 2011) e involucran las respuestas de las neuronas en la amígdala al tono (o
contexto) y la contingencia de choque. Además, la RC de congelación en un contexto específico (iluminación,
forma, color o textura de la cámara) involucra el hipocampo dorsal y la corteza prefrontal medial del cerebro.
La disrupción experimental de estas regiones cerebrales perjudica el condicionamiento contextual y de orden
superior. Debido a que las vías neuronales están bien descritas, los neurobiólogos del comportamiento
pueden realizar estudios epigenéticos del condicionamiento del miedo a nivel celular y molecular.
Control aversivo de la conducta 201
Después del entrenamiento inicial mediante condicionamiento del miedo en la cámara blanca, se
manipula la expresión génica de los animales de experimentación, mientras que los controles no reciben
este tratamiento. A continuación, después de un retraso de 24 horas, los animales se trasladan a un nuevo
contexto (caja gris) para probar la congelación al estímulo tonal (prueba tonal), seguida de una prueba de
congelación en la cámara blanca original, pero sin el tono (prueba de contexto). Sobre la base de estas
pruebas de condicionamiento y manipulaciones de la expresión génica, se sabe que el condicionamiento del
miedo promueve cambios epigenéticos (marcas) relacionados con la transcripción de genes relacionados con
la retención del aprendizaje del miedo y también inhibe la expresión de genes limitantes de la retención. La
acetilación de histonas (llevada a cabo por enzimas histonas acetiltransferasas o HATs) aumenta la retención
y es la modificación epigenética más ampliamente investigada en el condicionamiento del miedo. En las
pruebas de tono y contexto, los fármacos que inhiben las HAT y la acetilación de histonas disminuyen la
retención de las respuestas de miedo, mientras que los fármacos que inhiben las HDAC (enzimas que
eliminan los grupos acetilo) aumentan la retención (la desacetilación de histonas y las HDAC se analizan con
más detalle en el capítulo 14 de "Nuevas direcciones: reprogramación epigenética del comportamiento social
en hormigas carpinteras"). Estudios adicionales muestran que las manipulaciones de la acetilación de
histonas en la amígdala afectan específicamente a la congelación del tono (CS), mientras que las
manipulaciones dirigidas en el hipocampo mejoran (o perjudican) la respuesta de miedo al contexto.
Para investigar la retención del aprendizaje a largo plazo, los neurobiólogos conductuales utilizan una
situación de condicionamiento del miedo que implica entrenamiento, reactivación y una prueba para
recordar después de un largo retraso
(Maddox, Watts, Doyere y Schafe, 2013). Inicialmente, el animal recibe entrenamiento en una cámara blanca de novela; un
tono (CS) se asocia con hasta 3 presentaciones de choque en el pie (US). Veinticuatro horas después, el
animal es colocado en una cámara gris y se presenta un solo tono (CS) sin el choque para reactivar el
condicionamiento del miedo. Una hora después de la reactivación, los inhibidores de HAT se utilizan para
manipular la expresión génica (fármaco vs. vehículo). Aproximadamente 1 día después, el animal se coloca
de nuevo en la cámara gris y se somete a una prueba de congelación 10 veces para el tono CS (recordando
el miedo después de un retraso de 48 horas).
Se ha descubierto que las enzimas HAT mejoran el recuerdo a largo plazo del condicionamiento del
miedo. Por lo tanto, después de la reactivación de una experiencia de miedo débil (un ensayo de
entrenamiento), la inhibición farmacológica de las enzimas HAT en la amígdala lateral (LA) interrumpe la
congelación al tono un día después, lo que indica que los animales ya no recordaban la respuesta de miedo
condicionada. En otros experimentos, las ratas recibieron 3 presentaciones de choque de tono
(acondicionamiento fuerte) seguidas de 2 semanas en jaulas caseras sin entrenamiento adicional. A
continuación, las ratas fueron transferidas a la cámara gris para el procedimiento habitual de reactivación y
se les administró una infusión intra-LA del inhibidor de HATs. Un día más tarde y 21 días después del
entrenamiento aversivo, las ratas a las que se les infundió el inhibidor de HATs en la LA mostraron menos
congelación del tono que los animales de control. Significativamente, la inhibición de las enzimas HAT
después de la reactivación de una experiencia de miedo afecta la memoria, especialmente por parte de las
neuronas en la amígdala lateral (ver Kwapis y Wood, 2014 para evidencia sobre la manipulación de HDAC).
Los estudios de reactivación y manipulación epigenética para reducir las respuestas de miedo después
de un largo retraso han cobrado importancia. Trastorno de estrés postraumático (TEPT) y otros traumas y
ansiedad- Los problemas relacionados a menudo utilizan alguna forma de terapia de exposición al CS
que implica la presentación repetida de la señal de miedo sin el estímulo aversivo. De hecho, en el
laboratorio, la organización de una contingencia de extinción (la presentación repetida del tono CS sin el US)
reduce la congelación al tono. La investigación muestra, sin embargo, que la extinción no elimina el viejo
miedo aprendido que involucra a la amígdala; más bien, la extinción establece un nuevo aprendizaje,
especialmente en el segmento ventral de la corteza prefrontal medial (MPC), de que el tono CS ya no predice
el choque de EE (ver Kwapis y Wood, 2014). Las proyecciones neuronales de la MPC a la amígdala ayudan a
202 Control aversivo de la conducta
inhibir la reactivación de las respuestas de miedo en nuevos entornos o las respuestas de miedo cuando el
estímulo aversivo (shock) se encuentra de nuevo. Cada vez hay más pruebas de que los inhibidores de HDAC
dirigidos al segmento ventral de la MPC promueven un aprendizaje de extinción robusto y persistente que
puede superar al aprendizaje de miedo original (el tono CS predice el choque de EE. UU.).
A nivel conductual, los investigadores pueden ser capaces de producir efectos similares a los inhibidores
de HDAC añadiendo otros procedimientos a las contingencias de extinción. Una posibilidad es utilizar contra-
condicionamiento después de la reactivación del aprendizaje original del miedo (Richardson, Riccio, Jamis,
Cabosky y Skoczen, 1982). En este procedimiento, después del entrenamiento del miedo, se
reactiva el aprendizaje (CS- miedo presentado) y, poco después, las ratas se trasladan a jaulas
de alimentación para beber una solución de agua azucarada (US- positivo). Bajo este
procedimiento tardío de US-positivo, los animales mostraron sustancialmente menos
respuestas de miedo que las ratas de control, pero solo después de la reactivación del
aprendizaje mediante una breve presentación del estímulo de miedo (CS-aversivo). Una
posibilidad es que el contracondicionamiento positivo trabaje sobre los mecanismos
epigenéticos relacionados con la retención del aprendizaje original del miedo (amígdala) o tal
vez sobre la retención del nuevo aprendizaje de la extinción (segmento ventral de la MPC). En
cualquier caso, el tratamiento del trastorno de estrés postraumático y otros trastornos de
ansiedad puede beneficiarse de una terapia de desensibilización que combine la extinción y el
contracondicionamiento positivo.
La investigación en el campo de la epigenética y el aprendizaje de la retención del miedo ilustra la
síntesis en curso del análisis de la conducta con los procedimientos y principios neurobiológicos. Esta síntesis
proporciona una comprensión más completa de los componentes ambientales y biológicos de la retención
del miedo, lo que pronto puede proporcionar nuevas aplicaciones para la prevención y el tratamiento de los
trastornos de conducta relacionados con el estrés.

USO DEL CASTIGO EN EL TRATAMIENTO


Hay personas con discapacidades intelectuales y del desarrollo o trastornos psicológicos con episodios
psicóticos que, por diversas razones, tienen conductas autodestructivas. Este comportamiento puede
intensificarse hasta el punto en que la persona se golpea, araña, muerde o se arranca la mayor parte
del día. En algunos casos, los actos autolesivos son tan frecuentes e intensos que la persona puede
romperse huesos, destruir tejidos o ser hospitalizada. En ocasiones, las lesiones físicas son irreversibles,
como cuando una persona se golpea repetidamente la cabeza contra una pared, lo que provoca una
lesión cerebral traumática. Además, las personas con estos trastornos también pueden actuar de
manera agresiva y dirigir estos mismos tipos de comportamiento hacia el exterior, hacia los cuidadores.
Aunque los programas de refuerzo positivo se han utilizado para aliviar este tipo de problemas graves
de conducta, estas contingencias no siempre tienen éxito. En esta situación, la elección es a menudo
una de cuatro posibilidades: 1) continuar permitiendo que el individuo se involucre en una autolesión
o agresión grave, lo cual es dañino y poco ético; 2) sedar al individuo con fármacos depresores del SNC
o antipsicóticos, lo que disminuye su calidad de vida; 3) utilizar la contención física para prevenir las
conductas nocivas, que además de ser desagradables, también reduce el contacto con posibles fuentes
de refuerzo (y disminuye la calidad de vida); o 4) utilizar un procedimiento de castigo para atacar la
conducta autolesiva o agresiva. Los terapeutas conductuales han recurrido ocasionalmente a esta
última alternativa de castigo como una forma de reducir el comportamiento autodestructivo.
Control aversivo de la conducta 203
El debate sobre el castigo

El uso de estímulos aversivos como nebulización, ruidos fuertes y descargas leves para reducir el
comportamiento
ha sido muy controvertido, lo que ha dado lugar a una Debate sobre el uso del castigo (Feldman, 1990).
Los opositores al castigo argumentan que tales procedimientos son moralmente incorrectos, abogando
por una
prohibición de su uso (por ejemplo, Sobsey, 1990). Estos investigadores también sugieren que el castigo no es
Es necesario porque hay muchos métodos positivos disponibles para tratar problemas graves de
conducta. De hecho, la investigación muestra que el apoyo conductual positivo es tan efectivo como el
castigo para eliminar los problemas graves de comportamiento en niños pequeños con autismo (hasta
un 90% de reducción), especialmente cuando el programa de tratamiento se basa en una evaluación
conductual de las funciones (p. ej.,
atención, refuerzo automático, autoestimulación) de las respuestas autolesivas (Horner, Carr, Strain, Todd y Reed,
2002). Por lo tanto, es posible utilizar el manejo positivo de la conducta (sin castigo) con niños pequeños
que muestran un comportamiento problemático grave, como el comportamiento autolesivo.
Los partidarios de la reducción de la respuesta mediante el castigo incluyen a algunos terapeutas y
padres que no han observado reducciones exitosas en el comportamiento especialmente peligroso para
la vida o autolesivo de los niños con otros tratamientos. Estas personas defienden el derecho de la
persona
tratamiento efectivo (p. ej., Van Houten et al., 1988). Los defensores del tratamiento efectivo afirman que una
combinación de apoyo conductual positivo y castigo es la mejor (y quizás la única) manera de manejar
el comportamiento gravemente autolesivo sin sedación (ver revisión
por Minshawl, 2008). Nótese, sin embargo, que la estrategia predominante desde todas las perspectivas es el manejo
positivo de la conducta, independientemente de si el castigo se agrega al programa general. Nadie en
el análisis conductual aplicado aboga por el uso único o predominante del castigo sin un programa
general de comportamiento positivo.
El uso de la Estimulación Eléctrica Contingente de la Piel (CESS), o choque cutáneo de baja
intensidad, es especialmente controvertido. Se ha demostrado que el CESS utilizado como castigador
positivo reduce rápidamente
autolesiones (Lovaas y Simmons, 1969) o agresión y daño físico a otros (Israel et al., 2008). Además de la reducción
del daño, la razón de ser del CESS, al igual que otros estímulos aversivos, es que cuando se pasa menos
tiempo participando en autolesiones o agresiones (o siendo restringido química o físicamente), se
puede dedicar más tiempo a hacer contacto con reforzadores positivos, lo que mejora
la calidad de vida del paciente (aunque no es específica del CESS, véase, por ejemplo, Hanley et al., 2005). Los
partidarios del uso de CESS han argumentado que el uso temporal de un procedimiento de castigo
eficaz, cuando ningún otro procedimiento funcionará, puede salvar a un niño de años de autolesión o
sedación.
Es importante señalar que muy pocos analistas de comportamiento aplicado utilizan CESS y
muchos no apoyan CESS como una forma de reducir el comportamiento. Además, varias entidades y
organismos, como la Asociación Internacional para el Estudio Científico de la Propiedad Intelectual y
del Desarrollo,
204 Control aversivo de la conducta
Discapacidades, tienen declaraciones claras que se oponen al uso de CESS para tratar incluso conductas
severas
de las personas con discapacidad intelectual y del desarrollo (Zarcone, et al., 2020). Una de las razones que se dan
para no usar CESS (y otros castigos) en entornos aplicados es que las técnicas aversivas
puede generar angustia emocional, problemas de salud mental como ansiedad y depresión, sustitución
de otras conductas negativas y agresión (LaVigna y Donnellan, 1986; Meyer y Evans, 1989; Zarcone et al., 2020).
En un entorno de tratamiento, estos efectos secundarios implican que la terapia aversiva para el comportamiento
autolesivo puede producir tantos problemas como los que alivia (Lerman
& Vorndran, 2002; ver también la sección sobre "Efectos Secundarios de los Procedimientos Aversivos"
más abajo). De hecho, este es también el caso del uso de CESS (Zarcone, et al., 2020). Sin embargo, Salvy et al.
(2004) encontraron que un CESS de 85 V y 3,5 mA (se siente subjetivamente similar a un chasquido de banda
elástica en el brazo) eliminó los golpes graves en la cabeza y las lesiones en un niño en edad preescolar; No se
informaron efectos secundarios negativos. Además, la sola colocación del dispositivo sin la administración de
descargas mantuvo la autolesión a niveles cercanos a cero, incluso en un seguimiento de 7 meses. Es importante
señalar, sin embargo, que muchos de los estudios que informan sobre el uso de CESS no evalúan o informan
adecuadamente sobre los síntomas de salud mental de manera sistemática o en el seguimiento a largo plazo ;
pueden observarse anecdóticamente en situaciones más extremas. Por lo tanto, es difícil determinar hasta qué
punto estos síntomas están presentes en estudios más contemporáneos. Se están realizando esfuerzos para
sopesar los costos y beneficios de la CESS y otras alternativas en el tratamiento de estas formas extremas de
autolesión.
Permanencia de la pena

Una cuestión es si el castigo por sí mismo, sin procedimientos adicionales como la extinción o el refuerzo
de la conducta alternativa, puede eliminar permanentemente la conducta indeseable. En el análisis conductual
aplicado, la cuestión de la permanencia se plantea como el mantenimiento de la supresión de la respuesta
durante períodos prolongados. James O'Heare (2009; Weblog), un consultor certificado en comportamiento
animal, ha comentado sobre la permanencia del castigo y el mantenimiento de la supresión de la respuesta.
Afirma:
Sugerir que el castigo puede eliminar una conducta es confundir el castigo con el castigo y otros
procesos. Si se exhibe un comportamiento, entonces tiene un historial de refuerzo; Esa
contingencia está en su lugar. Cuando imponemos una contingencia de castigo a esa conducta,
simplemente añadimos esa contingencia a la contingencia de refuerzo prevaleciente. Si el
reforzador es más fuerte que el castigador, entonces el comportamiento continuará ocurriendo,
aunque tal vez a una tasa o frecuencia reducida. Si el castigo es más fuerte que el reforzador,
entonces el comportamiento será suprimido hasta cierto punto, dependiendo de cuánto más
fuerte sea. De hecho, el comportamiento puede ser suprimido a una tasa de cero. Pero tan pronto
como se interrumpe la contingencia de castigo, la contingencia de refuerzo existente prevalece
nuevamente y se espera que el comportamiento vuelva a la fuerza anterior al castigo. El punto
principal aquí es señalar que el castigo por sí solo no elimina el comportamiento; simplemente la
suprime hasta cierto punto mientras esa contingencia está en vigor. Si la conducta se elimina
permanentemente, no es solo por la contingencia del castigo. Lo que habría ocurrido es
probablemente la extinción impuesta simultáneamente, o más comúnmente la supresión
permitida para la realización y el refuerzo de otros comportamientos.
Control aversivo de la conducta 205
(O'Heare, 2009; Weblog)

En los entornos aplicados, los casos de castigo siempre implican otros procedimientos
conductuales como parte del paquete de tratamiento. En general, es razonable concluir que el castigo
en combinación con otros procedimientos positivos puede tener efectos supresivos duraderos en el
comportamiento humano.
ENFOQUE EN: CASTIGO FÍSICO Y PSIQUIÁTRICO
TRASTORNOS
A nivel mundial, el uso del castigo físico para disciplinar a los niños es controvertido, aunque no se
considere socialmente como maltrato o abuso (Organización Mundial de la Salud, 2021). El castigo físico
por parte de los padres incluye el uso de nalgadas, bofetadas o bofetadas cuando se juzga que los niños
se portan mal. Estos métodos de corrección implican infligir dolor con el propósito de disciplinar o
reformar el comportamiento del niño. Por lo tanto, el castigo no se define funcionalmente por sus
efectos sobre la conducta, sino que se refiere a los procedimientos dolorosos utilizados para reformar
la conducta desobediente, que probablemente refuerza a la persona que está infligiendo el castigo.
Una cuestión es si la imposición de dolor por desobediencia está vinculada a trastornos psiquiátricos,
incluso cuando no hay un maltrato más extremo que implique abuso físico, abuso sexual, abuso
emocional, negligencia física y emocional, y exposición a la violencia familiar.
Un estudio utilizó una muestra representativa a nivel nacional de los Estados Unidos para examinar la relación a
largo plazo.
entre el castigo físico y la salud mental (Afifi, Mota, Dasiewicz, MacMillan y Sareen, 2012). Los datos se extrajeron de
una encuesta nacional realizada entre 2004 y 2005 a casi 35.000 encuestados adultos, y los encuestados
abusados y maltratados fueron excluidos de los análisis posteriores. Los resultados mostraron que el
uso frecuente o severo del castigo físico en la infancia ocurrió en aproximadamente el 6% de la muestra
nacional, y los hombres informaron un castigo físico más severo que las mujeres. Además, los
encuestados que indicaron que crecieron en una familia disfuncional eran más propensos a reportar un
castigo físico severo por parte de los cuidadores adultos o los padres. Utilizando técnicas estadísticas y
controlando las variables socioeconómicas, se encontró que aquellos que experimentaron castigo físico
en la infancia eran más propensos que los encuestados no castigados a indicar un diagnóstico de
depresión mayor, manía, trastorno del estado de ánimo, fobia específica, trastornos de ansiedad o
dependencia del alcohol y las drogas.
En comparación con los estudios que utilizan diseños experimentales y la medición directa del
comportamiento, esta encuesta nacional tiene varias limitaciones, como han señalado los
investigadores. Un problema es que los datos se basan en informes retrospectivos de lo que sucedió en
la infancia, y estas respuestas verbales pueden estar influenciadas por muchos factores que
distorsionan el recuerdo, incluida la entrevista
situación misma (Loftus y Zanni, 1975). Otra limitación es que el diseño de la encuesta (que es
transversal) no permite ninguna inferencia de causalidad entre el castigo físico severo y los trastornos
mentales: lo mejor que se puede decir es que puede haber un vínculo o correlación. Sin embargo, el
análisis experimental del castigo en animales no humanos sugiere que una relación causal es una fuerte
posibilidad, especialmente cuando el castigo corporal de los niños se organiza sobre la base de
caprichos y creencias parentales erróneas de los cuidadores; en otras palabras, cuando el castigo no
está supeditado a la conducta.
206 Control aversivo de la conducta
CONTINGENCIAS DE REFUERZO NEGATIVO
Cuando un organismo emite un comportamiento en respuesta a un estímulo aversivo, el
comportamiento puede ser visto como escape o evitación. Si la respuesta se produce mientras el
estímulo castigador está ocurriendo o presente, es una respuesta de escape. El perro feroz te gruñe y
escapas cruzando al otro lado de la calle. El sol brillante brilla en tus ojos, así que te pones las gafas de
sol para bloquearlo. Cuando la operante impide el estímulo aversivo, la conducta es evitación. Gira a la
derecha para dar la vuelta a la manzana y, por lo tanto, no pasa junto al perro. Puede ponerse las gafas
de sol momentos antes de salir al sol para evitar que los rayos del sol golpeen sus ojos. En ambos casos,
la eliminación o prevención de un evento o estímulo aumenta la conducta operante y la contingencia
se define como reforzamiento negativo (celda 3 de la figura 6.4).
Cualquier evento o estímulo que aumente la tasa operante mediante su eliminación (o prevención)
se denomina reforzador negativo. Nótese que el mismo evento —la entrega de una descarga
eléctrica— es un castigador en un procedimiento de castigo positivo, y un reforzador negativo en un
procedimiento de refuerzo negativo. Ya sea que un estímulo se use en un procedimiento de castigo o
de refuerzo negativo, nos referimos al evento como un estímulo aversivo, un estímulo que el organismo
escapa o evita.
En la vida cotidiana, la distinción entre el refuerzo negativo y el positivo es ocasional.
A pesar de todo, la mayoría de los miembros de la Unión Europea siguen siendo un tema importante de debate en
el análisis de la conducta (Baron y Galizio,
2005, 2006). Por ejemplo, ¿abres una ventana en un día caluroso para recibir una brisa fresca como refuerzo
positivo o para escapar del calor como refuerzo negativo? Ponerse lentes correctivos aclara la visión,
pero también elimina una visión borrosa del mundo. Un problema es que la física nos dice que no existe
el frío, solo hay aumentos o disminuciones en el calor. Por lo tanto, una persona que coloca troncos en
el fuego está agregando calor y el comportamiento se controla mediante el refuerzo positivo, no el
refuerzo negativo (eliminar el frío). Por otro lado, hay muchos otros casos en los que puede ser difícil
notar la diferencia en la vida cotidiana. En el laboratorio operante, sin embargo, la distinción entre
reforzamiento positivo y negativo es razonablemente fácil de arreglar, y las investigaciones
experimentales del reforzamiento negativo son relativamente claras. Cuando una respuesta resulta en
la eliminación de un evento en curso o el aplazamiento de un estímulo y la tasa de respuesta aumenta,
se ha producido un refuerzo negativo.

Aprendizaje de escape

En el aprendizaje de escape, una conducta operante cambia la situación de una en la que un estímulo
aversivo está presente a una en la que está ausente, durante un período de tiempo. Una paloma está expuesta
a un ruido blanco fuerte y continuo y cuando el pájaro picotea una tecla, el ruido se apaga. Si el picoteo de la
tecla aumenta debido a la eliminación del ruido, entonces esto define el procedimiento como refuerzo negativo.
El ruido se consideraría un reforzador negativo. Las personas reprenden a los demás que los molestan con
declaraciones como "Deja eso" o "No hagas eso, no es agradable" y otras formas de desaprobación. La
investigación muestra que tales reprimendas son controladas por el refuerzo negativo en forma de escape de la
conducta agravante (Miller, Lerman y Fritz, 2010).
En los experimentos clásicos sobre el aprendizaje de escape, un perro saltó a través de una barrera
para escapar de una descarga eléctrica. La figura 6.5 es un diagrama de un aparato de caja de lanzadera
Control aversivo de la conducta 207
utilizado para entrenar el escape en perros. El perro puede participar en muchas respuestas, como
olfatear, acicalarse o descansar, pero solo saltar la barrera hacia el área libre de descargas (llamada área
de seguridad) termina la descarga. Generalmente, los organismos adquieren respuestas de escape más
fácilmente que respuestas de evitación. La razón es que en la huida, pero no en la evitación, hay un
cambio inmediato de la presencia o ausencia del estímulo aversivo.
Otro factor que afecta a la rapidez con la que se produce una respuesta de escape es su
compatibilidad con el comportamiento reflexivo provocado por el reforzador negativo. La evolución ha
asegurado que los organismos respondan a estímulos aversivos. En el mundo cotidiano, un animal solo
puede tener una oportunidad de salvar su vida en presencia de un evento aversivo. Correr como loco
tiene sentido (en muchos casos) cuando aparece un depredador. Aquellos animales que "reflexionan"
sobre la situación es probable que

Figura 6.5
Se representa una caja de transporte que puede usarse para condicionar las respuestas de escape en los perros. El animal se
coloca en el compartimento izquierdo al comienzo de una prueba. Se enciende una pequeña descarga eléctrica y el perro puede
escapar del estímulo aversivo saltando la barrera hacia el área segura, en el lado derecho de la caja.

han aportado calorías al depredador, pero no genes a la siguiente generación. Por lo tanto, la selección
natural ha asegurado que el comportamiento específico de la especie a menudo sea provocado por
estímulos aversivos que también funcionan como reforzadores negativos. Cuando a las ratas se
les presenta una descarga eléctrica en el pie, suelen mostrar respuestas defensivas. Estas respuestas
típicas de la especie incluyen saltar al inicio de los choques en los pies y congelarse en el intervalo
posterior al choque. Estos comportamientos típicos de la especie provocados por descargas eléctricas
a veces interfieren con el condicionamiento de escape. Por ejemplo, la operación de presionar la
palanca es incompatible con la congelación después del choque. Si simplemente se requiere que el
animal presione la palanca y la mantenga presionada, la respuesta de escape se adquiere más
fácilmente; Esto se debe a que la congelación interfiere menos con la retención de la palanca.
Generalmente El reforzamiento negativo puede provocar un comportamiento reflexivo que interfiere
con el aprendizaje del comportamiento requerido para la eliminación del reforzador negativo.
El condicionamiento de la conducta de escape es más fácil cuando la operante es similar a la
conducta reflexiva provocada por el estímulo aversivo. Una rata puede ser entrenada fácilmente para
correr en una rueda para escapar
descargas eléctricas, pero acondicionar al animal para que se ponga de pie es mucho más difícil (Bolles, 1970). Correr
es parte de las respuestas típicas de la especie a las descargas eléctricas, pero ponerse de pie no lo es.
Aunque el condicionamiento respondiente y operante interactúan durante el entrenamiento de escape,
el comportamiento finalmente queda bajo el control de la contingencia operante. Por ejemplo, las ratas
208 Control aversivo de la conducta
que están entrenadas para correr sobre una rueda (o mantener presionada una palanca) para escapar
del choque dejan de correr (o de sostener la palanca) si esta respuesta no termina con el reforzador
negativo. La respuesta específica de la especie no predomina en la conducta operante requerida por las
contingencias de refuerzo.

ENFOQUE EN: ESCAPE Y CUIDADO INFANTIL


Con frecuencia, los padres se enfrentan a un bebé que llora. El llanto es una respuesta normal de los
bebés, generalmente interpretada como una forma en que el bebé comunica sus deseos y necesidades,
y los padres deben responder a los llantos de un bebé. Sin embargo, el llanto excesivo y persistente es
un factor importante relacionado con el maltrato infantil (p. ej., sacudir al bebé) y una de las principales
causas de lesiones graves y muerte. Parece que el llanto del bebé organiza un estímulo aversivo
continuo para los padres o cuidadores, que generalmente se elimina mediante el comportamiento de
cuidado (p. ej., alimentarse, cambiarse, jugar o mecerse). El bebé y el cuidador están encerrados en
una interacción social; Esta interacción implica contingencias de escape en las que las acciones del
cuidador se refuerzan negativamente por la eliminación del llanto, y las vocalizaciones del bebé se
refuerzan positivamente por el cuidado parental. Desde este punto de vista, el maltrato infantil es el
resultado de un llanto ineludible en el que nada de lo que hacen los padres o los padres El
cuidador elimina el estímulo aversivo (Donovan, 1981; véase también la sección "Indefensión
aprendida" en este capítulo).
Para estudiar experimentalmente los efectos del llanto infantil en la conducta de cuidado, es
necesario manipular las contingencias de refuerzo. Por lo tanto, el llanto infantil debe ser controlado por el
investigador y su eliminación debe estar supeditada a acciones específicas de los cuidadores adultos. Un método
es una simulación experimental del cuidado infantil en la que la eliminación de los llantos infantiles grabados
requiere respuestas específicas por parte de los cuidadores. En un estudio realizado por Thompson, Bruzek y
Cotnoir-Bichelman (2011), se registró el llanto infantil mientras los padres mecían a su bebé antes de las siestas.
A continuación, se reclutó como participantes a estudiantes de pregrado con alguna experiencia en el cuidado
de bebés. Fueron colocados en un entorno experimental que incluía una cuna, una muñeca, una manta, juguetes,
un biberón y una grabación de los llantos de los bebés controlados desde una sala de observación adyacente. A
los participantes se les dijo que el estudio simulaba una situación de cuidado y que debían "hacer lo que les sale
de forma natural". El refuerzo negativo implicó la presentación del llanto infantil grabado hasta que el
participante realizó la respuesta objetivo (balanceo horizontal, balanceo vertical, alimentación o juego). Una
extensión del diseño de inversión (A-B-A-B) comparó el reforzamiento negativo con una fase de extinción que
dispuso el llanto independiente de la respuesta; Además, el comportamiento objetivo difiere según el
participante y la fase del experimento.
Los resultados de la Figura 6.6 muestran el número acumulado de segundos ocupados en el
comportamiento objetivo y las respuestas alternativas para tres participantes (P-7, P-8 y P-9). Observe el
aumento en el tiempo dedicado a la respuesta objetivo para cada participante en la fase inicial de llanto de
refuerzo negativo (Sr-). Cuando la contingencia se cambia a otra respuesta objetivo, el tiempo acumulado en esta
respuesta aumenta, mientras que la respuesta previamente reforzada cae a un nivel cercano a cero o alcanza
una meseta. Durante la extinción, la respuesta objetivo disminuyó, pero las respuestas que antes eran efectivas
para eliminar el llanto aumentaron, lo que indica un resurgimiento de las respuestas de cuidado basadas en una
historia de refuerzo negativo (véase también Bruzek, Thompson y Peters, 2009).
Control aversivo de la conducta 209
En general, los resultados indican que el cuidado del bebé está bajo el control del llanto emitido
por un bebé. Además, los hallazgos sugieren que el refuerzo negativo por escape es parte de la relación
temprana entre padres e hijos. Es evidente que esto no tiene por qué ser así en la práctica. Si el cuidador
está atendiendo al niño, las señales del bebé indicarían las necesidades del niño (hambre, pañal
mojado, etc.) antes del llanto. Los cuidadores que cambian un pañal o comienzan a amamantar
basándose en señales previas al llanto (p. ej., inquietud, vocalizaciones, chasquido de labios) reforzarían
el comportamiento de señalización del bebé como una forma temprana de comunicación humana
adecuada.

Aprendizaje de evitación

La parte superior de la Figura 6.7 muestra un esquema del comportamiento de escape. La caja negra
representa el inicio, la duración y el desplazamiento de un estímulo aversivo. No es que una respuesta
(R) cancele el aversivo y que exista un período de tiempo libre de aversivos (también llamado período
de seguridad). Cuando se presenta otro aversivo, la respuesta vuelve a poner fin al estímulo aversivo.
La conducta de escape, entonces, siempre hace contacto con el estímulo aversivo cancelándolo.
Cuando una conducta operante impide la ocurrencia de un estímulo aversivo, la contingencia se
denomina evitación. En el aprendizaje de evitación, la respuesta del animal cancela un evento aversivo
inminente para que no suceda nada. La conducta, entonces, no hace contacto con el estímulo aversivo.
Esto se muestra en la parte inferior de la Figura 6.7. Por ejemplo, normalmente puede
210 Control aversivo de la conducta

Jugando
Alimentación Meceo horizontal Balanceo vertical

Figura 6.6
Se muestra la duración acumulada (segundos) del cuidado de los participantes (P-7, P-8 y P-9). Los datos se representan en bins
de 1 minuto en el eje X y las interrupciones en las gráficas de datos indican una nueva sesión.
Fuente: Reimpreso de R. H. Thompson, J. Bruzek y N. Cotnoir-Bichelman (2011). El papel del refuerzo negativo en el cuidado infantil: una simulación
experimental. Revista de Análisis Conductual Aplicado, 44, pp. 295-304. Copyright 2011 en poder de John Wiley & Sons Ltd. Publicado con permiso.

Camina la distancia más corta hasta la universidad, pero recientemente un conocido, Kent, se ha unido
a ti a mitad de camino y continúa hablando incesantemente sobre temas que no te parecen muy
interesantes. Dada esta historia, ahora se camina una distancia más larga de la necesaria hasta la
universidad utilizando una ruta que no pasa por la casa de Kent, lo que impide una interacción con Kent.
En esencia, evitas Kent.
Control aversivo de la conducta 211
Del mismo modo, durante la migración anual, los ñus jóvenes se detienen a beber en un río
infestado de grandes cocodrilos. Los cocodrilos esperan cada año este almuerzo gourmet y "se
despican"
Escapar
R R

Evitación

R R R

50 segundos

Figura 6.7
Un esquema de la diferencia entre escape y evitación.

ñus raros. Es probable que los sobrevivientes del picnic de cocodrilos de la última vez elijan un lugar de agua
diferente el próximo año. Ellos también aprenden a evitar.
Evasión discriminada
La evitación puede implicar responder cuando una señal de advertencia precede a un estímulo aversivo.
Debido a que el organismo solo responde cuando se produce la señal de advertencia, el procedimiento
se denomina evitación discriminada. Un padre puede decirle a un niño: "Nathan, baja el ruido o
tendrás que irte a la cama". Un antílope puede oler a un león y cambiar la dirección en la que viaja. En
estos casos, se le dice al niño qué hacer y el antílope detecta en qué dirección evitar un estímulo
aversivo.
En el laboratorio operante, la evitación discriminada puede adquirir más lentamente de lo que uno
podría suponer. Las ratas, por ejemplo, aprenderán rápidamente a presionar la palanca para alimentarse, pero
pueden tardar más tiempo en adquirir la presión de palanca para evitar descargas eléctricas (Solomon y Brush,
1956). Las palomas también son lentas en la adquisición de conductas de evitación cuando se les pide que
picoteen una llave para evitar un evento aversivo. Una de las principales razones de la adquisición prolongada es
que, en el procedimiento de evitación discriminada, el estímulo de advertencia (S ave) es también un SC, que
provoca conductas condicionadas por el respondiente (como la congelación) que interfieren con la conducta
operante que se define como la respuesta de evitación (Meyer, Cho y Wesemann, 1960). Como se indicó en la
sección sobre el condicionamiento de escape, otras respuestas reflejas, como correr y saltar, son provocadas por
el choque y se adquieren mucho más fácilmente que presionar la palanca. Por ejemplo, Macphail (1968) informó
que las palomas requirieron 120 intentos de evasión señalizada para correr por un callejón recto para evitar el
choque. Tenga en cuenta que correr no es un comportamiento típico de la especie para las palomas,
generalmente vuelan. Las ratas, por otro lado, requirieron solo dos o tres intentos para aprender a saltar a una
plataforma cuando se produjo un estímulo de advertencia (Baum, 1965, 1969). En el caso de las ratas, saltar a
un lugar seguro puede tener algunos elementos de condicionamiento del respondiente; Este comportamiento
también es compatible con la contingencia de evitación operante.
212 Control aversivo de la conducta
En una serie de experimentos, Modaresi (1990) encontró que para las ratas, la presión de la palanca para evitar
los golpes se adquiere más fácilmente si la palanca está en lo alto de la pared, y si la presión de la
palanca no sólo evita los golpes, sino que también da como resultado el acceso a una plataforma para
pararse. Experimentos adicionales mostraron que estos dos aspectos de la situación estaban de acuerdo
con el comportamiento específico de la especie de las ratas. Las ratas y otros organismos se estiran
naturalmente hacia arriba y buscan un área segura cuando se liberan estímulos aversivos dolorosos
desde el suelo. Por lo tanto, para producir una rápida adquisición de respuestas de evitación señaladas,
el comportamiento que también es provocado por el reforzador negativo y la situación actual es más
efectivo.
Un experimento clásico de Solomon y Wynne (1953) ejemplifica la evitación discriminada utilizando una respuesta
de evitación que es más natural para la especie. Las contingencias fueron las siguientes. Se colocó un
perro en un compartimiento de una caja de transporte similar a la que se muestra en la Figura 6.5. Se
encendió una luz en el compartimento en el que se colocó al perro. Con el tiempo, la luz se apagó y la
luz del otro compartimento se iluminó. Si el perro no hacía nada, se aplicaba una descarga eléctrica 10
s después de que se apagara la luz de su compartimento (la luz que se apagaba indicaba una descarga
en 10 s). Si el perro saltaba la barrera al otro compartimento iluminado antes de que transcurrieran los
10 segundos, evitaría el choque inminente. En estas condiciones, los perros aprendieron rápidamente
(en 5 intentos) a saltar para evitar los golpes. De hecho, saltarían la barrera justo antes de que
transcurriera la señal de advertencia de 10 segundos.

Evitación no discriminada (Sidman)

En el estudio de Solomon y Wynne (1953), hubo un estímulo de advertencia para el choque (cuando la
luz se apagó en el compartimiento en el que estaba el perro y se encendió en el otro compartimiento).
Cuando no hay estímulo de advertencia, la contingencia se denomina evitación no discriminada.
Algunas personas se lavan las manos compulsivamente para deshacerse de los gérmenes invisibles. En
este caso, el lavado de manos es el operante, pero es difícil ver qué estímulo se está evitando. Tal vez
sea una reducción de la ansiedad (un evento privado que no es observable para nadie más que para la
persona que se está lavando las manos) lo que refuerza negativamente el lavado de manos. Como verás
en capítulos posteriores, el refuerzo negativo parece ser la base de muchos patrones de
comportamiento basados en la ansiedad.
Este libro fue escrito en una computadora, y un corte de energía inesperado podría resultar en
muchas horas de trabajo perdido. Para evitar este evento, los autores emiten regularmente el
comportamiento de guardar el documento. Esta respuesta de evitación guarda el texto en un disco duro
o en la nube y, presumiblemente, se mantiene porque ha evitado que los fallos informáticos cuesten a
los autores un día o incluso unos minutos de trabajo. Sin embargo, con el tiempo, hacer clic en el icono
de guardar es tan efectivo que rara vez se produce una pérdida de trabajo y la tasa de respuesta
comienza a disminuir: decimos que "olvidamos" guardar, que fuimos descuidados o que no era
necesario. En este punto, se produce un fallo informático o un "shock" equivalente y de repente se
restablece la conducta de evitación. Por lo tanto, la evitación es inherentemente cíclica. Es una paradoja
que cuanto más efectiva es la respuesta de evitación, menos choques se reciben, pero cuantos menos
choques se reciben, más débil es el comportamiento de evitación. Al igual que toda conducta operante,
las respuestas de evitación deben reforzarse negativamente, al menos ocasionalmente, para que la
Control aversivo de la conducta 213
conducta se mantenga en alta intensidad. En Coercion and Its Fallout, Murray Sidman señaló la paradoja
de la evitación cuando comparó las contingencias de la evitación y el refuerzo positivo. Declaró:
La paradoja de la evitación revela una diferencia crítica entre el refuerzo positivo y el refuerzo
negativo por evitación. Con la evasión, el éxito engendra fracaso; El comportamiento se debilita y
se detendrá a menos que otro choque lo traiga de vuelta. Con el refuerzo positivo, el éxito genera
más de lo mismo; El comportamiento continúa. Si la única razón por la que un estudiante estudia
es para evitar el fracaso, será necesario un fracaso ocasional o casi un fracaso para que el estudio
continúe. Un estudiante que estudia debido a las opciones que el nuevo aprendizaje pone a su
disposición se detendrá solo si los productos del aprendizaje se vuelven irrelevantes. Si los
ciudadanos se mantienen dentro de la ley solo porque eso los mantiene fuera de la cárcel,
eventualmente excederán el límite de velocidad, harán trampa en sus impuestos sobre la renta,
darán o aceptarán sobornos, o algo peor. Los ciudadanos que se mantienen dentro de la ley debido
a los beneficios de participar en una comunidad ordenada no enfrentarán tentaciones cíclicas de
violar la ley.
(Southman, 2001, p. 145)
El uso de controles por parte de la policía y las auditorías por parte del departamento de impuestos
garantizan que los conductores y los contribuyentes se encuentren o se vean amenazados con refuerzos
negativos ocasionales. Sin estos "choques" ocasionales habría mucha menos gente honesta en nuestra
sociedad.
Murray Sidman (1953) fue el primero en investigar la evitación no discriminada, y el procedimiento
a menudo se denomina evitación de Sidman o evitación de operación libre. El procedimiento fue
similar al experimento de Solomon y Wynne de 1953, excepto que no había ninguna luz que señalara
una descarga inminente o seguridad contra la descarga. Se puso en vigor un intervalo choque-choque
(SSI). Aquí, si el perro no hacía nada, recibía una descarga en un momento predecible, como cada 40
segundos. En segundo lugar, al mismo tiempo, también se puso en vigor un intervalo de respuesta y
choque (RSI). Aquí, cuando el perro salta la barrera (la respuesta de evitación), podría proporcionar,
por ejemplo, 60 s de seguridad contra el choque. Por lo tanto, un perro podría evitar todos los choques
saltando repetidamente la barrera aproximadamente cada 60 s, siempre que su intervalo entre saltos
fuera inferior a 60 s. Esperar demasiado tiempo (es decir, después de que transcurra el RSI, 60 s o más
en este caso) resultaría en una descarga. La pregunta era: ¿Podrían los perros responder para evitar el
choque sin una señal?
La respuesta es: absolutamente. Lo que esto podría parecer para un observador es que el animal
está respondiendo sin ninguna consecuencia. Si los perros espaciaran sus respuestas de tal manera que los
intervalos entre saltos estuvieran justo por debajo del RSI, podrían evitar la mayoría, si no todos, los choques.
De hecho, esto es lo que hicieron. La respuesta de evitación, ya sea discriminada o no discriminada, se aprende
más rápidamente cuando el intervalo RSI es más largo que el intervalo SSI (Sidman, 1962). En otras palabras,
cuando la operante retrasa el estímulo aversivo (RSI) durante un período mayor que el tiempo entre choques
(SSI), se potencia el condicionamiento; Esto se debe a que un mayor tiempo de seguridad es más reforzante que
un tiempo más corto de seguridad.
La mayor parte de la investigación sobre el aprendizaje de evitación ha utilizado el shock como estímulo
aversivo.
Sin embargo, la investigación ha demostrado que el tiempo de espera (TO) del refuerzo positivo (comida)
tiene propiedades funcionales similares a las de los choques. DeFulio y Hackenberg (2007) encontraron que los
214 Control aversivo de la conducta
resultados paralelos de evitación discriminada de TO obtenidos a partir de contingencias señaladas de evitación
de choques. En cuanto a la evitación de TO sin estímulo de advertencia, las tasas de respuesta para evitar el
tiempo de espera de las entregas de alimentos independientes de la respuesta fueron una función tanto de la
magnitud (calidad de los alimentos) como de la tasa de entrega de gránulos de alimentos, un hallazgo similar a
la manipulación de los parámetros de choque en una evitación de Sidman
(Richardson y Baron, 2008).

Programas de vacunación contra la prevención y salud pública


En cuanto a las conductas de evitación y la salud de la comunidad, parece que siempre hay una minoría
de la población que se niega a vacunar a sus hijos (véase la figura 6.8) o que no mantiene un programa de
vacunación contra las enfermedades infantiles (Kristof, 2015 sobre "Los peligros de la negación de las vacunas"
en The New York Times). Desde una perspectiva conductual, los brotes típicos de enfermedades, como la gripe
o el sarampión, funcionarían como un refuerzo negativo, manteniendo la evitación no discriminada mediante la
vacunación. [Nota: los brotes son eventos impredecibles sin una advertencia confiable para su aparición.] Los
padres que se niegan a vacunar a sus hijos pueden pertenecer a una generación que nunca se ha enfrentado a
un brote de enfermedades y que no ha aprendido los beneficios para la salud de evitar la enfermedad mediante
la vacunación, "sin ver ninguna razón para ello". Además, las advertencias sanitarias para vacunar no son

Figura 6.8
Una enfermera administra una vacuna a un niño.
Fuente: Shutterstock.

No se cree en señales suficientemente fiables o gráficas de brotes de enfermedades y, sin un historial


de evitación discriminatoria, no se crean, en el sentido de que las personas antivacunas alegan una
violación de su libertad y no vacunan a sus hijos.
Un fenómeno interesante son las tasas de vacunación contra el virus COVID-19. En el momento de
redactar esta versión de libro de texto, Estados Unidos acababa de alcanzar el 1.000.000 de muertes
Control aversivo de la conducta 215
relacionadas con la COVID (Centros para el Control y la Prevención de Enfermedades, 2022a); La tasa
de mortalidad mundial acababa de alcanzar
6,2 millones (Organización Mundial de la Salud, 2022). A pesar de la eficacia de la vacuna para reducir las muertes,
las visitas a la unidad de cuidados intensivos y las hospitalizaciones, y su alta accesibilidad en la mayoría
de las farmacias de EE. UU. (disponible de forma gratuita), solo el 66% de las personas elegibles en los
Estados Unidos hasta la fecha se han vacunado por completo. Esto podría deberse en parte a que las
contingencias del COVID-19 no son una presencia destacada. Por ejemplo, es posible que algunas
personas no se hayan visto directamente afectadas por una muerte relacionada con COVID o la
hospitalización de un ser querido o, si contrajeron COVID, es posible que solo hayan experimentado
síntomas leves. Es decir, no hay contacto directo con el estímulo aversivo que motiva la vacunación. A
esto contribuye otra posibilidad: la mayor difusión de información errónea sobre el virus COVID-19, que
desalienta las vacunas. Dicha información ha incluido que el COVID-19 es un engaño o que la vacuna no
es segura o causa efectos secundarios infundados, como la esterilización. Otra información errónea
incluye teorías de conspiración relacionadas con el gobierno, como que la vacuna contiene un
dispositivo de rastreo. Estos rumores infundados pueden disminuir la motivación de algunos para
vacunarse, lo que también puede ser reforzado por otros miembros de ideas afines de su comunidad
verbal. Lamentablemente, la realidad es que las tasas de vacunación más bajas significan que erradicar
este virus llevará mucho tiempo, a pesar de que tenemos los medios para hacerlo más rápidamente.
Dado que la vacunación es un comportamiento de evitación, cuanto mejor seamos para eliminar
las enfermedades mediante la vacunación, menos probable será que ocurra otro brote de la
enfermedad. Al igual que con otros problemas médicos que implican la evitación, como tomar
medicamentos para evitar problemas de salud adversos, una recomendación es que la situación se
convierta en un comportamiento de escape. Si los médicos o los funcionarios de salud pública pueden
generar un escenario más basado en el miedo (que sea consistente con el riesgo real) para que sirva
como un CS, del cual el paciente puede escapar cumpliendo con las sugerencias de vacunación, se
puede mejorar hacer lo prescrito (Cheney, 1996; Witte y Allen, 2000; pero véase Nyhan, Reifler, Richey
y Freed, 2014 para obtener evidencia negativa sobre esta estrategia). Sin embargo, esta estrategia
también puede ser contraproducente si se ve como una táctica de miedo sin una contingencia real.

Frecuencia de estímulos aversivos y comportamiento de evitación

La conducta de evitación ocurre cuando reduce la frecuencia de un evento aversivo (Sidman, 1962).
Sin embargo, no es necesario que elimine necesariamente el estímulo aversivo por completo, solo
necesita disminuir la probabilidad de un estímulo aversivo. En un experimento clásico, Herrnstein y Hineline
(1966) expusieron a 18 ratas a una secuencia aleatoria de pequeñas descargas eléctricas. Los animales podían
presionar una palanca para reducir, pero no eliminar, la probabilidad de choque. Diecisiete de las 18 ratas en
este experimento mostraron una respuesta de evitación: presionaron la palanca de manera confiable.
Este hallazgo ha generado un debate sobre los factores críticos que regulan la conducta de
evitación. Esencialmente, la cuestión se refiere al control molar frente al control molecular de la
conducta en la evitación. A partir de una explicación molecular del rendimiento del programa, el
tiempo de momento a momento entre choques
(SSI) y el tiempo transcurrido desde la respuesta hasta el shock (RSI) representan las variables esenciales
que regulan las respuestas de evitación (Dinsmoor, 1977, 2001a, 2001b). No obstante, la mayor parte de la
evidencia apoya una explicación molar del rendimiento del programa (Baum, 2001), lo que sugiere que el molar
216 Control aversivo de la conducta
variable Reducción general de la frecuencia de descarga (o sensibilidad a las tasas de choque), establece y
mantiene la evitación operante (Gardner y Lewis, 1976; Hineline, 1970).
Piensa en lo que sucede cuando tu amigo te regaña persistentemente para que dejes de ver una
serie en Netflix y empieces a trabajar en tu trabajo final. Puedes decir: "Déjame en paz, me ocuparé de
ello después de que termine este episodio". Es probable que esto reduzca la frecuencia de las molestias,
pero no las elimina. De hecho, es posible que tu amigo ahora diga: "No puedo entender cómo puedes
sentarte pegado al televisor cuando tienes tanto que hacer". Asumiendo que el regaño es un reforzador
negativo, ¿cómo se puede mantener tu operante vocal ("Déjame en paz...")? La respuesta, por
supuesto, es que ha reducido la tasa general de episodios molestos de tu compañero de cuarto mientras
has estado absorto en Stranger Things.
La pregunta básica concerniente a la evitación es cómo la falta de una consecuencia contingente
—la falta de estímulo aversivo— puede mantener la respuesta operante. ¿Cómo puede "nada" reforzar
algo? En la evitación discriminada, el estímulo de advertencia se vuelve aversivo al ser emparejado con
el estímulo aversivo (shock, por ejemplo) en el estudio de Solomon y Wynne (1953) y, por lo tanto, una
respuesta que previene el choque (evitación) también termina con el estímulo aversivo condicionado
(luz, que es un CS). Este último efecto puede explicarse como una contingencia de escape, ya que la
consecuencia contingente de la respuesta es la señal de seguridad de la luz (CS). Pero cuando no hay
ningún cambio en el contexto como resultado de una respuesta, es difícil dar cuenta de la conducta
operante. Este debate sigue siendo un tema de preocupación e investigación en el análisis experimental
de la conducta (Hineline y Rosales-Ruiz, 2013).

La evasión como perdición inminente

Hackenberg y Hineline (1987) utilizaron un paradigma de supresión condicionada para mostrar las interrelaciones
entre la evitación y la conducta mantenida por el refuerzo positivo.
La supresión condicionada es un procedimiento en el que se presenta un estímulo aversivo
condicionado (Save, un tono que ha señalado shock) cuando un animal está respondiendo al refuerzo
alimenticio. El tono (Guardar) suele suprimir la conducta operante regulada por la comida. Hackenberg
y Hineline (1987) introdujeron un giro interesante para mostrar que se podía obtener un efecto similar
cuando un período de evitación precedía o seguía a sesiones enteras de refuerzo alimentario.
En su experimento, ocho ratas fueron entrenadas para presionar una palanca para obtener comida
en un intervalo fijo de 3 minutos (FI 3 min). Después de que las tasas de respuesta se mantuvieron
estables en el programa de IF, los animales fueron expuestos a 100 minutos de evitación de choques no
señalizados. Durante este período, las descargas ocurrieron cada 5 s (SSI = 5 s) a menos que la rata
presionara una palanca que pospusiera las descargas durante 20 s (RSI = 20 s). Estos períodos de
evitación se presentaron a cuatro ratas justo antes de las sesiones de refuerzo alimentario. A los otros
cuatro animales se les dio el período de evitación inmediatamente después de que respondieron a la
comida. La pregunta era si los períodos de evitación suprimirían la respuesta durante las sesiones de
refuerzo alimentario.
Los resultados indicaron que la respuesta operante al refuerzo positivo se interrumpió cuando los
períodos de evitación precedieron o siguieron a las sesiones de comida. Esta supresión se produjo a
pesar de que las tasas de respuesta de las ratas se mantuvieron lo suficientemente altas como para
obtener la mayor parte del alimento disponible. Los períodos de evitación tuvieron un efecto que no
dependió de la interferencia con la conducta mantenida por el refuerzo positivo. Cuando los períodos
Control aversivo de la conducta 217
de evitación se produjeron después de las sesiones de refuerzo alimentario, hubo más interrupción de
la conducta relacionada con la comida que cuando los períodos de evitación precedieron a la respuesta
de FI a la comida. Además, cuando se suspendió la evitación, las respuestas operantes a la comida
tardaron más en recuperarse si los períodos de evitación se produjeron después de las sesiones de
refuerzo positivo.
En el lenguaje cotidiano, las ratas "parecían preocupadas" por su cita con la perdición (recordemos
que los animales habían experimentado estas citas en el pasado). Esto no es diferente a un estudiante
que tiene dificultades para estudiar porque está programado para que le extraigan una muela del juicio
unas horas más tarde. Las personas, y aparentemente las ratas, responden a las consecuencias aversivas
a largo plazo en su entorno. Esta perturbación de la respuesta es grave cuando las consecuencias a largo
plazo son inminentes. Los eventos aversivos entregados inmediatamente también pueden suprimir el
comportamiento operante pero, en igualdad de condiciones, no parecen afectar las respuestas con
tanta fuerza como las consecuencias aversivas retrasadas durante mucho tiempo. Por implicación, un
niño que recibe reprimendas de un maestro por hablar fuera de turno mostrará poca interrupción del
juego y el trabajo escolar. Por el contrario, un estudiante que es acosado regularmente por un acosador
(o un padre demasiado exigente) después de que termina la escuela puede mostrar una interrupción
general de las actividades escolares a lo largo del día.

Tiempo de espera desde la evasión

Todos valoramos unas vacaciones del estrés de los requisitos escolares o de los deberes y obligaciones
del mundo laboral. Una forma de analizar el trabajo y los días festivos es reconocer que gran parte de
nuestro comportamiento como estudiantes y empleados se mantiene por horarios de evasión.
Entregamos nuestros informes y ensayos a tiempo para evitar las reprimendas, las bajas calificaciones
o las evaluaciones de bajo rendimiento que recibimos de nuestro jefe o maestro en el pasado. Las
contingencias de evitación son tan frecuentes que pasamos gran parte de nuestro día ocupados en
evitar los estímulos aversivos organizados por los demás y el mundo natural. Piénsalo.
Ahora considere cuánto valoramos las vacaciones, los permisos de ausencia y otros períodos que
suspenden o eliminan temporalmente los requisitos cotidianos aversivos y de comportamiento que
impregnan nuestras vidas. Estos períodos de tiempo de ausencia de la evitación pueden ser analizados
como un refuerzo negativo de la conducta que termina, previene o pospone las contingencias de
evitación. Por ejemplo, a los profesores universitarios se les concede un permiso sabático (suspensión
de las tareas docentes y administrativas) supeditado a la redacción de una solicitud sabática en la que
se describa un programa de investigación e indagación académica. Un sólido historial de publicaciones
y obtención de becas de investigación es parte de la evaluación de la facultad para otorgar años
sabáticos. Los profesores con altos registros de publicaciones y grandes becas de investigación son
considerados dignos de años sabáticos, así como de premios monetarios al mérito. Obviamente, la
licencia sabática, como tiempo fuera de la evitación, forma parte de las contingencias de refuerzo que
mantienen gran parte del comportamiento académico de los profesores universitarios.
El tiempo de espera de la evitación se ha estudiado experimentalmente en un procedimiento desarrollado por
Perone y Galizio (1987). Las ratas podían presionar cualquiera de las dos palancas. Las respuestas en la palanca
derecha pospusieron las descargas eléctricas en los pies dispuestas en un programa de evasión de Sidman. Al
presionar la palanca izquierda de forma intermitente, se producían 2 minutos de tiempo de espera desde la
evasión. La inserción o extracción de las palancas de respuesta, la iluminación de la cámara y el ruido blanco
218 Control aversivo de la conducta
auditivo señalan los períodos de tiempo de entrada y de salida de evitación. En una serie de experimentos que
utilizaron el procedimiento de dos palancas, el tiempo de espera de la evitación mantuvo el comportamiento en
una variedad de intervalos y programas de relación de refuerzo (Foreman, 2009). Por lo tanto, tomarse unas
vacaciones de la evitación ha demostrado ser eficaz como refuerzo negativo.
Pero, ¿qué tiene un día festivo que hace que funcione como refuerzo negativo? El período de
tiempo de espera implica tres cambios distintos en el entorno. Se produce un cambio de estímulo de
evitación a tiempo de espera, se reduce la frecuencia de los choques (factores estresantes) y se
suspenden los requisitos de respuesta para la evitación y el tiempo de espera, lo que resulta en una
reducción del esfuerzo de respuesta. La investigación muestra que el cambio de estímulo de la evitación
al tiempo de espera no mantiene la respuesta en la palanca del tiempo de espera (Perone y Galizio,
1987). Investigaciones adicionales indican que la reducción en la frecuencia de descarga juega un papel
relativamente menor en el mantenimiento del comportamiento de tiempo de espera, mientras que la
reducción en el esfuerzo de respuesta es el factor clave (Courtney y Perone, 1992; Foreman, 2009). Las
personas pueden valorar las vacaciones, los permisos de ausencia y los años sabáticos porque son
períodos de menor esfuerzo de respuesta durante los cuales se suspenden muchos de los requisitos de
comportamiento de la vida.

EFECTOS SECUNDARIOS DE LOS PROCEDIMIENTOS AVERSIVOS


Hay razones éticas obvias para no utilizar las contingencias de castigo para cambiar el comportamiento.
Estas cuestiones éticas surgen a pesar de que el castigo, por definición, siempre funciona y funciona rápidamente
si se usa adecuadamente. También hay efectos secundarios graves que a menudo surgen cuando se emplean
contingencias de castigo y refuerzo negativo. Skinner (1953, 1971) reconoció estos problemas y ha argumentado
consistentemente en contra del uso de técnicas de castigo:
La técnica de control más común en la vida moderna es el castigo. El patrón es familiar: si un
hombre no se comporta como deseas, derribalo; si un niño se porta mal, dale una nalgada; Si la
gente de un país se porta mal, bombardearlos. Los sistemas legales y policiales se basan en castigos
como multas, flagelación, encarcelamiento y trabajos forzados. El control religioso se ejerce a
través de penitencias, amenazas de excomunión y envío al fuego del infierno. La educación no ha
abandonado del todo la vara de abedul. En el contacto personal cotidiano controlamos a través de
la censura, el desaire, la desaprobación o el destierro. En resumen, el grado en que usamos el
castigo como técnica de control parece estar limitado solo por el grado en que podemos obtener
el poder necesario. Todo esto se hace con la intención de reducir
Control aversivo de la conducta 219

-
tendencias a comportarse de cierta manera. El reforzamiento construye estas tendencias; El castigo
está diseñado para derribarlos.
(Skinner, 1953, págs. 182-183)
El uso del castigo para la regulación social de la conducta mantenida por el refuerzo positivo tiene
graves efectos no deseados, a los que nos referiremos a continuación.

Persistencia conductual por parte del Castigador

Como hemos visto, el castigo puede, en algunas circunstancias, producir una rápida disminución de la
conducta. Así, los individuos que utilizan el castigo de manera efectiva tienen más probabilidades de
usarlo en futuras ocasiones (Miller et al., 2010); es decir, su comportamiento de usar el castigo se
fortalece, o se refuerza negativamente, por la erradicación de la conducta problemática de los demás.
Este es un punto importante: el uso "exitoso" del castigo conduce a un mayor uso de la técnica, que
produce los efectos secundarios adicionales del control aversivo, como la contraagresión, la fuga y el
hastío.
La evitación evita la extinción del estímulo condicionado
Pensemos en una persona que ha recibido una dolorosa picadura de avispa. La vista y el zumbido del
insecto preceden a la picadura y (para algunas personas) se convierten en poderosos estímulos
condicionados (SC) que provocan ansiedad. Es probable que estas CS se generalicen a imágenes y
sonidos similares (es decir, la vista de otros insectos voladores o el zumbido de una mosca inofensiva).
El CS también tiene una doble función. En términos de condicionamiento asociativo pavloviano, el
estímulo provoca ansiedad; en un sentido operante, funciona como un estímulo aversivo condicionado
(Save), que fortalece la conducta que lo elimina (refuerzo negativo). Para extinguir los efectos de la SC,
ésta debe presentarse en ausencia del estímulo incondicionado o US (extinción del respondiente). En
circunstancias normales, el SC se extinguiría rápidamente, ya que los zumbidos y los insectos voladores
(CS) rara vez van acompañados de dolor (US). Sin embargo, las personas que tienen miedo a las avispas
y las abejas evitan los lugares donde se encuentran estos insectos y abandonan inmediatamente estos
lugares si se encuentran inadvertidamente. Generalmente, la conducta de evitación mantenida por el
condicionamiento operante previene la extinción del respondiente. De hecho, está bien documentado
en la investigación sobre el tratamiento terapéutico Aceptación y
Terapia de Compromiso (ACT), que el comportamiento de evitación puede resultar en el fortalecimiento
de los miedos
y la ansiedad (llamada evitación experiencial; Hayes y Wilson, 1994). Confrontar el estímulo temido es fundamental
para reducir la ansiedad y el miedo en una variedad de psicoterapias, incluida la terapia de exposición,
la desensibilización sistemática y la ACT.
Una forma de extinguir las CS basadas en el miedo es exponer al organismo al estímulo aversivo
mientras se evita una respuesta de escape efectiva. Por ejemplo, si una persona tiene un miedo
paralizante a volar en aviones, hacer que aborde un avión comercial hasta el despegue puede garantizar
que no haya respuesta de escape. Esto es similar a lo que ocurre en la terapia de exposición. Es probable
que esa sea una situación inicialmente aterradora para alguien, pero puede aprender que volar en un
220 Control aversivo de la conducta
avión probablemente no resultará en nada peligroso (viajar en avión es, después de todo, la forma más
segura de viajar). Un enfoque más suave podría
Es decir, utilizar una jerarquía de miedo, como la que se utiliza en la desensibilización sistemática (por ejemplo,
Wolpe, 1961). Aquí, se enumeran una serie de estímulos calificados para el evento temido que generan
menor ansiedad (por ejemplo, hacer una reserva de vuelo) a mayor ansiedad (por ejemplo, volar en
avión). La relajación se enseña para cada paso en la jerarquía, comenzando con el estímulo de menor
rango hasta que la ansiedad es baja o manejable y, finalmente, el cliente cumple con el estímulo objetivo
(por ejemplo, volar en un avión).
En los entornos terapéuticos, los temores que perturban la vida pueden ser aliviados por un
profesional. Sin embargo, en muchos entornos y comportamientos cotidianos, las respuestas de escape
y evitación que son menos perturbadoras para la vida pueden resistirse a la extinción. Esta persistencia
se produce cuando las condiciones de estímulo entre el peligro (la presencia del castigador) y la extinción
(la ausencia del castigo) son bajas. En otras palabras, la extinción puede no ser claramente señalada
por el CS. Cuando la diferencia entre el escenario de extinción y la situación asociada con un estímulo
aversivo es pequeña, la extinción no se discrimina y la respuesta de evitación continúa. Por ejemplo, en
la vida cotidiana, el consultorio de un dentista puede oler y parecerse al hospital donde alguna vez se
experimentó dolor, o las flores en el patio de un vecino pueden ser similares a las de un jardín donde
los insectos voladores y los zumbidos alguna vez estuvieron acompañados por una picadura. No está
claro si se experimentará un estímulo aversivo real (como el dolor) en estas condiciones.

Indefensión aprendida

Un efecto de persistencia similar ocurre cuando los animales son expuestos primero a una estimulación
inevitable y aversiva y luego se les da la oportunidad de escapar. En el fenómeno llamado indefensión aprendida,
un animal es expuesto primero repetidamente a estímulos aversivos ineludibles e impredecibles. Eventualmente,
el animal se da por vencido y deja de intentar evitar o escapar de la situación porque nada funciona. A
continuación, se cambian las condiciones y se pone a disposición una respuesta de escape, que en circunstancias
normales se adquiriría fácilmente. Sorprendentemente, el animal no hace la respuesta de escape; Ha aprendido
a volverse indefenso. En uno de los primeros experimentos, Seligman y Maier (1967) expusieron a los perros a
una descarga eléctrica ineludible e impredecible en las patas. Después de esto, intentaron enseñar a los animales
a evitar las descargas señaladas saltando a través de una barrera de caja de transporte. Los perros no pudieron
evitar las descargas, e incluso después de que se produjeran las descargas, no escaparían cruzando la barrera
para ponerse a salvo. Los investigadores sugirieron que los perros habían aprendido a darse por vencidos y a
sentirse indefensos cuando se les presentaban estímulos aversivos ineludibles. Por supuesto, los perros que no
están expuestos primero a un choque ineludible aprenden rápidamente a escapar y evitar los choques en una
caja de transporte.
La indefensión aprendida se ha encontrado en un gran número de experimentos, y ha sido
documentados en otros animales (por ejemplo, Jackson, Alexander y Maier, 1980; Maier y Seligman,
1976; Maier, Seligman y Solomon, 1969; Overmier y Seligman, 1967; Seligman y Maier, 1967). En un informe de
Current Biology, las moscas entrenadas para escapar (Drosophila) que dejaron de caminar durante un breve
período recibieron ráfagas de calor, que podrían terminarse al reanudar la marcha (Yang, Bertolucci, Wolf y
Heisenberg, 2013). Estas moscas muestran una reanudación confiable de la marcha después de recibir pulsos de
calor. Otras moscas entrenadas ineludiblemente recibieron los pulsos de calor exactamente en la misma
secuencia que las moscas de la condición entrenada para escapar, pero no pudieron hacer nada para escapar de
Control aversivo de la conducta 221

-
las ráfagas de calor y dejaron de responder. Después del entrenamiento, ambos grupos de moscas (entrenadas
para escapar y entrenadas para ineludibles) se sometieron a una prueba de locomoción. Las moscas que recibían
pulsos de calor ineludibles caminaban más lentamente, descansaban con más frecuencia y parecían
"deprimidas" en comparación con los insectos entrenados para escapar.
Se han reportado resultados similares para los seres humanos. Hiroto y Seligman (1975) expusieron a los
estudiantes universitarios a una serie de ruidos fuertes e ineludibles. Siguiendo este procedimiento, los
estudiantes tuvieron que resolver una serie de problemas de anagramas. Los estudiantes expuestos a
ruidos ineludibles tuvieron más dificultades para resolver problemas que los estudiantes que no
estuvieron expuestos al ruido fuerte. Más
Los sujetos de control resolvieron todos los anagramas y llegaron a soluciones cada vez más rápido. Por
el contrario, los estudiantes que estuvieron expuestos a ruidos ineludibles fracasaron en muchos
problemas y mejoraron lentamente su rendimiento.
Las implicaciones prácticas de estos hallazgos parecen obvias. Cuando las personas están expuestas
a un fracaso ineludible (shocks), pueden aprender a darse por vencidas y volverse indefensas. Un padre
que azota a un niño en función de su estado de ánimo en lugar de por el mal comportamiento del niño
puede crear un individuo socialmente retraído. El niño ha aprendido que "no importa lo que haga,
recibo una nalgada". Un individuo que con frecuencia "explota" sin razón aparente puede producir un
conjunto similar de respuestas en su pareja.
Impotencia, castigo y evasión
Los "shocks" sociales ineludibles no son la única forma de aprender la impotencia. Los guardias nazis
de los campos de concentración organizaron brutalmente el castigo indiscriminado y las contingencias
de evitación para inculcar una especie de impotencia y docilidad en los prisioneros judíos (figura 6.9).
Mucha gente se ha preguntado cómo tanta gente pudo haber ido a la muerte sin resistirse a los captores
nazis. La respuesta está en el poder del control aversivo, que supera con creces lo que podemos
imaginar.
Los carceleros alemanes a menudo utilizaban la matanza impredecible y arbitraria de prisioneros
para mantener el control después de usar la muerte por ejecución para cualquier acto menor de
resistencia. En esta situación, los cautivos judíos aprendieron a evitar la muerte haciendo lo que se
esperaba que hicieran. Una vez que se había establecido esta evasión indefensa, los guardias de las SS
podían mantenerla en marcha de vez en cuando
222 Control aversivo de la conducta

Figura 6.9
Un sello postal estadounidense representa a los sobrevivientes del Holocausto después de la liberación aliada en 1945. Los
supervivientes mostraron los profundos efectos del uso indiscriminado del castigo y las contingencias de evitación por parte de
los guardias nazis.
Fuente: Shutterstock.

seleccionando a unos pocos prisioneros para fusilarlos o exterminarlos a su antojo arbitrario. Estas
ejecuciones no estaban relacionadas con nada que las víctimas hicieran o dejaran de hacer, eran
inevitables. Murray Sidman explica que la imposición de la muerte indiscriminada por ejecución a la
evasión aprendida de la muerte fue la base de la impotencia observada:
Si la conmoción hubiera sido simplemente dolorosa [en lugar de la muerte], los judíos podrían
haberse resistido, dando la bienvenida a la muerte como el escape definitivo. Sin embargo, con la
muerte misma como conmoción, escapar de la muerte era la contingencia dominante. Esa
conmoción, que a menudo se producía con una crueldad similar a la de una máquina, dependía al
principio de las acciones de los prisioneros, cuando se resistían, por ejemplo, o no obedecían las
órdenes. Más tarde, los choques no tenían ninguna relación con nada de lo que realmente hicieron
o dejaron de hacer. Debido a que las contingencias originales habían generado una conducta de
evitación requerida —docilidad—, los choques no contingentes posteriores [fusilamiento arbitrario
de prisioneros] mantuvieron esa forma de evitación. Un observador externo, o un historiador,
podía ver que su silenciosa marcha hacia los hornos era inútil. Sin embargo, el cambio en las reglas
se había producido sin previo aviso, y los que estaban a punto de ser asesinados simplemente
estaban haciendo lo que las contingencias originales [de evasión] les habían enseñado que era
necesario para sobrevivir.
Sus muertes sirvieron para mantener la docilidad de los que se quedaron.
Control aversivo de la conducta 223

-
(Southman, 2001, págs. 147-148)
Es importante reconocer que la impotencia no tuvo nada que ver con que el pueblo judío no pudiera
resistir. Cualquier persona expuesta a tipos similares de control coercitivo se comportaría de manera
similar, independientemente de su raza, etnia u orientación religiosa. La impotencia no reside en las
víctimas de la violencia, sino en los poderosos efectos conductuales engendrados por las contingencias
aversivas dispuestas por los nazis.
Indefensión y depresión aprendidas
Seligman (1975) argumentó que la investigación sobre la indefensión aprendida con animales proporciona un
modelo para la depresión clínica. Por ejemplo, existe evidencia de que la indefensión está involucrada en la
relación entre la dependencia del alcohol y la depresión (Sitharthan, Hough, Sitharthan y Kavanagh, 2001). En
términos más generales, miles de personas cada año son diagnosticadas con depresión. Estos individuos
muestran insomnio, informan que se sienten fatigados, pueden dormir con frecuencia (evitando sus
circunstancias difíciles), tienen dificultades para realizar tareas rutinarias y pueden tener tendencias suicidas. La
depresión clínica es grave, duradera y no se puede atribuir fácilmente a una experiencia ambiental reciente.
Aunque los experimentos con animales pueden arrojar luz sobre la depresión humana, existen diferencias
(Abramson, Seligman y Teasdale, 1978; Peterson y Seligman, 1984). En su mayor parte, Seligman señala las
diferencias que se producen debido al comportamiento verbal humano. La gente habla de sus
problemas y los atribuye a causas internas o externas. Cuando las personas atribuyen sus dificultades a
causas personales (por ejemplo, "Soy un fracasado"), estas atribuciones podrían establecer la ocasión
para darse por vencido (comportamiento gobernado por reglas, como se discutió en el capítulo 11). En
cuanto al tratamiento, Seligman sugirió que los individuos deprimidos sean colocados en situaciones en
las que no puedan fallar. De esta manera, la persona puede hacer contacto con el refuerzo y, finalmente,
aprender respuestas exitosas en presencia de eventos negativos de la vida.
Seligman (1991) también sugirió cómo prevenir la indefensión aprendida y la depresión. Una persona que ya ha
aprendido a escapar del control punitivo puede ser "inmunizada" contra los efectos de eventos
aversivos ineludibles. Tal efecto es sugerido por experimentos en los que los animales aprenden
inicialmente alguna respuesta (por ejemplo, correr con la rueda) para escapar de estímulos aversivos.
En primer lugar, los animales aprenden una respuesta de escape eficaz a las contingencias de refuerzo
negativo. A continuación, los animales son expuestos a los procedimientos típicos de indefensión
aprendida de aversivos ineludibles. Finalmente, los sujetos son evaluados en una situación en la que
una nueva respuesta produce un escape de los estímulos aversivos (por ejemplo, cambiar de lado en
una caja de transporte). El efecto típico de la preexposición a la fuga es que esta experiencia bloquea
la indefensión aprendida que generalmente trae consigo
por la ineludible estimulación aversiva (Maier y Seligman, 1976; Williams y Lierle, 1986; pero véase Dos Santos, Gehm
y Hunziker, 2010 para la evidencia negativa). Esto también se puede considerar como el desarrollo de la resiliencia.
La importancia de la "inmunización" contra la indefensión aprendida también se puede ilustrar con
una estrategia de crianza milenaria conocida como paternidad helicóptero. Esta práctica de crianza se
refiere a la tendencia de los padres a prestar mucha atención a las actividades de sus hijos en un intento
de evitar que su hijo experimente decepción o dolor, como el fracaso, la injusticia o el rechazo de sus
compañeros. En otras palabras, los padres bien intencionados tratan de evitar que sus hijos
224 Control aversivo de la conducta
experimenten estímulos aversivos a lo largo de la vida. Las investigaciones muestran que, si bien esto
puede tener beneficios positivos para los niños cuando son pequeños, a largo plazo, en realidad puede
ser perjudicial. Los estudiantes en edad universitaria que experimentaron la paternidad helicóptero
cuando eran niños tienen más probabilidades de tener un bienestar psicológico deficiente, sufrir
depresión y tener mayores dificultades
adaptarse a la universidad (LeMoyne y Buchanan, 2011; Reed et al., 2016; Schiffren et al., 2014). Estos desafíos están
ligados a la falta de autonomía y competencia; En otras palabras, es probable que las personas con
paternidad helicóptero tengan una capacidad poco desarrollada para controlar los estímulos aversivos
que encuentran como estudiantes universitarios. Puede tener sentido, entonces, permitir que los niños
experimenten dificultades a medida que se desarrollan, pero proporcionar apoyo positivo y habilidades
de afrontamiento al tiempo que les permite etiquetar y experimentar sus respuestas emocionales. Este
tipo de estrategias pueden desarrollar resiliencia y resistencia a la indefensión.
Indefensión aprendida, depresión y neurociencia
Además de los enfoques conductuales que inmunizan contra la indefensión aprendida, la investigación
en neurociencia está analizando actualmente los mecanismos cerebrales subyacentes. El objetivo es
identificar las estructuras cerebrales, los sistemas neuronales y la neuroquímica implicados en la ayuda
aprendida.
y la depresión, con la esperanza de descubrir nuevos tratamientos médicos (véase LoLordo y Overmier, 2011).
Una estructura cerebral prometedora, que relaciona los choques ineludibles (o factores
estresantes) con la depresión conductual, es la corteza prefrontal medial, que es rica en 5-
hidroxitriptamina (5-HT)
receptores que son activados por el neurotransmisor serotonina (Amat et al., 2005). Los receptores 5-HT modulan la
liberación de muchos neurotransmisores y hormonas relacionados con el estrés y las reacciones de
"recompensa negativa", incluido el neurotransmisor dopamina. En este sentido, una línea de
investigación relaciona la dopamina y varios sitios cerebrales con la depresión conductual inducida por
la indefensión aprendida. Los fármacos que se dirigen a las vías dopaminérgicas pueden llegar a ofrecer
un tratamiento
para la depresión clínica (Bertaina-Anglade, La Rochelle, & Scheller, 2006 ; Takamori, Yoshida y Okuyama, 2001),
especialmente cuando se combina con intervenciones conductuales centradas en la superación y
prevención de la indefensión aprendida.
A nivel celular, el comportamiento depresivo es poco conocido. Las neuronas de la habénula lateral
(LHb) cerca del tálamo dorsal están implicadas, ya que permiten la comunicación entre las áreas del
prosencéfalo y el mesencéfalo asociadas con el aprendizaje de la "recompensa negativa"
(ver Mirrione et al. 2014 para imágenes cerebrales en la indefensión aprendida). Es importante destacar que las
neuronas LHb se proyectan y modulan las células nerviosas dopaminérgicas en el área tegmental ventral (VTA) del
mesencéfalo. Las neuronas dopaminérgicas de la ATV, a su vez, participan en el control de la conducta depresiva
inducida por un shock ineludible. Un estudio en Naturaleza mostró que los procedimientos de indefensión aprendida
aumentaron las respuestas sinápticas excitatorias de las neuronas LHb que se proyectan hacia el VTA (Li et al., 2011).
Además, el aumento de la activación sináptica de LHb es el resultado de la liberación presináptica de un
neurotransmisor y se correlaciona con el comportamiento depresivo de un animal. La estimulación eléctrica repetida
de los nervios aferentes LHb agota la liberación del neurotransmisor, disminuye sustancialmente las respuestas
sinápticas excitatorias de las neuronas LHb en cortes cerebrales y reduce significativamente el comportamiento de
indefensión aprendida en ratas. En general, los resultados indican que la liberación de transmisores en las neuronas
Control aversivo de la conducta 225

-
LHb contribuye al modelo de roedores de indefensión aprendida y depresión. Además, el método de estimulación
eléctrica utilizado para agotar la liberación del transmisor y reducir la indefensión aprendida es un tratamiento
médico prometedor, que podría complementar la terapia conductual (Strosahl y Robinson, 2016), para pacientes
diagnosticados con depresión clínica.

NUEVAS DIRECCIONES: NEUROCIENCIA CONDUCTUAL DE LA DERROTA SOCIAL

Trastornos psiquiátricos que incluyen depresión, fobia social y trastorno de estrés postraumático
(TEPT) se han relacionado con el retraimiento social y con anomalías del sistema dopaminérgico. Para
Para comprender mejor estos vínculos, Berton et al. (2006) utilizaron un procedimiento de
derrota social que altera profundamente las interacciones sociales de los roedores.
En su estudio, los ratones recibieron episodios diarios de derrota social, seguidos de un período de
exposición protegida al agresor más grande: ambos animales fueron colocados en una jaula separada por
una barrera para permitir el contacto sensorial. Los ratones de prueba fueron sometidos a la derrota por
diferentes agresores durante un período de 10 días, y se obtuvieron medidas de comportamiento social. Los
investigadores midieron el enfoque social de un ratón desconocido encerrado en una jaula de alambre,
utilizando un sistema de seguimiento de video. Los animales de control (invictos) pasaban la mayor parte del
tiempo muy cerca del ratón desconocido. Los ratones derrotados mostraron intensas respuestas de aversión
y pasaron menos tiempo cerca del ratón desconocido en la jaula, pero no cuando la jaula de alambre estaba
vacía. Por lo tanto, la respuesta fue al objetivo social (ratón desconocido), no a la novedosa jaula de alambre.
Cuando se volvió a probar después de 4 semanas, los ratones con un historial de derrota social aún
mostraban evitar el objetivo social. No es sorprendente que estas respuestas de evitación fueran mayores
para el agresor, pero también se generalizaron a ratones desconocidos que eran físicamente distintos del
agresor.
A continuación, los investigadores demostraron que los medicamentos antidepresivos utilizados con
humanos mejoraron la interacción social de los ratones derrotados, pero los medicamentos relacionados con
la ansiedad no tuvieron este efecto. Una posibilidad es que los fármacos antidepresivos actúen sobre las vías
dopaminérgicas (DA) del cerebro. Para caracterizar aún más los mecanismos neurobiológicos de la aversión
social inducida por la derrota, Berton et al. (2006) se centraron en las neuronas dopaminérgicas del cerebro
mesolímbico en el área tegmental vental (VTA), así como en las proyecciones de estas neuronas al núcleo
accumbens (NAc). Investigaciones anteriores han demostrado que estas vías están asociadas con estímulos
emocionalmente destacados y conductas de evitación. El factor neurotrófico BDNF (factor neurotrófico
derivado del cerebro) es un importante regulador de la vía de la dopamina mesolímbica, modulando la
liberación de dopamina. El BDNF también está implicado en la liberación de dopamina (DA) en el NAc a través
del receptor TrkB (receptor de tropomiosina kiasa B) en las terminales nerviosas de la dopamina. Los
resultados mostraron que los niveles de BDNF en el NAc se incrementaron por la derrota social, y este efecto
ocurrió 24 h e incluso 4 semanas después de los episodios de derrota social.
Se cree que la fuente de la proteína BDNF en el NAc es el VTA, donde se expresa el ARN mensajero
(ARNm) para el BDNF. Berton et al. (2006) eliminaron el gen que codifica para BDNF en el VTA de ratones
adultos y encontraron un efecto similar al de los antidepresivos; la deleción del gen para BDNF y
226 Control aversivo de la conducta
La liberación de DA redujo la adquisición de conductas de evitación social en ratones derrotados. Este
hallazgo y otras condiciones de control indicaron que el BDNF de las neuronas VTA es necesario para que un
objetivo social se convierta en un estímulo aversivo que regule el comportamiento de evitación de los ratones
derrotados. Investigaciones posteriores, utilizando la estimulación óptica óptica fásica in vivo, han
demostrado que la activación optogenética de la vía mesolímbica DA aumenta el BDNF en el NAc de ratones
socialmente estresados, pero no en ratones no estresados. Esta activación por estrés de la señalización de
BDNF está mediada por el factor liberador de corticotropina (CRF, una hormona del estrés y
neurotransmisor) que actúa sobre las neuronas NAc, lo que proporciona un estrés
mecanismo de detección de contexto para el circuito mesolímbico de recompensa DA del cerebro (Walsh et al., 2014).
Una implicación de la neurociencia de la derrota social es que los seres humanos diagnosticados con trastornos
afectivos pueden estar mostrando respuestas de evitación adquiridas por una historia de castigo y derrota social. Estos
efectos conductuales pueden involucrar BDNF, CRF y las vías dopaminérgicas (DA). La terapia conductual (Strosahl y
Robinson, 2016), cuando se combina con medicamentos antidepresivos especializados, podría ser especialmente
efectiva para reducir la aversión social y aumentar el comportamiento socialmente apropiado. Además, la investigación
neuroquímica innovadora está vinculando los procedimientos de indefensión aprendida y derrota social con
mecanismos cerebrales comunes, con el objetivo de producir una visión más completa de la indefensión.
trastorno depresivo mayor (Amat, Aleksejev, Paul, Watkins y Maier, 2010; Hammack, Cooper y Lezak, 2012).

Agresión: Un efecto secundario prominente


Agresión desplazada
Cuando se colocan dos ratas en el mismo entorno y se administran descargas dolorosas, los animales pueden
atacarse unos a otros (Ulrich y Azrin, 1962; Ulrich, Wolff y Azrin, 1964). La lucha generada por estas contingencias se
denomina agresión desplazada, porque el ataque sigue a la presentación de eventos aversivos. El
ataque ocurre a pesar de que ninguno de los animales es responsable de la ocurrencia de los choques.
La agresión desplazada se ha documentado en varias especies,
incluyendo a los humanos (Hutchinson, 1977), y se ha encontrado con estímulos distintos de las descargas eléctricas
(Azrin, Hake y Hutchinson, 1965); De hecho, los estímulos que se correlacionan con la extinción (refuerzo previo que
ya no está disponible) pueden inducir la agresión desplazada. La mayoría de las personas reconocen que son más
propensas a la agresión cuando se exponen a estímulos aversivos, ya sean dolorosos, aversivos o correlacionados
con la extinción. Cuando te sientes bien, es posible que nunca le grites a tu pareja, pero puedes hacerlo si tienes un
dolor de muelas o un dolor de cabeza intensos.
En estos primeros experimentos (O'Kelly y Steckle, 1939), las ratas fueron colocadas en un pequeño recinto
y las descargas eléctricas ocurrían periódicamente, sin importar lo que hicieran los animales. Cuando
las ratas recibían descargas eléctricas periódicas, comenzaron a pelear. Veintitrés años más tarde, Ulrich
y Azrin (1962) investigaron sistemáticamente el comportamiento de lucha de ratas expuestas a choques
ineludibles e intermitentes. Estos investigadores comenzaron probando si dos ratas peleaban cuando
simplemente se colocaban en una pequeña cámara operante, y observaron que los animales mostraban
una baja probabilidad de pelear cuando se colocaban en un espacio confinado sin descargas. Sin
embargo, cuando se administraban descargas al azar, las ratas se enfrentaban inmediatamente entre
sí, asumían una postura de pie con la boca abierta y se golpeaban y mordían vigorosamente unas a
otras (véase la figura 6.10), infligiéndose graves lesiones físicas unas a otras a menos que se tomaran
precauciones. En particular, la cantidad de peleas provocadas por el dolor entre las ratas dependía
críticamente del tamaño de la cámara. En una cámara pequeña, alrededor del 90% de las descargas
Control aversivo de la conducta 227
provocaron una respuesta de combate. Los combates disminuyeron con un mayor espacio en el suelo,
con solo el 2% de los choques provocando combates en la cámara más grande. Por lo tanto, el
confinamiento con otro animal

Figura 6.10
Dos ratas en posición de ataque inducidas por descarga eléctrica.
Fuente: Reimpreso de R. E. Ulrich y N. H. Azrin (1962). Lucha reflexiva en respuesta a la estimulación aversiva. Revista de Análisis Experimental de la
Conducta, 5, pp. 511-520. Copyright 1962 en poder de John Wiley & Sons Ltd. Publicado con permiso.

combinado con choques produjo altas cantidades de agresión desplazada (ver Ulrich, Hutchinson y Azrin, 1965
para una revisión de los factores moderadores relacionados con la agresión inducida por el dolor).
En algunos estudios, las descargas se administraron con frecuencias cada vez mayores, y el número
de ataques aumentó a medida que se presentaban más descargas. Además, Ulrich y Azrin (1962)
encontraron que la probabilidad de ataque de cualquier choque aumentaba a medida que aumentaba
el número de choques. Cuando los animales recibieron una descarga cada 10 minutos, los ataques
siguieron aproximadamente al 50% de las descargas. Cuando los animales recibieron 38 descargas por
minuto, las peleas siguieron al 85% de las descargas. La probabilidad de que un evento doloroso induzca
un comportamiento agresivo es mayor después de altas tasas de estimulación dolorosa.
La estimulación dolorosa también produce respuestas similares a las de un ataque en humanos y monos (
Azrin &
Holz, 1966; Azrin, Hutchinson y Sallery, 1964; Hutchinson, 1977). En un experimento, se administraron descargas
eléctricas a monos ardilla (Azrin et al., 1964). Al igual que en el caso de las ratas, el ataque fue inducido
por el shock. Los animales atacaron a otros monos, ratas, ratones y objetos inanimados, como una
muñeca de peluche, una pelota redonda o una manguera de goma que podían morder. A medida que
aumentaba la intensidad de los choques, también lo hacía la probabilidad y la duración de los ataques,
un resultado que es paralelo a los hallazgos con las ratas.
228 Control aversivo de la conducta
En una revisión de los efectos secundarios del control aversivo, Hutchinson (1977) describió las
reacciones de mordedura de los humanos a los estímulos aversivos. Los sujetos eran voluntarios
pagados que estaban expuestos a ruidos fuertes e ineludibles a intervalos regulares. Porque el ruido se
entregó en una predicción Los sujetos llegaron a discriminar el inicio del estímulo aversivo. Las
medidas discretas indicaban que los humanos mostrarían respuestas agresivas (o, más precisamente,
mordeduras en una manguera de goma) después de la presentación de ruidos fuertes. Las respuestas
de los participantes al ruido son paralelas a las peleas que se encuentran en los monos y otros animales.
Hutchinson, sin embargo, sugiere que estos resultados humanos deben interpretarse con precaución.
A los participantes se les dijo que recibirían estímulos aversivos, pero que la intensidad sería tolerable.
Además, señaló que a los participantes se les pagaba para que permanecieran en el experimento, y que
la mayoría de las personas dejarían esa situación en la vida cotidiana si fuera posible.
Como se mencionó anteriormente, después de un período de refuerzo positivo, la extinción o
retirada del refuerzo para la conducta operante es capaz de inducir respuestas agresivas. Así, Azrin et
al. (1966) fueron capaces de inducir ataques a una paloma objetivo alternando períodos de refuerzo
con períodos de extinción. Después de un refuerzo positivo continuo, el inicio de la extinción al principio
aumenta y luego disminuye la tasa operante, que a menudo se acompaña de un aumento en el
comportamiento agresivo. Piensa en la máquina expendedora que usas cada mañana para tomar una
taza de café antes de la clase. Insertar su dinero es el operativo, y la máquina dispensa un café cada vez
que inserta las monedas. Una mañana, insertas el dinero, pero la máquina no funciona (está rota y tu
comportamiento está en extinción). ¿A qué te dedicas? Al principio, muchos de nosotros nos
preguntamos qué ha pasado, pensamos: "Tal vez puse la cantidad equivocada" y volvemos a insertar la
moneda requerida (continuar respondiendo operante). Pero, de nuevo, la máquina no funciona y ahora
te encuentras golpeando la ranura de monedas, golpeando otras partes de la máquina con las manos,
pateándola o usando un comando mágico como "Trabaja, máquina estúpida". Como acabas de tomar
un curso de análisis de la conducta, de repente te das cuenta de que no es la máquina estúpida, sino el
período de extinción después del refuerzo positivo lo que explica tu arrebato agresivo.
La agresión también se genera por extinción después de un reforzamiento intermitente (ver
Frederiksen y Peterson, 1977). Después del reforzamiento intermitente, un período de extinción induce
más agresión que después del reforzamiento continuo (CRF). Los ataques inducidos por la extinción se
producen siguiendo programaciones de FR y VR, y las programaciones de FR generan más ataques que
las contingencias de VR. En los programas de FI, en los que se refuerza la primera respuesta después de
un período de tiempo determinado, los ataques dirigidos a un ave restringida pero protegida (o imagen
especular) ocurren a intervalos fijos que van de 60 a 270 s. Las palomas en los programas VI de refuerzo
también muestran agresión inducida.
En el caso de los seres humanos, la agresión ha sido inducida por la extinción después del refuerzo
positivo, y por el refuerzo periódico en intervalos y programas de proporción (Frederiksen y Peterson,
1977). La tasa de ataque está relacionada con la tasa de refuerzo, pero la naturaleza de esta relación en
los humanos no está bien investigada. La agresión humana se distribuye a lo largo de la RII y se limita
menos al período inmediatamente posterior al refuerzo como en otros animales. La historia previa del
reforzamiento del agresor, las características de estímulo del objetivo, la disponibilidad de armas y la
tasa actual de refuerzo probablemente se combinan para producir diferentes tasas de ataque en
humanos, pero nuevamente falta investigación. Una posibilidad es que el refuerzo periódico, y los
cambios del refuerzo a la extinción, proporcionen una interpretación conductual de los tiroteos masivos
aparentemente irracionales y otras formas de agresión en Estados Unidos después de la pérdida del
empleo, el final de una relación (como el divorcio) y la disminución de las tasas de refuerzo por parte
Control aversivo de la conducta 229
de familiares, amigos o compañeros de trabajo alienados (ver Follman, Aronsen, y Pan, artículo de 2014
sobre tiroteos masivos en Estados Unidos en la revista Mother Jones).
Contracontrol
Cuando una persona castiga el comportamiento de otra, la persona castigada puede tomar represalias.
Esto no es difícil de entender; una forma de escapar del castigo es eliminar o neutralizar a la persona
(o fuente) que lo está administrando (Azrin y Holz, 1966). Esta estrategia se denomina contracontrol, y
está formada y mantenida por el refuerzo negativo (es decir, la eliminación de un estímulo aversivo).
Las revoluciones y las guerras se basan en que los ciudadanos se levantan contra un gobierno opresor.
Un niño que es molestado por un acosador finalmente puede defenderse. Los adolescentes con padres
sobreprotectores pueden rebelarse. Todos estos son ejemplos de contracontrol.
Un problema con el control de los demás a través del control aversivo, especialmente a través de
la agresión física, es que las personas que utilizan con éxito la contraagresión para detener el castigo
acordado por otros pueden ser reforzadas negativamente por hacerlo. Considere una situación en la
que la discusión de una pareja se intensifica hasta que uno de ellos pierde los estribos y golpea a su
pareja, lo que suprime las discusiones de su pareja. Esto representa una serie de comportamientos de
contracontrol en los que una persona termina la discusión en un acto violento. El agresor se ve
reforzado negativamente por la sumisión de su pareja después del abuso físico. Aunque esto no explica
completamente el maltrato de la pareja de hecho, sí sugiere que el refuerzo negativo juega un papel
importante en muchos casos (ver sección "Control aversivo del comportamiento humano"
anteriormente en este capítulo para más detalles).
Aunque la agresión humana es fácilmente reconocible, es difícil de estudiar en el laboratorio. Esto
se debe a que el comportamiento agresivo es una forma peligrosa de conducta humana. Al darse cuenta del
peligro, los investigadores han desarrollado procedimientos que protegen a la víctima de cualquier daño. En la
situación de laboratorio, se hace creer a los participantes que tienen la oportunidad de dañar a otra persona
cuando en realidad no es así (p. ej., Cherek, et al., 1997; Gustafson, 1989; Vásquez, Denson, Pedersen, Stenstrom
y Miller, 2005). En un experimento típico, se les dice a los participantes que pueden dar un castigo (por ejemplo,
ruido fuerte, descarga eléctrica, robo de puntos o dinero, o inmersión de la mano en agua helada) a otra persona
presionando un botón en un panel de respuesta o indicando cuánto tiempo debe permanecer la mano
sumergida en agua extremadamente fría. La otra persona es, de hecho, cómplice o cómplice del investigador, y
actúa como víctima, pero en realidad no recibe el estímulo aversivo.
Ha habido un debate sobre la realidad o validez externa de estos procedimientos. Sin embargo, la
evidencia sugiere que estos métodos constituyen un análogo razonable de la agresión humana en la vida
cotidiana. Los participantes en experimentos de agresión parecen convencidos de que sus acciones dañaron al
cómplice (Berkowitz y Donnerstein, 1982). Además, cuando el cómplice provoca a los participantes con insultos
u otro tipo de estímulos aversivos, entregan mayores cantidades de estimulación dolorosa que cuando no son
provocados (Baron y Richardson, 1993). Por último, las personas que se sabe que son violentas suelen
seleccionar y administrar niveles más fuertes de estimulación aversiva que las que no tienen ese historial (Cherek
et al., 1997; Gully y Dengerink, 1983; Wolfe y Baron, 1971).

La agresión engendra agresión


La presentación de un estímulo aversivo puede hacer que el comportamiento agresivo sea más
probable. La provocación por parte de otros es una forma común de estimulación aversiva que ocurre
en una variedad de entornos sociales. Considera una situación en la que has trabajado muy duro en un
trabajo de fin de curso y sientes que es el mejor trabajo que has escrito. Tu profesor te llama a su oficina
230 Control aversivo de la conducta
y te dice: "Tu trabajo es basura. Carece de claridad, erudición y organización, y está plagado de errores
gramaticales". Protestas por lo que parece un trato injusto, pero es en vano. Sales furioso de la oficina
murmurando algunas palabras y, una vez en el pasillo, pateas la puerta del ascensor. Más adelante en
el trimestre, se le pide que complete una evaluación de enseñanza y, en represalia, califica al profesor
como uno de los peores maestros que ha conocido. En este ejemplo, los comentarios insultantes del
profesor generaron respuestas agresivas que iban desde patear una puerta hasta contraatacar.
ataque por evaluación negativa. Generalmente, la agresión engendra agresión (Patterson, 1976).
En términos de provocación física, los experimentos muestran que las personas responden a los ataques con
la escalada de contraataques (Borden, Bowen y Taylor, 1971; O'Leary y Dengerink, 1973; Taylor y Pisano, 1971). En
estos experimentos históricos, los participantes intentaron vencer a sus oponentes en un juego de
tiempo de reacción en el que el perdedor recibía una descarga eléctrica menor. De hecho, no hubo
oponentes reales, pero los participantes recibieron descargas que fueron programadas por los
investigadores. En este juego, los sujetos perdieron en una serie de pruebas y los choques del oponente
ficticio aumentaron en magnitud. Ante el aumento de la provocación física, los sujetos tomaron
represalias aumentando la intensidad de las descargas que daban cuando el
"oponente" perdido (ver Anderson, Buckley y Carnagey, 2008 sobre cómo una historia de agresión generalizada o
agresión rasgo influye en el nivel de agresión en esta situación).
Es importante tener en cuenta que es probable que estos experimentos más históricos no reciban
la aprobación de una Junta de Revisión Institucional (IRB, por sus siglas en inglés) en la actualidad. Un
IRB es un comité de instituciones que realizan investigaciones en seres humanos, como universidades
u hospitales médicos; Está compuesto por personas con formación científica, formación no científica y
miembros de la comunidad. El trabajo de este comité es revisar de forma independiente los estudios
de investigación en humanos, especialmente en lo que respecta a la ética del estudio. Protegen los
derechos y el bienestar de los participantes de la investigación, así como garantizan el cumplimiento de
las regulaciones y políticas federales y estatales. Los IRB estaban ausentes en los primeros días de la
investigación de control aversivo, y solo comenzaron en 1974 después del trato atroz de los humanos
en la investigación por parte del régimen nazi. Desafortunadamente, los Estados Unidos tampoco
siempre han protegido a los seres humanos en la investigación, y a menudo aquellos que están
subrepresentados han recibido el mayor daño (ver Bad Blood: The Tuskegee Syphilis Experiment: A
Tragedy of Race and Medicine de James H. Jones y The Immortal Life of Henrietta Lacks de Rebecca
Skloot para ejemplos históricos de falta de protección en la investigación para los afroamericanos). Al
leer acerca de algunos de estos estudios descritos en este libro de texto, preste atención a las fechas en
que se publicaron. El uso de choque con humanos en estos estudios no es frecuente hoy en día debido a
los IRB. Incluso la preocupación de hacer que las personas piensen que electrocutaron o dañaron a
alguien también tiene algunas complejidades éticas que los IRB considerarían muy cuidadosamente hoy
antes de permitir. Las regulaciones de los IRB continúan cambiando y se vuelven más protectoras de los
seres humanos a medida que se descubren y evalúan más datos e información sobre daños y beneficios.
El estudio del papel de la provocación física en la agresión es, de hecho, un reto de estudiar
éticamente. Pero también es importante entender este tipo de agresión debido a su alta incidencia en
la sociedad y en el mundo natural. Por lo tanto, nos basamos en estudios anteriores, tal vez menos
éticos, así como en aquellos que son más recientes, pero más éticos.
Un estudio más antiguo sobre la provocación involucró agresión física con individuos de diferentes
Orígenes culturales y étnicos: israelíes, rusos, estadounidenses y georgianos (Jaffe, Shapir y Yinon, 1981). A estos
participantes se les pidió que administraran descargas falsas por respuestas "incorrectas" a un alumno,
Control aversivo de la conducta 231
que en realidad era un cómplice. Aunque no se les exigió que lo hicieran, los individuos aumentaron el
nivel de descargas dadas por respuestas incorrectas (castigadores). Cuando se les colocó en grupos de
tres, dieron los niveles más altos de "choques" crecientes, presumiblemente porque la responsabilidad
individual y la culpa se reducen en los grupos (en psicología social, llamamos a esto difusión de la
responsabilidad). Estos hallazgos se replicaron en todos los grupos étnicos y culturales, lo que sugiere
que
La escalada de la agresión al castigo social (respuestas incorrectas) se produce en individuos y grupos,
independientemente de su origen cultural.
En otro estudio, las personas compararon su nivel de agresión con el nivel de provocación.
(Juujaevari, Kooistra, Kaartinen y Pulkkinen, 2001). Además, las personas tomaban más represalias cuando se
les provocaba y posteriormente se les presentaba una molestia menor que cuando solo se les provocaba o no
recibían ninguna provocación. La molestia menor se convertía en un "detonante" de represalias cuando iba
precedida de una provocación; por sí solo no tuvo ningún efecto sobre el comportamiento agresivo (Pedersen,
Gonzales y Miller, 2000). Esto tiene implicaciones para las microagresiones. Las microagresiones son desaires
verbales, conductuales o ambientales comunes y sutiles (tanto intencionales como no intencionales) que
comunican actitudes negativas o estereotipos sobre grupos culturalmente marginados. Algunos ejemplos de
microagresiones incluyen decirle a una mujer negra elocuente que habla como una persona blanca (ser
elocuente no está relacionado con la raza) o preguntarle a un estudiante asiático-estadounidense cuánto tiempo
ha estado en los Estados Unidos (nació en Estados Unidos, al igual que sus padres). Este tipo de problemas
pueden parecer asuntos menores para algunos ("No quise hacer ningún daño. ¿Por qué tan sensible?"), pero
imagínate tener que soportar este tipo de comentarios todos los días o que estén precedidos de experiencias
aversivas más grandes, como la violencia racial o la discriminación. La sensibilidad a ese tipo de comentarios
podría aumentar; es decir, podrían convertirse en desencadenantes. Se llaman microagresiones por una razón:
son más pequeñas que los actos más grandes de racismo (u homofobia, sexismo, agismo o capacitismo), pero
su impacto acumulado puede parecer mayor para la persona que es el objetivo. Esta es la razón por la que usar
el cuidado en lo que uno dice a los demás es una práctica considerada.
Los insultos verbales también provocan y dan lugar a fuertes contraataques. Wilson y Rogers (1975) sugieren
que la provocación verbal puede conducir a represalias físicas; Señalaron incidentes que comenzaron
con burlas verbales y se convirtieron en violentas peleas a puñetazos. En un estudio de laboratorio de
insultos verbales,
Geen (1968) encontró que los participantes expuestos a comentarios desagradables y no provocados de un
cómplice tomaban represalias con agresión física. A los participantes en este estudio se les permitió dar
descargas eléctricas al cómplice insultante (de hecho, en realidad no se les dieron descargas). En
comparación con la frustración personal (un cómplice que le impide completar una tarea asignada) y la
frustración de la tarea (la tarea no tiene solución), los insultos verbales produjeron el nivel más alto de
agresión hacia el cómplice.
Un estudio de campo de niños de 6º grado respalda estos hallazgos del laboratorio. En este estudio,
el contexto de los insultos y las reacciones de otros niños aumentó la hostilidad percibida de los insultos
de los compañeros de clase (intensidad del castigo) y la cantidad de escalada verbal que siguió. Los
insultos relacionados con atributos sociales permanentes (por ejemplo, la identidad étnica) provocaron
humillación y aumentaron la violencia de insultos verbales a agresión física tanto para los niños como
para los niños.
(Geiger y Fischer, 2006).
232 Control aversivo de la conducta
La escalada de la violencia, desde los insultos hasta la agresión física, ocurre con más frecuencia en los
hombres que provienen de una "cultura del honor" (por ejemplo, el sur de los EE. UU.) que en aquellos que
no la tienen (por ejemplo, los del norte de los Estados Unidos).
Estados Unidos). Para los hombres que valoran mucho el honor, los insultos disminuyen la reputación de la
persona, y los insultos Es decir, que la mayoría de las personas que se encuentran en el ámbito de la
educación y la
y Schwarz, 1996; véase McAndrew, 2009 para un análisis de los desafíos al estatus, los niveles de testosterona y
la agresión en hombres humanos). En general, la agresión engendra más agresión, y los episodios
agresivos pueden escalar hacia niveles dañinos de violencia física, especialmente en culturas que
propagan la dignidad y el honor (véase Skinner, 1971 sobre otros problemas de libertad y dignidad).
Agresión: respuesta a la exclusión social
El dicho de que la agresión engendra agresión también puede extenderse a los problemas de violencia
en las escuelas estadounidenses y otras situaciones sociales. Una forma común de comportamiento
grupal involucra
exclusión social de los demás en función de sus características y comportamiento (Killen y Rutland, 2011). Por
ejemplo, un estudiante que muestra un alto nivel de logro en materias académicas puede ser excluido
del "grupo interno", cuyos miembros lo llaman "nerd". ¿Este tipo de comportamiento grupal a menudo
instiga la agresión en aquellos que la reciben? Un experimento ha investigado
esta pregunta en el laboratorio (Twenge, Baumeister, Tice y Stucke, 2001). Los participantes humanos fueron
expuestos a la exclusión social diciéndoles que otros participantes los habían rechazado como parte del
grupo.
Los resultados eran predecibles. La exclusión social hizo que los participantes se comportaran de
manera más agresiva en diversos contextos. Cuando eran insultados por otra persona (el objetivo), las
personas excluidas tomaban represalias "disparando" al objetivo con niveles más altos de ruido
aversivo. En otro experimento, el objetivo recibió el mismo trato agresivo a pesar de que no había
insultado a las personas excluidas. Esto sugiere que es la propia exclusión social la que instigó el
comportamiento agresivo. Otro experimento mostró que los efectos de la exclusión social sobre la
agresión podrían mitigarse si el objetivo proporcionaba elogios sociales (refuerzo) a la persona excluida.
Otros estudios han aclarado aún más el amplio impacto de la exclusión social en el aprendizaje de
la agresión por parte de los niños. Las investigaciones indican que los niños en edad preescolar y escolar
que experimentan exclusión social muestran un comportamiento más agresivo. Se trata de efectos
generalizados
que puede mantenerse a lo largo de la infancia y más allá (ver DeWall, Twenge, Gitter, &
Baumeister, 2009; Stenseng, Belsky, Skalicka y Wichstrom, 2014). La marginación o exclusión social de sectores de la
sociedad produce desventajas al bloquear el acceso a ciertas oportunidades y recursos tanto para
determinados grupos como para individuos, lo que a veces provoca ira.
alienación y agresión (Betts y Hinsz, 2013). Desde el punto de vista conductual, las restricciones sociales impuestas a
los grupos marginados pueden ser análogas a un tiempo de espera prolongado desde el refuerzo, un
procedimiento de castigo capaz de inducir un comportamiento agresivo en los miembros del grupo
excluido.
La disrupción social como efecto secundario

Cuando el castigo se utiliza para disminuir el comportamiento, generalmente se intenta detener una
respuesta en particular. La esperanza es que otras conductas impunes no se vean afectadas. Dos
Control aversivo de la conducta 233
factores trabajan en contra de esto: la persona que administra el castigo y el entorno en el que se
produce el castigo pueden convertirse en estímulos aversivos condicionados (Save). Debido a este
condicionamiento, las personas a menudo intentan escapar o evitar a la persona o el entorno que los
castiga. Azrin y Holz llamaron a este efecto secundario negativo del castigo perturbación social:
Es en el área de la disrupción social donde el castigo parece ser capaz de producir cambios de
comportamiento que son de gran alcance en términos de producir una incapacidad para una vida
efectiva. Por ejemplo, un maestro puede castigar a un niño por hablar en clase, en cuyo caso se
desea que se elimine la vocalización no autorizada del niño, pero que sus otros comportamientos
permanezcan intactos. Sin embargo, hemos visto anteriormente que un efecto secundario del
proceso de castigo fue que reforzó las tendencias por parte del individuo a escapar de la situación
de castigo en sí. En términos del ejemplo que estamos usando, esto significa que no solo se
esperaría que el castigo de la vocalización disminuyera la vocalización, sino que también aumentara
la probabilidad de que el niño abandonara la situación del aula. Se fortalecerían conductas como
la tardanza, el ausentismo escolar y la deserción escolar. El resultado final sería la terminación de
la relación social, lo que haría imposible cualquier control social adicional del comportamiento del
individuo. Este efecto secundario del castigo parece ser uno de los aspectos más indeseables de
que un individuo imponga un castigo contra otro, ya que el proceso de socialización debe depender
necesariamente de la interacción continua con otros individuos.
(Azrin y Holz, 1966, pp. 439-440, énfasis añadido)
También vale la pena recordar los efectos supresores generales de los estímulos aversivos. Un
maestro, padre o empleador (agente social) que utiliza con frecuencia técnicas aversivas se convierte
en un estímulo castigador condicionado. Una vez que esto ocurre, la mera presencia del agente social
puede interrumpir todo el comportamiento operante en curso. Esto significa que el comportamiento
positivo cae a niveles bajos cuando esta persona está presente (ver sección "Nuevas Direcciones:
Neurociencia Conductual de la Derrota Social" en este capítulo).
234 Control aversivo de la conducta

EN EL LADO APLICADO: LA COERCIÓN Y SUS CONSECUENCIAS


En su libro titulado Coercion and Its Fallout, Murray Sidman (2001) ofrece un análisis del comportamiento
de la coerción y su uso frecuente en la sociedad norteamericana. La coerción se define como el "uso del
castigo y la amenaza de castigo para hacer que otros actúen como nos gustaría, y... nuestra práctica de
recompensar a las personas simplemente dejándolas escapar de nuestros castigos y amenazas" (p. 1). Para
Sidman, la coerción implica las contingencias básicas del castigo y el refuerzo negativo. Una parte interesante
de su libro se refiere a la huida y la "deserción" de la familia, la comunidad y la sociedad (figura 6.11).
La deserción escolar, un tipo de contingencia de escape, es uno de los principales problemas sociales
de nuestro tiempo. Las personas abandonan la educación, la familia, la responsabilidad personal y
comunitaria, la ciudadanía, la sociedad e incluso la vida. Sidman (2001, p. 101) señala que el elemento
común en todas estas formas de conducta es el refuerzo negativo. Una vez que están involucradas en un
sistema aversivo, las personas pueden salir retirándose de la situación coercitiva, y esto fortalece el
comportamiento de abandono. Sidman señala que la sociedad es la perdedora cuando la gente deja de
participar; La deserción escolar no es productiva, ya que la deserción ya no contribuye a su propio bienestar
ni al de la sociedad.
Un ejemplo desafortunado, pero común, es el abandono escolar. Día tras día, los estudiantes son
enviados a escuelas donde la coerción es una forma predominante de enseñanza. Los estudiantes muestran
formas cada vez más severas de deserción escolar. Las tardanzas, la enfermedad fingida, "hacerse el
enganche" y nunca presentarse a la escuela son respuestas comunes a la escalada de la coerción en las
escuelas. Sidman resume el problema de la siguiente manera:

La actual crisis de disciplina y deserción escolar es el resultado inevitable de una historia de coerción
educativa. Uno puede añorar los días en que los alumnos temían a sus maestros, les hablaban con
respeto, aceptaban el trabajo extra como castigo, se sometían a que los mantuvieran después de la
escuela e incluso se resignaban a ser golpeados. Pero a lo largo de los años, todas estas formas de
control coercitivo fueron sembrando las semillas de la destrucción del sistema. Dondequiera y cuando
quiera que se practique la coerción, el resultado final es la pérdida de apoyo al sistema por parte de
quienes la sufrieron. En todos los entornos coercitivos, los coaccionados eventualmente encuentran
formas de volverse contra los coercitivos. Se había desarrollado una relación de confrontación entre
alumnos y maestros, y las antiguas víctimas, ahora padres, ya no apoyan el sistema contra sus hijos.
(Southman, 2001, p. 107)
Control aversivo de la conducta 235
RESUMEN DEL CAPÍTULO
En ambos casos, el castigo se define por una probabilidad reducida de respuesta después de un
procedimiento de castigo. Vimos que el castigo es relativo y se hace más efectivo con la entrega
Este capítulo
abrupta, intensa puso de relieve
e inmediata dellascastigador.
principalesElcontingencias
cronograma delde control
castigoaversivo.
(continuo Lasescontingencias
el más
aversivas
efectivo), básicas se reducida
la efectividad esbozarondelenreforzador
términos de castigoque
positivo positivo y negativolayrespuesta
es mantener refuerzo negativo.
que se Se
deseamuestra queyellacastigo
disminuir, es complejo
disponibilidad en la forma de
de alternativas en que se concibe,
respuesta analiza
también y aplica.
mejoran También se ha
la regulación
de lademostrado
conducta porque es una parte
contingencias de desafortunada
castigo. de la experiencia de la vida. El castigo positivo
produce o añade un evento o estímulo que disminuye la frecuencia de una conducta operante. El
castigo negativo elimina un estímulo y da como resultado una disminución en la respuesta.
A continuación, pasamos al control de la conducta mediante el refuerzo negativo. Una
respuesta que elimina un estímulo aversivo y da lugar a un aumento en la frecuencia de esa
respuesta es el proceso de refuerzo negativo. Se identificaron dos tipos de refuerzo negativo
como escape y evitación, con la única diferencia de la presencia de aversivo en el primero. La
sección sobre la evitación introdujo las explicaciones moleculares y molares del rendimiento del
programa en términos de análisis, el paradigma de la supresión condicionada y la interrupción
del comportamiento operante en curso por períodos de evitación programada.
Luego nos centramos en los efectos secundarios del control aversivo, y observamos que la
conducta de evitación es persistente porque la evitación operante a menudo impide la extinción
del estímulo que está condicionado al miedo. Un efecto de persistencia similar se observó con la
exposición a castigos ineludibles y la indefensión aprendida. Después de una historia de choques
ineludibles, los animales no aprendieron a escapar de choques posteriores; Las personas y otros
animales no emiten respuestas que podrían eliminar los eventos punitivos (indefensión). Se
abordaron las implicaciones de la indefensión aprendida para la depresión clínica y su base neural
en la derrota social. La agresión desplazada y la de contracontrol se analizaron como efectos
secundarios del control aversivo. El análisis mostró que la agresión engendra agresión, y la
investigación sobre la agresión humana apoyó esta observación. De hecho, las personas que
controlan el comportamiento mediante el castigo a menudo se convierten en castigadores
condicionados (perturbación social).

Por último, analizamos brevemente el análisis de la coerción y sus consecuencias realizado por
Murray Sidman, haciendo hincapié en cómo el control coercitivo puede llevar a las personas a
abandonar la sociedad y a los adolescentes a abandonar el sistema escolar. La respuesta a este
problema es reducir el control coercitivo en la sociedad y en las escuelas, al tiempo que se
aumenta la regulación de la conducta mediante el refuerzo positivo.
236 Control aversivo de la conducta
Palabras clave Evitación no discriminada
Sobrecorrección
Estímulo aversivo Permanencia de la pena
Evitación Castigo positivo
Coacción Estímulo aversivo primario
Contracontrol Castigador
Estímulo aversivo condicionado (Ahorrar) Castigo
Evitación discriminada Relatividad del castigo
Agresión desplazada Costo de respuesta
Escapar Respuesta: intervalo de choque (RSI)
Validez externa Agresión inducida por el horario
Indefensión aprendida
Microagresión En la Web
Cuenta molar del rendimiento del programa
Choque: intervalo de choque (SSI)
Cuenta molecular del rendimiento de la
programación Evasión de Sidman
Castigo negativo Disrupción social
Refuerzos negativos Tiempo de espera desde la evasión
Reforzador negativo Tiempo de espera desde el refuerzo positivo
Debate sobre el uso del castigo
http:// Mor allo wgro und.com/ 2011/ 08/ 16/ kevin-elizab eth-sch atz-christ ian-fund amen tali sts-span ked-7-year-
old-daugh ter-to-death-beca use-god - Este es un enlace a la historia de CNN y al videoclip sobre Kevin y Elizabeth
Schatz, los fundamentalistas cristianos que azotaron a su hija de 7 años hasta la muerte. Discuta el uso generalizado del castigo
corporal en nuestra sociedad.

www.ppc.sas.upenn.edu/ publi cati ons.htm el Dr. Martin Seligman, quien realizó la investigación original sobre la indefensión
aprendida, ha recurrido a la psicología positiva, enfatizando los comportamientos relacionados con la felicidad y el bienestar.
Investiga su sitio web en el Centro de Psicología Positiva de la Universidad de Pensilvania.

www.teache rvis ion.com/ les son-plans / les son-10155.html Este sitio está dedicado al Arte de la Enseñanza por el Consejo
para Niños Excepcionales. La página web incluye consejos para el manejo del comportamiento y consejos para maestros,
incluyendo técnicas de disciplina y comportamiento en el aula, formularios y gráficos. Aprenda a usar el manejo positivo del
comportamiento en lugar del castigo para manejar el comportamiento.

www.jove.com/ video/ 4367/ the-resid El paradigma del intruso residente del Dr. Koolhass y sus colegas de la Universidad
de Groningen se utiliza para estudiar el comportamiento agresivo en ratas y puede utilizarse para inducir el estrés de derrota
social para estudios de comportamiento conductual. neurociencia y neurobiología. Este sitio web muestra el protocolo básico de
intrusos residentes utilizado para la investigación básica. Los estudios de agresión o derrota social en ratas deben pasar la revisión
ética de un comité de ética de la universidad, y los investigadores deben demostrar que los beneficios científicos de dichos
estudios superan la angustia y el daño potencial a los animales. Antes de llevar a cabo la investigación, se establecen criterios
para la inducción de la agresión y la retirada de los animales para prevenir o tratar las lesiones resultantes de ataques violentos.
Control aversivo de la conducta 237
Breve cuestionario
1 En cuanto a los estímulos aversivos, los ataques y los malos olores son _ _ _ , mientras que las amenazas y las calificaciones
reprobatorias son _
___________.
a potente; impotente b
natural; secundario c primario;
condicionado d primitivo; culto
2 Castigo:
a. aumenta el comportamiento del que depende
b. disminuye el comportamiento del que depende
c. no funciona
d. debe usarse siempre que sea posible

También podría gustarte