Está en la página 1de 32

UNIVERSIDAD DE CHILE

DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

Sobre el estado del conocimiento para el uso del castigo:


implicaciones para el tratamiento de los trastornos del
comportamiento
Dorothea C. Lerman y Christina M. Vorndran (2002)
Traducido por Francisca Diaz, Javier Bustamante, Gabriel González-Aravena, Fernanda
Sánchez y Gustavo Munro (2017)

En este artículo se revisarán los hallazgos de los experimentos básicos y aplicados


sobre el castigo, además se discutirá la importancia de llevar a cabo más investigaciones
sobre esta área. Las características de las respuestas durante el castigo y numerosos factores
que interactúan con los procesos básicos se delinean en conjunto con las implicancias para el
tratamiento de trastornos de la conducta en grupos clínicos. Llegamos a la conclusión de que
es necesario comprender de mejor forma los procesos de castigo, pues permitirá desarrollar
técnicas altamente sistemáticas y efectivas para el cambio de comportamiento, incluyendo
estrategias para mejorar la eficacia de los procedimientos menos invasivos y para detener
exitosamente el tratamiento.

Palabras clave: trastornos del comportamiento, análisis funcional, castigo, tratamiento

El castigo generalmente es definido como un cambio en el ambiente que tiene


contingencia (ya sea positiva o negativa) con el comportamiento, cuyo efecto es la
disminución de la respuesta en el tiempo (Michael, 1993). Se ha desarrollado numerosos
procedimientos de castigo para su uso clínico. Las investigaciones sobre el uso del castigo en
poblaciones clínicas han demostrado que este es eficaz en la reducción de los problemas de
comportamiento, e incluso en algunos casos, el castigo puede ser un componente esencial del
tratamiento (ver Kazdin, 2001, y O'Brien, 1989, para una revisión de esta literatura). Sin
embargo, se necesita más información sobre los factores que pueden influir en los efectos del
castigo sobre la conducta problema. Se han identificado pocas estrategias para mejorar la
eficacia de los procedimientos de castigo menos intrusivos, para la disminución de los
aspectos indeseables del castigo, o para la extinción con éxito de la conducta problema
mediante el tratamiento de castigo.
Los efectos directos e indirectos sobre el castigo han sido ampliamente estudiados en
los laboratorios, y a pesar de que aún existen importantes lagunas en el conocimiento en esta
área, las investigaciones básicas sobre este tema han ido disminuyendo rápidamente con el
tiempo (Baron, 1991; Crosbie, 1998). Es cuestionable el poder generalizar los
descubrimientos y los problemas de las investigaciones básicas hacia las poblaciones clínicas
(Hayes y McCurry, 1990). Pues la mayoría de los estudios básicos evaluaron los efectos de
los castigos intensos e incondicionados (por ejemplo, una leve descarga eléctrica), y una serie
de relaciones importantes entre ello, pero esto todavía no ha sido replicado con humanos o
con castigadores que puedan ser clínicamente relevantes.

1
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

El propósito de este trabajo es revisar los hallazgos de las investigaciones básicas y


aplicadas sobre el castigo, identificar los vacíos en la literatura, y discutir las implicancias de
estos hallazgos para la aplicación del castigo en el ámbito clínico. Se destacan los hallazgos
en investigaciones básicas que se encuentran en los libros de texto y documentos de revisión
que contradicen las suposiciones comunes sobre los efectos del castigo y que ayudan a aclarar
los resultados inconsistentes sobre el castigo en la literatura aplicada. La premisa principal de
este trabajo es que una mayor comprensión de los procesos de castigo puede conducir a una
mejora en las técnicas para producir cambios de comportamiento. Ampliamos las más
recientes revisiones bibliográficas sobre el castigo (Matson y DiLorenzo, 1984; Van Houten,
1983) con el objetivo de; (a) proporcionar una visión más amplia de los efectos directos e
indirectos del castigo y los factores que influyen en estos procesos básicos (e.g., historia), (b)
identificar las áreas que necesitan más literatura tanto de investigaciones básicas como
aplicadas, y (c) discutir los últimos resultados de las investigaciones sobre castigo en el
contexto de los avances en el análisis funcional de la conducta.
Algunos autores han sugerido que la investigación aplicada adicional sobre el castigo
es innecesaria a la luz de los refinamientos de las metodologías de análisis funcional y el
tratamiento con refuerzo (Donnellan y LaVigna, 1990; Guess, Helmstetter, Turnbull, y
Knowlton, 1987). Los resultados de numerosos estudios realizados en los últimos 15 años
han demostrado que la función del comportamiento problema a menudo puede ser aprendida
y que esta información puede ser utilizada para desarrollar tratamientos basados en la
extinción, refuerzo, y otros procesos, tales como el establecimiento de operaciones (por
ejemplo, Iwata, Pace, Dorsey, et al., 1994). Sin embargo, el castigo puede ser crítico para el
éxito del tratamiento cuando las variables que mantienen los problemas de comportamiento
no pueden ser identificadas o controladas (para discusión adicional, ver Axelrod, 1990; Iwata,
Vollmer, y Zarcone, 1990; Vollmer y Iwata, 1993). El castigo también puede ser preferible a
los tratamientos en base a refuerzo cuando el comportamiento problema debe ser suprimido
rápidamente para evitar un daño físico grave (Dura, 1991; véase también Iwata et al.;
Vollmer y Iwata). Más importante, los resultados de varios estudios indican que los
tratamientos derivados de los análisis funcionales (por ejemplo, reforzamiento diferencial de
conductas alternativas [DRA]) no siempre pueden reducir el comportamiento a niveles
clínicamente aceptables sin un componente de castigo (por ejemplo, Grace, Kahng, y Fisher,
1994; Hagopian, Fisher, Sullivan, Acquisto, y LeBlanc, 1998; Wacker et al., 1990).
El conocimiento sobre el castigo también es importante porque los tratamientos
comunes que están asociados con otros procesos pueden de hecho reducir la conducta
problemática a través del mecanismo del castigo. Por ejemplo, procedimientos tales como el
bloqueo de la respuesta, el cumplimiento de guiado, y la aplicación de equipo de protección,
a menudo se supone que reducen los problemas de comportamiento mediante la la
contingencia negativa del refuerzo que mantiene la respuesta (es decir, a través de extinción;
por ejemplo, Reid, Parsons, Phillips, y Green, 1993; Rincover, 1978). Hallazgos de
investigaciones sugieren que estas variaciones del procedimiento de extinción pueden
funcionar como castigo en lugar de, o en combinación con, la extinción (por ejemplo, Lerman
y Iwata, 1996b; Mazaleski, Iwata, Rodgers, Vollmer, y Zarcone, 1994). Algunos autores
también han sugerido que la pérdida contingente de refuerzo asociada a los procedimientos

2
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

de reforzamiento diferencial (por ejemplo, reforzamiento diferencial de otras conductas


[DRO]) podría constituir una forma de castigo (por ejemplo, Rolider y Van Houten, 1990).
Por lo tanto, el proceso de castigo puede ser la base de una serie de populares tratamientos
basados en la función.
La metodología del análisis funcional ahora permite investigaciones más precisas
sobre las relaciones importantes entre el entorno y el comportamiento en el ámbito del
castigo. Los hallazgos básicos indican que varios parámetros de refuerzo influyen en los
efectos directos e indirectos del castigo e interactúan con casi todos los demás factores que se
ha encontrado que influyen en la respuesta durante el castigo (por ejemplo, programa de
castigo y magnitud). Dichas interacciones tienen implicancias clínicas importantes porque es
más probable que el castigo se use cuando la relación respuesta-reforzador no puede ser
terminada completamente. En los estudios aplicados, las variables de refuerzo importantes,
identificadas a través del análisis funcional, podrían ser manipuladas antes y durante el
castigo, incluso cuando el comportamiento se mantiene por consecuencias no sociales (es
decir, el comportamiento se mantiene en ausencia de reforzadores socialmente mediados,
como la atención, artículos tangibles y escape de instrucciones; véase, por ejemplo, Lerman y
Iwata, 1996b).
Temas importantes relacionados con la ética y la aceptabilidad del uso del castigo
para tratar el comportamiento problemático en individuos con trastornos del desarrollo han
sido objeto de numerosos artículos en los últimos 30 años. Una visión general de estas
cuestiones está más allá del alcance de este documento, pero puede encontrarse en una
variedad de fuentes (véase Donnellan y LaVigna, 1990; Emerson, 1992; Guess et al., 1987;
Jacob-Timm, 1996; Sidman, 1989; Van Houten et al., 1988). A lo largo de este documento se
hacen sugerencias para futuras investigaciones aplicadas sobre el castigo, con la suposición
de que las guías y precauciones pertinentes sobre la aplicación del castigo acompañarán los
resultados de la investigación publicada (véase Alberto y Troutman, 1999; Lovaas y Favell,
1987; Matson y DiLorenzo, 1984).
Por último, los consumidores de las tecnologías conductuales (por ejemplo, clínicos,
cuidadores) determinarán que tratamientos son usados con sujetos con dificultades del
desarrollo (ver Iwata, 1988, para una discusión convincente de este tema). Estas decisiones
están al menos en parte guiadas por la información generada por la comunidad científica.
Tecnologías seguras, aceptables y altamente efectivas de cambio de comportamiento deben
estar disponibles para los consumidores que las soliciten, incluyendo procedimientos basados
en el castigo.
En la primera mitad de este artículo se discutirán hallazgos básicos y aplicados sobre
factores clínicamente relevantes que afectan los efectos directos del castigo. En la segunda
mitad se discutirán otras características de las respuestas castigadas, incluyendo su
mantención, generalización y efectos secundarios.

Factores que influyen en los efectos directos de castigo


Gran parte de la investigación básica sobre los efectos directos de castigo fue llevada
a cabo hace más de 30 años con no humanos (véase Azrin y Holz, 1966, para una revisión de
esta literatura). Variaciones en el procedimiento de castigo examinados en el laboratorio han

3
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

incluido la entrega de estímulos, a menudo llamados castigo positivo, y la eliminación de los


estímulos, a menudo llamado castigo negativo (por ejemplo, costo de respuesta, retirada del
refuerzo positivo). Sin embargo, la mayoría de los estudios empleó una descarga eléctrica
contingente. En los primeros estudios básicos, se evaluaron los efectos del castigo mientras
que la respuesta castigada estaba pasando por extinción (por ejemplo, Estes, 1944; Skinner,
1938; Thorndike, 1932). Sin embargo, en la mayoría de los estudios posteriores, se
introdujeron contingencias de castigo sin cambio en el programa de refuerzo prevaleciente.
Esta última disposición aseguró cierto nivel de respuesta para examinar los efectos del
castigo independientemente de los producidos por la extinción (Azrin y Holz, 1966). Las
interacciones complejas entre los procesos de refuerzo y castigo también podrían ser
evaluados. Varios autores sugieren que este arreglo de laboratorio puede ser más pertinente a
la aplicación, ya que el castigo es más probable que se utilice cuando el reforzador que
mantiene la conducta problema no pueda ser identificado o controlado (Azrin y Holz, 1966;
Dinsmoor, 1952).
De hecho, la función del comportamiento problema no se determinó antes del
tratamiento en la mayoría de los estudios clínicos sobre el castigo. Por lo tanto, el castigo se
ha superpuesto a un programa de refuerzo desconocido que probablemente tomó la forma de
extinción cuando el comportamiento era mantenido por consecuencias sociales (Iwata, Pace,
Cowdery, y Miltenberger, 1994). Es decir, las consecuencias sociales que pueden haber
mantenido la respuesta durante la línea base (por ejemplo, reprimendas verbales, escape de
instrucciones) a menudo se eliminaron con la introducción del castigo. Por lo tanto, una parte
sustancial de los hallazgos aplicados puede tener poca generalidad hacia los enfoques de
tratamiento actuales, porque es más probable que se utilice el castigo cuando el
comportamiento problemático sigue produciendo un refuerzo. Hallazgos básicos sugieren que
los parámetros básicos de refuerzo pueden influir en los efectos del castigo de manera
importante.

Los efectos directos del castigo


Los hallazgos de investigación básica han demostrado que leves descargas eléctricas,
ruidos, soplos de aire, costo de respuesta y ‘tiempo fuera’ contingentes con la respuesta,
pueden producir una disminución rápida en la frecuencia del comportamiento y, en algunos
casos, pueden conducir a una supresión completa de la respuesta en ratas, palomas, monos y
humanos (por ejemplo, estudiantes universitarios, pacientes psiquiátricos, Azrin, 1960;
Crosbie, Williams, Lattal, Anderson y Brown, 1997). Varios estudios con animales humanos
y no humanos también encontraron que los efectos reductores iniciales del castigo con
descargas o pérdida de puntos ocurrieron más rápidamente o en mayor medida que los
producidos por la extinción, saciedad y refuerzo diferencial (por ejemplo, Holz y Azrin,
1963; Johnson, McGlynn y Topping, 1973; Rawson y Leitenberg, 1973).
El beneficio potencial de utilizar castigo para el tratamiento de problemas de conducta
intratables condujo al desarrollo de numerosos procedimientos de castigo para el uso clínico.
Los resultados de las investigaciones han demostrado que tratamientos que utilizan una
amplia variedad de castigos (por ejemplo, reprimendas verbales, restricción, niebla de agua,
jugo de limón, leves descargas, la eliminación de actividades reforzantes o reforzadores

4
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

condicionados) pueden producir una supresión inmediata y considerable de los


comportamientos problemáticos (ver Kazdin de 2001; y Matson y DiLorenzo, 1984, para
revisiones de esta literatura). Los hallazgos aplicados también indican que los efectos del
castigo son superiores a los obtenidos con procedimientos menos intrusivos por sí solos,
como el refuerzo diferencial (por ejemplo, Barrett, Matson, Shapiro y Ollendick, 1981; Favell
et al., 1982; Scotti, Evans, Meyer y Walker, 1991). Aunque los resultados de tales
comparaciones son consistentes con los obtenidos en el laboratorio, los hallazgos son difíciles
de interpretar debido a que numerosos parámetros probablemente influyen en los efectos de
estos procedimientos reductores del comportamiento. Por ejemplo, un programa denso de
refuerzo diferencial puede reducir el comportamiento de manera más efectiva que un
castigador leve.
Más importante aún, la eficacia relativa de un tratamiento con refuerzo versus castigo
probablemente depende de una variedad de factores (por ejemplo, historia, uso de la
extinción, tipo, cantidad y programa de la consecuencia). Estas interacciones complejas
necesitan ser evaluadas para generar resultados más definitivos sobre los efectos supresores
del castigo en relación con otros procedimientos. Investigaciones adicionales sobre
estrategias para mejorar la eficacia del castigo serían más pragmáticas a largo plazo que los
estudios comparativos adicionales y complejos de refuerzo versus castigo.
Varios autores han sugerido que el tratamiento con castigo es tan eficaz porque por lo
general el castigo puede competir exitosamente con las contingencias de refuerzo que
mantienen los comportamientos problemáticos (por ejemplo, Van Houten, 1983). Aunque en
investigaciones aplicadas a menudo se confundió inadvertidamente el castigo con extinción,
estudios recientes han mostrado que los procedimientos comunes de castigo (por ejemplo,
‘tiempo fuera’, breve restricción manual) pueden ser eficaces en ausencia de extinción
(Fisher, Piazza, Bowman, Hagopian, y Langdon, 1994; Lerman, Iwata, Shore, y DeLeon,
1997; Thompson, Iwata, Conners, y Roscoe, 1999). Las reducciones en el comportamiento se
obtuvieron incluso después de intentos fallidos de tratar el comportamiento con
procedimientos menos intrusivos (por ejemplo, Fisher et al., 1993; Lindberg, Iwata, y Kahng,
1999).
Sin embargo, la generalidad de estos hallazgos puede ser limitada porque los datos
sobre tratamientos efectivos tienen más probabilidades de ser publicados que aquellos que
muestran resultados no exitosos. Los parámetros de refuerzo potencialmente importantes
tampoco fueron especificados en estos estudios. Los resultados de los análisis funcionales
previos al tratamiento indicaron que el comportamiento se mantuvo independiente de las
consecuencias sociales, pero no aíslan el refuerzo preciso que mantiene los comportamientos
problemáticos. En varios estudios se han examinado métodos para identificar el tipo de
refuerzo no social (a menudo denominado refuerzo automático) que está relacionado
funcionalmente con el comportamiento problemático (por ejemplo, Goh et al., 1995;
Kennedy y Souza, 1995; Patel, Carr, Kim, Robles y Eastridge, 2000; Piazza, Adelinis,
Hanley, Goh y Delia, 2000). Aunque se necesitan más refinamientos metodológicos, estas
estrategias pueden ser útiles para identificar y manipular diversos parámetros de refuerzo (por
ejemplo, programa y magnitud de refuerzo) mientras se trata con castigo el comportamiento
problemático reforzado automáticamente (por ejemplo, Lerman e Iwata, 1996b). Como se

5
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

describe con más detalle a continuación, los resultados de estudios que emplean este tipo de
manipulaciones con comportamientos mantenidos ya sea por consecuencias sociales o no
sociales podrían conducir a una mayor comprensión de los procesos de castigo y tratamientos
mejorados.
Como se discutirá en las siguientes secciones, se ha encontrado que una serie de
factores directamente relevantes para el desarrollo de una tecnología aplicada influyen en los
efectos directos del castigo. Estos factores incluyen variables históricas (por ejemplo,
experiencia previa con el estímulo de castigo o refuerzo intermitente); el uso de castigos
condicionados; variables de refuerzo (por ejemplo, programa, disponibilidad de fuentes
alternativas de refuerzo); y variables de castigo (por ejemplo, magnitud, inmediatez,
programa). Sin embargo, gran parte de la investigación sobre estos factores se ha realizado en
el laboratorio básico y nuestro conocimiento de algunas relaciones complejas importantes es
relativamente incompleto (Baron, 1991).

Historia
Los hallazgos básicos indican que la exposición previa a ciertos factores puede alterar
la respuesta durante el castigo, fenómeno que es especialmente relevante para la aplicación
del castigo, porque las poblaciones clínicas suelen tener diversas historias de aprendizaje. Los
resultados de numerosos estudios básicos han demostrado que la experiencia previa con el
estímulo punitivo (que se utiliza como castigo) ya sea contingente o no a la respuesta, puede
disminuir la sensibilidad del castigo y disminuir sus efectos (por ejemplo, Capaldi, Sheffer,
Viveiros, Davidson y Campbell, 1985; Halevy, Feldon y Weiner, 1987). Por ejemplo, los
hallazgos de la investigación con ratas indican que la exposición al castigo intermitente con
leves descargas eléctricas disminuye la eficacia del posterior castigo con descargas leves pero
continuas, incluso cuando transcurren varios días o semanas entre el castigo intermitente y
continuo (Banks, 1967; Halevy et al.; Shemer y Feldon, 1984). Deur y Parke (1970)
replicaron este efecto en niños con desarrollo normal utilizando un zumbador fuerte como
estímulo de castigo.
Aunque la adaptación al estímulo punitivo puede explicar estos hallazgos (Capaldi et
al., 1985), se ha obtenido una relación similar con el refuerzo intermitente. Es decir, las ratas
y los estudiantes universitarios que para una respuesta presentaron un historial de refuerzo
intermitente, mostraron menor supresión de esta conducta cuando se les aplicó castigo
continuo o intermitente con descargas leves, en comparación a los participantes con una
historia de refuerzo continuo (por ejemplo, Brown y Wagner, 1964; Estes, 1944; Halevy et al,
1987; Vogel-Sprott, 1967). Además, Eisenberger, Weier, Masterson y Theis (1989)
encontraron que la resistencia al castigo con descargas leves aumentó para una respuesta
(presión de palanca) en ratas, después de que una situación topográficamente diferente fue
expuesta a refuerzo intermitente.
En situaciones clínicas, es probable que un individuo experimente castigos comunes,
(reprimendas verbales, ‘tiempo fuera’) antes de que estas consecuencias estén
específicamente arregladas para tratar un comportamiento inapropiado en particular. Además,
la exposición a programas intermitentes de refuerzo y castigo es típica en el entorno natural.
A menudo se entregan consecuencias en programas intermitentes porque es difícil para los

6
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

padres y maestros reforzar o castigar cada vez que se ejecuta un comportamiento. Cuando los
intentos iniciales de tratar un comportamiento con castigo intermitente fracasan, los
cuidadores pueden cambiar a un programa continuo de castigo en un intento de mejorar la
eficacia del tratamiento. Los hallazgos básicos indican que una historia con castigo
intermitente puede complicar el éxito del tratamiento en estos casos, de tal manera que se
requerirán castigadores más intensos para suprimir el comportamiento de manera efectiva
(Halevy et al., 1987; Shemer y Feldon, 1984). Sin embargo, se desconoce la relevancia de
estos hallazgos para los tipos de castigos que se usan más comúnmente en entornos clínicos
porque casi todos los estudios básicos en esta área evaluaron los efectos de leves descargas
eléctricas y ningún estudio aplicado ha replicado y extendido estos hallazgos a
comportamientos problemáticos.
Sin embargo, los hallazgos básicos en esta área sugieren algunas pautas importantes
para la investigación clínica y la práctica. En primer lugar, puede ser beneficioso para los
cuidadores identificar castigos novedosos al diseñar los tratamientos y evitar el uso de
consecuencias comunes, tales como reprimendas verbales y tiempo-fuera de manera no
sistemática o no planificada. En segundo lugar, no deben aplicarse programas de castigo
intermitentes antes de programas continuos. En tercer lugar, si la adaptación al estímulo de
castigo explica la disminución de la sensibilidad del comportamiento (Capaldi et al., 1985),
puede resultar útil un breve intervalo de castigo, tal como se describe con más detalle a
continuación (Rachlin, 1966). Otra estrategia potencialmente útil para minimizar la
exposición a cualquier castigador único es alternar entre varios procedimientos de castigo
eficaces en lugar de usar un solo procedimiento (por ejemplo, Charlop, Burgio, Iwata y
Ivancic, 1988).

Estímulos Condicionados
Estímulos neutrales que son emparejados con estímulos de castigo pueden adquirir las
propiedades de dicho estímulo castigador. Resultados de estudios básicos indican que estos
estímulos condicionados pueden funcionar como castigadores cuando son entregados
contingentemente con el comportamiento en ausencia del estímulo primario o incondicionado
(e.g., Hake y Azrin, 1965). Los castigadores condicionados pueden ser útiles en incrementar
tanto la efectividad como la aceptación del castigo dentro de un contexto clínico. Suponga
que una consecuencia relativamente no intrusiva, pero ineficaz (e.g., una breve clave verbal)
fue establecida y mantenida como un potente castigador condicionado vía emparejamientos
intermitentes con una intervención más restrictiva y lenta (e.g., sobre corrección, tiempo-
fuera). La aplicación del castigador condicionado debería reducir tanto la exposición de los
individuos a la intervención del castigador incondicionado como también el grado de
esfuerzo requerido por los cuidadores para implementar el tratamiento, factores que podrían
evitar problemas con la inconsistencia del programa, habituación al castigador
incondicionado, y problemas éticos asociados con el uso de algunos procedimientos.
Varios estímulos han sido establecidos como castigadores condicionados en
laboratorios básicos, incluyendo tonos, luces, y descargas eléctricas más leves de lo habitual
(e.g., Crowell, 1974; Davidson, 1970; Hake y Azrin, 1965). El estímulo incondicionado fue
una leve descarga eléctrica (excepto en algunos casos, e.g., Trenholme y Baron, 1975) y los

7
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

sujetos fueron ratas o palomas. Los castigadores condicionados fueron establecidos por dos
métodos principales. Bajo uno de los métodos, el estímulo condicionado era presentado antes
del comienzo de un estímulo inescapable (e.g., las descargas eran entregadas de forma
independiente de las respuestas) para luego ser removido con el comienzo del estímulo
incondicionado (e.g., Hake y Azrin 1965; Mowrer y Solomon, 1954), o bien el estímulo
condicionado era mantenido en el ambiente mientras se entregaba el estímulo incondicionado
periódicamente (e.g., Orme-Johnson y Yarczower, 1974). Los resultados de los distintos
estudios indicaron que había un mayor condicionamiento si el estímulo condicionado era
presentado antes de la ocurrencia del estímulo incondicionado en vez de forma simultánea o
posterior a la presencia de dicho estímulo incondicionado (e.g., Evans, 1962; Mowrer y
Aiken, 1954).
Bajo el otro método, el estímulo condicionado fue establecido como un estímulo
discriminador para el castigo. Es decir, la presencia del estímulo condicionado era
correspondido con la entrega del estímulo incondicionado contingente a la respuesta (e.g.,
Davidson, 1970). Aunque posteriormente se ha observado que el estímulo discriminativo
suprime la respuesta cuando es entregado contingentemente con el comportamiento, los
resultados de Orme-Johnson y Yarczower (1974) indican que el estímulo establecido como
discriminativo era mucho menos efectivo que los castigadores condicionados establecidos en
el método anterior. Independiente del método de condicionamiento utilizado, las
investigaciones han mostrado que los efectos de los castigadores condicionados en el
comportamiento son temporales, a menos que el estímulo condicionado e incondicionado
continúen estando emparejados en algún grado (Davidson, 1970; Hake y Azrin, 1965).
Unos pocos estudios básicos han evaluado los factores que aparentemente influencian
el proceso de condicionamiento, como la magnitud del estímulo incondicionado (Mowrer y
Solomon, 1954) y la duración del estímulo condicionado (Hake y Azrin, 1965). Sin embargo,
otros parámetros clínicamente relevantes del condicionamiento, como el número de
emparejamientos entre el estímulo condicionado e incondicionado, el tipo de castigador
incondicionado usado, y las características del estímulo condicionado (e.g., intensidad o
saliencia), deberían ser examinados en futuras investigaciones. Adicionalmente, los estímulos
condicionados típicamente fueron establecidos y mantenidos independientes de la respuesta,
un método que posiblemente involucraría preocupaciones éticas si se extendiera a
poblaciones clínicas. Aunque podría ser más aceptable el emparejar estímulos condicionados
e incondicionados contingentemente con los problemas de conducta, las oportunidades para
condicionar el estímulo se verían severamente restringidas si el castigador incondicionado
suprime el problema conductual a niveles bajos.
El uso de castigadores condicionados en el tratamiento de problemas conductuales ha
sido reportado, sorprendentemente, en muy pocos estudios aplicados. Más importante aún,
ningún estudio aplicado se ha centrado exclusivamente en el método para desarrollar y
mantener estímulos como castigadores condicionados en contexto clínico. Lovaas y Simmons
(1969) emparejaron contingentemente la palabra “no” (estímulo condicionado) con una leve
descarga eléctrica (Estímulo incondicionado) en un paciente que presentaba un severo caso
de autolesión. La breve reprimenda verbal fue entonces presentada en ausencia del estímulo
incondicionado durante un limitado número de sesiones. Y los resultados sugieren que el

8
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

estímulo condicionado había adquirido las propiedades sorpresivas del castigador original. En
una evaluación más exhaustiva, Dorsey, Iwata, Ong, y McSween (1980) emparejaron
contingentemente la palabra “no” con niebla de agua con dos participantes que comenzaron a
autolesionarse. Los resultados muestran que la presentación contingente del estímulo verbal
mantuvo bajos niveles de autolesión cuando la niebla de agua fue retirada del contexto de
tratamiento original. A su vez, los efectos sorpresivos de la reprimenda verbal se
generalizaron a una configuración que no había sido previamente asociada con el
procedimiento de la niebla de agua, así como también, a otros terapeutas que nunca habían
utilizado la niebla de agua. Finalmente, Dixon, Helsel, Rojahn, Cipollone, y Lubertsky (1989)
emparejaron un castigador más suave e inefectivo (pantalla visual) con un castigador más
efectivo (el hedor del amoniaco) mientras trataban la agresión y disrupción mostrada por un
joven con trastorno del desarrollo. Los problemas conductuales se mantuvieron suprimidos
por un corto tiempo cuando la pantalla visual fue usada sola.
Aunque los resultados de estos tres estudios indican que los castigadores
condicionados fueron establecidos exitosamente en problemas clínicos, la eficacia del
tratamiento fue evaluada a lo largo de un limitado número de sesiones cortas. Estudios
básicos han mostrado que los efectos de los castigadores condicionados en la conducta son
temporales a menos que el estímulo condicionado e incondicionado continúen asociados de
alguna manera (Davidson, 1970; Hake y Azrin, 1965). Adicionalmente, los detalles
necesarios para replicar el procedimiento de condicionamiento (e.g., método de
emparejamiento, número total de emparejamientos, reglas para determinar cuándo testear el
efecto condicionado) no fueron proporcionados. La generalidad de estos hallazgos y aquellos
obtenidos en los laboratorios básicos puede también estar limitada por el uso de castigadores
incondicionados relativamente intrusivos (es decir, descargas pequeñas, niebla de agua,
amoniaco).
En consecuencia, el conocimiento actual sobre castigadores condicionados se
encuentra mayoritariamente incompleto, y las prescripciones para la aplicación de
castigadores condicionados debe esperar futuras investigaciones. La eficacia de emparejar
varios tipos de estímulos, auditivos, táctil y visual deben ser evaluadas con formas más
comunes y socialmente aceptables de castigo (e.g., tiempo fuera). El número de
emparejamientos requeridos para producir condicionamiento, así como los factores que
pueden alterar el resultado del condicionamiento (e.g., intensidad del estímulo condicionado)
pueden ser evaluados mediante el testeo periódico de los efectos de supresión del estímulo
condicionado en ausencia del castigador incondicionado. La durabilidad del
condicionamiento podría ser determinada mediante la presentación del estímulo condicionado
en ausencia del castigador incondicionado hasta que los efectos en la respuesta se disipen.
Esta estrategia puede también ser útil cuando se desarrolla un programa de emparejamiento
para los estímulos condicionados e incondicionados con tal de mantener el condicionamiento
en el tiempo. Por ejemplo, personal clínico podría determinar el número máximo de veces
que un estímulo condicionado puede estar presente antes que los efectos condicionados
comiencen a extinguirse. Entonces, el estímulo condicionado e incondicionado podrían ser
emparejados regularmente antes dicho número,

9
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

Programa de refuerzo
Estudios básicos indican que las características de responder durante el castigo
pueden depender del programa de reforzamiento que mantiene la conducta, un factor
especialmente relevante para la aplicación ya que es probable que los problemas en la
conducta sean mantenidos por alguna forma de refuerzo durante el tratamiento. La conducta
podría ser concurrentemente expuesta a programas de refuerzo cuando los cuidadores no
retengan completamente las consecuencias sociales durante el tratamiento, o cuando la
conducta es mantenida por refuerzo automático. Resultados de estudios básicos muestran
generalmente, que la cantidad de la supresión de la respuesta bajo castigo era inversamente
proporcional a la densidad del programa de refuerzo, siendo la extinción lo que provoca el
mayor decremento en la respuesta (Azrin y Holz, 1966). Varios parámetros del castigo (e.g.,
programa, intensidad) también parecen interactuar con la relación entre la supresión de la
respuesta y la densidad del refuerzo (Bouzas, 1977, 1978). Por ejemplo, Bradshaw y sus
colegas encontraron que la relación negativa entre la densidad del refuerzo y la supresión de
la respuesta era mucho más pronunciada cuando sujetos humanos eran expuestos a un
programa de castigo de pérdida monetaria de razón variable (RV) que a uno de intervalo
variable (IV).
Los programas de refuerzo intermitente examinados en el laboratorio han incluido
programas de intervalo fijo (IF), razón fija (RF), intervalo variable (IV), y razón variable
(RV). Aunque se ha observado que estos programas de refuerzo interactúan de forma
diferente con los efectos del castigo, dicha interacción no ha sido bien estudiada y es probable
que dependa en varios factores, como la densidad del refuerzo, el programa de castigo, la
cantidad de refuerzo perdido a raíz de la reducción en la respuesta (e.g., Powell, 1970; Scobie
y Kaufman, 1969; ver también Baron, 1991, para una mayor discusión). Las diversas formas
en que estos programas influencian los efectos del castigo son relevantes para una tecnología
aplicada, puesto que las contingencias sociales de los problemas de comportamiento a
menudo se aproximan a los arreglos de laboratorio en los ambientes naturales (e.g., Lalli y
Goh, 1993; Vollmer, Borrero, Wright, Van Camp, y Lalli, 2001). Estas complejas
interacciones entre programas de refuerzo y castigo también son, probablemente,
responsables de algunos de los inconsistentes hallazgos reportados en la literatura básica y
aplicada sobre el castigo (ver mayor discusión abajo). Adicionalmente, un mayor número de
estudios básicos en esta área son necesarios para clarificar estas relaciones.
El conocimiento sobre procesos básicos y prescripciones para mejores prácticas
cuando se utiliza castigo en situaciones clínicas estará incompleto sin una mayor evaluación
de la potencial interacción entre el programa de refuerzo y los parámetros del castigo. Sin
embargo, ningún estudio aplicado ha examinado los efectos del programa de refuerzo o la
densidad de este en el resultado de los tratamientos con castigo. Una mayor investigación
debería determinar si reducir la densidad del programa de refuerzo que opera en el ambiente
natural debería potenciar sustancialmente la eficacia de los procedimientos de castigo
comúnmente utilizados. De ser así, se necesitan estrategias para disminuir el programa de
refuerzo en tratamientos de problemas conductuales que utilicen castigo. Los parámetros bajo
los cuales el programa de refuerzo es y no es un factor importante cuando se tratan problemas

10
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

conductuales mediante castigo también debe ser evaluado. Parámetros potencialmente


relevantes incluyen el programa, el tipo, y la intensidad del castigador.
Aunque fuentes no sociales de refuerzo pueden ser difíciles de modificar (ver Lerman
e Iwata, 1996, para una aproximación), los resultados de esta aproximación investigativa
pueden conducir a una útil guía para el diseño efectivo y práctico de tratamientos cuando los
cuidadores se encuentren en dificultades o imposibilitados de retener refuerzos sociales en
situaciones de problemas de conducta. El conocimiento actual indica que el refuerzo para
problemas conductuales debería ser retenido o disminuido de ser posible. Así, por ejemplo,
cuando los cuidadores no puedan retener completamente el refuerzo durante el castigo (e.g.,
ignorar todas las instancias de autolesión), la densidad y magnitud del refuerzo para el
problema conductual debería ser disminuido y el castigo debiese ser entregado en un
programa continuo (ver mayor discusión abajo).

Disponibilidad de refuerzos alternativos


La mayoría de los textos y revisiones de literatura sobre la aplicación señalan los
beneficios de combinar el castigo con otros tipos de procedimiento de refuerzo, como DRA
(e.g., Cooper, Heron, y Heward, 1987; Matson y DiLorenzo, 1984). Estudios básicos con
ratas, palomas y pacientes psiquiátricos han mostrado que los efectos sorpresivos de una leve
descarga eléctrica, ruido o tiempo-fuera contingentes, fueron potenciados cuando el refuerzo
podía ser obtenido de una manera distinta, o en adición a participar en la respuesta castigada
(e.g., Boe, 1964; Herman y Azrin, 1964; Holz, Azrin y Ayllon, 1963; Rawson y Leitenberg,
1973). Aunque estos hallazgos sugieren que aumentar la densidad de refuerzos alternativos
puede aumentar la eficacia de castigadores leves en contextos clínicos, pocos estudios han
evaluado castigadores clínicamente relevantes o los parámetros bajo los cuales el refuerzo
puede proporcionar un beneficio óptimo durante el castigo.
En un estudio con palomas, Arzin y Holz (1966) reportaron que, por ejemplo, un
programa RF 25 de refuerzo alternativo no aumentó la sensibilidad al castigo cuando una
respuesta mantenida por el mismo programa de refuerzo fue castigada con descargas de bajo
voltaje (menos de 50 V). Sin embargo, es posible que un programa más denso de refuerzo
alternativo hubiese potenciado la eficacia de este castigador leve. Los resultados de un
estudio hecho por Fatino (1973) indican que los efectos beneficiosos de los refuerzos
alternativos fueron comprometidos cuando la razón del refuerzo proporcionada por un
programa IV concurrente anterior al castigo no podía ser obtenida mediante una respuesta
exclusiva a la alternativa no castigada. Los parámetros del castigo como el programa y
retraso y varios parámetros del refuerzo son altamente probables de modificar los efectos de
los refuerzos alternativos. Así, los hallazgos de investigaciones básicas sugieren que varios
factores (e.g., tipo o densidad del castigador, densidad del refuerzo disponible antes del
castigo) deben ser considerados cuando se combina refuerzo y castigo en un contexto clínico.
Sin embargo, otros arreglos de refuerzo comúnmente usados, como la no-contingencia
de refuerzo (NCR) y reforzamiento diferencial de bajas tasas de respuesta (DRL por su sigla
en inglés), no han sido evaluados por los laboratorios en el contexto de una contingencia de
castigo concurrente. Más importante aún, estos hallazgos básicos sobre los refuerzos
alternativos pueden tener una generalidad limitada a la aplicación a raíz de factores

11
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

clínicamente relevantes (e.g., topografía de la respuesta; calidad, programa retraso y


magnitud del refuerzo) se mantuvieron, usualmente, constantes a través de las opciones de
respuesta disponibles. Tratamiento con castigo y refuerzo diferencial incorporara,
típicamente, diferentes parámetros de respuesta, refuerzo, y castigo a través de los
comportamientos especificados, especialmente cuando un problema conductual es mantenido
por fuentes desconocidas o no controladas de refuerzo. En tales casos, el refuerzo alternativo
no podría suprimir la respuesta castigada ni aumentar el comportamiento adaptativo. El
resultado de estudios básicos en donde el programa de refuerzo y castigo fueron arreglados
para ambas opciones de respuesta también sugieren que la cantidad de la supresión provocada
por el castigo para un comportamiento dado puede ser influenciada por contingencias que
operan en otros comportamientos, incluyendo programas relativos, retraso, y magnitud del
refuerzo y castigo (e.g., Deluty, 1976, 1978; Farley, 1980).
A pesar de las obvias implicaciones clínicas, solo un estudio aplicado ha evaluado la
relación entre los efectos del castigo y la disponibilidad de refuerzo alternativo. Thompson et
al. (1999) examinaron los efectos separados y combinados del castigo y refuerzo en pacientes
de autolesión, luego de un análisis funcional se indicó que el comportamiento era mantenido
por un refuerzo automático. El refuerzo fue arreglado para un comportamiento alternativo
(manipulación de juguetes) al darle a los participantes acceso a juguetes preferidos
(estableciendo de este modo un jugar con juguete reforzado automáticamente) o al entregar
comida de forma contingente al utilizar el juguete. El resultado de los cuatro participantes
indica que el refuerzo alternativo potencia la eficacia de castigadores relativamente leves
(e.g., restricción breve de jugar con los juguetes). Además, el refuerzo por si solo fue bastante
inefectivo para todos los participantes, y el castigo por si solo fue inefectivo para un
participante. Sin embargo, el tratamiento combinado fue diferencialmente confundido con
una contingencia adicional (es decir, tiempo fuera del refuerzo positivo — el acceso al
refuerzo programado fue retenido durante el castigo) que puede restringir la generalidad de
estos hallazgos.
Se requiere de investigación adicional en las estrategias clínicas para potenciar la
eficacia de castigadores leves mediante el uso de procedimientos DRA, DRO, DRL y NCR.
Ya que hasta ahora, los estudios básicos en esta área sugieren una serie de prescripciones
tentativas de aplicación. Programas de refuerzo naturalistas para problemas específicos y
comportamiento alternativo deben ser considerados primero cuando se desarrollan
tratamientos que combinen refuerzo y castigo. En problemas conductuales mantenidos por
refuerzo, se debe identificar el tipo, programa y magnitud de este, para que una mayor
cantidad del mismo refuerzo pueda ser proporcionada independiente de respuestas
indeseables o contingentes a comportamientos alternativos (Fantino, 1973). Cuando el
reforzador funcional no pueda ser identificado o entregado por otros, seleccionar refuerzos
que compiten o sustituyen la mantención de reforzadores puede ser crítico en la generación
de un tratamiento efectivo (e.g., Shore, Iwata, DeLeon, Kahng, y Smith, 1997).
A su vez, han de determinarse todas las posibles fuentes de refuerzo disponible antes
del tratamiento, de modo que se puedan tomar las medidas necesarias para asegurar que la
cantidad total del refuerzo obtenible pueda ser entregado o superado a pesar de la reducción
en la conducta castigada. Para este fin, procesos de refuerzo diferenciales deberían enfocarse

12
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

en afectar respuestas simples de operante libre o conductas adaptativas que ya se encuentran


en el repertorio del sujeto. Procedimientos como el NCR, DRO y DRL, los cuales no
requieren una respuesta alternativa para la entrega del refuerzo, pueden ser preferibles
durante las etapas iniciales del tratamiento de castigo para asegurar una densidad suficiente
del refuerzo disponible. De hecho, múltiples respuestas, reforzadores, y contingencias de
refuerzo (e.g., DRO más NCR) deberían ser incorporadas en el tratamiento, de modo tal, que
el castigo de un numero restringido de respuestas sea implementado dentro del contexto de un
ambiente rico en refuerzo.

Magnitud del Castigo


La relación entre los efectos del castigo y la intensidad o cantidad de castigo es
especialmente pertinente a su eficacia y aceptabilidad en contextos clínicos. Desde un punto
de vista ético y práctico, para tratar problemas conductuales debería entregarse la menor
cantidad de castigo posible que sea efectivo (es decir, poca intensidad, poca duración).
Estudios básicos sobre la intensidad muestran que la supresión de la respuesta se relaciona
positivamente con la intensidad y duración de la descarga en ratas, palomas, monos y
estudiantes universitarios (Church, 1969; Deluty, 1978; Scobie y Kaufman, 1969), con la
duración del tiempo fuera en humanos normales (Kaufman y Baron, 1968; N. B. Miller y
Zimmerman, 1966), y con el número de puntos perdidos en costo de respuesta en humanos
normales (Weiner, 1964). De hecho, es más probable que ocurra recuperación durante y
después de terminado el castigo con estímulos suaves tales como el golpe de la palanca
(Skinner, 1938), y descargas de muy bajo voltaje (Hake, Azrin, y Oxford, 1967). Más aún, el
castigo con descargas de alta intensidad o golpes de aire es inefectivo en ratas cuando los
estímulos son inicialmente de baja intensidad y esta se incrementa gradualmente con el
tiempo (Cohen, 1968; N. E. Miller, 1969; Terris y Barnes, 1969). Basándose en estos
hallazgos, numerosos autores han recomendado usar castigos de intensidad moderada o alta
para tratar problemas conductuales, y han advertido contra aumentar gradualmente la
intensidad del castigo (e.g., Cooper et al., 1987; Martin y Pear, 1996; O’Brien, 1989). Estas
reglas pueden ser difíciles de reconciliar con el mandato ético de identificar el procedimiento
efectivo que sea menos restrictivo. Además, un examen más cercano de los descubrimientos
básicos del área indica que la relación entre la respuesta y la magnitud del castigo es más
compleja de lo que se asume normalmente. Como resultado, estrategias basadas en
recomendaciones de manuales (e.g., Cooper et al.; Martin y Pear) y revisiones de la literatura
puede que no influyan en la conducta del modo esperado.
Como se notó anteriormente, la relación básica entre supresión de la respuesta y la
intensidad del castigo puede ser afectada por la disponibilidad de refuerzo alternativo (e.g.,
Holz et al., 1963) y el tipo de programa de reforzamiento que está manteniendo la conducta
(e.g., Powell, 1970; Scobie y Kaufman, 1969). Otras variables (e.g., inmediatez; Cohen,
1968) también pueden alterar la relación entre la intensidad del castigo y la respuesta. Esta
interacción de tal complejidad puede ser responsable de algunos resultados contradictorios
sobre la magnitud del castigo que han sido reportados en la literatura aplicada. También es
algo limitado hasta hasta qué punto son comparables directamente los descubrimientos
básicos con los aplicados, debido a que la mayoría de los estudios básicos han examinado la

13
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

intensidad de descargas eléctricas, mientras los estudios aplicados se han enfocado en formas
de castigo más aceptables clínicamente (e.g., sobrecorrección, tiempo fuera).
En uno de los pocos estudios aplicados que ha evaluado la intensidad de las descargas
eléctricas, D. E. Williams, Kirkpatrick-Sánchez, e Iwata (1993) compararon la eficacia del
tratamiento para autolesiones con descargas de dos intensidades distintas (3,5 mA vs. 18,5
mA). Los resultados fueron consistentes con los obtenidos en estudios básicos. La
generalización de este hallazgo, sin embargo, es algo limitada debido a que el castigo fue
combinado con extinción. Además, efectos de secuencia pueden haber influenciado el
resultado debido a que el participante fue expuesto a la descarga de baja intensidad antes de
ser expuesto al de intensidad alta, y no se implementó un reverso de la condición de baja
intensidad (es decir, alta intensidad antes de baja intensidad).
Los resultados de estudios que han examinado la relación entre la intensidad del
castigo y la eficacia del tratamiento usando otros tipos de castigo (e.g., limitación o
restricción del movimiento, olores desagradables, tiempo fuera) han sido inconsistentes y
frecuentemente parecen estar mezclados con otras variables (e.g., Altman, Haavik, y Cook,
1978; Cole, Montgomery, Wilson, y Milan, 2000; Marholin y Townsend, 1978; Singh,
Dawson, y Manning, 1981). Por ejemplo, Cole et al. encontraron que el tratamiento con
sobrecorrección causó una disminución similar en conducta estereotipada tanto si el
tratamiento duró 30 segundos, 2 minutos u 8 minutos. Los efectos de la sobrecorrección, sin
embargo, pueden haber estado mezclados con los de la extinción y reprimendas verbales.
Estudios sobre la duración del tiempo fuera han mostrado una relación positiva (e.g.,
Burchard y Barrera, 1972; Hobbs, Forehand, y Murray, 1978), una relación negativa (e.g.,
Kendall, Nay, y Jeffers, 1975) y no relación (e.g., White, Nielsen, y Johnson, 1972) entre la
duración y efectos del tratamiento. Estos hallazgos son difíciles de interpretar debido a que
no se identificó la función de la conducta problema (y por tanto el tiempo fuera puede haber
estado contraindicado para algunos participantes), y efectos de secuencia pueden haber
confundido los resultados.
Más investigación acerca de la relación entre la intensidad del castigo y la respuesta al
tratamiento, así como sobre factores que pueden alterar esta relación (e.g., programa de
reforzamiento, demora del castigo) podría ser útil para reconciliar los resultados
inconsistentes en la literatura y para desarrollar guías más comprehensivas para la aplicación.
El supuesto común de que un castigo de mayor magnitud es más efectivo que uno de menor
magnitud no está ampliamente apoyado en la literatura actual, exceptuando los resultados en
descargas contingente. La intensidad debería ser manipulada en una variedad de castigos y de
maneras que no han sido examinadas por la investigación básica. Por ejemplo, la cantidad de
reforzamiento disponible durante el tiempo libre es una dimensión potencialmente importante
de la magnitud del castigo cuando se implementa un tratamiento de tiempo fuera (e.g.,
Solnick, Rincover, y Peterson, 1977).
También se deberían explorar estrategias para mejorar la supresión de respuesta y su
mantención bajo intensidades de castigo menos efectivas. Los resultados de la investigación
básica indican que magnitudes de castigo menores pueden ser más efectivas si el castigo se
entrega inmediatamente después de la conducta (e.g., Cohen, 1968) y si hay reforzamiento
disponible para una respuesta alternativa (e.g., Holz et al., 1963). Estudios básicos con

14
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

descargas también muestran que un castigo menos intenso puede ser efectivo, al menos
temporalmente, si resulta de un nivel de intensidad alto que disminuye a lo largo del tiempo
(e.g., Azrin, 1960; Cohen, 1968; Hake et al., 1967). Una aproximación que implique castigos
menos intensos presentados periódicamente entre castigos más intensos puede ser útil para
mantener los efectos del tratamiento mientras la magnitud del castigo se reduce
gradualmente. Como se mencionó anteriormente, mayor investigación en castigo
condicionado y tratamientos que combinen reforzamiento con castigo puede llevar también a
métodos para mejorar la efectividad de castigos suaves.
Finalmente, futuros estudios deberían evaluar métodos para identificar la magnitud de
un castigo dado antes de ser usado en un tratamiento en el ambiente natural. La típica
aproximación de ensayo y error para la selección del castigo es ineficiente y puede ser
contraproducente si un individuo recibe exposición prolongada a procedimientos inefectivos
(e.g., N. E. Miller, 1960; Terris y Barnes, 1969). Las estrategias eficientes para identificar el
tratamiento eficaz y menos restrictivo están sorprendentemente ausentes de la literatura
aplicada. En dos estudios ejecutados por Fisher y sus colegas (Fisher, Piazza, Bowman,
Hagopian, y Langdon, 1994; Fisher, Piazza, Bowman, Kurtz, et al., 1994) se evaluaron
rápidamente los potenciales efectos supresores de varios procedimientos (e.g., tiempo fuera,
cubierta facial, demandas contingentes) mediante la exposición de los participantes a los
castigos mientras se medían vocalizaciones negativas (e.g., gritos, llanto) y respuestas de
escape o evitación (e.g., tirarse al suelo). Cada procedimiento de castigo se entregó de manera
no contingente a lo largo de 5 duraciones diferentes, desde 15 hasta 180 segundos. Los
resultados del tratamiento mostraron que los procedimientos asociados con los mayores
niveles de vocalizaciones, respuestas de escape o de evitación fueron los castigos más
efectivos para la conducta problema. Sin embargo, los resultados de la evaluación inicial no
diferenciaron entre las varias duraciones para cada los participantes, quizás debido a que los
procedimientos alternaban rápidamente en un número limitado de ensayos. La utilidad de
tales evaluaciones debería ser evaluada en estudios futuros. Por ejemplo, una evaluación
separada de la magnitud del castigo, con un diseño similar al de Fisher et al., puede ser útil
cuando una evaluación inicial ha identificado un castigo potente.
Hasta que se conduzca mayor investigación aplicada sobre la intensidad del castigo,
los terapeutas debieran elegir magnitudes que se hayan mostrado seguras y efectivas en
estudios clínicos, en tanto la magnitud sea considerada aplicable y práctica por quienes
implementarán el tratamiento. El castigo debería ser además combinado con algún tipo de
reforzamiento, y debería ser entregado tan rápido como sea posible una vez que ocurra la
conducta problema (ver la discusión siguiente al respecto). Si el castigo falla en suprimir la
conducta, se deberían considerar procedimientos alternativos en vez de aumentar la magnitud
del castigo bajo el supuesto de que esta estrategia mejorará la eficacia del tratamiento.

Inmediatez del Castigo


Las consecuencias de la conducta problema frecuentemente se postergan en el
ambiente natural. Cuidadores y profesores usualmente son incapaces de monitorear la
conducta de manera cercana o de entregar castigos extensos (e.g., 15 minutos de trabajo
contingente) apenas ocurre una instancia de conducta problema (Azrin y Powers, 1975). El

15
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

castigo puede demorarse también cuando el individuo resiste activamente la aplicación de las
consecuencias programadas forcejeando o huyendo. En algunos casos la conducta problema
ocurre en ausencia de cualquier cuidador, lo que demora necesariamente la consecuencia
programada hasta que se detecta la ocurrencia de la conducta (Grace, Thompson, y Fisher,
1996; Van Houten y Rolider, 1988).
Por estas razones la investigación en demora del castigo es especialmente pertinente.
Resultados de laboratorio en ratas muestran que mientras más larga la demora entre la
ocurrencia de la conducta y la entrega de una leve descarga eléctrica contingente, menor la
cantidad de supresión de respuesta del castigo (e.g., Baron, Kaufman, y Fazzini, 1969; Camp,
Raymond, y Church, 1967). Incluso demoras breves de 10 o 20 segundos logran afectar
seriamente los efectos del castigo contingente con ratas y estudiantes universitarios (e.g.,
Banks y Vogel-Sprott, 1965; Goodall, 1984) y de pérdida del reforzamiento en estudiantes
universitarios (Trenholme y Baron, 1975).
Estímulos que podrían conectar el intervalo entre una respuesta y su consecuencia han
estado notoriamente ausentes de los diseños de laboratorio con castigo demorado. Resultados
de al menos un estudio sugieren que factores tales como la presencia de un castigo
condicionado y la entrega de instrucciones pueden alterar la eficacia del castigo demorado.
En Trenholme y Baron (1975), demoras de 10, 20 y 40 segundos fueron igualmente efectivas
en estudiantes universitarios cuando se presentaba un breve ruido asociado a la pérdida de
reforzamiento inmediatamente después de la ocurrencia de la conducta. Un experimento
siguiente mostró que el castigo demorado fue tan efectivo como el castigo inmediato cuando
los participantes recibieron instrucciones sobre la demora. No se ha determinado que tan
generalizables son estos resultados a poblaciones clínicas tales como personas con trastornos
del desarrollo. Además, ningún estudio básico ha evaluado el efecto de numerosos factores
potenciales en castigo demorado (factores como; historia, programa de reforzamiento,
disponibilidad de refuerzo alternativo).
Sorprendentemente, pocos estudios aplicados han evaluado la eficacia del castigo
demorado o estrategias para mejorar los efectos del tratamiento cuando las consecuencias no
ocurren de manera contigua a la conducta. En uno de los pocos estudios que han comparado
castigo inmediato y demorado, Abramowitz y O’Leary (1990) encontraron que reprimendas
verbales inmediatas fueron mucho más eficaces en disminuir la conducta de distracción en
escolares que retos con 2 minutos de demora. Sin embargo, estos resultados son algo difíciles
de interpretar debido a que las reprimendas demoradas se entregaban solo si la conducta de
distracción había ocurrido continuamente por 2 minutos, durante los cuales los estudiantes
tenían bastantes oportunidades de interactuar con otros estudiantes y objetos no relacionados
a la tarea. Así, los efectos de la demora del castigo no fueron separados de los efectos del
programa de reforzamiento y de castigo.
Los resultados de solo dos estudios han delineado las condiciones bajo las cuales el
castigo demorado puede producir resultados efectivos. Rolider y Van Houten (1985), y Van
Houten y Rolider (1988) demostraron la eficacia del castigo demorado usando varias
consecuencias mediadas en niños con problemas emocionales y del desarrollo. Una forma de
mediación incluía reproducir videos de la conducta disruptiva del niño grabados
anteriormente durante el día. Luego se entregaba la consecuencia castigadora (limitaciones

16
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

del movimiento, reprimendas verbales). En algunos casos, la grabadora era visible claramente
para el niño mientras era grabado, y se dio una explicación verbal de su rol en la entrega del
castigo demorado. Estos factores pueden haber servido para acortar el intervalo entre la
conducta inapropiada y su consecuencia (e.g., al funcionar como estímulo discriminativo para
el castigo; Trenholme y Baron, 1975). Sin embargo, para 1 participante ni las instrucciones
sobre el castigo demorado ni la consecuencia inmediata diseñada para señalizar que el castigo
se acercaba (una marca puesta en la mano del niño) fueron tan efectivos como el
procedimiento de video.
En Van Houten y Rolider (1988), los cuidadores guiaron físicamente 2 participantes a
ejecutar la conducta problema (agresión o robo) una vez se detectaron o reportaron
ocurrencias de la conducta. Los cuidadores entonces entregaron inmediatamente la
consecuencia castigadora (restricción del movimiento) a continuación de la respuesta guiada.
Si bien el tratamiento fue efectivo, no se examinó la eficacia del castigo demorado sin el
componente de respuesta guiada. Tampoco se especificaron la duración de la demora y de la
respuesta inmediata de los cuidadores a la conducta problema.
El conocimiento actual indica que los castigos suaves usados típicamente en contextos
clínicos serán inefectivos a menos que la consecuencia siga inmediatamente a la conducta
problema. Así, se necesita mayor investigación sobre los factores que puedan mejorar los
efectos del tratamiento con castigo demorado, especialmente de procedimientos o estímulos
que puedan cerrar el intervalo de tiempo entre la respuesta y su consecuencia. Es necesaria
investigación sobre la utilidad de entregar castigos condicionados, instrucciones y otros tipos
de estímulos asociados con consecuencias demoradas.
Hasta que se conduzcan más investigaciones, los profesores y cuidadores deberían
preocuparse de elegir castigos que puedan ser entregados fácilmente apenas ocurra la
conducta. Consecuencias que no requieran la proximidad del cuidador (es decir, estímulos
que puedan ser entregados o retirados desde cierta distancia) y tecnología para mejorar la
funcionalidad del castigo inmediato pueden ser de especial utilidad en este sentido. Aparatos
electrónicos que detecten la ocurrencia de la conducta problema y alerten a los cuidadores o
entreguen automáticamente la consecuencia pueden evitar los problemas del castigo
demorado (e.g., Linscheid, Iwata, Ricketts, Williams, y Griffin, 1990).
Sin embargo, también debería considerarse la temporalidad del castigo en relación
con la entrega de refuerzo, pues algunos estudios básicos han encontrado que el castigo
inmediato es menos efectivo que el demorado si el castigo inmediato precede al
reforzamiento mientras que el castigo demorado es presentado con posterioridad a este (e.g.,
Epstein, 1984; Rodríguez y Logan, 1980). Es posible que cuidadores diligentes puedan
responder a la conducta problema entregando inmediatamente el castigo prescrito (e.g., tarea
contingente, tiempo fuera), y manteniendo (inadvertidamente) el reforzamiento social (e.g.,
acceso a materiales). De manera similar, el castigo automatizado puede ser entregado de
manera inmediata y justo antes de consecuencias sociales o no sociales para la conducta
problema. Los resultados de otros estudios básicos, en los cuales la disponibilidad de refuerzo
para una respuesta se correlacionaba completamente con la entrega de un castigo inmediato
suave, mostraron que emparejar castigo y reforzamiento de esta manera estableció al estímulo
castigador como un reforzador condicionado positivo (e.g., Murray y Nevin, 1967; D. R.

17
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

Williams y Barry, 1966). Así, la temporalidad del castigo y del reforzamiento en el ambiente
natural debería ser evaluada cuidadosamente como parte del tratamiento

Programa de Castigo
Los efectos de los programas de castigo en la respuesta tienen implicancias relevantes
para la eficacia y aceptabilidad del tratamiento con castigo. Consecuencias entregadas de
manera intermitente que reduzcan exitosamente la conducta problema son más fáciles de
usar, consumen menos tiempo, y son menos intrusivas que consecuencias que tienen que
seguir a cada ocurrencia de la conducta. Los resultados de la investigación básica en palomas
y ratas sugieren que el castigo con leves descargas eléctricas o tiempo fuera no produce
resultados aceptables a menos que el castigo siga casi cada ocurrencia de la conducta en
casos en los cuales no hay alternativa disponible o cuando la densidad del reforzamiento no
es reducida (Appel, 1968; Azrin, Holz, y Hake, 1963; Deluty, 1976; Farley, 1980; Thomas,
1968).
Si bien cierta cantidad de estudios aplicados ha examinado la eficacia del castigo
intermitente para tratar conductas problemáticas, los resultados han sido inconsistentes, y las
condiciones bajo las cuales el castigo intermitente podría ser efectivo siguen siendo poco
claras. En algunos estudios, por ejemplo, programas de castigo intermitente fueron asociados
a una reducción significativa socialmente en la conducta, particularmente si la respuesta
había sido ya suprimida a niveles bajos mediante el uso de castigo continuo (e.g., Clark,
Rowbury, Baer, y Baer, 1973; Rollings y Baumeister, 1981; Romanczyk, 1977). Por otro
lado, en otros estudios incluso programas intermitentes densos fueron inefectivos para
algunos participantes (e.g., Calhoun y Matherne, 1975; Lerman et al., 1997). Resultados
básicos sobre los factores que interactúan con los efectos de los programas de castigo (e.g.,
programas de reforzamiento) podrían explicar por qué las aplicaciones clínicas han producido
resultados inconsistentes.
Primero, en estudios que han mostrado efectos significativos del tratamiento con
programas de castigo tenues (e.g., Barton, Brulle, y Repp, 1987; Clark et al., 1973;
Romanczyk, 1977), el castigo parece haber sido confundido con la extinción y otros
potenciales castigos (e.g., reprimendas verbales). Segundo, los parámetros de castigo
importantes (es decir, tipo, intensidad y programa) variaban considerablemente a lo largo de
los estudios. Resultados básicos indican que estas variables alteran la relación entre el castigo
intermitente y la supresión de respuesta. Aumentar la intensidad de un castigo, por ejemplo,
puede tanto mejorar como degradar la eficacia de un programa intermitente dependiendo de
otros factores (e.g., Appel, 1968; Lande, 1981). Ciertos programas de castigo (e.g., IV)
también han sido asociados con mayores disminuciones de la respuesta comparados con otros
programas (e.g., RF o IF; Azrin, 1956; Camp, Raymond, y Church, 1966), aunque la
naturaleza de esta relación es compleja (e.g., Arbuckle y Lattal, 1992) y parece estar
influenciada por el programa de reforzamiento que mantiene la conducta (e.g., Bradshaw et
al., 1977, 1978; Powell, 1970; Scobie y Kaufman, 1969).
En el único estudio aplicado que ha examinado la interacción entre el tipo o
intensidad del castigo y la intermitencia del programa, Cipani, Brendlinger, McDowell, y
Usher (1991) encontraron que un programa de castigo RV4 con aplicación contingente de

18
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

jugo de limón fue tan efectivo en reducir la conducta estereotipada de un niño como un
programa continuo. Un procedimiento de “sobrecorrección con guía manual” (es decir., guiar
físicamente el brazo del niño sobre su cabeza y hacia los lados 10 veces) también fue efectivo
cuando el procedimiento se entregó en un programa continuo. A diferencia del jugo de limón,
sin embargo, un programa RV4 con sobrecorrección no produjo reducciones clínicamente
significativas en el lenguaje.
Finalmente, interacciones entre programas de reforzamiento y castigo pueden dar
cuenta de los efectos idiosincráticos de castigo intermitente sobre la conducta. Por ejemplo,
Lerman et al. (1997) trataron la conducta autolesiva (CAL) de 5 participantes con un
programa de castigo continuo una vez que los resultados del análisis funcional mostraron que
la conducta estaba siendo mantenida por reforzamiento automático. Una aplicación inicial de
castigo intermitente (IF de 2 o de 5 minutos) fue inefectiva para 4 de los 5 participantes. El
programa de castigo continuo fue luego atenuado exitosamente a IF de 5 minutos para 2 de
estos participantes. En contraste, el castigo continuo fue necesario para suprimir CAL para
los otros 2 participantes, a pesar de intentos repetidos de atenuar el programa. Aunque la
función de la CAL había sido identificada con anterioridad al tratamiento, había importantes
parámetros de los reforzadores que eran desconocidos (e.g., programa, densidad, magnitud).
Estos parámetros, que muy probablemente variaban entre los participantes, pueden haber sido
responsables del éxito inconsistente del procedimiento de atenuación del programa.
Es necesaria más investigación sobre las interacciones entre el programa de castigo
(e.g., RV vs. IV) y otros parámetros de castigo y reforzamiento potencialmente importantes
para aclarar en qué condiciones el castigo intermitente sería o no efectivo. Pocos estudios han
evaluado directamente estrategias para atenuar sistemáticamente los programas de castigo o
para usar programas de alta variabilidad (y por tanto impredecibles). Combinar un programa
atenuado con un programa enriquecido de castigo condicionado es otra aproximación
potencial para mejorar la eficacia del castigo intermitente. Dependiendo de la naturaleza de
los castigos condicionados e incondicionados, este diseño puede ser más práctico que usar un
programa de castigo enriquecido por sí mismo. Un programa denso de reforzamiento
alternativo también puede promover la eficacia del castigo intermitente.
Otros tipos de programas de castigo examinados en el laboratorio básico, tales como
el castigo diferencial de tasas altas (CDTA) o de tasas bajas (CDTB), también podrían ser
útiles en contextos clínicos. Estos programas no especifican una contingencia directa entre la
entrega del castigo y la ocurrencia de una respuesta. Por ejemplo, en CDTA o CDTB, el
castigo se entrega de manera contingente con la pausa que precede inmediatamente a una
respuesta (es decir, castigo selectivo de intervalos de cierta duración entre respuestas). Los
resultados de estudios básicos en CDTA o CDTB muestran que en general la respuesta se
incrementa cuando se castigan intervalos entre respuestas relativamente largos (CDTA), y
disminuía cuando se castigaban intervalos cortos (CDTB; e.g., Galbicka y Branch, 1981;
Laurence, Hineline, y Bersh, 1994). Programas de CDTA pueden ser más beneficiosos que el
castigo continuo en tratar la conducta problema que ocurre a tasas altas o en brotes. También
es relevante obtener una mayor comprensión de estos programas porque pueden operar
comúnmente en el ambiente natural. Por ejemplo, los cuidadores puede que entreguen castigo
más probablemente cuando la conducta problema ocurre de manera infrecuente (es decir, se

19
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

caracteriza por largos tiempos entre respuestas) que cuando ocurre a tasas altas (ver Arbuckle
y Lattal, 1992, por una discusión). Tal sistema puede comprometer la eficacia del tratamiento
al aumentar la frecuencia de tiempos entre respuesta cortos.
El conocimiento actual sobre los programas de castigo sugiere que los padres y
profesores deberían castigar cada ocurrencia de la conducta problema a menos que tal
conducta este siendo extinguida simultáneamente. Hasta que se lleve a cabo más
investigación, los clínicos deberían tener extrema precaución al intentar atenuar el programa
de castigo, usar CDTA, o evaluar otras estrategias para mejorar los efectos del castigo
intermitente (e.g., usando programas variables o castigos condicionados). Inicialmente
siempre debería implementarse un programa de castigo continuo, y deberían considerarse
programas de castigo intermitente solo si el programa continuo es inefectivo en suprimir o
disminuir la conducta problema en una cantidad de tiempo considerable.

Factores relacionados con la mantención, generalización y efectos indirectos


Una muy pequeña proporción de estudios básicos y aplicados en castigo han evaluado
su mantenimiento a largo plazo, generalización y efectos secundarios del castigo en relación
con los efectos directos. La medida en que los efectos del castigo se mantienen con el tiempo,
la transferencia entre contextos y ajustes, y la producción de cambios en otros
comportamientos tiene implicaciones significativas para los tratamientos que involucran
castigo.

Mantención
La duración del entrenamiento con castigo es una de las consideraciones más
importantes para profesionales, profesores y cuidadores de personas con desórdenes
conductuales. Varios autores han sugerido que los efectos clínicos del castigo son
relativamente de corta duración, incluso cuando el tratamiento permanece sin cambios con el
tiempo (e.g., Parsons, Hinson, y Sardo-Brown, 2001; Walker y Shea, 1999). En estudios
básicos, tanto con animales humanos como con no humanos, varios castigadores han sido
asociados con una supresión continua de la respuesta bajo castigo, incluyendo descargas
eléctricas con niveles de intensidad relativamente altos en palomas y ratas (Azrin, 1960;
Crosbie et al., 1997), pérdida monetaria o de puntos en humanos (Crosbie et al.; Weiner,
1962), y tiempo fuera del reforzamiento positivo en monos ardilla (McMillan, 1967). Sin
embargo, la recuperación de la respuesta ha sido asociada con castigadores menos intensos,
tales como una descarga eléctrica de bajo voltaje en palomas (Rachlin, 1966), palmadas con
una barra en ratas (Skinner, 1938), y un ruido en palomas (Holz y Azrin, 1962). Los
hallazgos básicos sobre el mantenimiento de la supresión de la respuesta después de la
terminación de la contingencia punitiva también mostraron que las tasas de respuesta
regresaron inmediatamente a los niveles previos al castigo - a veces incluso excediendo
temporalmente la línea base - a menos que se utilizaran castigos intensos (e.g., choques de
alto voltaje; Azrin, 1960).
Estos resultados sugieren que castigadores suficientemente intensos, incluyendo los
comúnmente usados en procedimientos clínicos (e.g., el tiempo fuera), pueden producir
reducciones prolongadas en el comportamiento problemático mientras la contingencia del

20
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

castigo permanezca vigente. Sin embargo, los hallazgos básicos pueden no ser aplicables a
los tratamientos en contextos clínicos porque los periodos de tiempo evaluados en laboratorio
(e.g., 30 a 60 minutos de sesión de castigo de 10 a 20 días) pueden tener una relación
pequeña con los numerosos meses (y a veces años) que el comportamiento problemático
requiere de tratamiento. Además, pocos estudios han examinado factores que pueden
influenciar la duración de los efectos del castigo.
A pesar de que las evaluaciones breves del tratamiento son predominantes en la
literatura aplicada en castigo, un número creciente de estudios ha examinado la eficacia a
largo plazo del castigo los últimos 10 años. Los efectos del tratamiento han sido examinados
durante periodos de 1 a 60 meses después de que se inició y continuó con cambios menores
en su procedimiento el castigo (Duker y Seys, 1996; Ricketts, Goza, y Matese, 1993; D. E.
Williams, Kirkpatrick-Sánchez, y Crocker, 1994), y después de que el componente original
de castigo fue retirado (Arntzen y Werner, 1999; Foxx, Bittle, y Faw, 1989; Rolider,
Williams, Cummings, y Van Houten, 1991). Los resultados han mostrado un éxito variable
en el mantenimiento de la reducción del comportamiento, pero las razones potenciales de los
inconsistentes resultados aún no se han identificado.
Por ejemplo, D. E. Williams et al. (1993) observaron una recaída en el tratamiento
con una leve descarga eléctrica contingente, 6 meses después de iniciado el castigo. A la
inversa, Linscheid, Hartel, and Cooley (1993) encontraron que una leve descarga eléctrica
contingente continuó suprimiendo 2 comportamientos individuales autolesivos por 5 años.
Duker and Seys (1996) examinaron la eficacia a largo plazo de una descarga contingente con
12 individuos mediante la obtención de información sobre el grado de restricción física que
cada uno requiere de 2 a 47 meses después de iniciado el castigo. Los resultados en el
seguimiento sugieren que el tratamiento se mantuvo efectivo para 7 participantes incluido un
individuo que fue evaluado en 36 meses y otro que fue evaluado en 47 meses.
Las conclusiones respecto a los hallazgos aplicados en mantenimiento son difíciles de
trazar por un número de razones. Primero, la mayoría de los estudios examinan la efectividad
a largo plazo de las descargas contingentes, por lo que los resultados no pueden ser aplicados
a otros (o más leves) castigadores (Azrin y Holz, 1966). Segundo, las consecuencias
reforzantes de un comportamiento problemático no han sido identificadas previo a los
tratamientos en la mayoría de los casos. El mantenimiento de largo plazo puede ser más
probable de ocurrir si el reforzador de mantenimiento fue retenido contingente al
comportamiento problema o fácilmente disponible para involucrarse en un comportamiento
más apropiado (Estes, 1944). En tercer lugar, otros factores potencialmentes responsables de
los casos exitosos y no exitosos de mantenimiento del tratamiento pueden haber variado
ampliamente en todos los estudios (e.g., el programa de castigo, disponibilidad de
reforzadores que competían o sustituían al reforzador de mantenimiento). De hecho, los
componentes de la intervención original fueron modificados a través del tiempo en algunos
estudios (e.g., procedimientos conductuales adicionales o drogas fueron introducidos; Duker
y Seys, 1996), y es difícil determinar cuales, si cualquier modificación del tratamiento puede
haber sido responsable de los resultados. Además, el largo periodo de tiempo requerido para
conducir estos estudios incrementó la probabilidad de que cambios no planificados u otro
factor sin control interactúe con la eficacia del tratamiento original de manera deseable o

21
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

indeseable. Finalmente, el número de casos de recaídas reportados en la literatura puede no


precisamente reflejar la prevalencia de este problema en los contextos aplicados, porque
algunos casos son menos probables de ser presentados o aceptados para la publicación que
los casos exitosos de tratamiento de mantenimiento.
Identificar los factores o procesos asociados con el mantenimiento a largo plazo, es la
clave para el diseño de tecnología sistemática para prevenir y remediar la recaída. Varios
autores han sugerido que la adaptación, o habituación, al estímulo punitivo cuenta para las
instancias de recuperación (es decir, la exposición repetitiva disminuye la aversividad del
castigador; Goodall, 1984). Además, la adaptación es más probable que ocurra con
castigadores leves, que son usualmente empleados en contextos clínicos. Una estrategia que
podría disminuir la probabilidad de habituación es la de utilizar castigos espaciados. En
varios estudios básicos con palomas, la respuesta de supresión bajo castigo de leves descargas
eléctricas fue mejorado siguiendo periodos breves de tiempo con el sujeto que fue removido
de la situación de castigo o expuesto solo al reforzamiento (e.g., Rachlin, 1966). Más
investigación es necesaria, porque se encontró que el efecto beneficioso de este
procedimiento menguó a través de repetidos ciclos de castigo-hiato (e.g., Orme-Johnson,
1967). Otras estrategias pueden prevenir o atenuar la habituación, tales como las que usan
castigadores intermitentes, variados y breves (e.g., Charlop et al., 1988), lo que debería ser
evaluado en nuevos estudios.
Es también necesaria la investigación en estrategias destinadas al mantenimiento de
los efectos del castigo mientras la intervención es desvanecida sistemáticamente. Hallazgos
básicos con palomas y monos han demostrado que la respuesta permanecerá suprimida bajo
descargas de baja intensidad si un choque inicialmente intenso se reduce gradualmente (e.g.,
Hake et al., 1967). Es necesaria nueva investigación aplicada para determinar si los efectos
del tratamiento serían mantenidos mientras la intensidad o la duración de un procedimiento
de castigo es alterado muy gradualmente o si procedimientos menos intrusivos se introducen
simultáneamente. Por ejemplo, puede ser posible para reducir un tiempo fuera de 5 minutos a
uno de 1 minuto a través del tiempo. El uso de castigos condicionados puede mejorar la
probabilidad de desvanecimiento de ciertas dimensiones de los castigos intrusivos, mientras
que los efectos del tratamiento se mantienen a largo plazo. Por otra parte, los estudios básicos
han encontrado que la recuperación de la respuesta es más gradual después del retiro de las
leves descargas intermitentes que siguió la eliminación de otro programa de castigo (e.g.,
Azrin et al., 1963; Camp et al., 1966). Así, las estrategias para incrementar la utilidad de los
castigadores condicionados y el castigo intermitente, para la práctica clínica de rutina, puede
también promover la eficacia a largo plazo del castigo.
Varios autores han sugerido que la combinación de castigo con reforzamiento
diferencial puede incrementar la probabilidad de que el castigo pueda ser desvanecido con
éxito (e.g., Kazdin, 2001). Aunque esta estrategia clínica no ha sido evaluada directamente,
un estudio encontró que el reforzamiento diferencial fue más efectivo en la reducción del
comportamiento problemático después de que un participante había sido expuesto a un
periodo de castigo (trabajo contingente) cuando el reforzamiento diferencial precedió al
castigo (Fisher et al., 1993). Los hallazgos de la investigación sobre los efectos indirectos del
castigo sugieren que el castigo puede aumentar la respuesta al refuerzo (véase más adelante

22
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

para más discusión). Por lo tanto, el castigo puede aumentar la eficacia del refuerzo para
establecer una conducta apropiada que compita o reemplace una conducta inapropiada, un
resultado que a su vez puede aumentar la probabilidad de que el castigo pueda ser retirado.
Hasta que se lleve a cabo investigación adicional sobre el mantenimiento a largo
plazo, los profesionales y cuidadores no deben asumir que el castigo seguirá siendo efectivo a
largo plazo. Las estrategias para aumentar la probabilidad de mantenimiento deben ser
empleadas desde el inicio del tratamiento. Aunque los hallazgos básicos sugieren que los
castigos relativamente intensos pueden estar asociados con resultados exitosos a largo plazo,
el uso de procedimientos análogos para tratar el comportamiento problemático probablemente
plantearía preocupaciones éticas para todos los casos, excepto los más graves. Los
cuidadores, en cambio, deben centrarse en el uso del refuerzo para asegurar que el
comportamiento alternativo sea de gran fuerza en el repertorio de individuos expuestos al
castigo. Las evaluaciones sistemáticas del reforzador y los análisis funcionales del
comportamiento problemático siempre deben preceder la implementación del tratamiento
(Fisher et al., 1992). Los efectos del castigo pueden durar más si el comportamiento
apropiado es mantenido por los mismos reforzadores que mantienen un comportamiento
problemático o por reforzadores que son sustitutos efectivos para mantener los reforzadores.
Las consecuencias del refuerzo de la conducta problemática también deben ser minimizadas o
reprimidas si es posible.
Los problemas potenciales con la habituación pueden ser restringidos limitando la
exposición al castigador de varias maneras. Por ejemplo, los cuidadores pueden programar
breves vacaciones de castigo de manera regular (Rachlin, 1966) o restringir el uso de
procedimientos específicos a uno o dos comportamientos problemáticos (por ejemplo,
aquellos de mayor preocupación) en lugar de aplicar el mismo tratamiento para una variedad
de respuestas. También se deben emplear evaluaciones exhaustivas de los castigos para
identificar procedimientos clínicamente aceptables que produzcan la mayor reducción en el
comportamiento y, por lo tanto, conducir a una menor cantidad de exposición al castigador
(ver Fisher, Piazza, Bowman, Hagopian y Langdon, 1994). Si la evaluación identifica más de
una forma efectiva de castigo, los cuidadores podrían alternar entre varios procedimientos
para minimizar la exposición a un solo castigador.
Finalmente, los practicantes y cuidadores deben tener un plan para lidiar con la
recaída del tratamiento cuando ocurre durante el castigo o después de la eliminación del
castigo. El primer paso es identificar y rectificar otros factores que pueden ser responsables
del fracaso del tratamiento. Muchos casos de recaída son probablemente atribuibles a
problemas con la integridad del tratamiento (D. E. Williams et al., 1993), especialmente
cuando el procedimiento de castigo es complejo o lleva mucho tiempo (por ejemplo, Foxx y
Livesay, 1984). El siguiente paso es reevaluar una amplia gama de estímulos y actividades
que pueden funcionar como refuerzos potentes para el comportamiento apropiado y para
apuntar a respuestas adicionales múltiples que podrían competir con el comportamiento
castigado. Las formas alternativas de castigo deben ser consideradas sólo después de
determinar que el actual castigador es ineficaz dentro del contexto de un entorno ricamente
reforzante. En este punto, otra evaluación completa del castigo debe ser conducida para

23
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

identificar otros castigos efectivos. No se recomienda aumentar la intensidad o la magnitud


del puncionador ineficaz, como se discutió anteriormente (ver Magnitud de Refuerzo).

Generalización de Estímulos
La transferencia de los efectos del tratamiento a través de diferentes encuadres y
contextos (es decir, la generalización del estímulo) es otro resultado críticamente importante
para las personas con trastornos del comportamiento. (La respuesta de generalización bajo
castigo, o una reducción concomitante en el comportamiento no castigado cuando disminuye
una respuesta castigada, se discutirá bajo el encabezado Efectos Indirectos del Castigo). La
integración dentro de la comunidad puede ser restringida incluso cuando el comportamiento
problemático responde al tratamiento si el procedimiento no puede ser implementado (e.g.,
durante transiciones en la escuela o en lugares públicos como tiendas y autobuses). Los
hallazgos básicos sobre la generalización del estímulo, sin embargo, sugieren que los efectos
del castigo en la conducta problemática pueden transferirse a encuadres y contextos no
tratados. Los resultados de varios estudios básicos con palomas demostraron que la supresión
de la respuesta producida por el castigo de choque se produjo en presencia de estímulos
previos que no se utilizaron en la situación de entrenamiento, a pesar de que el castigo fue
retenido durante las pruebas de generalización (por ejemplo, Hoffman y Fleshler, 1965 Honig
y Slivka, 1964). La cantidad de supresión de la respuesta (es decir, el nivel de control del
estímulo) fue una función de la similitud física entre los estímulos de generalización y los
estímulos presentes durante el entrenamiento con el castigo, un hallazgo que es análogo a los
hallazgos básicos sobre la generalización del estímulo y los efectos del refuerzo (Guttman y
Kalish, 1956).
Sin embargo, los hallazgos de la investigación con palomas y leves descargas
eléctricas pueden no ser directamente aplicables a los seres humanos en contextos clínicos.
En los dos únicos estudios que examinan la generalización del estímulo con humanos en
laboratorio, la generalización fue relativamente difícil de obtener en estudiantes universitarios
y una forma clínicamente más relevante de castigo (O'Donnell y Crosbie, 1998; O'Donnell,
Crosbie, Williams, y Saunders, 2000). Se necesitan más investigaciones básicas con seres
humanos y no humanos para identificar los factores que influyen en el grado y la durabilidad
de la generalización del estímulo durante el castigo. Tales factores pueden incluir parámetros
de castigo o refuerzo (e.g., intensidad, cantidad, programación) y características de los
estímulos de generalización (e.g., saliencia).
De hecho, los resultados de numerosos estudios aplicados indican que los efectos de
castigo rara vez se trasladan a encuadres o contextos que no están asociados con la entrega de
castigos (e.g., Corte, Wolf y Locke, 1971, Doke y Epstein, 1975, Marholin y Townsend,
1978; Rollings, Baumeister, y Baumeister, 1977). Sorprendentemente pocos estudios han
evaluado estrategias para promover la generalización desde que Matson y Taras (1989)
lamentaron esta brecha en una revisión de 20 años de la literatura aplicada sobre el castigo.
En los primeros estudios, se descubrió que factores, como la presencia del terapeuta (Risley,
1968) y la proximidad del individuo al terapeuta o al ambiente de tratamiento (Lovaas y
Simmons, 1969, Rollings et al.), influyen en la generalización. Estos hallazgos son
consistentes con los de estudios básicos que muestran una relación positiva entre la cantidad

24
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

de supresión de respuesta y el grado de similitud entre los contextos de castigo y


generalización. Esta relación puede de hecho explicar por qué la generalización rara vez se ha
observado en los estudios aplicados. En la mayoría de los casos, el fenómeno se probó
mediante la alteración abrupta tanto del contexto del estímulo como de la contingencia
punitiva. Los participantes que siguieron exhibiendo al menos algunas instancias de la
conducta objetivo podrían fácilmente detectar la transición de un programa continuo de
castigo a la eliminación del castigo (Azrin y Holz, 1966). En los estudios básicos, la respuesta
finalmente se recuperó cuando los estímulos de generalización se presentaron repetidamente
en ausencia de castigo.
Por lo tanto, no es sorprendente que los efectos del castigo típicamente fallan la
generalización en ausencia de procedimientos diseñados para promover la transferencia
(Stokes y Baer, 1977). Varios autores han sugerido que las técnicas utilizadas para potenciar
la generalización bajo refuerzo pueden ser igualmente eficaces bajo castigo (por ejemplo,
Matson y DiLorenzo, 1984; Miltenberger, 2001). Algunos estudios aplicados sobre el castigo
han evaluado estrategias de generalización análogas a las utilizadas para promover efectos de
refuerzo. Por ejemplo, un estímulo común fue introducido dentro del tratamiento y contextos
de generalización (e.g., un estímulo discriminativo para el castigo se presentó en el marco de
la generalización; Birnbrauer, 1968), un estímulo que podía adquirir un control
discriminativo sobre el comportamiento fue eliminado del marco de tratamiento (e.g., el
terapeuta estaba oculto de la vista; Corte et al, 1971, Tate y Baroff, 1966), y un entrenamiento
que se llevó a cabo con múltiples ejemplares de estímulo (e.g., varios terapeutas diferentes
entregaron leves descargas eléctricas; Lovaas y Simmons, 1969). Sin embargo, en casi todos
los casos, estas estrategias eran ineficaces a menos que el castigo fuera entregado en el
contexto de la generalización.
Otras potenciales tácticas extraídas de la literatura sobre refuerzo, incluyen emparejar
el castigador con consecuencias naturalistas (e.g., reprimendas verbales), variando las
condiciones del estímulo durante el tratamiento inicial con castigo, proporcionando
instrucción sobre la autogestión, y usando castigo retrasado o intermitente (es decir,
contingencias indiscriminables; Stokes y Baer, 1977, véase también O'Donnell y Crosbie,
1998, Experimentos 3 y 4). La generalización también puede conseguirse implementando una
forma modificada del tratamiento en contextos de generalización (e.g., entregando una
cantidad menor de castigo o un solo componente de un procedimiento de tratamiento
multicomponente).
El conocimiento actual sobre el castigo, sin embargo, es insuficiente para guiar la
aplicación de tales estrategias. Por ejemplo, se ha encontrado que muchos factores que son
útiles para promover la generalización bajo refuerzo, tales como contingencias retrasadas o
intermitentes, socavan la eficacia del castigo (Azrin et al., 1963; Goodall, 1984; Trenholme y
Baron, 1975). Los efectos supresores de las consecuencias naturales y los derivados
componentes de las intervenciones complejas probablemente dependen del proceso de castigo
condicionado, un área que requiere más estudio. Por último, el desarrollo del control de
estímulos bajo castigo ha sido evaluado en pocos estudios básicos o aplicados (ver Rollings y
Baumeister, 1981, por una notable excepción). La generalización exitosa puede depender de
la presencia de estímulos que han adquirido un control estricto sobre la respuesta, de tal

25
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

manera que pocas respuestas se producen en ausencia de la contingencia de castigo. En


relación con la respuesta reforzada, puede ser difícil establecer el control sobre la respuesta
castigada con estímulos que no están perfectamente correlacionados con la entrega del
castigo. Así, más investigación en las áreas de castigo condicionado, control de estímulo, y el
castigo intermitente o retrasado parece ser crítico para el desarrollo de una tecnología de
generalización.
La literatura actual indica que el castigo debe ser presentado consistentemente en
todos los contextos relevantes. Sin embargo, varias estrategias de generalización descritas por
Stokes y Baer (1977) pueden ser útiles para promover la generalidad del tratamiento cuando
el procedimiento se extiende más allá del contexto inicial de tratamiento. Por ejemplo, se
podría disponer de una variedad de condiciones de estímulos en el entorno de tratamiento
inicial (e.g., diferentes cuidadores y compañeros podrían ser presentados, diversas actividades
se podrían programar, las características físicas del entorno podrían variar). Los estímulos
comunes a otros encuadres y contextos en los que se podría aplicar el castigo podrían
introducirse en el tratamiento inicial antes de que la intervención se aplique ampliamente. La
generalidad del tratamiento también puede mejorarse si se asegura que el refuerzo se
implemente de manera consistente en todos los entornos, incorporando ciertos aspectos de la
autogestión en el tratamiento (e.g., autocontrol) y estableciendo estímulos discriminativos
para el castigo en todos los encuadres y contextos (ver Stokes y Baer para más información
sobre los procedimientos de generalización).

Efectos Indirectos del Castigo


Los efectos del castigo en respuestas que pueden ocurrir de forma concurrente con la
conducta castigada también han sido estudiados en investigación básica y aplicada. Aumentos
colaterales en la agresión, conductas de escape y reacciones emocionales se encuentran entre
los efectos secundarios más descritos en libros de texto básicos y revisiones de literatura
(e.g., Azrin y Holz, 1966; Mazur, 1998) así como por autores que recomiendan evitar el uso
de castigo en contextos clínicos (e.g., LaVigna y Donnellan, 1986; McGee, Menolascino,
Hobbs, y Menousek, 1987; Parsons et al., 2001). La agresión (es decir, atacar sujetos
cercanos, morder objetos inanimados) en ratas, palomas y monos, ha sido asociada con
entregas no contingente de estímulos aversivos inevitables, incluyendo leves descargas
eléctricas y calor intenso (e.g., Hutchinson, 1977; Ulrich y Azrin, 1962). Aunque este
fenómeno usualmente es llamado agresión provocada por castigo, pocos estudios han
examinado este efecto secundario del castigo. Hallazgos básicos acerca de los efectos de
castigos inescapables e intensos, probablemente tienen generalidad limitada en la aplicación
del castigo (para mayor información, ver Linscheid y Meinhold, 1990). Más aún, se ha
observado una disminución en agresiones provocadas en monos y ratas, cuando los sujetos
podían emitir una respuesta (e.g., presión de palanca) para escapar de la situación en la que se
presentaba el estímulo (e.g., Azrin, Hutchinson, y Hake, 1966). Este hallazgo sugiere que la
agresión provocada, puede ser menos problemática durante el castigo de lo que usualmente se
asume porque la contingencia, por si sola provee de una respuesta de escape (es decir, entrega
del castigador puede ser evitada al abstenerse de ejecutar la conducta castigada). De hecho,
los resultados de variados estudios con ratas muestran que las respuestas emocionales como

26
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

agazaparse o defecarse, eran más pronunciadas y persistentes, cuando los sujetos eran
expuestos a descargas inevitables que cuando eran expuestos a estimulación contingente con
la respuesta (Hearst, 1965; Hunt y Brady, 1955).
Por otra parte, numerosos estudios básicos indican que otras formas de
comportamiento no castigado, incluyendo respuestas que ocurren en la ausencia de
consecuencias programadas (e.g., conductas específicas a la especie) y aquellas que son
mantenidas por refuerzos entregados por el experimentador pueden aumentar, disminuir o
mantenerse sin cambios durante el castigo. Los factores que determinan si un
comportamiento no castigado aumentará, o disminuirá (llamados contraste e inducción,
respectivamente) no han sido estudiados exhaustivamente. La función del comportamiento,
programa e intensidad del castigador y exposición previa al mismo podrían ser importantes
(para una discusión, ver Crosbie et al., 1997).
En una serie de estudios, Dunham y sus colegas examinaron los efectos del castigo en
jerbos al entregar leves descargas contingentes a una respuesta (e.g., comer) mientras se
medían cambios en respuestas alternativas (e.g., cavar, acicalarse, correr). Los resultados
indicaron que las respuestas más probables de no ser castigadas aumentó durante el castigo,
mientras que las respuestas que tendían a seguir la respuesta castigada, disminuyeron
(Dunham, 1977, 1978; Dunham y Grantmyre, 1982). Un estudio subsecuente, sugirió que la
función del comportamiento no castigado también podría determinar estos efectos
secundarios. Baker, Woods, Tait y Gardiner (1986]) encontraron que cuando a los jerbos se
les castiga la conducta de comer con leves descargas o ruido, aumenta la conducta de cavar
incluso si correr era la respuesta más probable durante el establecimiento de la línea base. Los
autores sugirieron que cavar era una respuesta específica a la especie frente a la privación de
comida (es decir, cavar estaba en la misma clasificación de respuesta en que se encuentra
comer). Los resultados de estudios en comportamiento que es mantenido en la ausencia de
refuerzos programados por el experimentador podrían tener alguna relevancia en
comportamientos problemáticos que generan sus propias consecuencias reforzadoras (e.g.,
estimulación sensorial).
En otros estudios básicos con humanos y palomas, se utilizó el mismo refuerzo para
establecer y mantener dos o más respuestas equivalentemente funcionales (e.g., picoteo de
claves, presión de palanca) bajo programas múltiples o concurrentes. Luego, se entregaron
castigos como descargas leves, tiempo fuera y pérdida de puntos o dinero, para uno de los
miembros de una clase de respuestas establecidas en el paso anterior, mientras se observaban
los efectos en las otras respuestas. El hallazgo más común tanto para animales humanos como
no humanos fue un aumento en la conducta no castigada (es decir, contraste; Bennet y
Cherek, 1990; Bradshaw, Szabadi, y Bevan, 1991; Powell, 1971; Thomas, 1968). Sin
embargo, los resultados fueron inconsistentes tanto inter como intra sujetos, y los efectos (es
decir, un aumento en la conducta más probable y una disminución del comportamiento que
usualmente seguía a la conducta castigada) tuvieron una corta duración (Dunham, 1977,
1978; Dunham y Grantmyre, 1982). Los hallazgos principales de Dunham y sus colegas no
pudieron ser replicados con estudiantes universitarios cuando estos se le reforzaban hasta 10
respuestas simultáneamente y una respuesta fue expuesta a pérdidas de puntaje contingente
(Crosbie, 1990, 1991).

27
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

Desde un punto de vista clínico sería deseable los aumentos colaterales en conductas
apropiadas y disminuciones colaterales en conductas inapropiadas no castigadas. De hecho,
hallazgos en investigaciones aplicadas sugieren que una variedad de efectos secundarios
deseables e indeseables pueden ocurrir en los individuos. El castigo del comportamiento
problemático ha sido asociado con aumentos en comportamiento apropiado, tal como
obediencia y jugar con juguetes (e.g., Koegel, Firestone, Kramme, y Dunlap, 1974; Rolider,
Cummings, y Van Houten, 1991) y con disminuciones en conductas inapropiadas no
castigadas, incluyendo agresiones y llantos (e.g., Bitgood, Crowe, Suárez, y Peters, 1980;
Lovaas y Simmons, 1969; Linscheid et al., 1990; Ricketts et al., 1993; Singh, Watson, y
Winton, 1986). Por otra parte, disminuciones en comportamientos apropiados (e.g., juego con
juguetes, hablar) y aumentos en comportamientos problemáticos apropiados no castigados
(e.g., agresión, reacciones emocionales, comportamiento estereotipado) también han sido
reportados (e.g., Bitgood et al., 1980; Duker y Seys, 1996; Foxx y Azrin, 1973; Harris y
Wolchick, 1979; Pendergrass, 1971; Singh, Manning, y Angell, 1982; Thompson et al.,
1999). Numerosos autores han sugerido que es más probable que ocurran efectos secundarios
deseables que efectos secundarios indeseables durante un tratamiento con castigo (para
revisiones, ver Lundervold y Bourland, 1988, y Matson y Taras, 1989). Se desconoce la
prevalencia de estos efectos secundarios, debido a que hay relativamente pocos estudios han
examinado directamente los efectos del castigo en comportamientos no castigados en marcos
clínicos. Más importante, la recolección de datos usualmente se limitaba a uno o dos
comportamientos colaterales (para una excepción notable ver, Sisson, Hersen, y Van Hasselt,
1993). Efectos secundarios positivos también podrían haber sido reportados más
frecuentemente que los efectos secundarios indeseables en estudios clínicos sobre castigo,
independientemente de la prevalencia real.
A pesar de que la investigación en esta área está relativamente incompleta, hallazgos
básicos sugieren algunas explicaciones posibles para los resultados inconsistentes que se han
obtenido en estudios aplicados. Agresión y reacciones emocionales provocadas por el castigo
son menos probables cuando la exposición al estímulo castigador puede ser reducida o
evitada (e.g., Azrin et al., 1966; Hunt y Brady, 1955). Así estos efectos secundarios
indeseables podrían ser menos probables de ocurrir en estudios clínicos, cuando un castigador
relativamente corto suprimió el comportamiento a niveles bajos o cuando una fuente
alternativa de reforzamiento fue altamente efectiva al fortalecer una respuesta incompatible.
A la inversa, agresiones y otros comportamientos inapropiados podrían haber aumentado en
algunos estudios aplicados porque las respuestas se encontraban en la misma clase que la
conducta castigada (Baker et al., 1984). Los resultados de múltiples estudios básicos con ratas
y palomas también indican que la probabilidad de contraste se relaciona positivamente con la
densidad del programa de castigo (e.g., Deluty, 1976; Thomas, 1968). De esta forma, los
aumentos en comportamientos no castigados podrían haber sido más probables cuando el
procedimiento de castigo fue implementado con un alto grado de integridad (es decir, siguió
consistentemente cada ocurrencia de la respuesta).
Algunos hallazgos básicos sugieren que el contexto podría ser un factor importante
para determinar qué respuestas aumentarán o disminuirán durante el castigo. Bolles, Holtz,
Dunn, and Hill (1980) encontraron que era más probable que ocurriera inducción en ratas

28
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

cuando la respuesta no castigada se realizaba bajo las mismas condiciones de estímulos que la
respuesta castigada (e.g., empujar versus. levantar la misma palanca) que cuando se usaban
distintas condiciones de estímulos (e.g., manipular palancas separadas). Crosbie et al. (1997)
encontraron que la inducción tanto en humanos como no humanos es más probable de ocurrir
bajo programas múltiples. Juntos, estos hallazgos sugieren que respuestas funcionalmente
equivalentes no castigadas probablemente disminuirían en estudios aplicados, si la respuesta
tendía a ser realizada en el mismo contexto en que se realizaba la respuesta castigada.
Se necesita más investigación para determinar si una conducta no castigada en
particular aumentará, disminuirá o se mantendrá sin cambios durante el castigo, para que la
dirección y naturaleza de los efectos secundarios puedan ser predichos y controlados.
También se necesita más investigación para determinar si estos efectos secundarios son
específicos al castigo debido a que se han obtenido resultados similares cuando una respuesta
se suprimía a través de la saciedad o bloqueo de la respuesta (e.g., Dunham y Grantmyre,
1982), indicando que dichos efectos podrían estar asociados con la supresión de una respuesta
por sí mismos. De hecho, diversos efectos secundarios indeseados del castigo (e.g., aumentos
en la agresión, escape y reacciones emocionales) podrían estar asociados con procedimientos
de extinción (Lerman y Iwata, 1966a) que usualmente fueron confundidos con castigos en
investigaciones aplicadas.
Sin embargo, hallazgos básicos sugieren numerosas estrategias que podrían ser
potencialmente útiles en ámbitos clínicos. Agresiones o respuestas emocionales (e.g., llorar)
provocadas por el castigo pueden ser atenuadas al implementar procedimientos que
minimizan la exposición al estímulo castigador (e.g., usar estímulos breves que producen una
supresión casi completa de la conducta; fortalecer respuestas competitivas al entregar
refuerzos potentes en programas enriquecidos). Análisis comprensivos, descriptivos o
funcionales de comportamientos apropiados e inapropiados en el repertorio conductual de un
sujeto, pueden ser de utilidad para predecir la probabilidad de efectos secundarios indeseados
y para arreglar condiciones para crear efectos deseables. Asegurarse de que los cuidadores
retiren el refuerzo de conductas problemáticas no castigadas, podría prevenir aumentos
secundarios en conductas que se encuentran en la misma clase de respuesta que las respuestas
castigadas. Si no se puede utilizar la extinción, podrían ser necesarias estrategias alternativas
para manejar los efectos indeseados de contraste (e.g., organizar castigos para otras
respuestas inapropiadas). Identificar y castigar precursores de conductas peligrosas (e.g.,
formas medias de autolesiones que consistentemente preceden formas más severas) puede
llevar a reducciones secundarias en la conducta severa, aumentando la seguridad y eficacia
del tratamiento (e.g., Dunham, 1977, 1978). Se podrían evitar reducciones colaterales de
conductas apropiadas funcionalmente equivalentes si se organizan refuerzos del
comportamiento bajo condiciones de estímulos que son diferentes de aquellas presentes
cuando ocurre la conducta castigada (e.g., al modificar claves del ambiente o introducir
refuerzos en un nuevo contexto). Para esto, los cuidadores deberían asegurarse de que haya
disponibilidad de refuerzos alternativos para múltiples respuestas a lo largo de variados
contextos y encuadres.
Finalmente, la literatura aplicada debería dar más atención al potencial de los efectos
secundarios indeseados que involucran la conducta del cuidador (e.g., sobre utilización del

29
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

castigo, deshumanizar al individuo castigado). A pesar de que estos efectos son


frecuentemente descritos en libros de textos y revisiones (e.g., Cooper et al., 1987; Guess et
al., 1987; Kazdin, 2001), pocos estudios han evaluado directamente los cambios en los
agentes castigadores del comportamiento. Hallazgos de investigaciones que son relevantes
para este fenómeno no han apoyado la hipótesis de que usar castigo afecta negativamente el
comportamiento del cuidador o las actitudes hacia el individuo castigado (e.g., Bihm,
Sigelman, y Westbrook, 1997; Goza, Ricketts, y Perkins, 1993; Harris, Handleman, Gill, y
Fong, 1991; Propst y Nagle, 1981). Bihm et al., por ejemplo, encontraron que las actitudes de
estudiantes universitarios hacia un cliente ficticio (es decir, puntuaciones de las
competencias, ajuste y potencial de aprendizaje del cliente) se relacionaron con el éxito del
tratamiento más que con el tipo de intervención utilizado (es decir, refuerzo vs. castigo
mediano o intenso).

Conclusiones
El uso del castigo para tratar comportamientos problemáticos en poblaciones clínicas
ha sido un tema controversial por muchos años (ver Iwata, 1988; Johnston, 1991). Los
resultados de investigaciones básicas y aplicadas indican que las aproximaciones actuales del
tratamiento basadas en castigo tienen ventajas (e.g., son altamente efectivas) y desventajas
(e.g., tienen efectos secundarios impredecibles). Sin embargo, a veces aún se necesita el
castigo para reducir comportamientos destructivos a niveles aceptables (e.g., Grace et al.,
1994; Hagopian et al., 1998; Wacker et al., 1990); el castigo podría ser la verdadera causa de
los efectos de algunos tratamientos comunes basados en la función (e.g., Lerman y Iwata,
1996b; Mazaleski et al., 1994); y los cuidadores continúan usando el castigo para reducir
comportamientos problemáticos en ambientes naturales (e.g., Peterson y Martens, 1995).
Se necesita un entendimiento más profundo de los procesos del castigo para
desarrollar una tecnología sistemática y efectiva del cambio del comportamiento. Una
revisión de la literatura aplicada indica que una amplia variedad de procedimientos de castigo
puede tratar exitosamente desórdenes conductuales severos en poblaciones clínicas. Sin
embargo, aún no se han delineado las variables involucradas en los hallazgos reportados en
esta investigación. La mayoría de los estudios se enfocan en variaciones procedurales del
castigo en lugar de los factores que podrían influenciar los efectos directos e indirectos del
castigo. Una revisión de investigaciones de laboratorio sobre el castigo sugiere que
numerosas variables alteran los procesos básicos de formas complejas. Factores como la
historia, programas de reforzamiento, varios parámetros de castigo y fuentes alternativas de
refuerzo podrían influenciar los efectos inmediatos de castigo y otros resultados clínicamente
relevantes, tales como la mantención a largo plazo, generalización y la emergencia de efectos
secundarios. Hallazgos básicos también contradicen algunas asunciones sostenidas
comúnmente acerca de los efectos del castigo y proveen posibles explicaciones para los
hallazgos inconsistentes que han sido reportados en estudios aplicados.
No obstante, el conocimiento actual acerca de los procesos básicos es insuficiente
para el traspaso a aplicaciones. Aún está incompleta la literatura básica sobre algunas
relaciones importantes (Baron, 1991; Crosbie, 1998). Más importante, el nivel al que los
hallazgos con sujetos no humanos y leves descargas eléctricas contingentes con la respuesta

30
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

se pueden extrapolar a tratamientos de desórdenes conductuales en poblaciones clínicas


podría ser sustancialmente limitado. Aunque algunos estudios básicos han sido realizados con
participantes humanos, el castigo (pérdida de puntos o dinero) y la población (adultos
normales) típicamente usados podrían limitar la importancia de estos resultados en individuos
con habilidades verbales restringidas (para mayor discusión ver Hayes y McCurry, 1990).
La investigación sobre castigo sólo apoya tentativamente la mayoría de las
prescripciones de la aplicación discutida en artículos previos sobre castigo y en esta revisión
actualizada de la literatura. Los hallazgos básicos también sugieren que los procesos de
castigo pueden ser más complejos de lo que se asume con frecuencia. De tal forma, clínicos,
padres y profesores deberían ser advertidos acerca de la necesidad de mayor investigación
acerca de las estrategias potenciales para aumentar la efectividad de castigos medianos, para
atenuar los aspectos indeseables del castigo, y para detener exitosamente el tratamiento con
castigo.
La literatura básica sugiere numerosos caminos para continuar la investigación. En
particular, conocimiento sobre castigo condicionado, intermitente y retrasado, y los efectos
interactivos del refuerzo y el castigo pueden llevar a avances tecnológicos que aumenten la
efectividad y aceptabilidad de castigo en encuadres clínicos. Programas concurrentes de
reforzamiento y castigo están especialmente relacionados con la aplicación porque en
ambientes naturales típicamente operan múltiples contingencias. El tratamiento también
podría tener una mayor probabilidad de éxito inmediato, a largo plazo y generalizado, cuando
se programan múltiples fuentes de refuerzo en el contexto de castigo.
El refinamiento de metodologías de análisis funcional ha llevado a una mayor
comprensión de las variables que pueden mantener comportamientos problemáticos y a un
énfasis en intervenciones basadas en la función. Aún, usualmente se pasan por alto algunos
enlaces entre la función y los tratamientos basados en castigo que son potencialmente
importantes. Futuras investigaciones deberían enfatizar la utilidad del análisis funcional para
guiar decisiones sobre tratamientos potenciales que incluyen un componente de castigo. Los
resultados de análisis funcionales podrían indicar si un tratamiento sólo con refuerzo (e.g.,
reforzamiento diferencial) o con procedimientos comunes de castigo (e.g., tiempo fuera,
reprimendas verbales) serán exitosos. Por ejemplo, el tiempo fuera tiene más probabilidades
de ser efectivo que reprimendas verbales contingentes, si el comportamiento problemático es
sensible a la atención (Iwata, Pace, Dorsey, et al., 1994). Las conductas problemáticas que
ocurren en altos niveles a lo largo de una amplia variedad de condiciones podrían responder
menos a los tratamientos con reforzamiento que las conductas que son diferencialmente
menores bajo condiciones específicas (e.g., la condición de juego o control del análisis
funcional; ver Paisey, Whitney, y Hislop, 1990). La metodología del análisis funcional
también podría ser de utilidad para identificar refuerzos potentes que pueden ser usados en el
tratamiento (e.g., para ser usados en reforzamientos diferenciales o procedimientos de
refuerzo no contingentes) y para identificar conductas apropiadas que sean funcionalmente
equivalentes para ser fortalecidas como parte del tratamiento.
Finalmente, una mayor disposición a publicar estudios que muestren fracasos u otras
consecuencias indeseadas de los tratamientos con castigo podría ser de utilidad. Por ejemplo,
intentos poco exitosos para atenuar efectos secundarios, aumentar la eficacia del castigo

31
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje

retardado, o promover la mantención y generalización a largo plazo podrían guiar futuras


investigaciones para delinear las variables que son relevantes y aquellas que no lo son para
aplicaciones clínicas. Finalmente, este conocimiento puede llevar a recomendaciones de
tratamiento empíricamente fundadas que sean más efectivas.

32

También podría gustarte