Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
1
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
2
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
3
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
4
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
5
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
describe con más detalle a continuación, los resultados de estudios que emplean este tipo de
manipulaciones con comportamientos mantenidos ya sea por consecuencias sociales o no
sociales podrían conducir a una mayor comprensión de los procesos de castigo y tratamientos
mejorados.
Como se discutirá en las siguientes secciones, se ha encontrado que una serie de
factores directamente relevantes para el desarrollo de una tecnología aplicada influyen en los
efectos directos del castigo. Estos factores incluyen variables históricas (por ejemplo,
experiencia previa con el estímulo de castigo o refuerzo intermitente); el uso de castigos
condicionados; variables de refuerzo (por ejemplo, programa, disponibilidad de fuentes
alternativas de refuerzo); y variables de castigo (por ejemplo, magnitud, inmediatez,
programa). Sin embargo, gran parte de la investigación sobre estos factores se ha realizado en
el laboratorio básico y nuestro conocimiento de algunas relaciones complejas importantes es
relativamente incompleto (Baron, 1991).
Historia
Los hallazgos básicos indican que la exposición previa a ciertos factores puede alterar
la respuesta durante el castigo, fenómeno que es especialmente relevante para la aplicación
del castigo, porque las poblaciones clínicas suelen tener diversas historias de aprendizaje. Los
resultados de numerosos estudios básicos han demostrado que la experiencia previa con el
estímulo punitivo (que se utiliza como castigo) ya sea contingente o no a la respuesta, puede
disminuir la sensibilidad del castigo y disminuir sus efectos (por ejemplo, Capaldi, Sheffer,
Viveiros, Davidson y Campbell, 1985; Halevy, Feldon y Weiner, 1987). Por ejemplo, los
hallazgos de la investigación con ratas indican que la exposición al castigo intermitente con
leves descargas eléctricas disminuye la eficacia del posterior castigo con descargas leves pero
continuas, incluso cuando transcurren varios días o semanas entre el castigo intermitente y
continuo (Banks, 1967; Halevy et al.; Shemer y Feldon, 1984). Deur y Parke (1970)
replicaron este efecto en niños con desarrollo normal utilizando un zumbador fuerte como
estímulo de castigo.
Aunque la adaptación al estímulo punitivo puede explicar estos hallazgos (Capaldi et
al., 1985), se ha obtenido una relación similar con el refuerzo intermitente. Es decir, las ratas
y los estudiantes universitarios que para una respuesta presentaron un historial de refuerzo
intermitente, mostraron menor supresión de esta conducta cuando se les aplicó castigo
continuo o intermitente con descargas leves, en comparación a los participantes con una
historia de refuerzo continuo (por ejemplo, Brown y Wagner, 1964; Estes, 1944; Halevy et al,
1987; Vogel-Sprott, 1967). Además, Eisenberger, Weier, Masterson y Theis (1989)
encontraron que la resistencia al castigo con descargas leves aumentó para una respuesta
(presión de palanca) en ratas, después de que una situación topográficamente diferente fue
expuesta a refuerzo intermitente.
En situaciones clínicas, es probable que un individuo experimente castigos comunes,
(reprimendas verbales, ‘tiempo fuera’) antes de que estas consecuencias estén
específicamente arregladas para tratar un comportamiento inapropiado en particular. Además,
la exposición a programas intermitentes de refuerzo y castigo es típica en el entorno natural.
A menudo se entregan consecuencias en programas intermitentes porque es difícil para los
6
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
padres y maestros reforzar o castigar cada vez que se ejecuta un comportamiento. Cuando los
intentos iniciales de tratar un comportamiento con castigo intermitente fracasan, los
cuidadores pueden cambiar a un programa continuo de castigo en un intento de mejorar la
eficacia del tratamiento. Los hallazgos básicos indican que una historia con castigo
intermitente puede complicar el éxito del tratamiento en estos casos, de tal manera que se
requerirán castigadores más intensos para suprimir el comportamiento de manera efectiva
(Halevy et al., 1987; Shemer y Feldon, 1984). Sin embargo, se desconoce la relevancia de
estos hallazgos para los tipos de castigos que se usan más comúnmente en entornos clínicos
porque casi todos los estudios básicos en esta área evaluaron los efectos de leves descargas
eléctricas y ningún estudio aplicado ha replicado y extendido estos hallazgos a
comportamientos problemáticos.
Sin embargo, los hallazgos básicos en esta área sugieren algunas pautas importantes
para la investigación clínica y la práctica. En primer lugar, puede ser beneficioso para los
cuidadores identificar castigos novedosos al diseñar los tratamientos y evitar el uso de
consecuencias comunes, tales como reprimendas verbales y tiempo-fuera de manera no
sistemática o no planificada. En segundo lugar, no deben aplicarse programas de castigo
intermitentes antes de programas continuos. En tercer lugar, si la adaptación al estímulo de
castigo explica la disminución de la sensibilidad del comportamiento (Capaldi et al., 1985),
puede resultar útil un breve intervalo de castigo, tal como se describe con más detalle a
continuación (Rachlin, 1966). Otra estrategia potencialmente útil para minimizar la
exposición a cualquier castigador único es alternar entre varios procedimientos de castigo
eficaces en lugar de usar un solo procedimiento (por ejemplo, Charlop, Burgio, Iwata y
Ivancic, 1988).
Estímulos Condicionados
Estímulos neutrales que son emparejados con estímulos de castigo pueden adquirir las
propiedades de dicho estímulo castigador. Resultados de estudios básicos indican que estos
estímulos condicionados pueden funcionar como castigadores cuando son entregados
contingentemente con el comportamiento en ausencia del estímulo primario o incondicionado
(e.g., Hake y Azrin, 1965). Los castigadores condicionados pueden ser útiles en incrementar
tanto la efectividad como la aceptación del castigo dentro de un contexto clínico. Suponga
que una consecuencia relativamente no intrusiva, pero ineficaz (e.g., una breve clave verbal)
fue establecida y mantenida como un potente castigador condicionado vía emparejamientos
intermitentes con una intervención más restrictiva y lenta (e.g., sobre corrección, tiempo-
fuera). La aplicación del castigador condicionado debería reducir tanto la exposición de los
individuos a la intervención del castigador incondicionado como también el grado de
esfuerzo requerido por los cuidadores para implementar el tratamiento, factores que podrían
evitar problemas con la inconsistencia del programa, habituación al castigador
incondicionado, y problemas éticos asociados con el uso de algunos procedimientos.
Varios estímulos han sido establecidos como castigadores condicionados en
laboratorios básicos, incluyendo tonos, luces, y descargas eléctricas más leves de lo habitual
(e.g., Crowell, 1974; Davidson, 1970; Hake y Azrin, 1965). El estímulo incondicionado fue
una leve descarga eléctrica (excepto en algunos casos, e.g., Trenholme y Baron, 1975) y los
7
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
sujetos fueron ratas o palomas. Los castigadores condicionados fueron establecidos por dos
métodos principales. Bajo uno de los métodos, el estímulo condicionado era presentado antes
del comienzo de un estímulo inescapable (e.g., las descargas eran entregadas de forma
independiente de las respuestas) para luego ser removido con el comienzo del estímulo
incondicionado (e.g., Hake y Azrin 1965; Mowrer y Solomon, 1954), o bien el estímulo
condicionado era mantenido en el ambiente mientras se entregaba el estímulo incondicionado
periódicamente (e.g., Orme-Johnson y Yarczower, 1974). Los resultados de los distintos
estudios indicaron que había un mayor condicionamiento si el estímulo condicionado era
presentado antes de la ocurrencia del estímulo incondicionado en vez de forma simultánea o
posterior a la presencia de dicho estímulo incondicionado (e.g., Evans, 1962; Mowrer y
Aiken, 1954).
Bajo el otro método, el estímulo condicionado fue establecido como un estímulo
discriminador para el castigo. Es decir, la presencia del estímulo condicionado era
correspondido con la entrega del estímulo incondicionado contingente a la respuesta (e.g.,
Davidson, 1970). Aunque posteriormente se ha observado que el estímulo discriminativo
suprime la respuesta cuando es entregado contingentemente con el comportamiento, los
resultados de Orme-Johnson y Yarczower (1974) indican que el estímulo establecido como
discriminativo era mucho menos efectivo que los castigadores condicionados establecidos en
el método anterior. Independiente del método de condicionamiento utilizado, las
investigaciones han mostrado que los efectos de los castigadores condicionados en el
comportamiento son temporales, a menos que el estímulo condicionado e incondicionado
continúen estando emparejados en algún grado (Davidson, 1970; Hake y Azrin, 1965).
Unos pocos estudios básicos han evaluado los factores que aparentemente influencian
el proceso de condicionamiento, como la magnitud del estímulo incondicionado (Mowrer y
Solomon, 1954) y la duración del estímulo condicionado (Hake y Azrin, 1965). Sin embargo,
otros parámetros clínicamente relevantes del condicionamiento, como el número de
emparejamientos entre el estímulo condicionado e incondicionado, el tipo de castigador
incondicionado usado, y las características del estímulo condicionado (e.g., intensidad o
saliencia), deberían ser examinados en futuras investigaciones. Adicionalmente, los estímulos
condicionados típicamente fueron establecidos y mantenidos independientes de la respuesta,
un método que posiblemente involucraría preocupaciones éticas si se extendiera a
poblaciones clínicas. Aunque podría ser más aceptable el emparejar estímulos condicionados
e incondicionados contingentemente con los problemas de conducta, las oportunidades para
condicionar el estímulo se verían severamente restringidas si el castigador incondicionado
suprime el problema conductual a niveles bajos.
El uso de castigadores condicionados en el tratamiento de problemas conductuales ha
sido reportado, sorprendentemente, en muy pocos estudios aplicados. Más importante aún,
ningún estudio aplicado se ha centrado exclusivamente en el método para desarrollar y
mantener estímulos como castigadores condicionados en contexto clínico. Lovaas y Simmons
(1969) emparejaron contingentemente la palabra “no” (estímulo condicionado) con una leve
descarga eléctrica (Estímulo incondicionado) en un paciente que presentaba un severo caso
de autolesión. La breve reprimenda verbal fue entonces presentada en ausencia del estímulo
incondicionado durante un limitado número de sesiones. Y los resultados sugieren que el
8
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
estímulo condicionado había adquirido las propiedades sorpresivas del castigador original. En
una evaluación más exhaustiva, Dorsey, Iwata, Ong, y McSween (1980) emparejaron
contingentemente la palabra “no” con niebla de agua con dos participantes que comenzaron a
autolesionarse. Los resultados muestran que la presentación contingente del estímulo verbal
mantuvo bajos niveles de autolesión cuando la niebla de agua fue retirada del contexto de
tratamiento original. A su vez, los efectos sorpresivos de la reprimenda verbal se
generalizaron a una configuración que no había sido previamente asociada con el
procedimiento de la niebla de agua, así como también, a otros terapeutas que nunca habían
utilizado la niebla de agua. Finalmente, Dixon, Helsel, Rojahn, Cipollone, y Lubertsky (1989)
emparejaron un castigador más suave e inefectivo (pantalla visual) con un castigador más
efectivo (el hedor del amoniaco) mientras trataban la agresión y disrupción mostrada por un
joven con trastorno del desarrollo. Los problemas conductuales se mantuvieron suprimidos
por un corto tiempo cuando la pantalla visual fue usada sola.
Aunque los resultados de estos tres estudios indican que los castigadores
condicionados fueron establecidos exitosamente en problemas clínicos, la eficacia del
tratamiento fue evaluada a lo largo de un limitado número de sesiones cortas. Estudios
básicos han mostrado que los efectos de los castigadores condicionados en la conducta son
temporales a menos que el estímulo condicionado e incondicionado continúen asociados de
alguna manera (Davidson, 1970; Hake y Azrin, 1965). Adicionalmente, los detalles
necesarios para replicar el procedimiento de condicionamiento (e.g., método de
emparejamiento, número total de emparejamientos, reglas para determinar cuándo testear el
efecto condicionado) no fueron proporcionados. La generalidad de estos hallazgos y aquellos
obtenidos en los laboratorios básicos puede también estar limitada por el uso de castigadores
incondicionados relativamente intrusivos (es decir, descargas pequeñas, niebla de agua,
amoniaco).
En consecuencia, el conocimiento actual sobre castigadores condicionados se
encuentra mayoritariamente incompleto, y las prescripciones para la aplicación de
castigadores condicionados debe esperar futuras investigaciones. La eficacia de emparejar
varios tipos de estímulos, auditivos, táctil y visual deben ser evaluadas con formas más
comunes y socialmente aceptables de castigo (e.g., tiempo fuera). El número de
emparejamientos requeridos para producir condicionamiento, así como los factores que
pueden alterar el resultado del condicionamiento (e.g., intensidad del estímulo condicionado)
pueden ser evaluados mediante el testeo periódico de los efectos de supresión del estímulo
condicionado en ausencia del castigador incondicionado. La durabilidad del
condicionamiento podría ser determinada mediante la presentación del estímulo condicionado
en ausencia del castigador incondicionado hasta que los efectos en la respuesta se disipen.
Esta estrategia puede también ser útil cuando se desarrolla un programa de emparejamiento
para los estímulos condicionados e incondicionados con tal de mantener el condicionamiento
en el tiempo. Por ejemplo, personal clínico podría determinar el número máximo de veces
que un estímulo condicionado puede estar presente antes que los efectos condicionados
comiencen a extinguirse. Entonces, el estímulo condicionado e incondicionado podrían ser
emparejados regularmente antes dicho número,
9
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
Programa de refuerzo
Estudios básicos indican que las características de responder durante el castigo
pueden depender del programa de reforzamiento que mantiene la conducta, un factor
especialmente relevante para la aplicación ya que es probable que los problemas en la
conducta sean mantenidos por alguna forma de refuerzo durante el tratamiento. La conducta
podría ser concurrentemente expuesta a programas de refuerzo cuando los cuidadores no
retengan completamente las consecuencias sociales durante el tratamiento, o cuando la
conducta es mantenida por refuerzo automático. Resultados de estudios básicos muestran
generalmente, que la cantidad de la supresión de la respuesta bajo castigo era inversamente
proporcional a la densidad del programa de refuerzo, siendo la extinción lo que provoca el
mayor decremento en la respuesta (Azrin y Holz, 1966). Varios parámetros del castigo (e.g.,
programa, intensidad) también parecen interactuar con la relación entre la supresión de la
respuesta y la densidad del refuerzo (Bouzas, 1977, 1978). Por ejemplo, Bradshaw y sus
colegas encontraron que la relación negativa entre la densidad del refuerzo y la supresión de
la respuesta era mucho más pronunciada cuando sujetos humanos eran expuestos a un
programa de castigo de pérdida monetaria de razón variable (RV) que a uno de intervalo
variable (IV).
Los programas de refuerzo intermitente examinados en el laboratorio han incluido
programas de intervalo fijo (IF), razón fija (RF), intervalo variable (IV), y razón variable
(RV). Aunque se ha observado que estos programas de refuerzo interactúan de forma
diferente con los efectos del castigo, dicha interacción no ha sido bien estudiada y es probable
que dependa en varios factores, como la densidad del refuerzo, el programa de castigo, la
cantidad de refuerzo perdido a raíz de la reducción en la respuesta (e.g., Powell, 1970; Scobie
y Kaufman, 1969; ver también Baron, 1991, para una mayor discusión). Las diversas formas
en que estos programas influencian los efectos del castigo son relevantes para una tecnología
aplicada, puesto que las contingencias sociales de los problemas de comportamiento a
menudo se aproximan a los arreglos de laboratorio en los ambientes naturales (e.g., Lalli y
Goh, 1993; Vollmer, Borrero, Wright, Van Camp, y Lalli, 2001). Estas complejas
interacciones entre programas de refuerzo y castigo también son, probablemente,
responsables de algunos de los inconsistentes hallazgos reportados en la literatura básica y
aplicada sobre el castigo (ver mayor discusión abajo). Adicionalmente, un mayor número de
estudios básicos en esta área son necesarios para clarificar estas relaciones.
El conocimiento sobre procesos básicos y prescripciones para mejores prácticas
cuando se utiliza castigo en situaciones clínicas estará incompleto sin una mayor evaluación
de la potencial interacción entre el programa de refuerzo y los parámetros del castigo. Sin
embargo, ningún estudio aplicado ha examinado los efectos del programa de refuerzo o la
densidad de este en el resultado de los tratamientos con castigo. Una mayor investigación
debería determinar si reducir la densidad del programa de refuerzo que opera en el ambiente
natural debería potenciar sustancialmente la eficacia de los procedimientos de castigo
comúnmente utilizados. De ser así, se necesitan estrategias para disminuir el programa de
refuerzo en tratamientos de problemas conductuales que utilicen castigo. Los parámetros bajo
los cuales el programa de refuerzo es y no es un factor importante cuando se tratan problemas
10
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
11
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
12
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
13
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
intensidad de descargas eléctricas, mientras los estudios aplicados se han enfocado en formas
de castigo más aceptables clínicamente (e.g., sobrecorrección, tiempo fuera).
En uno de los pocos estudios aplicados que ha evaluado la intensidad de las descargas
eléctricas, D. E. Williams, Kirkpatrick-Sánchez, e Iwata (1993) compararon la eficacia del
tratamiento para autolesiones con descargas de dos intensidades distintas (3,5 mA vs. 18,5
mA). Los resultados fueron consistentes con los obtenidos en estudios básicos. La
generalización de este hallazgo, sin embargo, es algo limitada debido a que el castigo fue
combinado con extinción. Además, efectos de secuencia pueden haber influenciado el
resultado debido a que el participante fue expuesto a la descarga de baja intensidad antes de
ser expuesto al de intensidad alta, y no se implementó un reverso de la condición de baja
intensidad (es decir, alta intensidad antes de baja intensidad).
Los resultados de estudios que han examinado la relación entre la intensidad del
castigo y la eficacia del tratamiento usando otros tipos de castigo (e.g., limitación o
restricción del movimiento, olores desagradables, tiempo fuera) han sido inconsistentes y
frecuentemente parecen estar mezclados con otras variables (e.g., Altman, Haavik, y Cook,
1978; Cole, Montgomery, Wilson, y Milan, 2000; Marholin y Townsend, 1978; Singh,
Dawson, y Manning, 1981). Por ejemplo, Cole et al. encontraron que el tratamiento con
sobrecorrección causó una disminución similar en conducta estereotipada tanto si el
tratamiento duró 30 segundos, 2 minutos u 8 minutos. Los efectos de la sobrecorrección, sin
embargo, pueden haber estado mezclados con los de la extinción y reprimendas verbales.
Estudios sobre la duración del tiempo fuera han mostrado una relación positiva (e.g.,
Burchard y Barrera, 1972; Hobbs, Forehand, y Murray, 1978), una relación negativa (e.g.,
Kendall, Nay, y Jeffers, 1975) y no relación (e.g., White, Nielsen, y Johnson, 1972) entre la
duración y efectos del tratamiento. Estos hallazgos son difíciles de interpretar debido a que
no se identificó la función de la conducta problema (y por tanto el tiempo fuera puede haber
estado contraindicado para algunos participantes), y efectos de secuencia pueden haber
confundido los resultados.
Más investigación acerca de la relación entre la intensidad del castigo y la respuesta al
tratamiento, así como sobre factores que pueden alterar esta relación (e.g., programa de
reforzamiento, demora del castigo) podría ser útil para reconciliar los resultados
inconsistentes en la literatura y para desarrollar guías más comprehensivas para la aplicación.
El supuesto común de que un castigo de mayor magnitud es más efectivo que uno de menor
magnitud no está ampliamente apoyado en la literatura actual, exceptuando los resultados en
descargas contingente. La intensidad debería ser manipulada en una variedad de castigos y de
maneras que no han sido examinadas por la investigación básica. Por ejemplo, la cantidad de
reforzamiento disponible durante el tiempo libre es una dimensión potencialmente importante
de la magnitud del castigo cuando se implementa un tratamiento de tiempo fuera (e.g.,
Solnick, Rincover, y Peterson, 1977).
También se deberían explorar estrategias para mejorar la supresión de respuesta y su
mantención bajo intensidades de castigo menos efectivas. Los resultados de la investigación
básica indican que magnitudes de castigo menores pueden ser más efectivas si el castigo se
entrega inmediatamente después de la conducta (e.g., Cohen, 1968) y si hay reforzamiento
disponible para una respuesta alternativa (e.g., Holz et al., 1963). Estudios básicos con
14
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
descargas también muestran que un castigo menos intenso puede ser efectivo, al menos
temporalmente, si resulta de un nivel de intensidad alto que disminuye a lo largo del tiempo
(e.g., Azrin, 1960; Cohen, 1968; Hake et al., 1967). Una aproximación que implique castigos
menos intensos presentados periódicamente entre castigos más intensos puede ser útil para
mantener los efectos del tratamiento mientras la magnitud del castigo se reduce
gradualmente. Como se mencionó anteriormente, mayor investigación en castigo
condicionado y tratamientos que combinen reforzamiento con castigo puede llevar también a
métodos para mejorar la efectividad de castigos suaves.
Finalmente, futuros estudios deberían evaluar métodos para identificar la magnitud de
un castigo dado antes de ser usado en un tratamiento en el ambiente natural. La típica
aproximación de ensayo y error para la selección del castigo es ineficiente y puede ser
contraproducente si un individuo recibe exposición prolongada a procedimientos inefectivos
(e.g., N. E. Miller, 1960; Terris y Barnes, 1969). Las estrategias eficientes para identificar el
tratamiento eficaz y menos restrictivo están sorprendentemente ausentes de la literatura
aplicada. En dos estudios ejecutados por Fisher y sus colegas (Fisher, Piazza, Bowman,
Hagopian, y Langdon, 1994; Fisher, Piazza, Bowman, Kurtz, et al., 1994) se evaluaron
rápidamente los potenciales efectos supresores de varios procedimientos (e.g., tiempo fuera,
cubierta facial, demandas contingentes) mediante la exposición de los participantes a los
castigos mientras se medían vocalizaciones negativas (e.g., gritos, llanto) y respuestas de
escape o evitación (e.g., tirarse al suelo). Cada procedimiento de castigo se entregó de manera
no contingente a lo largo de 5 duraciones diferentes, desde 15 hasta 180 segundos. Los
resultados del tratamiento mostraron que los procedimientos asociados con los mayores
niveles de vocalizaciones, respuestas de escape o de evitación fueron los castigos más
efectivos para la conducta problema. Sin embargo, los resultados de la evaluación inicial no
diferenciaron entre las varias duraciones para cada los participantes, quizás debido a que los
procedimientos alternaban rápidamente en un número limitado de ensayos. La utilidad de
tales evaluaciones debería ser evaluada en estudios futuros. Por ejemplo, una evaluación
separada de la magnitud del castigo, con un diseño similar al de Fisher et al., puede ser útil
cuando una evaluación inicial ha identificado un castigo potente.
Hasta que se conduzca mayor investigación aplicada sobre la intensidad del castigo,
los terapeutas debieran elegir magnitudes que se hayan mostrado seguras y efectivas en
estudios clínicos, en tanto la magnitud sea considerada aplicable y práctica por quienes
implementarán el tratamiento. El castigo debería ser además combinado con algún tipo de
reforzamiento, y debería ser entregado tan rápido como sea posible una vez que ocurra la
conducta problema (ver la discusión siguiente al respecto). Si el castigo falla en suprimir la
conducta, se deberían considerar procedimientos alternativos en vez de aumentar la magnitud
del castigo bajo el supuesto de que esta estrategia mejorará la eficacia del tratamiento.
15
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
castigo puede demorarse también cuando el individuo resiste activamente la aplicación de las
consecuencias programadas forcejeando o huyendo. En algunos casos la conducta problema
ocurre en ausencia de cualquier cuidador, lo que demora necesariamente la consecuencia
programada hasta que se detecta la ocurrencia de la conducta (Grace, Thompson, y Fisher,
1996; Van Houten y Rolider, 1988).
Por estas razones la investigación en demora del castigo es especialmente pertinente.
Resultados de laboratorio en ratas muestran que mientras más larga la demora entre la
ocurrencia de la conducta y la entrega de una leve descarga eléctrica contingente, menor la
cantidad de supresión de respuesta del castigo (e.g., Baron, Kaufman, y Fazzini, 1969; Camp,
Raymond, y Church, 1967). Incluso demoras breves de 10 o 20 segundos logran afectar
seriamente los efectos del castigo contingente con ratas y estudiantes universitarios (e.g.,
Banks y Vogel-Sprott, 1965; Goodall, 1984) y de pérdida del reforzamiento en estudiantes
universitarios (Trenholme y Baron, 1975).
Estímulos que podrían conectar el intervalo entre una respuesta y su consecuencia han
estado notoriamente ausentes de los diseños de laboratorio con castigo demorado. Resultados
de al menos un estudio sugieren que factores tales como la presencia de un castigo
condicionado y la entrega de instrucciones pueden alterar la eficacia del castigo demorado.
En Trenholme y Baron (1975), demoras de 10, 20 y 40 segundos fueron igualmente efectivas
en estudiantes universitarios cuando se presentaba un breve ruido asociado a la pérdida de
reforzamiento inmediatamente después de la ocurrencia de la conducta. Un experimento
siguiente mostró que el castigo demorado fue tan efectivo como el castigo inmediato cuando
los participantes recibieron instrucciones sobre la demora. No se ha determinado que tan
generalizables son estos resultados a poblaciones clínicas tales como personas con trastornos
del desarrollo. Además, ningún estudio básico ha evaluado el efecto de numerosos factores
potenciales en castigo demorado (factores como; historia, programa de reforzamiento,
disponibilidad de refuerzo alternativo).
Sorprendentemente, pocos estudios aplicados han evaluado la eficacia del castigo
demorado o estrategias para mejorar los efectos del tratamiento cuando las consecuencias no
ocurren de manera contigua a la conducta. En uno de los pocos estudios que han comparado
castigo inmediato y demorado, Abramowitz y O’Leary (1990) encontraron que reprimendas
verbales inmediatas fueron mucho más eficaces en disminuir la conducta de distracción en
escolares que retos con 2 minutos de demora. Sin embargo, estos resultados son algo difíciles
de interpretar debido a que las reprimendas demoradas se entregaban solo si la conducta de
distracción había ocurrido continuamente por 2 minutos, durante los cuales los estudiantes
tenían bastantes oportunidades de interactuar con otros estudiantes y objetos no relacionados
a la tarea. Así, los efectos de la demora del castigo no fueron separados de los efectos del
programa de reforzamiento y de castigo.
Los resultados de solo dos estudios han delineado las condiciones bajo las cuales el
castigo demorado puede producir resultados efectivos. Rolider y Van Houten (1985), y Van
Houten y Rolider (1988) demostraron la eficacia del castigo demorado usando varias
consecuencias mediadas en niños con problemas emocionales y del desarrollo. Una forma de
mediación incluía reproducir videos de la conducta disruptiva del niño grabados
anteriormente durante el día. Luego se entregaba la consecuencia castigadora (limitaciones
16
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
del movimiento, reprimendas verbales). En algunos casos, la grabadora era visible claramente
para el niño mientras era grabado, y se dio una explicación verbal de su rol en la entrega del
castigo demorado. Estos factores pueden haber servido para acortar el intervalo entre la
conducta inapropiada y su consecuencia (e.g., al funcionar como estímulo discriminativo para
el castigo; Trenholme y Baron, 1975). Sin embargo, para 1 participante ni las instrucciones
sobre el castigo demorado ni la consecuencia inmediata diseñada para señalizar que el castigo
se acercaba (una marca puesta en la mano del niño) fueron tan efectivos como el
procedimiento de video.
En Van Houten y Rolider (1988), los cuidadores guiaron físicamente 2 participantes a
ejecutar la conducta problema (agresión o robo) una vez se detectaron o reportaron
ocurrencias de la conducta. Los cuidadores entonces entregaron inmediatamente la
consecuencia castigadora (restricción del movimiento) a continuación de la respuesta guiada.
Si bien el tratamiento fue efectivo, no se examinó la eficacia del castigo demorado sin el
componente de respuesta guiada. Tampoco se especificaron la duración de la demora y de la
respuesta inmediata de los cuidadores a la conducta problema.
El conocimiento actual indica que los castigos suaves usados típicamente en contextos
clínicos serán inefectivos a menos que la consecuencia siga inmediatamente a la conducta
problema. Así, se necesita mayor investigación sobre los factores que puedan mejorar los
efectos del tratamiento con castigo demorado, especialmente de procedimientos o estímulos
que puedan cerrar el intervalo de tiempo entre la respuesta y su consecuencia. Es necesaria
investigación sobre la utilidad de entregar castigos condicionados, instrucciones y otros tipos
de estímulos asociados con consecuencias demoradas.
Hasta que se conduzcan más investigaciones, los profesores y cuidadores deberían
preocuparse de elegir castigos que puedan ser entregados fácilmente apenas ocurra la
conducta. Consecuencias que no requieran la proximidad del cuidador (es decir, estímulos
que puedan ser entregados o retirados desde cierta distancia) y tecnología para mejorar la
funcionalidad del castigo inmediato pueden ser de especial utilidad en este sentido. Aparatos
electrónicos que detecten la ocurrencia de la conducta problema y alerten a los cuidadores o
entreguen automáticamente la consecuencia pueden evitar los problemas del castigo
demorado (e.g., Linscheid, Iwata, Ricketts, Williams, y Griffin, 1990).
Sin embargo, también debería considerarse la temporalidad del castigo en relación
con la entrega de refuerzo, pues algunos estudios básicos han encontrado que el castigo
inmediato es menos efectivo que el demorado si el castigo inmediato precede al
reforzamiento mientras que el castigo demorado es presentado con posterioridad a este (e.g.,
Epstein, 1984; Rodríguez y Logan, 1980). Es posible que cuidadores diligentes puedan
responder a la conducta problema entregando inmediatamente el castigo prescrito (e.g., tarea
contingente, tiempo fuera), y manteniendo (inadvertidamente) el reforzamiento social (e.g.,
acceso a materiales). De manera similar, el castigo automatizado puede ser entregado de
manera inmediata y justo antes de consecuencias sociales o no sociales para la conducta
problema. Los resultados de otros estudios básicos, en los cuales la disponibilidad de refuerzo
para una respuesta se correlacionaba completamente con la entrega de un castigo inmediato
suave, mostraron que emparejar castigo y reforzamiento de esta manera estableció al estímulo
castigador como un reforzador condicionado positivo (e.g., Murray y Nevin, 1967; D. R.
17
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
Williams y Barry, 1966). Así, la temporalidad del castigo y del reforzamiento en el ambiente
natural debería ser evaluada cuidadosamente como parte del tratamiento
Programa de Castigo
Los efectos de los programas de castigo en la respuesta tienen implicancias relevantes
para la eficacia y aceptabilidad del tratamiento con castigo. Consecuencias entregadas de
manera intermitente que reduzcan exitosamente la conducta problema son más fáciles de
usar, consumen menos tiempo, y son menos intrusivas que consecuencias que tienen que
seguir a cada ocurrencia de la conducta. Los resultados de la investigación básica en palomas
y ratas sugieren que el castigo con leves descargas eléctricas o tiempo fuera no produce
resultados aceptables a menos que el castigo siga casi cada ocurrencia de la conducta en
casos en los cuales no hay alternativa disponible o cuando la densidad del reforzamiento no
es reducida (Appel, 1968; Azrin, Holz, y Hake, 1963; Deluty, 1976; Farley, 1980; Thomas,
1968).
Si bien cierta cantidad de estudios aplicados ha examinado la eficacia del castigo
intermitente para tratar conductas problemáticas, los resultados han sido inconsistentes, y las
condiciones bajo las cuales el castigo intermitente podría ser efectivo siguen siendo poco
claras. En algunos estudios, por ejemplo, programas de castigo intermitente fueron asociados
a una reducción significativa socialmente en la conducta, particularmente si la respuesta
había sido ya suprimida a niveles bajos mediante el uso de castigo continuo (e.g., Clark,
Rowbury, Baer, y Baer, 1973; Rollings y Baumeister, 1981; Romanczyk, 1977). Por otro
lado, en otros estudios incluso programas intermitentes densos fueron inefectivos para
algunos participantes (e.g., Calhoun y Matherne, 1975; Lerman et al., 1997). Resultados
básicos sobre los factores que interactúan con los efectos de los programas de castigo (e.g.,
programas de reforzamiento) podrían explicar por qué las aplicaciones clínicas han producido
resultados inconsistentes.
Primero, en estudios que han mostrado efectos significativos del tratamiento con
programas de castigo tenues (e.g., Barton, Brulle, y Repp, 1987; Clark et al., 1973;
Romanczyk, 1977), el castigo parece haber sido confundido con la extinción y otros
potenciales castigos (e.g., reprimendas verbales). Segundo, los parámetros de castigo
importantes (es decir, tipo, intensidad y programa) variaban considerablemente a lo largo de
los estudios. Resultados básicos indican que estas variables alteran la relación entre el castigo
intermitente y la supresión de respuesta. Aumentar la intensidad de un castigo, por ejemplo,
puede tanto mejorar como degradar la eficacia de un programa intermitente dependiendo de
otros factores (e.g., Appel, 1968; Lande, 1981). Ciertos programas de castigo (e.g., IV)
también han sido asociados con mayores disminuciones de la respuesta comparados con otros
programas (e.g., RF o IF; Azrin, 1956; Camp, Raymond, y Church, 1966), aunque la
naturaleza de esta relación es compleja (e.g., Arbuckle y Lattal, 1992) y parece estar
influenciada por el programa de reforzamiento que mantiene la conducta (e.g., Bradshaw et
al., 1977, 1978; Powell, 1970; Scobie y Kaufman, 1969).
En el único estudio aplicado que ha examinado la interacción entre el tipo o
intensidad del castigo y la intermitencia del programa, Cipani, Brendlinger, McDowell, y
Usher (1991) encontraron que un programa de castigo RV4 con aplicación contingente de
18
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
jugo de limón fue tan efectivo en reducir la conducta estereotipada de un niño como un
programa continuo. Un procedimiento de “sobrecorrección con guía manual” (es decir., guiar
físicamente el brazo del niño sobre su cabeza y hacia los lados 10 veces) también fue efectivo
cuando el procedimiento se entregó en un programa continuo. A diferencia del jugo de limón,
sin embargo, un programa RV4 con sobrecorrección no produjo reducciones clínicamente
significativas en el lenguaje.
Finalmente, interacciones entre programas de reforzamiento y castigo pueden dar
cuenta de los efectos idiosincráticos de castigo intermitente sobre la conducta. Por ejemplo,
Lerman et al. (1997) trataron la conducta autolesiva (CAL) de 5 participantes con un
programa de castigo continuo una vez que los resultados del análisis funcional mostraron que
la conducta estaba siendo mantenida por reforzamiento automático. Una aplicación inicial de
castigo intermitente (IF de 2 o de 5 minutos) fue inefectiva para 4 de los 5 participantes. El
programa de castigo continuo fue luego atenuado exitosamente a IF de 5 minutos para 2 de
estos participantes. En contraste, el castigo continuo fue necesario para suprimir CAL para
los otros 2 participantes, a pesar de intentos repetidos de atenuar el programa. Aunque la
función de la CAL había sido identificada con anterioridad al tratamiento, había importantes
parámetros de los reforzadores que eran desconocidos (e.g., programa, densidad, magnitud).
Estos parámetros, que muy probablemente variaban entre los participantes, pueden haber sido
responsables del éxito inconsistente del procedimiento de atenuación del programa.
Es necesaria más investigación sobre las interacciones entre el programa de castigo
(e.g., RV vs. IV) y otros parámetros de castigo y reforzamiento potencialmente importantes
para aclarar en qué condiciones el castigo intermitente sería o no efectivo. Pocos estudios han
evaluado directamente estrategias para atenuar sistemáticamente los programas de castigo o
para usar programas de alta variabilidad (y por tanto impredecibles). Combinar un programa
atenuado con un programa enriquecido de castigo condicionado es otra aproximación
potencial para mejorar la eficacia del castigo intermitente. Dependiendo de la naturaleza de
los castigos condicionados e incondicionados, este diseño puede ser más práctico que usar un
programa de castigo enriquecido por sí mismo. Un programa denso de reforzamiento
alternativo también puede promover la eficacia del castigo intermitente.
Otros tipos de programas de castigo examinados en el laboratorio básico, tales como
el castigo diferencial de tasas altas (CDTA) o de tasas bajas (CDTB), también podrían ser
útiles en contextos clínicos. Estos programas no especifican una contingencia directa entre la
entrega del castigo y la ocurrencia de una respuesta. Por ejemplo, en CDTA o CDTB, el
castigo se entrega de manera contingente con la pausa que precede inmediatamente a una
respuesta (es decir, castigo selectivo de intervalos de cierta duración entre respuestas). Los
resultados de estudios básicos en CDTA o CDTB muestran que en general la respuesta se
incrementa cuando se castigan intervalos entre respuestas relativamente largos (CDTA), y
disminuía cuando se castigaban intervalos cortos (CDTB; e.g., Galbicka y Branch, 1981;
Laurence, Hineline, y Bersh, 1994). Programas de CDTA pueden ser más beneficiosos que el
castigo continuo en tratar la conducta problema que ocurre a tasas altas o en brotes. También
es relevante obtener una mayor comprensión de estos programas porque pueden operar
comúnmente en el ambiente natural. Por ejemplo, los cuidadores puede que entreguen castigo
más probablemente cuando la conducta problema ocurre de manera infrecuente (es decir, se
19
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
caracteriza por largos tiempos entre respuestas) que cuando ocurre a tasas altas (ver Arbuckle
y Lattal, 1992, por una discusión). Tal sistema puede comprometer la eficacia del tratamiento
al aumentar la frecuencia de tiempos entre respuesta cortos.
El conocimiento actual sobre los programas de castigo sugiere que los padres y
profesores deberían castigar cada ocurrencia de la conducta problema a menos que tal
conducta este siendo extinguida simultáneamente. Hasta que se lleve a cabo más
investigación, los clínicos deberían tener extrema precaución al intentar atenuar el programa
de castigo, usar CDTA, o evaluar otras estrategias para mejorar los efectos del castigo
intermitente (e.g., usando programas variables o castigos condicionados). Inicialmente
siempre debería implementarse un programa de castigo continuo, y deberían considerarse
programas de castigo intermitente solo si el programa continuo es inefectivo en suprimir o
disminuir la conducta problema en una cantidad de tiempo considerable.
Mantención
La duración del entrenamiento con castigo es una de las consideraciones más
importantes para profesionales, profesores y cuidadores de personas con desórdenes
conductuales. Varios autores han sugerido que los efectos clínicos del castigo son
relativamente de corta duración, incluso cuando el tratamiento permanece sin cambios con el
tiempo (e.g., Parsons, Hinson, y Sardo-Brown, 2001; Walker y Shea, 1999). En estudios
básicos, tanto con animales humanos como con no humanos, varios castigadores han sido
asociados con una supresión continua de la respuesta bajo castigo, incluyendo descargas
eléctricas con niveles de intensidad relativamente altos en palomas y ratas (Azrin, 1960;
Crosbie et al., 1997), pérdida monetaria o de puntos en humanos (Crosbie et al.; Weiner,
1962), y tiempo fuera del reforzamiento positivo en monos ardilla (McMillan, 1967). Sin
embargo, la recuperación de la respuesta ha sido asociada con castigadores menos intensos,
tales como una descarga eléctrica de bajo voltaje en palomas (Rachlin, 1966), palmadas con
una barra en ratas (Skinner, 1938), y un ruido en palomas (Holz y Azrin, 1962). Los
hallazgos básicos sobre el mantenimiento de la supresión de la respuesta después de la
terminación de la contingencia punitiva también mostraron que las tasas de respuesta
regresaron inmediatamente a los niveles previos al castigo - a veces incluso excediendo
temporalmente la línea base - a menos que se utilizaran castigos intensos (e.g., choques de
alto voltaje; Azrin, 1960).
Estos resultados sugieren que castigadores suficientemente intensos, incluyendo los
comúnmente usados en procedimientos clínicos (e.g., el tiempo fuera), pueden producir
reducciones prolongadas en el comportamiento problemático mientras la contingencia del
20
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
castigo permanezca vigente. Sin embargo, los hallazgos básicos pueden no ser aplicables a
los tratamientos en contextos clínicos porque los periodos de tiempo evaluados en laboratorio
(e.g., 30 a 60 minutos de sesión de castigo de 10 a 20 días) pueden tener una relación
pequeña con los numerosos meses (y a veces años) que el comportamiento problemático
requiere de tratamiento. Además, pocos estudios han examinado factores que pueden
influenciar la duración de los efectos del castigo.
A pesar de que las evaluaciones breves del tratamiento son predominantes en la
literatura aplicada en castigo, un número creciente de estudios ha examinado la eficacia a
largo plazo del castigo los últimos 10 años. Los efectos del tratamiento han sido examinados
durante periodos de 1 a 60 meses después de que se inició y continuó con cambios menores
en su procedimiento el castigo (Duker y Seys, 1996; Ricketts, Goza, y Matese, 1993; D. E.
Williams, Kirkpatrick-Sánchez, y Crocker, 1994), y después de que el componente original
de castigo fue retirado (Arntzen y Werner, 1999; Foxx, Bittle, y Faw, 1989; Rolider,
Williams, Cummings, y Van Houten, 1991). Los resultados han mostrado un éxito variable
en el mantenimiento de la reducción del comportamiento, pero las razones potenciales de los
inconsistentes resultados aún no se han identificado.
Por ejemplo, D. E. Williams et al. (1993) observaron una recaída en el tratamiento
con una leve descarga eléctrica contingente, 6 meses después de iniciado el castigo. A la
inversa, Linscheid, Hartel, and Cooley (1993) encontraron que una leve descarga eléctrica
contingente continuó suprimiendo 2 comportamientos individuales autolesivos por 5 años.
Duker and Seys (1996) examinaron la eficacia a largo plazo de una descarga contingente con
12 individuos mediante la obtención de información sobre el grado de restricción física que
cada uno requiere de 2 a 47 meses después de iniciado el castigo. Los resultados en el
seguimiento sugieren que el tratamiento se mantuvo efectivo para 7 participantes incluido un
individuo que fue evaluado en 36 meses y otro que fue evaluado en 47 meses.
Las conclusiones respecto a los hallazgos aplicados en mantenimiento son difíciles de
trazar por un número de razones. Primero, la mayoría de los estudios examinan la efectividad
a largo plazo de las descargas contingentes, por lo que los resultados no pueden ser aplicados
a otros (o más leves) castigadores (Azrin y Holz, 1966). Segundo, las consecuencias
reforzantes de un comportamiento problemático no han sido identificadas previo a los
tratamientos en la mayoría de los casos. El mantenimiento de largo plazo puede ser más
probable de ocurrir si el reforzador de mantenimiento fue retenido contingente al
comportamiento problema o fácilmente disponible para involucrarse en un comportamiento
más apropiado (Estes, 1944). En tercer lugar, otros factores potencialmentes responsables de
los casos exitosos y no exitosos de mantenimiento del tratamiento pueden haber variado
ampliamente en todos los estudios (e.g., el programa de castigo, disponibilidad de
reforzadores que competían o sustituían al reforzador de mantenimiento). De hecho, los
componentes de la intervención original fueron modificados a través del tiempo en algunos
estudios (e.g., procedimientos conductuales adicionales o drogas fueron introducidos; Duker
y Seys, 1996), y es difícil determinar cuales, si cualquier modificación del tratamiento puede
haber sido responsable de los resultados. Además, el largo periodo de tiempo requerido para
conducir estos estudios incrementó la probabilidad de que cambios no planificados u otro
factor sin control interactúe con la eficacia del tratamiento original de manera deseable o
21
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
22
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
para más discusión). Por lo tanto, el castigo puede aumentar la eficacia del refuerzo para
establecer una conducta apropiada que compita o reemplace una conducta inapropiada, un
resultado que a su vez puede aumentar la probabilidad de que el castigo pueda ser retirado.
Hasta que se lleve a cabo investigación adicional sobre el mantenimiento a largo
plazo, los profesionales y cuidadores no deben asumir que el castigo seguirá siendo efectivo a
largo plazo. Las estrategias para aumentar la probabilidad de mantenimiento deben ser
empleadas desde el inicio del tratamiento. Aunque los hallazgos básicos sugieren que los
castigos relativamente intensos pueden estar asociados con resultados exitosos a largo plazo,
el uso de procedimientos análogos para tratar el comportamiento problemático probablemente
plantearía preocupaciones éticas para todos los casos, excepto los más graves. Los
cuidadores, en cambio, deben centrarse en el uso del refuerzo para asegurar que el
comportamiento alternativo sea de gran fuerza en el repertorio de individuos expuestos al
castigo. Las evaluaciones sistemáticas del reforzador y los análisis funcionales del
comportamiento problemático siempre deben preceder la implementación del tratamiento
(Fisher et al., 1992). Los efectos del castigo pueden durar más si el comportamiento
apropiado es mantenido por los mismos reforzadores que mantienen un comportamiento
problemático o por reforzadores que son sustitutos efectivos para mantener los reforzadores.
Las consecuencias del refuerzo de la conducta problemática también deben ser minimizadas o
reprimidas si es posible.
Los problemas potenciales con la habituación pueden ser restringidos limitando la
exposición al castigador de varias maneras. Por ejemplo, los cuidadores pueden programar
breves vacaciones de castigo de manera regular (Rachlin, 1966) o restringir el uso de
procedimientos específicos a uno o dos comportamientos problemáticos (por ejemplo,
aquellos de mayor preocupación) en lugar de aplicar el mismo tratamiento para una variedad
de respuestas. También se deben emplear evaluaciones exhaustivas de los castigos para
identificar procedimientos clínicamente aceptables que produzcan la mayor reducción en el
comportamiento y, por lo tanto, conducir a una menor cantidad de exposición al castigador
(ver Fisher, Piazza, Bowman, Hagopian y Langdon, 1994). Si la evaluación identifica más de
una forma efectiva de castigo, los cuidadores podrían alternar entre varios procedimientos
para minimizar la exposición a un solo castigador.
Finalmente, los practicantes y cuidadores deben tener un plan para lidiar con la
recaída del tratamiento cuando ocurre durante el castigo o después de la eliminación del
castigo. El primer paso es identificar y rectificar otros factores que pueden ser responsables
del fracaso del tratamiento. Muchos casos de recaída son probablemente atribuibles a
problemas con la integridad del tratamiento (D. E. Williams et al., 1993), especialmente
cuando el procedimiento de castigo es complejo o lleva mucho tiempo (por ejemplo, Foxx y
Livesay, 1984). El siguiente paso es reevaluar una amplia gama de estímulos y actividades
que pueden funcionar como refuerzos potentes para el comportamiento apropiado y para
apuntar a respuestas adicionales múltiples que podrían competir con el comportamiento
castigado. Las formas alternativas de castigo deben ser consideradas sólo después de
determinar que el actual castigador es ineficaz dentro del contexto de un entorno ricamente
reforzante. En este punto, otra evaluación completa del castigo debe ser conducida para
23
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
Generalización de Estímulos
La transferencia de los efectos del tratamiento a través de diferentes encuadres y
contextos (es decir, la generalización del estímulo) es otro resultado críticamente importante
para las personas con trastornos del comportamiento. (La respuesta de generalización bajo
castigo, o una reducción concomitante en el comportamiento no castigado cuando disminuye
una respuesta castigada, se discutirá bajo el encabezado Efectos Indirectos del Castigo). La
integración dentro de la comunidad puede ser restringida incluso cuando el comportamiento
problemático responde al tratamiento si el procedimiento no puede ser implementado (e.g.,
durante transiciones en la escuela o en lugares públicos como tiendas y autobuses). Los
hallazgos básicos sobre la generalización del estímulo, sin embargo, sugieren que los efectos
del castigo en la conducta problemática pueden transferirse a encuadres y contextos no
tratados. Los resultados de varios estudios básicos con palomas demostraron que la supresión
de la respuesta producida por el castigo de choque se produjo en presencia de estímulos
previos que no se utilizaron en la situación de entrenamiento, a pesar de que el castigo fue
retenido durante las pruebas de generalización (por ejemplo, Hoffman y Fleshler, 1965 Honig
y Slivka, 1964). La cantidad de supresión de la respuesta (es decir, el nivel de control del
estímulo) fue una función de la similitud física entre los estímulos de generalización y los
estímulos presentes durante el entrenamiento con el castigo, un hallazgo que es análogo a los
hallazgos básicos sobre la generalización del estímulo y los efectos del refuerzo (Guttman y
Kalish, 1956).
Sin embargo, los hallazgos de la investigación con palomas y leves descargas
eléctricas pueden no ser directamente aplicables a los seres humanos en contextos clínicos.
En los dos únicos estudios que examinan la generalización del estímulo con humanos en
laboratorio, la generalización fue relativamente difícil de obtener en estudiantes universitarios
y una forma clínicamente más relevante de castigo (O'Donnell y Crosbie, 1998; O'Donnell,
Crosbie, Williams, y Saunders, 2000). Se necesitan más investigaciones básicas con seres
humanos y no humanos para identificar los factores que influyen en el grado y la durabilidad
de la generalización del estímulo durante el castigo. Tales factores pueden incluir parámetros
de castigo o refuerzo (e.g., intensidad, cantidad, programación) y características de los
estímulos de generalización (e.g., saliencia).
De hecho, los resultados de numerosos estudios aplicados indican que los efectos de
castigo rara vez se trasladan a encuadres o contextos que no están asociados con la entrega de
castigos (e.g., Corte, Wolf y Locke, 1971, Doke y Epstein, 1975, Marholin y Townsend,
1978; Rollings, Baumeister, y Baumeister, 1977). Sorprendentemente pocos estudios han
evaluado estrategias para promover la generalización desde que Matson y Taras (1989)
lamentaron esta brecha en una revisión de 20 años de la literatura aplicada sobre el castigo.
En los primeros estudios, se descubrió que factores, como la presencia del terapeuta (Risley,
1968) y la proximidad del individuo al terapeuta o al ambiente de tratamiento (Lovaas y
Simmons, 1969, Rollings et al.), influyen en la generalización. Estos hallazgos son
consistentes con los de estudios básicos que muestran una relación positiva entre la cantidad
24
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
25
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
26
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
agazaparse o defecarse, eran más pronunciadas y persistentes, cuando los sujetos eran
expuestos a descargas inevitables que cuando eran expuestos a estimulación contingente con
la respuesta (Hearst, 1965; Hunt y Brady, 1955).
Por otra parte, numerosos estudios básicos indican que otras formas de
comportamiento no castigado, incluyendo respuestas que ocurren en la ausencia de
consecuencias programadas (e.g., conductas específicas a la especie) y aquellas que son
mantenidas por refuerzos entregados por el experimentador pueden aumentar, disminuir o
mantenerse sin cambios durante el castigo. Los factores que determinan si un
comportamiento no castigado aumentará, o disminuirá (llamados contraste e inducción,
respectivamente) no han sido estudiados exhaustivamente. La función del comportamiento,
programa e intensidad del castigador y exposición previa al mismo podrían ser importantes
(para una discusión, ver Crosbie et al., 1997).
En una serie de estudios, Dunham y sus colegas examinaron los efectos del castigo en
jerbos al entregar leves descargas contingentes a una respuesta (e.g., comer) mientras se
medían cambios en respuestas alternativas (e.g., cavar, acicalarse, correr). Los resultados
indicaron que las respuestas más probables de no ser castigadas aumentó durante el castigo,
mientras que las respuestas que tendían a seguir la respuesta castigada, disminuyeron
(Dunham, 1977, 1978; Dunham y Grantmyre, 1982). Un estudio subsecuente, sugirió que la
función del comportamiento no castigado también podría determinar estos efectos
secundarios. Baker, Woods, Tait y Gardiner (1986]) encontraron que cuando a los jerbos se
les castiga la conducta de comer con leves descargas o ruido, aumenta la conducta de cavar
incluso si correr era la respuesta más probable durante el establecimiento de la línea base. Los
autores sugirieron que cavar era una respuesta específica a la especie frente a la privación de
comida (es decir, cavar estaba en la misma clasificación de respuesta en que se encuentra
comer). Los resultados de estudios en comportamiento que es mantenido en la ausencia de
refuerzos programados por el experimentador podrían tener alguna relevancia en
comportamientos problemáticos que generan sus propias consecuencias reforzadoras (e.g.,
estimulación sensorial).
En otros estudios básicos con humanos y palomas, se utilizó el mismo refuerzo para
establecer y mantener dos o más respuestas equivalentemente funcionales (e.g., picoteo de
claves, presión de palanca) bajo programas múltiples o concurrentes. Luego, se entregaron
castigos como descargas leves, tiempo fuera y pérdida de puntos o dinero, para uno de los
miembros de una clase de respuestas establecidas en el paso anterior, mientras se observaban
los efectos en las otras respuestas. El hallazgo más común tanto para animales humanos como
no humanos fue un aumento en la conducta no castigada (es decir, contraste; Bennet y
Cherek, 1990; Bradshaw, Szabadi, y Bevan, 1991; Powell, 1971; Thomas, 1968). Sin
embargo, los resultados fueron inconsistentes tanto inter como intra sujetos, y los efectos (es
decir, un aumento en la conducta más probable y una disminución del comportamiento que
usualmente seguía a la conducta castigada) tuvieron una corta duración (Dunham, 1977,
1978; Dunham y Grantmyre, 1982). Los hallazgos principales de Dunham y sus colegas no
pudieron ser replicados con estudiantes universitarios cuando estos se le reforzaban hasta 10
respuestas simultáneamente y una respuesta fue expuesta a pérdidas de puntaje contingente
(Crosbie, 1990, 1991).
27
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
Desde un punto de vista clínico sería deseable los aumentos colaterales en conductas
apropiadas y disminuciones colaterales en conductas inapropiadas no castigadas. De hecho,
hallazgos en investigaciones aplicadas sugieren que una variedad de efectos secundarios
deseables e indeseables pueden ocurrir en los individuos. El castigo del comportamiento
problemático ha sido asociado con aumentos en comportamiento apropiado, tal como
obediencia y jugar con juguetes (e.g., Koegel, Firestone, Kramme, y Dunlap, 1974; Rolider,
Cummings, y Van Houten, 1991) y con disminuciones en conductas inapropiadas no
castigadas, incluyendo agresiones y llantos (e.g., Bitgood, Crowe, Suárez, y Peters, 1980;
Lovaas y Simmons, 1969; Linscheid et al., 1990; Ricketts et al., 1993; Singh, Watson, y
Winton, 1986). Por otra parte, disminuciones en comportamientos apropiados (e.g., juego con
juguetes, hablar) y aumentos en comportamientos problemáticos apropiados no castigados
(e.g., agresión, reacciones emocionales, comportamiento estereotipado) también han sido
reportados (e.g., Bitgood et al., 1980; Duker y Seys, 1996; Foxx y Azrin, 1973; Harris y
Wolchick, 1979; Pendergrass, 1971; Singh, Manning, y Angell, 1982; Thompson et al.,
1999). Numerosos autores han sugerido que es más probable que ocurran efectos secundarios
deseables que efectos secundarios indeseables durante un tratamiento con castigo (para
revisiones, ver Lundervold y Bourland, 1988, y Matson y Taras, 1989). Se desconoce la
prevalencia de estos efectos secundarios, debido a que hay relativamente pocos estudios han
examinado directamente los efectos del castigo en comportamientos no castigados en marcos
clínicos. Más importante, la recolección de datos usualmente se limitaba a uno o dos
comportamientos colaterales (para una excepción notable ver, Sisson, Hersen, y Van Hasselt,
1993). Efectos secundarios positivos también podrían haber sido reportados más
frecuentemente que los efectos secundarios indeseables en estudios clínicos sobre castigo,
independientemente de la prevalencia real.
A pesar de que la investigación en esta área está relativamente incompleta, hallazgos
básicos sugieren algunas explicaciones posibles para los resultados inconsistentes que se han
obtenido en estudios aplicados. Agresión y reacciones emocionales provocadas por el castigo
son menos probables cuando la exposición al estímulo castigador puede ser reducida o
evitada (e.g., Azrin et al., 1966; Hunt y Brady, 1955). Así estos efectos secundarios
indeseables podrían ser menos probables de ocurrir en estudios clínicos, cuando un castigador
relativamente corto suprimió el comportamiento a niveles bajos o cuando una fuente
alternativa de reforzamiento fue altamente efectiva al fortalecer una respuesta incompatible.
A la inversa, agresiones y otros comportamientos inapropiados podrían haber aumentado en
algunos estudios aplicados porque las respuestas se encontraban en la misma clase que la
conducta castigada (Baker et al., 1984). Los resultados de múltiples estudios básicos con ratas
y palomas también indican que la probabilidad de contraste se relaciona positivamente con la
densidad del programa de castigo (e.g., Deluty, 1976; Thomas, 1968). De esta forma, los
aumentos en comportamientos no castigados podrían haber sido más probables cuando el
procedimiento de castigo fue implementado con un alto grado de integridad (es decir, siguió
consistentemente cada ocurrencia de la respuesta).
Algunos hallazgos básicos sugieren que el contexto podría ser un factor importante
para determinar qué respuestas aumentarán o disminuirán durante el castigo. Bolles, Holtz,
Dunn, and Hill (1980) encontraron que era más probable que ocurriera inducción en ratas
28
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
cuando la respuesta no castigada se realizaba bajo las mismas condiciones de estímulos que la
respuesta castigada (e.g., empujar versus. levantar la misma palanca) que cuando se usaban
distintas condiciones de estímulos (e.g., manipular palancas separadas). Crosbie et al. (1997)
encontraron que la inducción tanto en humanos como no humanos es más probable de ocurrir
bajo programas múltiples. Juntos, estos hallazgos sugieren que respuestas funcionalmente
equivalentes no castigadas probablemente disminuirían en estudios aplicados, si la respuesta
tendía a ser realizada en el mismo contexto en que se realizaba la respuesta castigada.
Se necesita más investigación para determinar si una conducta no castigada en
particular aumentará, disminuirá o se mantendrá sin cambios durante el castigo, para que la
dirección y naturaleza de los efectos secundarios puedan ser predichos y controlados.
También se necesita más investigación para determinar si estos efectos secundarios son
específicos al castigo debido a que se han obtenido resultados similares cuando una respuesta
se suprimía a través de la saciedad o bloqueo de la respuesta (e.g., Dunham y Grantmyre,
1982), indicando que dichos efectos podrían estar asociados con la supresión de una respuesta
por sí mismos. De hecho, diversos efectos secundarios indeseados del castigo (e.g., aumentos
en la agresión, escape y reacciones emocionales) podrían estar asociados con procedimientos
de extinción (Lerman y Iwata, 1966a) que usualmente fueron confundidos con castigos en
investigaciones aplicadas.
Sin embargo, hallazgos básicos sugieren numerosas estrategias que podrían ser
potencialmente útiles en ámbitos clínicos. Agresiones o respuestas emocionales (e.g., llorar)
provocadas por el castigo pueden ser atenuadas al implementar procedimientos que
minimizan la exposición al estímulo castigador (e.g., usar estímulos breves que producen una
supresión casi completa de la conducta; fortalecer respuestas competitivas al entregar
refuerzos potentes en programas enriquecidos). Análisis comprensivos, descriptivos o
funcionales de comportamientos apropiados e inapropiados en el repertorio conductual de un
sujeto, pueden ser de utilidad para predecir la probabilidad de efectos secundarios indeseados
y para arreglar condiciones para crear efectos deseables. Asegurarse de que los cuidadores
retiren el refuerzo de conductas problemáticas no castigadas, podría prevenir aumentos
secundarios en conductas que se encuentran en la misma clase de respuesta que las respuestas
castigadas. Si no se puede utilizar la extinción, podrían ser necesarias estrategias alternativas
para manejar los efectos indeseados de contraste (e.g., organizar castigos para otras
respuestas inapropiadas). Identificar y castigar precursores de conductas peligrosas (e.g.,
formas medias de autolesiones que consistentemente preceden formas más severas) puede
llevar a reducciones secundarias en la conducta severa, aumentando la seguridad y eficacia
del tratamiento (e.g., Dunham, 1977, 1978). Se podrían evitar reducciones colaterales de
conductas apropiadas funcionalmente equivalentes si se organizan refuerzos del
comportamiento bajo condiciones de estímulos que son diferentes de aquellas presentes
cuando ocurre la conducta castigada (e.g., al modificar claves del ambiente o introducir
refuerzos en un nuevo contexto). Para esto, los cuidadores deberían asegurarse de que haya
disponibilidad de refuerzos alternativos para múltiples respuestas a lo largo de variados
contextos y encuadres.
Finalmente, la literatura aplicada debería dar más atención al potencial de los efectos
secundarios indeseados que involucran la conducta del cuidador (e.g., sobre utilización del
29
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
Conclusiones
El uso del castigo para tratar comportamientos problemáticos en poblaciones clínicas
ha sido un tema controversial por muchos años (ver Iwata, 1988; Johnston, 1991). Los
resultados de investigaciones básicas y aplicadas indican que las aproximaciones actuales del
tratamiento basadas en castigo tienen ventajas (e.g., son altamente efectivas) y desventajas
(e.g., tienen efectos secundarios impredecibles). Sin embargo, a veces aún se necesita el
castigo para reducir comportamientos destructivos a niveles aceptables (e.g., Grace et al.,
1994; Hagopian et al., 1998; Wacker et al., 1990); el castigo podría ser la verdadera causa de
los efectos de algunos tratamientos comunes basados en la función (e.g., Lerman y Iwata,
1996b; Mazaleski et al., 1994); y los cuidadores continúan usando el castigo para reducir
comportamientos problemáticos en ambientes naturales (e.g., Peterson y Martens, 1995).
Se necesita un entendimiento más profundo de los procesos del castigo para
desarrollar una tecnología sistemática y efectiva del cambio del comportamiento. Una
revisión de la literatura aplicada indica que una amplia variedad de procedimientos de castigo
puede tratar exitosamente desórdenes conductuales severos en poblaciones clínicas. Sin
embargo, aún no se han delineado las variables involucradas en los hallazgos reportados en
esta investigación. La mayoría de los estudios se enfocan en variaciones procedurales del
castigo en lugar de los factores que podrían influenciar los efectos directos e indirectos del
castigo. Una revisión de investigaciones de laboratorio sobre el castigo sugiere que
numerosas variables alteran los procesos básicos de formas complejas. Factores como la
historia, programas de reforzamiento, varios parámetros de castigo y fuentes alternativas de
refuerzo podrían influenciar los efectos inmediatos de castigo y otros resultados clínicamente
relevantes, tales como la mantención a largo plazo, generalización y la emergencia de efectos
secundarios. Hallazgos básicos también contradicen algunas asunciones sostenidas
comúnmente acerca de los efectos del castigo y proveen posibles explicaciones para los
hallazgos inconsistentes que han sido reportados en estudios aplicados.
No obstante, el conocimiento actual acerca de los procesos básicos es insuficiente
para el traspaso a aplicaciones. Aún está incompleta la literatura básica sobre algunas
relaciones importantes (Baron, 1991; Crosbie, 1998). Más importante, el nivel al que los
hallazgos con sujetos no humanos y leves descargas eléctricas contingentes con la respuesta
30
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
31
UNIVERSIDAD DE CHILE
DEPARTAMENTO DE PSICOLOGÍA
USO EXCLUSIVO DE LA CÁTEDRA
Procesos Básicos de Aprendizaje
32