Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2 Control de La Conducta Operante Humana Por Medio de Instrucciones - Galizio
2 Control de La Conducta Operante Humana Por Medio de Instrucciones - Galizio
En
E. Ribes y P. Harzem (Comps.), Lenguaje y Conducta (pp. 123-168). México: Trillas.
INTRODUCCIÓN
TIPOS DE INSTRUCCIONES
La interpretación de los resultados de estudios específicos podría apoyarse por el sistema de
clasificación de los eventos reconocidos como “instrucciones". Desgraciadamente no se cuenta
con un esquema completo. Puesto que las instrucciones son producto de la conducta verbal,
uno de los enfoques consiste en asociar las distintas formas de instrucción con las clases de
conducta verbal (Skinner, 1957). En las expresiones cotidianas, las instrucciones suelen tomar la
forma de mandos, esto es, de aquella conducta verbal que especifica al escucha la respuesta
que refuerza el hablante. Sin embargo, tal parece que en los experimentos operantes las
funciones de las instrucciones son distintas, ya que describen características del medio
ambiente como en el caso en que se dice a los sujetos “puedes ganar dinero en este
experimento" o apretar la tecla aumentas el contador". En las interacciones verbales naturales,
las expresiones descriptivas de esta especie por lo común funcionan como tactos, como en el
caso en que un profesor o “instructor” enseña al alumno.
No obstante, desde nuestro punto de vista, la clasificación de las instrucciones como formas de
conducta verbal no parece muy productiva. El problema consiste en que el análisis se centra en
las variables que inducen y mantienen la conducta del hablante, es decir, del individuo que
proporciona las instrucciones. El escucha está implicado, pero primordialmente como audiencia
cuya función reside en proporcionar estímulos reforzantes y discriminativos para la conducta
del hablante. En cambio, el análisis del control por instrucciones requiere la consideración de
las relaciones de control entre los estímulos verbales y las respuestas del escucha, es decir,
necesita del individuo que recibe las instrucciones.
La exposición de Skinner (1969) acerca de la conducta gobernada por reglas proporciona un
marco de referencia útil para estimar las propiedades de estímulo que tiene la conducta verbal.
Las conductas que resultan de seguir instrucciones, atender advertencias y obedecer leyes
(ejemplos de conducta gobernada por reglas según Skinner) se consideran como respuestas a
un conjunto de estímulos verbales cuyo rasgo característico estriba en que éstos especifican
contingencias del medio ambiente. Aunque las reglas pueden ejercer un control muy poderoso
sobre la conducta operante, las respuestas a las descripciones de las contingencias pueden
diferir de las respuestas que se dan a las contingencias reales que describen. Esto se debe a
que, por lo general, las reglas no especifican plenamente las contingencias, y también se debe a
que las respuestas inducidas por las reglas no necesariamente son controladas por los mismos
eventos de privación y aversivos. Es de mayor importancia el hecho de que las conductas de
seguimiento de reglas en sí mismas son influidas por sus consecuencias. Esto conduce a
considerar las ejecuciones de los sujetos humanos en el laboratorio en términos de las
interacciones entre las respuestas engendradas por las instrucciones y las respuestas inducidas
por las contingencias que se están estudiando.
Hasta no contar con un análisis más detallado debemos ser un tanto pragmáticos al hacer
nuestras clasificaciones de estímulos de instrucción. Un examen de los procedimientos que se
utilizaron en varios experimentos pone de manifiesto que la dimensión importante
corresponde al grado de detalle que se proporciona a las contingencias experimentales. A
manera de ilustración, consideremos las siguientes instrucciones que fueron utilizadas en uno
de los primeros estudios de la conducta operante humana (Dews y Morse, 1958). En este
experimento se entregaban monedas a los sujetos de acuerdo con un programa que combinaba
características tanto de contingencias de razón fija como de contingencias RDB (reforzamiento
diferencial de tasas bajas).
El experimento se iniciará cuando se encienda la luz izquierda y terminará una hora después,
cuando se apague. Durante el experimento tienes que presionar la tecla de telégrafo. Tu
objetivo es ganar tantas monedas como sea posible. La luz de la derecha se encenderá y
recibirás unas monedas cuando hayas presionado la tecla un mínimo de 100 veces. Sin embargo
los golpes que des dentro de un periodo de dos segundos y medio a partir del golpe anterior no
contarán. Por otro lado, el tiempo que tardes después de los dos segundos y medio es tiempo
perdido. Por Io tanto, para conseguir el máximo posible de monedas, golpea la tecla
regularmente a intervalos que excedan lo menos posible los dos segundos y medio. La siguiente
serie de golpes ocurre a intervalos de dos segundos y medio (se presentan entonces 8 golpes a
intervalos de 2.5 segundos), Empieza a presionar la tecla tan pronto como se encienda la luz
(pág. 360).
Interacciones instrucción-contingencia
Un análisis completo de las interacciones que ocurren entre la instrucción y la contingencia
requiere de la comparación de las ejecuciones que ocurren después de girar diferentes tipos de
instrucciones. Aquellos procedimientos en los que las instrucciones no corresponden a las
contingencias reales son particularmente interesantes porque revelan la contribución relativa
de los dos factores que participaron en las ejecuciones. Con el fin de obtener este tipo de datos
observamos a estudiantes universitarios que respondían bajo un programa de intervalo variable
de un minuto por puntos acumulados (Kaufman et al., 1966). Los sujetos asignados a las cinco
condiciones del experimento recibieron diferentes grados de instrucción acerca de la relación
respuesta reforzador; se les dijo:
a) Simplemente que se podían obtener puntos.
b) Que, además, se podían obtener los puntos apretando la tecla de respuesta.
c) Que, además, el programa de entrega de puntos era de intervalo fijo de un minuto.
d) O que el programa era de intervalo variable de un minuto.
e) O que el programa era de razón variable de 150.
Por consiguiente los sujetos asignados a la condición d) fueron correctamente informados del
programa, mientras que los asignados a las condiciones c) y e)recibieron-información
incorrecta.
Parte de los resultados se muestran en la figura 5.1, la cual presenta los registros acumulativos
de cada una de las cinco condiciones. Las instrucciones mínimas (gráfica superior) condujeron a
la adquisición de la respuesta, pero la forma de responder fue errónea y no mostró buen
control del programa. El control también fue pobre cuando se dieron instrucciones acerca de la
respuesta requerida (segunda gráfica), ya que las tasas de respuesta por lo general excedieron
los requisitos del programa. Aunque el programa real siempre fue el mismo, los sujetos
asignados a las tres condiciones tendieron a manifestar los patrones de respuesta implicados
por las instrucciones sobre el programa. Las de intervalo fijo (tercera gráfica) produjeron tasas
bajas y patrones festoneados ocasionales. Las instrucciones de intervalo variable (cuarta
gráfica) produjeron tasas intermedias y las instrucciones de razón variable (gráfica inferior)
produjeron tasas altas y uniformes, las cuales son características del control de este programa.
En un experimento adicional a esta serie se encontró un fuerte control de extinción. Los sujetos
recibieron instrucciones mínimas o de razón variable (véanse las condiciones a) y e) del párrafo
anterior), antes de ser sometidos a una sola sesión de tres horas en la que jamás se
proporcionó reforzamiento. Ambos tipos de instrucciones fueron seguidas por un número
considerable de respuestas, aunque los sujetos sometidos a instrucciones mínimas mostraron
cierto debilitamiento conforme progresaba la sesión, pero de ninguna manera dejaron de
responder totalmente. Los sujetos que recibieron instrucciones de razón respondieron a tasas
elevadas a lo largo de la sesión.
En experimentos que se realizaron posteriormente se confirmó que las instrucciones sobre el
programa de reforzamiento pueden producir patrones de respuesta discordantes con las
contingencias reales. Por ejemplo, en un estudio, Lippman y Meyer (1967), sometieron a unos
estudiantes universitarios a un programa de intervalo fijo de 20 s de puntos acumulados,
indicándoles que la contingencia dependía del paso del tiempo o que dependía del número de
respuestas. En una tercera condición, los sujetos no recibieron instrucciones en cuanto al
programa. Las ejecuciones apropiadas a los programas de intervalo fijo (tasas relativamente
bajas con un patrón festoneado en los registros acumulativos) aparecieron en forma más
confiable entre los sujetos que recibieron instrucciones de tiempo, mientras que los sujetos que
no recibieron instrucciones y los que recibieron instrucciones de razón tendieron a responder a
tasas altas y constantes.
Weiner (1970) también encontró un fuerte control de las instrucciones en cuanto a programas
de extinción. Al utilizar dinero como reforzador, adultos jóvenes respondieron bajo un
programa de razón fija de 10. Después de entregar 700 reforzadores, se inició un periodo de
extinción de dos horas. Los sujetos que no recibieron instrucciones acerca del número de
reforzadores mostraron poca tendencia a la extinción. En cambio, los sujetos que recibieron
instrucciones precisas en cuanto a que sólo podían obtenerse 700 reforzadores, cesaron de
responder en forma abrupta al llegar a ese punto. Finalmente, los que recibieron la información
errónea de que podían obtenerse 999 reforzadores, persistieron en responder durante el
periodo de extinción, aunque lo hicieron a tasas menores que los sujetos que no recibieron
instrucciones.
Los hallazgos citados anteriormente muestran que las intrucciones referentes a las respuestas
necesarias para producir el reforzador, dan lugar a un rápido inicio del responder, pero también
pueden producir tendencias persistentes a responder. En comparación, las instrucciones
referentes al programa por medio del cual se refuerza la respuesta, evocan una conducta de
responder más acorde con el programa. En ambos casos se encontró que el control por
instrucciones interfiere con el control de las contingencias reales. Esto se pone particularmente
de manifiesto cuando las instrucciones son falsas; en cuyo caso, la forma de responder
muestra un mayor acuerdo con la del programa que se describe, que con la estructura del
programa realmente impuesto.
Comparaciones de programas
En esta sección consideraremos experimentos en que se comparan las ejecuciones que se
realizan bajo diferentes programas. Cuando únicamente interviene un programa, como en el
caso de los experimentos hasta ahora discutidos, el grado de control del programa sólo puede
evaluarse en términos de la estructura del programa o de las ejecuciones de sujetos
infrahumanos en programas similares. Este último criterio no es totalmente satisfactorio, ya
que se presentan dificultades para igualar los experimentos con humanos e infrahumanos en
términos de reforzadores, requisitos de respuesta y otros aspectos del procedimiento.
Nuestra investigación hace un análisis de las ejecuciones que se observaron al aplicar
programas de intervalo fijo y de la evitación que surgió después de girar diversos tipos de
instrucciones. En uno de los primeros experimentos, se entrenó a estudiantes universitarios en
diferentes programas de intervalo fijo (Baron et al., 1969). Por otra parte, en un programa
múltiple se incluyeron cuatro componentes de intervalo fijo (10, 30, 90 y 270 s) y uno de
extinción. Una parte de los sujetos no recibieron instrucciones acerca del programa
(únicamente se les dijo que era necesario oprimir la tecla para producir el reforzador), mientras
que otros recibieron información acerca de la duración de los intervalos fijos que estaban
asociados con cada componente. El experimento fue diseñado, además, para revelar la
contribución de la retroalimentación proporcionada por la entrega de los reforzadores. Parte de
los sujetos de cada condición de instrucción recibían una señal cada vez que ganaban un
reforzador (retroalimentación), mientras que otra parte no participó de esta condición sino
hasta el final de la sesión (sin retroalimentación).
En la figura superior izquierda de la figura 5.2 se muestran los registros de un sujeto que recibió
tanto instrucciones como retroalimentación de reforzamiento. Puesto que dependían del
intervalo fijo, las tasas variaron sistemáticamente, se observaron pocas respuestas en el
componente de extinción y estas ejecuciones diferenciadas se volvieron más pronunciadas a lo
largo de las 20 sesiones de entrenamiento. La figura superior derecha contiene el registro de un
sujeto entrenado con instrucciones pero que no recibió retroalimentación. Aquí también se
pone de manifiesto el control del programa, pero no en forma tan marcada como cuando se
proporcionó retroalimentación y las ejecuciones no cambiaron gran cosa en el curso del
entrenamiento. La exposición al programa sin instrucciones (parte inferior izquierda), condujo a
un control pobre cuando se recibió la retroalimentación y se limitó a los componentes de
extinción e IF 270 s del programa. Finalmente, las ejecuciones sin instrucciones ni
retroalimentación (parte inferior derecha), resultaron esencialmente indistintas. También
encontramos que, una vez establecidas, las ejecuciones diferenciadas no fueron interferidas
por la eliminación de instrucciones en la tarea de los sujetos. No obstante, resultó extraño que,
al agregar las instrucciones, las ejecuciones pobremente diferenciadas que estaban asociadas
con la ausencia de instrucciones permanecieran.
En un estudio subsecuente se investigó el control por instrucciones de las respuestas de
evitación (Galizio, 1979). Las comparaciones que existen entre las formas de responder en
evitación e intervalo-fijo son interesantes debido a la forma diferente en que las respuestas
ante los dos programas hacen contacto con las contingencias temporales. En el caso de los
programas de intervalo fijo, cada entrega del reforzador proporciona información acerca del
intervalo. Esta retroalimentación no se encuentra en los programas de evitación, puesto que
cada respuesta pospone la presentación futura del evento aversivo. Con el fin de hacer estos
experimentos equiparables a nuestro estudio de intervalo fijo, los adaptamos de tal forma que
se pudieran aplicar a estudiantes universitarios, quienes recibían entrenamiento para evitar una
señal de pérdida monetaria bajo un complejo programa múltiple, en el que los intervalos
respuesta-pérdida de 10 s, 30 s o 20 s se asociaron a tres de los componentes (el intervalo
pérdida-pérdida siempre fue de 10 s) y, en el cuarto componente, se omitieron todas las
pérdidas. Las instrucciones iniciales se limitaron a indicar la contingencia respuesta-reforzador
(especificaban que manipular la manivela posponía la siguiente pérdida). En seguida se dieron
instrucciones sobre el tiempo en que las respuestas posponían la pérdida en los diferentes
componentes.
En la figura 5.3 los registros de dos sujetos muestran que, a pesar de las diferencias que había
en los intervalos respuesta-pérdida, antes de que se proporcionaran las instrucciones las tasas
en los diferentes componentes por lo general fueron similares (gráficas superiores). Cuando se
agregaron los rótulos de instrucción a las luces que señalaban los componentes (gráficas
inferiores), apareció el control temporal y el discriminativo; las tasas más elevadas ocurrieron
en el intervalo respuesta-pérdida de 10 s, cuando fue de 30 y 60 s, ocurrieron tasas intermedias
y en el componente en que se omitieron las pérdidas ocurrieron pocas respuestas. Este patrón
persistió al eliminar los rótulos de instrucción, así como al colocar nuevamente los estímulos
que estaban asociados con los estímulos componentes, por lo que se mostró que las
instrucciones incrementaron la sensibilidad a las contingencias del programa. Sin embargo, en
concordancia con las diferencias entre programas de intervalo fijo y evitación observadas
anteriormente, a pesar de las instrucciones el control temporal de las respuestas de evitación
no fue tan marcado como el observado ante programas de intervalo fijo.
Matthews, et al. (1977) abordaron de manera distinta el asunto de la sensibilidad en un estudio
en el que utilizaron procedimientos acoplados. Estudiantes universitarios debían presionar una
tecla para obtener reforzamiento monetario, de tal forma que las respuestas de los miembros
de una pareja fueran reforzador de acuerdo con un programa de intervalo variable; estos
intervalos se producían por el segundo miembro quien respondía bajo un programa de razón
variable. Por consiguiente, igualaba a los dos sujetos con cierta precisión en cuanto a número
de reforzadores, así como en cuanto a los intervalos que había entre los reforzadores. En una
manipulación adicional, la respuesta de presionar la palanca se estableció por medio de
moldeamiento para algunos sujetos (el entrenamiento, se inició con el reforzamiento de
aproximaciones sucesivamente más cercanas a oprimir la tecla) y, para otros, por medio de una
demostración (“después de un breve intento por moldear el oprimir la tecla un experimentador
entraba al cubículo y presionaba la tecla, lo cual encendía las luces de reforzamiento; no se
estableció ninguna interacción verbal”). Los resultados indicaron que los sujetos entrenados
con el procedimiento de moldeamiento se mostraron sensibles a las contingencias de
reforzamiento, ya que al final de la sesión las tasas de los sujetos sometidos a programas de
razón fueron sustancialmente mayores que las de los sujetos acoplados que fueron sometidos a
un programa de intervalo. En contraste, el procedimiento de demostración, aunque fue
efectivo para establecer las respuestas, no fue acompañado de diferencias claras en las tasas de
los dos pares estudiados en esta condición.
En un estudio subsecuente, Shimoff y colaboradores (1981) compararon las ejecuciones que se
lograron con instrucciones con aquellas que se lograron con moldeamiento; la comparación se
hizo tomando como base diferentes programas en los que variaban la duración de una
contingencia RDB que se había sobrepuesto a un programa de intervalo al azar con
reforzamiento monetario. Se estableció presionar una tecla, por moldeamiento o por una
combinación de demostración e instrucciones, en estudiantes universitarios, para que
respondieran a una tasa baja (“deben presionar con lentitud; si presionan demasiado rápido no
funcionará"). Cuando se eliminó la contingencia de RDB a mitad de la sesión (y, por tanto, se
hicieron imprecisas las instrucciones), se incrementaron las tasas de siete de 11 sujetos cuyas
respuestas habían sido moldeadas, en comparación a tres de 10 de los sujetos que habían
recibido instrucciones. Por lo general este patrón de resultados fue similar al de un segundo
experimento donde las respuestas se reforzaron según un programa de razón al azar, al que se
le agregó una contingencia RDB. Cuando se redujo el tiempo mínimo entre respuestas respecto
a su valor original, las tasas aumentaron en un mayor número de sujetos moldeados que en los
que recibieron instrucciones.
Los experimentos tratados en esta sección coinciden en señalar que las contingencias
programadas logran un control pobre cuando la respuesta se establece por medio de
instrucciones respecto a la respuesta (o por su demostración). Los diferentes experimentos
también identifican procedimientos que pueden aumentar la sensibilidad a las contingencias
del programa. Uno de estos consiste en omitir toda instrucción acerca de la respuesta que
favorezca el desarrollo de la respuesta, al utilizar procedimientos de moldeamiento. Otra
estrategia consiste en proporcionar instrucciones más elaboradas que describan las
contingencias del programa y que también especifique la respuesta.
Consecuencias demoradas
En su exposición acerca de la conducta moldeada por contingencias y la conducta gobernada
por las reglas, Skinner (1969) señaló una importante función de las reglas: "Las reglas tienden a
poner en juego las consecuencias remotas; sin las reglas, las consecuencias inmediatas
únicamente afectan la conducta" (pág. 169). Si bien es cierto que los experimentos con sujetos
infrahumanos, y en menor grado con humanos, han investigado los nocivos efectos de las
contingencias demoradas, no se ha investigado mucho la capacidad de las instrucciones para
llenar los espacios temporales. Nosotros tratamos esta propiedad de las instrucciones como
parte del castigo demorado (Trenholme y Baron, 1975). Como veremos, los resultados no
fueron distintos a los hallazgos que se lograron cuando se proporcionaron instrucciones en
programas de intervalo fijo y de evitación.
En el experimento inicial se observaron las ejecuciones realizadas por sujetos que recibieron
instrucciones mínimas acerca del castigo que se aplica a las respuestas después de una demora.
En la condición de línea de base, los estudiantes universitarios respondieron conforme a un
procedimiento de ensayo discreto en el que se presentaba un estímulo, una luz blanca o una luz
amarilla en diferentes ensayos, una vez cada minuto, y en el que al presionar una vez la tecla,
en presencia de la luz se producía una señal de reforzamiento monetario en el 50% de los
ensayos. Enseguida se introdujo el castigo en los ensayos con luz amarilla, de tal. forma que las
respuestas en presencia de este estímulo eran seguidas por una señal de pérdida monetaria en
el 50% de aquellos ensayos en que no estaba programada la ocurrencia del reforzador. Los
sujetos fueron asignados a condiciones que diferían en el grado de demora vinculado con la
señal de pérdida, según los siguientes valores: 0 s, 10 s, 20 s, o 40 s. Los datos resumidos en las
dos funciones inferiores de la figura 5.4 muestran que las respuestas al estímulo que está
asociado con castigo (círculos blancos) fueron suprimidas en relación con las respuestas del
otro estímulo (círculos negros). También es evidente que la supresión fue mayor cuando el
castigo se aplicó inmediatamente y que disminuyó progresivamente conforme la demora
aumentó hasta 40 s.
En las dos funciones superiores de la figura 5.4 se muestran los datos que se obtuvieron en dos
experimentos subsecuentes que tenían como propósito estudiar las variables que pueden
aumentar la supresión mediante castigo demorado; el castigo condicionado inmediato y las
instrucciones sobre las contingencias demoradas. Ambos experimentos se iniciaron con los
procedimientos de entrenamiento ya descritos. El castigo condicionado se estudió al programar
un estímulo nuevo (ruido blanco), el cual resultaba como consecuencia inmediata de responder
bajo las condiciones de castigo-demora (10, 20 y 40 s). El mismo estímulo también precedía la
presentación de la señal perdida (castigo primario). En el experimento acerca de las
instrucciones se informó a los sujetos que el estímulo de pérdida ocurría como consecuencia de
presionar la tecla. También se les informó del intervalo temporal que separaba cada respuesta
de la pérdida. Los resultados que se resumen en la figura 5.4 indican que la adición del castigo
condicionado (triángulos negros) aumentó la supresión de respuestas bajo las condiciones de
castigo demorado. Desde el punto de vista de la presente discusión, son de particular interés
los efectos que tiene agregar instrucciones acerca de la contingencia demorada (triángulos
blancos). En las tres condiciones de demora, el castigo demorado más las instrucciones dio
lugar a un grado de supresión comparable al que está asociado con el castigo inmediato.
Estos hallazgos muestran que las instrucciones pueden sensibilizar a los sujetos a contingencias
demoradas, las cuales, de otra manera, podrían no ser efectivas. Sin embargo, los mecanismos
implicados en esa mediación son mucho menos claros que cuando está implicado el castigo
condicionado. En nuestro informe de los experimentos (Trenholme y Baron, 1975), sugerimos
considerar los resultados a la luz de la hipótesis de Dollard y Miller (1950) referente al grado de
distinción adquirido por las señales; esto es, que la vinculación de respuestas verbales o rótulos
con los estímulos, aumenta su grado global de discriminación. No obstante, advertimos que esa
interpretación especulaba demasiado, ya que no teníamos manera de observar directamente
las respuestas disimuladas por las instrucciones o por otros aspectos del procedimiento.
La naturaleza fragmentaria de la bibliografía que existe acerca del control instrucciones indica la
necesidad de realizar una investigación más planeada sobre este asunto. Pero, al mismo tiempo
se requiere de una mejor conceptualización de la manera en que las instrucciones influyen en la
conducta. Hasta ahora ha existido la tendencia de considerar las instrucciones, como una
variable ajena al experimento, y que interfiere con el estudio de otras variables. La estrategia
que seguiremos en las siguientes secciones tiene como fin identificar los puntos de
correspondencia entre los tipos de control ejercido por las instrucciones y las influencias de los
eventos-estímulo más comúnmente estudiados.
Propiedades discriminativas
En el condicionamiento operante se encuentran implicados tres elementos: un estímulo que
ocasiona las respuestas, la respuesta misma y las consecuencias que tiene el responder. Cuando
la respuesta se controla por medio de instrucciones, parece fácil relacionar las instrucciones
con el primero de estos elementos. La ventaja de considerar al control por instrucciones de esta
manera estriba en que el análisis puede seguir su curso conforme a los mismos lineamientos
que el estudio del control por medio de cualquier estímulo. Por ejemplo, ya no existiría la
necesidad de postular procesos cognoscitivos mediadores como la que aparece en el caso del
control de estímulos en general. Biglam y Kass (1977) expresaron este razonamiento al criticar
la idea de que el control por instrucciones implica necesariamente que la conducta esté bajo
control de "contingencias cognoscitivas”.
Podemos ilustrar la naturaleza arbitraria de la inferencia que se hace acerca de la eficacia de las
contingencias cognoscitivas, si consideramos un posible experimento con animales.
Supongamos que establecemos control de estímulos sobre las respuestas de intervalo fijo y de
razón fija en un pichón, utilizando estímulos arbitrarios. Tomemos las letras “IF” como estímulo
de control para el programa de intervalo fijo y las letras “RF” como estímulo para el programa
de razón fija. Ahora supongamos que, una vez establecido el control de estímulos, presentamos
el estímulo cuando el pichón de hecho se encuentra en un programa de razón. Con seguridad
puede suponer, en base a la investigación disponible, que el pichón responderá "como si creyera
que el programa es de intervalo fijo”. ¿Es este también un caso de contingencias cognoscitivas?
(pág. 11).
Este hipotético experimento pone de manifiesto que las operaciones que están implicadas en el
control por instrucciones comparten características evidentes con las que tienen los
experimentos acerca del control discriminativo. Junto con esta correspondencia se encuentran
diferencias potencialmente importantes que requieren de un análisis más elaborado. El factor
limitante que existe en el estudio del control por instrucciones es de orden metodológico.
Cuando se estudia el control de estímulos en el laboratorio de animales, las respuestas se
refuerzan diferencialrnente en presencia de un estímulo particular y se utiliza el término
“estímulo discriminativo” para hacer referencia a aquellos estímulos que muestran lograr
control sobre el responder. Por consiguiente, pueden especificarse las características de los
estímulos y se cuenta con una amplia información sobre las circunstancias en las que se
desarrolla el control. En contraste, en la mayor parte de la investigación acerca de las
instrucciones, las propiedades de control de los estímulos de instrucción se establecen antes de
iniciar el experimento, a pesar de que se sabe poco acerca del desarrollo de estas propiedades.
Esto no significa que no puedan realizarse explicaciones del control por instrucciones al tomar
como base las interpretaciones de la conducta tal y como ocurre en el medio ambiente natural.
Es común, en la socialización del niño, destacar el reforzamiento diferencial de las respuestas
que se dan a las instrucciones que proporcionan los padres, y otros adultos, y resulta plausible
el supuesto de que las instrucciones que se proporcionan a sujetos adultos en el laboratorio
entran en contacto con esta compleja historia. Pero, a diferencia de las conclusiones obtenidas
de los estudios de control discriminativo en el laboratorio, tales explicaciones del control por
instrucciones resultan muy aventuradas.
El análisis completo de los efectos que tienen las instrucciones como una forma de control
discriminativo, debe esperar hasta contar con procedimientos que permitan la observación
directa de su desarrollo. Una estrategia prometedora, pero que casi no se ha puesto en
práctica, consiste en investigar a individuos quienes, por sus características especiales, son
insensibles a las instrucciones y, por consiguiente, a quienes se les puede observar durante la
adquisición de conducta de seguir instrucciones. Dentro de esta línea se encuentra un
experimento divulgado por Ayllon y Azrin (1964, exp. II) como fragmento de sus estudios
realizados con pacientes psiquiátricos. Aunque muchos de los sujetos con los que trabajaban no
respondían cuando recibían la instrucción de llevar a efecto una respuesta no reforzada,
posteriormente todos lo hicieron cuando las instrucciones se acompañaron con el
reforzamiento. Por medio de procedimientos que refuerzan selectivamente las respuestas
congruentes con las instrucciones, se han producido incrementos similares de las respuestas a
las instrucciones en niños de preprimaria (Schutte y Hopkins, 1970) y adolescentes retrasados
(Streifel, Bryan y Aíkins, 1974).
Una propiedad de las instrucciones estriba en que éstas suelen tener influencias más generales
que los eventos estimulantes discretos. En los experimentos operantes, las instrucciones
preceden y a la vez concurren con la relaciones respuesta-reforzador que se estudian y las
influencias de las instrucciones que se suscitan en esta relación pueden ser facilitadoras o
inhibidoras. Estas consideraciones llevaron a Bijou y Baer (1966) a proponer que las
instrucciones son un tipo de “evento disposicional”. Bijou y Baer, así como otros autores (y por
ejemplo Steinman, 1977; Wahler y Fox, 1981) han puesto énfasis en la noción de evento
disposicional (Kantor, 1959) como una forma de dar cuenta de variables históricas que pudieran
alterar la efectividad de las contingencias de reforzamiento actuales. Aunque se considera que
los eventos disposicionales potencialmente pueden descomponerse en estímulos
componentes, es cierto que proporcionan una forma de resumir globalmente los aspectos
complejos pasados y presentes de los contextos del medio ambiente que interactúan con las
contingencias actuales. Con el propósito de ejemplificar los eventos disposicionales Bijou y Baer
se pusieron a trabajar con las operaciones de privación y saciedad, así como con los aspectos
más remotos de la historia del individuo, como la educación, la identificación sexual y la
pertenencia a una clase social. La noción de evento disposicional también se ha aplicado al
análisis de la conducta de imitación (véase la siguiente sección); por ejemplo, al buscar la forma
de abordar el hallazgo que mostró que la ejecución del niño ante una respuesta modelada, no
sólo depende del reforzamiento explícito de la respuesta, sino que también depende de la
presencia o ausencia del modelo del adulto (Steinman, 1977).
Bijou y Baer (1966) hacen notar que las instrucciones proporcionadas en los experimentos con
niños, constituyen una clase importante de eventos disposicionales y no resulta difícil toparse
con formas de instrucción que se adecuan a su definición. Un ejemplo similar lo forman las
instrucciones que se proporcionan en un experimento operante en cuanto a la disponibilidad
del reforzador (“en esta máquina puedes ganar dulces"). Dada la historia del niño, esta
expresión puede cumplir la misma función de incentivo que la presentación real del evento al
que se hace referencia y, de esta forma, puede tener efectos generales sobre la conducta del
niño. Además, el hecho de que las instrucciones se proporcionen por un individuo en una
posición de autoridad, puede evocar respuestas características como orientación hacia el
aparato, reacciones emocionales, etc. Anteriormente hicimos notar que también puede
considerarse que el control por instrucciones cumple la función de estímulo discriminativo,
como cuando las instrucciones especifican una relación contingente entre una respuesta
particular y la entrega de un reforzador (“si presionas este botón, puedes ganar dulces en esta
máquina"). Redd y Wheeler (1973) trabajaban en el problema de determinar si clasificar a las
instrucciones como eventos disposicionales será mejor que clasificarlos como estímulos
discriminativos. Desde nuestro punto de vista, estas formas alternativas de conceptuar los
efectos de las instrucciones no compiten entre si. Como regla general, las instrucciones, que
inevitablemente se introducen en los experimentos con sujetos humanos, tienen efectos
amplios que no pueden tratarse únicamente en los mismos términos que las contingencias del
experimento. Además, en muchos de los experimentos que hemos discutido, las instrucciones
describían las contingencias del programa experimental y, por tanto, constituían estímulos
discriminativos cuyas propiedades de control dependían del hecho de que las respuestas que
evocaban fueran o no reforzadas.
Conducta imitativa
Como lo señala Bandura (1971), el control de la conducta por medio de instrucciones verbales
(lo que él denomina “modelamiento verbal”) tiene rasgos en común con la inducción de
conducta imitativa realizada por medio de demostraciones (a lo que denomina "modelamiento
conductual"). Se dice que la imitación ocurre cuando un individuo lleva a cabo una respuesta y
un observador realiza una respuesta similar. La contraparte; en los estudios de las instrucciones
realizadas en el laboratorio, en su forma más simple, aparece cuando la respuesta en cuestión,
en lugar de demostrarse se describe (por ejemplo, "al presionar la tecla se enciende la luz de
reforzamiento”). En los estudios de laboratorio, tanto de imitación como de control por
instrucciones, la respuesta se refuerza una vez que se realiza su ejecución correcta.
Además de estas similitudes de procedimiento, existen ciertas correspondencias interesantes
entre los tipos de control logrado por medio de instrucciones y aquellos que se sabe resultan de
las demostraciones. Un procedimiento común consiste en que un modelo adulto realice una
serie de respuestas verbales o motoras (frecuentemente al agregar instrucciones como "haz
esto") a la vista de un niño, el sujeto experimental. Las respuestas imitativas a un grupo de
estos estímulos (aquellos designados como estímulos discriminativos positivos) son reforzados
y las respuestas a los estímulos restantes (aquellos designados como estímulos discriminativos
negativos) no se les aplica reforzamiento posterior. En varios estudios se encontró que este tipo
de programa produce conducta imitativa, ya que el niño llega a copiar las respuestas del adulto.
Sin embargo, un hallazgo menos esperado consiste en mostrar que, en los ensayos negativos,
también ocurren respuestas de imitación persistentes y estas respuestas pueden mantenerse
indefinidamente en ausencia de reforzamiento. El descubrimiento que mostró que el
rforzamiento diferencial no establece un buen control discriminativo sobre la conducta
imitativa fue señalado por primera vez por Baer y Sherman (1964), quienes sugieren que el
reforzamiento de la conducta imitativa fortalece una clase general de respuestas "la imitación
generalizada”, mas no solamente las respuestas que se modelan.
Con respecto al fenómeno de la imitación generalizada se han propuesto diferentes
interpretaciones; por ejemplo, que el niño es incapaz de discriminar entre los estímulos
positivos y negativos o que las similitudes entre las ejecuciones del adulto y del niño adquieren
propiedades de reforzamiento condicionado. Desde la perspectiva de la presente discusión, las
consideraciones importantes consisten en afirmar que las respuestas imitativas ocurren sin
reforzamiento explícito y que estas respuestas continúan apareciendo a pesar de las
contingencias contradictorias. Recordemos que gran parte de la investigación que se dedica a
estudiar las respuestas que se derivan de instrucciones se caracteriza por lograr resultados
similares: las respuestas ocurren con toda su fortaleza cuando se dan las instrucciones para
responder por primera vez y los patrones iniciales de respuesta persisten, a pesar de ser
incongruentes con la estructura del programa.
La investigación referente a la conducta imitativa ha empezado a aislar procedimientos que
generan control discriminativo sobre el responder. Asimismo, las variables importantes que
influyen al respecto son análogas a las que se implican en los efectos producidos por las
instrucciones. Un rasgo crítico de la investigación acerca de la imitación se desprende del
programa de discriminación. Como dijimos anteriormente, el programa supone, normalmente,
un procedimiento sucesivo donde los ensayos positivos y negativos se alternan en una serie
irregular. Sin embargo, cuando el programa se cambia por un procedimiento simultáneo (de
elección), de tal forma que se pide al niño que escoja cuál de las dos respuestas va a imitar, se
seleccionan las respuestas que cuentan con historia de reforzamiento en lugar de dar
preferencia a las que no se han reforzado previamente. Estos descubrimientos llevaron a
Steinman (1977) a proponer que la presencia del modelo adulto, junto con las instrucciones de
imitar, funcionan como eventos disposicionales que influyen sobre la probabilidad de que una
respuesta imitativa se realice. Como lo dice el autor, “Dependiendo de la historia de
consecuencias del niño por cumplir o no con las instrucciones del adulto, abstenerse de
responder bajo estas circunstancias para el niño puede ser simplemente más aversivo que
responder” (pág. 107). Por consiguiente, anticipamos un conflicto que surge bajo el
procedimiento sucesivo entre el control del evento disposicional (presencia del modelo adulto)
y el control de las contingencias de reforzamiento diferencial. En comparación, el control del
evento disposicional bajo el procedimiento simultáneo, a la vez que permite que las
contingencias diferenciales controlen las respuestas particulares, garantiza que la respuesta
imitativa ocurra.
Estos descubrimientos pueden relacionarse de manera más estrecha con nuestro análisis de los
efectos que producen las instrucciones, si tomamos en cuenta las diferentes contingencias que
están asociadas a los procedimientos de discriminación sucesiva y simultánea. En la medida en
que las respuestas de cada ensayo, positivo o negativo, reúnan todos los reforzadores
disponibles, no se requerirán ejecuciones discriminadas con el procedimiento sucesivo. Pero,
con el procedimiento simultáneo, las ejecuciones discriminadas son esenciales; por ejemplo, si
un niño respondiera en forma indistinta a los estímulos positivos y negativos, perdería la mitad
de los reforzadores disponibles.
Nuestra hipótesis afirma que en la imitación generalizada observada en los niños y en el
seguimiento de instrucciones persistente que se manifiesta en los experimentos operantes con
sujetos adultos aparecen procesos similares. En ambos casos se pone de manifiesto la
importancia que tienen los eventos disposicionales que se relacionan con la historia social del
individuo. Además, las conductas dependen considerablemente de las tasas globales de
reforzamiento. Cuando una u otra forma de responder conduce a la pérdida de reforzamiento
(como en el caso de instrucciones erróneas o cuando debe elegirse entre respuestas imitativas),
se incrementa el control de las contingencias reales. Los fenómenos de imitación generalizada y
seguimiento persistente de instrucciones, posiblemente resulten un tanto inesperados debido a
que las ejecuciones, si bien es cierto que sirven para maximizar las tasas de reforzamiento,
también producen una considerable cantidad excedente de respuestas. No obstante, aún
queda por determinar si el trabajo implicado en estos experimentos, imitar a un modelo adulto
o presionar una tecla, es necesariamente aversivo en ausencia de reforzamiento explícito. Otro
enfoque afirma que en el contexto del experimento existen otros reforzadores, (por ejemplo,
reforzadores sensoriales) que sostienen la conducta.
Interpretaciones mediacionales
Como hicimos notar al principio, algunos autores han vinculado el control por instrucciones con
procesos cognoscitivos hipotéticos que se supone subyacen en toda conducta humana. Tal vez
la opinión más radical fue la que expresó Brewer (1974), quien utilizó dicho control para indicar
que los humanos no están sujetos al condicionamiento; únicamente pueden condicionarse a
cambios de estructuras cognoscitivas. El análisis que hace Bandura (1971; 1977) de las
instrucciones como un vehículo del reforzamiento vicario es más moderado. Así como cuando
observamos que refuerza la respuesta de un modelo, el recibir la instrucción de que nuestras
propias respuestas serán reforzadas crea "representaciones cognoscitivas de las contingencias”
que influyen en la ejecución del sujeto cuando se presenta 1a oportunidad de responder. De
manera similar, Thoresen y Mahoney (1974) plantean que las ejecuciones humanas complejas
se controlan por "consecuencias anticipadas (o sea, imágenes y pensamientos acerca de las
contingencias existentes)” (pág. 120). Estas anticipaciones pueden originarse por las
instrucciones que el individuo se proporciona a sí mismo, es decir, por las autoinstrucciones.
Una interpretación más conductual, pero que sin embargo se basa en procesos mediadores, da
por sentado la existencia de respuestas verbales cubiertas. De acuerdo con esta interpretación,
según el reciente análisis de Harzem, Lowe y Bagshaw (1978) y Lowe (1979), en los
experimentos operantes los sujetos humanos describen verbalmente las contingencias para si
mismos, y estas formulaciones sirven como estímulos que controlan la tasa de la respuesta
reforzada. Las instrucciones proporcionadas por el experimentador pueden constituir un
instigador de esta conducta verbal pero, aun cuando no se haga explícita la información sobre
las contingencias, el individuo desarrolla su propia interpretación de la relación respuesta-
reforzador. Por consiguiente, así como en las explicaciones expresadas en términos más
cognoscitívos, la respuesta reforzada se trata como si se controlara por un sistema mediador
("lo que el sujeto se dice"), además de cualquier otra influencia ejercida directamente por las
contingencias.
Las implicaciones metodológicas e interpretativas que tienen estas explicaciones mediacionales
hacen recordar la controversia, actualmente inactiva, en cuanto al papel que juega la
"conciencia" en el condicionamiento verbal (véase Donahoe y Wessels, 1980, para una
revisión). Recordemos que la discusión se centraba sobre los resultados de los experimentos
que utilizaban un procedimiento desarrollado por Greenspoon (1955), en el que se pedía a los
sujetos que dijeran palabras y las palabras de cierto tipo (por ejemplo, sustantivos referentes a
personas) eran reforzadas por el experimentador (por ejemplo, “bien"). La controversia
resultante entre investigadores de orientación cognoscitiva y conductual se relaciona con el
argumento de que únicamente los sujetos capaces de verbalizar con precisión la contingencia
respuesta-reforzador (esto es, lo que estaban, según la posición cognoscitiva, conscientes de
ella) fueron influidos por ésta. Aunque los datos que se obtuvieron sobre este punto no fueron
totalmente congruentes entre sí, muchos autores los tomaron para apoyar la interpretación
que afirma que la conciencia constituye un prerrequisito necesario para el condicionamiento.
A1 apoyar el punto de vista cognoscitivo, Spielberger y DeNike (1966) consideraron con cierto
detalle los mecanismos cognoscitivos que efectivamente podrían implicarse en los
experimentos de condicionamiento verbal. Cabe hacer notar que ellos suponían que los sujetos
realizaban diálogos verbales consigo mismos. Como ejemplos de las cosas que los sujetos
podrían decirse a sí mismos durante el experimento de condicionamiento verbal presentaron lo
siguiente: "Tal vez el que me digan ‘bien’ depende de lo que yo digo"; “Quizás lo que desea‘ es
que’ descubra a qué palabras dice ‘bien’, y quiere que diga otras iguales"; “Tal vez dice ‘blen’
cuando yo digo palabras que se refieren a personas" (pág. 320). Por consiguiente, según este
análisis, el aumento en la emisión de la palabra seleccionada está controlada por la expresión
verbal de la relación entre respuesta y reforzador, más que por la acción directa del reforzador
sobre la respuesta.
Aunque, seguramente, aún no se dice la última palabra en cuanto al papel que juega la
conciencia en el condicionamiento verbal, resultan evidentes ciertos problemas referentes a los
análisis que se apoyan en este proceso. Las explicaciones que se dan a las respuestas que los
humanos manifiestan ante los programas que se basan en eventos verbales cubiertos pueden
presentar problemas similares. Las dificultades son tanto metodológicas como conceptuales.
Tal como originalmente lo señaló Greenspoon (1963) con respecto a la conciencia y el
condicionamiento verbal, el informe verbal del sujeto, el cual normalmente se. obtiene durante
una entrevista posterior al experimento, puede haber sido provocado por la entrevista en si.
Además, tales informes no establecen la relación temporal que existe entre el supuesto estado
de conciencia y el condicionamiento, por lo que puede argüirse que las descripciones que se
hacen de contingencias son consecuencia del condicionamiento y no al revés. Quizás el aspecto
más critico, como lo subraya Holz y Azrin (1966), consiste en considerar que la conducta está
bajo control de eventos internos sin registrar. Una vez discutida la posibilidad de explicar la
conducta, tanto de la rata como del pichón, en términos cognoscitivos, estos autores
comentaron:
En ambos casos resultan posibles tales eventos internos, pero sigue vigente el problema
planteado por los conductistas: ¿pueden identificarse los eventos internos que controlan la
conducta? Apelar a constructos hipotéticos que intervienen entre el ambiente controlador y la
conducta, no constituye una solución; simplemente cambia la forma de la pregunta. Si se
postula la conciencia, entonces debemos preguntar ¿cuáles son las condiciones que producen la
conciencia y qué condiciones determinan que la respuesta ocurra o no ocurra una vez que existe
la conciencia? Si estas preguntas tienen respuesta, la ley de la parsimonia puede aplicarse una
vez más con el fin de eliminar los constructos que intervienen (pág. 807).
Recientemente Shimoff et al. (1981) hicieron un planteamiento similar en lo que se refiere a las
explicaciones que se daban de los efectos que provocaban las instrucciones desde el punto de
vista de las respuestas verbales cubiertas, en casos en los que la información acerca de los
mediadores verbales hipotetizados se obtiene en entrevistas posteriores al experimento. Según
sus propias palabras:
En un análisis experimental nuestra tarea no consiste en tratar a los informes verbales como si
fueran causas, sino 1a de identiIicar la forma en que tales informes, así como la conducta
extraverbal a la que acompañan, son afectados por las variables medioambientales. Tanto el
valor como la correlación de dichos informes verbales, en relación con otras conductas, resultan
problemáticos. La incertidumbre persistirá mientras se carezca de explicaciones adecuadas de
los informes verbales considerados como respuestas. El desarrollo de procedimientos que
permitan tal análisis experimental sigue siendo un desafío importante (págs. 218-219).
Por lo tanto, no está a discusión si es plausible el supuesto de que la ejecución de los humanos
en programas operantes se acompañe de respuestas verbales cubiertas. Lo que se discute es el
lugar que deben ocupar este tipo de eventos que no están registrados en el análisis. Por el
momento no existen procedimientos convincentes que puedan revelar directamente
cualesquiera que sean las conductas verbales y que ocurran durante el curso de los
experimentos de condicionamiento operante. Tampoco son claros los procedimientos que
podrían aplicarse en un análisis experimental del control que tales conductas ejercen sobre las
respuestas al programa.
LA “RESPUESTA DE INSTRUCCIÓN”
La discusión anterior acerca de la relación que guarda el control por instrucciones con la
imitación generalizada, junto con nuestra consideración acerca del papel que juegan los
estímulos de instrucción como evento discriminativo, trajeron a colación el asunto referente a
que los individuos pueden responder apropiadamente a las instrucciones que no han sido
explícitamente asociadas con el reforzamiento. Esta propiedad del control por instrucciones es
de importancia central para la integración de las publicaciones de investigación, porque implica
que la conducta de seguir instrucciones incluye algo más que un estímulo particular que
ocasiona una respuesta característica. El control general que puede ejercerse por medio de
instrucciones plantea problemas para los modelos de simple control de estímulos. Sin embargo,
la consideración de las ejécuciones que se realizan en paradigmas de discriminación compleja
puede proporcionar las bases para un análisis más satisfactorio.
Consideremos los casos particulares de las discriminaciones de igualación a la muestra e
igualación de singularidad, en los que se ha observado que los estímulos novedosos logran
control sobre la conducta de maneras predecibles. Por ejemplo, en el problema de igualación a
la muestra se presenta al sujeto un estímulo como muestra; quien, luego, debe seleccionar ese
estímulo entre la presentación de varios estímulos. El entrenamiento para discriminar entre un
grupo de estímulos da lugar a una igualación precisa no sólo de esos estímulos, sino también de
los estímulos nuevos que no se presentaron durante el entrenamiento. La adquisición de la
respuesta de igualación se ha analizado como si ocurriera a dos niveles. Un nivel consiste en la
adquisición. de una respuesta a un estimulo con propiedades físicas específicas. Un segundo
nivel estriba en la adquisición de una respuesta de orden superior cuya dimensión de control
revela una regla abstracta o concepto, en este caso, "similitud” (Cumming y Berryman,1965;
Urcuioli y Nevin,197S).
En lo que se refiere al control por instrucciones, puede hacerse una distinción similar entre dos
niveles de respuesta. Por un lado, las instrucciones pueden controlar los patrones de respuesta
específicos, los cuales son señalados por las instrucciones. Sin embargo, las instrucciones
también pueden crear tendencias más generales que sigan cualquier instrucción que se
presente. Esta segunda propiedad fue discutida por Schoenfeld y Cumming (1963) en el análisis
que hicieron del papel que juegan las instrucciones en los experimentos de percepción. Estos
autores propusieron que los estímulos de instrucción en los mencionados experimentos evocan
lo que ellos denominan respuestas de instrucción; la respuesta persistente que modifica él
complejo de estímulos presente en ese ensayo. Esta respuesta puede considerarse como una
respuesta de orden superior que es capaz de dominar una amplia variedad de conductas de
otro tipo. Un corolario importante que se desprende del análisis de Schoenfeld y Cumming
estriba en que la misma respuesta de instrucción puede ser influida por las consecuencias de
las conductas que controla. Por consiguiente, la respuesta de instrucción "puede condicionarse,
extinguirse, someterse a reforzamiento intermitente y, en todo caso, manipularse" (pág. 240).
Esta noción que se dio a la respuesta de instrucción, en lo que se refiere a su aplicación a las
instrucciones sobre los programas de reforzamiento, puede investigarse en el laboratorio
utilizando procedimientos que centren la atención en las contingencias específicas que están
asociadas con la conducta de seguir instrucciones. Por ejemplo, el seguimiento de instrucciones
debe fortalecerse por el reforzamiento y debilitarse por el castigo. Por medio del reforzamiento
selectivo, el seguimiento de instrucciones debe quedar bajo control discriminativo y los
estímulos que controlan la respuesta (es decir, las instrucciones mismas) deben reforzar la
conducta de observación.
Nosotros empezamos a examinar estas propiedades en una serie de experimentos (Galizio,
1979), cuyos resultados presentaremos más adelante; en cuanto al método, ya lo hemos
explicado. En resumen, se adiestró a estudiantes universitarios para evitar pérdidas monetarias,
con y sin información acerca del programa, con un programa de cuatro componentes. Como ya
se discutió en una sección anterior, sólo aparecieron respuestas diferenciadas cuando se
proporcionaron rótulos de instrucción acerca de los intervalos de respuesta-pérdida dentro de
los componentes. En esta etapa del procedimiento se introdujeron las manipulaciones que
tenían interés para el presente caso. En una de las dos formas se manipularon las
consecuencias de seguir instrucciones al hacer imprecisos los estímulos de instrucción. En la
primera condición simplemente se apagó el generador de pérdidas, de manera que las pérdidas
ya no aparecieran en ningún componente del programa (los rótulos de instrucción se
exhibieron como se hizo anteriormente). A esta condición la llamaremos, la condición “sin
contacto” puesto que los sujetos no harían contacto con las contingencias alteradas si
continuaban siguiendo las instrucciones; esto es, si respondían igual que en la forma anterior
eliminaban las pérdidas. Sin embargo, otra manera de interpretar el procedimiento consiste en
considerar que el seguimiento de instrucciones se refuerza en forma consistente ya que, en
apariencia, el seguimiento de instrucciones anula las pérdidas ante una situación que
anteriormente producía pérdidas. En la segunda condición, se programó el intervalo respueste-
pérdida más pequeño (10 s) en los cuatro componentes y, nuevamente, los estímulos de
instrucción se mantuvieron constantes. En esta condición "de contacto", el seguimiento de las
instrucciones tenía como consecuencia poner al sujeto en contacto con la discrepancía entre el
programa y las contingencias reales. Desde este último punto de vista, esta condición contenía
una contingencia de castigo: si el sujeto persistía en seguirlas instrucciones falsas, responder se
asociaba con pérdida monetaria. Por consiguiente, los procedimientos que se utilizaron en el
experimento hacían esperar que el seguimiento de instrucciones se mantendría bajo la
condición “sin contacto" y que el seguimiento de instrucciones sería suprimido bajo la
condición de "contacto". Eso fue lo que en esencia se encontró. En la figura 5.5 se muestra una
parte de los resultados. En primera gráfica se presentan las ejecuciones que realizaron los
cuatro sujetos al final de la condición previa; es decir, esto sucedió así cuando las instrucciones
describieron en forma precisa las contingencias de los cuatro componentes. Las tasas de
respuesta están bien diferenciadas y son apropiadas para los programas de evitación (así como
para las instrucciones) que están asociados con cada componente, de tal forma que en el
intervalo respuesta-pérdida de 10 segundos ocurrieron las tasas más altas, en el componente
con intervalos intermedios (30 y 60 s) ocurrieron tasas más bajas y en el componente sin
pérdida aparecieron pocas respuestas. En la primera manipulación, cuando se hicieron
imprecisas las instrucciones al eliminar todas las pérdidas (condición sin contacto, gráfica 2), no
hubo efectos aparentes; es decir, el seguimiento de instrucciones persistió. En contraste, el
procedimiento de la siguiente condición en la que se programó un intervalo corto de respuesta-
pérdida en los cuatro componentes (condición de contacto, gráfica 3), condujo el cese del
seguimiento de instrucciones y a la adopción de tasas de respuesta apropiadas al programa real
de evitación de 10 segundos (el sujeto MB constituye una excepción en el caso de las sesiones 4
y 5 en las que, inexplicablemente, no respondió y como consecuencia no obtuvo dinero). El
ajuste que se hizo al programa que estaba bajo la condición de “contacto” se desarrolló
abruptamente durante la primera sesión e inmediatamente después de sufrir pérdidas
contingentes con respecto a la conducta de seguir instrucciones falsas. Con el fin de determinar
en qué grado se había perdido el control de las instrucciones, al apoyar nuevamente el
generador de pérdidas, restablecimos la condición original “sin contacto", como fase final del
experimento. Si el seguimiento de instrucciones realmente hubiera sido, eliminado por el
castigo previo, entonces las instrucciones reflejarían las contingencias reales, mas no las
instrucciones. La gráfica derecha de la figura 5.5 confirma esta proposición. Tres sujetos
mostraron tasas disminuidas, al indicar que las respuestas eran controladas por la contingencia
de pérdida, mas no por las instrucciones. El cuarto sujeto mantuvo las tasas altas indiferencia
tampoco mostró indicios de reaunudar el seguimiento de instrucciones que manifestó en 1a
condición "sin contacto” previo.
Una propiedad importante de la conducta operante consiste en que ésta puede ponerse bajo
control discriminativo. Este aspecto del seguimiento de instrucciones lo examinamos en otro
experimento en el que utilizamos un procedimiento con el que se alternaban instrucciones
verdaderas y falsas en la misma sesión. Se asociaron estímulos diferentes (luces de colores) en
las dos condiciones. Al igual que en los experimentos anteriores, se estudiaron los dos tipos de
discrepancias que había entre instrucciones y contingencias. Primero el procedimiento "sin
contacto" donde se eliminaron todas las pérdidas y, enseguida, el procedimiento de "contacto”
en el que se programó el intervalo respuesta-pérdida más corto en los cuatro componentes.
En la figura 5.6 se muestran los resultados que obtuvieron dos sujetos. En cada gráfica se
contrastan las ejecuciones que se realizaron en presencia del estímulo, que estaba asociado con
las instrucciones precisas (círculos blancos), con las ejecuciones que se realizaron al seguir
instrucciones falsas (círculos negros). La primera gráfica muestra que los resultados iniciales
fueron semejantes a los que se obtuvieron con los experimentos previos en los que las tasas de
respuesta variaron sistemáticamente bajo la condición “sin contacto”, independientemente de
que las instrucciones fueran precisas o falsas. Cuando se introdujo de "contacto" con el
intervalo respuesta-pérdida de 10 s en los cuatro componentes (contacto, gráfica 2),
rápidamente surgió el control discriminativo sobre la conducta de seguir instrucciones. En
presencia del estímulo que estaba asociado con instrucciones precisas, se continuó con el
seguimiento de las instrucciones y, en presencia del estímulo que estaba asociado con las
instrucciones falsas, las respuestas ocurrieron de acuerdo con las contingencias reales (las tasas
aumentaron en los cuatro componentes). Finalmente, como sucedió en el experimento
anterior, las instrucciones ya no fueron seguidas cuando se aplicó la condición en que se
omitieron las pérdidas (sin contacto, gráfica 3). La rápida disminución de las tasas en presencia
del estímulo que estaba asociado con las instrucciones erróneas, indica que la respuesta llegó a
quedar bajo control de las contingencias reales.
Un último experimento de esta serie se basó en el descubrimiento de Wyckoff (1969) en cuanto
a que los estímulos discriminativos pueden reforzar la conducta de observación. En algunos de
nuestros trabajos anteriores desarrollamos algunos procedimientos para estudiar este
fenómeno con sujetos humanos y encontramos que los estímulos corrrelacionados con el
tiempo resultaron reforzadores efectivos para sujetos que respondían bajo programas de
intervalo fijo y evitación con reforzamiento monetario (Baron y Galizio, 1976). En el presente
estudio combinamos este procedimiento con el procedimiento básico de evitación, de tal forma
que la respuesta de observación se hacía necesaria con el fin de exhibir el rótulo que revelaba
el intervalo respuesta-pérdida. En distintas condiciones, la respuesta exhibió los rótulos de
instrucción durante diferentes periodos de tiempo, entre 10 y 30 s.
Los resultados que se resumen en la figura 5.7 muestran que los estímulos de instrucción
llegaron a ser reforzadores efectivos, ya que los tres sujetos respondieron a tasas que
mantuvieron iluminado el rótulo durante una buena parte de la sesión; el rango varió del 28
(sujeto CB, en 10 s) al 83% (sujeto PR, en 20 y 30 s). Cuando se eliminó 1a contingencia que se
introdujo entre la respuesta de observación y la exhibición del rótulo (Ext. en la figura 5.7), las
tasas disminuyeron hasta un nivel cercano a cero. Los resultados fueron similares cuando se
emitieron instrucciones erróneas al programar el intervalo respuesta-pérdida breve en los
cuatro componentes (contacto en la figura 5.7).
En conjunto, los tres experimentos anteriormente descritos muestran que los seguimientos de
instrucciones poseen características similares a otro tipo de respuestas operantes. La tendencia
a seguirlas instrucciones fueron influidas por sus consecuencias, ya que la conducta se sostuvo
cuando las consecuencias se asociaron con el reforzamiento continuo y se suprimió cuando las
consecuencias fueron aversivas. Encontramos que la respuesta podía ponerse bajo control
discriminativo por medio de reforzamiento diferencial en presencia de estímulos diferentes.
Finalmente, encontramos que los estímulos de instrucción poseen propiedades reforzantes,
característica que se comparte con otro tipo de estímulos discriminativos.
La noción de seguimiento de instrucciones como un tipo de respuestas distinta, proporciona un
marco de referencia a la bibliografía que surge de la investigación. Una implicación esencial
consiste en que las instrucciones generan interacciones y, por tanto, conflictos potenciales
entre los sistemas de respuesta; por un lado, la llamada respuesta de instrucción y, por otro, las
respuestas controladas por las contingencias de los contextos reales del medio ambiental. Por
consiguiente, las circunstancias en las que las instrucciones podrían facilitar o impedir las
respuestas a las contingencias reales dependen de la compatibilidad relativa de los dos tipos de
respuestas, así como de su respectiva fortaleza.
En estos términos, el análisis debe tomar en cuenta las variables comunes que controlan las
respuestas operantes, como podrían ser la naturaleza y programación de los eventos
reforzantes, la prominencia de los estímulos discriminativos, la historia de reforzamiento, etc.
Este punto de vista no excluye algunas de las explicaciones que se dan con respecto a los
efectos que producen las instrucciones discutidas anteriormente. En particular, nuestro
reconocimiento del seguimiento de instrucciones como respuesta, no especifica su ubicación o
sus dimensiones. Tal como lo han propuesto otros autores, esta respuesta muy bien podría
comprender la repetición cubierta de las conductas verbales que se implican en la lectura y
comprensión de los estímulos de instrucción. Lo único que podríamos agregar es que las
explicaciones que se basan en tales procesos mediadores estarán incompletas, mientras no se
obtenga información directa acerca de estos eventos y sus variables controladoras. En cuanto a
la conclusión que afirma que las instrucciones reducen la sensibilidad a las contingencias del
programa, nuestro punto de vista señala algunas de las circunstancias, si este fuera el caso.
Pero, como originalmente lo sugirieron Schoenfeld y Cumming (1963), las instrucciones
también pueden servir para orientar a los sujetos hacia los eventos del medio ambiental y, por
tanto, pueden tener la capacidad de aumentar, más que reducir, la sensibilidad a las relaciones
respuesta-reforzador.
El fenómeno del control por instrucciones tiene implicaciones importantes para el análisis de
laboratorio de la conducta humana. Para el investigador interesado en los programas operantes
resulta obvio recomendarle precaución. Puesto que es prácticamente inevitable cierta
interacción verbal entre el sujeto y el experimentador, los investigadores podrían toparse con
cierta dificultad para determinar si la conducta que están observando se encuentra bajo control
de las instrucciones o del programa. Como señalamos anteriormente, las características del
ambiente de laboratorio u otros aspectos del procedimiento pueden funcionar, aun en ausencia
de instrucciones específicas, como eventos disposicionales que limitan o exageran los efectosde
las contingencias del programa. Teniendo en cuenta estos problemas, las conclusiones
definitivas acerca del control que el programa ejerce sobre las respuestas que emiten los
humanos hacen necesario comparar las ejecuciones con diferentes condiciones que
comprenden el moldeamíento de respuestas en sujetos que no reciben instrucciones, así como
con los procedimientos que dan instrucciones específicas acerca del programa. Nuestra
investigación sobre las consecuencias que tienen las instrucciones falsas pone de manifiesto
otra posibilidad. Con el fin de reducir la influencia potencial que ejercen las instrucciones, los
sujetos pueden inicialmente recibir instrucciones falsas que entren en conflicto con las
contingencias del primer programa. Descubrimos que este procedimiento conduce a los sujetos
a hacer caso omiso de cualquier instrucción subsecuente que se proporcione.
El hecho de que los estudios dedicados a examinar el papel que juegan las instrucciones en
medio aplicados, como los experimentos de Ayllon y Azrin (1964), no hayan mostrado el tipo de
efectos abrumadores que se obtienen en el laboratorio, no tiene interés meramente pasajero.
El presente análisis podría ser de valor en este caso. En el mundo real, si un niño gritara “lobo”,
cuando no hay lobo, tendríamos que estar de acuerdo con Esopo en que los lugareños con el
tiempo cesarían de reaccionar. Sin embargo, difícilmente esperaríamos que dejaran de seguir
las instrucciones que se dan unos a otros; sólo se eliminarían las del niño. En la psiclogía social
es bien sabido que las respuestas a la comunicación persuasiva varían en función de la fuente;
por su parte, Bandura (1969) y otros proponen que el control depende de la probabilidad de
obtener consecuencias favorables cuando se siguen las recomendaciones de la fuente.
Nuestros experimentos, en los que se pusieron bajo control discriminativo el seguimiento de
instrucciones, proporcionan apoyo empírico a esta forma de caracterizar el papel que juega la
fuente en las comunicaciones persuasivas y también propone una metodología que podrían
seguir otros estudios que centran la atención en estos problemas.
Los estudios que se han hecho acerca del control por instrucciones en los ambientes naturales
apoyan el presente análisis. Como contraparte aplicada a nuestra investigación de laboratorio
analizamos las variables que podrían llevar a controlar el conducir a velocidad excesiva en las
carreteras (Galizio, Jackson y Steele, 1979). UN descubrimiento general mostró que, a
diferencia de los rótulos de instrucción del laboratorio, las señales de las carreteras, en lo que
respecta a los límites de velocidad (“Límite de velocidad 50 km/hr” o “velocidad vigilada por
radar”) constituyen fuentes de control débiles. De hecho, la única variable que pudimos
identificar y que produjo un sometimiento confiable al límite de velocidad fue la presencia de
una patrulla en la carretera. Según nuestro análisis, las señales de límite de velocidad por lo
general no son apoyadas por las contingencias reales y, en consecuencia, este tipo de estímulos
de instrucción ha perdido su poder de controlar la conducta en forma eficaz. Por otra parte, el
exceso de velocidad frente a una patrulla tiene una gran probabilidad de relacionarse con
consecuencias aversivas y se mantiene como un potente estímulo de control. Volviendo una vez
más a los experimentos de laboratorio, el sujeto humano se encuentra inseguro, quizá
temeroso de las contingencias, pero para él es incuestionable que su conducta se encuentra
bajo una minuciosa observación. El individuo se encuentra en tal situación que, por lo menos a
corto plazo, es de esperar que fomente una sensibilidad exagerada al control por instrucciones.
CONCLUSIÓN
Hemos analizado varios experimentos de laboratorio que tratan de encontrar las influencias
que las instrucciones ejercen sobre la ejecución realizada por humanos. El hilo conductor
general de estos estudios consiste en afirmar que las instrucciones pueden ejercer un fuerte
control sobre la conducta, aun al grado de anular el control del programa de reforzamiento
real. Sin embargo, esta posibilidad de controlar por instrucciones no se interpretó como una
limitación del reforzamiento de la conducta humana, sino como un ejemplo que pone de
manifiesto la forma en qué las historias de reforzamiento afectan cierto tipo de conducta
gobernada por reglas.
Muchas de las preguntas generadas por el análisis conductual del control por instrucciones no
se han podido responder. Por ejemplo, la adquisición inicial del control por instrucciones sólo
puede abordarse mediante un programa de investigación del desarrollo. De las diferentes
cuestiones, un problema particularmente intratable lo representa el seguimiento de
instrucciones que, como el caso de la conducta imitativa, carece de una topografía que la
distinga. Por consiguiente, la conclusión que afirma que se ha seguido una instrucción o que ha
ocurrido la imitiación, constituye una inferencia compleja que se deduce del contexto en que
ocurre la conducta. En ambos casos, el rasgo distintivo estriba en que se evocan conductas
novedosa; y que éstas persisten frente a contingencias contradictorias. Estos problemas de
análisis se magnifican cuando se toma en cuenta al proceso por medio del cual se adiestra al
individuo en desarrollo para obedecer instrucciones o para imitar las respuestas de otros. Una
explicación completa debe especificar los eventos medioambientales que permiten a los
agentes de reforzamiento identificar la conducta y los eventos que controlan la propia
conducta. Estos problemas que no han sido resueltos fueron planteados por Catania (1979) con
respecto a la conducta imitativa; sus comentarios son de igual, si no es que mayor, fuerza
cuando se aplican al fenómeno del seguimiento de instrucciones:
Desconocemos las dimensiones físicas pertinentes de la conducta imitativa (por ejemplo, si, en
el juego de “Simón dice”, el niño ve la mano del líder pero no la siente, mientras que siente
pero no ve su propia mano; ya que no hay una correspondencia entre ver la mano de otra
persona y sentir la propia, ¿cómo puede el niño aprender a imitar?). De hecho, podríamos
preguntar ¿qué dimensiones de correspondencia controlan nuestra respuesta que consiste en
llamar imitativas a ciertas clases de conducta? (pág. 164).
FIGURA 5.1.
FIGURA 5.2
FIGURA 5.3
FIGURA 5.4
FIGURA 5.5
FIGURA 5.6
FIGURA 5.7