Está en la página 1de 39

Barón, A. & Galizio, M. (1990). Control de la conducta operante humana por medio de instrucciones.

En
E. Ribes y P. Harzem (Comps.), Lenguaje y Conducta (pp. 123-168). México: Trillas.

Control de la conducta operante humana por


medio de instrucciones
ALAN BARON
MARK GALIZIO

INTRODUCCIÓN

Los métodos de condicionamiento operante se estructuraron originalmente para estudiar


animales infrahumanos, por lo general ratas y pichones; pero, en la actualidad, es común
utilizar series de procedimientos de laboratorio tipo. Por ejemplo, Ferster (1953) explicaba que
la forma de preparar a los pichones para utilizarlos en un experimento operante consistía en
crear un estado de privación apropiado, entrenar el ave para que coma el grano del receptáculo
de alimento, establecer la respuesta de picotear el disco, etc. Pero, por otro lado, la ampliación
de los métodos operantes al análisis experimental de la conducta humana origina algunos
problemas nuevos, así como presenta opciones novedosas que normalmente no se encuentran
en el laboratorio de animales. Entre éstas se encuentra el sobresaliente papel que juegan las
instrucciones. Es obvio que en todo experimento de laboratorio con sujetos humanos ocurre
cierto tipo de intercambio verbal. No se puede simplemente sacar a alguien de su casa, meterlo
en una cámara y poner seguro a la puerta (aunque este procedimiento es similar al que se
aplica con el pichón). La ética de la investigación y los reglamentos federales nuevos exigen
que, por lo menos, se obtenga el consentimiento del sujeto, basándose en la información que
se le proporcione con respecto al procedimiento; es decir, antes de que acepte participar debe
informarse al sujeto acerca de los riesgos y beneficios potenciales del procedimiento. Además
de esta función, las instrucciones proporcionan una forma de inducir conductas que pueden
tener un interés especial para el investigador. A diferencia del pichón, el sujeto humano puede
ser encaminado para que responda y se le pueden proporcionar diferentes grados de
información acerca de las consecuencias que tendrán sus respuestas.
¿Qué tipo de influencias pueden ejercer las instrucciones sobre la conducta operante del sujeto
humano? ¿En qué medida las conductas inducidas mediante instrucciones son equivalentes a
aquellas establecidas por medio de contingencias experimentales? Aunque las respuestas a
estos interrogantes son esenciales para la interpretación adecuada de los experimentos con
sujetos humanos, aún no se han encontrado las soluciones. Skinner (1963) abordó estas
cuestiones en forma introductoria y sugirió que podría haber diferencias fundamentales.
Señalaba que los sujetos normalmente son incapaces de verbalizar con precisión las
contingencias a las que fueron sometidos y que, por esta razón, no era de esperarse que
reaccionaran apropiadamente a la descripción de las contingencias proporcionadas por los
experimentos. Estas consideraciones lo llevaron a proponer que las instrucciones podrían no
ser una buen sustituto de la manipulación efectiva de las contingencias, aunque podrían ser
valiosas cuando el interés se centra en la ejecución eventual de una respuesta, más que en su
adquisición.
Poco después de la publicación del artículo de Skinner aparecieron varios experimentos que
trajeron a colación los asuntos que consideraremos en esta presentación. Uno de los
descubrimientos mostró que, en ausencia de instrucciones específicas con respecto a la
respuesta objetivo, los sujetos humanos podrían no responder al nivel suficiente como para
permitir que se aplique el reforzador (Ayllon y Azrin, 1964). Otro demostró que las
instrucciones pueden ejercer un control poderoso sobre la respuesta, hasta el grado de superar
el control del programa de reforzamiento impuesto en el experimento (Kaufman, Baron y Kopp,
1966; Lippman y Meyer, 1967). Un descubrimiento sorprendente, a la luz del análisis de
Skinner, mostró que los sujetos que recibieron instrucciones acerca de las contingencias del
programa respondían a las contingencias con mayor probabilidad que aquellos sujetos que no
las recibieron (Baron, Kaufman y Stauber, 1969); esto es, que actúen en forma congruente con
la estructura del programa.
Aunque estos descubrimientos no despertaron mayor interés dentro de la psicología operante,
la observación de que las instrucciones podían ejercer mayor control que las contingencias
reales atrajo la atención de algunos críticos de orientación cognoscitiva. Estos consideraban a
los resultados como una muestra de que la respuesta humana, bajo programas de
reforzamiento, no está tan controlada por las contingencias de reforzamiento como por las
creencias e hipótesis que el individuo tiene acerca de la forma como funciona el programa
(Bandura, 1969; Brewer, 1974; Thoresen y Mahoney, 1974). Según su punto de vista, una
interpretación adecuada de las ejecuciones de los humanos debe concentrarse en estas
influencias cognoscitivas; por ejemplo, en "las representaciones cognoscitivas de las
contingencias" en lugar de concentrarse en las propias contingencias. Se considera que las
instrucciones acerca de las contingencias juegan un papel importante en el establecimiento y
mantenimiento de tales representaciones. Los intentos por considerar al control instruccional
en términos cognoscitivos pueden formar parte de una tendencia más general que intenta
introducir tales explicaciones en la psicología operante (Branch y Malagodi, 1980). Sin
adentrarnos en las ramificaciones más generales de este asunto, nos mantenemos escépticos
en cuanto a la conducta controlada por instrucciones tenga una mayor necesidad de
explicaciones cognoscitivas que la conducta controlada por otros aspectos del medio ambiente.
Aunque algunos investigadores conductuales pudieran estar lejos de reconocer a las
instrucciones como un objeto de estudio legítimo, los estímulos de instrucción constituyen
determinantes externos de la conducta cuyas influencias, aunque complejas, deben ser
sometidas a la investigación objetiva. Mientras que la meta del análisis experimental de la
conducta consista en identificar y explicar variables con influencias controlantes sobresalientes,
resultará esencial la atención al control por instrucciones.
En este trabajo revisaremos e interpretaremos los experimentos de laboratorio en los que las
instrucciones modifican las reacciones del sujeto cambiándolas por aquellas de los programas
de reforzamiento. Daremos mayor peso a aquellas investigaciones en las que las instrucciones
se tratan explícitamente como una variable experimental. Los resultados de otros experimentos
que sólo utilizan un nivel de instrucción dejan abierto el problema que trata de la contribución
relativa de las instrucciones (o de su omisión) con respecto a otros aspectos del procedimiento;
por ejemplo, el reforzador particular, el grado en que fueron moldeadas las ejecuciones, el
programa de reforzamiento, etc.

TIPOS DE INSTRUCCIONES
La interpretación de los resultados de estudios específicos podría apoyarse por el sistema de
clasificación de los eventos reconocidos como “instrucciones". Desgraciadamente no se cuenta
con un esquema completo. Puesto que las instrucciones son producto de la conducta verbal,
uno de los enfoques consiste en asociar las distintas formas de instrucción con las clases de
conducta verbal (Skinner, 1957). En las expresiones cotidianas, las instrucciones suelen tomar la
forma de mandos, esto es, de aquella conducta verbal que especifica al escucha la respuesta
que refuerza el hablante. Sin embargo, tal parece que en los experimentos operantes las
funciones de las instrucciones son distintas, ya que describen características del medio
ambiente como en el caso en que se dice a los sujetos “puedes ganar dinero en este
experimento" o apretar la tecla aumentas el contador". En las interacciones verbales naturales,
las expresiones descriptivas de esta especie por lo común funcionan como tactos, como en el
caso en que un profesor o “instructor” enseña al alumno.
No obstante, desde nuestro punto de vista, la clasificación de las instrucciones como formas de
conducta verbal no parece muy productiva. El problema consiste en que el análisis se centra en
las variables que inducen y mantienen la conducta del hablante, es decir, del individuo que
proporciona las instrucciones. El escucha está implicado, pero primordialmente como audiencia
cuya función reside en proporcionar estímulos reforzantes y discriminativos para la conducta
del hablante. En cambio, el análisis del control por instrucciones requiere la consideración de
las relaciones de control entre los estímulos verbales y las respuestas del escucha, es decir,
necesita del individuo que recibe las instrucciones.
La exposición de Skinner (1969) acerca de la conducta gobernada por reglas proporciona un
marco de referencia útil para estimar las propiedades de estímulo que tiene la conducta verbal.
Las conductas que resultan de seguir instrucciones, atender advertencias y obedecer leyes
(ejemplos de conducta gobernada por reglas según Skinner) se consideran como respuestas a
un conjunto de estímulos verbales cuyo rasgo característico estriba en que éstos especifican
contingencias del medio ambiente. Aunque las reglas pueden ejercer un control muy poderoso
sobre la conducta operante, las respuestas a las descripciones de las contingencias pueden
diferir de las respuestas que se dan a las contingencias reales que describen. Esto se debe a
que, por lo general, las reglas no especifican plenamente las contingencias, y también se debe a
que las respuestas inducidas por las reglas no necesariamente son controladas por los mismos
eventos de privación y aversivos. Es de mayor importancia el hecho de que las conductas de
seguimiento de reglas en sí mismas son influidas por sus consecuencias. Esto conduce a
considerar las ejecuciones de los sujetos humanos en el laboratorio en términos de las
interacciones entre las respuestas engendradas por las instrucciones y las respuestas inducidas
por las contingencias que se están estudiando.
Hasta no contar con un análisis más detallado debemos ser un tanto pragmáticos al hacer
nuestras clasificaciones de estímulos de instrucción. Un examen de los procedimientos que se
utilizaron en varios experimentos pone de manifiesto que la dimensión importante
corresponde al grado de detalle que se proporciona a las contingencias experimentales. A
manera de ilustración, consideremos las siguientes instrucciones que fueron utilizadas en uno
de los primeros estudios de la conducta operante humana (Dews y Morse, 1958). En este
experimento se entregaban monedas a los sujetos de acuerdo con un programa que combinaba
características tanto de contingencias de razón fija como de contingencias RDB (reforzamiento
diferencial de tasas bajas).

El experimento se iniciará cuando se encienda la luz izquierda y terminará una hora después,
cuando se apague. Durante el experimento tienes que presionar la tecla de telégrafo. Tu
objetivo es ganar tantas monedas como sea posible. La luz de la derecha se encenderá y
recibirás unas monedas cuando hayas presionado la tecla un mínimo de 100 veces. Sin embargo
los golpes que des dentro de un periodo de dos segundos y medio a partir del golpe anterior no
contarán. Por otro lado, el tiempo que tardes después de los dos segundos y medio es tiempo
perdido. Por Io tanto, para conseguir el máximo posible de monedas, golpea la tecla
regularmente a intervalos que excedan lo menos posible los dos segundos y medio. La siguiente
serie de golpes ocurre a intervalos de dos segundos y medio (se presentan entonces 8 golpes a
intervalos de 2.5 segundos), Empieza a presionar la tecla tan pronto como se encienda la luz
(pág. 360).

En el ejemplo anterior se proporciona al sujeto una considerable información acerca de la


respuesta requerida y las contingencias programadas. Por comparación, las instrucciones
pueden ser considerablemente menos informativa mientras se limiten a expresiones tales
como “puedes obtener dinero en este experimento", o “al presionar la tecla aumenta el
contador". De esta forma, en un extremo del continuo se encuentran las instrucciones que no
hacen otra cosa que especificar que ciertos reforzadores se encuentran disponibles. Estas
instrucciones mínimas pueden ampliarse con el fin de incluir la explicación que indique que una
respuesta determinada de alguna forma produce el reforzador. Finalmente, las instrucciones
pueden describir la contingencia entre la respuesta y el reforzador, es decir, pueden
proporcionar diferentes grados de información sobre la estructura del programa de
reforzamiento. Dentro de esta última categoría las instrucciones sobre los programas pueden
diferir en cuanto a las diversas formas que distinguen a los programas de reforzamiento. Por
ejemplo, las instrucciones pueden referirse a estímulos discriminativos o demoras temporales
entre el responder y los eventos contingentes. También es necesario distinguir entre las
instrucciones que describen con precisión las contingencias y las instrucciones que
proporcionan información falsa acerca de ellas.

RESEÑA DE LOS HALLAZGOS EXPERIMENTALES


Adquisición y control del programa
Empezaremos por describir algunos de los experimentos iniciales que encontraron dificultades
inesperadas para establecer la emisión de respuestas en sujetos que no recibieron
instrucciones, hasta el grado de no indicarles que el reforzador dependía de algo que podían
hacer. Los procedimientos son considerados al detalle a fin de ilustrar el vital papel que pueden
jugar las instrucciones (o su omisión) en el control de la conducta operante de los humanos.
Ader y Tatum (1961) se interesaron en desarrollar un procedimiento para estudiar la evitación
de operante libre en sujetos humanos. Con este objetivo, estudiantes y graduados de medicina,
de sexo masculino, a quienes "no se dijo nada acerca de la naturaleza del experimento”, se
sentaron frente a una mesa en la que había un conspicuo botón rojo. Se les adhirió unos
electrodos en la pantorrilla y se les aplicó descargas eléctricas, lo suficientemente fuertes cómo
para provocar "una flexión involuntaria de la pierna”, a uno de varios intervalos choque-choque
para diferentes sujetos (5, 10 o 20 s). Al presionar el botón se demoraba el siguiente choque el
mismo tiempo que el intervalo choque-choque. Sin embargo no más de la mitad de los 36
sujetos adquirieron la respuesta de evitación durante la sesión de 90 minutos. En cuanto a los
demás sujetos, algunos se quitaron los electrodos terminando así la sesión, otros simplemente
no respondieron, en cuyo caso fueron recibidas todas las descargas aplicadas por el regulador
temporal de choques.
Resultados similares aparecieron en un estudio aplicado de Ayllon y Azrin (1964), el cual fue
diseñado para mejorar las conductas a la hora de la comida de 18 pacientes de sexo femenino
en un hospital psiquiátrico. Si la paciente tomaba el servicio de mesa junto con el alimento en la
línea de servicio, se le daban productos adicionales (dulces, cigarros). A pesar de esta
contingencia, la frecuencia de la conducta deseada no aumentó, llegando a ocurrir en menos
del 10% del tiempo durante una serie de comidas. Después de 20 comidas sin mejora, se
cambio el procedimiento de tal forma que el encargado de la linea de servicio ahora indicaba
explícitamente a los sujetos: "Por favor recoge tu cuchillo, tenedor y cuchara y tendrás derecho
a elegir más leche, café, cigarros o dulces”. El resultado fue que un número considerable de
sujetos (12 de 18) respondieron apropiadamente.
Un tercer ejemplo proviene de un estudio de nuestro propio laboratorio (Baron y Kaufman,
1966). En este estudio, estudiantes universitarios respondían bajo un programa de evitación, en
el cual se utilizaron tiempos en que no había ganancias monetarias como evento aversivo. Cada
vez que se presionaba la tecla se posponía de 10 a 15 s el periodo en que se omitía la señal de
ganancia. Las instrucciones se limitaron a indicar que el pago dependía del número de veces
que la luz de pago centelleara y que, en ocasiones, la luz podía dejar de parpadear. Resultó una
sorpresa para nosotros descubrir que, a pesar de una considerable pérdida de ganancias,
ninguno de los cuatro sujetos presionaba la tecla durante la primera sesión de evitación
(algunos habían respondido durante las sesiones de nivel operante previas). Sin embargo, la
adquisición de la respuesta ocurrió rápidamente cuando, antes de empezar la siguiente sesión,
se les dijo: "estamos dispuestos a pagarte tanto como antes, pero de ti depende hacer algo
para lograrlo”.
El hallazgo de que los sujetos humanos en ocasiones no responden en el laboratorio a menos
que, por medio de instrucciones, se les incite a hacerlo, tiene su contraparte en los
experimentos que buscan sensibilidad a las contingencias programadas una vez que se ha
establecido el responder. Un programa en que la presencia o ausencia de control puede
reconocerse con facilidad es el de intervalo fijo. Los experimentos con sujetos infrahumanos
indican que la mayoría de las respuestas normalmente ocurren al final del intervalo, parte del
programa que está más estrechamente asociada con la entrega del reforzador, mientras que
dicho control temporal no es un resultado común en los sujetos humanos.
Uno dé los primeros casos es el de la investigación divulgada por Azrin (1958), en el cual los
sujetos, soldados de sexo masculino, recibieron instrucciones mínimas antes de responder
iluminando un medidor cuya aguja se desviaba de acuerdo con un programa de intervalo fijo de
3 minutos. Si bien la respuesta de presionar la tecla fue adquirida con prontitud, estos sujetos
mantuvieron tasas elevadas a lo largo del intervalo, aun después de una exposición prolongada
al programa. Weiner (1962) obtuvo resultados similares en un estudio donde jóvenes adultos
del sexo masculino podían obtener puntos si detectaban señales que se presentaban de
acuerdo con un programa de intervalo fijo de un minuto. En las partes subsecuentes de sus
investigaciones, tanto como Weiner introdujeron procedimientos especiales que lograron
producir el control temporal, ya sea aumentando la fuerza requerida para operar la tecla de
respuesta (Azrin) o imponiendo pérdida de puntos contingentes a cada respuesta además de
los puntos entregados al final del intervalo (Weiner).
No hay duda de que los rasgos peculiares de los resultados de éstos y de otros estudios sobre
adquisición y control del programa en humanos, pueden atribuirse a diversos aspectos de la
contingencia respuesta-reforzador; por ejemplo, el programa de reforzamiento particular, el de
reforzador, la cantidad de esfuerzo requerido en la respuesta, etc. Aún hace falta realizar la
investigación necesaria para esclarecer las contribuciones rigurosas, que tienen estas variables
en la ejecución humana. Sin embargo, los hallazgos también muestran que las instrucciones son
una variable que tiene que tomarse en cuenta en el estudio de la conducta humana. Tal como
subrayan subrayan Ayllon y Azrin (1964), las respuestas en los contextos naturales del medio
ambiente comúnmente se inician mediante instrucciones. Dichos autores observaron que el
procedimiento de reforzamiento no fue efectivo en los sujetos que no recibieron instrucciones
debido a que la respuesta por tratar ocurría con tan poca frecuencia que no permitía el
contacto con las contingencias programadas.
Estos resultados también sugieren que las instrucciones mínimas no son necesariamente
neutrales. Dadas las complejas historias con los sujetos humanos que llegan al laboratorio, el
omitir información acerca de los procedimientos puede desencadenar reacciones que
interfieren con el control de las contingencias experimentales. Entre estas reacciones se
encuentra la inhibición de responder en sitios extraños, particularmente cuando no se dice a los
sujetos que responder está permitido. A este respecto, consideremos el comentario que hizo
un sujeto que fue sometido a un experimento de evitación que había recibido descargas
eléctricas repetidamente y, a pesar de ello, no presionaba el gran botón rojo que se encontraba
en la mesa que estaba frente a él: "Creí que se trataba de una prueba de resistencia y que el
botón era un botón de alarma para determinar el experimentos”, (Weiner y Ader, 1965, pág.
428).

Interacciones instrucción-contingencia
Un análisis completo de las interacciones que ocurren entre la instrucción y la contingencia
requiere de la comparación de las ejecuciones que ocurren después de girar diferentes tipos de
instrucciones. Aquellos procedimientos en los que las instrucciones no corresponden a las
contingencias reales son particularmente interesantes porque revelan la contribución relativa
de los dos factores que participaron en las ejecuciones. Con el fin de obtener este tipo de datos
observamos a estudiantes universitarios que respondían bajo un programa de intervalo variable
de un minuto por puntos acumulados (Kaufman et al., 1966). Los sujetos asignados a las cinco
condiciones del experimento recibieron diferentes grados de instrucción acerca de la relación
respuesta reforzador; se les dijo:
a) Simplemente que se podían obtener puntos.
b) Que, además, se podían obtener los puntos apretando la tecla de respuesta.
c) Que, además, el programa de entrega de puntos era de intervalo fijo de un minuto.
d) O que el programa era de intervalo variable de un minuto.
e) O que el programa era de razón variable de 150.
Por consiguiente los sujetos asignados a la condición d) fueron correctamente informados del
programa, mientras que los asignados a las condiciones c) y e)recibieron-información
incorrecta.
Parte de los resultados se muestran en la figura 5.1, la cual presenta los registros acumulativos
de cada una de las cinco condiciones. Las instrucciones mínimas (gráfica superior) condujeron a
la adquisición de la respuesta, pero la forma de responder fue errónea y no mostró buen
control del programa. El control también fue pobre cuando se dieron instrucciones acerca de la
respuesta requerida (segunda gráfica), ya que las tasas de respuesta por lo general excedieron
los requisitos del programa. Aunque el programa real siempre fue el mismo, los sujetos
asignados a las tres condiciones tendieron a manifestar los patrones de respuesta implicados
por las instrucciones sobre el programa. Las de intervalo fijo (tercera gráfica) produjeron tasas
bajas y patrones festoneados ocasionales. Las instrucciones de intervalo variable (cuarta
gráfica) produjeron tasas intermedias y las instrucciones de razón variable (gráfica inferior)
produjeron tasas altas y uniformes, las cuales son características del control de este programa.
En un experimento adicional a esta serie se encontró un fuerte control de extinción. Los sujetos
recibieron instrucciones mínimas o de razón variable (véanse las condiciones a) y e) del párrafo
anterior), antes de ser sometidos a una sola sesión de tres horas en la que jamás se
proporcionó reforzamiento. Ambos tipos de instrucciones fueron seguidas por un número
considerable de respuestas, aunque los sujetos sometidos a instrucciones mínimas mostraron
cierto debilitamiento conforme progresaba la sesión, pero de ninguna manera dejaron de
responder totalmente. Los sujetos que recibieron instrucciones de razón respondieron a tasas
elevadas a lo largo de la sesión.
En experimentos que se realizaron posteriormente se confirmó que las instrucciones sobre el
programa de reforzamiento pueden producir patrones de respuesta discordantes con las
contingencias reales. Por ejemplo, en un estudio, Lippman y Meyer (1967), sometieron a unos
estudiantes universitarios a un programa de intervalo fijo de 20 s de puntos acumulados,
indicándoles que la contingencia dependía del paso del tiempo o que dependía del número de
respuestas. En una tercera condición, los sujetos no recibieron instrucciones en cuanto al
programa. Las ejecuciones apropiadas a los programas de intervalo fijo (tasas relativamente
bajas con un patrón festoneado en los registros acumulativos) aparecieron en forma más
confiable entre los sujetos que recibieron instrucciones de tiempo, mientras que los sujetos que
no recibieron instrucciones y los que recibieron instrucciones de razón tendieron a responder a
tasas altas y constantes.
Weiner (1970) también encontró un fuerte control de las instrucciones en cuanto a programas
de extinción. Al utilizar dinero como reforzador, adultos jóvenes respondieron bajo un
programa de razón fija de 10. Después de entregar 700 reforzadores, se inició un periodo de
extinción de dos horas. Los sujetos que no recibieron instrucciones acerca del número de
reforzadores mostraron poca tendencia a la extinción. En cambio, los sujetos que recibieron
instrucciones precisas en cuanto a que sólo podían obtenerse 700 reforzadores, cesaron de
responder en forma abrupta al llegar a ese punto. Finalmente, los que recibieron la información
errónea de que podían obtenerse 999 reforzadores, persistieron en responder durante el
periodo de extinción, aunque lo hicieron a tasas menores que los sujetos que no recibieron
instrucciones.
Los hallazgos citados anteriormente muestran que las intrucciones referentes a las respuestas
necesarias para producir el reforzador, dan lugar a un rápido inicio del responder, pero también
pueden producir tendencias persistentes a responder. En comparación, las instrucciones
referentes al programa por medio del cual se refuerza la respuesta, evocan una conducta de
responder más acorde con el programa. En ambos casos se encontró que el control por
instrucciones interfiere con el control de las contingencias reales. Esto se pone particularmente
de manifiesto cuando las instrucciones son falsas; en cuyo caso, la forma de responder
muestra un mayor acuerdo con la del programa que se describe, que con la estructura del
programa realmente impuesto.

Comparaciones de programas
En esta sección consideraremos experimentos en que se comparan las ejecuciones que se
realizan bajo diferentes programas. Cuando únicamente interviene un programa, como en el
caso de los experimentos hasta ahora discutidos, el grado de control del programa sólo puede
evaluarse en términos de la estructura del programa o de las ejecuciones de sujetos
infrahumanos en programas similares. Este último criterio no es totalmente satisfactorio, ya
que se presentan dificultades para igualar los experimentos con humanos e infrahumanos en
términos de reforzadores, requisitos de respuesta y otros aspectos del procedimiento.
Nuestra investigación hace un análisis de las ejecuciones que se observaron al aplicar
programas de intervalo fijo y de la evitación que surgió después de girar diversos tipos de
instrucciones. En uno de los primeros experimentos, se entrenó a estudiantes universitarios en
diferentes programas de intervalo fijo (Baron et al., 1969). Por otra parte, en un programa
múltiple se incluyeron cuatro componentes de intervalo fijo (10, 30, 90 y 270 s) y uno de
extinción. Una parte de los sujetos no recibieron instrucciones acerca del programa
(únicamente se les dijo que era necesario oprimir la tecla para producir el reforzador), mientras
que otros recibieron información acerca de la duración de los intervalos fijos que estaban
asociados con cada componente. El experimento fue diseñado, además, para revelar la
contribución de la retroalimentación proporcionada por la entrega de los reforzadores. Parte de
los sujetos de cada condición de instrucción recibían una señal cada vez que ganaban un
reforzador (retroalimentación), mientras que otra parte no participó de esta condición sino
hasta el final de la sesión (sin retroalimentación).
En la figura superior izquierda de la figura 5.2 se muestran los registros de un sujeto que recibió
tanto instrucciones como retroalimentación de reforzamiento. Puesto que dependían del
intervalo fijo, las tasas variaron sistemáticamente, se observaron pocas respuestas en el
componente de extinción y estas ejecuciones diferenciadas se volvieron más pronunciadas a lo
largo de las 20 sesiones de entrenamiento. La figura superior derecha contiene el registro de un
sujeto entrenado con instrucciones pero que no recibió retroalimentación. Aquí también se
pone de manifiesto el control del programa, pero no en forma tan marcada como cuando se
proporcionó retroalimentación y las ejecuciones no cambiaron gran cosa en el curso del
entrenamiento. La exposición al programa sin instrucciones (parte inferior izquierda), condujo a
un control pobre cuando se recibió la retroalimentación y se limitó a los componentes de
extinción e IF 270 s del programa. Finalmente, las ejecuciones sin instrucciones ni
retroalimentación (parte inferior derecha), resultaron esencialmente indistintas. También
encontramos que, una vez establecidas, las ejecuciones diferenciadas no fueron interferidas
por la eliminación de instrucciones en la tarea de los sujetos. No obstante, resultó extraño que,
al agregar las instrucciones, las ejecuciones pobremente diferenciadas que estaban asociadas
con la ausencia de instrucciones permanecieran.
En un estudio subsecuente se investigó el control por instrucciones de las respuestas de
evitación (Galizio, 1979). Las comparaciones que existen entre las formas de responder en
evitación e intervalo-fijo son interesantes debido a la forma diferente en que las respuestas
ante los dos programas hacen contacto con las contingencias temporales. En el caso de los
programas de intervalo fijo, cada entrega del reforzador proporciona información acerca del
intervalo. Esta retroalimentación no se encuentra en los programas de evitación, puesto que
cada respuesta pospone la presentación futura del evento aversivo. Con el fin de hacer estos
experimentos equiparables a nuestro estudio de intervalo fijo, los adaptamos de tal forma que
se pudieran aplicar a estudiantes universitarios, quienes recibían entrenamiento para evitar una
señal de pérdida monetaria bajo un complejo programa múltiple, en el que los intervalos
respuesta-pérdida de 10 s, 30 s o 20 s se asociaron a tres de los componentes (el intervalo
pérdida-pérdida siempre fue de 10 s) y, en el cuarto componente, se omitieron todas las
pérdidas. Las instrucciones iniciales se limitaron a indicar la contingencia respuesta-reforzador
(especificaban que manipular la manivela posponía la siguiente pérdida). En seguida se dieron
instrucciones sobre el tiempo en que las respuestas posponían la pérdida en los diferentes
componentes.
En la figura 5.3 los registros de dos sujetos muestran que, a pesar de las diferencias que había
en los intervalos respuesta-pérdida, antes de que se proporcionaran las instrucciones las tasas
en los diferentes componentes por lo general fueron similares (gráficas superiores). Cuando se
agregaron los rótulos de instrucción a las luces que señalaban los componentes (gráficas
inferiores), apareció el control temporal y el discriminativo; las tasas más elevadas ocurrieron
en el intervalo respuesta-pérdida de 10 s, cuando fue de 30 y 60 s, ocurrieron tasas intermedias
y en el componente en que se omitieron las pérdidas ocurrieron pocas respuestas. Este patrón
persistió al eliminar los rótulos de instrucción, así como al colocar nuevamente los estímulos
que estaban asociados con los estímulos componentes, por lo que se mostró que las
instrucciones incrementaron la sensibilidad a las contingencias del programa. Sin embargo, en
concordancia con las diferencias entre programas de intervalo fijo y evitación observadas
anteriormente, a pesar de las instrucciones el control temporal de las respuestas de evitación
no fue tan marcado como el observado ante programas de intervalo fijo.
Matthews, et al. (1977) abordaron de manera distinta el asunto de la sensibilidad en un estudio
en el que utilizaron procedimientos acoplados. Estudiantes universitarios debían presionar una
tecla para obtener reforzamiento monetario, de tal forma que las respuestas de los miembros
de una pareja fueran reforzador de acuerdo con un programa de intervalo variable; estos
intervalos se producían por el segundo miembro quien respondía bajo un programa de razón
variable. Por consiguiente, igualaba a los dos sujetos con cierta precisión en cuanto a número
de reforzadores, así como en cuanto a los intervalos que había entre los reforzadores. En una
manipulación adicional, la respuesta de presionar la palanca se estableció por medio de
moldeamiento para algunos sujetos (el entrenamiento, se inició con el reforzamiento de
aproximaciones sucesivamente más cercanas a oprimir la tecla) y, para otros, por medio de una
demostración (“después de un breve intento por moldear el oprimir la tecla un experimentador
entraba al cubículo y presionaba la tecla, lo cual encendía las luces de reforzamiento; no se
estableció ninguna interacción verbal”). Los resultados indicaron que los sujetos entrenados
con el procedimiento de moldeamiento se mostraron sensibles a las contingencias de
reforzamiento, ya que al final de la sesión las tasas de los sujetos sometidos a programas de
razón fueron sustancialmente mayores que las de los sujetos acoplados que fueron sometidos a
un programa de intervalo. En contraste, el procedimiento de demostración, aunque fue
efectivo para establecer las respuestas, no fue acompañado de diferencias claras en las tasas de
los dos pares estudiados en esta condición.
En un estudio subsecuente, Shimoff y colaboradores (1981) compararon las ejecuciones que se
lograron con instrucciones con aquellas que se lograron con moldeamiento; la comparación se
hizo tomando como base diferentes programas en los que variaban la duración de una
contingencia RDB que se había sobrepuesto a un programa de intervalo al azar con
reforzamiento monetario. Se estableció presionar una tecla, por moldeamiento o por una
combinación de demostración e instrucciones, en estudiantes universitarios, para que
respondieran a una tasa baja (“deben presionar con lentitud; si presionan demasiado rápido no
funcionará"). Cuando se eliminó la contingencia de RDB a mitad de la sesión (y, por tanto, se
hicieron imprecisas las instrucciones), se incrementaron las tasas de siete de 11 sujetos cuyas
respuestas habían sido moldeadas, en comparación a tres de 10 de los sujetos que habían
recibido instrucciones. Por lo general este patrón de resultados fue similar al de un segundo
experimento donde las respuestas se reforzaron según un programa de razón al azar, al que se
le agregó una contingencia RDB. Cuando se redujo el tiempo mínimo entre respuestas respecto
a su valor original, las tasas aumentaron en un mayor número de sujetos moldeados que en los
que recibieron instrucciones.
Los experimentos tratados en esta sección coinciden en señalar que las contingencias
programadas logran un control pobre cuando la respuesta se establece por medio de
instrucciones respecto a la respuesta (o por su demostración). Los diferentes experimentos
también identifican procedimientos que pueden aumentar la sensibilidad a las contingencias
del programa. Uno de estos consiste en omitir toda instrucción acerca de la respuesta que
favorezca el desarrollo de la respuesta, al utilizar procedimientos de moldeamiento. Otra
estrategia consiste en proporcionar instrucciones más elaboradas que describan las
contingencias del programa y que también especifique la respuesta.

Consecuencias demoradas
En su exposición acerca de la conducta moldeada por contingencias y la conducta gobernada
por las reglas, Skinner (1969) señaló una importante función de las reglas: "Las reglas tienden a
poner en juego las consecuencias remotas; sin las reglas, las consecuencias inmediatas
únicamente afectan la conducta" (pág. 169). Si bien es cierto que los experimentos con sujetos
infrahumanos, y en menor grado con humanos, han investigado los nocivos efectos de las
contingencias demoradas, no se ha investigado mucho la capacidad de las instrucciones para
llenar los espacios temporales. Nosotros tratamos esta propiedad de las instrucciones como
parte del castigo demorado (Trenholme y Baron, 1975). Como veremos, los resultados no
fueron distintos a los hallazgos que se lograron cuando se proporcionaron instrucciones en
programas de intervalo fijo y de evitación.
En el experimento inicial se observaron las ejecuciones realizadas por sujetos que recibieron
instrucciones mínimas acerca del castigo que se aplica a las respuestas después de una demora.
En la condición de línea de base, los estudiantes universitarios respondieron conforme a un
procedimiento de ensayo discreto en el que se presentaba un estímulo, una luz blanca o una luz
amarilla en diferentes ensayos, una vez cada minuto, y en el que al presionar una vez la tecla,
en presencia de la luz se producía una señal de reforzamiento monetario en el 50% de los
ensayos. Enseguida se introdujo el castigo en los ensayos con luz amarilla, de tal. forma que las
respuestas en presencia de este estímulo eran seguidas por una señal de pérdida monetaria en
el 50% de aquellos ensayos en que no estaba programada la ocurrencia del reforzador. Los
sujetos fueron asignados a condiciones que diferían en el grado de demora vinculado con la
señal de pérdida, según los siguientes valores: 0 s, 10 s, 20 s, o 40 s. Los datos resumidos en las
dos funciones inferiores de la figura 5.4 muestran que las respuestas al estímulo que está
asociado con castigo (círculos blancos) fueron suprimidas en relación con las respuestas del
otro estímulo (círculos negros). También es evidente que la supresión fue mayor cuando el
castigo se aplicó inmediatamente y que disminuyó progresivamente conforme la demora
aumentó hasta 40 s.
En las dos funciones superiores de la figura 5.4 se muestran los datos que se obtuvieron en dos
experimentos subsecuentes que tenían como propósito estudiar las variables que pueden
aumentar la supresión mediante castigo demorado; el castigo condicionado inmediato y las
instrucciones sobre las contingencias demoradas. Ambos experimentos se iniciaron con los
procedimientos de entrenamiento ya descritos. El castigo condicionado se estudió al programar
un estímulo nuevo (ruido blanco), el cual resultaba como consecuencia inmediata de responder
bajo las condiciones de castigo-demora (10, 20 y 40 s). El mismo estímulo también precedía la
presentación de la señal perdida (castigo primario). En el experimento acerca de las
instrucciones se informó a los sujetos que el estímulo de pérdida ocurría como consecuencia de
presionar la tecla. También se les informó del intervalo temporal que separaba cada respuesta
de la pérdida. Los resultados que se resumen en la figura 5.4 indican que la adición del castigo
condicionado (triángulos negros) aumentó la supresión de respuestas bajo las condiciones de
castigo demorado. Desde el punto de vista de la presente discusión, son de particular interés
los efectos que tiene agregar instrucciones acerca de la contingencia demorada (triángulos
blancos). En las tres condiciones de demora, el castigo demorado más las instrucciones dio
lugar a un grado de supresión comparable al que está asociado con el castigo inmediato.
Estos hallazgos muestran que las instrucciones pueden sensibilizar a los sujetos a contingencias
demoradas, las cuales, de otra manera, podrían no ser efectivas. Sin embargo, los mecanismos
implicados en esa mediación son mucho menos claros que cuando está implicado el castigo
condicionado. En nuestro informe de los experimentos (Trenholme y Baron, 1975), sugerimos
considerar los resultados a la luz de la hipótesis de Dollard y Miller (1950) referente al grado de
distinción adquirido por las señales; esto es, que la vinculación de respuestas verbales o rótulos
con los estímulos, aumenta su grado global de discriminación. No obstante, advertimos que esa
interpretación especulaba demasiado, ya que no teníamos manera de observar directamente
las respuestas disimuladas por las instrucciones o por otros aspectos del procedimiento.

CUESTIONES METODOLÓGICAS Y CONCEPTUALES


Los experimentos que se resumieron en el apartado anterior ilustran algunas de las funciones
que cumplen las instrucciones. Aunque todavía quedan numerosas preguntas sin respuesta,
sabemos que es posible que los sujetos que reciben instrucciones mínimas en los experimentos
de laboratorio no adquieran la respuesta pretendida. En contraste, las instrucciones para
realizar ese tipo de respuesta conducen a una rápida adquisición, pero puede ocurrir que la
respuesta no logre quedar bajo un claro control del programa de reforzamiento. El
procedimiento más elaborado, que consiste en combinar las instrucciones de responder con la
información precisa acerca de las contingencias del programa, puede producir patrones de
respuesta más apropiados con respecto a la estructura del programa. Este último hallazgo deja
abierto el problema de determinar si las ejecuciones son controladas por las instrucciones o por
las contingencias, ya que se encontró que las instrucciones imprecisas producen ejecuciones
que están más de acuerdo con el programa que se describe que con el programa que
efectivamente se impone.
A la par con estos hallazgos someramente descritos, se encuentra el reconocimiento cada vez
mayor de que el análisis experimental del responder en humanos no puede realizarse
independientemente de la variable instrucción (véase Baron et al, 1969; Lowe, 1979; Matthews
el al, 1977). Además, se ha llegado a considerar que las instrucciones juegan un papel vital en el
desarrollo y control de la conducta humana en los contextos del medio ambiente natural, según
lo expresó recientemente Catania (1979):

Una característica importante de la instrucción es que suele sustituir a las contingencias


naturales por estímulos discriminativos verbales, como cuando el padre dice al niño "No toques
la estufa porque te vas a quemar”. Esta propiedad de la instrucción verbal tiene consecuencias
de largo alcance. En términos generales, las instrucciones pueden cambiar la conducta del
escucha cuando las consecuencias naturales no son efectivas por si mismas o cuando sólo son
levemente efectivas. Si, por ejemplo, invitamos a unos amigos a una fiesta, les damos
instrucciones acerca de la manera de llegar; en lugar de que busquen la manera de llegar por sí
mismos (...) Uno de los grandes logros de la conducta verbal humana consiste en que permite
que la conducta sea controlada por las descripciones de las contingencias, lo cual se logra
mediante la conducta verbal de otros, más que por las contingencias en sí (págs. 246-247).

La naturaleza fragmentaria de la bibliografía que existe acerca del control instrucciones indica la
necesidad de realizar una investigación más planeada sobre este asunto. Pero, al mismo tiempo
se requiere de una mejor conceptualización de la manera en que las instrucciones influyen en la
conducta. Hasta ahora ha existido la tendencia de considerar las instrucciones, como una
variable ajena al experimento, y que interfiere con el estudio de otras variables. La estrategia
que seguiremos en las siguientes secciones tiene como fin identificar los puntos de
correspondencia entre los tipos de control ejercido por las instrucciones y las influencias de los
eventos-estímulo más comúnmente estudiados.

Sensibilidad a las contingencias


Los experimentos operantes centran la atención en las influencias que ejercen las contingencias
experimentales y, como se anotó anteriormente, se han propuesto varias interpretaciones
acerca del papel que deben jugar las instrucciones en ese análisis. Por ejemplo, Ayllon y Azrin
(1964) proponen que podría utilizarse a las instrucciones como alternativa en los
procedimientos de moldeamiento que por lo general se utilizan con sujetos infrahumanos.
Estos autores argumentan que el procedimiento de iniciar respuestas por medio de
instrucciones “concuerda con la teoría y la práctica del condicionamiento operante”, y que esta
forma de utilizar las instrucciones ejemplifica el principio de que "los cambios conductuales
deben originarse en el repertorio de conducta que ya existe en el organismo” (pág. 330).
En cambio, Matthews et al., (1977) llegan la conclusión de que los procedimientos con los que
se logra responder por medio de instrucciones constituyen un serio obstáculo para el control
por contingencias experimentales. Los resultados señalan que las respuestas producidas por
moldeamiento se parecen más a las sensibles ejecuciones de los infrahumanos que a aquellas
producidas por medio de instrucciones. Al revisar parte de esos mismos datos, Lowe (1979)
contraargumenta esa interpretación, por los menos en lo que se refiere a su aplicación en las
ejecuciones normadas por programas de intervalo fijo. Este autor hace notar que las
ejecuciones que ocurren a lo largo de una sesión experimental específica varían mucho de
sujeto a sujeto y que el patrón de respuesta, constituido por una sola respuesta por intervalo,
realmente difiere del patrón que caracteriza la manera de responde de los infrahumanos.
Además, el mismo patrón de tasas bajas registradas en sujetos humanos se observa en estudios
donde no se incluye al moldeamiento.
Al considerar las circunstancias en las que las instrucciones pueden o no promover la
sensibilidad hacia las contingencias experimentales, resulta importante distinguir las variables
que influyen en el establecimiento de la respuesta de aquellas que están implícitas en su
mantenimiento subsecuente. Los procedimientos que instruyen al sujeto en cuanto a que es
necesaria la respuesta específica para obtener cierto reforzador no sólo establecen la
respuesta, sino que también generan tasas altas que posteriormente pueden ser inapropiadas
desde el punto de vista de las contingencias intermitentes del programa. La reacción inicial
podría considerarse como un reflejo de la historia del individuo que conoce las instrucciones, en
tanto que podría considerarse que el mantenimiento dependa de variables experimentales,
como el grado de exposición al programa, el grado de variación local en las tasas de respuesta
(permitiendo así el contacto diferencial con las contingencias del programa) y la medida en que
las contingencias del programa refuerza adventiciamente las tasas iniciales altas. A partir de
estas últimas consideraciones, resultan más razonables los hallazgos de tasas
inapropiadamente altas que aparecen en los programas que se basan en el tiempo (por
ejemplo, intervalo fijo y evitación). A pesar de que las ejecuciones incongruencia con la
estructura real del programa no sólo se acompañan por reforzamiento, sino que también tienen
la importancia de maximizar cualquiera de los reforzamientos disponibles en el programa.
A diferencia de las instrucciones que se dan acerca de la respuesta, se encontró que las
instrucciones del programa cumplen una función de modulación. Con diversos experimentos se
ha mostrado que, desde el principio, este procedimiento produce patrones dé respuesta que
son congruentes con la estructura del programa que se describe. Cuando las instrucciones
proporcionadas antes del entrenamiento con programas de intervalo fijo incluyen la
información de que el rerforzamiento se entrega por responder a intervalos temporales fijos,
las tasas iniciales son bajas y el patrón de respuesta incluye marcadas pausas después de cada
entrega. Un hallazgo posterior mostró que el patrón de respuesta diferenciado se vuelve más
preciso con la exposición constante al programa de intervalo fijo. Estos resultados señalan las
influencias potenciales que las instrucciones del programa pueden tener sobre la forma de
responder a las contingencias reales del programa. Ahora bien, puesto que las respuestas que
resultan de la instrucción reflejan la estructura que se describe, las instrucciones ponen
rápidamente en contacto a las ejecuciones con las contingencias del programa y, de esta forma,
aumentan las probabilidades de que se desarrolle y se mantenga la conducta controlada por
contingencias.
Las interacciones que se llevan a cabo entre instrucciones y contingencias se vuelven aún más
más claras al considerar el impacto que tienen las instrucciones incongruentes sobre las
contingencias. De la misma manera de lo que sucede con las instrucciones precisas, las
instrucciones falsas generan patrones de respuesta que se derivan del programa que se
describe. Varios experimentos indican que el futuro de estos patrones, a pesar de la
contradicción, depende de dos consideraciones interrelacionadas: primera, de la medida en
que los patrones de respuesta producidos por las instrucciones maximizan las tasas de
reforzamiento y, segunda, del grado en que las tasas de respuesta sean lo suficientemente
variables como para permitir que la respuesta sea reforzada diferencialmente por el programa
real.
A manera de ilustración, consideremos el resultado de nuestro experimento al que se sometió a
los sujetos a un programa de intervalo variable, pero quienes recibieron la instrucción errónea
de que el programa era de razón variable (Kaufman et al., 1966). Las altas tasas sostenidas que
fueron inducidas por las instrucciones de razón variable se mantuvieron a lo largo de todo el
experimento. Tal forma de responder se reforzó por el programa de intervalo y las tasas no
variaron lo suficiente como para permitir el contacto diferencial con las contingencias
temporales reales. Se obtuvo el resultado opuesto cuando, el mismo programa de intervalo
variable, se describió erróneamente como de intervalo fijo. La respuesta inicial a estas
instrucciones consistió en efectuar una pausa después de la entrega de los reforzadores; ya que
las pausas en los programas de intervalo variable aumentan la probabilidad de que las
respuestas sean reforzadas después de las pausas, el patrón de respuesta origina una
aproximación a un programa de intervalo fijo efectivo. No obstante, las contingencias de
intervalo variable refuerzan sistemáticamente las pausas que se hacen cada vez más cortas. La
consecuencia que se obtiene consiste en que el patrón de respuesta cambia progresivamente
por un patrón uniforme de respuestas.
La interpretación que se hace desde el punto de vista de las tasa globales de reforzamiento
también puede aplicarse al estudio de Shigoff et al. (1981), en el que unos sujetos fueron
moldeados y otros recibieron instrucción de responder con lentitud a un programa que
requería tasas bajas (el programa incluía una contingencia RDB). Al eliminar la contingencia, se
permitió que las tasas aumentaran; las tasas aumentaron efectivamente en los sujetos que
habían sido moldeados pero no hubo cambios, o estos se desarrollaron lentamente, en los
sujetos que fueron expuestos a las instrucciones que ahora resultaban imprecisas. La
conclusión a la que llegaron Shimoff et al., en cuanto a que las instrucciones habían reducido la
sensibilidad a las contingencias del programa, constituye una forma apropiada de caracterizar
estos resultados pero es importante notar que la naturaleza del programa fue tal que los
incrementos en las tasas de respuestas resultaban innecsarios para mantener las tasas de
reforzamiento previo. Por consiguiente, en los sujetos que recibieron instrucciones, la
respuesta de seguir las instrucciones falsas no incurrió en ningún castigo real. Nuestra hipótesis
consiste en señalar que el debilitamiento del control por instrucciones podría efectuarse al
adaptar el programa RDB de tal forma que el seguimiento de las instrucciones condujera a una
pérdida significativa de reforzamiento.
Puede observarse cierta correspondencia entre estos efectos de las instrucciones con aquellos
que pueden tener las historias de condicionamiento acerca de la sensibilidad que los humanos
muestran ante las contingencias del programa. Ambos grupos de variables pueden entrar en
complejas interacciones que pueden aumentar o reducir la sensibilidad subsecuente a las
contingencias experimentales, dependiendo del grado de congruencia con las contingencias
actuales. Por ejemplo, Weiner (1964) observó las ejecuciones que realizaron algunos sujetos
humanos en un programa de intervalo fijo después de recibir entrenamiento en uno de dos
programas de reforzamiento (de razón fija o RDB). Los resultados arrojados por las historias de
razón fija no fueron muy diferentes a los que se describieron anteriormente para las
instrucciones de razón -se mantuvieron tasas elevadas inapropiadas a lo largo de una serie de
sesiones bajo el programa de intervalo fijo. En cambio, las tasas de respuesta después de la
historia de entrenamiento en RDB fueron bajas e incluían la realización de pausas después de la
entrega del reforzador.
Las consideraciones tratadas en esta sección señalan la posibilidad de analizar el control por
instrucciones desde el punto de vista de las contingencias que están asociadas al seguimiento
de instrucciones. Estas contingencias dependen sustancialmente de la historia preexperimental
del individuo, con la consecuencia de que el control por instrucciones resulta poderoso cuando
se introducen las instrucciones al inicio. Pero, por otro lado, los estudios que se han hecho
sobre las instrucciones también indican que el mantenimiento del control durante el curso del
experimento, como sucede con otras formas de conducta operante, hace necesario que se
refuerce la conducta de seguir instrucciones.

Propiedades discriminativas
En el condicionamiento operante se encuentran implicados tres elementos: un estímulo que
ocasiona las respuestas, la respuesta misma y las consecuencias que tiene el responder. Cuando
la respuesta se controla por medio de instrucciones, parece fácil relacionar las instrucciones
con el primero de estos elementos. La ventaja de considerar al control por instrucciones de esta
manera estriba en que el análisis puede seguir su curso conforme a los mismos lineamientos
que el estudio del control por medio de cualquier estímulo. Por ejemplo, ya no existiría la
necesidad de postular procesos cognoscitivos mediadores como la que aparece en el caso del
control de estímulos en general. Biglam y Kass (1977) expresaron este razonamiento al criticar
la idea de que el control por instrucciones implica necesariamente que la conducta esté bajo
control de "contingencias cognoscitivas”.

Podemos ilustrar la naturaleza arbitraria de la inferencia que se hace acerca de la eficacia de las
contingencias cognoscitivas, si consideramos un posible experimento con animales.
Supongamos que establecemos control de estímulos sobre las respuestas de intervalo fijo y de
razón fija en un pichón, utilizando estímulos arbitrarios. Tomemos las letras “IF” como estímulo
de control para el programa de intervalo fijo y las letras “RF” como estímulo para el programa
de razón fija. Ahora supongamos que, una vez establecido el control de estímulos, presentamos
el estímulo cuando el pichón de hecho se encuentra en un programa de razón. Con seguridad
puede suponer, en base a la investigación disponible, que el pichón responderá "como si creyera
que el programa es de intervalo fijo”. ¿Es este también un caso de contingencias cognoscitivas?
(pág. 11).

Este hipotético experimento pone de manifiesto que las operaciones que están implicadas en el
control por instrucciones comparten características evidentes con las que tienen los
experimentos acerca del control discriminativo. Junto con esta correspondencia se encuentran
diferencias potencialmente importantes que requieren de un análisis más elaborado. El factor
limitante que existe en el estudio del control por instrucciones es de orden metodológico.
Cuando se estudia el control de estímulos en el laboratorio de animales, las respuestas se
refuerzan diferencialrnente en presencia de un estímulo particular y se utiliza el término
“estímulo discriminativo” para hacer referencia a aquellos estímulos que muestran lograr
control sobre el responder. Por consiguiente, pueden especificarse las características de los
estímulos y se cuenta con una amplia información sobre las circunstancias en las que se
desarrolla el control. En contraste, en la mayor parte de la investigación acerca de las
instrucciones, las propiedades de control de los estímulos de instrucción se establecen antes de
iniciar el experimento, a pesar de que se sabe poco acerca del desarrollo de estas propiedades.
Esto no significa que no puedan realizarse explicaciones del control por instrucciones al tomar
como base las interpretaciones de la conducta tal y como ocurre en el medio ambiente natural.
Es común, en la socialización del niño, destacar el reforzamiento diferencial de las respuestas
que se dan a las instrucciones que proporcionan los padres, y otros adultos, y resulta plausible
el supuesto de que las instrucciones que se proporcionan a sujetos adultos en el laboratorio
entran en contacto con esta compleja historia. Pero, a diferencia de las conclusiones obtenidas
de los estudios de control discriminativo en el laboratorio, tales explicaciones del control por
instrucciones resultan muy aventuradas.
El análisis completo de los efectos que tienen las instrucciones como una forma de control
discriminativo, debe esperar hasta contar con procedimientos que permitan la observación
directa de su desarrollo. Una estrategia prometedora, pero que casi no se ha puesto en
práctica, consiste en investigar a individuos quienes, por sus características especiales, son
insensibles a las instrucciones y, por consiguiente, a quienes se les puede observar durante la
adquisición de conducta de seguir instrucciones. Dentro de esta línea se encuentra un
experimento divulgado por Ayllon y Azrin (1964, exp. II) como fragmento de sus estudios
realizados con pacientes psiquiátricos. Aunque muchos de los sujetos con los que trabajaban no
respondían cuando recibían la instrucción de llevar a efecto una respuesta no reforzada,
posteriormente todos lo hicieron cuando las instrucciones se acompañaron con el
reforzamiento. Por medio de procedimientos que refuerzan selectivamente las respuestas
congruentes con las instrucciones, se han producido incrementos similares de las respuestas a
las instrucciones en niños de preprimaria (Schutte y Hopkins, 1970) y adolescentes retrasados
(Streifel, Bryan y Aíkins, 1974).
Una propiedad de las instrucciones estriba en que éstas suelen tener influencias más generales
que los eventos estimulantes discretos. En los experimentos operantes, las instrucciones
preceden y a la vez concurren con la relaciones respuesta-reforzador que se estudian y las
influencias de las instrucciones que se suscitan en esta relación pueden ser facilitadoras o
inhibidoras. Estas consideraciones llevaron a Bijou y Baer (1966) a proponer que las
instrucciones son un tipo de “evento disposicional”. Bijou y Baer, así como otros autores (y por
ejemplo Steinman, 1977; Wahler y Fox, 1981) han puesto énfasis en la noción de evento
disposicional (Kantor, 1959) como una forma de dar cuenta de variables históricas que pudieran
alterar la efectividad de las contingencias de reforzamiento actuales. Aunque se considera que
los eventos disposicionales potencialmente pueden descomponerse en estímulos
componentes, es cierto que proporcionan una forma de resumir globalmente los aspectos
complejos pasados y presentes de los contextos del medio ambiente que interactúan con las
contingencias actuales. Con el propósito de ejemplificar los eventos disposicionales Bijou y Baer
se pusieron a trabajar con las operaciones de privación y saciedad, así como con los aspectos
más remotos de la historia del individuo, como la educación, la identificación sexual y la
pertenencia a una clase social. La noción de evento disposicional también se ha aplicado al
análisis de la conducta de imitación (véase la siguiente sección); por ejemplo, al buscar la forma
de abordar el hallazgo que mostró que la ejecución del niño ante una respuesta modelada, no
sólo depende del reforzamiento explícito de la respuesta, sino que también depende de la
presencia o ausencia del modelo del adulto (Steinman, 1977).
Bijou y Baer (1966) hacen notar que las instrucciones proporcionadas en los experimentos con
niños, constituyen una clase importante de eventos disposicionales y no resulta difícil toparse
con formas de instrucción que se adecuan a su definición. Un ejemplo similar lo forman las
instrucciones que se proporcionan en un experimento operante en cuanto a la disponibilidad
del reforzador (“en esta máquina puedes ganar dulces"). Dada la historia del niño, esta
expresión puede cumplir la misma función de incentivo que la presentación real del evento al
que se hace referencia y, de esta forma, puede tener efectos generales sobre la conducta del
niño. Además, el hecho de que las instrucciones se proporcionen por un individuo en una
posición de autoridad, puede evocar respuestas características como orientación hacia el
aparato, reacciones emocionales, etc. Anteriormente hicimos notar que también puede
considerarse que el control por instrucciones cumple la función de estímulo discriminativo,
como cuando las instrucciones especifican una relación contingente entre una respuesta
particular y la entrega de un reforzador (“si presionas este botón, puedes ganar dulces en esta
máquina"). Redd y Wheeler (1973) trabajaban en el problema de determinar si clasificar a las
instrucciones como eventos disposicionales será mejor que clasificarlos como estímulos
discriminativos. Desde nuestro punto de vista, estas formas alternativas de conceptuar los
efectos de las instrucciones no compiten entre si. Como regla general, las instrucciones, que
inevitablemente se introducen en los experimentos con sujetos humanos, tienen efectos
amplios que no pueden tratarse únicamente en los mismos términos que las contingencias del
experimento. Además, en muchos de los experimentos que hemos discutido, las instrucciones
describían las contingencias del programa experimental y, por tanto, constituían estímulos
discriminativos cuyas propiedades de control dependían del hecho de que las respuestas que
evocaban fueran o no reforzadas.

Conducta imitativa
Como lo señala Bandura (1971), el control de la conducta por medio de instrucciones verbales
(lo que él denomina “modelamiento verbal”) tiene rasgos en común con la inducción de
conducta imitativa realizada por medio de demostraciones (a lo que denomina "modelamiento
conductual"). Se dice que la imitación ocurre cuando un individuo lleva a cabo una respuesta y
un observador realiza una respuesta similar. La contraparte; en los estudios de las instrucciones
realizadas en el laboratorio, en su forma más simple, aparece cuando la respuesta en cuestión,
en lugar de demostrarse se describe (por ejemplo, "al presionar la tecla se enciende la luz de
reforzamiento”). En los estudios de laboratorio, tanto de imitación como de control por
instrucciones, la respuesta se refuerza una vez que se realiza su ejecución correcta.
Además de estas similitudes de procedimiento, existen ciertas correspondencias interesantes
entre los tipos de control logrado por medio de instrucciones y aquellos que se sabe resultan de
las demostraciones. Un procedimiento común consiste en que un modelo adulto realice una
serie de respuestas verbales o motoras (frecuentemente al agregar instrucciones como "haz
esto") a la vista de un niño, el sujeto experimental. Las respuestas imitativas a un grupo de
estos estímulos (aquellos designados como estímulos discriminativos positivos) son reforzados
y las respuestas a los estímulos restantes (aquellos designados como estímulos discriminativos
negativos) no se les aplica reforzamiento posterior. En varios estudios se encontró que este tipo
de programa produce conducta imitativa, ya que el niño llega a copiar las respuestas del adulto.
Sin embargo, un hallazgo menos esperado consiste en mostrar que, en los ensayos negativos,
también ocurren respuestas de imitación persistentes y estas respuestas pueden mantenerse
indefinidamente en ausencia de reforzamiento. El descubrimiento que mostró que el
rforzamiento diferencial no establece un buen control discriminativo sobre la conducta
imitativa fue señalado por primera vez por Baer y Sherman (1964), quienes sugieren que el
reforzamiento de la conducta imitativa fortalece una clase general de respuestas "la imitación
generalizada”, mas no solamente las respuestas que se modelan.
Con respecto al fenómeno de la imitación generalizada se han propuesto diferentes
interpretaciones; por ejemplo, que el niño es incapaz de discriminar entre los estímulos
positivos y negativos o que las similitudes entre las ejecuciones del adulto y del niño adquieren
propiedades de reforzamiento condicionado. Desde la perspectiva de la presente discusión, las
consideraciones importantes consisten en afirmar que las respuestas imitativas ocurren sin
reforzamiento explícito y que estas respuestas continúan apareciendo a pesar de las
contingencias contradictorias. Recordemos que gran parte de la investigación que se dedica a
estudiar las respuestas que se derivan de instrucciones se caracteriza por lograr resultados
similares: las respuestas ocurren con toda su fortaleza cuando se dan las instrucciones para
responder por primera vez y los patrones iniciales de respuesta persisten, a pesar de ser
incongruentes con la estructura del programa.
La investigación referente a la conducta imitativa ha empezado a aislar procedimientos que
generan control discriminativo sobre el responder. Asimismo, las variables importantes que
influyen al respecto son análogas a las que se implican en los efectos producidos por las
instrucciones. Un rasgo crítico de la investigación acerca de la imitación se desprende del
programa de discriminación. Como dijimos anteriormente, el programa supone, normalmente,
un procedimiento sucesivo donde los ensayos positivos y negativos se alternan en una serie
irregular. Sin embargo, cuando el programa se cambia por un procedimiento simultáneo (de
elección), de tal forma que se pide al niño que escoja cuál de las dos respuestas va a imitar, se
seleccionan las respuestas que cuentan con historia de reforzamiento en lugar de dar
preferencia a las que no se han reforzado previamente. Estos descubrimientos llevaron a
Steinman (1977) a proponer que la presencia del modelo adulto, junto con las instrucciones de
imitar, funcionan como eventos disposicionales que influyen sobre la probabilidad de que una
respuesta imitativa se realice. Como lo dice el autor, “Dependiendo de la historia de
consecuencias del niño por cumplir o no con las instrucciones del adulto, abstenerse de
responder bajo estas circunstancias para el niño puede ser simplemente más aversivo que
responder” (pág. 107). Por consiguiente, anticipamos un conflicto que surge bajo el
procedimiento sucesivo entre el control del evento disposicional (presencia del modelo adulto)
y el control de las contingencias de reforzamiento diferencial. En comparación, el control del
evento disposicional bajo el procedimiento simultáneo, a la vez que permite que las
contingencias diferenciales controlen las respuestas particulares, garantiza que la respuesta
imitativa ocurra.
Estos descubrimientos pueden relacionarse de manera más estrecha con nuestro análisis de los
efectos que producen las instrucciones, si tomamos en cuenta las diferentes contingencias que
están asociadas a los procedimientos de discriminación sucesiva y simultánea. En la medida en
que las respuestas de cada ensayo, positivo o negativo, reúnan todos los reforzadores
disponibles, no se requerirán ejecuciones discriminadas con el procedimiento sucesivo. Pero,
con el procedimiento simultáneo, las ejecuciones discriminadas son esenciales; por ejemplo, si
un niño respondiera en forma indistinta a los estímulos positivos y negativos, perdería la mitad
de los reforzadores disponibles.
Nuestra hipótesis afirma que en la imitación generalizada observada en los niños y en el
seguimiento de instrucciones persistente que se manifiesta en los experimentos operantes con
sujetos adultos aparecen procesos similares. En ambos casos se pone de manifiesto la
importancia que tienen los eventos disposicionales que se relacionan con la historia social del
individuo. Además, las conductas dependen considerablemente de las tasas globales de
reforzamiento. Cuando una u otra forma de responder conduce a la pérdida de reforzamiento
(como en el caso de instrucciones erróneas o cuando debe elegirse entre respuestas imitativas),
se incrementa el control de las contingencias reales. Los fenómenos de imitación generalizada y
seguimiento persistente de instrucciones, posiblemente resulten un tanto inesperados debido a
que las ejecuciones, si bien es cierto que sirven para maximizar las tasas de reforzamiento,
también producen una considerable cantidad excedente de respuestas. No obstante, aún
queda por determinar si el trabajo implicado en estos experimentos, imitar a un modelo adulto
o presionar una tecla, es necesariamente aversivo en ausencia de reforzamiento explícito. Otro
enfoque afirma que en el contexto del experimento existen otros reforzadores, (por ejemplo,
reforzadores sensoriales) que sostienen la conducta.

Interpretaciones mediacionales
Como hicimos notar al principio, algunos autores han vinculado el control por instrucciones con
procesos cognoscitivos hipotéticos que se supone subyacen en toda conducta humana. Tal vez
la opinión más radical fue la que expresó Brewer (1974), quien utilizó dicho control para indicar
que los humanos no están sujetos al condicionamiento; únicamente pueden condicionarse a
cambios de estructuras cognoscitivas. El análisis que hace Bandura (1971; 1977) de las
instrucciones como un vehículo del reforzamiento vicario es más moderado. Así como cuando
observamos que refuerza la respuesta de un modelo, el recibir la instrucción de que nuestras
propias respuestas serán reforzadas crea "representaciones cognoscitivas de las contingencias”
que influyen en la ejecución del sujeto cuando se presenta 1a oportunidad de responder. De
manera similar, Thoresen y Mahoney (1974) plantean que las ejecuciones humanas complejas
se controlan por "consecuencias anticipadas (o sea, imágenes y pensamientos acerca de las
contingencias existentes)” (pág. 120). Estas anticipaciones pueden originarse por las
instrucciones que el individuo se proporciona a sí mismo, es decir, por las autoinstrucciones.
Una interpretación más conductual, pero que sin embargo se basa en procesos mediadores, da
por sentado la existencia de respuestas verbales cubiertas. De acuerdo con esta interpretación,
según el reciente análisis de Harzem, Lowe y Bagshaw (1978) y Lowe (1979), en los
experimentos operantes los sujetos humanos describen verbalmente las contingencias para si
mismos, y estas formulaciones sirven como estímulos que controlan la tasa de la respuesta
reforzada. Las instrucciones proporcionadas por el experimentador pueden constituir un
instigador de esta conducta verbal pero, aun cuando no se haga explícita la información sobre
las contingencias, el individuo desarrolla su propia interpretación de la relación respuesta-
reforzador. Por consiguiente, así como en las explicaciones expresadas en términos más
cognoscitívos, la respuesta reforzada se trata como si se controlara por un sistema mediador
("lo que el sujeto se dice"), además de cualquier otra influencia ejercida directamente por las
contingencias.
Las implicaciones metodológicas e interpretativas que tienen estas explicaciones mediacionales
hacen recordar la controversia, actualmente inactiva, en cuanto al papel que juega la
"conciencia" en el condicionamiento verbal (véase Donahoe y Wessels, 1980, para una
revisión). Recordemos que la discusión se centraba sobre los resultados de los experimentos
que utilizaban un procedimiento desarrollado por Greenspoon (1955), en el que se pedía a los
sujetos que dijeran palabras y las palabras de cierto tipo (por ejemplo, sustantivos referentes a
personas) eran reforzadas por el experimentador (por ejemplo, “bien"). La controversia
resultante entre investigadores de orientación cognoscitiva y conductual se relaciona con el
argumento de que únicamente los sujetos capaces de verbalizar con precisión la contingencia
respuesta-reforzador (esto es, lo que estaban, según la posición cognoscitiva, conscientes de
ella) fueron influidos por ésta. Aunque los datos que se obtuvieron sobre este punto no fueron
totalmente congruentes entre sí, muchos autores los tomaron para apoyar la interpretación
que afirma que la conciencia constituye un prerrequisito necesario para el condicionamiento.
A1 apoyar el punto de vista cognoscitivo, Spielberger y DeNike (1966) consideraron con cierto
detalle los mecanismos cognoscitivos que efectivamente podrían implicarse en los
experimentos de condicionamiento verbal. Cabe hacer notar que ellos suponían que los sujetos
realizaban diálogos verbales consigo mismos. Como ejemplos de las cosas que los sujetos
podrían decirse a sí mismos durante el experimento de condicionamiento verbal presentaron lo
siguiente: "Tal vez el que me digan ‘bien’ depende de lo que yo digo"; “Quizás lo que desea‘ es
que’ descubra a qué palabras dice ‘bien’, y quiere que diga otras iguales"; “Tal vez dice ‘blen’
cuando yo digo palabras que se refieren a personas" (pág. 320). Por consiguiente, según este
análisis, el aumento en la emisión de la palabra seleccionada está controlada por la expresión
verbal de la relación entre respuesta y reforzador, más que por la acción directa del reforzador
sobre la respuesta.
Aunque, seguramente, aún no se dice la última palabra en cuanto al papel que juega la
conciencia en el condicionamiento verbal, resultan evidentes ciertos problemas referentes a los
análisis que se apoyan en este proceso. Las explicaciones que se dan a las respuestas que los
humanos manifiestan ante los programas que se basan en eventos verbales cubiertos pueden
presentar problemas similares. Las dificultades son tanto metodológicas como conceptuales.
Tal como originalmente lo señaló Greenspoon (1963) con respecto a la conciencia y el
condicionamiento verbal, el informe verbal del sujeto, el cual normalmente se. obtiene durante
una entrevista posterior al experimento, puede haber sido provocado por la entrevista en si.
Además, tales informes no establecen la relación temporal que existe entre el supuesto estado
de conciencia y el condicionamiento, por lo que puede argüirse que las descripciones que se
hacen de contingencias son consecuencia del condicionamiento y no al revés. Quizás el aspecto
más critico, como lo subraya Holz y Azrin (1966), consiste en considerar que la conducta está
bajo control de eventos internos sin registrar. Una vez discutida la posibilidad de explicar la
conducta, tanto de la rata como del pichón, en términos cognoscitivos, estos autores
comentaron:

En ambos casos resultan posibles tales eventos internos, pero sigue vigente el problema
planteado por los conductistas: ¿pueden identificarse los eventos internos que controlan la
conducta? Apelar a constructos hipotéticos que intervienen entre el ambiente controlador y la
conducta, no constituye una solución; simplemente cambia la forma de la pregunta. Si se
postula la conciencia, entonces debemos preguntar ¿cuáles son las condiciones que producen la
conciencia y qué condiciones determinan que la respuesta ocurra o no ocurra una vez que existe
la conciencia? Si estas preguntas tienen respuesta, la ley de la parsimonia puede aplicarse una
vez más con el fin de eliminar los constructos que intervienen (pág. 807).

Recientemente Shimoff et al. (1981) hicieron un planteamiento similar en lo que se refiere a las
explicaciones que se daban de los efectos que provocaban las instrucciones desde el punto de
vista de las respuestas verbales cubiertas, en casos en los que la información acerca de los
mediadores verbales hipotetizados se obtiene en entrevistas posteriores al experimento. Según
sus propias palabras:

En un análisis experimental nuestra tarea no consiste en tratar a los informes verbales como si
fueran causas, sino 1a de identiIicar la forma en que tales informes, así como la conducta
extraverbal a la que acompañan, son afectados por las variables medioambientales. Tanto el
valor como la correlación de dichos informes verbales, en relación con otras conductas, resultan
problemáticos. La incertidumbre persistirá mientras se carezca de explicaciones adecuadas de
los informes verbales considerados como respuestas. El desarrollo de procedimientos que
permitan tal análisis experimental sigue siendo un desafío importante (págs. 218-219).

Por lo tanto, no está a discusión si es plausible el supuesto de que la ejecución de los humanos
en programas operantes se acompañe de respuestas verbales cubiertas. Lo que se discute es el
lugar que deben ocupar este tipo de eventos que no están registrados en el análisis. Por el
momento no existen procedimientos convincentes que puedan revelar directamente
cualesquiera que sean las conductas verbales y que ocurran durante el curso de los
experimentos de condicionamiento operante. Tampoco son claros los procedimientos que
podrían aplicarse en un análisis experimental del control que tales conductas ejercen sobre las
respuestas al programa.

LA “RESPUESTA DE INSTRUCCIÓN”
La discusión anterior acerca de la relación que guarda el control por instrucciones con la
imitación generalizada, junto con nuestra consideración acerca del papel que juegan los
estímulos de instrucción como evento discriminativo, trajeron a colación el asunto referente a
que los individuos pueden responder apropiadamente a las instrucciones que no han sido
explícitamente asociadas con el reforzamiento. Esta propiedad del control por instrucciones es
de importancia central para la integración de las publicaciones de investigación, porque implica
que la conducta de seguir instrucciones incluye algo más que un estímulo particular que
ocasiona una respuesta característica. El control general que puede ejercerse por medio de
instrucciones plantea problemas para los modelos de simple control de estímulos. Sin embargo,
la consideración de las ejécuciones que se realizan en paradigmas de discriminación compleja
puede proporcionar las bases para un análisis más satisfactorio.
Consideremos los casos particulares de las discriminaciones de igualación a la muestra e
igualación de singularidad, en los que se ha observado que los estímulos novedosos logran
control sobre la conducta de maneras predecibles. Por ejemplo, en el problema de igualación a
la muestra se presenta al sujeto un estímulo como muestra; quien, luego, debe seleccionar ese
estímulo entre la presentación de varios estímulos. El entrenamiento para discriminar entre un
grupo de estímulos da lugar a una igualación precisa no sólo de esos estímulos, sino también de
los estímulos nuevos que no se presentaron durante el entrenamiento. La adquisición de la
respuesta de igualación se ha analizado como si ocurriera a dos niveles. Un nivel consiste en la
adquisición. de una respuesta a un estimulo con propiedades físicas específicas. Un segundo
nivel estriba en la adquisición de una respuesta de orden superior cuya dimensión de control
revela una regla abstracta o concepto, en este caso, "similitud” (Cumming y Berryman,1965;
Urcuioli y Nevin,197S).
En lo que se refiere al control por instrucciones, puede hacerse una distinción similar entre dos
niveles de respuesta. Por un lado, las instrucciones pueden controlar los patrones de respuesta
específicos, los cuales son señalados por las instrucciones. Sin embargo, las instrucciones
también pueden crear tendencias más generales que sigan cualquier instrucción que se
presente. Esta segunda propiedad fue discutida por Schoenfeld y Cumming (1963) en el análisis
que hicieron del papel que juegan las instrucciones en los experimentos de percepción. Estos
autores propusieron que los estímulos de instrucción en los mencionados experimentos evocan
lo que ellos denominan respuestas de instrucción; la respuesta persistente que modifica él
complejo de estímulos presente en ese ensayo. Esta respuesta puede considerarse como una
respuesta de orden superior que es capaz de dominar una amplia variedad de conductas de
otro tipo. Un corolario importante que se desprende del análisis de Schoenfeld y Cumming
estriba en que la misma respuesta de instrucción puede ser influida por las consecuencias de
las conductas que controla. Por consiguiente, la respuesta de instrucción "puede condicionarse,
extinguirse, someterse a reforzamiento intermitente y, en todo caso, manipularse" (pág. 240).
Esta noción que se dio a la respuesta de instrucción, en lo que se refiere a su aplicación a las
instrucciones sobre los programas de reforzamiento, puede investigarse en el laboratorio
utilizando procedimientos que centren la atención en las contingencias específicas que están
asociadas con la conducta de seguir instrucciones. Por ejemplo, el seguimiento de instrucciones
debe fortalecerse por el reforzamiento y debilitarse por el castigo. Por medio del reforzamiento
selectivo, el seguimiento de instrucciones debe quedar bajo control discriminativo y los
estímulos que controlan la respuesta (es decir, las instrucciones mismas) deben reforzar la
conducta de observación.
Nosotros empezamos a examinar estas propiedades en una serie de experimentos (Galizio,
1979), cuyos resultados presentaremos más adelante; en cuanto al método, ya lo hemos
explicado. En resumen, se adiestró a estudiantes universitarios para evitar pérdidas monetarias,
con y sin información acerca del programa, con un programa de cuatro componentes. Como ya
se discutió en una sección anterior, sólo aparecieron respuestas diferenciadas cuando se
proporcionaron rótulos de instrucción acerca de los intervalos de respuesta-pérdida dentro de
los componentes. En esta etapa del procedimiento se introdujeron las manipulaciones que
tenían interés para el presente caso. En una de las dos formas se manipularon las
consecuencias de seguir instrucciones al hacer imprecisos los estímulos de instrucción. En la
primera condición simplemente se apagó el generador de pérdidas, de manera que las pérdidas
ya no aparecieran en ningún componente del programa (los rótulos de instrucción se
exhibieron como se hizo anteriormente). A esta condición la llamaremos, la condición “sin
contacto” puesto que los sujetos no harían contacto con las contingencias alteradas si
continuaban siguiendo las instrucciones; esto es, si respondían igual que en la forma anterior
eliminaban las pérdidas. Sin embargo, otra manera de interpretar el procedimiento consiste en
considerar que el seguimiento de instrucciones se refuerza en forma consistente ya que, en
apariencia, el seguimiento de instrucciones anula las pérdidas ante una situación que
anteriormente producía pérdidas. En la segunda condición, se programó el intervalo respueste-
pérdida más pequeño (10 s) en los cuatro componentes y, nuevamente, los estímulos de
instrucción se mantuvieron constantes. En esta condición "de contacto", el seguimiento de las
instrucciones tenía como consecuencia poner al sujeto en contacto con la discrepancía entre el
programa y las contingencias reales. Desde este último punto de vista, esta condición contenía
una contingencia de castigo: si el sujeto persistía en seguirlas instrucciones falsas, responder se
asociaba con pérdida monetaria. Por consiguiente, los procedimientos que se utilizaron en el
experimento hacían esperar que el seguimiento de instrucciones se mantendría bajo la
condición “sin contacto" y que el seguimiento de instrucciones sería suprimido bajo la
condición de "contacto". Eso fue lo que en esencia se encontró. En la figura 5.5 se muestra una
parte de los resultados. En primera gráfica se presentan las ejecuciones que realizaron los
cuatro sujetos al final de la condición previa; es decir, esto sucedió así cuando las instrucciones
describieron en forma precisa las contingencias de los cuatro componentes. Las tasas de
respuesta están bien diferenciadas y son apropiadas para los programas de evitación (así como
para las instrucciones) que están asociados con cada componente, de tal forma que en el
intervalo respuesta-pérdida de 10 segundos ocurrieron las tasas más altas, en el componente
con intervalos intermedios (30 y 60 s) ocurrieron tasas más bajas y en el componente sin
pérdida aparecieron pocas respuestas. En la primera manipulación, cuando se hicieron
imprecisas las instrucciones al eliminar todas las pérdidas (condición sin contacto, gráfica 2), no
hubo efectos aparentes; es decir, el seguimiento de instrucciones persistió. En contraste, el
procedimiento de la siguiente condición en la que se programó un intervalo corto de respuesta-
pérdida en los cuatro componentes (condición de contacto, gráfica 3), condujo el cese del
seguimiento de instrucciones y a la adopción de tasas de respuesta apropiadas al programa real
de evitación de 10 segundos (el sujeto MB constituye una excepción en el caso de las sesiones 4
y 5 en las que, inexplicablemente, no respondió y como consecuencia no obtuvo dinero). El
ajuste que se hizo al programa que estaba bajo la condición de “contacto” se desarrolló
abruptamente durante la primera sesión e inmediatamente después de sufrir pérdidas
contingentes con respecto a la conducta de seguir instrucciones falsas. Con el fin de determinar
en qué grado se había perdido el control de las instrucciones, al apoyar nuevamente el
generador de pérdidas, restablecimos la condición original “sin contacto", como fase final del
experimento. Si el seguimiento de instrucciones realmente hubiera sido, eliminado por el
castigo previo, entonces las instrucciones reflejarían las contingencias reales, mas no las
instrucciones. La gráfica derecha de la figura 5.5 confirma esta proposición. Tres sujetos
mostraron tasas disminuidas, al indicar que las respuestas eran controladas por la contingencia
de pérdida, mas no por las instrucciones. El cuarto sujeto mantuvo las tasas altas indiferencia
tampoco mostró indicios de reaunudar el seguimiento de instrucciones que manifestó en 1a
condición "sin contacto” previo.
Una propiedad importante de la conducta operante consiste en que ésta puede ponerse bajo
control discriminativo. Este aspecto del seguimiento de instrucciones lo examinamos en otro
experimento en el que utilizamos un procedimiento con el que se alternaban instrucciones
verdaderas y falsas en la misma sesión. Se asociaron estímulos diferentes (luces de colores) en
las dos condiciones. Al igual que en los experimentos anteriores, se estudiaron los dos tipos de
discrepancias que había entre instrucciones y contingencias. Primero el procedimiento "sin
contacto" donde se eliminaron todas las pérdidas y, enseguida, el procedimiento de "contacto”
en el que se programó el intervalo respuesta-pérdida más corto en los cuatro componentes.

En la figura 5.6 se muestran los resultados que obtuvieron dos sujetos. En cada gráfica se
contrastan las ejecuciones que se realizaron en presencia del estímulo, que estaba asociado con
las instrucciones precisas (círculos blancos), con las ejecuciones que se realizaron al seguir
instrucciones falsas (círculos negros). La primera gráfica muestra que los resultados iniciales
fueron semejantes a los que se obtuvieron con los experimentos previos en los que las tasas de
respuesta variaron sistemáticamente bajo la condición “sin contacto”, independientemente de
que las instrucciones fueran precisas o falsas. Cuando se introdujo de "contacto" con el
intervalo respuesta-pérdida de 10 s en los cuatro componentes (contacto, gráfica 2),
rápidamente surgió el control discriminativo sobre la conducta de seguir instrucciones. En
presencia del estímulo que estaba asociado con instrucciones precisas, se continuó con el
seguimiento de las instrucciones y, en presencia del estímulo que estaba asociado con las
instrucciones falsas, las respuestas ocurrieron de acuerdo con las contingencias reales (las tasas
aumentaron en los cuatro componentes). Finalmente, como sucedió en el experimento
anterior, las instrucciones ya no fueron seguidas cuando se aplicó la condición en que se
omitieron las pérdidas (sin contacto, gráfica 3). La rápida disminución de las tasas en presencia
del estímulo que estaba asociado con las instrucciones erróneas, indica que la respuesta llegó a
quedar bajo control de las contingencias reales.
Un último experimento de esta serie se basó en el descubrimiento de Wyckoff (1969) en cuanto
a que los estímulos discriminativos pueden reforzar la conducta de observación. En algunos de
nuestros trabajos anteriores desarrollamos algunos procedimientos para estudiar este
fenómeno con sujetos humanos y encontramos que los estímulos corrrelacionados con el
tiempo resultaron reforzadores efectivos para sujetos que respondían bajo programas de
intervalo fijo y evitación con reforzamiento monetario (Baron y Galizio, 1976). En el presente
estudio combinamos este procedimiento con el procedimiento básico de evitación, de tal forma
que la respuesta de observación se hacía necesaria con el fin de exhibir el rótulo que revelaba
el intervalo respuesta-pérdida. En distintas condiciones, la respuesta exhibió los rótulos de
instrucción durante diferentes periodos de tiempo, entre 10 y 30 s.
Los resultados que se resumen en la figura 5.7 muestran que los estímulos de instrucción
llegaron a ser reforzadores efectivos, ya que los tres sujetos respondieron a tasas que
mantuvieron iluminado el rótulo durante una buena parte de la sesión; el rango varió del 28
(sujeto CB, en 10 s) al 83% (sujeto PR, en 20 y 30 s). Cuando se eliminó 1a contingencia que se
introdujo entre la respuesta de observación y la exhibición del rótulo (Ext. en la figura 5.7), las
tasas disminuyeron hasta un nivel cercano a cero. Los resultados fueron similares cuando se
emitieron instrucciones erróneas al programar el intervalo respuesta-pérdida breve en los
cuatro componentes (contacto en la figura 5.7).
En conjunto, los tres experimentos anteriormente descritos muestran que los seguimientos de
instrucciones poseen características similares a otro tipo de respuestas operantes. La tendencia
a seguirlas instrucciones fueron influidas por sus consecuencias, ya que la conducta se sostuvo
cuando las consecuencias se asociaron con el reforzamiento continuo y se suprimió cuando las
consecuencias fueron aversivas. Encontramos que la respuesta podía ponerse bajo control
discriminativo por medio de reforzamiento diferencial en presencia de estímulos diferentes.
Finalmente, encontramos que los estímulos de instrucción poseen propiedades reforzantes,
característica que se comparte con otro tipo de estímulos discriminativos.
La noción de seguimiento de instrucciones como un tipo de respuestas distinta, proporciona un
marco de referencia a la bibliografía que surge de la investigación. Una implicación esencial
consiste en que las instrucciones generan interacciones y, por tanto, conflictos potenciales
entre los sistemas de respuesta; por un lado, la llamada respuesta de instrucción y, por otro, las
respuestas controladas por las contingencias de los contextos reales del medio ambiental. Por
consiguiente, las circunstancias en las que las instrucciones podrían facilitar o impedir las
respuestas a las contingencias reales dependen de la compatibilidad relativa de los dos tipos de
respuestas, así como de su respectiva fortaleza.
En estos términos, el análisis debe tomar en cuenta las variables comunes que controlan las
respuestas operantes, como podrían ser la naturaleza y programación de los eventos
reforzantes, la prominencia de los estímulos discriminativos, la historia de reforzamiento, etc.
Este punto de vista no excluye algunas de las explicaciones que se dan con respecto a los
efectos que producen las instrucciones discutidas anteriormente. En particular, nuestro
reconocimiento del seguimiento de instrucciones como respuesta, no especifica su ubicación o
sus dimensiones. Tal como lo han propuesto otros autores, esta respuesta muy bien podría
comprender la repetición cubierta de las conductas verbales que se implican en la lectura y
comprensión de los estímulos de instrucción. Lo único que podríamos agregar es que las
explicaciones que se basan en tales procesos mediadores estarán incompletas, mientras no se
obtenga información directa acerca de estos eventos y sus variables controladoras. En cuanto a
la conclusión que afirma que las instrucciones reducen la sensibilidad a las contingencias del
programa, nuestro punto de vista señala algunas de las circunstancias, si este fuera el caso.
Pero, como originalmente lo sugirieron Schoenfeld y Cumming (1963), las instrucciones
también pueden servir para orientar a los sujetos hacia los eventos del medio ambiental y, por
tanto, pueden tener la capacidad de aumentar, más que reducir, la sensibilidad a las relaciones
respuesta-reforzador.
El fenómeno del control por instrucciones tiene implicaciones importantes para el análisis de
laboratorio de la conducta humana. Para el investigador interesado en los programas operantes
resulta obvio recomendarle precaución. Puesto que es prácticamente inevitable cierta
interacción verbal entre el sujeto y el experimentador, los investigadores podrían toparse con
cierta dificultad para determinar si la conducta que están observando se encuentra bajo control
de las instrucciones o del programa. Como señalamos anteriormente, las características del
ambiente de laboratorio u otros aspectos del procedimiento pueden funcionar, aun en ausencia
de instrucciones específicas, como eventos disposicionales que limitan o exageran los efectosde
las contingencias del programa. Teniendo en cuenta estos problemas, las conclusiones
definitivas acerca del control que el programa ejerce sobre las respuestas que emiten los
humanos hacen necesario comparar las ejecuciones con diferentes condiciones que
comprenden el moldeamíento de respuestas en sujetos que no reciben instrucciones, así como
con los procedimientos que dan instrucciones específicas acerca del programa. Nuestra
investigación sobre las consecuencias que tienen las instrucciones falsas pone de manifiesto
otra posibilidad. Con el fin de reducir la influencia potencial que ejercen las instrucciones, los
sujetos pueden inicialmente recibir instrucciones falsas que entren en conflicto con las
contingencias del primer programa. Descubrimos que este procedimiento conduce a los sujetos
a hacer caso omiso de cualquier instrucción subsecuente que se proporcione.
El hecho de que los estudios dedicados a examinar el papel que juegan las instrucciones en
medio aplicados, como los experimentos de Ayllon y Azrin (1964), no hayan mostrado el tipo de
efectos abrumadores que se obtienen en el laboratorio, no tiene interés meramente pasajero.
El presente análisis podría ser de valor en este caso. En el mundo real, si un niño gritara “lobo”,
cuando no hay lobo, tendríamos que estar de acuerdo con Esopo en que los lugareños con el
tiempo cesarían de reaccionar. Sin embargo, difícilmente esperaríamos que dejaran de seguir
las instrucciones que se dan unos a otros; sólo se eliminarían las del niño. En la psiclogía social
es bien sabido que las respuestas a la comunicación persuasiva varían en función de la fuente;
por su parte, Bandura (1969) y otros proponen que el control depende de la probabilidad de
obtener consecuencias favorables cuando se siguen las recomendaciones de la fuente.
Nuestros experimentos, en los que se pusieron bajo control discriminativo el seguimiento de
instrucciones, proporcionan apoyo empírico a esta forma de caracterizar el papel que juega la
fuente en las comunicaciones persuasivas y también propone una metodología que podrían
seguir otros estudios que centran la atención en estos problemas.
Los estudios que se han hecho acerca del control por instrucciones en los ambientes naturales
apoyan el presente análisis. Como contraparte aplicada a nuestra investigación de laboratorio
analizamos las variables que podrían llevar a controlar el conducir a velocidad excesiva en las
carreteras (Galizio, Jackson y Steele, 1979). UN descubrimiento general mostró que, a
diferencia de los rótulos de instrucción del laboratorio, las señales de las carreteras, en lo que
respecta a los límites de velocidad (“Límite de velocidad 50 km/hr” o “velocidad vigilada por
radar”) constituyen fuentes de control débiles. De hecho, la única variable que pudimos
identificar y que produjo un sometimiento confiable al límite de velocidad fue la presencia de
una patrulla en la carretera. Según nuestro análisis, las señales de límite de velocidad por lo
general no son apoyadas por las contingencias reales y, en consecuencia, este tipo de estímulos
de instrucción ha perdido su poder de controlar la conducta en forma eficaz. Por otra parte, el
exceso de velocidad frente a una patrulla tiene una gran probabilidad de relacionarse con
consecuencias aversivas y se mantiene como un potente estímulo de control. Volviendo una vez
más a los experimentos de laboratorio, el sujeto humano se encuentra inseguro, quizá
temeroso de las contingencias, pero para él es incuestionable que su conducta se encuentra
bajo una minuciosa observación. El individuo se encuentra en tal situación que, por lo menos a
corto plazo, es de esperar que fomente una sensibilidad exagerada al control por instrucciones.

CONCLUSIÓN
Hemos analizado varios experimentos de laboratorio que tratan de encontrar las influencias
que las instrucciones ejercen sobre la ejecución realizada por humanos. El hilo conductor
general de estos estudios consiste en afirmar que las instrucciones pueden ejercer un fuerte
control sobre la conducta, aun al grado de anular el control del programa de reforzamiento
real. Sin embargo, esta posibilidad de controlar por instrucciones no se interpretó como una
limitación del reforzamiento de la conducta humana, sino como un ejemplo que pone de
manifiesto la forma en qué las historias de reforzamiento afectan cierto tipo de conducta
gobernada por reglas.
Muchas de las preguntas generadas por el análisis conductual del control por instrucciones no
se han podido responder. Por ejemplo, la adquisición inicial del control por instrucciones sólo
puede abordarse mediante un programa de investigación del desarrollo. De las diferentes
cuestiones, un problema particularmente intratable lo representa el seguimiento de
instrucciones que, como el caso de la conducta imitativa, carece de una topografía que la
distinga. Por consiguiente, la conclusión que afirma que se ha seguido una instrucción o que ha
ocurrido la imitiación, constituye una inferencia compleja que se deduce del contexto en que
ocurre la conducta. En ambos casos, el rasgo distintivo estriba en que se evocan conductas
novedosa; y que éstas persisten frente a contingencias contradictorias. Estos problemas de
análisis se magnifican cuando se toma en cuenta al proceso por medio del cual se adiestra al
individuo en desarrollo para obedecer instrucciones o para imitar las respuestas de otros. Una
explicación completa debe especificar los eventos medioambientales que permiten a los
agentes de reforzamiento identificar la conducta y los eventos que controlan la propia
conducta. Estos problemas que no han sido resueltos fueron planteados por Catania (1979) con
respecto a la conducta imitativa; sus comentarios son de igual, si no es que mayor, fuerza
cuando se aplican al fenómeno del seguimiento de instrucciones:

Las respuestas de imitación representan un tipo de respuestas que pueden reforzarse


diferencialmente (...) y, puesto que es ocasionada por estímulos, tal conducta constituye un
ejemplo de operante discriminada.

Desconocemos las dimensiones físicas pertinentes de la conducta imitativa (por ejemplo, si, en
el juego de “Simón dice”, el niño ve la mano del líder pero no la siente, mientras que siente
pero no ve su propia mano; ya que no hay una correspondencia entre ver la mano de otra
persona y sentir la propia, ¿cómo puede el niño aprender a imitar?). De hecho, podríamos
preguntar ¿qué dimensiones de correspondencia controlan nuestra respuesta que consiste en
llamar imitativas a ciertas clases de conducta? (pág. 164).
FIGURA 5.1.
FIGURA 5.2
FIGURA 5.3
FIGURA 5.4
FIGURA 5.5
FIGURA 5.6
FIGURA 5.7

También podría gustarte