Condicionamiento Operante

204 CAPÍTULO 5
150
Tiempo para escapar (segundos)

100
50
0
1 12 24
Prueba
A B
FIGURA 5-9 La investigación de Thorndike creó el marco para el desarrollo del
condicionamiento operante. Mediante la caja problema (A), mostró que los com-
portamientos, que él describió como satisfactorios, tendían a grabarse en el orga-
nismo. Al principio, el animal realizaba respuestas aleatorias al tratar de salir de la
caja y agarrar el pescado (un satisfactor), pero pronto presentaba comportamien-
tos que le permitían escapar y tomar la comida fuera de la caja problema (B).
ley de efecto la puerta de la caja problema se abría y el animal salía para comer el alimento que había sido
Según Thorndike los reforzadores colocado justo fuera de la puerta. En algunos casos salir de la caja problema requería una
promueven el aprendizaje, en simple respuesta como oprimir una palanca o pisar una plataforma. En otros, la respuesta
tanto que los castigos provocan el requerida era más difícil. Por ejemplo, el animal tenía que realizar tres respuestas separadas:
desaprendizaje de las respuestas jalar una cuerda (que levantaba un perno), pisar una plataforma (que levantaba el otro
perno) y alcanzar y girar uno de los dos pestillos a través de las barras al frente de la puerta.
Cuando Thorndike colocó al animal en la caja problema (ya sea en la versión simple o en la
compleja), por lo general le tomaba un largo tiempo escapar. El animal se movía alrededor
de la caja problema y exploraba varias partes de la cámara, de manera aleatoria. Al final, el
animal realizaba la(s) respuesta(s) que abría la puerta. Thorndike regresaba al animal a la
caja problema muchas veces y registraba la cantidad de tiempo que le tomaba escapar. Los
resultados de este procedimiento se observan en la figura 5-9B. Thorndike creía que la pri-
mera respuesta acertada del animal era accidental. Con el tiempo, al animal le tomaba me-
nos tiempo escapar, haciéndose más eficiente para realizar la respuesta (o respuestas)
apropiada. Esta observación condujo a Thorndike a establecer lo que llamó la ley del
efecto (Thorndike, 1911): presentar un “satisfactor” conduce al fortalecimiento o aprendi-
zaje de nuevas respuestas, en tanto que presentar un “perturbador” conduce al debilita-
miento o desaprendizaje de las respuestas. En este caso, el satisfactor (salir y obtener la
comida) parece haberse grabado en el repertorio del animal, en tanto que los intentos falli-
dos parecen haber salido del repertorio de comportamientos.
El trabajo de Thorndike creó el marco para el desarrollo del condicionamiento ope-
rante. La terminología específica cambiaría, pero las ideas básicas tenían sus raíces en la caja
problema de Thorndike. Nadie ha sido más asociado con el condicionamiento operante
que el difunto psicólogo de Harvard B.F. Skinner (1904-1990), quien ha sido considerado
como el psicólogo más famoso del mundo (Fowler, 1990). Skinner tenía una gran influen-
cia de Edward Thorndike, así como de la opinión conductual de John B. Watson sobre la
psicología (véase p. 195). Como hemos visto, Watson creía que si pudiéramos entender
cómo predecir y controlar la conducta, sabríamos todo sobre la psicología. Por tanto, Skin-
ner empezó a buscar el estímulo que controla la conducta. Para aislar estos efectos, desa-
rrolló un ambiente de pruebas especial llamado cámara de condicionamiento operante, la cual
se conoce como caja de Skinner (véase figura 5-10). Aunque Skinner se basaba en el uso de
animales, como ratas y palomas, sus ideas se han aplicado a la conducta humana. La ventaja
de la caja de Skinner y los estudios de laboratorio es que permiten a los investigadores te-
B.F. Skinner entrenando una ner control en su investigación y, por tanto, los investigadores están en una mejor posición
rata en la caja de Skinner. para identificar las influencias reales en la conducta.
206 CAPÍTULO 5
reforzador negativo rre la respuesta meta. Por lo general son considerados deseables y agradables y, por tanto,
Acontecimiento o estímulo elimi- son buscados por las personas y los animales. Por ejemplo, un agente de bienes raíces gana
nado después de la respuesta una comisión por cada casa que vende; las comisiones refuerzan sus intentos por vender
meta, aumentando así la probabi- tantas casas como sea posible. A su pequeño hermano le permiten ver caricaturas los sába-
lidad de que esta respuesta dos después de que limpia su habitación; como resultado, él limpia su habitación todos los
vuelva a ocurrir
sábados. Esperamos que usted haya sido elogiado por recibir buenas clasificaciones en las
reforzador primario pruebas psicológicas; los elogios lo alientan a estudiar aún más en el futuro.
Estímulo que tiene propiedades Reforzadores negativos son acontecimientos o estímulos que se eliminan porque ha
de reforzamiento innatas ocurrido una respuesta. Algunos ejemplos de los reforzadores negativos incluyen tocar mú-
sica para reducir el aburrimiento, limpiar su cuarto para que su compañero deje de quejarse
reforzador secundario
porque usted es desaliñado y tomar medicamentos para reducir el dolor de una cirugía de
Estímulo que adquiere propieda-
des de reforzador al ser asociado
hernia reciente. En estas situaciones algo se detuvo (el aburrimiento), se eliminó (la crítica)
con un reforzador primario o se redujo (el dolor) porque usted realizó una respuesta meta.
reforzador positivo Reforzadores primarios y secundarios (condicionados). Un reforzador pri-

Aumento en la frecuencia de una mario es un acontecimiento o estímulo que tiene propiedades de reforzamiento innatas (es
conducta meta (respuesta) que decir, biológicas); usted no necesita aprender que dichos estímulos son reforzadores. Para
ocurre cuando una conducta es una persona hambrienta, la comida es un reforzador primario. El agua es otro reforzador
seguida por la presentación de primario, en especial en un día muy caluroso; un tercer ejemplo del reforzador primario es
un reforzador positivo el descanso proporcionado al dormir, que es bienvenido, refrescante y con frecuencia insu-
ficiente para nuestras necesidades. De más está decir que no todos los acontecimiento o es-
tímulos que pueden seguir a una conducta satisfarán algunas de las necesidades biológicas
como el hambre, la sed o el sueño. Un reforzador secundario es un estímulo que adquiere
propiedades de reforzador al ser asociado con un reforzador primario. Debido a que usted
Fuente: Psi Chi Newsletter. Se reproduce con
debe aprender que los estímulos son reforzadores, también se llaman reforzadores condicio-
nados. El dinero es el mejor ejemplo de un reforzador secundario. Por sí mismo, el dinero
no tiene ningún valor intrínseco; los niños aprenden que el dinero se intercambia por re-
forzadores primarios como el helado, los refrescos, las palomitas de maíz o los dulces. Tam-
bién usamos el dinero para comprar otros alimentos, bebidas y lugares para dormir, como
un departamento, una casa o un cuarto de hotel.
autorización de Psi Chi.
Contingencias y conducta
Skinner acuñó el término condicionamiento operante porque las conductas que realizamos
voluntariamente (a diferencia de las conductas que son provocadas o “sacadas” del orga-
nismo) operan de alguna manera en el entorno que nos rodea. Los cambios resultantes en
el entorno determinan lo que pasa con una conducta meta dada (respuesta). Si una con-
ducta es seguida por un reforzador positivo, como cuando un estudiante responde una
pregunta y el profesor le dice “¡Excelente!”, la conducta tiende a aumentar en el futuro.
Skinner notó que se establece una contingencia entre la conducta y los resultados: las con-
tingencias toman la forma de las relaciones “Si ______ entonces _____”. Si un estudiante
da una buena respuesta, entonces el profesor dirá “Excelente” (véase figura 5-11). En otros
casos, como en el castigo, la contingencia es diferente: si un niño corre hacia la calle, en-
tonces sus padres le pegarán, lo que produce una disminución de la conducta (correr hacia
la calle) en el futuro.
Reforzador positivo. Es un concepto fácil de entender porque existen muchos ejem-
plos en la vida diaria. El reforzador positivo ocurre cuando una conducta meta (respuesta)
es seguida por la presentación de un reforzador positivo, el cual tiene el efecto de tener más
probabilidades de que la conducta ocurra en el futuro. A continuación presentamos algunos
ejemplos de reforzadores cotidianos, que aparecen en forma de contingencias:
• Si Agnes, de 5 años, recoge todos los juguetes del piso de su habitación (conducta
meta), entonces su mamá le dará más postre en la cena (presentación de un refor-
zador positivo que produce un reforzamiento positivo).
• Si Jason, de 16 años, corta el pasto (conducta meta), entonces sus padres le presta-
rán el automóvil el sábado por la noche (presentación de un reforzador positivo
que produce un reforzamiento positivo).
208 CAPÍTULO 5
modelamiento esta conducta? La respuesta parece ser negativa; la cantidad de estudiantes que admiten ha-
Una forma de condicionamiento ber hecho trampa en exámenes es bastante grande; de 40 a 95% de los estudiantes univer-
operante en la cual una respuesta sitarios encuestados informaron haber hecho trampa en alguna ocasión (Burnett, Rudolph
deseada se enseña por medio del y Clifford, 1998; Davis y Ludvigson, 1995; Jensen, Arnett, Feldman y Cauffman, 2002); por
reforzamiento de las respuestas consiguiente, el hacer trampa es una seria preocupación en muchos campus universitarios
sucesivas que más se asemejan a
(McCabe, Trevino y Butterfield, 2001; Whitley y Keith-Spiegel, 2002).
la respuesta meta
Psico-detective
¿Puede un reforzador positivo alentar la conducta falta de ética? Considere el problema
de hacer trampa. A los niños se les enseña que hacer trampa está mal, pero esta conducta
persiste en la mayoría de los segmentos de nuestra sociedad. ¿Por qué? Analice por al-
gunos minutos la conducta de hacer trampa en términos del condicionamiento clásico.
Asegúrese de escribir la respuesta meta y los reforzadores.
Existe una creciente preocupación porque la expansión actual de formatos de aprendi-

zaje a larga distancia facilitaría aún más que los estudiantes hagan trampa (Kennedy, No-
wak, Raghuraman, Thomas y Davis, 2000; Underwood y Szabo, 2003). Además, los índices
de detección son muy bajos, a menudo menores de 2% (Haines, Diekhoff, LaBeff y Clark,
1986). Por tanto, solamente se detecta una pequeña cantidad de tramposos y aún menos son
castigados. El prospecto de obtener una calificación fácilmente, aunado a la baja probabili-
dad de ser descubierto, es un poderoso reforzador para hacer trampa en las pruebas.
5.2
Modelamiento. Piense por un momento sobre las conductas diarias que observa en
su entorno. Mientras piensa en ellas, quizá se percate de que la conducta final no siem-
pre ocurre desde el principio. Por ejemplo, no es probable que usted haya aprendido a
manejar después de dar una vuelta a la manzana. ¿Cómo explica Skinner la manera en
que desarrollamos conductas complejas, que tal vez no existían antes de comenzar el en-
trenamiento?
Cuando usted comienza a entrenar una rata en una caja de Skinner (véase página 205),
no espere mucho de la rata. La rata no empezará a oprimir la palanca o la barra tan pronto
como entre en este nuevo entorno. Usted tendrá que ayudarla a aprender a oprimir la pa-
lanca o barra para obtener comida. La técnica que usará es una forma de condicionamiento
operante llamada modelamiento. El modelamiento implica las respuestas de reforzadores
sucesivas que se parecen más a la respuesta meta deseada; en otras palabras, usted está
usando el método de las aproximaciones sucesivas. Cuando utiliza este método, retiene el re-
forzador hasta que el animal realiza una conducta que se acerca a la respuesta meta deseada.
Aunque el concepto del modelamiento es claro, llevarlo a cabo sería difícil. La sincroniza-
ción de la presentación del reforzador es crucial; si los reforzadores no se presentan en el
momento exacto, puede modelarse una respuesta inapropiada.
Para que una rata aprenda a oprimir una palanca para obtener alimento, la secuen-
cia de eventos es la siguiente: cuando la rata esté cerca del plato de comida, deje caer un
pedazo de comida en el plato. Comer el alimento refuerza la conducta de acercarse al
plato. Una vez que la rata haya aprendido dónde está la comida, comience a ofrecerle re-
forzadores cuando la rata esté cerca de la palanca de respuesta. De manera gradual, usted
Las ratas pueden aprender a hace que los requerimientos de su respuesta sean más exigentes hasta que la rata debe to-
jugar básquetbol. Los car la palanca para recibir el reforzador. Una vez que la rata haya empezado a tocar la pa-
estudiantes de la escuela lanca, requeriría que la palanca sea oprimida antes de darle el reforzador. De esta manera
secundaria DeKalb, bajo la guía
usted ha hecho que la respuesta que produce el reforzador se parezca más (aproximación
de su profesor, el doctor Jim
sucesiva) a la respuesta meta de oprimir la palanca. En resumen, usted ha modelado la res-
Divine, usaron técnicas de
modelamiento para enseñar a puesta de la rata.
ratas a jugar básquetbol. Sus Uno de los casos más conocidos de modelamiento implica a un paciente que fue inter-
ratas eran excelentes para nado en un hospital mental a los 21 años, diagnosticado con esquizofrenia (véase capítulo
hacer canastas (como se 12); él había estado “completamente mudo inmediatamente después de ser internado” (Isa-
muestra aquí), ¡aunque tenían acs, Thomas y Goldiamond, 1960). ¡Nadie había sido capaz de sacarle una palabra por 19
dificultad con los lanzamientos años! Él vivía sin pronunciar una palabra, con una mirada perdida. Un día, a un psicólogo
de tres puntos! se le cayó una caja de goma de mascar. Los ojos del paciente se fijaron en la goma de mas-
210 CAPÍTULO 5
reforzador negativo El principio de Premack fue utilizado en una situación con riesgo de muerte de un
Aumento en la frecuencia de una niño de 7 años que solamente aceptaba comer alimentos muy específicos. Cuando sus pa-
conducta meta (respuesta) que dres le ofrecían otros alimentos, él se volvía agresivo y difícil. Sus padres estaban preocupa-
ocurre cuando un reforzador ne- dos de que esta dieta autoimpuesta le provocara serios riesgos de salud. Ellos solicitaron la
gativo es eliminado o terminado; ayuda de un terapeuta que diseñó un programa de tratamiento basado en el principio de
el condicionamiento de escape
Premack. A la hora de la comida, sus padres decían al niño que si comía una pequeña can-
y el de evitación son algunos
tidad de alimentos nuevos, podía comer uno de sus alimentos favoritos. Si no comía estos
ejemplos
nuevos alimentos, le daban uno de los alimentos que menos le gustaban para que no estu-
viera hambriento. Con el tiempo, el niño empezó a comer una variedad más amplia de ali-
mentos y estaba más calmado cuando se le presentaban nuevos alimentos (Brown, Spencer
y Stella, 2002).
Existen numerosos ejemplos del principio de Premack, incluyendo:
• Terminar la tarea (actividad no preferida) se refuerza con la oportunidad de jugar
(actividad preferida).
• Los jugadores de futbol pueden hacer nuevas jugadas (actividad preferida) después
de que han corrido las vueltas requeridas (actividad no preferida).
• El recoger y poner en bolsa las hojas el domingo por la mañana (actividad no pre-
ferida) se refuerza con la oportunidad de jugar un videojuego el domingo por la
tarde (actividad preferida).
Reforzadores negativos. Los estudiantes parecen tener más dificultad para aprender el
concepto de los reforzadores negativos que los positivos. Cuando los estudiantes ven la pala-
bra negativo, con frecuencia asumen que una conducta disminuye. No se enrede en este ma-
lentendido, que ha sido conocido como uno de los principales errores cometidos por los
estudiantes de psicología (Leahey y Harris, 2001; McConnell, 1990). Tanto los reforzadores
negativos como los positivos han sido efectivos, la respuesta meta que lo terminó tiene pro-
babilidades de ocurrir de nuevo. El reforzador negativo ocurre cuando una conducta meta
(respuesta) es seguida por la eliminación o reducción de un reforzador negativo, el cual pro-
duce un aumento en la frecuencia de la conducta meta (véase figura 5-11 en la página 207).
Considere los siguientes ejemplos del reforzador negativo presentados en forma de contin-
gencias:
• Si Ann se sube a su automóvil y escucha el molesto sonido de la alarma del cintu-
rón de seguridad, entonces ella se abrocha el cinturón de seguridad (respuesta meta)
y el molesto sonido desaparece (eliminación de un reforzador negativo que con-
duce al reforzamiento negativo).
• Si Jason se pone su crema para el tratamiento de quemaduras de sol (conducta
meta), entonces su dolor parece esfumarse (eliminación de un reforzador negativo
que produce un reforzamiento negativo).
• Si Joe se pone ansioso cuando ve un gran perro negro de largo pelaje a 200 yar-
das y camina en dirección opuesta al perro (conducta meta), entonces su nivel de an-
siedad baja con cada paso que da para alejarse del perro (eliminación de un
reforzador negativo que produce un reforzamiento negativo).
• Si Warren está trabajando en casa y la temperatura aumenta a un nivel incómodo,
entonces él camina hacia el termostato y baja la temperatura a un nivel más cómodo
(conducta meta). Él se percata que el calor incómodo se ha eliminado (eliminación
de un reforzador negativo que produce un reforzamiento negativo).
Considere el siguiente caso: Jason, el encargado de un hospital estatal, era considerado
un empleado modelo; era trabajador, puntual y los pacientes lo querían. Sólo había un pro-
blema: Jason tenía la tendencia de caminar con los hombros caídos mientras trabajaba. A
pesar que el caminar con los hombros caídos no es un problema grave, presenta un modelo
de conducta inapropiado para los pacientes. Varios psicólogos diseñaron un arnés para los
hombros con una banda elástica a lo largo de la espalda de Jason. La banda estaba conec-
tada a un pequeño generador de tono y a un aparato que hacía clic. El arnés no se veía
cuando Jason usaba una camisa y un suéter encima. Cuando caminaba con los hombros caí-
dos, la banda elástica se estiraba y producía un sonido de clic. Tres segundos después sonaba
un tono desagradable que no se detenía hasta que Jason se enderezaba. Cuando Jason es-
taba en una buena postura, podía escapar al sonido del tono. Si continuaba con una buena
212 CAPÍTULO 5
Un gran número de estímulos discriminativos se encuentran en el mundo real. La se-

ñal de “abierto” en la ventana de una tienda es un estímulo discriminativo, señala que la res-
puesta de alcanzar el picaporte de la puerta será reforzada al poder entrar en la tienda y
comprar. El color de la luz del semáforo en una intersección señala que la respuesta de
detener su automóvil (roja) o seguir (verde) será reforzada al llegar seguro a su destino. El
estado de ánimo de sus amigos es una señal de que una respuesta, como hacer una broma o
un comentario simpático, puede ser apreciada.
La señal de “abierto” es un Programas de reforzamiento

estímulo discriminativo que En una cámara de condicionamiento operante, el investigador liberará reforzadores, como
indica que la respuesta de jalar una bolita de comida para una rata o paloma hambrientas, de acuerdo con un patrón pre-
el picaporte de la puerta será determinado. La figura 5-10 (pág. 205) muestra un instrumento, conocido como grabadora
reforzado al poder entrar a acumulativa, que registra las respuestas del participante. La hoja de resultados, conocida
Mother Myrick’s para comer un como registro acumulativo, muestra el índice de respuesta en una serie de pruebas de con-
refrigerio.
dicionamiento operante; cuanto más empinada sea la línea, más alto será el índice de res-
puesta. Tenga en cuenta que una grabadora acumulativa registra la acumulación de las
respuestas meta contra el tiempo, de ahí el término acumulativa.
Psico-detective
Suponga que observa el registro acumulativo de una rata que está siendo entrenada en
una caja de Skinner. Mientras sostiene la rata en su mano, observa el registro y nota algo
interesante. A lo largo de varios días, el registro muestra una línea recta horizontal.
¿Qué le pasó a la respuesta meta de la rata?
Esta rata ha dejado de realizar la conducta meta. El hecho de que la esté sosteniendo
significa que el animal aún está vivo. El investigador coloca a esta rata en un programa que
produce la reducción y eliminación de la respuesta (extinción).
Un patrón o plan preestablecido para liberar el reforzamiento, un programa de re-
forzamiento, es un importante factor determinante de la conducta (Mazur, 2006; Shull y
Lawrence, 1998). Una vez que la respuesta meta ha sido modelada, el investigador puede
hacer que el reforzador se libere de acuerdo con un programa específico. La mayoría de los
planes o programas para liberar reforzadores recaen en dos categorías principales: continuo
e intermitente (parcial). Esto significa que el reforzador siempre seguirá a la conducta meta
o algunas veces seguirá a la conducta meta.
registro acumulativo
Resultado de una serie de prue- Reforzamiento continuo. El programa básico es el de reforzamiento continuo, en el
bas de condicionamiento ope- cual se le proporciona al participante un reforzador después de que ocurre la respuesta
rante, mostrado como un índice meta. Por ejemplo, una rata en una caja de Skinner recibe una bolita de alimento cada vez
de respuesta que oprime la barra; una máquina de refrescos entrega una bebida fría cada vez que recibe
programa de reforzamiento dinero. Un programa de reforzamiento continuo produce un índice de respuesta alto. No
Patrón preestablecido para liberar obstante, una vez que el reforzador pierde su efectividad, el índice de respuesta baja rápida-
el reforzador mente. Una bolita de alimento refuerza la respuesta de una rata hambrienta, pero no es
efectiva después de que ha comido muchas.
reforzamiento continuo
Reforzamiento que sigue a todas Reforzamiento intermitente (parcial). En programas que no implican el uso del re-
las respuestas meta forzamiento continuo, algunas respuestas no se refuerzan. El término reforzamiento in-
termitente (o parcial) describe estos patrones interrumpidos de entrega de reforzamiento.
reforzamiento intermitente
Existen dos tipos principales de programas intermitentes: de proporción y de intervalo.
(o parcial)
Reforzador que no sigue a todas Programas de razón. Cuando se usa el programa de razón, la cantidad de respuestas
las respuestas meta determina si el participante recibe el reforzamiento. En algunos casos la cantidad exacta de
respuestas que se deben realizar para recibir un reforzador es específica. Por ejemplo, tal
programa de razón
Programa de reforzamiento en el vez se requiera que una paloma picotee un disco (llave) cinco veces antes de que el grano
cual el reforzador es la cantidad (un reforzador positivo) sea liberado. Cuando la cantidad de respuestas requeridas para pro-
de respuestas, la cual se esta- ducir un reforzador se especifica, se conoce como un programa de razón fija (RF). Pedir que
blece (programa de RF) o varía de una paloma picotee cinco veces para recibir el reforzamiento está diseñado como un pro-
un reforzador a otro (programa grama de razón fija 5 (RF-5). Podemos pensar en un programa de reforzamiento continuo
de RV) como un programa de razón fija 1 (RF-1).

Condicionamiento Operante

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Condicionamiento Operante

Cargado por

Copyright:

Formatos disponibles

204 CAPÍTULO 5

Tiempo para escapar (segundos)

reforzador positivo Reforzadores primarios y secundarios (condicionados). Un reforzador pri-

Existe una creciente preocupación porque la expansión actual de formatos de aprendi-

Un gran número de estímulos discriminativos se encuentran en el mundo real. La se-

La señal de “abierto” es un Programas de reforzamiento

También podría gustarte