Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Condicionamiento Operante
Condicionamiento Operante
El condicionamiento operante es un tipo de aprendizaje asociativo que tiene que ver con el desarrollo de
nuevas conductas en función de sus consecuencias, y no con la asociación entre estímulos y conductas
reflejas existentes como ocurre en el condicionamiento clásico. Los principios del condicionamiento
operante fueron desarrollados por B.F. Skinner, quien recibió la influencia de las investigaciones de Pavlov
y de Edward L. Thorndike.
Un ejemplo claro del aprendizaje por condicionamiento operante ocurre en los perros que halan la correa
cuando salen a pasear. El perro hala la correa y su propietario lo sigue, hasta que llegan a donde el perro
quiere ir. Entonces, la conducta (inapropiada) de halar la correa se fortalece porque el perro consigue lo
que quería.
Por el mismo proceso de aprendizaje, aunque con consecuencias negativas, algunos niños aprenden que
no deben tocar la estufa cuando está caliente. Cuando tocan la estufa se queman la mano. Entonces, la
conducta de tocar la estufa cuando está encendida desaparece porque tiene consecuencias desagradables.
Thorndike comenzó con sus denominadas Caja Problema, jaulas por las que se puede escapar si se tira de
una polea que hay en el interior. Metió en una de estas cajas a un gato hambriento. El gato podía ver que
fuera de la caja había comida, pero no podía alcanzarla. Lo que el gato comienza a hacer son movimientos
azarosos hasta que casualmente tira de la polea que abre la jaula. Cada vez que Thorndike metía al gato en
la jaula, tardaba menos en salir. Esto se debía a que se estaba produciendo un condicionamiento operante:
la conducta de tirar de la polea estaba siendo reforzada por su consecuencia (la apertura de la caja y la
obtención de la comida). Esta conducta, al ser reforzada, se convierte en la conducta más probable en un
futuro cuando las circunstancias sean iguales.
Por ejemplo, tu perro se sienta y le das comida cuando lo hace. Tu perro se sienta cada vez con más
frecuencia porque la comida ha funcionado como estímulo reforzador. Esto se conoce como reforzamiento
positivo porque la adición de una consecuencia positiva (comida) aumenta la frecuencia de la conducta
(sentarse).
Ahora imagina que tu perro tiene miedo de la gente. Una persona se le acerca y él ladra agresivamente. La
persona se aleja y tu perro deja de sentir miedo. Entonces, aprende que ladrando agresivamente puede
hacer que la gente que teme se aleje. Esto se conoce como reforzamiento negativo porque el retiro de un
estimulo aversivo (la gente) aumenta la frecuencia de la conducta (ladrar agresivamente).
Imagina que tu perro se acerca a un extraño al que no le gustan los perros, y esta persona le da una
patada. Entonces, tu perro aprende a evitar a las personas. Esto se conoce como castigo positivo porque la
adición de algo (la patada) disminuye la frecuencia de la conducta (acercarse a las personas). Este tipo de
castigo no es recomendable en el adiestramiento porque tiene consecuencias adversas que implican daño
físico y/o emocional del organismo.
Un caso diferente ocurre si tu perro está jugando contigo al tira y afloja. Tú tiras del extremo de un trapo,
mientras tu perro tira del otro extremo. En su entusiasmo por morder el trapo, tu perro te muerde la mano
por lo que terminas el juego y te vas. Entonces tu perro aprende a no morderte cuando juegan. Esto se
conoce como castigo negativo, porque el retiro de algo (el juego) disminuye la frecuencia de la conducta
(morder tu mano).
3. Extinción. Es la disminución de la frecuencia de una conducta aprendida, que ocurre cuando dicha
conducta no tiene consecuencias. Es decir que dejan de existir las consecuencias que antes
reforzaban la conducta.
Imagina que cuando tu perro era un cachorro saludaba a las personas saltando sobre ellas, porque lo
acariciaban y jugaban con él. Entonces aprendió que esta es la manera correcta de saludar a la gente. Un
buen día, la gente deja de acariciarlo y jugar con él cuando salta. En cambio, le dan la espalda y lo ignoran.
Con el tiempo tu perro deja de saltar para saludar a las personas. Esto ocurre porque la conducta
aprendida (saltar sobre las personas) deja de tener consecuencias reforzantes y, entonces, se produce la
extinción de la conducta.
• Moldeamiento
• Encadenamiento
• Entrenamiento de omisión
• Castigo
• Control de respuesta
• Tiempo fuera
Moldeamiento
El moldeamiento es una estrategia psicológica con la cual se pretende aumentar la frecuencia de una conducta
en un individuo que no la realiza o que no la hace con tanta frecuencia como se desearía. Sirve para establecer
conductas complejas que aun no existen en el repertorio comportamental de un individuo. Consiste en reforzar
en aproximaciones sucesivas, conductas que el sujeto emita que se asemejen a la conducta meta.
El moldeamiento se utiliza cuando el sujeto (frecuentemente niños o personas con deficiencia mental) no
saben realizar la conducta porque les resulta compleja. Por ello, no se ofrece un refuerzo o reforzador positivo
cuando consigue hacer la acción. En su lugar, la conducta se descompone en sus partes más simples y se
escalona su aprendizaje, tomando en un primer lugar las más elementales y avanzando hacia las más
complejas. Así, se va reforzando una a una, primero las elementales y progresivamente, las más complicadas,
apoyadas en las anteriores.
Gracias a esta estrategia, el paciente va aprendiendo poco a poco una conducta originariamente muy compleja
y fuera de su repertorio.
Por ejemplo, si un profesor está enseñándole a un alumno a escribir el numeral "1", puede empezar por
reforzarle cuando haga una línea curva. De todas las líneas curvas que haga, algunas serán más rectas y más
verticales que otras. Ya habiendo establecido las líneas curvas, el maestro empezará a reforzar las que sean
más rectas, y así sucesivamente.
Tiempo fuera
El Tiempo Fuera es una estrategia psicológica de intervención, muy utilizada con niños, para conseguir eliminar
una conducta inadecuada.
Con el Tiempo Fuera aplicamos un entrenamiento de omisión (le quitamos algo que le gusta) al privar al niño
de todo tipo de reforzador que podía recibir en su contexto, aislándolo durante un periodo breve de tiempo
(de 1 a 5 minutos) cuando ha realizado una conducta que deseamos eliminar.
Un ejemplo de esta técnica, sería que, ante un comportamiento agresivo de un niño para quitarle el juguete a
un compañero, le llevásemos al pasillo y le dejásemos ahí, quieto y sin poder hacer nada. Esta técnica ha de ser
explicada previamente al niño; se le ha de decir, desapasionadamente (para que no obtenga el reforzador de la
atención) que su comportamiento no ha estado bien, y que le vamos a dejar fuera para que piense en lo que ha
hecho.
Condicionamiento instrumental
El nombre que B.F. Skinner dio a este tipo de aprendizaje fue condicionamiento operante, aunque hoy se
prefiere el de condicionamiento instrumental, por ser más descriptivo, aunque hay quien ve algún matiz
distintivo desde posiciones puramente conductistas. Fue él precisamente el primero en distinguir entre este
tipo de condicionamiento y el condicionamiento clásico.
Estímulos
También se usan estímulos condicionados (EC), estímulos relativamente inocuos sin significado o poder
específico, al menos al comienzo del entrenamiento.
El estímulo discriminativo es un estímulo neutro que indica cuándo la respuesta puede conducir o no a la
consecuencia deseada. Es decir, el estímulo discriminativo indica si el reforzador está disponible. Por oposición,
el estímulo delta es el estímulo que no estuvo presente cuando la respuesta fue reforzada, y por lo tanto no da
información sobre la disponibilidad del reforzador.
Respuestas
La respuesta incondicionada (RI) es la provocada por el EI de forma refleja y que viene determinada por él.
La respuesta condicionada (también llamada respuesta instrumental) suele ser distinta a la RI, siendo bastante
arbitraria.
Fases
Las fases de un experimento de condicionamiento instrumental son esencialmente las mismas que en el caso
del condicionamiento clásico:
• Adquisición
• Extinción
Programas de reforzamiento
Un programa de reforzamiento es una regla sobre la administración del reforzador. Existen programas de
reforzamiento de dos tipos: de razón (en función de la respuesta) y de intervalo (en función del tiempo), y cada
uno admite una administración fija o variable.
Tipos
• Condicionamiento de recompensa
• Entrenamiento de omisión
• Castigo
• Escape y evitación (Aunque distintos, ambos se consideran dentro del mismo procedimiento, ya que
ambos implican la no ocurrencia del estímulo incondicionado aversivo.)
Entrenamiento de omisión
Aunque en la literatura psicológica a menudo se ha usado el nombre de castigo negativo para este tipo de
condicionamiento, ese término ha sido relegado en aras de la claridad, ya que a menudo el término castigo
conducía a error.
El entrenamiento de omisión consiste en que el resultado que sigue a la respuesta dada por un individuo es la
ausencia de un estímulo apetitivo; es decir, la conducta da lugar a la omisión de la recompensa.
Un ejemplo de castigo negativo podría ser la mala costumbre de mandar a los niños a la cama sin cenar: la
consecuencia de su conducta es quitar un estímulo considerado como positivo o apetitivo (excepto, claro que
la cena no fuera del gusto del niño).
El entrenamiento de omisión se parece a la extinción en que ambos procedimientos dan lugar a la disminución
de la ejecución, si bien son muy diferentes en, por ejemplo, el grado de suspensión. Además todos los
experimentos en este sentido coinciden en considerarlos procedimientos semejantes, pero distintos.
Castigo
El castigo o castigo positivo es, en psicología un tipo de condicionamiento instrumental. El término castigo
positivo se hace innecesario al evitarse también el término castigo negativo, sustituido por el más adecuado y
claro de entrenamiento de omisión.
El castigo ocurre cuando la respuesta instrumental va seguida de un estímulo aversivo. Este estímulo aversivo
puede consistir, en los experimentos de laboratorio, en pequeñas descargas eléctricas o ruidos estridentes.
Aplicado a humanos, el castigo es habitual en la sociedad; no sólo sería castigo el físico o penal, también puede
ser psicológico.