Está en la página 1de 5

Condicionamiento operante

En psicología, el condicionamiento operante es una forma de aprendizaje en la que la consecuencia (el


estímulo reforzador) es contingente a la respuesta que previamente ha emitido el sujeto. El
condicionamiento operante implica la ejecución de conductas que operan sobre el ambiente.

El condicionamiento operante es un tipo de aprendizaje asociativo que tiene que ver con el desarrollo de
nuevas conductas en función de sus consecuencias, y no con la asociación entre estímulos y conductas
reflejas existentes como ocurre en el condicionamiento clásico. Los principios del condicionamiento
operante fueron desarrollados por B.F. Skinner, quien recibió la influencia de las investigaciones de Pavlov
y de Edward L. Thorndike.

El nombre condicionamiento operante es el que dio Skinner, aunque hoy se prefiere el de


condicionamiento instrumental, por ser más descriptivo. Roger Tarpy los equipara, decantándose por el
término instrumental, especialmente para el aprendizaje humano, aunque para todos en general. Para él
ambos son iguales en tanto en cuanto ambos dan lugar a consecuencias reforzantes. Desde el punto de
vista histórico, el término de condicionamiento operante se ha utilizado para hacer referencia a
situaciones experimentales en las que los sujetos actúan a su propio ritmo, en contraposición a recibir
ensayos directos. Algunos defienden en esto la separación de ambos términos que por lo demás se
considera poco operativa.

Aprendizaje por condicionamiento operante

En el condicionamiento operante las conductas se emiten espontáneamente y sus consecuencias


determinan el aprendizaje. Las consecuencias agradables tienden a fortalecer una conducta. En cambio,
las consecuencias desagradables tienden a debilitar una conducta contingente

Un ejemplo claro del aprendizaje por condicionamiento operante ocurre en los perros que halan la correa
cuando salen a pasear. El perro hala la correa y su propietario lo sigue, hasta que llegan a donde el perro
quiere ir. Entonces, la conducta (inapropiada) de halar la correa se fortalece porque el perro consigue lo
que quería.

Por el mismo proceso de aprendizaje, aunque con consecuencias negativas, algunos niños aprenden que
no deben tocar la estufa cuando está caliente. Cuando tocan la estufa se queman la mano. Entonces, la
conducta de tocar la estufa cuando está encendida desaparece porque tiene consecuencias desagradables.

Thorndike comenzó con sus denominadas Caja Problema, jaulas por las que se puede escapar si se tira de
una polea que hay en el interior. Metió en una de estas cajas a un gato hambriento. El gato podía ver que
fuera de la caja había comida, pero no podía alcanzarla. Lo que el gato comienza a hacer son movimientos
azarosos hasta que casualmente tira de la polea que abre la jaula. Cada vez que Thorndike metía al gato en
la jaula, tardaba menos en salir. Esto se debía a que se estaba produciendo un condicionamiento operante:
la conducta de tirar de la polea estaba siendo reforzada por su consecuencia (la apertura de la caja y la
obtención de la comida). Esta conducta, al ser reforzada, se convierte en la conducta más probable en un
futuro cuando las circunstancias sean iguales.

Tipos de condicionamiento operante

1. Reforzamiento. Cualquier adición (para aumentar la frecuencia del comportamiento) o retiro


(para disminuir la frecuencia del comportamiento) de algún estimulo o artefacto como
consecuencia de cualquier conducta.

Por ejemplo, tu perro se sienta y le das comida cuando lo hace. Tu perro se sienta cada vez con más
frecuencia porque la comida ha funcionado como estímulo reforzador. Esto se conoce como reforzamiento
positivo porque la adición de una consecuencia positiva (comida) aumenta la frecuencia de la conducta
(sentarse).
Ahora imagina que tu perro tiene miedo de la gente. Una persona se le acerca y él ladra agresivamente. La
persona se aleja y tu perro deja de sentir miedo. Entonces, aprende que ladrando agresivamente puede
hacer que la gente que teme se aleje. Esto se conoce como reforzamiento negativo porque el retiro de un
estimulo aversivo (la gente) aumenta la frecuencia de la conducta (ladrar agresivamente).

2. Castigo. Comportamiento usado para extinguir o anular algún comportamiento de algún


organismo.

Imagina que tu perro se acerca a un extraño al que no le gustan los perros, y esta persona le da una
patada. Entonces, tu perro aprende a evitar a las personas. Esto se conoce como castigo positivo porque la
adición de algo (la patada) disminuye la frecuencia de la conducta (acercarse a las personas). Este tipo de
castigo no es recomendable en el adiestramiento porque tiene consecuencias adversas que implican daño
físico y/o emocional del organismo.

Un caso diferente ocurre si tu perro está jugando contigo al tira y afloja. Tú tiras del extremo de un trapo,
mientras tu perro tira del otro extremo. En su entusiasmo por morder el trapo, tu perro te muerde la mano
por lo que terminas el juego y te vas. Entonces tu perro aprende a no morderte cuando juegan. Esto se
conoce como castigo negativo, porque el retiro de algo (el juego) disminuye la frecuencia de la conducta
(morder tu mano).

3. Extinción. Es la disminución de la frecuencia de una conducta aprendida, que ocurre cuando dicha
conducta no tiene consecuencias. Es decir que dejan de existir las consecuencias que antes
reforzaban la conducta.

Imagina que cuando tu perro era un cachorro saludaba a las personas saltando sobre ellas, porque lo
acariciaban y jugaban con él. Entonces aprendió que esta es la manera correcta de saludar a la gente. Un
buen día, la gente deja de acariciarlo y jugar con él cuando salta. En cambio, le dan la espalda y lo ignoran.
Con el tiempo tu perro deja de saltar para saludar a las personas. Esto ocurre porque la conducta
aprendida (saltar sobre las personas) deja de tener consecuencias reforzantes y, entonces, se produce la
extinción de la conducta.

4. Discriminación y control por el estímulo. Es el aumento de la frecuencia de una conducta en


presencia de un estímulo, pero no en presencia de otros.

Estrategias de modificación de conducta operante


Existen una variedad de estrategias desarrolladas para modificar, establecer y desvanecer la conducta
dentro del paradigma operante. Por ejemplo:

• Moldeamiento
• Encadenamiento
• Entrenamiento de omisión
• Castigo
• Control de respuesta
• Tiempo fuera

Moldeamiento

El moldeamiento es una estrategia psicológica con la cual se pretende aumentar la frecuencia de una conducta
en un individuo que no la realiza o que no la hace con tanta frecuencia como se desearía. Sirve para establecer
conductas complejas que aun no existen en el repertorio comportamental de un individuo. Consiste en reforzar
en aproximaciones sucesivas, conductas que el sujeto emita que se asemejen a la conducta meta.

El moldeamiento se utiliza cuando el sujeto (frecuentemente niños o personas con deficiencia mental) no
saben realizar la conducta porque les resulta compleja. Por ello, no se ofrece un refuerzo o reforzador positivo
cuando consigue hacer la acción. En su lugar, la conducta se descompone en sus partes más simples y se
escalona su aprendizaje, tomando en un primer lugar las más elementales y avanzando hacia las más
complejas. Así, se va reforzando una a una, primero las elementales y progresivamente, las más complicadas,
apoyadas en las anteriores.

Gracias a esta estrategia, el paciente va aprendiendo poco a poco una conducta originariamente muy compleja
y fuera de su repertorio.

Por ejemplo, si un profesor está enseñándole a un alumno a escribir el numeral "1", puede empezar por
reforzarle cuando haga una línea curva. De todas las líneas curvas que haga, algunas serán más rectas y más
verticales que otras. Ya habiendo establecido las líneas curvas, el maestro empezará a reforzar las que sean
más rectas, y así sucesivamente.

Tiempo fuera

El Tiempo Fuera es una estrategia psicológica de intervención, muy utilizada con niños, para conseguir eliminar
una conducta inadecuada.

Con el Tiempo Fuera aplicamos un entrenamiento de omisión (le quitamos algo que le gusta) al privar al niño
de todo tipo de reforzador que podía recibir en su contexto, aislándolo durante un periodo breve de tiempo
(de 1 a 5 minutos) cuando ha realizado una conducta que deseamos eliminar.

Un ejemplo de esta técnica, sería que, ante un comportamiento agresivo de un niño para quitarle el juguete a
un compañero, le llevásemos al pasillo y le dejásemos ahí, quieto y sin poder hacer nada. Esta técnica ha de ser
explicada previamente al niño; se le ha de decir, desapasionadamente (para que no obtenga el reforzador de la
atención) que su comportamiento no ha estado bien, y que le vamos a dejar fuera para que piense en lo que ha
hecho.

Condicionamiento instrumental

En psicología, el condicionamiento instrumental es una forma de aprendizaje en la que la consecuencia (el


estímulo reforzador) es contingente a la respuesta que previamente ha emitido el sujeto. Se le llamó en
principio "operante" porque el organismo opera sobre el medio para recibir una consecuencia.

El nombre que B.F. Skinner dio a este tipo de aprendizaje fue condicionamiento operante, aunque hoy se
prefiere el de condicionamiento instrumental, por ser más descriptivo, aunque hay quien ve algún matiz
distintivo desde posiciones puramente conductistas. Fue él precisamente el primero en distinguir entre este
tipo de condicionamiento y el condicionamiento clásico.

Distinción entre condicionamiento clásico y operante

• En el condicionamiento clásico la asociación se da entre un estímulo condicionado y uno


incondicionado.
• En el condicionamiento instrumental, la asociación se da entre las respuestas y las consecuencias que
se derivan de ellas.
• En el condicionamiento clásico, el estímulo incondicionado no depende de la respuesta del sujeto,
mientras que, en el operante, las consecuencias dependen de la respuesta del sujeto.
• En el condicionamiento clásico, la respuesta del sujeto es involuntaria, mientras que en el
instrumental es generalmente voluntaria.
La distinción entre ambos condicionamientos para los conductistas más radicales es tanto operativa como de
procesos:

• Operativa, ya que el reforzador depende de la respuesta, de la conducta, por lo tanto.


• Procesal, estando implicado en un caso el sistema nervioso autónomo y en el otro el sistema nervioso
central. ESTA DIFERENCIA NO HA SIDO DEMOSTRADA EXPERIMENTALMENTE DE MANERA PÚBLICA ANTE LA COMUNIDAD
CIENTÍFICA PERO LA EVIDENCIA ENCONTRADA EN ESTA INVESTIGACIÓN EXPONE CLARAMENTE QUE NO SOLO SE TUVO QUE
HABER LOGRADO DEMOSTRAR EXPERIMENTALMENTE, SINO QUE LOS RESULTADOS OBTENIDOS PROCESALMENTE
SOBRE RESPUESTAS EMITIDAS POR EL SISTEMA NERVIOSO AUTÓNOMO SON ALARMANTEMENTE EFICACES, SI BIEN LOS
FINES CON LOS QUE SE HAN UTILIZADO SON TOTALITARIOS, PREPÓSTEROS Y PROTERVOS.

Estímulos

Lo verdaderamente importante en este tipo de condicionamiento es la respuesta generada ante el estímulo.


Cualquier proceso de condicionamiento instrumental admite el uso de estímulos que en condicionamiento
pavloviano podrían clasificarse como condicionados, incondicionados o neutros, ya que el análisis no se
concentra en ellos sino en las consecuencias de las respuestas, que son las que determinan la probabilidad de
que la conducta se repita o no.

En el condicionamiento instrumental los estímulos incondicionados se usan igual que en el pavloviano. El


estímulo incondicionado (EI) es el resultado que sigue a la respuesta (por ejemplo comida, descargas
eléctricas...)

También se usan estímulos condicionados (EC), estímulos relativamente inocuos sin significado o poder
específico, al menos al comienzo del entrenamiento.

El estímulo discriminativo es un estímulo neutro que indica cuándo la respuesta puede conducir o no a la
consecuencia deseada. Es decir, el estímulo discriminativo indica si el reforzador está disponible. Por oposición,
el estímulo delta es el estímulo que no estuvo presente cuando la respuesta fue reforzada, y por lo tanto no da
información sobre la disponibilidad del reforzador.

Respuestas

La respuesta incondicionada (RI) es la provocada por el EI de forma refleja y que viene determinada por él.

La respuesta condicionada (también llamada respuesta instrumental) suele ser distinta a la RI, siendo bastante
arbitraria.

Fases

Las fases de un experimento de condicionamiento instrumental son esencialmente las mismas que en el caso
del condicionamiento clásico:

• Adquisición
• Extinción

Programas de reforzamiento

Un programa de reforzamiento es una regla sobre la administración del reforzador. Existen programas de
reforzamiento de dos tipos: de razón (en función de la respuesta) y de intervalo (en función del tiempo), y cada
uno admite una administración fija o variable.

• En un programa de razón fija se administra un reforzador cada cierto número de respuestas. Un


programa RF1, por ejemplo, da un reforzador por cada respuesta. El RF2 da un reforzador por cada
dos respuestas.
• El programa de razón variable administra reforzadores cada cierto número de respuestas. Pero en este
caso, este número no es fijo, sino que varía alrededor de un promedio. RV3 da una respuesta cada 2, 3
ó 4 respuestas, aproximadamente (y aleatoriamente).
• Un programa de intervalo fijo implica un período siempre igual durante el cual no hay disponibilidad
del reforzador, período que se inicia justo después de la presentación de la respuesta criterio (es decir,
aquella de interés). El hecho de que el sujeto emita o no respuesta alguna durante el transcurso del
intervalo no modifica el ritmo de administración de los reforzadores.
• El programa de intervalo variable hace que el período durante el cual no está disponible el reforzador
cambie alrededor de un promedio.
Por lo general, los programas de tasa (razón) producen una adquisición más rápida, pero fácilmente extinguible
una vez suspendida la administración de reforzadores; y los de intervalo producen una adquisición más estable
y resistente a la extinción.

Tipos

Existen cuatro procedimientos o tipos de condicionamiento instrumental:

• Condicionamiento de recompensa
• Entrenamiento de omisión
• Castigo
• Escape y evitación (Aunque distintos, ambos se consideran dentro del mismo procedimiento, ya que
ambos implican la no ocurrencia del estímulo incondicionado aversivo.)

Entrenamiento de omisión

El entrenamiento de omisión es, en psicología, un tipo de condicionamiento instrumental.

Aunque en la literatura psicológica a menudo se ha usado el nombre de castigo negativo para este tipo de
condicionamiento, ese término ha sido relegado en aras de la claridad, ya que a menudo el término castigo
conducía a error.

El entrenamiento de omisión consiste en que el resultado que sigue a la respuesta dada por un individuo es la
ausencia de un estímulo apetitivo; es decir, la conducta da lugar a la omisión de la recompensa.

Un ejemplo de castigo negativo podría ser la mala costumbre de mandar a los niños a la cama sin cenar: la
consecuencia de su conducta es quitar un estímulo considerado como positivo o apetitivo (excepto, claro que
la cena no fuera del gusto del niño).

El entrenamiento de omisión se parece a la extinción en que ambos procedimientos dan lugar a la disminución
de la ejecución, si bien son muy diferentes en, por ejemplo, el grado de suspensión. Además todos los
experimentos en este sentido coinciden en considerarlos procedimientos semejantes, pero distintos.

Se le suele considerar como lo contrario al condicionamiento de recompensa.

Castigo

El castigo o castigo positivo es, en psicología un tipo de condicionamiento instrumental. El término castigo
positivo se hace innecesario al evitarse también el término castigo negativo, sustituido por el más adecuado y
claro de entrenamiento de omisión.

El castigo ocurre cuando la respuesta instrumental va seguida de un estímulo aversivo. Este estímulo aversivo
puede consistir, en los experimentos de laboratorio, en pequeñas descargas eléctricas o ruidos estridentes.
Aplicado a humanos, el castigo es habitual en la sociedad; no sólo sería castigo el físico o penal, también puede
ser psicológico.

El castigo es un procedimiento contrario al condicionamiento de recompensa y similar a la preparación aversiva


del condicionamiento clásico. El resultado es, como predice la ley del efecto, la disminución de la conducta.

También podría gustarte