Está en la página 1de 5

Condicionamiento operante

En psicologa, el condicionamiento operante es una forma de aprendizaje en la que la consecuencia (el


estmulo reforzador) es contingente a la respuesta que previamente ha emitido el sujeto. El
condicionamiento operante implica la ejecucin de conductas que operan sobre el ambiente.

El condicionamiento operante es un tipo de aprendizaje asociativo que tiene que ver con el desarrollo de
nuevas conductas en funcin de sus consecuencias, y no con la asociacin entre estmulos y conductas
reflejas existentes como ocurre en el condicionamiento clsico. Los principios del condicionamiento
operante fueron desarrollados por B.F. Skinner, quien recibi la influencia de las investigaciones de Pavlov
y de Edward L. Thorndike.

El nombre condicionamiento operante es el que dio Skinner, aunque hoy se prefiere el de
condicionamiento instrumental, por ser ms descriptivo. Roger Tarpy los equipara, decantndose por el
trmino instrumental, especialmente para el aprendizaje humano, aunque para todos en general. Para l
ambos son iguales en tanto en cuanto ambos dan lugar a consecuencias reforzantes. Desde el punto de
vista histrico, el trmino de condicionamiento operante se ha utilizado para hacer referencia a
situaciones experimentales en las que los sujetos actan a su propio ritmo, en contraposicin a recibir
ensayos directos. Algunos defienden en esto la separacin de ambos trminos que por lo dems se
considera poco operativa.

Aprendizaje por condicionamiento operante

En el condicionamiento operante las conductas se emiten espontneamente y sus consecuencias
determinan el aprendizaje. Las consecuencias agradables tienden a fortalecer una conducta. En cambio,
las consecuencias desagradables tienden a debilitar una conducta contingente

Un ejemplo claro del aprendizaje por condicionamiento operante ocurre en los perros que halan la correa
cuando salen a pasear. El perro hala la correa y su propietario lo sigue, hasta que llegan a donde el perro
quiere ir. Entonces, la conducta (inapropiada) de halar la correa se fortalece porque el perro consigue lo
que quera.

Por el mismo proceso de aprendizaje, aunque con consecuencias negativas, algunos nios aprenden que
no deben tocar la estufa cuando est caliente. Cuando tocan la estufa se queman la mano. Entonces, la
conducta de tocar la estufa cuando est encendida desaparece porque tiene consecuencias desagradables.

Thorndike comenz con sus denominadas Caja Problema, jaulas por las que se puede escapar si se tira de
una polea que hay en el interior. Meti en una de estas cajas a un gato hambriento. El gato poda ver que
fuera de la caja haba comida, pero no poda alcanzarla. Lo que el gato comienza a hacer son movimientos
azarosos hasta que casualmente tira de la polea que abre la jaula. Cada vez que Thorndike meta al gato en
la jaula, tardaba menos en salir. Esto se deba a que se estaba produciendo un condicionamiento operante:
la conducta de tirar de la polea estaba siendo reforzada por su consecuencia (la apertura de la caja y la
obtencin de la comida). Esta conducta, al ser reforzada, se convierte en la conducta ms probable en un
futuro cuando las circunstancias sean iguales.

Tipos de condicionamiento operante

1. Reforzamiento. Cualquier adicin (para aumentar la frecuencia del comportamiento) o retiro
(para disminuir la frecuencia del comportamiento) de algn estimulo o artefacto como
consecuencia de cualquier conducta.

Por ejemplo, tu perro se sienta y le das comida cuando lo hace. Tu perro se sienta cada vez con ms
frecuencia porque la comida ha funcionado como estmulo reforzador. Esto se conoce como reforzamiento
positivo porque la adicin de una consecuencia positiva (comida) aumenta la frecuencia de la conducta
(sentarse).

Ahora imagina que tu perro tiene miedo de la gente. Una persona se le acerca y l ladra agresivamente. La
persona se aleja y tu perro deja de sentir miedo. Entonces, aprende que ladrando agresivamente puede
hacer que la gente que teme se aleje. Esto se conoce como reforzamiento negativo porque el retiro de un
estimulo aversivo (la gente) aumenta la frecuencia de la conducta (ladrar agresivamente).

2. Castigo. Comportamiento usado para extinguir o anular algn comportamiento de algn
organismo.

Imagina que tu perro se acerca a un extrao al que no le gustan los perros, y esta persona le da una
patada. Entonces, tu perro aprende a evitar a las personas. Esto se conoce como castigo positivo porque la
adicin de algo (la patada) disminuye la frecuencia de la conducta (acercarse a las personas). Este tipo de
castigo no es recomendable en el adiestramiento porque tiene consecuencias adversas que implican dao
fsico y/o emocional del organismo.

Un caso diferente ocurre si tu perro est jugando contigo al tira y afloja. T tiras del extremo de un trapo,
mientras tu perro tira del otro extremo. En su entusiasmo por morder el trapo, tu perro te muerde la mano
por lo que terminas el juego y te vas. Entonces tu perro aprende a no morderte cuando juegan. Esto se
conoce como castigo negativo, porque el retiro de algo (el juego) disminuye la frecuencia de la conducta
(morder tu mano).

3. Extincin. Es la disminucin de la frecuencia de una conducta aprendida, que ocurre cuando dicha
conducta no tiene consecuencias. Es decir que dejan de existir las consecuencias que antes
reforzaban la conducta.

Imagina que cuando tu perro era un cachorro saludaba a las personas saltando sobre ellas, porque lo
acariciaban y jugaban con l. Entonces aprendi que esta es la manera correcta de saludar a la gente. Un
buen da, la gente deja de acariciarlo y jugar con l cuando salta. En cambio, le dan la espalda y lo ignoran.
Con el tiempo tu perro deja de saltar para saludar a las personas. Esto ocurre porque la conducta
aprendida (saltar sobre las personas) deja de tener consecuencias reforzantes y, entonces, se produce la
extincin de la conducta.

4. Discriminacin y control por el estmulo. Es el aumento de la frecuencia de una conducta en
presencia de un estmulo, pero no en presencia de otros.

Estrategias de modificacin de conducta operante
Existen una variedad de estrategias desarrolladas para modificar, establecer y desvanecer la conducta
dentro del paradigma operante. Por ejemplo:

Moldeamiento
Encadenamiento
Entrenamiento de omisin
Castigo
Control de respuesta
Tiempo fuera

Moldeamiento

El moldeamiento es una estrategia psicolgica con la cual se pretende aumentar la frecuencia de una conducta
en un individuo que no la realiza o que no la hace con tanta frecuencia como se deseara. Sirve para establecer
conductas complejas que aun no existen en el repertorio comportamental de un individuo. Consiste en reforzar
en aproximaciones sucesivas, conductas que el sujeto emita que se asemejen a la conducta meta.

El moldeamiento se utiliza cuando el sujeto (frecuentemente nios o personas con deficiencia mental) no
saben realizar la conducta porque les resulta compleja. Por ello, no se ofrece un refuerzo o reforzador positivo
cuando consigue hacer la accin. En su lugar, la conducta se descompone en sus partes ms simples y se
escalona su aprendizaje, tomando en un primer lugar las ms elementales y avanzando hacia las ms
complejas. As, se va reforzando una a una, primero las elementales y progresivamente, las ms complicadas,
apoyadas en las anteriores.

Gracias a esta estrategia, el paciente va aprendiendo poco a poco una conducta originariamente muy compleja
y fuera de su repertorio.

Por ejemplo, si un profesor est ensendole a un alumno a escribir el numeral "1", puede empezar por
reforzarle cuando haga una lnea curva. De todas las lneas curvas que haga, algunas sern ms rectas y ms
verticales que otras. Ya habiendo establecido las lneas curvas, el maestro empezar a reforzar las que sean
ms rectas, y as sucesivamente.

Tiempo fuera

El Tiempo Fuera es una estrategia psicolgica de intervencin, muy utilizada con nios, para conseguir eliminar
una conducta inadecuada.

Con el Tiempo Fuera aplicamos un entrenamiento de omisin (le quitamos algo que le gusta) al privar al nio
de todo tipo de reforzador que poda recibir en su contexto, aislndolo durante un periodo breve de tiempo
(de 1 a 5 minutos) cuando ha realizado una conducta que deseamos eliminar.

Un ejemplo de esta tcnica, sera que, ante un comportamiento agresivo de un nio para quitarle el juguete a
un compaero, le llevsemos al pasillo y le dejsemos ah, quieto y sin poder hacer nada. Esta tcnica ha de ser
explicada previamente al nio; se le ha de decir, desapasionadamente (para que no obtenga el reforzador de la
atencin) que su comportamiento no ha estado bien, y que le vamos a dejar fuera para que piense en lo que ha
hecho.

Condicionamiento instrumental

En psicologa, el condicionamiento instrumental es una forma de aprendizaje en la que la consecuencia (el
estmulo reforzador) es contingente a la respuesta que previamente ha emitido el sujeto. Se le llam en
principio "operante" porque el organismo opera sobre el medio para recibir una consecuencia.

El nombre que B.F. Skinner dio a este tipo de aprendizaje fue condicionamiento operante, aunque hoy se
prefiere el de condicionamiento instrumental, por ser ms descriptivo, aunque hay quien ve algn matiz
distintivo desde posiciones puramente conductistas. Fue l precisamente el primero en distinguir entre este
tipo de condicionamiento y el condicionamiento clsico.

Distincin entre condicionamiento clsico y operante

En el condicionamiento clsico la asociacin se da entre un estmulo condicionado y uno
incondicionado.
En el condicionamiento instrumental, la asociacin se da entre las respuestas y las consecuencias que
se derivan de ellas.
En el condicionamiento clsico, el estmulo incondicionado no depende de la respuesta del sujeto,
mientras que, en el operante, las consecuencias dependen de la respuesta del sujeto.
En el condicionamiento clsico, la respuesta del sujeto es involuntaria, mientras que en el
instrumental es generalmente voluntaria.
La distincin entre ambos condicionamientos para los conductistas ms radicales es tanto operativa como de
procesos:

Operativa, ya que el reforzador depende de la respuesta, de la conducta, por lo tanto.
Procesal, estando implicado en un caso el sistema nervioso autnomo y en el otro el sistema nervioso
central. ESTA DIFERENCIA NO HA SIDO DEMOSTRADA EXPERIMENTALMENTE DE MANERA PBLICA ANTE LA COMUNIDAD
CIENTFICA PERO LA EVIDENCIA ENCONTRADA EN ESTA INVESTIGACIN EXPONE CLARAMENTE QUE NO SOLO SE TUVO QUE
HABER LOGRADO DEMOSTRAR EXPERIMENTALMENTE, SINO QUE LOS RESULTADOS OBTENIDOS PROCESALMENTE
SOBRE RESPUESTAS EMITIDAS POR EL SISTEMA NERVIOSO AUTNOMO SON ALARMANTEMENTE EFICACES, SI BIEN LOS
FINES CON LOS QUE SE HAN UTILIZADO SON TOTALITARIOS, PREPSTEROS Y PROTERVOS.

Estmulos

Lo verdaderamente importante en este tipo de condicionamiento es la respuesta generada ante el estmulo.
Cualquier proceso de condicionamiento instrumental admite el uso de estmulos que en condicionamiento
pavloviano podran clasificarse como condicionados, incondicionados o neutros, ya que el anlisis no se
concentra en ellos sino en las consecuencias de las respuestas, que son las que determinan la probabilidad de
que la conducta se repita o no.

En el condicionamiento instrumental los estmulos incondicionados se usan igual que en el pavloviano. El
estmulo incondicionado (EI) es el resultado que sigue a la respuesta (por ejemplo comida, descargas
elctricas...)

Tambin se usan estmulos condicionados (EC), estmulos relativamente inocuos sin significado o poder
especfico, al menos al comienzo del entrenamiento.

El estmulo discriminativo es un estmulo neutro que indica cundo la respuesta puede conducir o no a la
consecuencia deseada. Es decir, el estmulo discriminativo indica si el reforzador est disponible. Por oposicin,
el estmulo delta es el estmulo que no estuvo presente cuando la respuesta fue reforzada, y por lo tanto no da
informacin sobre la disponibilidad del reforzador.

Respuestas

La respuesta incondicionada (RI) es la provocada por el EI de forma refleja y que viene determinada por l.

La respuesta condicionada (tambin llamada respuesta instrumental) suele ser distinta a la RI, siendo bastante
arbitraria.

Fases

Las fases de un experimento de condicionamiento instrumental son esencialmente las mismas que en el caso
del condicionamiento clsico:

Adquisicin
Extincin

Programas de reforzamiento

Un programa de reforzamiento es una regla sobre la administracin del reforzador. Existen programas de
reforzamiento de dos tipos: de razn (en funcin de la respuesta) y de intervalo (en funcin del tiempo), y cada
uno admite una administracin fija o variable.

En un programa de razn fija se administra un reforzador cada cierto nmero de respuestas. Un
programa RF1, por ejemplo, da un reforzador por cada respuesta. El RF2 da un reforzador por cada
dos respuestas.
El programa de razn variable administra reforzadores cada cierto nmero de respuestas. Pero en este
caso, este nmero no es fijo, sino que vara alrededor de un promedio. RV3 da una respuesta cada 2, 3
4 respuestas, aproximadamente (y aleatoriamente).
Un programa de intervalo fijo implica un perodo siempre igual durante el cual no hay disponibilidad
del reforzador, perodo que se inicia justo despus de la presentacin de la respuesta criterio (es decir,
aquella de inters). El hecho de que el sujeto emita o no respuesta alguna durante el transcurso del
intervalo no modifica el ritmo de administracin de los reforzadores.
El programa de intervalo variable hace que el perodo durante el cual no est disponible el reforzador
cambie alrededor de un promedio.
Por lo general, los programas de tasa (razn) producen una adquisicin ms rpida, pero fcilmente extinguible
una vez suspendida la administracin de reforzadores; y los de intervalo producen una adquisicin ms estable
y resistente a la extincin.

Tipos

Existen cuatro procedimientos o tipos de condicionamiento instrumental:

Condicionamiento de recompensa
Entrenamiento de omisin
Castigo
Escape y evitacin (Aunque distintos, ambos se consideran dentro del mismo procedimiento, ya que
ambos implican la no ocurrencia del estmulo incondicionado aversivo.)

Entrenamiento de omisin

El entrenamiento de omisin es, en psicologa, un tipo de condicionamiento instrumental.

Aunque en la literatura psicolgica a menudo se ha usado el nombre de castigo negativo para este tipo de
condicionamiento, ese trmino ha sido relegado en aras de la claridad, ya que a menudo el trmino castigo
conduca a error.

El entrenamiento de omisin consiste en que el resultado que sigue a la respuesta dada por un individuo es la
ausencia de un estmulo apetitivo; es decir, la conducta da lugar a la omisin de la recompensa.

Un ejemplo de castigo negativo podra ser la mala costumbre de mandar a los nios a la cama sin cenar: la
consecuencia de su conducta es quitar un estmulo considerado como positivo o apetitivo (excepto, claro que
la cena no fuera del gusto del nio).

El entrenamiento de omisin se parece a la extincin en que ambos procedimientos dan lugar a la disminucin
de la ejecucin, si bien son muy diferentes en, por ejemplo, el grado de suspensin. Adems todos los
experimentos en este sentido coinciden en considerarlos procedimientos semejantes, pero distintos.

Se le suele considerar como lo contrario al condicionamiento de recompensa.

Castigo

El castigo o castigo positivo es, en psicologa un tipo de condicionamiento instrumental. El trmino castigo
positivo se hace innecesario al evitarse tambin el trmino castigo negativo, sustituido por el ms adecuado y
claro de entrenamiento de omisin.

El castigo ocurre cuando la respuesta instrumental va seguida de un estmulo aversivo. Este estmulo aversivo
puede consistir, en los experimentos de laboratorio, en pequeas descargas elctricas o ruidos estridentes.
Aplicado a humanos, el castigo es habitual en la sociedad; no slo sera castigo el fsico o penal, tambin puede
ser psicolgico.

El castigo es un procedimiento contrario al condicionamiento de recompensa y similar a la preparacin aversiva
del condicionamiento clsico. El resultado es, como predice la ley del efecto, la disminucin de la conducta.