Condicionamiento Operante

CONDICIONAMIENTO OPERANTE
(condicionamiento instrumental)
1. DEFINICIÓN:
Es el aprendizaje en el que una respuesta voluntaria se fortalece o debilita, segú n que sus
consecuencias sean positivas o negativas; es un aprendizaje segú n las consecuencias de su
acció n.
El término “operante” significa que: el organismo opera en su ambiente con el fin de producir
un resultado específico (deseable).
 Aprendizaje: es el proceso en virtud del cual se introducen cambios relativamente

permanentes en el comportamiento mediante la experiencia o la práctica
 Condicionamiento: adquisición de patrones de conducta bastante específicos en presencia de
estímulos bien definidos.
 CDN Clásico: tipo de aprendizaje en el cual un organismo aprende a transferir una
respuesta natural ante un estímulo a otro estímulo previamente neutral
2. HISTORIA:
A fines del siglo pasado (1898), mientras Pavlov estaba ocupado con sus perros, Edward Lee
Thorndike, psicó logo y pedagogo americano, realizaba experimentos para determinar la
inteligencia animal, sobre todo determinar como aprendían los gatos. Diseñ ó una “caja-acertijo”
donde se introdujo un gato hambriento y se colocó comida fuera de la caja, donde el animal
podría verla y olerla. El gato aprende a pisar una palanca para escapar de la caja y coger la
comida. Los gatos aprendieron a emitir la respuesta necesaria má s rapidamente, a medida que
aumentaba el nú mero de ensayos.
Ley del efecto: “las respuestas satisfactorias tiene má s posibilidades de repetirse que aquellas
que no son satisfactorias”.
Skinner, es considerado como el padre de los psicó logos interesados al CDN OP. Los animales de
la Caja de Skinner obtenían el alimento operando en el ambiente interno de la caja. La caja
contenía una palanca: si el animal (palomas, ratones) descubría por casualidad que la presió n de
una barra (palanca) le permitía obtener alimento, tenía tendencia a repetir esta operació n, cuyas
repeticiones eran registradas sobre una curva por un estilete unida a una palanca.
Segú n Skinner la variable dependiente a estudiar en todo comportamiento es la respuesta y su

frecuencia. El organismo actú a sobre el entorno y las consecuencias de su actuació n lo llevan a
modificar su comportamiento. É l repetirá o eliminará ciertas respuestas, siendo las acciones
reforzadas por sus consecuencias.
3. ELEMENTOS DEL CDN OPERANTE:
A. ESTÍMULO DISCRIMINATIVO (ED): Es aquel estímulo que adquiere la propiedad de

indicar la ocasió n o el momento para la emisió n de una respuesta o conducta.
Ej. Una señ al luminosa
B. RESPUESTA O CONDUCTA: Es una operante cualquiera, emitida por el sujeto. No es

evocada por un estímulo natural.
Ej. Apretar una palanca
 Características de la conducta operante:

 Opera sobre el medio ambiente y éste a su vez opera sobre la conducta
 Es una conducta voluntaria (involucra a los mú sculos estriados).
 Está bajo el control de estímulos llamados reforzadores.
 Parámetros de la conducta operante. El má s usado es la frecuencia.
 Frecuencia: se refiere a la cantidad de respuestas que se observan en una

unidad de tiempo.
Ej. Nº de golpes de un boxeador a su contrincante en 1 minuto
 Duración: Se refiere al tiempo que dura una conducta
Ej. el tiempo que el boxeador abraza a su contrincante.
 Intensidad: Se refiere a la energía o fuerza con que se hace una conducta.
Ej. en el box: el knock out
C. ESTIMULO REFORZADOR.
Es un evento cualquiera, o consecuencia de estímulo que sigue a una respuesta y cuyo efecto
es incrementar la frecuencia de la respuesta o la conducta.
 Ej. El alimento
4. ESQUEMA DEL CDN OPERANTE. (selecció n de una respuesta por refuerzo)
Ed ------------------------ R -------------------------- Er
(Estímulo discriminativo) (Respuesta) (Estimulo reforzador)
Antecedente Consecuente
Respuesta A .......
Luz Respuesta B alimento

(apretar la palanca)
Respuesta C ........
 A la secuencia Ed – r—Er se le llama la triple relación de contingencia y es fundamental

para el aná lisis y la descripció n funcional de la conducta y CDN OP
Contingencia (“algo que puede suceder”), se refiere a la relación temporal entre las
conductas y sus reforzadores, de manera que para que un estímulo refuerce positivamente una
conducta, deberá aparecer contingentemente en forma inmediata al emitir esta. Para que un
estímulo refuerce negativamente una conducta, deberá cesar contingentemente con la
aparición de la misma. Un buen manejo de contingencias es indispensable para el éxito en el
control de una conducta.
 La conducta se halla bajo el efecto de dos estímulos: antecedente (ED) y consecuente (Er).
 El Ed controla la conducta y el Er es consecuencia de la conducta.
 El principio fundamental en el CDN OP. es el REFORZAMIENTO.
5. PRINCIPIOS BASICOS:
Son aquellos que describen la relació n entre la conducta y los acontecimientos ambientales que
influyen sobre ella.
Estos principios son: reforzamiento, extinción y castigo.
5.1. REFORZAMIENTO:
El principio de reforzamiento se refiere al aumento que se produce en la frecuencia
de una respuesta a la que sigue inmediatamente ciertas consecuencias.
La consecuencia puede ser la presentació n de un reforzador (+) / (-).
5.1.1. REFORZAMIENTO POSITIVO: Es toda aquella consecuencia ambiental contingente

a una conducta cuya presencia aumenta la probabilidad de la misma. Es sumar
algo bueno contingente sobre la conducta deseada.
Ej. Obtener alimento, por presionar una palanca.
Obtener felicitaciones, al presentar un buen trabajo.
Aplicaciones:
 Incrementar conductas de baja frecuencia.
 Establecer nuevas conductas.
5.1.2. REFORZAMIENTO NEGATIVO: incremento en la frecuencia de una respuesta

por medio de la eliminació n de un evento aversivo. Se aprenden conductas inadecuadas,
las cuales cesan, cuando obtienen lo que quieren.
Es quitar algo malo contingente sobre la conducta deseada.
Ej. Comprarle al niñ o lo que pide, con lo cual el niñ o se calla (cesa la molestia)
Dejar de presionar la palanca, cesa la descarga eléctrica.
 El reforzamiento tiene varios componentes: Operante, reforzador (consecuencia)
 NIVEL OPERANTE: (conducta emitida)

Es la frecuencia con que se da una conducta antes del condicionamiento, o antes de una
intervenció n. También se le llama línea de base. Con esta medida podemos saber si
incrementamos o disminuimos una conducta.
 REFORZADOR:
Es cualquier estímulo que aumente la probabilidad de que se repita el comportamiento
precedente. Es todo estímulo (evento) que aumenta la probabilidad de la conducta a la
que sucede.
Un estímulo se define como reforzador por sus consecuencias. Es decir se define
exclusivamente mediante el efecto que tenga en una conducta, Rf (+) / Rf (-).
REFORZADOR POSITIVO (+):

 La presentació n de un reforzador permite aumentar la intensidad y frecuencia
de la conducta que la precede
Ej. Otorgar dinero, alimento o agua después de una respuesta, es más probable que
esa respuesta se repita.
REFORZADOR NEGATIVO (-):

 Estímulo cuya reducció n o eliminació n aumenta la probabilidad de que la
conducta vuelva a ocurrir.
Ej. Si los síntomas de la gripe se alivian cuando se ingiere medicinas, es má s
probable que se las tome (RF -) en otra vez para el alivio de síntomas.
El Rf (-) enseñ a que la realizació n de una acció n elimina un elemento negativo
que existe en el ambiente.
REFORZADOR PRIMARIO:
 Es aquel estímulo en la cual no se aprende su valor reforzante (no dependen del
aprendizaje). Es una recompensa que satisface una necesidad bioló gica (ej. el
hambre o la sed) y que funciona de manera natural.
Ej. alimentos, bebida, sexo, vestimenta.
REFORZADOR SECUNDARIO:
 Es aquel estímulo que se convierte en reforzador por su asociació n con un
reforzador primario (ej. el dinero, que nos permite conseguir alimento, que es un
reforzador primario). Son aprendidos a travez del proceso de socializació n.
 Ej. reforzadores sociales: elogios verbales, la atención, el contacto físico,
expresiones faciales, son reforzadores condicionados. Si dependen del aprendizaje
Es necesario recordar que:

 Un estímulo puede ser reforzador (+) para una persona y no para otra.
 Un estímulo es reforzador (+) bajo algunas circunstancias o algú n momento.
PROGRAMAS DE REFORZAMIENTO:
Es el nombre que se da al programa con el que se elige la respuesta o respuestas que será n
reforzadas.
 Reforzamiento continuo: Es el programa en el que se refuerza una respuesta cada
vez que ésta ocurra.
 Reforzamiento intermitente: No se refuerza una respuesta cada vez que se presenta
sino solamente se refuerzan algunas ocurrencias de una respuesta.
PROGRAMA DE RAZÓN
En el cual el reforzamiento es contingente a la emisió n de un cierto número de
respuestas. Pueden ser de dos tipos:
 PROGRAMA DE RAZÓN FIJA: Reforzamiento de la respuesta correcta luego de
un nú mero fijo de respuestas correctas.
RF:1 especifica que solo se necesita de una sola respuesta para que se dé el
reforzador. Ej. el pago del trabajo a destajo.
RF: 10, se reforzará cada 10 respuestas. $1 c/10 cajones de fruta recogidas.
 PROGRAMA DE RAZÓN VARIABLE: Especifica que el reforzamiento ocurrirá

después de un cierto nú mero de respuestas, sin embargo ese nú mero varía
impredeciblemente de una ocasió n a otra. Los sujetos no hacen pausa después
del reforzamiento y hay un elevado % de respuestas durante un largo periodo.
Ej. La maquina tragamoneda o los juegos de azar. Quizá el jugador gane pero no
sabe cuando.
PROGRAMA DE INTERVALO
En el cual se da el reforzamiento en base al lapso de tiempo que pasa antes de que
se pueda reforzarse una conducta. Son de dos tipos:
 PROGRAMA DE INTERVALO FIJO: se refuerza a los sujetos por la primera
respuesta correcta emitida después de un cierto tiempo. Aprenden a esperar un
periodo determinado antes de responder y pueden realizar respuestas poco
antes de que haya transcurrido el tiempo establecido.
Ej. receta de cocina: “déjelo en el horno 45 minutos”, pero lo veremos antes.
 PROGRAMA DE INTERVALO VARIABLE: refuerza las respuestas correctas

después de duraciones variables. Puede darse después de 6 minutos, el siguiente
después de 4’, el siguiente a 5’.
Los sujetos aprenden a emitir un patró n lento y constante de respuestas
procurando no ser tan lentos para no perder todos los premios.
Ej. exámenes aplicados a intervalos impredecibles, lo que obliga a estudiar con
igual intensidad todo el tiempo a diferencia de exámenes a intervalo fijo.
PRINCIPIO DE PREMACK (“ley de la abuelita”):
“En cualquier par de respuestas o actividades en que se ocupe un individuo, la más
frecuente reforzará a la menos frecuente.
Es posible incrementar una conducta de baja probabilidad utilizando como
reforzador de esa conducta una conducta de alta probabilidad de ocurrencia.
Ej. “niños podréis ir a jugar cuando hayáis hecho las tareas ... ”. En muchos niños
se ve que el jugar con los amigos tiene una frecuencia mayor que el estudiar. Si la
conducta de mayor frecuencia (jugar con los amigos) se hace contingente sobre la
conducta de menor frecuencia (estudiar), se incrementará la conducta de menor
probabilidad.
5.2. MOLDEAMIENTO (Aproximación sucesiva, Shaping):

Procedimiento que consiste en reforzar diferencialmente por aproximaciones sucesivas,
(paso pequeñ os) hasta lograr la conducta terminal deseada.
Puede ser usado cuando la conducta deseada no ocurre u ocurre con un nivel operante bajo,
o cuando la conducta deseada sea tan compleja que no está dentro del repertorio del
individuo
Procedimiento: el proceso incluye varios pasos:
 Se define la conducta terminal deseada. Ej. Estimular el habla en los niñ os.
 Se elige una conducta que existe en el repertorio del sujeto y se refuerzan los cambios
pequeñ os que se dan en esa conducta, hasta que poco a poco se logre la conducta
objetivo.
 Se elige el reforzador adecuado para la persona a ser entrenada.
 Las respuestas que se aproximan al objetivo final son reforzadas (ej. sonidos, silabas).
 Se instiga a que la conducta sea cada vez má s parecida a la terminal mediante el
principio de reforzamiento diferencial.
 Las respuestas emitidas que no se aproximan al objetivo (gritar, llorar) son extinguidas
durante el proceso.
5.3. ENCADENAMIENTO
Procedimiento que consiste en el reforzamiento combinado de conductas simples ya
establecidos en el repertorio del individuo para formar comportamientos má s complejos.
Enseñ a al individuo a ejecutar la secuencia como una conducta unitaria.
Procedimiento:
 Definir el comportamiento meta o la conducta objetivo
 Seleccionar las subhabilidades que la persona tiene
 Reforzar cuando se dan las subhabilidades hasta formar la cadena completa.
5.4 EXTINCION
Es el procedimiento por el cual un comportamiento que ha sido previamente reforzado NO
ES MÁS REFORZADO, por consiguiente, disminuye su frecuencia hasta desaparecer y se
extingue.
La extinció n difiere del castigo en que ninguna consecuencia sigue a la respuesta.
Ej. Presionar la palanca y no se da alimento.
No comprar golosinas cuando el niñ o llora para conseguirlos.
 Ventajas:
 Reduce el comportamiento de forma efectiva.
 Efectos a largo plazo.
 No se requiere estímulos aversivos.
5.5 CASTIGO
Procedimiento que consiste en disminuir la probabilidad de una respuesta haciéndola
seguir de un estímulo punitivo (aversivo) o eliminando un reforzador positivo.
Estimulo aversivo: estimulo desagradable o doloroso.
5.5.1. CASTIGO POSITIVO (por aplicación)

Es la presentació n de un estímulo aversivo después de una respuesta (Conducta)
negativa y que disminuye la frecuencia de ésta.
 Se elige la conducta negativa a ser extinguida
 Elecció n de los estímulos (eventos) aversivos adecuados para la persona:
 Primarios, incondicionados: shock eléctrico, luces, ruido, golpe
 Secundarios: gritos, NO, gestos, ademanes, amenazas.
 Es recomendable usarlo só lo si han fracasado otros procedimientos.
5.5.2. CASTIGO NEGATIVO (por supresión)

Es la eliminació n de un estímulo positivo después de una respuesta negativa y que
va a disminuir la frecuencia de ésta. Tipos:
 Tiempo fuera (Time out): tipos: parcial o total
Ventajas: No ocasiona dolor físico y es facil de ejecutar.
 Costo de Respuesta: Es la pérdida de reforzadores positivos como sanció n por

no haber hecho algú n trabajo, esfuerzo o una conducta positiva previamente
establecida.
Ventaja: no quita a la persona la posibilidad de recibir reforzadores
positivos para comportamientos deseables.
¿Porqué un castigo PUEDE NO FUNCIONAR?

Para que un castigo sea efectivo, debe utilizarse apropiadamente:
1) Debe ser rá pido, los niñ os que se portan mal deben ser castigados inmediatamente, de
manera que sepan que lo que hicieron está mal.
2) Debe ser suficiente, sin ser cruel. Debe mantenerse un nivel constante de castigo y no dar un
castigo má s severo a cada infracció n.
3) Debe ser consistente o inevitable. Se debe castigar todas y cada una de las veces que se
porte mal, de otra manera la conducta persistirá .
Naturaleza del Aplicación Remoción o supresión

Estimulo
Reforzamiento positivo Castigo por supresión
Positivo Ej. otorgar un aumento por el buen Ej. retirar el juguete favorito después
Desempeñ o De una mala conducta.
Resultado: aumento en la frecuencia Resultado: disminución de la frecuencia
de la respuesta (buen desempeñ o) de la respuesta (mala conducta)
Castigo por aplicación Reforzamiento negativo

Negativo Ej. dar palmadas después de una Ej. poner fin a una jaqueca ingiriendo una
mala conducta Aspirina.
Resultado: disminució n de la frecuencia Resultado: aumento en la frecuencia de la
de la conducta (mala conducta) respuesta (ingerir aspirinas)
Augusto Mosquera Del Aguila

Psiquiatra – Psicoterapeuta
DAMOC - HHV /marzo2210
Diferencias entre:
Reforzamiento negativo: Fortalece la conducta al eliminar algo desagradable del ambiente.
Castigo: añ ade algo desagradable al ambiente y, por lo tanto tiende a debilitar una conducta
¿Porqué el castigo no funciona?

Para que un castigo sea efectivo, debe utilizarse apropiadamente:
4) Debe ser rá pido, los niñ os que se portan mal deben ser castigados inmediatamente, de manera
que sepan que lo que hicieron está mal.
5) Debe ser suficiente, sin ser cruel. Debe mantenerse un nivel constante de castigo y no dar un
castigo má s severo a cada infracció n.
6) Debe ser consistente o inevitable. Se debe castigar todas y cada una de las veces que se porte
mal, de otra manera la conducta persistirá .
CASTIGO:
Ventajas:
 Cambiar la conducta rá pidamente.
 Puede detener una conducta autodestructiva
Desventajas (Skinner, 1953):

 El castigo solo suprime la conducta. No provoca el desaprendizaje de la conducta. Si
desaparece el castigador o la amenaza de castigo, es probable que la conducta negativa
vuelva a darse.
 No enseñ a una conducta má s deseable y no es buena técnica para crear cambios
conductuales a largo plazo.
 Produce emociones desagradables (miedo, ansiedad) que interfieren con el aprendizaje
de la conducta que queremos enseñ ar.
 Enseñ a conductas agresivas indeseables
Si es necesario emplear castigo para suprimir una conducta indeseable, se debe eliminar cuando
ocurra una conducta má s deseable. (para reforzar de manera negativa esa conducta). Así mismo
debe reforzarse con un RF (+), elogio, recompensa para fortalecer la conducta deseada.
Entrenamiento de evitación: aprendizaje de una conducta deseable a fin de evitar que ocurra una
condició n desagradable. Se ha estudiado en animales con dispositivos como una luz o un timbre par
evitar algú n castigo. No es ú til cuando aprendemos a llevar un paraguas cuando parece que va a
llover o no beber botellas etiquetadas con la palabra “veneno”.
No sabremos si algo reforzará o castigará hasta que veamos que se incrementa o disminuye la
ocurrencia de una respuesta. Un dulce puede ser reforzante pero si se come en exceso se puede
volver neutral o, incluso, un castigo.

Condicionamiento Operante

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Condicionamiento Operante

Cargado por

Copyright:

Formatos disponibles

CONDICIONAMIENTO OPERANTE

 Aprendizaje: es el proceso en virtud del cual se introducen cambios relativamente

Segú n Skinner la variable dependiente a estudiar en todo comportamiento es la respuesta y su

3. ELEMENTOS DEL CDN OPERANTE:

A. ESTÍMULO DISCRIMINATIVO (ED): Es aquel estímulo que adquiere la propiedad de

B. RESPUESTA O CONDUCTA: Es una operante cualquiera, emitida por el sujeto. No es

 Características de la conducta operante:

 Frecuencia: se refiere a la cantidad de respuestas que se observan en una

4. ESQUEMA DEL CDN OPERANTE. (selecció n de una respuesta por refuerzo)

Luz Respuesta B alimento

 A la secuencia Ed – r—Er se le llama la triple relación de contingencia y es fundamental

5.1.1. REFORZAMIENTO POSITIVO: Es toda aquella consecuencia ambiental contingente

5.1.2. REFORZAMIENTO NEGATIVO: incremento en la frecuencia de una respuesta

 El reforzamiento tiene varios componentes: Operante, reforzador (consecuencia)

 NIVEL OPERANTE: (conducta emitida)

REFORZADOR POSITIVO (+):

REFORZADOR NEGATIVO (-):

Es necesario recordar que:

 PROGRAMA DE RAZÓN VARIABLE: Especifica que el reforzamiento ocurrirá

 PROGRAMA DE INTERVALO VARIABLE: refuerza las respuestas correctas

5.2. MOLDEAMIENTO (Aproximación sucesiva, Shaping):

5.5.1. CASTIGO POSITIVO (por aplicación)

5.5.2. CASTIGO NEGATIVO (por supresión)

 Costo de Respuesta: Es la pérdida de reforzadores positivos como sanció n por

¿Porqué un castigo PUEDE NO FUNCIONAR?

Naturaleza del Aplicación Remoción o supresión

Castigo por aplicación Reforzamiento negativo

Augusto Mosquera Del Aguila

¿Porqué el castigo no funciona?

Desventajas (Skinner, 1953):

También podría gustarte