Está en la página 1de 7

TEMA 4. EL CONDICIONAMIENTO OPERANTE.

1. Introducción. Res

2. Elementos del condicionamiento operante.


3. Principios básicos del condicionamiento
operante.
4. Tipos de condicionamiento operante.
5. Relación respuesta-refuerzo.
6. Variables que influyen en el condicionamiento
operante.
7. Programas de reforzamiento.
N

1
1. INTRODUCCIÓN.

Existe otro tipo de aprendizaje asociativo denominado, aprendizaje operante. En dicho


aprendizaje, la conducta está controlada por sus consecuencias (R-Er).
Se trata de un aprendizaje donde el individuo realiza la conducta para conseguir algo que le
interesa o para suprimir y evitar algo que le molesta. Es decir, la conducta del individuo está
destinada a un objetivo o meta.
Tiene cierta vinculación con el condicionamiento clásico:

 EI y Er son estímulos biológicamente significativos. Sin embargo, son sucesos que tienen
una función diferente. EI es contingente al EC que le precede y el sujeto no puede
controlar su aparición. El Er es contingente a la R que también le precede, pero si puede
controlar su aparición o no.
 Así, la respuesta condicionada clásicamente está controlada por un estímulo antecedente
(EC-EI) y la respuesta operante por un estímulo consiguiente (Er).

2. ELEMENTOS DEL CONDICIONAMIENTO OPERANTE.


El condicionamiento operante es un tipo de aprendizaje asociativo en el que el sujeto establece
una relación entre la conducta y sus consecuencias en un contexto o en presencia de un estímulo
ambiental que señala la posibilidad del refuerzo.
Es decir, consta de tres elementos: la respuesta, el estímulo reforzador o refuerzo y el contexto
donde ocurren estos sucesos o estímulo discriminativo (Ed -R- Er).

La respuesta operante: es una respuesta que se define en función de los efectos que tiene
sobre el ambiente. Es una acción que controla el estímulo reforzador ya que puede hacerla
aparecer o desaparecer.

Mediante el condicionamiento operante se puede aprender una respuesta nueva que no existía en
el repertorio del organismo, se puede potenciar una respuesta ya existente o se pueden cambiar
algunos parámetros como la latencia, frecuencia, duración...
El estímulo reforzador (Er): es cualquier estímulo que sigue a la respuesta y que aumenta su
fuerza (frecuencia, probabilidad, etc.).

Un reforzador se define en función de los efectos que tiene sobre la respuesta.

 Reforzador positivo (Er+): la emisión de la R da lugar a algo que agrada al sujeto.


Relación de contingencia positiva entre R y Er.
 Reforzador negativo (Er-): la emisión de la R evita algo que desagrada al sujeto.
Relación de contingencia negativa entre R y Er.
Otra clasificación de los refuerzos:

 Refuerzos primarios o incondicionados: estímulos biológicamente relevantes cuya


capacidad reforzante es innata (agua, comida...).
 Refuerzos secundarios o condicionados: son aquellos estímulos que adquieren valor
reforzante a través de la experiencia (dinero, aplausos, alabanzas, mi canción favorita...).

El estímulo discriminativo (Ed): estímulo que señala la ocasión para recibir un refuerzo. Se
encuentra en el contexto de la situación. Por ejemplo (aparición del profesor en clase, la sirena de
la ambulancia, la cruz verde de la farmacia...).

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3. PRINCIPIOS BÁSICOS DEL CONDICIONAMIENTO OPERANTE.

a. Adquisición.
La emisión de una respuesta seguida de un estímulo reforzador da lugar a la adquisición de una
respuesta nueva o poco frecuente.

El reforzamiento de la un R produce una asociación entre dicha respuesta y el reforzador que


aumenta la probabilidad de que la respuesta se repita.
Cuanto más emparejamientos haya entre los dos elementos, mayor será la fuerza de la asociación
y mayor será la fuerza de la R (por ejemplo: presionar palanca y obtener comida).

Para aprender una nueva conducta es útil la técnica del moldeamiento: reforzamiento diferencial
de aquellas R que suponen aproximaciones sucesivas (respuestas distales, intermedias y
proximales) a la R final y no reforzamiento de las R iniciales en la jerarquía (por ejemplo:
experimento con Sniffy).
b. Extinción.

La extinción consiste en la retirada del refuerzo, como consecuencia de ello, se interrumpe la


relación previa R-Er y se produce una disminución progresiva de la fuerza de la respuesta.

Es el fenómeno opuesto a la adquisición.

La respuesta operante puede desaparecer durante un tiempo, pero reaparecer de forma


espontánea cuando se expone al sujeto a la misma situación en la que fue reforzado. Esto se
denomina recuperación espontánea de la R.
La velocidad de la extinción depende del programa de reforzamiento aplicado en la fase de
adquisición.
c. Discriminación.

En el entrenamiento en discriminación, se presentan varios estímulos y sólo uno de ellos señaliza


la disponibilidad del reforzador. Nuestra conducta está bajo el control de un estímulo Ed. Por
ejemplo: luz verde taxi, carteles, señales tráfico...

d. Generalización.
Es el fenómeno contrario a la discriminación.
Cuando se ha establecido una respuesta operante ante un determinado Ed, otros estímulos
semejantes también adquieren la capacidad de señalizar la disponibilidad del Er o de controlar la
R.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
4. TIPOS DE CONDICIONAMIENTO OPERANTE.

Res

 Refuerzo positivo: a quien ejecuta la conducta que estamos reforzando, le damos algo
positivo, le pasa algo bueno como consecuencia de esa conducta.
 Refuerzo negativo: a quien ejecuta la conducta que estamos reforzando, le quitamos algo
malo, algo malo que le pasaba le deja de pasar como consecuencia de esa conducta.
 Castigo positivo: a quien ejecuta la conducta que queremos eliminar, le damos algo malo,
algo malo le pasa como consecuencia de esa conducta.
 Castigo negativo: a quien ejecuta la conducta que queremos eliminar, le quitamos algo
bueno, algo bueno que le pasaba, le deja de pasar como consecuencia de esa conducta.
Ejercicio de condicionamiento:

 Un niño/a se porta bien en clase y le dejamos que tenga más recreo. N


 Un alumno/a llega tarde a clase y le mandamos trabajo extra para casa.
 Un amigo/a hace algo que consideremos bueno hacia nosotros, y le compramos un
regalo.
 Un niño/a se porta bien en clase y le permitimos ese día que no se coma las
verduras.
 Nuestro hijo/a se porta mal en el colegio y le dejamos sin postre.

4
5. RELACIÓN RESPUESTA-ESFUERZO.
Hay dos variables que influyen en la relación respuesta-refuerzo:

1. La relación temporal respuesta-refuerzo: hace referencia al tiempo que transcurre desde la R


hasta la consecución del refuerzo. Tanto los animales como los humanos prefieren el refuerzo
inmediato al demorado. El refuerzo inmediato facilita la adquisición de la respuesta operante y el
demorado la retrasa. La relación de contigüidad temporal asegura que el sujeto no realice otras
respuestas entre la R adecuada y el refuerzo, que interfieran en la relación. Esto también ocurre
para el castigo.
2. La relación causal o relación de contingencia respuesta-refuerzo: hace referencia a la
relación de probabilidad que hay entre la R y la consecución del refuerzo.

 Relación de contingencia positiva (p1>p2). Más probabilidad de refuerzo ante la R.


 Relación de contingencia negativa (p1<p2). Más probabilidad de refuerzo si no hay R.
 No hay relación de contingencia (p1=p2). Misma probabilidad de refuerzo antela R que
ante no R.

6. VARIABLES QUE INFLUYEN EN EL CONDICIONAMIENTO OPERANTE.

a. Nivel de motivación interna.

Cuanto mayor es el nivel de motivación interna o nivel de impulso, más rápida es la adquisición
y mayor es la tasa de respuesta conseguida. Por ejemplo: en experimentación, privar de comida o
bebida al animal.
b. Características de la respuesta.

No todas las respuestas se condicionan con la misma facilidad. Hay algunas respuestas que se
condicionan mejor que otras. Esta en función de la relación de relevancia entre respuesta y
refuerzo. En función de si la respuesta a aprender se relaciona con pautas de comportamiento
típicas en la especie.
c. Magnitud del refuerzo.

Cuanto mayor es la cantidad y calidad del refuerzo, mayor es la motivación del incentivo. Es
decir, a mayor premio, mayor motivación del incentivo y mayor actuación.
d. Demora del refuerzo.

Periodo de tiempo que transcurre entre la R y el refuerzo. Cuanto más largas sean las demoras,
más se dificulta el condicionamiento. Cuanto más cortas sean, más se facilita.

e. Contraste del refuerzo.


Cuando se cambia la magnitud del refuerzo de manera brusca, aparecen cambios transitorios en
la ejecución del sujeto.

 Efecto de contraste negativo (+ a -). Disminuye la R.


 Efecto de contraste positivo (- a +). Aumenta la R.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
7. PROGRAMAS DE REFORZAMIENTO.

Los programas de reforzamiento son reglas que determinan la forma y el momento en que se
reforzará una respuesta (Fester y Skinner, 1957).
La manera de aplicar los refuerzos puede estar en función del número de respuestas, de un
intervalo de tiempo, de la presencia o no de ciertos estímulos...
Tienen gran relevancia práctica en distintos ámbitos de la vida cotidiana, por ejemplo:

 La forma de pago de un empresario a su trabajador.


 El refuerzo de un profesor a su alumno tras la tarea.
Según sea la forma de aplicar el refuerzo, así será la frecuencia de una determinada conducta.
Todo programa de reforzamiento, tiene que tener en cuenta una serie de
consideraciones, como son:

 Definición de la conducta (definir el comportamiento en términos operativos y


observables)
o Conducta inicial
o Conducta meta
o Conductas intermedias
 Búsqueda y selección de reforzadores (agradables, potentes, disponibles, naturales).
Entrevistas, cuestionarios, observaciones. Magnitud ajustada.
 Aspectos contextuales
o Quién va a reforzar: encargado supervisión programa.
o Cuándo: cercanía en el tiempo (inmediato).
o Dónde: en todas las situaciones donde aparezca.
o Cómo: refuerzo específico + refuerzo social.

a. Programas simples de reforzamiento.

1. Programa de reforzamiento continuo (RFC): se refuerzan todas las respuestas que realiza
el sujeto. Hay una relación 1:1 entre la respuesta y el reforzador. Se caracteriza porque
da lugar a una adquisición rápida de la R y una tasa de respuestas moderadas y constante.
2. Programa de reforzamiento intermitente o parcial: se refuerzan las respuestas sólo en
algunas ocasiones. El refuerzo intermitente se encuentra entre el refuerzo continuo y la
extinción.
Tipos de programas de Refuerzo Intermitente:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
A modo de resumen sobre los programas simples de reforzamiento:

a) En los programas de razón producen mayor tasa de respuestas que los de intervalo. La
tasa de respuesta está relacionada con el reforzamiento, por lo que el sujeto responde de
manera más rápida para obtener más refuerzos.
b) En los programas de intervalo la tasa de respuesta es menor porque la respuesta es
reforzada sólo pasado un tiempo determinado.
c) Los programas variables generan más tasa de respuesta que los fijos.
d) Los programas fijos se extinguen más fácilmente que los programas variables.

Ejercicio de programas de reforzamiento.

 El alumno/a obtiene un punto positivo tras realizar tres tareas en la clase de matemáticas.
 Un padre que verifica cada cierto tiempo, que su hijo está estudiando, y cuando es así le
hace un halago.
 Un empleado cobra su sueldo cada mes, siempre el día 1.
 Un padre/madre refuerza a su hijo al finalizar el curso académico.
 Jugar a las máquinas tragaperras hasta que te toque el premio.
 Un comercial de una inmobiliaria obtiene una bonificación cada vez que vende o alquila
10 pisos.
 Un empleado cobra su sueldo cada mes, entre los días 1-5.
 El profesor alaba al alumno/a cada 15 minutos que está concentrado leyendo un libro.
 El alumno/a puede salir antes de clase si termina las tareas de ese día. Res

b. Programas compuestos de reforzamiento.

Los programas compuestos son dos o más programas de reforzamiento que operan uno tras otro.
Hay cuatro formas básicas de programas compuestos dependiendo de si los programas ocurren en
un orden fijo o aleatorio y si hay un E d o no que señalice el comienzo del programa.
1. Programa tándem: compuesto por dos programas simples que se presentan en un orden fijo
y el refuerzo se recibe al finalizar los dos programas.

2. Programa mixto: dos programas simples que se presentan en un orden aleatorio y el refuerzo
se recibe al finalizar los dos programas.

3. Programa encadenado: los programas se presentan en un orden fijo y al finalizar el primero


se presenta un E d del siguiente programa. N

4. Programa múltiple: se presentan dos o más programas de forma aleatoria y cada uno va
señalizado por un Ed.

También podría gustarte