Está en la página 1de 7

Psicología del Aprendizaje 2015/16 Llanos Merín

TEMA 4: PRINCIPIOS BÁSICOS DEL CONDICIONAMIENTO OPERANTE


ANTECEDENTES
HISTÓRICOS

Thorndike y la Ley del El análisis experimental del


Efecto comportamiento de Skinner

Los trabajos de Thorndike son el comienzo del estudio científico del Skinner desarrolla la idea de que los reflejos podrían ser estudiados como
condicionamiento instrumental, al que denominó aprendizaje por ensayo y error. conductas más que como un reflejo del sistema nervioso o de la mente: distingue
Para este autor, el aprendizaje ocurre porque se fortalecen las conexiones que se entre el condicionamiento de los reflejos de Pavlov y el tipo de aprendizaje
forman entre los estímulos y las respuestas cuando dan lugar a un estado de propuesto por Thorndike, lo que le llevó a formular que la conducta se regula
satisfacción para el animal. Denominó a esto conexionismo. tanto por el condicionamiento de los reflejos o condicionamiento respondiente
 Experimento: metía a gatos en diferentes “caja problema”, una especie de jaulas como por el operante.
de las que podían salir al activar algún tipo de resorte desde el interior, y al salir el  Empleo de los términos condicionamiento operante y condicionamiento
investigador les daba una cierta cantidad de comida. En los primeros intentos instrumental: el termino operante refleja la capacidad del sujeto para operar
tardaban un tiempo considerable y exploraban la caja hasta dar por casualidad con sobre su ambiente, mientras que el termino instrumental tiene en cuenta el
el mecanismo de apertura. Según transcurría los ensayos y repetían la tarea, el hecho de que la conducta del sujeto es el instrumento para obtener el
tiempo que tardaban en accionar el mecanismo y en salir de la caja era menor. reforzador.
Este tiempo que pasaba desde que comenzaba el ensayo hasta que el sujeto salía  Procedimientos de operante libre: Skinner utilizó experimentos en los que el
de la caja, llamado latencia de escape, era la medida que Thorndike utilizó para la sujeto podía ejecutar una respuesta repetidamente sin la intervención del
evaluación de la ejecución del aprendizaje. Estableció que la entrega de comida experimentador. En ellos, la respuesta puede ocurrir en cualquier momento y de
fortalecía la conexión entre la situación y la respuesta. forma repetida mientras el sujeto siga en la caja de condicionamiento. La variable
 Ley del efecto: de las muchas respuestas dadas en la misma situación, las que dependiente medida en este caso es la tasa de respuesta, o número de
vayan acompañadas o inmediatamente seguidas de satisfacción para el animal, en respuestas por unidad de tiempo.
igualdad de condiciones, se conectarán más firmemente con la situación; de
manera que cuando vuelva a presentarse, volverán a darse con gran probabilidad.
Psicología del Aprendizaje 2015/16 Llanos Merín
TEMA 4: PRINCIPIOS BÁSICOS DEL CONDICIONAMIENTO OPERANTE

DEFINICIÓN DE CO: proceso que da lugar a que la probabilidad de una respuesta se vea modificada por sus consecuencias, es decir, por los efectos que tiene el
ambiente sobre ella. Si el resultado del comportamiento es beneficioso para el animal la conducta se fortalecerá, siendo más probable que se emita de nuevo en
circunstancias parecidas. Si el resultado es perjudicial, ducha conducta tenderá a desaparecer del repertorio del sujeto.

La descripción de la conducta operante requiere habitualmente de tres términos y sus interrelaciones funcionales. Éstos son:

El estímulo discriminativo La respuesta El reforzador

Las claves contextuales en el CO reciben el nombre de La respuesta operante se define por los Un reforzador es cualquier suceso o evento que al hacerse
estímulos discriminativos (Eds) y señalan la ocasión para efectos que provoca en el ambiente. Cuando contingente con una respuesta cambia la probabilidad de
que, si la conducta se presenta, sea seguida por una una respuesta produce el mismo efecto que aparición de esa respuesta en el futuro. Por tanto, se define
consecuencia. Es decir, un estímulo en principio neutro, otra, estaremos hablando de la misma en función de los efectos que tiene sobre la conducta.
puede indicar si el reforzador está disponible y, por tanto, operante porque producen los mismos efectos  Reforzamiento condicionado: la conducta humana
indica al sujeto cuándo ha de responder. Esto implica sobre el ambiente. Por tanto, la operante se muchas veces no es controlada por reforzadores primarios
reforzar una respuesta en una situación, pero no en otra. define por su función, no por su forma. (ej.: comida), sino que depende de la historia de
 Cuando un Ed va seguido de una respuesta cuya Cuando hablamos de la conducta, ésta puede reforzamiento (Ej.: elogios, críticas o juicios sobre nuestro
consecuencia es apetitiva, ésta se ve reforzada y la adoptar distintas formas (topografía) teniendo comportamiento pueden fortalecer o debilitar la conducta).
probabilidad de que ocurra aumente si dicho estímulo la misma función. Hablamos de clases de Este tipo de eventos adquieren sus efectos debido a las
está presente posteriormente. respuesta cuando nos estamos refiriendo a experiencias que la gente ha tenido con ellos a lo largo de
 Cuando una respuesta operante no es seguida de una cualquier forma de ejecutar una conducta con sus vidas. El reforzamiento condicionado o reforzamiento
consecuencia reforzante, el estímulo que precede la una función similar. Ej.: si queremos conseguir secundario se refiere a un estímulo o evento que
respuesta se conoce como estímulo delta (E∆), y en su comida, podemos hacerlo nosotros mismos o originalmente no es reforzante, pero que puede adquirir
presencia la probabilidad de emitir la operante disminuye. pedirle a otro que lo haga. Ambas sería la capacidad de reforzamiento mediante la asociación repetida
 El término control por el estímulo se refiere a cómo los misma clase de respuesta porque cumplen la con otro que previamente era reforzante. Es decir, la
estímulos que preceden una conducta pueden controlar la misma función, pero tienen una topografía o conducta se fortalece debido a sucesos que tienen un efecto
ocurrencia de ésta, lo cual no quiere decir que el Ed forma diferente. que depende de la historia de reforzamiento del sujeto.
provoque la respuesta.

Entre estos tres términos se establece una contingencia que se define como: en presencia de un
estímulo discriminativo, el reforzador se presentará si, y sólo si, la respuesta operante sucede.
Psicología del Aprendizaje 2015/16 Llanos Merín
TEMA 4: PRINCIPIOS BÁSICOS DEL CONDICIONAMIENTO OPERANTE

ACLARACIONES ENTRE
CONCEPTOS

Reforzador- Respuesta discreta- Topografía- Instancia de respuesta Interacciones clásicas


reforzamiento operante libre función y clase de respuesta y operantes en el
control de la conducta

El evento sería el reforzador, y  Experimentos de ensayo  Topografía: punto de vista  Instancia de respuesta: En el CO, para poder reforzar o
el procedimiento o proceso el discreto: la variable estructural de una conducta, la forma unidad mínima de conducta castigar una conducta es necesario
reforzamiento. El dependiente es la latencia de de la respuesta, sus propiedades o que se refiere a la ocurrencia que dicha conducta ocurra con
reforzamiento produce respuesta. El ensayo comienza características físicas, entendida particular y específica de una cierta probabilidad. Cuando esta
incrementos en la conducta, y cuando el sujeto es dispuesto en como una secuencia de movimientos respuesta teniendo en cuenta probabilidad es muy baja hay
los reforzadores son los el aparato y éste puede que ocurren en el tiempo. Desde el además su topografía. ciertas soluciones para no tener
eventos que hacen que el únicamente emitir, y el punto de vista del CO las  Clase de respuesta: todas que esperar a que se dé por
reforzamiento produzca esos investigador registrar, una consecuencias de una respuesta las formas en las que la casualidad, lo que llevaría mucho
efectos. Cuando el respuesta en cada ensayo. pueden modificar su topografía o ejecución de la respuesta tiempo. Una de ellas es el
procedimiento disminuye la  Procedimientos de operante forma. Ej.: para empujar una puerta puede llevar a una función automoldeamiento: hacer primero
conducta, se denomina castigo libre: la variable dependiente podemos hacerlo con la mano o con el
similar. un procedimiento de CC que
y los eventos utilizados cuando para medir el aprendizaje es la pie, el resultado es el mismo, pero si
se presenta la conducta son de tasa de respuesta, y los sujetos estamos en público será menos probable empareje un estímulo neutro (luz)
naturaleza aversiva. Hay que que lo hagamos con el pie. con algo apetitivo (comida), con lo
pueden emitir la respuesta de
distinguir así entre forma constante y  Función: es la relación de la que la luz pasará tras varios
consecuencia apetitiva repetidamente sin que el respuesta con los estímulos ensayos a ser un EC. Una vez que la
(reforzador) y consecuencia investigador tenga que antecedentes y las consecuencias de luz provoca la RC, podemos
aversiva (castigo). la misma. Dos respuestas con la someterla a control operante
manipular al sujeto de ninguna
misma forma pueden tener función haciendo que solo aparezca la
forma entre ensayo y ensayo.
diferente, y dos respuestas con comida cuando la paloma la
distinta topografía tener la misma picotea, pasando de ser un EC a un
función. En el ejemplo anterior la Ed que correlaciona con la comida
función sería abrir la puerta. cuando el animal presiona la tecla
(respeta operante).
Psicología del Aprendizaje 2015/16 Llanos Merín
TEMA 4: PRINCIPIOS BÁSICOS DEL CONDICIONAMIENTO OPERANTE

PROCEDIMIENTOS BÁSICOS DEL


CONDICIONAMIENTO OPERANTE

APETITIVO AVERSIVO Contingencia: relación de dependencia funcional entre dos


componentes de un condicionamiento, que se establece
CONTINGENCIA Refuerzo positivo: Castigo positivo:
cuando uno de los componentes correlaciona con el otro. En
POSITIVA La conducta provoca consecuencias La conducta provoca consecuencias
CO, hablamos de contingencia positiva cuando una respuesta
positivas. negativas.
La conducta La conducta es seguida de una consecuencia, y de contingencia negativa
CONTINGENCIA Entrenamiento de omisión o castigo Entrenamiento de escapa y evitación o cuando una respuesta elimina o previene la aparición de una
NEGATIVA negativo: reforzamiento negativo: consecuencia. Dependiendo del tipo de contingencia y de la
La conducta provoca la omisión de La conducta provoca la omisión de algo naturaleza apetitiva o aversiva de la consecuencia, se
algo bueno. malo. establecen los 4 procedimientos fundamentales de CO que
La conducta La conducta aparecen en la tabla.

 Reforzamiento positivo (entrenamiento de recompensa): tiene lugar en el momento en que una consecuencia apetitiva
se presenta de forma contingente a una respuesta, lo que provoca un aumento de la fuerza de la respuesta: su intensidad,
su frecuencia de aparición, etc. De esta forma, cuando el sujeto emite la conducta, se presenta un evento apetitivo. Si la
respuesta que queremos medir no está presente en el repertorio natural del animal, como presionar una palanca, se pude
Procedimientos destinados a emplear el moldeamiento o método de aproximaciones sucesivas: reforzar respuestas o conductas que se vayan
aumentar conductas aproximando a la respuesta final que queremos medir, y dejar de reforzarlas (extinguirlas) según vamos consiguiendo
respuestas más cercanas a nuestro objetivo.
 Escape y evitación (reforzamiento negativo): en el procedimiento de escape eliminamos o detenemos un evento
aversivo como resultado de una respuesta operante, por lo que la respuesta aumenta; en el procedimiento de evitación la
respuesta impide que se presente el evento de naturaleza aversiva. En laboratorio, es normal que estos dos
procedimientos se presenten de forma conjunta, aprendiéndose primero una respuesta de escape y luego de evitación.

 Castigo o castigo positivo: se aplica una consecuencia aversiva de forma contingente a la respuesta o conducta, y tiene
como resultado la disminución de la misma. La consecuencia aversiva se presenta cuando el sujeto emite la respuesta
operante, y no se presenta si no la emite. Para poder castigar una respuesta antes ha tenido que ser reforzada. Así, el castigo
Procedimientos destinados a consiste en la disminución de una respuesta previamente reforzada debido a la imposición de una contingencia de tipo
disminuir conductas aversivo sobre dicha respuesta.
 Entrenamiento de omisión o castigo negativo: tiene como resultado una disminución en la fuerza de la respuesta porque
se elimina o previene la aparición de una consecuencia apetitiva de forma contingente a la respuesta. Si el sujeto emite la
respuesta operante, la consecuencia será la no presentación de un evento apetitivo.
Psicología del Aprendizaje 2015/16 Llanos Merín
TEMA 4: PRINCIPIOS BÁSICOS DEL CONDICIONAMIENTO OPERANTE

LA EXTINCIÓN EN EL
REFORZAMIENTO POSITIVO

Fenómenos que muestran


Fenómeno de que la extinción no es
extinción
desaprendizaje

La extinción en el CO es el procedimiento mediante el cual una respuesta que previamente se La extinción es un procedimiento en el que una respuesta
reforzaba, se deja de reforzar. anteriormente reforzada ya no produce reforzamiento,
Estallido de extinción: efecto de la extinción sobre la conducta que consiste en un aumento de la pero la posibilidad de emitir la respuesta sigue
tasa de respuesta los primeros ensayos en los que dejamos de presentar el reforzador que antes se disponible. Consiste en un nuevo aprendizaje por lo que
presentaba. Posteriormente la respuesta comienza a disminuir de forma gradual. no implica ni desaprendizaje ni olvido, como muestran
 Aumento de la variabilidad de la respuesta: efecto que ocurre al comienzo del procedimiento de los siguientes fenómenos:
extinción. Tiene una posible explicación adaptativa: la variación conductual aumenta las probabilidades Recuperación espontánea: fenómeno en el que se
de entrar de nuevo en contacto con el reforzador o con otras posibles fuentes de reforzamiento. observa cierta recuperación de la respuesta cuando
 Como consecuencia de la extinción es habitual encontrarse con un estado emocional que se suele dejamos pasar cierto tiempo sin que el sujeto sea
denominar frustración y que da lugar a que surjan respuestas emocionales incondicionadas, como la expuesto a sesiones de extinción.
agresión en humanos.  Renovación: consiste en la recuperación de la
 Resistencia a la extinción: las respuestas operantes que han sido reforzadas en pocas ocasiones se respuesta extinguida en un contexto diferente al que se
extinguen de forma lenta, pero cuando una respuesta ha sido reforzada en múltiples ocasiones llevó a cabo el procedimiento de extinción.
muestra menor resistencia a la extinción, sobre todo cuando en la fase de adquisición se ha utilizado  Restauración: se da cuando se vuelve a situar los
un programa de reforzamiento continuo (efecto de sobreentrenamiento en la extinción). La resistencia sujetos en el contexto original de la extinción.
a la extinción aumenta de forma importante cuando se utiliza un programa de reforzamiento parcial o  Restablecimiento: en este caso, después de extinguir
intermitente (efecto del reforzamiento parcial). la respuesta, el sujeto es expuesto de forma no
 Otras variables que influyen en la persistencia de la respuesta durante la extinción son la magnitud contingente al reforzador, lo que hace que la respuesta
del reforzador y la inmediatez de la recompensa. Cuando la magnitud de la recompensa durante la vuelva a aparecer sin que ésta dé lugar a reforzamiento.
adquisición es alta y se administra de forma continua, la resistencia a la extinción disminuye. Ocurre lo
contrario cuando las recompensas grandes se administran intermitentemente, como consecuencia del
efecto del reforzamiento parcial. Por otro lado, cuando la demora en la presentación del reforzador es
baja, la resistencia a la extinción es mayor.
Psicología del Aprendizaje 2015/16 Llanos Merín
TEMA 4: PRINCIPIOS BÁSICOS DEL CONDICIONAMIENTO OPERANTE

FENÓMENOS DEL
CONDICIONAMIENTO OPERANTE

La conducta La deriva instintiva y el concepto Los cambios en la cantidad y


supersticiosa de relevancia o pertinencia calidad de la recompensa

 Experimento de superstición (Skinner): ponía palomas en  Deriva instintiva: Tendencia de


cajas independientes y les daba comida cada 15 segundos El contraste conductual es un fenómeno, relacionado con la
algunos animales a mostrar motivación, que se basa en el hecho de que la efectividad de un
independientemente de lo que hicieran. Lo que observó es que respuestas instintivas que compiten
los animales actuaban como si su comportamiento controlara reforzador para controlar la conducta puede verse modificada
con la respuesta requerida cuando por la experiencia previa con el mismo reforzador cuando éste
la entrega del reforzador cuando no era así. Skinner explicó son entrenados mediante
este comportamiento mediante la idea del reforzamiento es de una magnitud o calidad diferente. Si aumente o disminuye
procedimientos de condicionamiento el reforzador, en relación a lo que percibíamos antes, tiene
accidental o adventicio, es decir, si una respuesta ocurre operante. consecuencias en nuestra conducta y emociones.
cuando se entrega el reforzador, esa conducta se ve reforzada.  Pertinencia o relevancia: se
 Experimento de Staddon y Simmelhag: encontraron que las  Contraste conductual positivo: se refiere al hecho de que los
refiere a que algunas respuestas se sujetos responden más a un reforzador favorable si
respuestas emitidas por los animales se podían agrupar en dos relacionarían de modo natural con el
categorías a las que llamaron conductas de ínterin y previamente han recibido un peor premio que si no han tenido
reforzador como consecuencia de la esta experiencia anterior.
terminales. Las conductas de ínterin eran aquellas actividades historia evolutiva del animal, por lo
del animal que tenían lugar en el medio del intervalo, cuando  Contraste conductual negativo: Se refiere al hecho de que
que serán más fáciles de condicionar los sujetos responden menos a un reforzador desfavorable si
faltaba bastante tiempo para la aparición del reforzador. Las que otras dependiendo del
conductas terminales eran aquellas que ocurrían al final del han recibido previamente un mejor premio que si no han tenido
reforzador que usemos. esta experiencia previa.
intervalo y próximas en el tiempo a la aparición del reforzador.
Argumentaron que no es el reforzamiento lo que origina un Grupo Fase 1 Fase 2 Resultado
aumento en la frecuencia de las conductas de ínterin, sino que
Grupo A (Pequeño- Recompensa Recompensa Misma
éstas son respuestas que un sujeto emite de forma innata pequeño) pequeña pequeña respuesta
cuando la probabilidad de reforzamiento es baja. Grupo B (Pequeño- Recompensa Recompensa Aumento de
 Herrstein. Diferenció entre: supersticiones idiosincráticas, grande) pequeña grande respuesta
que son aquellas motivadas por la experiencia propia anterior Grupo C (Grande- Recompensa Recompensa Misma
con situaciones de reforzamiento, y supersticiones sociales que grande) grande Grande respuesta
Grupo D (Grande- Recompensa Recompensa Disminución
las personas han mantenido a lo largo del tiempo.
pequeño) grande pequeña de respuesta
Psicología del Aprendizaje 2015/16 Llanos Merín
TEMA 4: PRINCIPIOS BÁSICOS DEL CONDICIONAMIENTO OPERANTE

FENÓMENOS DEL
CONDICIONAMIENTO OPERANTE

La controlabilidad de las Los efectos de la demora del


La devaluación del
consecuencias aversivas y el reforzamiento: el procedimiento
reforzador
efecto de indefensión aprendida de marcado

 Indefensión aprendida: cuando los animales son sometidos a  La demora del reforzamiento ocurre cuando existe un  Devaluación del reforzador:
situaciones en las que tienen poco o ningún control desarrollan periodo de tiempo entre la respuesta que da lugar al Procedimiento que consiste en
una reacción emocional en la que manifiestan un comportamiento reforzador y la entrega posterior del mismo. Puede disminuir asociar al reforzador que se está
pasivo ante dichas circunstancias o circunstancias parecidas. o aumentar la conducta, o incluso modificarla respecto al utilizando un estímulo o evento de
 Experimento: Para determinar el efecto de la indefensión aprendida reforzamiento no demorado. Hay que obtener una línea base naturaleza contraria.
Seligman y colaboradores realizaron un diseño triádico que se muestra de respuesta estable a partir de la cual poder observar los El efecto resultante de este
en la tabla. Se sometió a tres grupos de perros a diferentes situaciones efectos de la presentación demorada del reforzador. Cuando procedimiento es una disminución
experimentales con dos fases (fase de preexposición al entrenamiento la línea base es estable y se impone una demora,
escape/evitación y fase de aprendizaje). El grupo acoplado, el único que de la respuesta operante que ha
normalmente ésta da lugar a una reducción de la respuesta. sido reforzada con el reforzador
había recibido descargas inescapables durante la preexposición,
 Procedimiento de marcado: Es una forma de evitar los devaluado, aunque esta respuesta
mostraba un aprendizaje escape/evitación mucho más lento, ya que la
efectos de la demora en la entrega del reforzador. Este nunca haya sido contingente al
fase 1 había generado en los animales la expectativa de que su conducta
no tenía ningún efecto sobre las consecuencias aversivas. procedimiento consiste en marcar la respuesta haciendo que estímulo aversivo.
 Inmunización: proceso que se desarrolla cuando un sujeto ésta pueda diferenciarse de otros eventos que ocurren
tiene una primera experiencia con descargas escapables que durante el periodo de demora.
bloquea el desarrollo de la indefensión aprendida cuando se
presentan descargas inescapables en una fase posterior.
Grupo Fase de Fase de Resultado
preexposición aprendizaje conductual
escape/evitación
Escape Descargas Señal-descarga Aprendizaje
controlables rápido
Acoplado Descargas Señal-descarga Aprendizaje
incontrolables lento
Control Sin descargas Señal-descarga Aprendizaje
rápido

También podría gustarte