Está en la página 1de 8

Conceptos clave

En el condicionamiento clásico, el estímulo (E) desencadena la respuesta (R) de un


organismo. Por la exposición del organismo a los estímulos, resultan los reflejos. El reflejo
es un comportamiento involuntario de raíz interna. Uno de los reflejos más comunmente
observables en nosotros es el parpadeo del ojo cuando se sopla aire en él o cuando se
acerca un objeto extraño. El concepto de reflejo como la carencia de un control consciente,
se incorpora en el condicionamiento clásico.
Pavlov desarrolló un modelo de condicionamiento clásico para poder tener una mejor
comprensión de éste. En general, hay cuatro conceptos consecutivos bajo este modelo,
que incluyen:
1. El estímulo incondicionado (E.I), activa la respuesta incondicionada (RI)
Esto significa que sin necesidad de un aprendizaje, un estímulo puede provocar un
reflejo. Al reflejo se le denommina respuesta incondicionada por lo que mencionamos
anteriormente, es involuntaria y no necesitamos aprenderlo para que el evento se
produzca.

2. El estímulo neutro (EN) es un estímulo que no provoca la respuesta


incondicionada (RI)
Esto significa que cuando el estímulo es presentado al organismo, éste no ejecutaría la
misma respuesta que mostró cuando se encontró con el EI.

3. EI y EN son repetidamente emparejados y presentados al organismo en


conjunto
4. El emparejamiento de EI y EN transforma al EN en un Estímulo
Condicionado (EC)
Esto significa que cada vez que cada vez que el estímulo previamente neutro se
presenta solo (el EI no es mostrado) al organismo, causa que se produzca la RI. Pero
esta vez, la RI se tranforma en Respuesta Condicionada (RC), porque la respuesta es
provocada por el condicionamiento. Por lo tanto, EC provoca RC.

4
Condicionamiento Instrumental: ¿Qué es y cómo
funciona?
El condicionamiento instrumental o condicionamiento operante es un tipo
de aprendizaje que sucede cuando los hechos son un resultado directo de la
conducta del individuo. Es decir, mediante el condicionamiento instrumental, las
acciones o conductas de un individuo pueden ser modificadas por sus
consecuencias.

Según el condicionamiento instrumental, para que tenga lugar el aprendizaje de


una respuesta (R), esta respuesta tiene que predecir un reforzador, es decir una
consecuencia positiva.

La relación entre la conducta y sus consecuencias es uno de los factores más


importantes en el control de la conducta instrumental. En el condicionamiento
instrumental es muy importante la contigüidad temporal y la contingencia que
se establece entre la respuesta y el reforzador reforzador, es decir, la relación que
se creará entre ambos factores.

Thorndike y el condicionamiento instrumental

Uno de los antecedentes históricos del condicionamiento instrumental son los


trabajos de Edward Thorndike acerca del aprendizaje. La intención inicial de
Thorndike fue estudiar la inteligencia animal, y creó su teoría del aprendizaje que
se basaba en la observación con modelos de aprendizaje animal.

Thorndike llegó a la conclusión que las respuestas animales que eran


recompensadas, es decir que recibían una recompensa (reforzador positivo),
tenían más tendencia a repetirse en el futuro. Por el contrario, las respuestas que
eran castigadas, es decir no recibían recompensa y/o recibían
un castigo (reforzador negativo), tenían tendencia a no repetirse en el futuro.

Por ejemplo, uno de sus famosos experimentos consistió en encerrar a un gato


en una caja, y que por ensayo-error, aprendiera que cada vez que pisa una
manecilla, la puerta se abre. La primera vez que lo probó, el gato se movía de un
lado a otro desordenadamente. Realizaba acciones sin sentido como dar con el
pestillo y abrir la jaula para tener acceso a un poco de comida. Con el tiempo,
aprendió que cada vez le costaba menos abrir la jaula y la abría en menos tiempo.

Por lo tanto, su teoría de “law of effect” (ley del efecto) propone que las
recompensas motivan el aprendizaje, es decir: si una respuesta (R) ejecutada en
presencia de un estímulo (E) va seguida de una consecuencia satisfactoria
(Reforzador positivo), la asociación entre la E-R se fortalecerá. Por el contrario, si
la R va seguida de una consecuencia no deseada (Reforzador negativo), la
asociación E-R no se fortalecerá, sino que se debilitará.

Skinner y el condicionamiento operante o condicionamiento instrumental

B.F.Skinner propone que los animales adquieren conductas en función de las


consecuencias. Es decir, que dependiendo de las consecuencias (positivas o
negativas) de cada acción, estas serán repetidas en un futuro o no.

Por ejemplo, Skinner demuestra que una rata aprende a darle a una palanca
cuando dicha acción tiene la consecuencia de obtener alimento. Según este autor,
el condicionamiento operante o condicionamiento instrumental ocurre cuando
una respuesta en seguida por un reforzador. Contra más número de veces se
repita la relación entre respuesta-reforzador, más probabilidad habrá de que se
repita la respuesta premiada.

Por lo tanto, para Skinner un reforzador es cualquier “cosa” que aumente la


frecuencia de una respuesta. Y que cualquier reforzador, incluso el mismo en cada
caso (ej: caramelos) puede aumentar cualquier tipo de conducta (ej: lavarse los
dientes, hacer los deberes, u ordenar la habitación).

Programas de reforzamiento

Un programa de reforzamiento es una pauta o una regla que determina cuando


y cómo se va a entregar un reforzador tras realizar una respuesta determinada.
Hay cuatro tipos de programas de reforzamiento.

 Programa de razón fija: este programa consiste en la administración de una


recompensa tras un número determinado de respuestas.
 Programa de intervalo fijo: es programa consiste en que la respuesta es recompensada
después de haber transcurrido un determinado intervalo fijo de tiempo (que no varía, es
siempre el mismo).
 Programa de razón variable: este programa consiste en que la recompensa está
determinada por el número de respuestas emitidas. Pero este número de respuestas
emitidas puede variar de un momento a otro (por ejemplo: unas veces se puede dar la
recompensa tras haber emitido la conducta dos veces, y otras se dará al haber emitido
la conducto cuatro veces. Pero nunca se dará la recompensa sin haber emitido la
respuesta).
 Programa de intervalo variable: este programa consiste en que la respuesta es
reforzada después de haber transcurrido un cierto periodo de tiempo. Este período de
tiempo es variable, por lo que puede variar de un momento a otro (por ejemplo: en
algunos casos se dará tras 10 segundos, en otros tras 5 segundos, etc).


 skinner distinguió entre dos tipos diferentes de comportamientos: las respuestas
instintivas y los comportamientos operantes.
 Las conductas instintivas son aquellas que ocurren de forma automática y reflexiva, como
retirar la mano de una estufa caliente o sacudir la pierna cuando el médico le toca la
rodilla. No hay que aprender estos comportamientos, simplemente ocurren de forma
automática e involuntaria.
 Los comportamientos operantes son aquellos que están bajo nuestro control
consciente. Algunos pueden ocurrir de manera espontánea y otros a propósito, pero son
las consecuencias de estas acciones las que influyen en que ocurran o no en el futuro.
Nuestras acciones sobre el medio ambiente y las consecuencias de esas acciones
constituyen una parte importante del proceso de aprendizaje.
 Refuerzo y castigo
 La promesa o posibilidad de recompensa provoca un aumento en la frecuencia o
intensidad del comportamiento que «pensamos» (porque ya ocurrió en el pasado) que
nos llevará a obtenerla. Sin embargo, el condicionamiento operante también se puede
utilizar para disminuir un comportamiento. La eliminación de un resultado deseable o la
aplicación de una consecuencia negativa se puede usar para disminuir o prevenir
comportamientos indeseables.
 En este sentido, Skinner identificó dos aspectos clave del proceso de condicionamiento
operante: el refuerzo y el castigo. El refuerzo sirve para aumentar el comportamiento,
mientras que el castigo sirve para disminuir el comportamiento. Además, encontramos
que el refuerzo variable puede llegar a ser mucho mejor que el refuerzo constante, ya
que el comportamiento adquirido se vuelve más resistente a la extinción.
 Además, identificó dos tipos diferentes de refuerzo y dos tipos diferentes de castigo.
 El refuerzo positivo implica presentar un resultado favorable, mientras que el refuerzo
negativo implica la eliminación de un estímulo desagradable. En ambos casos, el refuerzo
hace que aumente la frecuencia o la intensidad del comportamiento.
 El castigo positivo significa aplicar un evento desagradable después de un
comportamiento, mientras que el castigo negativo implica quitar algo agradable después
de que ocurra un comportamiento. En ambos casos de castigo, el comportamiento
disminuye (tiende a extinguirse).


 El condicionamiento operante en la actualidad
 Si bien el conductismo puede haber perdido gran parte del protagonismo que tenía
durante la primera parte del siglo XX, el condicionamiento operante sigue siendo una
herramienta importante y utilizada con frecuencia en los procesos de moldeamiento de
la conducta. De hecho, muchos padres la utilizan aunque no sean conscientes de la teoría
que hay detrás.
 Así, el condicionamiento operante es una forma de generar asociaciones -con incidencia
en el comportamiento- que podemos reconocer con facilidad en nuestra vida diaria,
tanto en la educación que reciben u ofrecemos a nuestros hijos o en el entrenamiento
que utilizamos con nuestras mascotas, por ejemplo. La publicidad y las acciones
de marketing también emplean el condicionamiento operante en sus estrategias para
vender productos y servicios a los consumidores.

También podría gustarte