Está en la página 1de 8

La teoría del

Condicionamiento
operante de B. F.
Skinner
POR: CARLOS VERGARA
En la década de 1920 luego del retiro de John B. Watson del mundo
de la psicología académica, los psicólogos, en particular los
conductistas estaban ansiosos por plantear nuevas teorías sobre el
aprendizaje diferentes a las ya planteadas por el condicionamiento
clásico. La más importante entre estas nuevas teorías fue la del
condicionamiento operante propuesto por Burrhus Frederic Skinner,
más comúnmente conocido como B.F. Skinner.

Skinner fundó su teoría en la simple reflexión de que el


comportamiento observable era más factible de estudiar que los
procesos mentales internos, los cuales no eran observables.

Las ideas de Skinner fueron mucho menos extremas que los de


Watson, aunque consideraba la existencia de la mente, afirmaba que
era más productivo estudiar el comportamiento observable que los
eventos mentales internos.

El trabajo de Skinner se basó en la visión de que el condicionamiento


clásico era demasiado simplista para poder ser una explicación
completa del comportamiento humano complejo. Creía que la mejor
manera de entender el comportamiento era observar las causas de
una acción y sus consecuencias. A este enfoque lo llamo
condicionamiento operante.
El aprendizaje y el Condicionamiento operante

B.F. Skinner fue famoso por su investigación pionera en el campo del


aprendizaje y el comportamiento.

Propuso una teoría para estudiar el comportamiento humano


complejo mediante el estudio de las respuestas voluntarias mostradas
por el organismo cuando se ubica en un entorno controlado.

Nombró dichos comportamientos como respuestas operantes.


También se le reconoce como el padre del Aprendizaje por
condicionamiento operante, basó su teoría en la «Ley de efecto»,
descubierta por Edward Thorndike en 1905.

De acuerdo con este principio, es más probable que se repita un


comportamiento si este va seguido de consecuencias agradables y
menos probables que se repita si las consecuencias son
desfavorables.

Skinner introdujo un nuevo término “la Ley de efecto-refuerzo.” La


cual fue una modificación de la Ley de Thorndike, según la cual el
comportamiento que es reforzado tiende a repetirse (fortalecerse);
mientras que el comportamiento que no es reforzado tiende a
extinguirse, (debilitarse).

B.F. Skinner propuso su teoría sobre el condicionamiento operante a


partir de la realización de varios experimentos con animales. Para ello
empleó un artilugio especial diseñado por el mismo, el cual
actualmente es conocido como la «Caja Skinner», utilizó en sus
experimentos especialmente ratas de laboratorio.

Primer experimento (Refuerzo positivo)


En uno de sus primeros experimentos, colocó una rata hambrienta
dentro de su “caja”.  Al principio la rata estuvo inactiva dentro de la
caja, pero gradualmente, a medida que comenzó a adaptarse
comenzó a explorar su entorno. Finalmente, la rata descubrió una
palanca, la cual al presionarla le proporcionaba comida.

Después que el animal satisfizo su hambre, comenzó a explorar la


caja de nuevo, luego de un tiempo, presionó la palanca por segunda
cuando volvió a tener hambre. Este fenómeno continuó en repetidas
ocasiones, después de un tiempo, la rata aprendió a presionar la
palanca cada vez que quería alimentarse, en este punto Skinner
consideró que el condicionamiento había sido exitoso.

En este ejemplo, la acción de presionar la palanca es una


respuesta/comportamiento operante, y la comida liberada dentro de
la cámara es la recompensa.

El experimento también se conoce como Aprendizaje por


Condicionamiento Instrumental, ya que la respuesta es fundamental
para obtener alimentos.

Este experimento también demuestra y rebela los efectos del refuerzo


positivo. Al presionar la palanca, la rata hambrienta fue
recompensada con alimento, que el cual satisfizo su hambre; Por lo
tanto, se considera como un refuerzo positivo.

Segundo experimento (Reforzamiento negativo)

BF Skinner también realizó un experimento que trataba de explicar el


refuerzo negativo.
Skinner colocó una rata en una caja con la misma configuración de la
anterior, pero en lugar de emplear el hambre, sometió la caja a una
corriente eléctrica desagradable.

La rata que experimentó la incomodidad por la corriente eléctrica


comenzó a moverse desesperadamente alrededor de la caja y
accidentalmente golpeó la palanca.

Al presionar la palanca se interrumpía inmediatamente el flujo de


corriente desagradable. Después de un par de veces, la rata se había
vuelto lo suficientemente inteligente como para ir directamente a la
palanca para evitar el malestar.

La corriente eléctrica en este caso actuó como refuerzo negativo y


escapar de la corriente eléctrica era la motivación para que la rata
repitiera la conducta una y otra vez.

En este caso también, la presión de la palanca fue una respuesta


operante y la interrupción completa del flujo de corriente eléctrica fue
su recompensa.

De hecho, Skinner incluso enseñó a las ratas a evitar la corriente


eléctrica al encender una luz justo antes de que se activara la
corriente eléctrica. Las ratas pronto aprendieron a presionar la
palanca cuando se encendía la luz porque sabían que con esto
evitarían la corriente eléctrica.

Estas dos respuestas aprendidas se conocen también como


aprendizaje por condicionamiento de escape y evitación.

Como resultado de estos experimentos Skinner identificó tres tipos de


respuestas las cuales pueden seguir el comportamiento:
 Operantes neutrales: respuestas procedentes del entorno las
cuales no aumentan ni disminuyen la probabilidad que se repita un
comportamiento determinado.

 Reforzadores: son respuestas provenientes del entorno las


cuales incrementan la probabilidad de repetición de un
comportamiento. Los reforzadores pueden ser tanto positivos como
negativos.

 Castigos: son respuestas del entorno las cuales disminuyen la


probabilidad que se repita un comportamiento. El castigo debilita el
comportamiento.

El condicionamiento operante se basa en una premisa bastante


simple: las acciones seguidas por una recompensa se
reforzarán y es más probable que vuelvan a ocurrir en el
futuro.

Por ejemplo, si alguien cuenta una historia divertida en la clase y


todos se ríen es más probable que quiera volver a repetir dicha
conducta en el futuro.

Si levanta la mano para realizar una pregunta y su maestro elogia su


comportamiento, será más probable que levante la mano la próxima
vez que tenga una pregunta o comentario.

Debido a que el comportamiento fue seguido por un refuerzo o


un resultado deseable, las acciones anteriores se fortalecen.

Al contrario, aquellas acciones que resulten en castigos o


consecuencias indeseables se debilitarán y será menos probable que
vuelvan a ocurrir en el futuro.
Si el alumno vuelve a contar de nuevo la misma historia en otra clase
pero esta ocasión nadie se ríe, será menos probable que quiera
repetirla en el futuro.

Si “gritas” una respuesta en clase y el maestro te regaña, entonces


es menos probable que vuelvas a interrumpir la clase.

Definición y conceptos básicos

Castigo (debilita el comportamiento)

El castigo se define como lo opuesto al refuerzo, ya que está


diseñado para debilitar o eliminar una respuesta en lugar de
aumentarla. Es un evento aversivo que disminuye el comportamiento
que sigue.

Al igual que el refuerzo, el castigo puede funcionar ya sea aplicando


directamente un estímulo desagradable como un shock eléctrico
después de una respuesta o eliminando un estímulo potencialmente
gratificante, como por ejemplo, rebajando el estímulo económico de
alguien para castigar un comportamiento no deseado.

Algunas veces resulta difícil diferenciar entre el castigo y el refuerzo


negativo.

Existen algunos inconvenientes al emplear el castigo, tales como:

 El comportamiento castigado no se deja de lado, solo se


suprime, este puede retornar cuando el castigo ya no está
presente.

 Puede aumentar la agresividad: la agresión es una forma de


enfrentar los problemas para algunos organismos.
 Genera temor el cual puede extenderse a comportamientos
indeseables, como por ejemplo, miedo a la escuela.

 No necesariamente conduce hacia el comportamiento deseado:


el refuerzo nos indica qué debemos hacer, en cambio el castigo
solo le señala lo qué no hay que hacer.

Extinción

Este concepto se emplea para explicar la desaparición de una


respuesta aprendida debido a la eliminación del refuerzo del
escenario condicionado.

Este concepto en la teoría del condicionamiento operante es similar al


del condicionamiento clásico. Por ejemplo; en el experimento de
Skinner, la rata podría dejar de presionar la palanca si está ya no
recibe su porción de comida.

Generalización y Discriminación.

El fenómeno en el cual un organismo presenta una respuesta similar


cuando reacciona a estímulos similares se conoce como
generalización.

Un concepto complementario al de generalización es la


discriminación, la cual explica una respuesta similar representada por
un organismo debido a la diferencia en los estímulos.

Recuperación espontánea

Este concepto se explica cuando en la caja de Skinner la rata es


retirada y ya no tiene que presionar la palanca, incluso después de
haberla retirado de la caja durante un cierto periodo de tiempo y el
comportamiento haberse extinguido, al reintroducir la rata a la caja el
comportamiento presenta una recuperación espontanea.1

1
Teoría del Condicionamiento Operante. Carlos Vergara. Consultado Abril, 2020. Disponible
en: https://www.actualidadenpsicologia.com/teoria-condicionamiento-operante-skinner/

También podría gustarte