Está en la página 1de 8

ESCUELA PROFESIONAL DE PSICOLOGÍA

CURSO PSICOLOGÍA DEL APRENDIZAJE

III CICLO

EL CONDICIONAMIENTO OPERANTE
ACERCA DE B.F SKINNER

Psicólogo estadounidense quien comenzó con la idea de


que los principios del condicionamiento clásico sólo
explicaban una pequeña parte de las conductas que se
aprenden. De acuerdo con Skinner, estos operantes son
afectados por lo que sucede después de ellos. De esta
manera, el condicionamiento operante, o aprendizaje
operante, implica el control de las consecuencias de la
conducta.
Para estudiar los efectos de las consecuencias sobre la
conducta bajo condiciones cuidadosamente controladas, Skinner diseñó un apartado
especial parecido a una caja. Los sujetos en estudio de Skinner fueron en su mayoría
ratas o pichones colocados en cajas, que al poco tiempo se conocieron como cajas de
Skinner.
Una típica caja de Skinner es un cajón pequeño que contiene tan sólo una charola
para comida y una palanca o barras (para ratas) o un disco (para los pichones). La
palanca o disco se conecta a una tolva con alimento. Las modificaciones a esta caja
básica incluyen luces cercanas a la palanca o disco y pisos electrificados que se
utilizan para dar toques eléctricos a los animales.
Probablemente puede imaginarse como se emplea esa caja para estudiar los efectos
de las consecuencias positivas (la comida), como las consecuencias desagradables
(toques eléctricos). Se coloca un pichón en la caja que comienza a explorarla. Como
los pichones tienden a estar picoteando, eventualmente el animal se acercará a
picotear el disco y en ese momento caerá a la charola una bolita de comida. Como
está hambriento se la come, da una vuelta por la caja, y picotea el disco
nuevamente; cae más alimento y al poco tiempo el pichón esta picoteando y
comiendo continuamente. La siguiente vez que se coloque el pichón en la caja, irá
directamente al disco y comenzará a picotear.
Con la rata el mismo mecanismo; al presionar la barra, recibe los comprimidos de
comida en la caja, lo cual refuerza la conducta de oprimir la barra.

Las conductas operantes, son respuestas emitidas sin que necesariamente esté
presente un estímulo. Ocurren en forma espontánea. No todos los movimientos del
recién nacido son respuestas reflejas. Algunas de estas son
respuestas operantes con las que el niño actúa sobre el
ambiente. Un bebe agita un brazo o mueve una pierna y
siguen ciertas consecuencias. Estas determinan si la
respuesta será repetida o no. Skinner creía que le proceso
de condicionamiento operante tiene un significado mucho
mayor que el condicionamiento clásico simple. Muchas de
nuestras conductas no pueden ser explicadas en términos
de condicionamiento clásico. Más bien, son en su origen
conductas espontáneas cuyas consecuencias determinan su frecuencia subsecuente.
Hay una distinción clara entre la naturaleza de una conducta respondiente y una
operante. La conducta respondiente es provocada o producida por un estímulo; la
operante es emitida o llevada a cabo en forma libre por el organismo. También difiere
la naturaleza del reforzamiento. En el condicionamiento clásico, el estímulo es el
reforzamiento y antecedente a la conducta; en el operante, el efecto de la conducta
es el reforzamiento. Por tanto, en el condicionamiento operante el reforzamiento
sigue a la conducta.

Cuando la rata privada de alimento es condicionada en una


caja de Skinner a oprimir una barra y es reforzada por esa
conducta con alimento, se puede predecir con bastante
precisión lo que la rata va a hacer en sesiones subsecuentes
en la caja de Skinner. Además se puede controlar su
conducta cambiando el reforzamiento. Cuando ocurre la conducta deseada, es
reforzada. El reforzamiento apropiado incrementa la probabilidad de que la conducta
ocurra denuevo.

CONDICIONAMIENTO OPERANTE INSTRUMENTAL

Tipo de aprendizaje en el cual la probabilidad de aparición de una conducta se


incrementa o reduce mediante el reforzamiento o castigo.
El condicionamiento instrumental conduce a 2 objetivos evitar el dolor y conseguir
una gratificación ambas a su vez. Se diferencia del puramente operante porque se
realiza en laboratorio.
El condicionamiento instrumental es denominado así porque el animal aprende que su
acción determina ciertos efectos.

TIPOS DE REFORZADORES:
Hemos visto que en el condicionamiento operante una vez que ocurre la respuesta
deseada, aumenta la probabilidad de que vuelva a ocurrir mediante el reforzamiento.
Cada vez que algo es seguido de cerca por un reforzamiento, tendemos a repetir la
acción aún cuando el refuerzo no produzca directamente lo que hemos hecho.

Reforzadores positivo y negativo:


Los psicólogos distinguen varios tipos de reforzadores. Una de las distinciones más
importantes es la que se da entre los reforzadores positivos y negativos. Calificar a
un reforzador como positivo significa simplemente que añade una recompensa a
cierta situación, por ejemplo, comida o música agradable. El reforzamiento negativo
resulta eficaz porque substrae algo desagradable de la situación: el reforzamiento
consiste en eliminar el estímulo. Los animales aprenderán a oprimir barras y abrir
puertas no sólo para obtener alimento y agua (reforzamiento positivo) sino también
para evitar descargas eléctricas o ruidos molestos (reforzamiento negativo).
Cabe hacer notar que ambos tipos de reforzamiento dan por resultado el aprendizaje
de nuevos comportamientos y el fortalecimiento de conductas ya existentes. Tal vez a
un niño le guste tocar el piano para que lo elogien (reforzamiento positivo) o bien
para escapar un rato de alguna tarea tediosa (reforzamiento negativo). Un perro
aprende a abrir la puerta trasera con las patas ya sea por el reforzamiento positivo de
salir a jugar o por el reforzamiento negativo de alejarse del latoso gato de la familia.
Si a un niño lo regañan por comer espagueti con los dedos y
dejan de regañarlo si toma un tenedor y lo usa, es más
probable que en un futuro use el tenedor. Este es un ejemplo
de reforzador negativo ya que reducir o terminar con eventos
desagradables (como los castigos) aumentan las probabilidades
de que el comportamiento se presenta en ese momento se
repita. Y si al mismo tiempo se añade un reforzamiento positivo (“eres un buen niño”
¡Así como los grandes comen espaguetis!), existen aún más probabilidades de que el
nuevo comportamiento se repita en el futuro.

Reforzamiento primario y secundario:


La distinción entre los reforzadores primarios y los secundarios también es
importante. Un reforzador primario es aquel que resulta grato por si mismo sin nexo
alguno con otros. El alimento, el agua y sexo pertenecen a esta categoría. Un
reforzador secundario es aquel cuyo valor ha de aprenderse mediante una asociación
con otros reforzadores. Se le califica de secundario no porque sea menos importante,
sino porque se adquiere. Una rata aprende a obtener comida tirando de una barra;
después que se activa un zumbador cada vez que ejecuta esa acción y consigue
comida. Aún cuando el animal deje de obtenerla, seguirá tirando de la barra con tal
de oír el zumbador. Aunque el zumbador por sí mismo carece de valor para el animal,
se ha convertido en un reforzador secundario.
El dinero es un reforzador secundario. Aunque no pasa de ser simple papel o metal,
gracias a su vinculación con el alimento, la ropa y otros reforzadores primarios, se
convierte en un precio poderoso. Los niños aprenden a conocer su valor sólo cuando
saben que con él comprarán cosas como dulces (reforzador primario). Y en ese
momento el dinero se convierte para ellos en un reforzador secundario. Los
chimpancés han aprendido a trabajar para conseguir fichas de pócker que después
introducen en una máquina automática y obtienen el reforzador primario: uvas,
pasas. Las fichas se han convertido para ellos en un reforzador secundario.

Reforzamiento demorado:
Finalmente cabe señalar que por lo regular se da un intervalo entre el momento en
que se produce el comportamiento deseado y el momento en que se aplica el
reforzamiento. La duración de este intervalo es importante para que se realice el
aprendizaje; cuanto mayor sea el intervalo, menor, eficacia tendrá el reforzamiento.
En un estudio los experimentadores variaron el intervalo en que las ratas tiraban de la
palanca y el momento en que se les daba el reforzamiento. Un retraso de unos
cuantos segundos reducía drásticamente la frecuencia con que las ratas tiraban de la
palanca. El reforzamiento demorado puede afectar nuestras elecciones, sobre todo
las que tienen que ver con el autocontrol. Una persona que está a dieta puede optar
por una rebanada de pastel debido a que el reforzador primario es mucho más
inmediato que el reforzador de adelgazar.
La reducción de la eficacia con el retardo del esfuerzo parece deberse a distracciones
que entorpecen el proceso adquisitivo. Al minimizar las distracciones a que está
sujeto el individuo entre el comportamiento y el reforzamiento, es posible posponer
este último sin que el aprendizaje disminuya demasiado. Lo mismo se logra en el ser
humano recordándole varias veces que el reforzamiento está por llegar o explicándole
por que se le refuerza cuando finalmente llega. Esto forma un nexo entre la respuesta
del que aprende y el retardo del refuerzo que viene después.
Hay casos en que los comportamientos son intrínsecamente reforzadores, de modo
que no se da ningún retardo en ellos. Por ejemplo a esta categoría pertenece la
conducta depredadora y sexual de los animales. Al ocurrir el comportamiento, éste
premia de inmediato al animal. Como cabe suponer, tales actos son difíciles de
eliminar.

Castigo:
Ocurre cuando una conducta es seguida por una situación desagradable diseñada para
eliminarla. El castigo puede detener o bloquear una conducta pero no necesariamente
eliminarla.

PROGRAMAS DE REFORZAMIENTO:

Skinner (1969) describió tres programas de reforzamiento e indicó su efectividad. En


el reforzamiento continuo, las conducta deseada cada vez que ocurre. Un programa
de reforzamiento continuo es en extremo efectivo en el desarrollo y fortalecimientos
iniciales de una conducta. Sin embargo, si el reforzamiento es detenido, la respuesta
desaparece con rapidez o sufre la extinción.

En el reforzamiento de intervalo, el organismo es reforzado después


de que ha transcurrido un cierto tiempo, sin importar el porcentaje
de respuesta. El reforzamiento de intervalo puede ser aplicado en
una base fija o variable. Si es fijo, transcurre el mismo periodo
cada vez (tal como cinco minutos). Si es variable, el periodo puede diferir en
longitud. Este tipo de programa de reforzamiento ocurre con frecuencia en la vida
cotidiana. Los empleados reciben su paga al final de cada semana. A los estudiantes
se les dan calificaciones en determinados intervalos del año. En cada uno de estos
casos, el reforzamiento de intervalo produce un nivel de respuestas que es más difícil
de extinguir que las respuestas que han sido reforzadas en forma continua. Sin
embargo, el nivel de respuesta tiende a ser inferior que el producido por otros tipos
de programa.
En el reforzamiento de razón, el reforzamiento es determinado por el número de
respuestas apropiadas que emite el organismo. Un obrero en una fábrica puede recibir
su pago de acuerdo al número de piezas que termina. Los programas de reforzamiento
de razón también pueden ser fijos o variables. Si son fijos el número de respuestas
requerido antes del reforzamiento es estable y en igual cantidad cada vez. Si son
variables, el número de conductas operantes apropiadas que debe ocurrir antes del
reforzamiento cambia de vez en cuando. Mientras que un programa de reforzamiento
continuo es más efectivo para el desarrollo y fortalecimiento iniciales de conducta, un
programa de razón variables es más efectivo después de mantenerla. Las respuestas
conservadas bajo condiciones d reforzamiento de razón variable son muy resistentes a
la extinción y tienen menor probabilidad de desaparecer. Los casinos de juego han
aprendido bien esta lección. Su uso del principio de los programas de razón variable
mantiene a muchos jugadores en la mesa mucho después de que el dinero que se les
ha asignado para jugar se ha terminado.

MOLDEAMIENTO:

Con frecuencia la conducta que se desea que el animal ejecute es tan compleja y
rebuscada que no se esperaría que peste la realizara en forma natural poco después
de entrar en la caja. Supóngase que se desea entrenar a un pichón a picotear un
pequeño punto negro dentro de un círculo blanco. Si se tuviera que esperar hasta que
la conducta ocurriera de manera espontánea, se podría aguardar un largo tiempo. Por
consiguiente, Skinner empleó un procedimiento denominado moldeamiento, el cual de
manera deliberada forma o moldea la conducta del animal en fin de lograr la
conducta deseada.
Al principio, el pichón se mueve al azar por la caja. Cuando se mueve en dirección al
círculo, es reforzado con una bolita de alimento en el comedero que se encuentra
debajo de este. La siguiente vez que se acerque al círculo, es reforzado de nuevo.Más
tarde, se le permite que se acerque más al círculo antes de ser reforzado.
Luego, no es reforzado sino hasta que picotea le círculo blanco.
Por último, el pichón es reforzado solo por picotear en el pequeño punto negro dentro
del círculo.
Por medio del moldeamiento, Skinner fue capaz de inducir a los animales a ejecutar
proezas únicas y notables; enseñó a los pichones a jugar ping-pong, a guiar proyectiles
a su objetivo.
El moldeamiento es el reforzamiento de las aproximaciones sucesivas a un
comportamiento deseado.
Skinner creía que la mayor parte de la conducta animal y humana es aprendida por
medio del condicionamiento operante. El proceso de aprendizaje para hablar el
propio idioma natal implica reforzamiento y moldeamiento de conducta operante. El
niño pequeño emite ciertos sonidos espontáneos. Estos no están limitados a sonidos
de su idioma natal, sino que representan a todos los idiomas posibles. Al principio, el
niño es reforzado sólo por hablar con significado. Skinner (1986) sugirió que la
conducta verbal evolucionó del señalamiento, la imitación y otras conductas no
verbales, siguiendo las reglas de las contingencias de reforzamiento. Por tanto, el
proceso de moldeamiento está implicado en el aprendizaje del habla así como en
muchas otras conductas humanas.