Está en la página 1de 4

Para Thorndike, la explicación del aprendizaje estaba en las conexiones que se establecen entre estímulos y respuestas

(algo conocido como conexionismo o asociacionismo) a partir del ensayo y error, como vemos en el vídeo del gato y la
caja puzle. De esta manera, los organismos adquieren de manera progresiva aquellas conductas que producen
consecuencias positivas, mientras se suprimen aquellas conductas que llevan a consecuencias desagradables. En otras
palabras, la recompensa aumenta las respuestas, mientras que el castigo las elimina. De ahí, su Ley del Efecto.
Paralelamente, Thorndike pensaba que la repetición de una respuesta fortalece la conexión entre el estímulo y la
respuesta, mientras que la falta de práctica, debilita esta conexión. A este principio lo llamó Ley del Ejercicio.

Si bien las ideas de Thorndike se recuerdan más como antecedentes de las teoría modernas que por su valor actual, la
influencia de ideas como el poder de la recompensa en el aprendizaje han sido claves en el desarrollo posterior de las
teorías del aprendizaje, lo que hace de este investigador una figura muy relevante.

Posteriormente, Burrhus Frederic Skinner desarrolló el concepto de condicionamiento operante o instrumental a partir
de las ideas de Thorndike.

Skinner se planteaba dos problemas en la investigación sobre la conducta basada en consecuencias:

Si utilizamos cajas-problema o laberintos, la conducta que observamos es discreta.

¿Cómo dividir la conducta en trozos analizables, cuando en el mundo real vemos que es un continuo?

Para dar solución a estos problemas:

 Diseñó un dispositivo (caja de Skinner) que permitiese al organismo emitir la conducta sin restricciones para así
poder medir conductas semejantes a las que ocurren en el mundo real.
 Planteó la idea de operante: una unidad conductual que se define por los efectos que opera en el ambiente (da
lugar al nombre de condicionamiento operante).

Se ha de tener en cuenta que Skinner no habla de asociación estímulo-respuesta, sino de incremento de la fuerza de la
respuesta por las consecuencias que la siguen. Las respuestas a una situación que van seguidas por un refuerzo, se
fortalecen y tienen mayor probabilidad de repetirse en el futuro.

2. Condicionamiento clásico y operante ¿En qué se diferencian y cómo se complementan?


El condicionamiento clásico y operante siguen procesos diferentes, aunque nada impide que se den juntos para lograr la
instauración de conductas. De hecho, no es extraño que aparezcan juntos en la vida diaria ni en los procedimientos
experimentales.

por ejemplo, en los procedimientos de entrenamiento y moldeamiento al comedero (un tipo de procedimiento de los
llamados de operante libre) se han de combinar ambos tipos. En este entrenamiento se pretende enseñar a un animal,
por ejemplo una rata, a comer de un comedero presionando una palanca para que salga la comida. Al comenzar el
entrenamiento los animales presentan una tasa de presión de la palanca (línea base) muy baja. Primero deben aprender
cuándo está disponible la comida mediante un procedimiento de condicionamiento clásico (entrenamiento al
comedero), en el que se vincula un EC a la disponibilidad de comida (si presionas en presencia del EC saldrá comida; si el
EC no está presente, no saldrá). A continuación debe aprender a ejecutar la operante requerida (presionar la palanca)
para obtener el reforzador paso a paso (moldeamiento), al principio reforzando cualquier conducta que se asemeje a la
operante y exigiendo una respuesta cada vez más parecida a la misma (reforzamiento de aproximaciones sucesivas)
mientras se deja de reforzar las conductas iniciales (no reforzamiento de las formas de respuesta más tempranas). Esta
es la base de técnicas de modificación de conducta como el moldeamiento, por el que enseñamos conductas nuevas a
partir de conductas lo más parecidas a la conducta objetivo, que están ya en el repertorio del individuo.

4. Fases del condicionamiento operante


En la siguiente figura puedes ver cómo se adquiere y cómo se elimina una conducta aprendida por Condicionamiento
Operante.

Como ves, al principio la conducta se da en un nivel de línea base, es decir, el nivel en que el sujeto la emite antes de
reforzarla. Este nivel base puede ser cero, es decir, puede no darse la conducta en absoluto. En ese caso, la instauración
de la conducta requerirá la aplicación combinada de otras técnicas además del reforzamiento (como el moldeado, las
instrucciones o el modelado). Imaginemos que un niño nunca participa en clase. Su nivel base para la conducta de hacer
preguntas es cero y para poder reforzarla hemos primero de conseguir que la emita en algún grado; por ejemplo,
animándole, mediante instrucciones, a paticipar (Juanito, ¿Se te ocurre algún ejemplo de esto?). Una vez que
consigamos la realización de la conducta en algún grado podremos reforzarla, por ejemplo con refuerzo social como
“muy bien, Juanito, que interesante lo que has dicho” o con refuerzos materiales (una chuche) o puntos (reforzador
secundario, del que hablaremos más adelante) (no importa si al principio hay que animarle siempre a preguntar,
reforzaremos la pregunta igualmente, y el próximo paso será reforzarla únicamente si pregunta de modo espontaneo,
pero cómo hacer eso lo veremos más adelante). Si reforzamos la conducta de preguntar, ésta aumentará su frecuencia
(fase de adquisición). Al final de nuestro programa de reforzamiento (más adelante veremos los distintos programas), la
conducta llegará a tomar la forma y frecuencia estable que deseamos, es lo que se llama conducta terminal. Ahora bien,
si dejamos de reforzarla, la conducta se extinguirá, es decir, irá disminuyendo en frecuencia hasta volver a su línea base
(fase de extinción). Si esta línea base era cero, la conducta desaparecerá. Pero antes, ocurrirá un fenómeno curioso: una
vez que retiramos el reforzador, la conducta pasará por un periodo de aumento de frecuencia, en lo que se llama tren de
respuesta. ¡¡Lógico!! Juanito no comprende nada, intenta conseguir su refuerzo como antes, y pregunta y pregunta,
cada vez más, en un intento desesperado de que le refuercen. Finalmente, se dará cuenta de que no le van a reforzar, y
poco a poco dejará de preguntar, entrando en la fase de extinción.

¿Qué refuerzos podemos elegir y de qué depende que funcionen? ¿Qué podemos hacer para que Juanito no deje de
preguntar pero tampoco estar dándole chuches cada pregunta? Sigue estudiando el tema y lo averiguarás…

Si dejamos de reforzarla, la conducta se extinguirá, es decir, irá disminuyendo en frecuencia hasta volver a su línea base
(fase de extinción)

5. Elementos influyentes en el condicionamiento operante: cantidad y naturaleza del reforzador


Algo importante a tener en cuenta es la cantidad y naturaleza del reforzador. En general, a mayor cantidad de
reforzador, mayor tasa de respuesta y a “mejor cualidad” del reforzador (reforzador más atractivo), mayor tasa de
respuesta. Hay que tener en cuenta que a todas las personas no les resultan atractivos los mismos reforzadores. A
Juanito le encantan las gominolas, pero odia el chocolate. Aunque a todos los seres humanos les gusta el refuerzo social
y que les presten atención, son reforzadores muy potentes ¡y baratos!

En nuestro intento de que Juanito participe más en clase, también podemos jugar con los cambios en la cantidad y
naturaleza del reforzador. Cuando se pasa de una recompensa pequeña (o menos atractiva) a otra grande (o más
atractiva) la tasa de respuesta aumenta. Este fenómeno se conoce como contraste positivo. Por ejemplo, si Juanito no
aumenta su tasa de participaciones, podemos probar a aumentar la calidad del refuerzo; si le sonreíamos simplemente
como refuerzo, pasaremos a elogiarle o ponerle una corona de “rey de la clase”. Pero ¡ojo!: cuando se pasa de una
recompensa grande (o más atractiva) a otra pequeña (o menos atractiva) la tasa de respuesta disminuye. Si hemos
empezado dándole grandes refuerzos (por ejemplo le dábamos un coche de juguete en cada participación) y ahora
pasamos a darle sólo una gominola o sonreírle, la tasa de participación disminuirá. Este fenómeno se conoce como
contraste negativo. Así que, ya sabes, empieza siempre por pequeños refuerzos.

Y ¿Cuándo hay que reforzar? ¿Da igual que le demos la chuche o felicitemos a Juanito al final del día o es mejor hacerlo
inmediatamente después de que participe? No, no da igual. La relación conducta-reforzador (o castigo, si lo que
queremos es eliminar una conducta) es muy importante. Existen dos tipos de relaciones entre respuesta y reforzador, la
contigüidad temporal y la contingencia respuesta-reforzador. Ambos tipos de relación son independientes Y

6. Elementos influyentes en el condicionamiento operante: contingencia y balance de consecuentes


La contingencia indica al organismo cómo controlar la aparición del reforzador; es importante que el refuerzo aparezca
con más probabilidad cuando se la da conducta que queremos que aumente que cuando no se da. Si quiero que
Manolita haga la cama todas las mañanas y cada vez que la hace la doy una piruleta, es importante que sólo consiga
piruletas por hacer la cama o, al menos, que hacer la cama haga que consiga más piruletas que si no la hace. Pero si en la
cocina tiene un bote de piruletas y coge las que quiere cuando quiere, entonces la aparición de la piruleta no es
contingente a hacer la cama (la tiene haga la cama o no la haga). Esta es una razón por la que fallan muchos programas
de reforzamiento, especialmente en las aulas y hogares: no se controla realmente la contingencia, estando disponibles
los reforzadores aunque no se hagan las conductas objetivo.

Puede haber refuerzos por una conducta y también castigos por esas mismas conductas

Otra razón puede ser la existencia de otros consecuentes. Así, puede haber refuerzos por una conducta y también
castigos por esas mismas conductas. Por ejemplo, nosotros reforzamos a Pepe por comportarse bien en clase y traer
siempre las tareas hechas y bien presentadas, pero los amigos se ríen de él por esa misma razón (castigo positivo), dejan
de querer jugar con él cuando hace esas conductas (castigo negativo). Como ves, una misma conducta tiene,
normalmente, muchos consecuentes y la conducta resultado es consecuencia del balance entre unos y otros.

Por supuesto, también influye en la realización (o no) de una conducta el hecho de tener que elegir, a veces, entre ésta y
otras conductas incompatibles. Es decir, pueden existir otras conductas incompatibles con la primera que supongan la
obtención de refuerzos. Por ejemplo, imaginemos que los amigos de Pepe le alaban cuando no trae los deberes hechos y
se enfrenta al profesor (refuerzo positivo de conducta incompatible). Pepe debe elegir entre dos conductas: traer los
deberes y seguir las normas o no traer los deberes y enfrentarse a los profesores, cada una con un refuerzo asociado y
también unos castigos. A esto se le llama conducta de elección, y lo veremos más adelante en este mismo tema.

8. Programas simples de reforzamiento: Tipos de Programas


Denominamos programa de reforzamiento a la regla que establece cómo y cuándo una respuesta irá seguida de su
reforzador.

Continuo: En los programas continuos el refuerzo aparece cada vez que se emite la conducta.

Parcial o intermitente: No todas las conductas son reforzadas.

De intervalo: Es un tipo de programa parcial en el que las respuestas son reforzadas sólo si ocurren cuando ha
transcurrido un intervalo determinado de tiempo desde la última vez que se entregó el reforzador.

Intervalo Fijo: Si es de intervalo Fijo (abreviado IF, seguido se señala el tiempo) este tiempo siempre es el mismo,
permanece estable. Por ejemplo, en un trabajo el sueldo (reforzador) se da únicamente una vez al mes, a final de mes (IF
1 mes). No importa si trabajas mucho durante ese mes, ni cuanto vayas a ver a tu jefe, sólo recibirás un nuevo sueldo un
mes después del anterior.

Intervalo Variable: En ese caso, el intervalo de tiempo no es fijo, sino que varía alrededor de una media. Su abreviatura
es IV y seguido aparece el tiempo medio de los intervalos. Por ejemplo, puedo llevar al cine a mis hijos una vez cada 4
semanas como media (IV 4 semanas. Si no se portan bien no les llevo, pero si se portan bien les llevaré sólo si hace
tiempo que no vamos, como media, si hace 4 semanas que no vamos (a veces serán 2 semanas y a veces 6 semana). Por
muy bien que se porten, no les llevo hoy y mañana otra vez.

De Razón: El reforzamiento depende del número de respuestas que el organismo realiza.

Razón Fija: El número de respuestas es fijo. Por ejemplo, otorgamos un punto extra en una asignatura cada 7 trabajos
voluntarios entregados (abreviado RF7). Fíjate que los programas continuos son, realmente, programas de razón fija de
tasa 1 (RF1).

Razón variable: El número de respuestas requerido para obtener el reforzador es variable, en torno a una media. Por
ejemplo, damos un premio cada cierto número de veces que un alumno participa en clase, pero este número fluctúa en
torno a una media, pueden ser 8 o pueden ser 10, la media es 9 (RV9).

NOTA: tanto en los programas IF como IV, una vez transcurrido el tiempo prefijado, puede o no haber un límite de
tiempo para ejecutar la conducta. Si lo hay, se llama espera limitada.
El Condicionamiento clásico, explicado

Una de las características más importantes de este tipo de aprendizaje es que implica respuestas automáticas o reflejas,
no conductas voluntarias (a diferencia del Condicionamiento operante o instrumental). Se denominó "condicionamiento
clásico" a la creación de una conexión entre un estímulo nuevo y un reflejo ya existente, por tanto, es un tipo de
aprendizaje según el cual un estímulo originalmente neutro, que no provoca una respuesta, llega a poder provocarla
gracias a la conexión asociativa de este estímulo con el estímulo que normalmente provoca dicha respuesta.

El Condicionamiento clásico sentó las bases del conductismo, una de las escuelas más importantes de la psicología, y
nace como consecuencia de los estudios Pavlov, un psicólogo ruso que se interesó por la fisiología de la digestión,
especialmente en los reflejos de salivación en perros.

La teoría del Condicionamiento clásico: conceptos generales

El Condicionamiento clásico también se denomina modelo estímulo-respuesta o aprendizaje por asociaciones (E-R). Los
resultados de sus investigaciones, le valieron a Pavlov el premio Nobel en 1904.

En el proceso, diseñó el esquema del Condicionamiento clásico a partir de sus observaciones:

 El Estímulo Incondicionado (EI) es un estímulo que de manera automática provoca una respuesta del organismo.
 La Respuesta Incondicionada (RI) es la respuesta que ocurre en el organismo de manera automática cuando está
presente un estímulo incondicionado. Para Pavlov sería la cantidad de saliva que el perro segregaba cuando se le
presentaba la comida.
 El Estímulo neutro (EN) es un estímulo que cuando está presente en el medio no provoca ningún tipo de
respuesta en el organismo.
 Cuando un estímulo neutro se ha asociado temporalmente con un estímulo incondicionado, éste pasa a ser
Estímulo Condicionado (EC), ya que es capaz por sí mismo de provocar una respuesta parecida a la que
provocaba el estímulo incondicionado.
 La Respuesta Condicionada (RC) es la respuesta que aparece al presentarse sólo el estímulo condicionado. Para
Pavlov sería la cantidad de saliva que segregaban los perros cuando se les presentaba sólo el estímulo auditivo o
visual.
 Generalmente la RC es más débil que la RI y tiene una mayor latencia, es decir, tarda más en darse una vez que
el estímulo está presente.

Las aportaciones de Watson al conductismo

Fascinado por los descubrimientos de Pavlov, John Watson propuso que el proceso de Condicionamiento clásico podía
explicar también el aprendizaje en los humanos. Como conductista clásico, pensó que las emociones también se
aprendían mediante la asociación condicionada, y de hecho, pensó que las diferencias en el comportamiento entre
humanos eran provocadas por las distintas experiencias que cada uno vivía.

El experimento del pequeño Albert (de John Watson)

Para ello, llevó a cabo “el experimento con el pequeño Albert”, un bebé de 11 meses, junto con su colaboradora Rosalie
Rayner, en la Universidad Johns Hopkins (Estados Unidos), pues pretendía averiguar si es posible condicionar a un
animal cuando éste se asocia a un ruido fuerte (golpe de martillo sobre una tabla metálica) que provoca una respuesta
de miedo.

La asociación del golpe de un martillo sobre la tabla de metal (EI) y la presencia de una rata blanca (EC) que previamente
era un estímulo neutro, acabó por provocar una respuesta emocional de miedo (RC) ante la sola presencia de la rata,
demostrando así que el miedo podía ser aprendido por condicionamiento clásico. Este es el mecanismo más habitual de
adquisición de fobias. Huelga decir que este experimento no se podría realizar hoy en día, puesto que sobrepasa los
límites de la ética científica.

Puedes descubrir más sobre el experimento del pequeño Albert entrando en este post:

También podría gustarte