Condicionamiento Operante o Instrumental

CONDICIONAMIENTO OPERANTE O INSTRUMENTAL
El condicionamiento instrumental o condicionamiento operante es un tipo de aprendizaje

que sucede cuando los hechos son un resultado directo de la conducta del individuo. Es decir,
las acciones o conductas de un individuo, pueden ser modificadas por sus consecuencias
mediante el condicionamiento instrumental. 7 mayo 2015.
El condicionamiento operante es una forma de aprendizaje mediante la cual un sujeto tiene
más probabilidades de repetir las formas de conducta que conllevan consecuencias positivas y
menos probabilidades de repetir las que conllevan consecuencias negativas. Es un tipo de
aprendizaje asociativo que tiene que ver con el desarrollo de nuevas conductas en función de
sus consecuencias, y no con la asociación entre estímulos y conductas como ocurre en el
condicionamiento clásico.
El término fue introducido por Burrhus Frederic Skinner, aunque hoy se prefiere el de
«condicionamiento instrumental», introducido por Edward Thorndike, por ser más descriptivo.
Este último sugiere que la conducta sirve de instrumento para conseguir un fin y se da por
ensayo y error, a diferencia del condicionamiento operante planteado por Skinner, que propone
que aquellas respuestas que se vean reforzadas tienen tendencia a repetirse y aquellas que
reciban un castigo tendrán menos probabilidad de repetirse.
La investigación sobre el condicionamiento operante ha dado lugar a una tecnología muy
minuciosa para la enseñanza, denominada modificación de conducta.
El psicólogo Edward Thorndike (1874-1949) fue uno de los pioneros en el estudio del
condicionamiento instrumental. Para ello, ideó sus denominadas «cajas de solución de
problemas», que eran jaulas de las que los gatos (que eran los animales con los que trabajaba)
podían escapar mediante acciones simples como manipular un cordón, presionar una palanca
o pisar una plataforma. Como incentivo para resolver el problema, el gato podía ver y oler que
fuera de la caja había comida, pero no podía alcanzarla. Al principio, el gato comenzaba a
hacer movimientos azarosos, hasta que casualmente resolvía el problema, por ejemplo tirando
de la polea que abría la jaula. Sin embargo, cada vez que Thorndike metía al gato en la jaula,
tardaba menos en salir. Esto se debía a que se estaba produciendo un condicionamiento
operante: la conducta de tirar de la polea estaba siendo reforzada por su consecuencia (la
apertura de la caja y la obtención de la comida). Esta conducta, al ser reforzada, se convertía
en la conducta más probable en un futuro cuando las circunstancias eran similares.
Caja de Skinner
A partir de estos experimentos, Thorndike estableció un principio
que denominó Ley del efecto: «Cualquier conducta que en una
situación produce un efecto satisfactorio, se hará más probable en
el futuro». Si la respuesta va seguida de una consecuencia
satisfactoria, la asociación entre el estímulo y la respuesta se
fortalece; si a la respuesta le sigue una consecuencia desagradable,
la asociación se debilita. En otras palabras, Thorndike defendía que
todos los animales, incluyendo al ser humano, resuelven los
problemas mediante el aprendizaje por ensayo y error.
También los estudios de Pávlov sobre condicionamiento clásico tuvieron una gran influencia en
el estudio del condicionamiento operante. Si bien se trata de procesos de aprendizaje
diferentes, el condicionamiento clásico y el operante comparten varios de sus principios, como
la adquisición, la extinción, la discriminación o la generalización.
El autor más importante en el estudio del condicionamiento operante es B. F. Skinner. A finales
de la década de 1920 empezó a trabajar con palomas. Para ello, utilizaba un ambiente libre de
distracciones denominado caja de Skinner, en el que se podían manipular las condiciones en
las que se proporcionaba alimento a los animales. Sus exhaustivos estudios utilizando este
artefacto permitieron a Skinner descubrir muchos de los factores que influyen en el
condicionamiento operante.
Existen cuatro procedimientos o tipos de condicionamiento instrumental:
 Refuerzo positivo o condicionamiento de recompensa: Un refuerzo positivo es un
objeto, evento o conducta cuya presencia incrementa la frecuencia de la respuesta por
parte del sujeto. Se trata del mecanismo más efectivo para hacer que tanto animales
como humanos aprendan. Se denomina «refuerzo» porque aumenta la frecuencia de la
conducta, y «positivo» porque el refuerzo está presente. Refuerzos positivos típicos son
las alabanzas, los regalos o las aportaciones monetarias. Sin embargo, hay que tener en
cuenta que en ocasiones algo que ordinariamente se considera desagradable puede
funcionar como refuerzo positivo, ya que de hecho incrementa la probabilidad de la
respuesta (como cuando se grita a un niño ante una rabieta, y este se siente reforzado
porque así llama la atención).
 Refuerzo negativo: Un refuerzo negativo es un objeto, evento o conducta cuya retirada
incrementa la frecuencia de la respuesta por parte del sujeto. Al igual que el anterior, se
denomina «refuerzo» porque aumenta la frecuencia de la conducta, pero «negativo»
porque la respuesta se incrementa cuando el refuerzo desaparece. En el refuerzo
negativo se pueden distinguir dos procedimientos:
o Condicionamiento de escape: En este caso, la frecuencia de una respuesta
aumenta porque interrumpe un estímulo aversivo, es decir, un suceso que está
ocurriendo y que el sujeto considera desagradable. Un ejemplo típico sería el de
un animal que aprieta una palanca porque así elimina una corriente eléctrica o el
de un padre que le compra una chuchería a su hijo para dejar de oírle llorar.
o Condicionamiento de evitación : En este caso, la frecuencia de una respuesta
aumenta porque pospone o evita un estímulo aversivo futuro. Un ejemplo típico
sería el de un alumno que estudia para evitar una mala nota.
 Entrenamiento de omisión : Se produce cuando la respuesta operante impide la
presentación de un refuerzo positivo o de un hecho agradable; es decir, consiste en
retirar el estímulo positivo de una conducta para así provocar la extinción de la
respuesta. Un ejemplo importante es el de «tiempo fuera», en el que se retira la atención
de un niño aislándolo durante un cierto período de tiempo.
 Castigo: El castigo provoca la disminución de una conducta porque el suceso que la
sigue es un estímulo aversivo. Un ejemplo típico es castigar a una rata con una pequeña
corriente eléctrica cuando pulsa una palanca. Aunque el castigo puede ser en ocasiones
muy eficaz para hacer que desaparezca una conducta, se recomienda utilizarlo lo
menos posible, ya que tiene muchos efectos adversos o no deseados. En muchas
ocasiones la conducta sólo desaparece temporalmente o únicamente en los contextos
en los que es probable el castigo. Además, genera gran cantidad de consecuencias
secundarias (como frustración, agresividad, etc.) que pueden hacer que se detenga el
proceso de aprendizaje. Por eso, en la aplicación de castigos es importante seguir
ciertas reglas, como reforzar al mismo tiempo conductas alternativas a la castigada,
aplicarlo inmediatamente después de la conducta que se quiere suprimir, o ser
constante (ya que castigar una conducta sólo a veces produce un efecto contrario al que
se desea).
Lo que es o no es un refuerzo durante el condicionamiento operante depende del individuo y

de las circunstancias en que se encuentra en ese momento. Por ejemplo, unas galletas pueden
suponer un refuerzo para un perro hambriento, pero no para uno que acaba de comer carne.
Los refuerzos se pueden dividir en dos grandes grupos: los primarios o intrínsecos y los
secundarios o extrínsecos.
 Se dice que un reforzador es primario o intrínseco cuando la respuesta es reforzante
por sí misma, es decir, cuando la respuesta es en sí una fuente de sensaciones
agradables y la acción se fortalece automáticamente cada vez que ocurre. Existen
varios tipos de conductas que son intrínsecamente reforzantes. Por ejemplo, las
respuestas que satisfacen necesidades fisiológicas, como beber cuando se tiene sed o
comer cuando se tiene hambre, son intrínsecamente agradables para la mayoría de los
organismos. Muchas actividades sociales o que brindan estimulación sensorial o
intelectual son también con frecuencia intrínsecamente reforzantes, al igual que la
sensación de progreso en una habilidad. También pueden ser reforzantes por sí mismas
todas las conductas que ayudan a un organismo a evitar algún daño. Sin embargo, las
actividades intrínsecamente gratificadoras no siempre son reforzantes desde el principio;
por ejemplo, se necesita cierta habilidad antes de que una actividad que requiere
competencia (como tocar un instrumento musical, por ejemplo) se vuelva
inherentemente satisfactoria.
 Los refuerzos secundarios o extrínsecos son aprendidos, y en ellos el premio o
gratificación no es parte de la actividad misma, sino que obtienen su carácter de
refuerzo por asociación con los reforzadores primarios. Por ejemplo, las recompensas
monetarias se convierten en refuerzo porque permiten a su vez conseguir refuerzos
primarios. Un tipo de reforzadores extrínsecos especialmente importante, que pueden
influir enormemente cuando se trata de modificar la conducta humana, son los
reforzadores sociales como el afecto, la atención o la aprobación.
En la vida real, diversos reforzadores intrínsecos y extrínsecos se encuentran habitualmente
entremezclados en un mismo suceso reforzante.
FASES DEL CONDICIONAMIENTO OPERANTE:

 Adquisición: La adquisición de la respuesta se refiere a la fase del aprendizaje en que
la respuesta es seguida por reforzadores. Durante la adquisición la respuesta se vuelve
más fuerte o más frecuente, debido a su relación con la consecuencia reforzante.
 Generalización: Las respuestas fortalecidas mediante procedimientos operantes en un
conjunto de circunstancias tienden a extenderse o a generalizarse en situaciones
similares, al igual que ocurre en el condicionamiento clásico. Cuando más parecidos
sean los contextos, más probable es la generalización.
 Discriminación: Los individuos desarrollan también discriminaciones al reforzarse las
respuestas en una situación, pero no en otra.
 Extinción: Cuando se retira el reforzamiento para alguna respuesta particular, dicha
conducta disminuye su frecuencia gradualmente hasta que sólo ocurre con la misma
frecuencia con que ocurría antes del reforzamiento. Sin embargo, es importante advertir
que en muchas ocasiones, después de que se retiren los reforzadores, se advierte
inicialmente un aumento de la cantidad de respuesta y de la frustración antes de que
empiece la disminución.
 Recuperación espontánea: Al igual que en el condicionamiento clásico, las respuestas
que se han extinguido vuelven a aparecer algunas veces, es decir, se da una
recuperación espontánea después de un descanso
Los programas de reforzamiento son reglas que indican el momento y la forma en que la
aparición de la respuesta va a ir seguida de un reforzador sobre la administración del
reforzador. Estos programas influyen en distintos aspectos del aprendizaje, como la rapidez
con la que se aprende inicialmente la respuesta, la frecuencia con la que se ejecuta la
respuesta aprendida, la frecuencia con la que se hacen las pausas después de los
reforzamientos, o el tiempo que se sigue ejecutando la respuesta una vez que el refuerzo deja
de ser predecible o se suspende.
Existen dos tipos básicos de reforzamiento: el reforzamiento continuo y el reforzamiento
intermitente. En el reforzamiento continuo cada una de las respuestas da lugar a la aparición
de un reforzador, como en el caso de una paloma que recibe comida cada vez que picotea una
tecla. Este tipo de reforzamiento parece ser el modo más eficaz para condicionar inicialmente
la conducta. Sin embargo, cuando el refuerzo cesa (por ejemplo, cuando desconectamos la
entrega de alimento) la extinción también es rápida. Por su parte, en el reforzamiento
intermitente las respuestas sólo se refuerzan algunas veces, como en el caso de una persona
que juega a las máquinas y recibe el refuerzo o premio cada varias jugadas. Este tipo de
programa produce un patrón más persistente de respuestas que un programa continuo cuando
el reforzamiento se vuelve impredecible o cesa. Una combinación de reforzamiento intermitente
y de refuerzo continuo es muy eficaz cuando se trata de enseñar a los sujetos mediante
condicionamiento operante: al principio se utiliza un reforzamiento continuo, para que se
adquiera la respuesta, y luego se pasa a un reforzamiento intermitente, para que sea más difícil
que se extinga.
El reforzamiento intermitente da lugar a los programas de reforzamiento, que pueden ser de
dos tipos: de razón (en función del número de respuestas) y de intervalo (en función del
tiempo). A su vez, cada uno de ellos admite dos tipos de administración: fija o variable.
 Razón fija: El refuerzo se obtiene después de un número fijo de respuestas. Un ejemplo
se da cuando las fábricas pagan a sus obreros después de producir un determinado
número de productos. En realidad, el reforzamiento continuo es un programa de este
tipo de razón 1. Los individuos responden con una tasa relativamente mayor de
respuestas cuando operan bajo programas de razón fija superior a 1 (dependerá del
caso aplicar la razón más adecuada), pero por lo general hacen una pausa para
descansar después de recibir el reforzamiento, antes de proseguir con la respuesta.
 Razón variable: En este caso, el número de respuestas para conseguir el reforzador
varía aleatoriamente, aunque siempre dentro de un promedio determinado. Un ejemplo
son las máquinas tragamonedas, que están programadas para otorgar el premio
conforme a un programa de razón variable. Muchos reforzadores naturales, como el
éxito o el reconocimiento, se acercan mucho a este tipo de programas. Los programas
de razón variable producen una tasa de respuesta global elevada sostenida, y los
individuos no hacen pausa después del refuerzo. Aparentemente, la incertidumbre de no
saber cuándo va a llegar el siguiente reforzador mantiene a los organismos produciendo
la respuesta constantemente.
 Intervalo fijo: El refuerzo aparece cada vez que trascurre una determinada cantidad de
tiempo, siempre que durante el intervalo se haya dado la respuesta. Un ejemplo sería el
de un padre que verifica cada media hora que su hijo está estudiando, y cuando es así
le hace un halago. Los programas de intervalo fijo producen una tasa de respuestas
desigual. Una vez que se administra el refuerzo, la tasa de respuestas tiende a ser baja.
Durante el intervalo, la conducta aumenta típicamente hasta alcanzar un nivel elevado
inmediatamente antes del siguiente reforzador programado. La cantidad global de
respuestas en un programa de intervalos fijos es moderada.
 Intervalo variable: El refuerzo está disponible después de un tiempo que varía
aleatoriamente, pero alrededor de un promedio. Un ejemplo es el de un profesor que
realiza exámenes sorpresa aproximadamente cada semana. Este tipo de programa por
lo general produce una tasa de respuesta constante, pero moderada.
Por lo general, los programas de tasa (razón) producen una adquisición más rápida, pero
fácilmente extinguible una vez suspendida la administración de reforzadores; y los de intervalo
producen una adquisición más estable y resistente a la extinción. En la vida real, estos
programas básicos a menudo se combinan.
Distinción entre condicionamiento clásico y operante

 En el condicionamiento clásico la asociación se da entre un estímulo condicionado y uno
incondicionado. En el condicionamiento instrumental, la asociación se da entre las
respuestas y las consecuencias que se derivan de ellas.
 En el condicionamiento clásico, el estímulo incondicionado no depende de la respuesta
del sujeto, mientras que en el operante las consecuencias dependen de la respuesta del
sujeto.
 En el condicionamiento clásico, la respuesta del sujeto es involuntaria, mientras que en
el instrumental es generalmente voluntaria.
Edward Lee Thorndike (pr. [θ'oRn daik]) (Williamsburg, 31 de agosto de 1874-Montrose, 9 de

agosto de 1949) fue un psicólogo y pedagogo estadounidense, considerado un antecesor de la
psicología conductista estadounidense. Sus principales aportaciones fueron el aprendizaje por
ensayo/error y la ley del efecto. Sus estudios sobre la conducta animal le permitieron
desarrollar la teoría del conexionismo.
Los experimentos de Thorndike muestran dos factores importantes del condicionamiento
operante. El primero es la respuesta operante, se realiza cuando se escoge una respuesta en
particular (respuesta operante) entre varias conductas y después nos enfocamos en observarla
y modificarla.
El segundo elemento es la consecuencia que acompaña a la conducta, es decir a lo que se
conoce como reforzamiento. Un reforzamiento es una acción (consecuencia) que tiene como
objetivo aumentar la probabilidad de que una conducta se repita.
Para Thorndike el uso del reforzamiento es de suma importancia, ello se refleja en su ley del
efecto que dice “En igualdad de circunstancias, las respuestas que se acompañan o son
seguidas inmediatamente por satisfacción tenderán más a repetirse; las que se acompañan o
que son seguidas inmediatamente por molestar tendrán menos probabilidad de ocurrir”.
Dentro de los procedimientos conductuales, el condicionamiento operante o instrumental es

probablemente el que tiene aplicaciones más numerosas y variadas.
Desde el tratamiento de fobias hasta la superación de adicciones como el tabaquismo o el
alcoholismo, el esquema operante permite conceptualizar y modificar prácticamente cualquier
hábito a partir de la intervención sobre unos pocos elementos.
Pero ¿en qué consiste exactamente el condicionamiento operante? En este artículo
repasamos los conceptos clave para entender este paradigma y detallamos sus aplicaciones
más frecuentes, tanto para aumentar conductas como para reducirlas.
Antecedentes del condicionamiento operante

El condicionamiento operante tal y como lo conocemos fue formulado y sistematizado por
Burrhus Frederic Skinner en base a las ideas planteadas previamente por otros autores.
Ivan Pavlov y John B. Watson habían descrito el condicionamiento clásico, también
conocido como condicionamiento simple o pavloviano.
Por su parte, Edward Thorndike introdujo la ley del efecto, el antecedente más claro del
condicionamiento operante. La ley del efecto plantea que si una conducta tiene consecuencias
positivas para quien la realiza será más probable que se repita, mientras que si tiene
consecuencias negativas esta probabilidad disminuirá. En el contexto de la obra de Thorndike
el condicionamiento operante es denominado “instrumental”.
Diferencia entre condicionamiento clásico y operante

La diferencia principal entre el condicionamiento clásico y el operante es que el primero se
refiere al aprendizaje de información sobre un estímulo, mientras que el segundo implica un
aprendizaje sobre las consecuencias de la respuesta.
Skinner opinaba que la conducta era mucho más fácil de modificar si se manipulaban sus
consecuencias que si simplemente se asociaban estímulos a ésta, como sucede en el
condicionamiento clásico. El condicionamiento clásico se basa en la adquisición de respuestas
reflejas, con lo cual explica una menor cantidad de aprendizajes y sus usos son más limitados
que los del operante, ya que éste hace referencia a conductas que el sujeto puede controlar a
voluntad.
 Artículo relacionado: “El condicionamiento clásico y sus experimentos más importantes”
Conceptos del condicionamiento operante
A continuación definiremos los conceptos básicos del condicionamiento operante para
entender mejor este procedimiento y sus aplicaciones.
Muchos de estos términos son compartidos por las orientaciones conductuales en general, si
bien pueden tener connotaciones específicas dentro del paradigma operante.
Respuesta instrumental u operante
Este término designa cualquier conducta que conlleva una consecuencia determinada y
es susceptible de cambiar en función de ésta. Su nombre indica que sirve para obtener algo
(instrumental) y que actúa sobre el medio (operante) en lugar de ser provocada por éste, como
sucede en el caso del condicionamiento clásico o respondiente.
En la teoría conductista la palabra “respuesta” es básicamente equivalente a “conducta” y
“acción”, si bien “respuesta” parece hacer referencia en mayor medida a la presencia de
estímulos antecedentes.
Consecuencia
En la psicología conductista y cognitivo-conductual una consecuencia es el resultado de una
respuesta. La consecuencia puede ser positiva (refuerzo) o negativa (castigo) para el
sujeto que lleve a cabo la conducta; en el primer caso la probabilidad de que se dé la respuesta
aumentará y en el segundo disminuirá.
Es importante tener en cuenta que las consecuencias afectan a la respuesta y, por tanto, en el
condicionamiento operante lo que es reforzado o castigado es dicha conducta, no la persona o
el animal que la lleva a cabo.
Reforzamiento
Este término designa las consecuencias de las conductas cuando hacen más probable
que se vuelvan a dar. El reforzamiento puede ser positivo, en cuyo caso estaremos hablando
de la obtención de una recompensa o premio por la ejecución de una respuesta, o negativo,
que engloba la desaparición de estímulos aversivos.
Dentro del reforzamiento negativo podemos distinguir entre respuestas de evitación y de
escape. Las conductas de evitación previenen o impiden la aparición de un estímulo aversivo;
por ejemplo, una persona con agorafobia que no sale de casa porque así no siente ansiedad
está evitando esta emoción. En cambio las respuestas de escape hacen que el estímulo
desaparezca cuando ya está presente.
La diferencia con la palabra “reforzador” es que ésta se refiere al evento que se da como
consecuencia de la conducta en vez de al procedimiento de premiar o castigar. Por tanto,
“reforzador” es un término más cercano a “recompensa” y “premio” que a “reforzamiento”.
Castigo
Un castigo es cualquier consecuencia de una conducta determinada que disminuya la
probabilidad de que ésta se repita.
Como el reforzamiento, el castigo puede ser positivo o negativo. El castigo positivo se
corresponde con la presentación de un estímulo aversivo después de que se produzca la
respuesta, mientras que el castigo negativo es la retirada de un estímulo apetitivo como
consecuencia de la conducta.
El castigo positivo se puede relacionar con el uso que se da en general a la palabra “castigo”,
mientras que el castigo negativo se refiere más bien a algún tipo de sanción o multa. Si un niño
no deja de gritar y recibe una bofetada de su madre para que se calle se le estará aplicando un
castigo positivo, mientras que si en vez de eso le quita la consola a la que está jugando recibirá
un castigo negativo.
 Artículo relacionado: “8 razones para no usar el castigo físico hacia los hijos”
Estímulo discriminativo y estímulo delta
En Psicología, la palabra “estímulo” se utiliza para designar eventos que provocan una
respuesta por parte de una persona o animal. Dentro del paradigma operante, el estímulo
discriminativo es aquel cuya presencia indica al sujeto de aprendizaje que si lleva a cabo una
determinada conducta ésta tendrá como consecuencia la aparición de un reforzador o de
un castigo.
Por contra, la expresión “estímulo delta” se refiere a aquellas señales que, al estar presentes,
informan de que la ejecución de la respuesta no conllevará consecuencias.
¿En qué consiste el condicionamiento operante?
El condicionamiento instrumental u operante es un procedimiento de aprendizaje que se basa
en que la probabilidad de que se dé una respuesta determinada depende de las
consecuencias esperadas. En el condicionamiento operante la conducta es controlada por
estímulos discriminativos presentes en la situación de aprendizaje que transmiten información
sobre las consecuencias probables de la respuesta.
Por ejemplo, un cartel de “Abierto” en una puerta nos indica que si intentamos girar el pomo lo
más probable es que se abra. En este caso el cartel sería el estímulo discriminativo y la
apertura de la puerta funcionaría como reforzador positivo de la respuesta instrumental de girar
el pomo.
El análisis conductual aplicado de B. F. Skinner
Skinner desarrolló técnicas de condicionamiento operante que se engloban en lo que
conocemos como “análisis de conducta aplicado”. Éste se ha mostrado particularmente eficaz
en la educación de niños, con un énfasis especial en los niños con dificultades del desarrollo.
El esquema básico del análisis conductual aplicado es el siguiente. En primer lugar se plantea
una meta conductual, que consistirá en el aumento o la reducción de comportamientos
determinados. En función de esto se reforzarán las conductas que se quiere desarrollar y se
reducirán los incentivos existentes para la realización de las conductas que se pretende inhibir.
En general la retirada de reforzadores es más deseable que el castigo positivo puesto que
genera menos rechazo y hostilidad por parte del sujeto. No obstante el castigo puede ser útil
en casos en que la conducta problema es muy disruptiva y requiere una reducción rápida, por
ejemplo si se da violencia.
Durante todo el proceso es fundamental monitorear el progreso de forma sistemática para
poder comprobar con objetividad si los objetivos deseados se están produciendo. Esto se lleva
a cabo principalmente mediante el registro de datos.
Técnicas operantes para desarrollar conductas
Dadas la importancia y la eficacia del refuerzo positivo, las técnicas operantes para aumentar
conductas tienen una utilidad demostrada. A continuación describiremos los más relevantes de
entre estos procedimientos.
1. Técnicas de instigación
Se consideran técnicas de instigación aquellas que dependen de la manipulación de
estímulos discriminativos para aumentar la probabilidad de que se dé una conducta.
Este término incluye las instrucciones que incrementan determinadas conductas, la guía física,
que consiste en mover o colocar partes del cuerpo de la persona entrenada, y el modelado, en
que se observa a un modelo realizando una conducta para poder imitarlo y aprender cuáles
son sus consecuencias. Estos tres procedimientos tienen en común que se centran en
enseñar directamente al sujeto cómo tiene que realizar una acción determinada, sea
verbal o físicamente.
2. Moldeamiento
Consiste en acercar gradualmente una conducta determinada a la conducta objetivo,
empezando por una respuesta relativamente parecida que el sujeto pueda realizar y
modificándola poco a poco. Se lleva a cabo por pasos (aproximaciones sucesivas) a los que
se aplica reforzamiento.
El moldeamiento es considerado especialmente útil para establecer conductas en sujetos que
no se pueden comunicar verbalmente, como las personas con discapacidad intelectual
profunda o los animales.
3. Desvanecimiento
El desvanecimiento se refiere a la retirada gradual de las ayudas o instigadores que se
habían utilizado para reforzar una conducta meta. Se pretende que el sujeto consolide una
respuesta y posteriormente pueda llevarla a cabo sin necesidad de ayudas externas.
Este procedimiento consiste fundamentalmente en sustituir un estímulo discriminativo por otro
distinto.
4. Encadenamiento
Una cadena conductual, es decir, una conducta compuesta por varias conductas simples, se
separa en distintos pasos (eslabones). A continuación el sujeto debe aprender a ejecutar los
eslabones uno a uno hasta lograr llevar a cabo la cadena completa.
El encadenamiento puede realizarse hacia delante o hacia atrás y tiene como peculiaridad que
cada eslabón refuerza al anterior y funciona como estímulo discriminativo del siguiente.
5. Programas de reforzamiento
En un procedimiento de aprendizaje operante, los programas de reforzamiento son las pautas
que establecen cuándo la conducta será premiada y cuándo no.
Hay dos tipos básicos de programas de reforzamiento: los de razón y los de intervalo. En los
programas de razón se obtiene el reforzador después de que se dé un número concreto de
respuestas, mientras que en los de intervalo esto sucede después de que haya pasado un
tiempo determinado desde la última conducta reforzada y ésta vuelva a darse.
Ambos tipos de programa pueden ser fijos o variables, lo cual indica que el número de
respuestas o el intervalo de tiempo necesarios para la obtención del reforzador pueden ser
constantes u oscilar en torno a un valor promedio. También pueden ser continuos o
intermitentes; esto significa que la recompensa puede darse cada vez que el sujeto lleve a
cabo la conducta objetivo o bien de vez en cuando (aunque siempre como consecuencia de
una emisión de la respuesta deseada).
El reforzamiento continuo es más útil para establecer conductas y el intermitente para
mantenerlas. Así, teóricamente un perro aprenderá más rápido a dar la pata si le damos un
premio cada vez que nos ofrezca la pata, pero una vez aprendida la conducta será más difícil
que deje de hacerla si le damos el reforzador uno de cada tres o cinco intentos.
Técnicas operantes para reducir o eliminar conductas
Al aplicar técnicas operantes para reducir conductas conviene tener en mente que, dado que
estos procedimientos pueden ser desagradables para los sujetos, siempre es preferible utilizar
los menos aversivos cuando sea posible. Asimismo estas técnicas son preferibles a los
castigos positivos.
A continuación presentamos un listado de estas técnicas en orden de menor a mayor potencial
de generar aversión.
1. Extinción: Se deja de recompensar una conducta que había sido reforzada con
anterioridad. Esto disminuye la probabilidad de que la respuesta vuelva a darse. Formalmente
la extinción es lo opuesto al reforzamiento positivo.
A largo plazo la extinción es más eficaz para eliminar respuestas que el castigo y el resto
de técnicas operantes para reducir conductas, si bien puede ser más lenta.
Un ejemplo básico de extinción es lograr que un niño pare de patalear simplemente
ignorándolo hasta que se dé cuenta de que su conducta no tiene las consecuencias deseadas
(por ejemplo el enfado de los padres, que funcionaría como reforzador) y se harte.
2. Entrenamiento de omisión: En este procedimiento, a la conducta del sujeto le sigue la

ausencia de la recompensa; es decir, si se da la respuesta no se obtendrá el reforzador. Un
ejemplo del entrenamiento de omisión podría ser que unos padres impidan a su hija ver la
televisión esa noche por haberles hablado de forma irrespetuosa.
3. Programas de reforzamiento diferencial: Son un subtipo especial de programa de

reforzamiento que se utiliza para reducir (no eliminar) las conductas objetivo aumentando
otras respuestas alternativas. Por ejemplo, se podría premiar a un niño por leer y por hacer
ejercicio y no por jugar a la consola si se pretende que esta última conducta pierda valor
reforzante.
En el reforzamiento diferencial de tasas bajas se refuerza la respuesta si se da un determinado
periodo de tiempo después de la última vez que se produjo. En el reforzamiento diferencial de
omisión el refuerzo se obtiene si, después de un periodo de tiempo determinado, la respuesta
no se ha producido. El reforzamiento diferencial de conductas incompatibles consiste en
reforzar respuestas incompatibles con la conducta problema; este último procedimiento se
aplica a los tics y la onicofagia, entre otros trastornos.
4. Coste de respuesta: Variante del castigo negativo en que la ejecución de la conducta

problema provoca la pérdida de un reforzador. El carnet de puntos para conductores que se
introdujo en España hace unos años es un buen ejemplo de programa de coste de respuesta.
5. Tiempo fuera: El tiempo fuera consiste en aislar al sujeto, en general niños, en un entorno
no estimulante en caso de que se produzca la conducta problemática. También una variante
del castigo negativo, se diferencia del coste de respuesta en que lo que se pierde es la
posibilidad de acceder al refuerzo, no el reforzador en sí.
6. Saciación: El refuerzo que se obtiene por llevar a cabo la conducta es tan intenso o
cuantioso que pierde el valor que tenía para un sujeto. Esto puede tener lugar por saciación
de respuesta o práctica masiva (repetir la conducta hasta que deje de ser apetitiva) o bien por
saciación de estímulo (el reforzador pierde su apetitividad por exceso).
7. Sobrecorrección: La sobre-corrección consiste en aplicar un castigo positivo relacionado

con la conducta problema. Por ejemplo, es muy utilizada en casos de enuresis, en que se
pide al niño que lave las sábanas después de orinarse encima durante la noche.
Técnicas de organización de contingencias: Los sistemas de organización de contingencias

son procedimientos complejos a través de los cuales se puede reforzar unas conductas y
castigar otras. La economía de fichas es un ejemplo muy conocido de este tipo de técnicas.
Consiste en entregar fichas (u otros reforzadores genéricos equivalentes) como premio por la
realización de las conductas objetivo; posteriormente los sujetos pueden intercambiar sus
fichas por premios de valor variable. Se utiliza en escuelas, cárceles y hospitales psiquiátricos.
Los contratos conductuales o de contingencias son acuerdos entre varias personas,
normalmente dos, mediante los que se comprometen a realizar (o a no realizar) determinadas
conductas. En los contratos se detallan las consecuencias en caso de que se cumplan o
incumplan las condiciones acordadas.
Referencias bibliográficas:
 Domjam, M. (2010). Principios básicos de aprendizaje y conducta. Madrid: Thomson.
 Labrador, F. J. (2008). Técnicas de modificación de conducta. Madrid: Pirámide.
APLICACIONES AL ESTUDIO (APRENDIZAJE)

A la hora del estudio son muchos los factores que influyen en la capacidad final que va a
disponer el estudiante para interiorizar con mayor o menor competencia los contenidos de
aprendizaje. Tal como veremos a continuación, tanto los aspectos físicos como los psicológicos
van a resultar igualmente determinantes para alcanzar un eficaz rendimiento académico.
 Artículo relacionado: "La influencia del autoconcepto en el rendimiento académico"
El concepto de la higiene mental en el estudiante
La higiene mental del estudio se define como el conjunto de condiciones físicas, mentales y
psíquicas que facilitan la tarea intelectual. En toda conducta, los éxitos o los fracasos son en
un gran porcentaje la consecuencia del estado de ánimo en que se encuentra el individuo.
Si el estado neurofisiológico está positivamente predispuesto al aprendizaje, es más probable
que se activen las capacidades para conseguir confianza en un mismo, las cuales son
considerablemente relevantes para configurar un estado motivacional adecuado en la
adquisición de conocimiento. Ello está fuertemente influido por:
 La representación interna o concepto de sí mismo (positiva o negativa), que hace
referencia a la tendencia a lograr el éxito o a evitar el fracaso.
 Las condiciones fisiológicas y el uso que se hace de ellas, como el nivel de tensión
muscular, de cansancio, la activación del organismo, el nivel de relajación y el
funcionamiento general del organismo.
Estos dos factores pueden ser favorecidos por la propia persona creando estados o actitudes
positivas que activen al máximo la capacidad psíquica y acerquen al estudiante al éxito. Es
algo posible, si se tiene en consideración que la representación interna no es un reflejo de
la realidad, sino que deviene una interpretación personal derivada de las creencias
particulares individuales del sujeto de tal manera que una persona se convierte en aquello que
piensa sobre sí mismo.
Una persona no podrá ser inteligente ni eficaz mientras piense lo contrario, podría decirse. Un
aspecto clave, por tanto, es trabajar para el cambio de estas representaciones internas para
que sean acordes a la idea de éxito o eficacia personal. Así, un elemento fundamental es
adoptar una actitud positiva hacia a las capacidades intelectuales propias para lograr una
mayor confianza en las propias posibilidades.
 Quizás te interese: "Los 13 tipos de aprendizaje: ¿cuáles son?"
El buen estado físico y el rendimiento académico
El estudio o el trabajo intelectual es una actividad psíquica y está condicionada por la salud
física y el bienestar corporal. Se distinguen los siguientes como factores intervinientes y
determinantes:
Las horas de sueño
Se recomienda dormir entre 7 y 9 horas diarias. Hay que reponerse y descansar del
agotamiento diario mental y físico. Por ello, más que la cantidad lo más relevante es la
calidad del sueño, el cual tiene que ser reparador e ininterrumpido. Es decir, la sensación que
se tiene al despertar debe ser una sensación de relajación o frescura. Así, se recomienda lo
siguiente:
 No arrastrar al lugar de descanso problemas personales, procurando su solución
antes de finalizar el día o, en su defecto, dejarlos aplazados para el día siguiente.
 Se deben suprimir o reducir, en la medida de lo posible, los alimentos o las bebidas
estimulantes, como el chocolate o el café, etc., sobre todo a última hora del día.
 Es recomendable cenar pronto, sobre las 21 horas, e ingerir alimentos ligeros y de fácil
digestión.
 No tomar tranquilizantes de forma habitual, sólo en casos excepcionales.
 Tomar un baño caliente o caminar durante unos 15 minutos antes de ir a dormir.
 Realizar el repertorio diario de conductas de higiene corporal y bucal y se recomienda el
uso de ropa holgada que resulte adecuado. También es relevante adoptar una postura
cómoda al dormir.
 Marcar una hora fija para ir a dormir e intentar no hacer actividades que resten horas de
sueño, como por ejemplo ver la TV.
 Realizar ejercicio físico regular para que el cuerpo busque una forma de descanso
natural al cansancio producido por esta actividad.
 Practicar un rato de ejercicios de relajación antes de ir a dormir.
 Si en unos 30 minutos no se consigue coger el sueño, se recomienda no preocuparse
por ello, sino levantarse y hacer alguna actividad que facilite coger el sueño
nuevamente.
La alimentación racional
Una dieta equilibrada es imprescindible para un buen rendimiento intelectual. La dieta debe ser
variada y rica, incluyendo pescado, carne, huevos, vegetales, fruta, etc. No deben ser
comidas muy abundantes, se recomienda almorzar fuerte, comer bien, y merendar y cenar
menor cantidad. El equilibrio entre una dieta saludable y ejercicio físico regular es un factor
clave.
El ejercicio físico
Se recomienda la práctica constante y continuada, en lugar de puntual y extrema. El ritmo de
vida actual afectado por la prisa, los ruidos, el estrés, etc. deterioran el propio sistema nervioso
y provocan la aparición de características negativas como estar más susceptible, un estado de
alerta permanente, estar a la defensiva, irritable, etc.
La relajación
Muy útiles en estudiantes con tendencia a la preocupación o la ansiedad. Una dedicación de 15
o 20 minutos diarios puede resultar muy beneficioso para aumentar el rendimiento mental. En
una postura cómoda con las extremidades flexionadas, ojos cerrados y dejando los músculos
relajados se deja la mente en blanco. Es fundamental que durante estos minutos no haya
ningún tipo de interrupción ni ruido externo. La relajación repara el organismo del cansancio
tanto físico como psíquico, restableciendo una sensación de paz y tranquilidad general.
 Quizás te interese: "6 técnicas de relajación fáciles para combatir el estrés"
El bienestar psíquico del estudiante
Además de las condiciones físicas, tal y cómo se ha comentado anteriormente, los factores
psicológicos también juegan un papel importante en el rendimiento intelectual. Aspectos como
el nivel de motivación, la autoestima, la preocupación, el estado emocional general, la
ansiedad... influyen en gran medida en la conducta individual.
Puede ser, así, un ejercicio de gran utilidad el dedicar unos minutos de vez en cuando a
conversar con uno mismo realizando una pequeña reflexión sobre cuál es el estado psíquico
propio y ver hasta qué punto está afectando al rendimiento intelectual cotidiano.
Según Tierno (2009) los siguientes fenómenos son factores clave que influyen de forma
principal sobre el nivel de bienestar emocional y cognitivo del alumno. Todos ellos
interactúan y se relacionan bidireccionalmente con el estado fisiológico, propiciando una
predisposición adaptativa o perjudicial para el estudio:
Nivel de autoestima
Es decir, grado de confianza que tiene en sí mismo para lograr buenos resultados
académicos. Es importante ser consciente tanto de las propias capacidades como de las
limitaciones. Una actitud positiva consistente en estar convencido de que con tiempo, esfuerzo
e ilusión el éxito puede ser logrado, favorece el incremento de este rasgo de personalidad.
 Artículo relacionado: "¿Autoestima baja? Cuando te conviertes en tu peor enemigo"
Entusiasmo
Disponer de confianza en uno mismo y deshacerse de complejos en los diferentes ámbitos de
interacción (familiar y escolar) es un aspecto principal, aunque el reconocimiento por parte
de los otros ayuda a potenciar este factor.
 Artículo relacionado: "Pirámide de Maslow: la jerarquía de las necesidades humanas"
Actitud receptiva, curiosidad e interés por aprender
Es fundamental que el estudiante presente una buena orientación a adquirir nuevos
conocimientos que amplíen su bagaje cultural. Los diálogos con profesores y familiares
pueden enriquecer y aumentar la curiosidad e interés para aprender.
Comprensión y aceptación de los otros: capacidad que permite ser más sociable, comunicativo
y generoso con los otros.
 Artículo relacionado: "La Teoría del Aprendizaje Significativo de David Ausubel"
A modo de conclusión
A pesar de que de forma superficial puede parecer que la consecución del aprendizaje está
exclusivamente definido por el nivel de capacidad intelectual del estudiante, en este texto se
han descrito múltiples fenómenos, que en interacción recíproca, resultan indispensables para
explicar el motivo por el cuál un estudiante puede estar por debajo de lo esperado en su
rendimiento académico.
Se sabe necesario, por tanto, la realización de un análisis donde se determine cuáles de todos
estos elemento se encuentra alterado y proponer una serie de medidas que los re-canalicen de
forma adecuada.
Referencias bibliográficas:
 Soria, E. (2015) Técnicas de estudio eficaces. Ed: Mestas Ediciones: Madrid.
 Tierno, B. (2009) Las mejores técnicas de estudio. Ed: Temas de Hoy: Madrid.
Los 13 tipos de aprendizaje: ¿cuáles son?

Una clasificación con los tipos de aprendizaje y las características de cada uno.
Algunas personas piensan que solamente hay una manera de aprender.
Seguramente, muchos, cuando pensamos en el aprendizaje, nos imaginamos a alguien
estudiando o realizando aprendizaje de memoria. Sin embargo, existen distintos tipos de
aprendizaje con características muy distintas entre sí. En el artículo de hoy, los repasaremos y
explicaremos.
Psicología y aprendizaje
El aprendizaje hace referencia a la adquisición de conocimientos, habilidades, valores y
actitudes, y los seres humanos no podríamos adaptarnos a los cambios si no fuese por este
proceso.
La psicología se ha interesado por este fenómeno desde hace varias décadas y son muchos
los autores que han aportado un valioso conocimiento sobre qué es y cómo se construye dicho
aprendizaje. Ivan Pavlov, John Watson o Albert Bandura son ejemplos claros de este marcado
interés.
Si estás interesado en saber más sobre la aportación de la psicología al aprendizaje, te
recomendamos la lectura de los siguientes artículos:
 Psicología educativa: definición, conceptos y teorías
 La Teoría del Aprendizaje de Jean Piaget
 La Teoría Sociocultural de Lev Vygotsky
 Piaget vs Vygotsky: similitudes y diferencias entre sus teorías
Los distintos tipos de aprendizaje
A lo largo de los años, los estudios de muchos de estos investigadores han permitido ir
descifrando cómo funciona nuestra memoria y cómo influye la observación o la experiencia en
la hora de construir conocimiento y cambiar nuestra manera de actuar.
Pero, ¿qué maneras de aprender existen? ¿qué clases de aprendizaje hay? A continuación te
lo explicamos.
Artículo recomendado: "Tipos de memoria: ¿cómo almacena los recuerdos el cerebro
humano?"
1. Aprendizaje implícito
El aprendizaje implícito hace referencia a un tipo de aprendizaje que se constituye en un
aprendizaje generalmente no-intencional y donde el aprendiz no es consciente sobre qué se
aprende.
El resultado de este aprendizaje es la ejecución automática de una conducta motora. Lo cierto
es que muchas de las cosas que aprendemos ocurren sin darnos cuenta, Por ejemplo, hablar o
caminar. El aprendizaje implícito fue el primero en existir y fue clave para nuestra
supervivencia. Siempre estamos aprendiendo sin darnos cuenta.
2. Aprendizaje explícito
El aprendizaje explícito se caracteriza porque el aprendiz tiene intención de aprender y es
consciente de qué aprende.
Por ejemplo, este tipo de aprendizaje nos permite adquirir información sobre personas, lugares
y objetos. Es por eso que esta forma de aprender exige de atención sostenida y selectiva del
área más evolucionada de nuestro cerebro, es decir, requiere la activación de los lóbulos
prefrontales.
3. Aprendizaje asociativo
Este es un proceso por el cual un individuo aprende la asociación entre dos estímulos o un
estímulo y un comportamiento. Uno de los grandes teóricos de este tipo de aprendizaje fue
Iván Pavlov, que dedicó parte de su vida al estudio del condicionamiento clásico, un tipo de
aprendizaje asociativo.
Puedes saber más sobre este tipo de aprendizaje en nuestro artículo: "El condicionamiento
clásico y sus experimentos más importantes"
4. Aprendizaje no asociativo (habituación y sensibilización)
El aprendizaje no asociativo es un tipo de aprendizaje que se basa en un cambio en nuestra
respuesta ante un estímulo que se presenta de forma continua y repetida. Por ejemplo. cuando
alguien vive cerca de una discoteca, al principio puede estar molesto por el ruido. Al cabo del
tiempo, tras la exposición prolongada a este estímulo, no notará la contaminación acústica,
pues se habrá habituado al ruido.
Dentro del aprendizaje no asociativo encontramos dos fenómenos: la habituación y
la sensibilización.
Para saber más, visita nuestro post: "La habituación: un proceso clave en el aprendizaje pre-
asociativo"
5. Aprendizaje significativo
Este tipo de aprendizaje se caracteriza porque el individuo recoge la información, la selecciona,
organiza y establece relaciones con el conocimiento que ya tenía previamente. En otras
palabras, es cuando una persona relaciona la información nueva con la que ya posee.
Puedes saber más sobre el aprendizaje significativo pinchando aquí
6. Aprendizaje cooperativo
El aprendizaje cooperativo es un tipo de aprendizaje que permite que cada alumno aprenda
pero no solo, sino junto a sus compañeros.
Por tanto, suele llevarse a cabo en las aulas de muchos centros educativos, y los grupos de
alumnos no suelen superar los cinco miembros. El profesor es quien forma los grupos y quien
los guía, dirigiendo la actuación y distribuyendo roles y funciones.
7. Aprendizaje colaborativo
El aprendizaje colaborativo es similar al aprendizaje cooperativo. Ahora bien, el primero se
diferencia del segundo en el grado de libertad con la que se constituyen y funcionan los
grupos.
En este tipo de aprendizaje, son los profesores o educadores quienes proponen un tema o
problema y los alumnos deciden cómo abordarlo
8. Aprendizaje emocional
El aprendizaje emocional significa aprender a conocer y gestionar las emociones de manera
más eficiente. Este aprendizaje aporta muchos beneficios a nivel mental y psicológico, pues
influye positivamente en nuestro bienestar, mejora las relaciones interpersonales, favorece el
desarrollo personal y nos empodera.
Artículo recomendado: "Los 10 beneficios de la inteligencia emocional"
9. Aprendizaje observacional
Este tipo de aprendizaje también se conoce como aprendizaje vicario, por imitación o
modelado, y se basa en una situación social en la que al menos participan dos individuos: el
modelo (la persona de la que se aprende) y el sujeto que realiza la observación de dicha
conducta, y la aprende.
10. Aprendizaje experiencial
El aprendizaje experiencial es el aprendizaje que se produce fruto de la experiencia, como su
propio nombre indica.
Esta es una manera muy potente de aprender. De hecho, cuando hablamos de aprender los
errores, nos estamos refiriendo al aprendizaje producido por la propia experiencia. Ahora bien,
la experiencia puede tener diferentes consecuencias para cada individuo, pues no todo el
mundo va a percibir los hechos de igual manera. Lo que nos lleva de la simple experiencia al
aprendizaje, es la autorreflexión.
Artículo recomendado: "Desarrollo Personal: 5 razones para la autorreflexión"
11. Aprendizaje por descubrimiento
Este aprendizaje hace referencia al aprendizaje activo, en el que la persona en vez aprender
los contenidos de forma pasiva, descubre, relaciona y reordena los conceptos para adaptarlos
a su esquema cognitivo. Uno de los grandes teóricos de este tipo de aprendizaje es Jerome
Bruner.
12. Aprendizaje memorístico
El aprendizaje memorístico significa aprender y fijar en la memoria distintos conceptos sin
entender lo que significan, por lo que no realiza un proceso de significación. Es un tipo de
aprendizaje que se lleva a cabo como una acción mecánica y repetitiva.
13. Aprendizaje receptivo
Con este tipo de aprendizaje denominado aprendizaje receptivo la persona recibe el contenido
que ha de internalizar.
Es un tipo de aprendizaje impuesto, pasivo. En el aula ocurre cuando el alumno, sobre todo por
la explicación del profesor, el material impreso o la información audiovisual, solamente necesita
comprender el contenido para poder reproducirlo.
3.3. La motivación en la psicología del aprendizaje

En el estudio del aprendizaje, los aspectos motivacionales ocupan un papel central, en el
sentido que se buscan los mecanismos que detectan y retienen la información del ambiente y
sus consecuencias sobre la conducta, para comprender el uso que se da para satisfacer las
necesidades del organismo.
Factores motivacionales del condicionamiento clásico

Pavlov, estudiando inicialmente la digestión de los perros, llegó al descubrimiento del
condicionamiento clásico o pavloviano. Comprobó que una respuesta refleja, innata e
inmodificable, podía emitirse ante otro estímulo para el que no estaba programada
genéticamente, por presentarse en contigüidad temporal con el estímulo desencadenante del
reflejo. Llamó reflejo condicionado a esa respuesta que se establecía por la conexión temporal
entre un estímulo nuevo y un reflejo ya existente.
Con los planteamientos pavlovianos se empieza a estudiar la posibilidad de alterar la
frecuencia y dirección de la conducta, lo que afectó al desarrollo de la psicología de la
motivación.
Cuando el estímulo que desencadena la respuesta refleja es agradable (por ejemplo, un trozo
de comida), nos hallamos ante un condicionamiento clásico apetitivo. Pero también se puede
conseguir condicionamientos utilizando estímulos desagradables, provocando la adquisición de
conductas por un condicionamiento clásico de defensa (por ejemplo, una descarga). El primero
en estudiar el condicionamiento clásico de defensa fue Bekhterev.
Elementos del condicionamiento clásico
Los elementos principales del condicionamiento clásico son:
 el estímulo incondicionado (EI) que es el que desencadena una respuesta no aprendida
(en el experimento de Pavlov sería la comida del perro),
 la respuesta incondicionada (RI), que es la respuesta no aprendida que se emite cuando
aparece el EI (en el ejemplo, sería la salivación del perro cuando oye la campana y se le
da comida),
 el estímulo condicionado (EC), que inicialmente es un estímulo neutro a la situación y se
empareja con el EI (en el experimento de Pavlov, sería el sonido de la campana); y
finalmente,
 la respuesta condicionada (RC), que es la respuesta aprendida que se emite ante el EC
y que no es exactamente igual que la RI (una vez establecida la asociación EC-EI) (en el
experimento, sería la salivación del perro aunque no haya comida).
Proceso del condicionamiento clásico
En el proceso del condicionamiento clásico se establece una relación funcional entre el EC y el
EI, y por eso, se conoce como modelo E-E.
Tiene dos características importantes:
1. Los estímulos se presentan al sujeto con independencia de su conducta.
2. Se condicionan respuestas reflejas, no actividades espontáneas.
Tanto en el condicionamiento clásico apetitivo como en el de defensa se aprende una nueva
respuesta, pero Pavlov descubrió otro tipo de condicionamiento: el condicionamiento clásico
inhibitorio, en el que se aprende a retener o inhibir la RC. En este caso, un estímulo inhibitorio,
el EC, señala la ausencia del EI por lo que se inhibe la RC (por ejemplo, si siempre comemos
en un restaurante pero un día vemos allí una desagradable pelea; la siguiente vez que
pasemos por delante no tendremos motivación de comer allí).
En el condicionamiento de segundo orden se emplea como EI un EC de un condicionamiento
anterior. Así un EC produce una RC por emparejarse con otro, cuyas propiedades
motivacionales son adquiridas (por ejemplo, el valor que tiene actualmente el dinero porque
permite conseguir otros objetivos.
Técnicas de condicionamiento clásico
El estudio del condicionamiento clásico ha dado lugar al establecimiento de distintas técnicas o
procedimientos de investigación entre las que hay que destacar:
 La respuesta emocional condicionada. Ante una situación que produce miedo, se alteran
el resto de las conductas. Para demostrarlo experimentalmente, primero se entrena a
una rata a apretar una palanca para obtener un premio, segundo se le presenta
asociado un tono (EC) con una descarga eléctrica (EI), finalmente, conforme se
adquiere la asociación, al presentarse el EC, se suprime la respuesta de presionar la
palanca. Los cambios emocionales provocan cambios en la motivación. Por ejemplo,
cuando decimos “me he quedado helado” ante una situación y dejamos de emitir
respuesta.
 El seguimiento de señales. Consiste en el seguimiento de aquellas señales relacionadas
con las situaciones que permiten satisfacer necesidades (comida, etc); en vez de
arrimarse directamente a la comida en sí, siguen las señales que les conducen a las
mismas.
 El condicionamiento de aversión al sabor. Una sustancia adquiere las características
aversivas de otra por presentarse asociadas. Es de destacar que el condicionamiento se
produce desde el primer ensayo, y ante intervalos entre el EC y el EI muy largos.
De la Ley del Efecto a la Ley del Refuerzo
Edward Lee Thorndike estudió la relación entre aprendizaje y motivación, para saber cómo
consigue la mente de un organismo adaptarse a las exigencias de su ambiente. Para ello,
introdujo a gatos con hambre en una jaula (la llamó “caja problema”) de la que debían escapar
para obtener alimento. Los animales sentían el impulso de actuar, eran activos para conseguir
el premio y aprendían pronto la respuesta: la conducta era un instrumento para conseguir
premios y evitar castigos (=condicionamiento instrumental).
Lo denominó condicionamiento instrumental. Estableció la ley del efecto, según la cual las
consecuencias de una conducta, determinarán su repetición: así, el animal asocia el estímulo
(la situación) con la respuesta (abrir la puerta), mientras que la recompensa fortalece la
asociación. Así se crea la teoría E-R.
También creo la Ley del efecto: las consecuencias que tenga una conducta determinarán su
repetición, de modo que si las consecuencias son agradables la conducta aumentará, pero si
son desagradables disminuirá. Según ésto, el impulso tiene 3 funciones: energiza, orienta la
conducta y selecciona las respuestas que conducen al éxito. Manipulando los impulsos se
puede manipular la motivación.
Posteriormente Skinner planteó la ley del refuerzo al demostrar que a través de las
consecuencias el sujeto opera en el ambiente, por lo que pasa a denominarse
condicionamiento operante a este tipo de aprendizaje. Se establece una asociación entre la
respuesta y el reforzador (para Thorndike la asociación era entre la situación y la respuesta).
A través de la “caja de Skinner”, plantea la situación experimental de operante libre, en la que
el sujeto puede repetir la respuesta para obtener más premios (en cambio, en el
condicionamiento clásico la respuesta era independiente de la conducta del sujeto).
Su postura es radicalmente ambientalista, ya que el individuo está sometido a las influencias
configuradoras de su medio; por tanto considera al sujeto como un organismo pasivo sometido
a las influencias anticipatorias de su entorno, y se le puede manipular de la manera deseada a
través de recompensas y castigos.
Elementos del condicionamiento operante
El condicionamiento operante, básico en el aprendizaje, se compone de dos elementos:
1. La respuesta operante, que es la que se desea adquirir y se está motivado a realizar.
2. El estímulo reforzador, que es el que se dispensa tras la ejecución correcta, y es
cualquier estímulo que incremente la probabilidad de la respuesta.
Efecto del reforzador
El reforzador es el elemento motivador del condicionamiento que depende de la historia previa
del sujeto y de sus necesidades. Si el reforzador disminuye las necesidades biológicas, se
denomina reforzador primario; pero si las propiedades motivacionales del reforzador son
adquiridas, se conoce como reforzador secundario.
Genéricamente, se puede decir que la eficacia del reforzador viene determinada por la edad, el
sexo y la historia previa del sujeto.
Qué puede actuar como reforzador?
No sólo los estímulos pueden actuar como reforzadores de una conducta, sino la propia
actividad puede comportarse como reforzadora si motiva la repetición de dicha conducta.
Según la teoría de la probabilidad condicionada de Premack (o Principio de Premack), además
de un estímulo, puede actuar como reforzador aquella actividad cuya probabilidad de
ocurrencia sea mayor que la de la conducta exigida. Las actividades de alta probabilidad
refuerzan las actividades de baja probabilidad. Es la actividad la que facilita el estímulo
reforzador (comer, beber, etc), no el estímulo en sí lo que resulta reforzante.
Conforme la hipótesis de la privación de la respuesta deTimberlake y Allison, también puede
actuar de reforzador aquellas actividades que ocurren con menor frecuencia; se busca emitir el
menor número de respuestas para conseguir el reforzador. Una ampliación de esta teoría es: la
teoría de la distribución conductual, según la cual cualquier actividad puede convertirse en
reforzador de otra. Así durante un condicionamiento se modifica la distribución que hace el
sujeto de su tiempo (por ejemplo, un niño que pasa más tiempo jugando a la consola que
estudiando, si se le cambia la distribución del tiempo, estudiará para poder acceder a lo que
realmente quiere).
Con la manipulación de los reforzadores se puede intervenir en la conducta, a través de su
nivel de motivación.
La motivación como función activadora
La motivación es fundamentalmente activadora de la acción. En esta línea, Woodworth
introdujo el término impulso o drive, al considerar que la motivación actuaba para conseguir la
homeostasis o equilibrio interno del organismo, al cubrir una necesidad o carencia biológica.
Sus estudios se centraron en comprender cómo los impulsos facilitan el aprendizaje para
asegurar la supervivencia.
El impulso
Igualmente, para Hull el aprendizaje no se producía por contigüidad, sino por el refuerzo que
provocaba la reducción del impulso (cualquier respuesta que reduzca el impulso da lugar a
reforzamiento; el refuerzo es la reducción del impulso), por lo que su teoría pasó a llamarse
Teoría de la reducción del impulso. Así planteado, la conducta quedaba constituida por
mecanismos aprendidos y motivacionales: aquella reacción por la que queda reducida una
necesidad biológica será aprendida.
Definió operacionalmente el impulso:
E=HxD
esto es, potencial de Excitación (fuerza de la conducta ante un estímulo determinado) x Hábito
o probabilidad que se emita una respuesta observable x impulso interno o Drive.
Posteriormente añadiría la variable motivación de incentivo, que era el componente motivador
del reforzador para el sujeto, quedando la formulación:
E=HxDxI
Según ésto, el potencial de excitación depende de:
 El impulso o las necesidades básicas que se regulaban homeostáticamente.
 La fuerza de los hábitos relacionados con los comportamientos aprendidos.
 El incentivo que eran las propiedades motivadoras de la meta.
El impulso se relacionaba con alteraciones fisiológicas, el incentivo se relacionaba con
aspectos del medio ambiente. El drive representa un estado de activación general en una
función dinámica que energizaba todo el comportamiento posible, mientras que el hábito se
consideraba una función directiva, puesto que conforme se repetía la situación ya no se hacían
todas las conductas, sino sólo aquellas exitosas que reducían el estado de necesidad.
Agregó a su fórmula otros 3 elementos multiplicativos relacionados con el valor del incentivo
del reforzador:
1. El valor de la meta.
2. La demora del reforzador.
3. La intensidad del estímulo, lo que provocaba la inviabilidad de su fórmula.
Además, si alguno de sus elementos no se producía, esto es, si tenía un valor de cero, ya no
se producía la respuesta al no existir potencial de excitación (multiplicar cualquier número por
cero da cero de resultado).
Hull consideró que no se aprendía por la asociación E-R, sino por la asociación de una serie de
respuestas (respuestas fraccionarias o anticipatorias de meta: rm), que llevaban al premio.
Dichas respuestas se condicionaban clásicamente por contigüidad con la respuesta final
(respuesta meta).
Criticas a la teoría de la reducción del impulso
Aunque la teoría de la reducción del impulso ha supuesto un intento de cuantificar la
motivación, se ha criticado:
1. porque solo era valida para ciertas personas en especial
2. Porque puede existir reforzamiento sin reducir de la necesidad siempre que se aprende
una conducta se reduce una necesidad fisiológica
3. La relativa a la función activadora e inespecífica que atribuían a los impulsos puestos
que distintas actividades como la sed o el hambre activaban estados similares e
intercambiables.
Función informativa de la motivación: el incentivo
El incentivo ocupa un papel central por la motivación en la adquisición de la conducta. Las
características del incentivo de la meta son las que tiran del organismo y lo atrae hacia la meta
Para estudiar el papel de la motivación en los condicionamientos, se emplea la técnica de la

devaluación del reforzador y así, conocer la naturaleza de las representaciones internas que se
establecen. Consiste en la disminución del valor motivacional de EI (en el condicionamiento
clásico), y en la reducción del valor del reforzador (en el condicionamiento operante). Se ha
comprobado que se pueden establecer representaciones simbólicas de la estructura causal del
entorno, y que se codifican ciertos aspectos de la información sensorial del reforzador.
Con mayor número de ensayos, la conducta se ve menos afectada por las variaciones
motivacionales. Esto se debe a que con mayor número de ensayos, la conducta se automatiza,
por lo que está menos afectada por posteriores cambios del incentivo.
Se aprenden comportamientos al observar cómo los realizan otros y las consecuencias que
conllevan.
Tentativas explicativas de la imitación

Inicialmente se consideró la imitación una conducta instintiva. Desde el condicionamiento
clásico se justificaba por la contigüidad entre la situación observada y la posibilidad de
repetición por parte del observador. Para el condicionamiento operante, el sujeto debía estar
motivado para repetir la conducta observada y así obtener el reforzador.
Las teorías cognitivas del aprendizaje observacional mantienen que el observador elabora
representaciones cognitivas de la conducta del modelo.
Justificaciones cognitivas de la imitación

Bandura defiende con la teoría social cognitiva que el reforzador, a través de una mediación
cognitiva, ejerce una influencia antecedente más que consecuente. Al observar al modelo, se
crean expectativas sobre los efectos del reforzador, lo que incrementa la retención de lo
observado y su codificación. El refuerzo facilita, pero no es indispensable.
Apela a la intervención de cuatro procesos explicativos del aprendizaje observacional:
1. Procesos atencionales.
2. Procesos de retención.
3. Procesos de reproducción motora. De conducta observada.
4. Procesos de motivación
Procesos atencionales
La estimulación contigua por sí sola no produce siempre la adquisición de respuestas, se
considera esencial la focalización y mantenimiento de un foco atencional para la adquisición de
conductas imitativas, con el fin de que el observador discrimine entre las claves relevantes e
irrelevantes de la conducta del modelo. Las variables que determinan esa focalización está en
relación con:
 Las Propiedades Físicas del Estímulo: variables como la intensidad, la viveza y la
novedad son fundamentales para centrar la atención. Es también muy importante la
complejidad del estímulo, porque dificulta la atención sobre la conducta observada.
 Las Características del Modelo: el grado de competencia, el prestigio social, la edad, el
sexo y el estatus social o étnico, determinan la atención que se preste a un modelo.
 Las Características del Observador: la percepción del grado de dificultad de la tarea por
parte del observador aumentará la atención, asimismo el nivel de dependencia, la
autoestima, las aptitudes o el estatus sociocultural pueden determinar por sí mismo a lo
que se es capaz de atender.
Procesos de retención
Bandura alude a dos sistemas de representación: uno de mediación imaginativa (que
transforma los estímulos de modelado en imágenes), y el otro de mediación verbal (que
convierte las secuencias de conductas presentadas por el modelo en códigos verbales). Así
cuando las experiencias se han codificado en imágenes o palabras para su representación en
la memoria, funcionan como mediadores para la recuperación, actualización y reproducción de
las pautas de conductas imitadas, los códigos imaginativos y verbales tienen la función de
representar de forma simbólica en la memoria las respuestas imitativas, actuando de guías
para la reproducción posterior de la conducta observada y dando cuenta, asimismo, de la
retención a largo plazo de los estímulos de modelado aun cuando el modelo no esté presente.
Una de las variables determinante del proceso de retención lo constituyen todas aquellas
operaciones de repetición. Otra variable influyente es el repaso encubierto, dado que
incrementa la retención de respuestas ya adquiridas, sobre todo en tareas que cuentan con
funciones simbólicas.
Procesos de reproducción motora

Estos procesos resultan imprescindibles para la puesta en práctica de la respuesta adquirida e
implican la utilización de las representaciones simbólica de los patrones modelados para dirigir
la ejecución real de las respuestas.
Procesos motivacionales
Son los encargados de determinar la transformación del aprendizaje en ejecución. El incentivo
puede actuar por medio de varias funciones para producir cambios psicológicos en los
observadores. Funciones principales del incentivo:
 Función Informativa: durante el aprendizaje de una conducta observada, el sujeto va
notando los efectos que las respuestas producen, observando los resultados de las
acciones y así desarrollando hipótesis sobre cuáles son las respuestas más apropiadas.
De esta forma, el sujeto anticipa el futuro sin haberlo experimentado con anterioridad.
 Función Motivacional: al representarse simbólicamente las consecuencias previsibles,
éstas se convierten en motivaciones reales de la conducta. La mayor parte de las
acciones están bajo el control del carácter anticipatorio. Esto es lo que se conoce como
autoincentivo.
 Función de Acrecentamiento del Estímulo: la observación de las consecuencias de la
conducta del modelo aporta una discriminación de las conductas apropiadas o
inadecuadas en ambientes diferentes.
El análisis conductual aplicado es el uso de los principios conductuales del

aprendizaje para la comprensión y la modificación del comportamiento.
Métodos para promover conductas
Para reforzar una determinada conducta o incorporar una nueva disponemos de una serie de
recursos: el elogio, la selección de reforzadores, el moldeamiento o la práctica positiva.
Utilizar el elogio
Los profesores pueden mejorar la conducta de los estudiantes alabando el buen
comportamiento e ignorando los errores y la mala conducta. Aunque este modo de actuar
puede ser útil, las conductas indeseables pueden persistir cuando sólo se utiliza el elogio como
única estrategia de control del aula. Los resultados positivos del uso de reforzadores se
producen cuando se realiza controladamente:
 Los reforzadores deben ser contingentes a las conductas deseadas.
 Debe referirse a los actos, no a la personalidad del alumno.
 Se debe especificar claramente la conducta que se quiere reforzar.
 Tiene que ser creíble.
En definitiva, el elogio no debe usarse indiscriminadamente (pues podríamos reforzar
conductas indeseadas) y ha de ser un reconocimiento sincero a una conducta
determinada.
Además, los programas de reforzamiento especifican la frecuencia con que el reforzador
debe ser administrado: el reforzamiento es más eficaz cuando el reforzador se administra de
manera continuada en la fase de adquisición, y de manera intermitente cuando la conducta ya
ha sido adquirida.
El principio de Premack
Según el principio de Premack, una conducta muy frecuente (una actividad preferida por
un alumno) puede ser un buen reforzador de una menos común (actividad menos
preferida), lo que en ocasiones se conoce como “la regla de la abuela”: primero haz lo que yo
quiero que hagas y luego puedes hacer lo que tú quieras.
Para utilizarlo de una manera provechosa es necesario que la conducta menos frecuente,
es decir, la menos preferida, ocurra primero, de manera que al término de ésta el alumno
pueda realizar esa segunda actividad preferida:
Si terminas de hacer… luego podrás….
Ahora bien, estos reforzadores no actúan por igual en todos los alumnos: un mismo
estímulo puede ser algo atractivo para un alumno, pero provocar rechazo a otro, por lo que
obliga al profesor a conocer cómo son sus alumnos y cuáles son los reforzadores que más les
conviene con objeto de utilizarlos adecuadamente. Además, los reforzadores podrían perder
su eficacia si se emplean en exceso.
Moldeamiento
El moldeamiento, o técnica de las aproximaciones sucesivas, se utiliza para adquirir
gradualmente una determinada conducta deseada y resulta eficaz para conseguir
respuestas que no existen en el sujeto.
El procedimiento consiste en aplicar el reforzamiento tras las respuestas que, aun no siendo
las que se desean, se aproximan a ellas y, a la vez, en ir administrando el reforzador
diferencialmente; esto es, se administra el reforzador sólo cuando van apareciendo
versiones más refinadas de las conductas deseadas.
Un método para identificar estos pequeños pasos es el análisis de tareas desarrollado por
R.B. Miller en el que se define el objetivo final y se establece una secuencia lógica de los pasos
que conducen hacia esa meta (se realiza una subdivisión de las habilidades en diferentes
categorías). Esto ofrece la posibilidad al profesor de asegurarse de que los estudiantes tengan
las habilidades necesarias para continuar con el siguiente paso. Además permite señalar con
claridad las áreas problemáticas si un alumno encuentra dificultades.
Muchas conductas pueden mejorar con el moldeamiento, en especial las que implican
persistencia, paciencia, mayor precisión, mayor rapidez o mucha práctica para lograr el
dominio. Sin embargo, dado que es un proceso que toma mucho tiempo, no hay que
emplearlo si puede tener éxito con métodos más simples, como la señalización (conjunto de
estímulos que orientan al individuo hacia una determinad conducta deseada).
Este es el procedimiento que, durante siglos, han venido utilizando los domadores de animales.
La práctica positiva
La práctica positiva es una estrategia para ayudar a reemplazar una conducta con otra, que
consiste en practicar las respuestas correctas inmediatamente después de los errores
(por lo que resulta apropiada para corregir los fallos de los estudiantes).
Es posible aplicar el mismo principio cuando los estudiantes rompen las reglas del aula; así, en
lugar de castigarlos se les puede pedir que practiquen la acción correcta.
Métodos para combatir conductas indeseadas
Por el contrario, para afrontar conductas indeseables, podemos recurrir a las siguientes
estrategias:
Reforzamiento negativo
El reforzamiento negativo permite fortalecen una conducta mediante la supresión de algo que
resulta desagradable o aversivo. El profesor puede recurrir a él si sitúa a los alumnos en
situaciones ligeramente desagradables que pueden evitar mejorando su conducta:
Podréis salir al recreo cuando tengáis recogidos vuestros pupitres y cada uno esté sentado y
en silencio en su asiento.
De esta manera el profesor pretende fortalecer unas conductas y cesar la realización de
otras, al tiempo que da a los alumnos la oportunidad de ejercer el control.
Para servirse del reforzamiento negativo es recomendable seguir una serie de pautas, tales
como describir el cambio deseado en positivo, evitar las amenazas, mantener las situaciones
desagradables en el tiempo frente a las protestas y centrar la atención en las acciones, no en
las promesas.
La saciedad
Otra forma de disminuir una conducta problemática es insistir en la realización de dicha
conducta hasta el punto de perder el interés o la motivación. Si la conducta del estudiante
no interfiere con el desarrollo de la clase, el maestro puede permitir que continúe realizándola
hasta que se detenga por sí mismo, lo que se logra ignorando la conducta.
Este procedimiento debe aplicarse con cuidado, ya que obligar a los alumnos a seguir
realizando algunas conductas puede ser nocivo física o emocionalmente e incluso peligroso.
Reprimendas
Si los regaños no se emplean con demasiada frecuencia y el ambiente del aula suele ser
positivo y cálido, los alumnos suelen responder con rapidez, pero pueden ejercer un efecto
contrario al deseado en alumnos que busquen ese reconocimiento por su mala conducta.
Costo de respuesta
Es el castigo con pérdida de reforzadores. Para entendernos, es la “multa a pagar” por la
mala conducta del alumno. Puede comenzar como advertencia y aumentar a medida que el
alumno reitera su comportamiento. El castigo debe ser siempre un último recurso, aplicarse de
manera justa, proporcionada y dejando claro cuál es la conducta inadecuada y la acción
deseable que se pretende reforzar.

Condicionamiento Operante o Instrumental

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Condicionamiento Operante o Instrumental

Cargado por

Copyright:

Formatos disponibles

CONDICIONAMIENTO OPERANTE O INSTRUMENTAL

El condicionamiento instrumental o condicionamiento operante es un tipo de aprendizaje

Lo que es o no es un refuerzo durante el condicionamiento operante depende del individuo y

FASES DEL CONDICIONAMIENTO OPERANTE:

Distinción entre condicionamiento clásico y operante

Edward Lee Thorndike (pr. [θ'oRn daik]) (Williamsburg, 31 de agosto de 1874-Montrose, 9 de

Dentro de los procedimientos conductuales, el condicionamiento operante o instrumental es

Antecedentes del condicionamiento operante

Diferencia entre condicionamiento clásico y operante

2. Entrenamiento de omisión: En este procedimiento, a la conducta del sujeto le sigue la

3. Programas de reforzamiento diferencial: Son un subtipo especial de programa de

4. Coste de respuesta: Variante del castigo negativo en que la ejecución de la conducta

7. Sobrecorrección: La sobre-corrección consiste en aplicar un castigo positivo relacionado

Técnicas de organización de contingencias: Los sistemas de organización de contingencias

APLICACIONES AL ESTUDIO (APRENDIZAJE)

Los 13 tipos de aprendizaje: ¿cuáles son?

3.3. La motivación en la psicología del aprendizaje

Factores motivacionales del condicionamiento clásico

Para estudiar el papel de la motivación en los condicionamientos, se emplea la técnica de la

Tentativas explicativas de la imitación

Justificaciones cognitivas de la imitación

Procesos de reproducción motora

El análisis conductual aplicado es el uso de los principios conductuales del

También podría gustarte