Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Al suavizarse ese planteamiento inicial (tema 6), se empieza a introducir el concepto de incentivo
como el aspecto motivador del reforzador (Hull), en cuanto que «atraía al sujeto o tiraba de él
hacia la meta», se puede observar la fuerza en el estímulo. Posteriormente, desde una perspectiva
más cognitiva sobre aprendizaje animal, la teoría del incentivo de Dickinson et al. mantiene que la
dirección hacia una meta es fruto de la interacción entre estados emocionales y expectativas
cognitivas.
Se ha dado un paso más al considerar que el aspecto motivador del incentivo ya no solo se halla
en el objeto a conseguir sino en las expectativas que se crea el propio sujeto acerca de ese
objeto. Sería la manera en que percibiese el sujeto esa atracción lo que realmente le motivaría a
emitir la conducta. En esa nueva consideración de la noción de incentivo el componente de la
motivación juega un papel fundamental. Es sabido que la motivación determina aquello que se
ejecuta e, incluso, aquello que se aprende.
- Motivación: se obtiene la fuerza para emitir esas respuestas. Dirige la conducta pero también
la energiza o instiga en el sentido que la intensifica. Conforme a la motivación, daremos más
respuestas y más rápidas o nos mantendremos más tiempo emitiendo esa respuesta.
1. Por condicionamiento clásico los objetos del ambiente adquieren propiedades hedónicas,
agradables como aversivas. Mediante condicionamiento clásico se aprende a anticipar los
estímulos ambientales que están a punto de producirse. En el experimento de Pavlov también
se aprendía el valor de esos estímulos para el sujeto, lo que da lugar a una tendencia
motivacional, que provoca conductas de acercamiento o alejamiento.
2. Por condicionamiento operante el sujeto emite respuestas voluntarias para acceder a esos
estímulos o huir de ellos, según sean las características hedónicas de dichos estímulos
reforzadores.
El componente motivacional hace que el sujeto se sienta atraído o, por el contrario, sienta
repulsión por las características del estímulo y realice las conductas que le lleven a su consecución
o rechazo.Esta motivación que se anticipa al reforzador se denomina motivación de incentivo
que al encontrarse regulada por el ambiente es aprendida por condicionamiento operante, si
bien por condicionamiento clásico los estímulos adquieren sus características hedónicas.
• Condicionamiento operante: configura nuestra conducta dirigida a una meta, siendo los
estímulos agradables los que provocan las conductas de aproximación a esa meta y los
estímulos aversivos los que inducen las conductas de evitación, las cuales son igualmente
adaptativas para la supervivencia.
Insistimos en que el valor de incentivo depende de las expectativas del sujeto que percibe
ese estímulo.
Es la experiencia hedónica producida por las propiedades sensoriales de los estímulos lo que
refuerza la conducta motivada extrínsecamente. Por lo indicado hasta este momento, es fácil
deducir que la motivación regulada por el ambiente es fruto del aprendizaje, ya que
aprendemos las consecuencias de nuestras respuestas, de tal forma que los agentes
externos.
Las características del reforzador facilitan la ejecución por las expectativas que crean y, por eso,
el valor de incentivo es aprendido. El valor del objeto no se encuentra en sí mismo, sino en el
sujeto que lo percibe e interpreta.
C. Incentivo: Expectativa que se crea ante aquel objeto ambiental que se conoce de
antemano que se va a conseguir si se realiza determinada ejecución y, en este sentido,
atrae o no a la persona a realizarla. Es el componente motivacional de la acción, y por eso
depende de la experiencia personal y las expectativas al respecto.
Planteados estos tres elementos, se puede comprobar que la recompensa actúa como
reforzador porque se dispensa después de la acción e incrementa su probabilidad de repetición
y, funciona como incentivo dado que nos permite anticipar las consecuencias favorables de la
ejecución de la conducta.
Para ver la diferencia entre recompensa e incentivo. Los incentivos difieren de los reforzadores
en su momento de aparición y en cómo motivan el comportamiento. Mientras que el reforzador
al darse al nal de la respuesta determina que se vuelva a emitir, el incentivo, al adelantarse a
esa respuesta, establece la fuerza/debilidad con la que se va a emitir e, incluso, que no se
produzca. El valor de incentivo afecta a la ejecución, porque «distrae» la atención del proceso de
aprendizaje hacia las conductas necesarias para obtener la recompensa cuanto antes. Las teorías
del incentivo se han desarrollado a partir de los efectos que tienen las condiciones de
reforzamiento sobre la ejecución.
3
fi
1. Programa de refuerzo parcial: La emisión de la respuesta no tiene en todas las ocasiones las
consecuencias que se deseaban.
Los programas de refuerzo simple se pueden llevar a cabo de dos maneras diferentes:
A. Manipulando el número de respuestas que se tiene que emitir para recibir el premio.
Existe otra situación de refuerzo parcial en la que también se tiene en cuenta el número de
respuestas y que se denomina: programa de razón variable. En ella el número de respuestas que
debe emitir el sujeto para obtener el premio varía de un ensayo a otro según una programación
previa. En este tipo de programa el sujeto establece unas expectativas de la situación que
provocan que se produzca una tasa de respuesta constante, pero cuanto más elevado sea el
número medio de respuestas que debe dar para recibir el premio, mayor será la cantidad de
respuestas que emita el sujeto.
4. Los programas de razón variable: Operan en las máquinas tragaperras; ello explica el vigor y
la persistencia de esta conducta «obsesiva», en la que el individuo sigue incesantemente
repitiendo la acción de introducir monedas aunque no aparezca el premio.
Mientras transcurre ese intervalo de tiempo, el sujeto puede estar motivado para ejecutar la
respuesta y realizarla, pero solo recibirá el premio cuando haya pasado el periodo preestablecido
fi
Comparando los dos tipos de programa, razón e intervalo, puede concluirse un patrón de
actuación característico:
- En los de razón se emiten mayor número de respuestas, ya que depende del sujeto el
recibir el reforzador.
- En los de intervalo se producen pausas después de recibir los premios, pues el sujeto se
crea claramente expectativas sobre la situación y el acceso al reforzador y aprende que,
hasta que no transcurra un tiempo determinado no podrá obtener el premio.
La cantidad y la calidad del premio afectan a la motivación, en el sentido de que producen más
motivación de incentivo y, a su vez, ese nivel motivacional afecta más a la ejecución de una
conducta que a su aprendizaje. De esta forma se ha comprobado que la ejecución de la conducta
motivada aumenta conforme se incrementa la magnitud o cantidad del estímulo reforzante por las
expectativas que conlleva.
Aspecto fundamental: Para establecer la cantidad óptima de un premio habrá que conocer la
historia previa del sujeto, dado que es el factor que nos permitirá conocer las expectativas que
se crearán ante dicho premio.
En relación a esta variable, inicialmente Crespi probó de forma experimental, que los cambios
en la magnitud o en la calidad del premio, durante la adquisición de una conducta, provocan
cambios en la conducta motivada: Efecto de contraste. Es uno de los parámetros donde se
puede observar el peso de la motivación sobre el aprendizaje.
Ambos tienen que ver con las reacciones emocionales que se producen en el sujeto ante el
cambio en las expectativas que se crean sobre la situación de incentivo. Esta afirmación nos
indica que esas diferencias de ejecución se deben a diferencias en la motivación, puesto que los
cambios en el aprendizaje se producen más gradualmente.
- Tipos de contraste: Variable muy importante a considerar y nos confirma, que si no conocemos
la experiencia previa del sujeto con el reforzador puede que no tenga los efectos que nosotros
pensamos a priori.
- Aprendizaje latente: Se aprende una conducta sin recompensa, lo que produce una ejecución
escasa pero, cuando esa misma conducta pasa a ser reforzada, se emite rápidamente.
- Los reforzadores verbales: Actúan como marcas que permiten demoras prolongadas del
premio sin que afecten a la ejecución de la conducta.
- Descuento de la demora: Tiene que ver con las expectativas que se crean al respecto. Se ha
comprobado que la demora del premio produce que se reduzca su valor de incentivo.
En un principio se pensaba que un premio que se demorara más tiempo pero de gran magnitud,
se seguía prefiriendo durante todo el plazo de la demora. Sin embargo, se ha comprobado que
aunque inicialmente se hubiera elegido un premio muy demorado de gran magnitud por encima
de otro menos demorado, cuando se empieza a aproximar el plazo de cumplimiento del premio
inferior, los sujetos pasan a preferir éste por ser más inmediato, dado que su nivel motivacional se
dispara.
- Entrenamiento de omisión: Su objetivo es suprimir una conducta. Hay situaciones en las que
la aparición de una conducta determinada provoca que desaparezca el premio. En este
sentido, el valor de incentivo del reforzador para el sujeto determina que no se ejecute la
conducta para que no se retire el estímulo agradable. Para que realmente la acción fuese
eficaz, se debería insistir sobre otras conductas más deseables.
- Ej: Cuando se diseñó la normativa del carné de conducir por puntos, al conductor se le
retiraban determinados puntos cuando cometía una infracción, y además esa resta de puntos
se realizaba inmediatamente para que se produjera una asociación clara entre infracción y
estímulo aversivo. Cuando antes del 2006 se enviaba la multa a casa después de un par de
meses de haber cometido la infracción, el conductor se enfadaba por tener que pagar ese
dinero, dado que la asociación anteriormente mencionada no se estabecía claramente para
futuros comportaientos por la demora excesiva entre la conducta y sus consecuencias. Cada
vez que se detecta un comportamiento disruptivo afecta a las conductas posteriores al restar
puntos, lo que actuaría como marcaje del estímulo aversivo y atenuaría los efectos de la
demora.
Se pueden establecer dos situaciones en las que se emplea un estímulo desagradable pero con
consecuencias diferentes sobre la ejecución:
b) En una situación de evitación se hace uso de los denominados estímulos discriminativos que
avisan de la próxima aparición del estímulo aversivo, lo que posibilita el no sufrirlo. En los
primeros ensayos en una situación experimental de evitación, el sujeto padecerá el estímulo
aversivo y al emitir la respuesta escapará de él, pero con la presencia de un estímulo
discriminativo que le avise de la situación, a medida que avancen los ensayos, aprenderá que
ese estímulo discriminativo, le avisa de la aparición del estímulo aversivo y así no tendría que
sufrir las consecuencias del estímulo aversivo.
■ La base del condicionamiento operante era que se debía emitir una respuesta para ser
reforzada y así incrementar su frecuencia, mientras que el objetivo del escape/evitación es que
no aparezca el reforzador, contradiciendo de alguna manera el principio general del
condicionamiento operante.
■ Se han intentado dar diferentes explicaciones a este hecho: la Tª de los dos factores de
Mowrer , para indicar que la conducta de escape se adquiere por una fase de condicionamiento
clásico y otra de condicionamiento operante. Inicialmente el sujeto recibe el reforzador versivo y
el estímulo discriminativo, se condiciona clásicamente a la respuesta de miedo. Por otra parte,
se ha comprobado que no se puede condicionar cualquier respuesta de escape, sino que el
organismo muestra conductas defensivas propias de la especie, que le lleva a emitirlas en
situaciones de peligro.
2. Castigo: la respuesta provoca que aparezca un estímulo aversivo, por lo que la adquisición de
expectativas al respecto debería llevar a no ejecutar la conducta.
El castigo
- Finalidad del castigo: No emisión de la conducta. Castigo se opone a refuerzo. Por otra parte,
debemos distinguir el castigo de la situación de evitación/escape ya que el objetivo del
8
castigo es, motivar para dejar de emitir una conducta y en la situación de escape o en la
evitación, sin embargo, el sujeto se encuentra motivado a dar aquella respuesta con la que
evita o en la que escapa del estímulo aversivo.
- Fruto de trabajosa investigar la efectividad del castigo, se han establecido una serie de variables
que, afectan a los resultados del castigo:
- Duración del estímulo desagradable. Cuanto más prolongado dentro de unos límites sea
el castigo, mayor efecto supresor tendrá.
Si se manipulan bien las variables expuestas se podrán controlar los efectos del estímulo
desagradable sobre la supresión de la conducta y, así, este procedimiento será e caz. No
obstante, su mal empleo o su utilización constante provocan ansiedad en el que lo padece.
Asimismo, se ha comprobado que cuando se vive en un ambiente dónde se emplea
continuamente el castigo, posteriormente también se recurrirá con más frecuencia a él en las
interacciones con los demás; uno se hace finalmente más agresivo.
f
El castigo provoca seis efectos secundarios:
3. Sustitución de la respuesta castigada por otra igualmente no deseada (se castiga a un niño
por gritar y empieza a dar patadas).
De todas las teorías explicativas al respecto, la más completa es la de las expectativas acerca de
la falta de control sobre los eventos que, además, transfiere a otras situaciones.
2. Resistencia a la extinción: Número de veces que se sigue emitiendo la respuesta aunque las
consecuencias de dicha conducta no se presenten, debido al nivel motivacional alcanzado
durante la adquisición de la respuesta. Las variables que afectan a la extinción se miden por
los efectos que producen en dicha resistencia. Son:
10
- Mantiene que puede actuar de reforzador cualquier actividad cuya probabilidad de ocurrencia
sea mayor que la de la conducta exigida.
- Postula que cuando una conducta se hace contingente con otra, la más probable servirá de
reforzador a la menos probable, pero no al contrario, es decir, la respuesta más probable
puede motivar al sujeto para emitir la respuesta menos probable.
- Con la situación experimental se comprueba que actividades con alta probabilidad refuerzan
las actividades de baja probabilidad. Al observar el porcentaje de tiempo que un sujeto dedica
a una actividad, podemos comprobar sus preferencias que, obviamente, son subjetivas.
- Tiene gran repercusión en la psicología, dado que permite que siempre se pueda encontrar un
motivo para el aprendizaje de una conducta nueva. Basta con fijarse en el repertorio de
conductas del sujeto y emplear aquella que realice con más frecuencia, para reforzar la que se
desee que adquiera. Así un niño con autismo con el que es difícil interaccionar por su propia
patología, si se observa que mira continuamente las láminas de un libro, se puede emplear
éste como reforzador cuando presente respuestas de aproximación al adulto.
Según los autores, observando la actividad de los organismos es posible predecir cuándo la
oportunidad de emitir una actividad se convertirá en reforzadora de otra, e, incluso, postulan que
se puede comprobar que una actividad de poca probabilidad de ocurrencia, se puede convertir
en reforzadora de otra de mayor frecuencia. En posteriores investigaciones, desarrollaron su
hipótesis inicial al comprobar que, en condiciones normales, los sujetos emiten el menor número
11
de respuestas contingentes para sacar el máximo provecho a los reforzado- res o, lo que es lo
mismo, se busca emitir el menor número de respuestas para conseguir el reforzador. De esta
forma, cualquier actividad, se puede convertir en reforzadora de otra.
- Se plantea que como los organismos hacen una distribución adaptativa de sus
actividades, lo que se intenta, es romper dicha distribución para condicionar la
realización de una tarea previa del sujeto, a la ejecución que se desea implantar. Así
durante el condicionamiento, se redistribuye el tiempo de una forma diferente a como
había hecho el propio sujeto, por lo que, se pretende que llegue a su propia
distribución adaptativa.
Desde aquí podemos afirmar que con la manipulación de los reforzadores se puede intervenir en
la conducta, a través de su nivel de motivación, y no siempre el sujeto es consciente de ello.
12
Ed- - - - - - R- - - - - - Ref
Ed, conducta a imitar que actúa como estímulo discriminativo
R, respuesta imitada
Ref, reforzador
• Este modelo presenta tres limitaciones: la respuesta debe existir previamente en el
repertorio de conductas de la persona que imita, en cuanto que se exige que exista un
reforzador para que se adquiera la conducta, ya que se aprenden la conducta
observándola sin necesidad de un reforzador; y, en cuanto que considera que se debe
ejecutar la conducta una vez observada, cuando se ha comprobado la imitación
demorada.
13
El máximo representante es Bandura quien elaboró la teoría del aprendizaje social, que tiene
como punto principal considerar que el ser humano se encuentra fundamentalmente inmerso en
un medio social, y lo que aprende lo consigue al observar la conducta de los demás y, a través de
esa observación, aprende la utilidad de ciertas conductas por las consecuencias que conllevan.
Fue posteriormente ampliada, pasándose a ser teoría social cognitiva que parte de tres
supuestos:
• El modelo de reciprocidad diádica no implica que las influencias siempre tengan igual
peso, es decir, a veces un elemento determina en mayor manera el aprendizaje que otro; no
obstante, la mayoría de las veces el comportamiento es fruto de la interacción de los tres
elementos.
• De forma vicaria: se acelera el aprendizaje; se evita tener que ejecutar todo tipo de
conductas para aprenderlas y, generalmente, las actividades complejas se mejoran en gran
parte por observación.
14
fi
2. La anticipación del reforzador es uno de los factores que pueden in uir en que se
observen determinadas cosas, y/o traspasen desapercibidas. Para Bandura el esquema de
funcionamiento del refuerzo vicario es el expuesto a continuación.
Según la teoría, el refuerzo se estima como un factor que facilita el proceso de aprendizaje, pero
no es una condición imprescindible. Se considera que la explicación que se da desde las teorías
operantes, para las que es imprescindible que se dispense un reforzador, es un caso especial de
AO.
■ Procesos atencionales.
■ Procesos de retención.
■ Procesos de reproducción motora.
■ Procesos de motivación.
Los dos primeros están implicados en la adquisición de la conducta modelada, mientras que los
dos últimos tendrán más que ver con su ejecución.
A. Procesos atencionales
En estos procesos se considera que la atención que se presta a los acontecimientos relevantes
del medio es necesaria para que sean percibidos de forma significativa, pues la estimulación
contigua por sí sola no produce siempre la adquisición de respuestas. Se considera esencial la
focalización y mantenimiento de un foco atencional para la adquisición de conductas imitativas,
con el fin de que el observador discrimine entre las claves relevantes e irrevelantes de la conducta
del modelo. Las principales variables que determinan esa focalización so n:
■ Repetición.
■ Las propiedades físicas del estímulo.
■ Las características más cognitivas (intensidad, la viveza y novedad), son fundamentales para
centrar la atención. Los estímulos de modelado deben presentarse de forma que no excedan la
capacidad de atención del sujeto, de igual forma, el grado de discriminación de los estímulos
de modelado y su presentación real o imaginaria determinan el nivel de AO.
■ La complejidad del estímulo, porque dificulta la atención sobre la conducta observada.
• Las características del modelo. El grado de competencia, el prestigio social, la edad, el sexo y
el estatus social o étnico, determinan la atención que se preste a un modelo. El valor afectivo de
los modelos puede incrementar el AO al provocar y mantener una conducta atencional más
fuerte.
15
fl
Así cuando las experiencias se han codificado para su representación en la memoria, funcionan
como mediadoras para la recuperación, actualización y reproducción de las pautas de conductas
imitadas. Los códigos imaginativos y verbales tienen la función de representar de forma
simbólica en la memoria las respuestas imitativas, actuando de guías y dando cuenta, también,
de la retención a largo plazo de los estímulos de modelado aun cuando el modelo no esté
presente.
16
Una misma conducta puede tener consecuencias diferentes en función de las situaciones donde
se manifieste, de las personas a las que se dirija y el momento en que se realice. Cuando se
observa cómo se recompensa a alguien por cierta conducta, en un contexto determinado, pero
se le ignora o castiga por ese mismo tipo de conducta en una situación diferente, se obtiene
información discriminativa acerca de los aspectos del medio que van a determinar con-
secuencias de recompensa o castigo.
17