Está en la página 1de 17

TEMA 7: MOTIVACIÓN Y APRENDIZAJE.

Al suavizarse ese planteamiento inicial (tema 6), se empieza a introducir el concepto de incentivo
como el aspecto motivador del reforzador (Hull), en cuanto que «atraía al sujeto o tiraba de él
hacia la meta», se puede observar la fuerza en el estímulo. Posteriormente, desde una perspectiva
más cognitiva sobre aprendizaje animal, la teoría del incentivo de Dickinson et al. mantiene que la
dirección hacia una meta es fruto de la interacción entre estados emocionales y expectativas
cognitivas.

Se ha dado un paso más al considerar que el aspecto motivador del incentivo ya no solo se halla
en el objeto a conseguir sino en las expectativas que se crea el propio sujeto acerca de ese
objeto. Sería la manera en que percibiese el sujeto esa atracción lo que realmente le motivaría a
emitir la conducta. En esa nueva consideración de la noción de incentivo el componente de la
motivación juega un papel fundamental. Es sabido que la motivación determina aquello que se
ejecuta e, incluso, aquello que se aprende.

2. LA MOTIVACIÓN EN LA CONDUCTA APRENDIDA.


La motivación responde a la pregunta del porqué actuamos. Es una pregunta esencial en
psicología, ya que si desconocemos qué nos lleva a funcionar, cómo lo hacemos y cómo
mantenemos una conducta en el tiempo, difícilmente podremos llegar a desvelar el psiquismo
humano. Cuando estamos motivados para hacer algo, no vemos los problemas del camino o, al
menos, nos sentimos capaces, pero cuando nos falta esa activación, cualquier cosa nos es
imposible.

- Aprendizaje: se aprende la respuesta a dar en cada momento.

- Motivación: se obtiene la fuerza para emitir esas respuestas. Dirige la conducta pero también
la energiza o instiga en el sentido que la intensifica. Conforme a la motivación, daremos más
respuestas y más rápidas o nos mantendremos más tiempo emitiendo esa respuesta.

El incentivo se refiere a la manera en que afecta en la conducta motivada de cada sujeto la


estimulación externa. Según la Tª del incentivo, hay objetos en el ambiente hacia los cuales es
atraído el organismo y así «tiran» de él, pero, esa atracción depende fundamentalmente del
propio sujeto en cuanto a su historia personal con el reforzador y a las expectativas que se crea
sobre la situación.

Por el condicionamiento clásico se obtiene el procedimiento por el que se adquieren y explican


las propiedades hedónicas de los estímulos que incentivan al organismo a realizar la conducta:
Muy sucintamente el proceso es el siguiente:

1. Por condicionamiento clásico los objetos del ambiente adquieren propiedades hedónicas,
agradables como aversivas. Mediante condicionamiento clásico se aprende a anticipar los
estímulos ambientales que están a punto de producirse. En el experimento de Pavlov también
se aprendía el valor de esos estímulos para el sujeto, lo que da lugar a una tendencia
motivacional, que provoca conductas de acercamiento o alejamiento.

2. Por condicionamiento operante el sujeto emite respuestas voluntarias para acceder a esos
estímulos o huir de ellos, según sean las características hedónicas de dichos estímulos
reforzadores.

El componente motivacional hace que el sujeto se sienta atraído o, por el contrario, sienta
repulsión por las características del estímulo y realice las conductas que le lleven a su consecución
o rechazo.Esta motivación que se anticipa al reforzador se denomina motivación de incentivo
que al encontrarse regulada por el ambiente es aprendida por condicionamiento operante, si
bien por condicionamiento clásico los estímulos adquieren sus características hedónicas.

• Condicionamiento operante: configura nuestra conducta dirigida a una meta, siendo los
estímulos agradables los que provocan las conductas de aproximación a esa meta y los
estímulos aversivos los que inducen las conductas de evitación, las cuales son igualmente
adaptativas para la supervivencia.

• El valor de incentivo depende de:


Las expectativas del sujeto, que funciona, entonces, por sus características hedónicas, dado
que tendemos a acercarnos a aquello que nos reporta consecuencias agradables, y a
alejarnos de aquello que nos produce consecuencias desagradables. I

Insistimos en que el valor de incentivo depende de las expectativas del sujeto que percibe
ese estímulo.

Es la experiencia hedónica producida por las propiedades sensoriales de los estímulos lo que
refuerza la conducta motivada extrínsecamente. Por lo indicado hasta este momento, es fácil
deducir que la motivación regulada por el ambiente es fruto del aprendizaje, ya que
aprendemos las consecuencias de nuestras respuestas, de tal forma que los agentes
externos.

• La motivación de incentivo se basa en las expectativas o en la anticipación de las


propiedades hedónicas de los reforzadores. Esto sugiere que la conducta instrumental se
encuentra motivada por las expectativas de un reforzador con unas características
determinadas que dependen de un aprendizaje previo.

3. LOS NIVELES DE MOTIVACIÓN ANTE LA PRESENCIA DE UN REFORZADOR


Se ha insistido en la diferencia entre el reforzador en sí y su aspecto motivador. Ambos aspectos
determinarán la actuación última. Solamente la idea de que tal conducta llevará a tal premio,
puede hacer que la conducta se realice de forma más motivada. Así, se pueden aprender
respuestas tanto anticipando los premios que conlleve su ejecución.

Las características del reforzador facilitan la ejecución por las expectativas que crean y, por eso,
el valor de incentivo es aprendido. El valor del objeto no se encuentra en sí mismo, sino en el
sujeto que lo percibe e interpreta.

1. Valor de incentivo: Experiencia subjetiva de las características motivacionales que posee el


reforzador para el sujeto y que le llevan a actuar. No causa la conducta, pero afecta a la
probabilidad de que se repita la respuesta en cuanto que «es una señal situacional que marca la
posibilidad de que una conducta produzca o no consecuencias de recompensa o castigo, y se
aprende mediante la experiencia ».

El incentivo siempre precede a la ejecución creando una expectativa de futuras consecuencias


buenas o malas sobre la conducta.

En el modelo de incentivo se destaca la asociación de los estímulos con placer o dolor e,


igualmente, los esfuerzos del organismo por alcanzar metas que atraen o repelen. Conviene dejar
claro desde el inicio la diferencia entre recompensa, castigo e incentivo:

A. Recompensa: Objeto ambiental agradable que se da al final de una secuencia conductual


y su objetivo es el incremento de esa conducta. Nuestra conducta depende en gran
medida de las recompensas por el valor motivacional que conllevan. No solo se actúa para
obtener recompensas materiales, las recompensas sociales tienen un gran peso en la
ejecución de nuestros comportamientos.

B. Castigo: Objeto ambiental desagradable que se da al final de una secuencia conductual y


su finalidad es reducir la probabilidad de que se vuelva a emitir esa respuesta.

C. Incentivo: Expectativa que se crea ante aquel objeto ambiental que se conoce de
antemano que se va a conseguir si se realiza determinada ejecución y, en este sentido,
atrae o no a la persona a realizarla. Es el componente motivacional de la acción, y por eso
depende de la experiencia personal y las expectativas al respecto.

Planteados estos tres elementos, se puede comprobar que la recompensa actúa como
reforzador porque se dispensa después de la acción e incrementa su probabilidad de repetición
y, funciona como incentivo dado que nos permite anticipar las consecuencias favorables de la
ejecución de la conducta.

Para ver la diferencia entre recompensa e incentivo. Los incentivos difieren de los reforzadores
en su momento de aparición y en cómo motivan el comportamiento. Mientras que el reforzador
al darse al nal de la respuesta determina que se vuelva a emitir, el incentivo, al adelantarse a
esa respuesta, establece la fuerza/debilidad con la que se va a emitir e, incluso, que no se
produzca. El valor de incentivo afecta a la ejecución, porque «distrae» la atención del proceso de
aprendizaje hacia las conductas necesarias para obtener la recompensa cuanto antes. Las teorías
del incentivo se han desarrollado a partir de los efectos que tienen las condiciones de
reforzamiento sobre la ejecución.

Consecuencias motivacionales del premio.


Las expectativas positivas de una recompensa sobre la acción que la provoca, van a llevar a que
se incremente el número de veces que se emita esa respuesta para obtener los beneficios
esperados. Es más, si a determinada conducta le siguen ciertas consecuencias favorables para el
organismo, le va a motivar a repetir la respuesta para conseguir el premio e, incluso, se va a dar
esa respuesta más rápidamente conforme ese estímulo posea más valor motivacional para la
persona que ejecuta la acción. Los elementos más importantes son:

• La contingencia premio-conducta motivada.


• Los efectos en la motivación en la magnitud del
premio.
• La detección de causalidad.
• Las consecuencias motivacionales por la demora del premio.

3

fi



Contingencia premio-conducta motivada

1. Programa de refuerzo parcial: La emisión de la respuesta no tiene en todas las ocasiones las
consecuencias que se deseaban.

Este tipo de programas se pueden complicar hasta situaciones experimentales realmente


sofisticadas, pero vamos a profundizar en los programas de refuerzo parcial simple, que son
aquellos en los que el sujeto solo debe emitir un tipo de respuesta.

Los programas de refuerzo simple se pueden llevar a cabo de dos maneras diferentes:

A. Manipulando el número de respuestas que se tiene que emitir para recibir el premio.

B. Se puede establecer que el premio se dispense después de un período de tiempo


determinado.

2. Programa de refuerzo de razón: Cuando se ha acordado que el sujeto debe ejecutar la


respuesta un número de veces señalado antes de recibir el premio.

3. Programa de refuerzo de intervalo: Si lo que planteamos es una situación en la que solo


daremos el premio cuando haya transcurrido un tiempo acordado previamente. En esta situa- ción
el sujeto, aunque ejecute repetidamente la res- puesta, solo tendrá disponible el premio ante
aquella respuesta pasado el tiempo que se haya estipulado previamente y, a partir de ahí,
empezará a contar nuevamente otro intervalo de tiempo.

Un ejemplo de programa de razón es el que se emplea para controlar la «conducta de pica». A


partir de esos datos, se puede establecer que el sujeto reciba el premio cada diez veces que haya
conseguido controlar el impulso de comer. Hasta hace poco tiempo junto con la compra de
algunos periódicos se entregaban cupones que cuando se conseguía un número determinado de
ellos, se regalaba una camiseta o, incluso, una vajilla.

4. Programas de razón ja porque en todas ellas se dispensa el premio emitidas un número


predeterminado de respuestas. Con los programas de razón se produce una tasa de respuestas
consistente con una característica, la respuesta se interrumpe temporalmente nada más recibir el
reforzador, lo que se conoce como pausa post-reforzamiento.

Existe otra situación de refuerzo parcial en la que también se tiene en cuenta el número de
respuestas y que se denomina: programa de razón variable. En ella el número de respuestas que
debe emitir el sujeto para obtener el premio varía de un ensayo a otro según una programación
previa. En este tipo de programa el sujeto establece unas expectativas de la situación que
provocan que se produzca una tasa de respuesta constante, pero cuanto más elevado sea el
número medio de respuestas que debe dar para recibir el premio, mayor será la cantidad de
respuestas que emita el sujeto.

4. Los programas de razón variable: Operan en las máquinas tragaperras; ello explica el vigor y
la persistencia de esta conducta «obsesiva», en la que el individuo sigue incesantemente
repitiendo la acción de introducir monedas aunque no aparezca el premio.

Mientras transcurre ese intervalo de tiempo, el sujeto puede estar motivado para ejecutar la
respuesta y realizarla, pero solo recibirá el premio cuando haya pasado el periodo preestablecido

fi

y emita la conducta correctamente; a partir de que se responda se empezará a contabilizar el


tiempo para administrar la recompensa en el próximo ensayo. A medida que se va adquiriendo la
respuesta, lógicamente el sujeto va aprendiendo la situación y adecuando sus expectativas, lo
que le lleva a predecir la aparición del premio y provoca que, anteriormente a él no emita la
actividad, pero al aproximarse la finalización del plzo de tiempo, el sujeto incremente
significativamente su número de respuestas.

En otras ocasiones se puede manipular un intervalo de tiempo medio, que se varía de un


ensayo a otro. En estos programas de intervalo variable la tasa de respuestas es más estable y la
cantidad de respuestas se ve influenciada por la duración del intervalo, debido a que al sujeto le
es difícil crearse unas expectativas sobre la situación.

Comparando los dos tipos de programa, razón e intervalo, puede concluirse un patrón de
actuación característico:

- En los de razón se emiten mayor número de respuestas, ya que depende del sujeto el
recibir el reforzador.

- En los de intervalo se producen pausas después de recibir los premios, pues el sujeto se
crea claramente expectativas sobre la situación y el acceso al reforzador y aprende que,
hasta que no transcurra un tiempo determinado no podrá obtener el premio.

Efecto de la motivación en la magnitud del premio.

La cantidad y la calidad del premio afectan a la motivación, en el sentido de que producen más
motivación de incentivo y, a su vez, ese nivel motivacional afecta más a la ejecución de una
conducta que a su aprendizaje. De esta forma se ha comprobado que la ejecución de la conducta
motivada aumenta conforme se incrementa la magnitud o cantidad del estímulo reforzante por las
expectativas que conlleva.

Aspecto fundamental: Para establecer la cantidad óptima de un premio habrá que conocer la
historia previa del sujeto, dado que es el factor que nos permitirá conocer las expectativas que
se crearán ante dicho premio.

En relación a esta variable, inicialmente Crespi probó de forma experimental, que los cambios
en la magnitud o en la calidad del premio, durante la adquisición de una conducta, provocan
cambios en la conducta motivada: Efecto de contraste. Es uno de los parámetros donde se
puede observar el peso de la motivación sobre el aprendizaje.

- Efecto de contraste conductual positivo (efecto de elación): Si a un sujeto experimental se le


ha entrenado con una magnitud de recompensa determinada y luego esta se incrementa, el
sujeto se hallará más motivado y su número de respuestas aumentará y el tiempo que tarda en
emitirlas disminuirá. Se ha comprobado que aquellos sujetos a los que se les agranda la
magnitud del premio a lo largo de un experimento, elevan el número de respuestas dadas.

- Efecto de contraste conductual negativo (efecto de depresión), y es el caso contrario. Si a lo


largo del experimento se disminuye la magnitud de la recompensa, los sujetos se encontrarán
menos motivados para responder de tal forma que pasarán a responder menos o peor; y,
cuando se desciende la magnitud de la recompensa realizando la misma actuación, los sujetos
responden por debajo de aquellos otros a los que se les dio siempre ese reforzador pequeño.

En este tipo de contraste se produce frustración primaria, una serie de reacciones


emocionales desagradables y disruptivas y una disminución de la eficacia conductual. Se
produce generada por obtener menos incentivo del que se esperaba en función de la historia
de reforzamiento anterior.

Ambos tienen que ver con las reacciones emocionales que se producen en el sujeto ante el
cambio en las expectativas que se crean sobre la situación de incentivo. Esta afirmación nos
indica que esas diferencias de ejecución se deben a diferencias en la motivación, puesto que los
cambios en el aprendizaje se producen más gradualmente.

- Tipos de contraste: Variable muy importante a considerar y nos confirma, que si no conocemos
la experiencia previa del sujeto con el reforzador puede que no tenga los efectos que nosotros
pensamos a priori.

- Aprendizaje latente: Se aprende una conducta sin recompensa, lo que produce una ejecución
escasa pero, cuando esa misma conducta pasa a ser reforzada, se emite rápidamente.

Consecuencias motivacionales por la demora del premio

El aprendizaje es mejor cuando el premio se aplica inmediatamente a la realización de la


respuesta y, que demoras en el acceso al premio retardan la ejecución, debido a que no se
establece la asociación entre ambos elementos: conducta motivada-premio. También, se ha
explicado este hecho porque durante el retraso en la administración del reforzador, el sujeto
puede realizar otras conductas que pasen a ser premiadas y, con ello, el sujeto no discrimine tan
fácilmente la situación de aprendizaje. La importancia de la inmediatez en la entrega del premio
ante la realización de la conducta deseada queda también patente en el adiestramiento de
mascotas.

- En un principio se creyó que la demora en la aplicación del premio afectaba a la adquisición


de la conducta y, a partir de un determinado periodo de tiempo, el aprendizaje se hacía
imposible. Se ha comprobado que no es exactamente así, dado que en la propia situación
aparecen estímulos de marcaje o estímulos marca que actúan como reforzadores
secundarios, y estos reforzadores secundarios sí son contingentes con la conducta motivada,
con lo que minimizan los efectos de la demora del premio.

- Los reforzadores verbales: Actúan como marcas que permiten demoras prolongadas del
premio sin que afecten a la ejecución de la conducta.

- Descuento de la demora: Tiene que ver con las expectativas que se crean al respecto. Se ha
comprobado que la demora del premio produce que se reduzca su valor de incentivo.

Es comprensible que los reforzadores desarrollen más valor de incentivo si se administran


inmediatamente. Los estudios que han intentado aclarar este aspecto, trabajan con reforzadores
de distinta magnitud y distinta demora.

En un principio se pensaba que un premio que se demorara más tiempo pero de gran magnitud,
se seguía prefiriendo durante todo el plazo de la demora. Sin embargo, se ha comprobado que
aunque inicialmente se hubiera elegido un premio muy demorado de gran magnitud por encima
de otro menos demorado, cuando se empieza a aproximar el plazo de cumplimiento del premio

inferior, los sujetos pasan a preferir éste por ser más inmediato, dado que su nivel motivacional se
dispara.

Mazur ha demostrado que el valor de incentivo de un reforzador demorado aumenta en una


proporción creciente por unidad de tiempo conforme disminuye la demora.

- Margen de vulnerabilidad: El margen de tiempo en el que se cambia el criterio de


decisión y se pasa a preferir el reforzador más inmediato. Durante ese tiempo se tienen
reacciones más impulsivas y menos adaptativas.

- El margen de vulnerabilidad depende tanto de la magnitud y la demora del reforzador,


como del autocontrol y la impulsividad del sujeto. (Ej. Dulces y dieta).

La conducta motivada ante la retirada del premio

- Entrenamiento de omisión: Su objetivo es suprimir una conducta. Hay situaciones en las que
la aparición de una conducta determinada provoca que desaparezca el premio. En este
sentido, el valor de incentivo del reforzador para el sujeto determina que no se ejecute la
conducta para que no se retire el estímulo agradable. Para que realmente la acción fuese
eficaz, se debería insistir sobre otras conductas más deseables.

- Ej: Cuando se diseñó la normativa del carné de conducir por puntos, al conductor se le
retiraban determinados puntos cuando cometía una infracción, y además esa resta de puntos
se realizaba inmediatamente para que se produjera una asociación clara entre infracción y
estímulo aversivo. Cuando antes del 2006 se enviaba la multa a casa después de un par de
meses de haber cometido la infracción, el conductor se enfadaba por tener que pagar ese
dinero, dado que la asociación anteriormente mencionada no se estabecía claramente para
futuros comportaientos por la demora excesiva entre la conducta y sus consecuencias. Cada
vez que se detecta un comportamiento disruptivo afecta a las conductas posteriores al restar
puntos, lo que actuaría como marcaje del estímulo aversivo y atenuaría los efectos de la
demora.

La conducta motivada ante estímulos aversivos

Se pueden establecer dos situaciones en las que se emplea un estímulo desagradable pero con
consecuencias diferentes sobre la ejecución:

1. Escape/evitación: La aparición de la conducta tiene como efecto que desaparezca el estímulo


desagradable o que no llegue a presentarse y, el valor de incentivo llevará a ejecutar la
conducta para no sufrir los efectos del estímulo desagradable.

- Escape (reforzamiento negativo): La consecuencia de la ejecución de la conducta es la


retirada del estímulo aversivo. A medida que el sujeto adquiere la conducta, ejecutará más
rápidamente la respuesta para evitar o escapar del estímulo desagradable. Las
expectativas que crea el sujeto ante la situación es lo que le permite no sufrir las
consecuencias del estímulo desagradable.

La principal diferencia entre escape y evitación es:

a) En una situación de escape, aparece el estímulo aversivo y el sujeto se encuentra motivado a


es- capar de él para no sufrir sus consecuencias.

b) En una situación de evitación se hace uso de los denominados estímulos discriminativos que
avisan de la próxima aparición del estímulo aversivo, lo que posibilita el no sufrirlo. En los
primeros ensayos en una situación experimental de evitación, el sujeto padecerá el estímulo
aversivo y al emitir la respuesta escapará de él, pero con la presencia de un estímulo
discriminativo que le avise de la situación, a medida que avancen los ensayos, aprenderá que
ese estímulo discriminativo, le avisa de la aparición del estímulo aversivo y así no tendría que
sufrir las consecuencias del estímulo aversivo.

■ El condicionamiento de escape/evitación (enormemente adaptativo): El objetivo de este tipo


de situaciones es el incremento de la respuesta motivada con el empleo de un estímulo
aversivo. Comparte con la recompensa el motivar a la realización de la respuesta, pero difiere
de ella en que se emplea un reforzador aversivo. La reducción de un estímulo aversivo
produce la conducta de huida o escape, mientras que su prevención da lugar a la conducta de
evitación.

■ La base del condicionamiento operante era que se debía emitir una respuesta para ser
reforzada y así incrementar su frecuencia, mientras que el objetivo del escape/evitación es que
no aparezca el reforzador, contradiciendo de alguna manera el principio general del
condicionamiento operante.

■ Se han intentado dar diferentes explicaciones a este hecho: la Tª de los dos factores de
Mowrer , para indicar que la conducta de escape se adquiere por una fase de condicionamiento
clásico y otra de condicionamiento operante. Inicialmente el sujeto recibe el reforzador versivo y
el estímulo discriminativo, se condiciona clásicamente a la respuesta de miedo. Por otra parte,
se ha comprobado que no se puede condicionar cualquier respuesta de escape, sino que el
organismo muestra conductas defensivas propias de la especie, que le lleva a emitirlas en
situaciones de peligro.

■ Investigaciones posteriores: interpretación cognitiva, incidiendo en las expectativas que se


crea el sujeto ante la situación. Esta postura defiende que la evitación se produce por las
expectativas de actuar que elabora el sujeto ante la situación. Posiblemente sea la intervención
de los tres elementos lo que dé una explicación más completa de los mecanismos subyacentes
de la evitación: la intervención del dualismo condicionamiento, las reacciones defensivas
propias de la especie y las expectativas de actuar.

2. Castigo: la respuesta provoca que aparezca un estímulo aversivo, por lo que la adquisición de
expectativas al respecto debería llevar a no ejecutar la conducta.

El castigo

- La ejecución de la respuesta provoca la aparición de un estímulo aversivo, por lo que es


básicamente un procedimiento para reducir la aparición de una conducta. En el castigo no hay
refuerzo porque el sujeto crea expectativas de la situación que le llevan a no responder, ya que
su respuesta implicaría recibir el estímulo aversivo.

- Finalidad del castigo: No emisión de la conducta. Castigo se opone a refuerzo. Por otra parte,
debemos distinguir el castigo de la situación de evitación/escape ya que el objetivo del
8

castigo es, motivar para dejar de emitir una conducta y en la situación de escape o en la
evitación, sin embargo, el sujeto se encuentra motivado a dar aquella respuesta con la que
evita o en la que escapa del estímulo aversivo.

- Fruto de trabajosa investigar la efectividad del castigo, se han establecido una serie de variables
que, afectan a los resultados del castigo:

- Intensidad del estímulo aversivo. Se producirá menor supresión de la conducta si se


utiliza al principio un castigo suave y se va incrementando gradualmente su intensidad
hasta tal punto que, intensidades altas posteriores, no surten los resultados previstos.
Igualmente se sabe que un castigo débil tiene poco efecto sobre la conducta que se
pretende eliminar y, en cualquier caso, dicho efecto es transitorio.

- Duración del estímulo desagradable. Cuanto más prolongado dentro de unos límites sea
el castigo, mayor efecto supresor tendrá.

- Contingencia del castigo. Se debe administrar el castigo ante la conducta inadecuada;


esto es, siempre se debe producir la contingencia. Si no se aplica de forma continua, la
respuesta tardará más en suprimirse. Se ha demostrado que con programas de castigos
intermitentes la conducta persiste durante más ensayos.

- Efecto de la demora. Influye sobremanera en el grado de supresión de la respuesta. Para


que sea eficaz un castigo debe aplicarse de inmediato. Demoras entre la emisión de la
respuesta y la aplicación del estímulo desagradable, producen menor supresión de la
respuesta.

- Disponibilidad de una respuesta alternativa. Si a la vez que castigamos una respuesta,


motivamos a que realice el sujeto otra conducta premiada, la probabilidad de ocurrencia
de la respuesta castigada, disminuirá drásticamente.

Si se manipulan bien las variables expuestas se podrán controlar los efectos del estímulo
desagradable sobre la supresión de la conducta y, así, este procedimiento será e caz. No
obstante, su mal empleo o su utilización constante provocan ansiedad en el que lo padece.
Asimismo, se ha comprobado que cuando se vive en un ambiente dónde se emplea
continuamente el castigo, posteriormente también se recurrirá con más frecuencia a él en las
interacciones con los demás; uno se hace finalmente más agresivo.

Tal y como indica Reeve el castigo provoca 4 tipos de efectos:


- Efecto social que implicaría las reacciones
sociales y quizá jurídicas por la conducta
- Primario: Supresión de la conducta que se castigada y secuelas sociales del castigo a
pretende castigar. otras personas próximas a la persona
castigada
- Efecto físico: Aquellas consecuencias físicas
directas. - Efectos secundarios.

f
El castigo provoca seis efectos secundarios:

1. Conductas emocionales aparejadas a los efectos del castigo (miedo, rabia...).

2. Conductas de escape y huida.

3. Sustitución de la respuesta castigada por otra igualmente no deseada (se castiga a un niño
por gritar y empieza a dar patadas).

4. Facilitación de la respuesta que provoca que la conducta castigada se incremente.

5. Supresión generalizada de las conductas semejantes y así el castigo se generaliza a otras


conductas.

6. Modelamiento negativo, el modelado es una for- ma de aprendizaje consistente en aprender


una conducta al observar su ejecución en otra persona y las consecuencias que conlleva. Se
refiere al modelado de conductas no deseadas en ambientes naturales (en las conductas
delictivas, un ladrón aprende de otro, porque las consecuencias de su conducta son más
beneficiosas, que el castigo).

Indefensión aprendida: Se expone a un sujeto a estímulos aversivos de los que no se puede


escapar. Induce a que no se sepa responder ante otras situaciones. Provoca un retraso en futuros
aprendizajes si se reciben previamente contingencias incontrolables. El sujeto se considera
incapaz de evitar otras situaciones desagradables y, se ve inepto para dar solución a cualquier
situación con la que se tenga que enfrentar.

De todas las teorías explicativas al respecto, la más completa es la de las expectativas acerca de
la falta de control sobre los eventos que, además, transfiere a otras situaciones.

4. LOS NIVELES DE MOTIVACION EN LA EXTINCIÓN


En el proceso denominado de extinción, la motivación por ejecutar la conducta desciende, dado
que ya no está incentivado para realizarla. No se nos puede pasar por alto que en la vida diaria la
extinción puede ser tan adaptativa como la adquisición, ya que es lógico pensar que si una
conducta deja de recibir las consecuencias de su repetición, es más económico dejar de
responder.

1. Cuando desaparece el estímulo apetitivo, el sujeto incrementa tanto el número como la


magnitud de sus respuestas debido a su nivel de motivación y, a su vez, aparece una reacción
emocional intensa de frustración por la falta de consecuencias esperables de su conducta.
Aunque durante la extinción deja de emitirse, no quiere decir que ésta haya desaparecido
completamente.

2. Resistencia a la extinción: Número de veces que se sigue emitiendo la respuesta aunque las
consecuencias de dicha conducta no se presenten, debido al nivel motivacional alcanzado
durante la adquisición de la respuesta. Las variables que afectan a la extinción se miden por
los efectos que producen en dicha resistencia. Son:

1. Contingencia estímulo reforzante - conducta motivada empleada en la fase de


adquisición es determinante de la resistencia a la extinción que manifieste la
conducta. La diferencia en adquisición de la respuesta entre los programas de

10

refuerzo continuo y de refuerzo parcial, es mucho más pronunciada cuando se


compara su efecto sobre la extinción de la respuesta. De esta forma, una conducta
que se ha adquirido consiguiendo siempre el premio ante su ejecu- ción, se
extinguirá más rápidamente porque se cambiarán antes las expectativas sobre la
posible ejecución, que una conducta que se haya adqui- rido recibiendo ante su
ejecución unas veces el premio y otras no.

2. Si el aprendizaje se ha efectuado en distintos ambientes, la extinción es más difícil


dado que se han creado más expectativas en distintas cla-ves contextuales.

3. El efecto de la magnitud de la recompensa depende de la cantidad de veces


que se haya ejecutado la conducta, de tal forma que a igual magnitud un
entrenamiento largo provoca mayor resistencia a la extinción.

4. La demora del premio durante la adquisición provoca mayor resistencia a la


extinción cuando se han empleado demoras diferentes mientras se aprendía la
conducta. En el caso de haber utilizado la misma demora, entonces dicha variable
no afecta a la extinción.

LA ACTIVIDAD COMO MOTIVADORA DE LA CONDUCTA

David Premack elaboró la teoría de la probabilidad condicionada, o princi-pio de Premack.

- Mantiene que puede actuar de reforzador cualquier actividad cuya probabilidad de ocurrencia
sea mayor que la de la conducta exigida.

- Postula que cuando una conducta se hace contingente con otra, la más probable servirá de
reforzador a la menos probable, pero no al contrario, es decir, la respuesta más probable
puede motivar al sujeto para emitir la respuesta menos probable.

- Con la situación experimental se comprueba que actividades con alta probabilidad refuerzan
las actividades de baja probabilidad. Al observar el porcentaje de tiempo que un sujeto dedica
a una actividad, podemos comprobar sus preferencias que, obviamente, son subjetivas.

- Tiene gran repercusión en la psicología, dado que permite que siempre se pueda encontrar un
motivo para el aprendizaje de una conducta nueva. Basta con fijarse en el repertorio de
conductas del sujeto y emplear aquella que realice con más frecuencia, para reforzar la que se
desee que adquiera. Así un niño con autismo con el que es difícil interaccionar por su propia
patología, si se observa que mira continuamente las láminas de un libro, se puede emplear
éste como reforzador cuando presente respuestas de aproximación al adulto.

Timberlake y Allison propusieron la hipótesis de la privación de la respuesta al comprobar que


podían actuar como reforzadores aquellas conductas del sujeto que ocurrían con menor
frecuencia, siempre y cuando la poco frecuente estuviese restringida

Según los autores, observando la actividad de los organismos es posible predecir cuándo la
oportunidad de emitir una actividad se convertirá en reforzadora de otra, e, incluso, postulan que
se puede comprobar que una actividad de poca probabilidad de ocurrencia, se puede convertir
en reforzadora de otra de mayor frecuencia. En posteriores investigaciones, desarrollaron su
hipótesis inicial al comprobar que, en condiciones normales, los sujetos emiten el menor número

11

de respuestas contingentes para sacar el máximo provecho a los reforzado- res o, lo que es lo
mismo, se busca emitir el menor número de respuestas para conseguir el reforzador. De esta
forma, cualquier actividad, se puede convertir en reforzadora de otra.

• Teoría de la distribución conductual, siendo la hipótesis de la privación de la respuesta en un


caso particular de esta nueva teoría. Surgió en el campo de la economía y viene a indicar que lo
que se pretende es que a través de reforzadores adecuados, el sujeto llegue a tener una
adaptación correcta de su tiempo y actividades. En este sentido, parte de que los organismos
hacen una distribución ele sus actividades que les resulta lo más agradable posible, por lo que
pretenden mantenerla frente a los cambios.

- Se plantea que como los organismos hacen una distribución adaptativa de sus
actividades, lo que se intenta, es romper dicha distribución para condicionar la
realización de una tarea previa del sujeto, a la ejecución que se desea implantar. Así
durante el condicionamiento, se redistribuye el tiempo de una forma diferente a como
había hecho el propio sujeto, por lo que, se pretende que llegue a su propia
distribución adaptativa.

Desde aquí podemos afirmar que con la manipulación de los reforzadores se puede intervenir en
la conducta, a través de su nivel de motivación, y no siempre el sujeto es consciente de ello.

6. LA MOTIVACIÓN Y EL APRENDIZAJE OBSERVACIONAL


Los seres humanos aprenden comportamientos no solo al ejecutarlos sino también, por ver
realizarlos a los demás y observar las consecuencias que tienen en el otro. Imitación proviene del
griego mimesis que hacía referencia al aprendizaje a través de la imitación de conductas.

Aunque la imitación no es una actividad exclusivamente del hombre, sí se ha comprobado una


relación directa entre nivel cognitivo y grado de imitación. De tal manera que está demostrado
que a mayor complejidad del SN, no solo aumenta el número de conductas imitativas, sino
también calidad y mecanismos de control.

Si la capacidad de aprendizaje se redujera a la experiencia directa con la situación, la posibilidad


de adquisiciones de nuevas conductas se vería seriamente limitada. En el ser humano es tan
importante la imitación, que de este fenómeno se han aprovechado todas las culturas y, por
ello, se han utilizado modelos para implantar conductas ecológicamente válidas. Si bien esos
modelos que juegan un papel fundamental en la conformación de la conducta y la modificación
de las normas sociales, pueden ser muy diferentes en unos medios y otros.

Establecimiento de modelos socialmente perniciosos y al peligro que encierran: Pensemos la


televisión como medio de comunicación de masas que indudablemente crea corrientes de
opinión, y provoca patrones a seguir, y reflexionemos en aquellos «programas basura»
Retransmitiendo la entrevista se refuerza esa conducta, se muestra un modelo no deseable para la
sociedad, pero que no es tratado como tal.

La imitación tiene gran incidencia en los aspectos sociales, y se la ha denominado aprendizaje


observacional, social o modelado, por la influencia que posee el modelo para el sujeto que
observa, pero también ha recibido nombres como aprendizaje vicario, por no tener los sujetos
experiencia directa sino mediatizada por un modelo, y aprendizaje sin ensayo, al no precisar
ningún tipo de realización motora.

12

Aprendizaje observacional. Es indudable el papel que desempeña la imitación en el desarrollo


de la conducta humana. El entorno familiar es un modelo tan determinante en el desarrollo de la
personalidad, que tendemos a repetir conductas observadas en la infancia aunque en su
momento no se estuviera de acuerdo con ellas. Pero el papel de la imitación no se delimita a este
bosquejo superficial, sino, va más allá, dando cuenta de gran cantidad de adquisiciones en las
que a veces, se mezcla la ejecución de la conducta con la observación de esa misma conducta
en un modelo.

Tentativas explicativas de la imitación


Un primer intento se proporciona desde las teorías instintivistas, que consideraban la capacidad
de imitar como una tendencia innata o instintiva. La influencia que ejercía un modelo sobre un
observador se debía a que éste se encontraba dotado de un instinto imitativo y, así, el hombre
reproducía de forma inconsciente la conducta de los demás por una propensión innata a ello.

- Condicionamiento clásico: La única condición necesaria y suficiente para la aparición y


mantenimiento de la imitación es la contigüidad espacio-temporal entre situación observada y
posibilidad de emitir la respuesta a imitar. La imitación se produciría por el condicionamiento
pavloviano de ver- balizaciones, respuestas motoras o emocionales y estímulos sociales
similares.Todas las teorías asociacionistas explican cómo la conducta aprendida previamente
puede ser provocada por la acción de otros, pero no dan cuenta de la manera en que se
adquieren respuestas nuevas.

- Condicionamiento operante: Para producirse la imitación es preciso que exista un sujeto


motivado al que se refuerce y un observador, lo que significa, que para aprenderse la
conducta debe ser reforzada y, para ello, tiene que ser ejecutada. De esta forma, las conductas
que correspondan a las acciones del modelo se reforzarán pero no aquellas divergentes,
convirtiéndose la conducta de los demás en señal para efectuar la propia respuesta y
seleccionando uno mismo, aquellas respuestas del modelo que son reforzadas. Se establece la
imitación como una contingencia:

Ed- - - - - - R- - - - - - Ref
Ed, conducta a imitar que actúa como estímulo discriminativo
R, respuesta imitada
Ref, reforzador
• Este modelo presenta tres limitaciones: la respuesta debe existir previamente en el
repertorio de conductas de la persona que imita, en cuanto que se exige que exista un
reforzador para que se adquiera la conducta, ya que se aprenden la conducta
observándola sin necesidad de un reforzador; y, en cuanto que considera que se debe
ejecutar la conducta una vez observada, cuando se ha comprobado la imitación
demorada.

• Posteriormente, establece el concepto de imitación generalizada para explicar la


conducta imitativa sin un refuerzo contingente, dado que es el modelo quien recibe el
reforzador, no el observador. Se llega a suponer que si se recompensa consistentemente la
reproducción del modelo, la similitud conductual entre la conducta del modelo y la
propia adquiere propiedades reforzantes secundarias. El problema que plantea ese tipo
de teorías es su insuficiencia para explicar la aparición de conductas imitativas, en aquellas
situaciones en que no se dispensa refuerzo ni al modelo ni al observador.

13


Justi caciones cognitivas del aprendizaje observacional


La explicación cognitiva de la imitación parte de que el modelo expuesto anteriormente de
estímulo-respuesta es escaso, por lo que recurre a representaciones cognitivas por parte del
observador de la conducta del modelo; mientras que el modelo realiza la acción surgen
procesos simbólicos, antes de efectuarse ningún tipo de respuesta y sin necesidad de ningún
reforzador.

1. Refuerzo: Cambio en la conducta de los observadores en función de la observación de las


consecuencias que acompañan a las actuaciones de los demás.

El máximo representante es Bandura quien elaboró la teoría del aprendizaje social, que tiene
como punto principal considerar que el ser humano se encuentra fundamentalmente inmerso en
un medio social, y lo que aprende lo consigue al observar la conducta de los demás y, a través de
esa observación, aprende la utilidad de ciertas conductas por las consecuencias que conllevan.
Fue posteriormente ampliada, pasándose a ser teoría social cognitiva que parte de tres
supuestos:

1. Las interacciones recíprocas. La conducta se explica según el modelo de reciprocidad


triádica en el que la conducta, los factores cognitivos y el entorno son factores
determinantes y se influyen mutuamente.

• El modelo de reciprocidad diádica no implica que las influencias siempre tengan igual
peso, es decir, a veces un elemento determina en mayor manera el aprendizaje que otro; no
obstante, la mayoría de las veces el comportamiento es fruto de la interacción de los tres
elementos.

2. El aprendizaje directo y el aprendizaje vicario. Bandura considera que el aprendizaje implica


un procesamiento de la información en el que los datos del entorno y del individuo se
analizan y procesan, asimismo establece dos tipos de aprendizaje,

• Directo: se aprenden las consecuencias de la propia conducta.

• De forma vicaria: se acelera el aprendizaje; se evita tener que ejecutar todo tipo de
conductas para aprenderlas y, generalmente, las actividades complejas se mejoran en gran
parte por observación.

3. El aprendizaje y el desempeño. No siempre que se aprende una conducta se ejecuta.

La teoría social cognitiva considera el AO como una «representación mental y elaborada de un


sujeto que ha observado a un modelo, que ejecuta alguna conducta o sufre las consecuencias de
alguna acción». De esta forma, desde su postura socio-cognitiva considera que el reforzador sí
influye en el AO, pero a través de una mediación cognitiva ejerciendo una «influencia
antecedente más que consecuente».

La forma de actuación sería la siguiente:

1. Una persona ve el reforzador que recibe el modelo, lo que provoca su focalización


atencional hacia esas conductas y la aparición de expectativas sobre los posibles efectos del
reforzador, lo que le incita a un incremento de la retención de lo aprendido, aumentando la
posibilidad de su codificación.

14
fi

2. La anticipación del reforzador es uno de los factores que pueden in uir en que se
observen determinadas cosas, y/o traspasen desapercibidas. Para Bandura el esquema de
funcionamiento del refuerzo vicario es el expuesto a continuación.

Según la teoría, el refuerzo se estima como un factor que facilita el proceso de aprendizaje, pero
no es una condición imprescindible. Se considera que la explicación que se da desde las teorías
operantes, para las que es imprescindible que se dispense un reforzador, es un caso especial de
AO.

La diferencia se encuentra en la distinción entre aprendizaje y ejecución, dado que para la


ejecución es preciso la aparición del reforzador, pero para la adquisición de respuestas de
imitación es importante la contigüidad estimular e, igualmente, de los procesos simbólicos
asociados a la misma. No todo lo que se observa se ejecuta, aunque sí se puede aprender.
Bandura apela a la existencia de cuatro procesos interrelacionados que influyen marcadamente en
el grado y contenido del aprendizaje:

■ Procesos atencionales.
■ Procesos de retención.
■ Procesos de reproducción motora.
■ Procesos de motivación.

Los dos primeros están implicados en la adquisición de la conducta modelada, mientras que los
dos últimos tendrán más que ver con su ejecución.

A. Procesos atencionales

En estos procesos se considera que la atención que se presta a los acontecimientos relevantes
del medio es necesaria para que sean percibidos de forma significativa, pues la estimulación
contigua por sí sola no produce siempre la adquisición de respuestas. Se considera esencial la
focalización y mantenimiento de un foco atencional para la adquisición de conductas imitativas,
con el fin de que el observador discrimine entre las claves relevantes e irrevelantes de la conducta
del modelo. Las principales variables que determinan esa focalización so n:

■ Repetición.
■ Las propiedades físicas del estímulo.
■ Las características más cognitivas (intensidad, la viveza y novedad), son fundamentales para
centrar la atención. Los estímulos de modelado deben presentarse de forma que no excedan la
capacidad de atención del sujeto, de igual forma, el grado de discriminación de los estímulos
de modelado y su presentación real o imaginaria determinan el nivel de AO.
■ La complejidad del estímulo, porque dificulta la atención sobre la conducta observada.
• Las características del modelo. El grado de competencia, el prestigio social, la edad, el sexo y
el estatus social o étnico, determinan la atención que se preste a un modelo. El valor afectivo de
los modelos puede incrementar el AO al provocar y mantener una conducta atencional más
fuerte.

15

fl

B. Procesos de retención. Consisten en codificar y transformar la información observada para


poder almacenarla en la memoria y repasarla cognitivamente. Para ello, Bandura alude a dos
sistemas de representación:

■ Mediación imaginativa: Transforma los estímulos de modelado en imágenes. Es importante en


tareas que no se describen fácilmente con palabras.

■ Código de mediación verbal (convierte las secuencias de conductas presentadas por el


modelo en códigos verbales). Se emplea principalmente en tareas cognitivas como cuando
repetimos unas instrucciones que nos acaba de dar.

Así cuando las experiencias se han codificado para su representación en la memoria, funcionan
como mediadoras para la recuperación, actualización y reproducción de las pautas de conductas
imitadas. Los códigos imaginativos y verbales tienen la función de representar de forma
simbólica en la memoria las respuestas imitativas, actuando de guías y dando cuenta, también,
de la retención a largo plazo de los estímulos de modelado aun cuando el modelo no esté
presente.

Durante la exposición a los estímulos, el observador de forma activa se dedica a codificar,


clasificar y reorganizar los elementos en esquemas más familiares. Una de las variables
determinante del proceso de retención lo constituyen todas aquellas operaciones de repetición
que estabilizan y fortalecen las respuestas adquiridas. Otra variable influyente es el repaso
encubierto, que incrementa la retención de respuestas ya adquirida sobre todo en tareas que
cuentan con funciones simbólicas .

Procesos de reproducción motora. Consisten en poner en juego lo atendido y almacenado


cognitivamente, por lo que resultan imprescindibles para la puesta en práctica de la respuesta
adquirida, e implican la utilización de las representaciones simbólica de los patrones
modelados para dirigir la ejecución de las respuestas.

La tasa y el nivel de AO se encuentran en parte determinados, a ese nivel motor, por la


disponibilidad de respuestas componentes necesarias. Por eso en muchos casos, los patrones
de la conducta observada se retienen en forma de representación, pero no se pueden reproducir
conductualmente por limitaciones físicas. También es necesario, e igualmente importante, que el
observador se sienta capaz de poder hacerlo y no se ponga sus propias limitaciones. En
definitiva, hay conductas que se adquieren por su observación pero cuando nos fijamos en
actividades complejas, hace falta la combinación del aprendizaje observacional, la práctica
inducida y la retroalimentación correctiva.

C. Procesos motivacionales. Son los encargados de determinar la transformación del


aprendizaje en ejecución. Una persona puede adquirir y retener una conducta observada e,
incluso, puede poseer las habilidades necesarias para su repetición, pero no lo hará si no se le
propician las condiciones motivacionales favorables, por el contrario, si piensa que el beneficio va
a ser desagradable, aunque aprenda la conducta, no se sentirá motivado para ejecutarla. Pero es
más, las variables motivacionales no solo controlan las ejecuciones, sino también el aprendizaje
al ejercer un control selectivo sobre los estímulos.

Se puede comprender que desempeña un importante papel tanto en la adquisición, como en la


actualización de la conducta de imitación. Durante la adquisición, sus efectos se canalizan a

16

través de la anticipación de las posibles consecuencias de una acción determinada. Para la


repetición de las conductas imitativas, el incentivo será condición necesaria y suficiente, ya que
las consecuencias anticipadas se establecen a través del reforzador experimentado. El incentivo
puede actuar por medio de varias funciones para producir cambios psicológicos en los
observadores:

• Informativa: durante el aprendizaje de una conducta observada, el sujeto va notando los


efectos que las respuestas producen, observando los resultados de las acciones y desarrollando
hipótesis sobre cuáles son las respuestas más apropiadas.

• Motivacional: al representarse simbólicamente las consecuencias previsibles, éstas se


convierten en motivaciones reales de la conducta, y, la mayor parte de las acciones se
encuentran bajo el control del carácter anticipatorio. Es lo que se conoce como autoincentivo,
puesto que se relaciona con las expectativas que desarrolla el sujeto sobre las posibilidades de
reforzamiento asociadas a la realización de la conducta previamente observada. El
autoincentivo depende, de factores personales del propio sujeto.

• Acrecentamiento del estímulo: la observación de las consecuencias de la conducta del modelo


aporta una discriminación de las conductas apropiadas o inadecuadas en ambientes diferentes.

Una misma conducta puede tener consecuencias diferentes en función de las situaciones donde
se manifieste, de las personas a las que se dirija y el momento en que se realice. Cuando se
observa cómo se recompensa a alguien por cierta conducta, en un contexto determinado, pero
se le ignora o castiga por ese mismo tipo de conducta en una situación diferente, se obtiene
información discriminativa acerca de los aspectos del medio que van a determinar con-
secuencias de recompensa o castigo.

La capacidad que posee el ser humano de aprender observando las consecuencias de la


conducta de los demás, nos facilita desarrollar patrones de comportamientos sin necesidad de
realizarlos directamente (economía de adquisición de conductas). A través del AO, aprendemos a
motivarnos para realizar ciertas conductas y aprendemos, las respuestas emocionales y afectivas
ante determinadas situaciones. Esa conducta vicaria se almacena de forma simbólica lo que
permite pronosticar las consecuencias de dicha conducta.

17

También podría gustarte