Está en la página 1de 31

TEMA 4: CONDICIONAMIENTO EN SUJETOS HUMANOS

Las personas somos capaces de prever lo que va a ocurrir, para lo que es preciso una
conceptualización y categorización de la realidad: ¿Cómo aprendemos a predecir lo que va a
ocurrir, como es el caso de las consecuencias de nuestra conducta?

1) APRENDIZAJE PREDICTIVO:

El aprendizaje predictivo es una herramienta fundamental para la adaptación del


organismo al medio. Como psicólogos para entender la conducta humana tenemos que
plantearnos ¿qué resultado pretende conseguir el sujeto al realizar una determinada
conducta?

De este modo, podemos plantear cuatro preguntas para entender la conducta:

 ¿Qué quiere?: cuáles son sus metas, sistemas motivacionales…


 ¿Qué pasa?: cómo percibe la situación actual, que cree que pasa, si se acerca o no a
sus metas…
 ¿Qué va a pasar?: aprendizaje predictivo. Una de las principales motivaciones de la
conducta está basada en el aprendizaje predictivo, la conducta depende de lo que el
sujeto cree que va a pasar, cuál será la consecuencia de su conducta. Es importante
conocer lo que el sujeto cree que ocurrirá.
 ¿Qué puede hacer?: acción, aprendizaje instrumental. ¿Cómo va a actuar si la
situación no es acorde a lo que esperaba? ¿qué puede hacer para conseguir sus
metas?

Estas dos últimas cuestiones se aprenden por condicionamiento: el resultado es una


asociación predictiva estímulo – estímulo. Un EC se asocia con un EI, de modo que luego
podremos saber lo que ocurrirá cuando aparezca el EC (aparecerá el EI). No sólo
condicionará la respuesta.

A) El Condicionamiento:

Condicionamiento (Rescorla, 1988): consiste en el aprendizaje de relaciones entre


eventos, no sólo es un proceso de asociación E - R. Es decir, en las situaciones de
condicionamiento no se aprende simplemente una respuesta condicionada, sino una relación
predictiva entre dos estímulos. (Es – resultado).

Esto también se aplica en C. Instrumental, donde suele haber un contexto (E


discriminativo) donde hay varias respuestas posibles y una de ellas irá seguida de
reforzamiento positivo (Ley del Efecto). No se aprende una relación E – R por el reforzador
sino que se aprende una relación más compleja: cómo en ese contexto tal respuesta producirá
un reforzador (R – resultado). Esto hace referencia a la pregunta ¿qué puede hacer el sujeto?

El Condicionamiento hace referencia a un aprendizaje más complejo que lo que las


teorías asociacionistas del conductismo planteaban. No se evalúa preguntándole al sujeto
sino que se evalúa a partir de la conducta del sujeto (RC o frecuencia con que una respuesta
se produce en una situación).
B) Aprendizaje de relaciones de contingencia y causalidad:

El Condicionamiento no es la única situación donde se ha estudiado el aprendizaje


predictivo. También cuando aparece una covariación entre estímulos podemos aprender
contingencias: distinguir entre cosas que coinciden y cosas que actúan como causa – efecto,
separando casualidades de causalidades para poder predecir.

A partir de los años 80 aparece la literatura de situaciones de aprendizaje de


contingencia y causalidad, donde las tareas no implicaban estímulos de gran valor
motivacional como ocurría en el condicionamiento (comida, descargas…). Ej: pacientes
ficticios, se trata de ver cómo somos capaces de ver qué síntomas se relacionan con tal
enfermedad. Además, también podemos pedir juicios verbales a los sujetos, pidiéndoles que
juzguen la relación de contingencia.

2) CONDICIONAMIENTO CLÁSICO EN HUMANOS

A) Preparaciones Experimentales:

En animales este tipo de experimentación se realiza con un conjunto reducido de


preparaciones (como la caja de Skinner). En humanos tampoco se ha estudiado todo el
conjunto de aprendizajes que impliquen condicionamiento, sino que se centraron en unos
pocos, sobre todo los siguientes:

 Sistema Nervioso Autónomo: se trata de preparaciones de


condicionamiento diferencial, en las que se usan dos ECs: EC+ (asociado a un
estímulo aversivo) y EC- (no asociado a un estímulo aversivo). Por ejemplo, el EC+
podría ser un estímulo visual que se asocie con una descarga eléctrica (molesta pero
no dolorosa) que sería en EI, y el EC- un sonido que no va seguido de descarga.
Tras varios ensayos, observamos si el EC+ produce un efecto, una respuesta
condicionada sobre el SN Autónomo, como es la respuesta de conductividad de la
piel. Se asume que esa respuesta es una parte de las respuestas que ocurren cuando
uno espera un estímulo aversivo (cambios fisiológicos). Si el sujeto aprende la
relación EC+ -> EI experimentará la respuesta emocional.

 Condicionamiento Palpebral: En el que el EI es un soplo


dirigido a la córnea del sujeto y la RI (respuesta incondicionada) es el parpadeo. Se
trata de ver si el sujeto aprende a parpadear en repuesta a un EC que predice el EI (en
este caso se trataría de una respuesta condicionada de parpadeo). Ej: cuando un
sonido predice el soplo, ¿se consigue parpadeo ante el sonido (RC)?

 Condicionamiento Semántico: algunos autores pensaban que el


aprendizaje asociativo simple estaba en la base del significado de las palabras. Se
utilizó el paradigma de condicionamiento con palabras.
Cogemos un grupo de palabras neutras y las relacionamos con eventos
aversivos (o con otras palabras de significado aversivo): ¿se produce un cambio en el
significado de las palabras neutras? Esto se evaluaba pidiendo al sujeto que valorara
estas palabras neutras mediante la técnica del diferencial semántico y se descubrió
que sí ocurría el cambio de significado.

Hoy día es difícil atribuir todo el significado a estos mecanismos, pero sí es


importante tenerlo en cuenta en ciertos casos. Ej: cuando no nos gusta un nombre
porque conocemos a alguien que se llama así y no nos cae bien o al contrario.

B) El papel de la Conciencia:

Se plantea una discusión: ¿es posible demostrar que en los humanos además de un
aprendizaje a nivel verbal hay señales de condicionamiento clásico puro? ¿El aprendizaje
predictivo consciente y el condicionamiento son la misma cosa?

Brewer (1974): No hay evidencia convincente de condicionamiento operante o


clásico en humanos adultos. Este autor evaluaba cómo la conciencia de la contingencia
determinaba la conducta de los seres humanos adultos (descubrimos regularidades y
actuamos en base a ellas). Revisa 5 tipos de situaciones, de modo que concluye que la
conciencia es el predictor principal de la conducta del adulto.

 Emparejamiento informado: aumento RC electrodérmica. Le decimos directamente


al sujeto lo que va a ocurrir (tras la presentación de una luz recibirá una descarga
molesta). Lo que ocurre es que la RC aparece incluso antes de que el sujeto reciba la
primera descarga (EI), por lo que no ha dado tiempo a crear una respuesta
condicionada en sí. Por tanto, la información simbólica es suficiente para que se
produzca esa respuesta.

 Desemparejamiento informado: descenso RC electrodérmica. Disminuye la respuesta


pero no desaparece del todo. En conclusión, dar información modifica las RC, el
control depende de sus procesos cognitivos conscientes.

 Condicionamiento instruído: RC a petición. Si le decimos al sujeto que cuando


aparezca el EC realice directamente la respuesta el sujeto es capaz de hacerlo o dejar
de hacerlo si se le pide también (No condicionamiento instruido: no RC a petición).

 Enmascaramiento de la relación: se le cuenta una historia al sujeto para que no se de


cuenta de la contingencia, y si no se da cuenta no produce RC aunque la contingencia
esté presente, sin embargo, si la descubre producirá la RC.
Este procedimiento es el que presenta mayor evidencia de la importancia de la
conciencia. Por medio de instrucciones enmascaradotas los sujetos no se dan cuenta
de la relación, se centran en otro aspecto de la tarea. Si ese enmascaramiento tiene
éxito no se va a dar la RC, ya que no habrá conciencia de la relación. Si tenemos dos
grupos (uno con enmascaramiento y otro no) ambos habrán visto el mismo número
de ensayos, sin embargo, unos presentarán RC y otros no.
CONDICIÓN NECESARIA DE ENTRADA (Necessary-gate hypothesis)

Dawson y Schell (1987): en la tarea lo que se hace es asociar un tono con una
descarga, mientras que otros tonos distintos no se asocian con las descargas. Las
manipulaciones enmascaradotas dirigen a los sujetos a otras tareas, como la de evaluar sus
capacidades de discriminación de distintos tonos en base a un tono de referencia ¿cuáles son
idénticos al de referencia? Además, les dicen a los sujetos que las descargas son para ver
cómo afecta la ansiedad a las capacidades perceptivas (conocer el efecto se choques
eléctricos sobre su sensibilidad perceptiva).

A partir de las medidas de consciencia (mediante lenguaje) se crean dos grupos: los
que no se dan cuenta de la relación entre un tono y la descarga, y los que a pesar del
enmascaramiento se hacen conscientes de la relación. Sólo el grupo que se hace consciente
de la contingencia produce RC (respuesta electrodérmica), los otros no.

A partir de esto Dawson propone que la conciencia de la contingencia es una


condición de entrada necesaria para que se produzca condicionamiento en humanos en tareas
como ésta (condicionamiento clásico diferencial de la respuesta electrodérmica).

Pero esto no quiere decir que todo lo que aprendemos sea sólo consecuencia de la
toma de conciencia. Hay sujetos que se hacen conscientes de la contingencia y sin embargo
no producen RC, por lo que ser consciente es una condición necesaria pero no suficiente
para que se produzca condicionamiento. El grado en el que los sujetos se hacen conscientes
no covaría con la intensidad de la RC (hay sujetos muy conscientes de la relación de
contingencia que producen una RC menos intensa que la de otros sujetos menos
conscientes).

Existen variables que afectan al condicionamiento sin afectar a la conciencia y


viceversa, por lo que conciencia y condicionamiento no son análogos. Ej: dos grupos en
condicionamiento pueden alcanzar la misma certeza de la relación y no dar el mismo grado
de RC.

- Condicionamiento de demora: el EC aparece antes del EI pero sigue presente


cuando éste último aparece, se produce un solapamiento físico entre EC y EI.

- Condicionamiento de huella: aparece el EC, desaparece el EC, aparece el EI.

En ambos casos el EC es informativo, sin embargo, en el condicionamiento de


demora la contigüidad es mayor, por lo que el condicionamiento es más fuerte que en el de
huella, aunque la certeza de la relación sea la misma.

Si luego procedemos a la extinción, aunque la creencia en el sujeto se extinga, la RC


sigue apareciendo (aunque disminuye), es decir, que el EC sigue provocando efecto de
miedo (Ej: EI descarga).
*CASOS LÍMITE: Situaciones de distinción entre conciencia y condicionamiento.

 Expresión sin conciencia: Corteen y Word, 1972 (Vila y Tudela, 1982). Para
continuar expresando una conducta (RC) no tiene por qué estar presente la
conciencia. Puede aprenderse explícitamente y luego llevar a cabo esa conducta
inconscientemente.

- Adquisición del condicionamiento: consciente.


- Expresión/presentación del condicionamiento: inconsciente.

Se trata de un condicionamiento semántico diferencial, en el que unas


palabras concretas se asocian a descargas contingentes (EC+) y otras no (EC-). Una vez
que el sujeto descubre la relación éste crea una regla consciente, y mostrará una
respuesta de anticipación a la descarga (RC).

Cuando termina el experimento se comienza uno nuevo, una tarea de escucha


dicótica. En esta tarea, los sujetos no son conscientes de los estímulos que se les presenta
a través del oído no atendido, en el que se le presentarán palabras relacionadas o de la
misma categoría que las que habían sido asociadas a la descarga en el primer
experimento, junto con otras palabras de comparación. Lo que se hace es medir la
actividad eletrodérmica, mientras que por el oído atendido se les encarga una tarea de
seguimiento de un texto.

Se descubrió que estos sujetos presentaban condicionamiento aunque no eran


conscientes de ello, ni de qué palabras se les presentaba (presentaban RC de miedo antes
las palabras relacionadas con la descarga en el primer experimento).

 Adquisición de condicionamiento sin conciencia con estímulos relevantes: Ohman &


Soares (1993). Si presentamos estímulos visuales de forma que no lleguen a la
consciencia como en el caso anterior (muy rápidos, enmascarados…) ¿se produce
condicionamiento si se asocian esas imágenes con un EI (descarga)?

Con estímulos enmascarados no se suele producir condicionamiento, pero


existe una excepción: cuando se usan estímulos relevantes, potencialmente fóbicos
(arañas, serpientes…). Esto debe ser consecuencia de un pasado filogenético común
(supervivencia).

Cuando se utilizan este tipo de estímulos fóbicos y se presentan de forma muy


rápida (milisegundos), el sujeto no sabe lo que se le ha presentado, pero sí se produce
condicionamiento diferencial, de forma que los sujetos producen respuesta de miedo en
presencia del EC+ y no del EC- (Ej: si la imagen de la serpiente predice descarga y la de
la araña no descarga).

Además, aunque perceptivamente al principio ninguno de los sujetos es capaz


de diferenciar entre los dos estímulos visuales, después del condicionamiento hay
algunos sujetos que consiguen hacerlo. Estos autores plantean que los sujetos que son
capaces, lo son porque se basan en sus propias respuestas vegetativas, son más
conscientes de sus respuestas fisiológicas, es decir, que diferencian los estímulos según
la respuesta que de su cuerpo (araña/ serpiente, EC+/EC-).
 Condicionamiento de parpadeo: Clark, Mann & Squire (2002). En el
condicionamiento de parpadeo resulta muy difícil que los sujetos no descubran la
relación entre un EC y el soplo de aire al ojo. En las tareas motoras es muy difícil
disociar conciencia y contingencia.

Por tanto, estos autores intentaron hacerlo en poblaciones especiales, como


los ancianos, y descubrieron que se produce condicionamiento pero no son muy
conscientes de la relación. Por tanto, en los ancianos aumenta la diferencia entre
condicionamiento de huella y de demora.

- Si el condicionamiento es de demora es posible que se produzca condicionamiento sin


conciencia (ya que coinciden EC y EI).

- En el condicionamiento de huella depende más de que el sujeto se de cuenta o no del


valor predictivo del EC, sino no se da condicionamiento.

En estas tareas es más difícil porque el sujeto es más conciente cuando está
dando su respuesta, ya que las respuestas motoras son más visibles.

 Perruchet (1985): Disociación expectativas del sujeto – condicionamiento. Existe una


situación que nos permite disociar entre expectativas del sujeto y RC de forma muy
clara: cuando la relación entre EC – EI es aleatoria, de forma que el EC no predice
nada sobre el EI.

EC – EI: EL 50% de los ensayos.


EC (solo): El 50% de los ensayos.

A pesar de esto, el sujeto crea expectativas relacionadas con falacias. La falacia del
jugador consiste en que si tiramos una moneda al aire y sale 3 veces seguida cara, el
sujeto pensará que a la próxima seguramente salga cruz, y no es así, ya que en cada
ensayo: cara 50% posibilidades, cruz 50% posibilidades, independientemente de lo que
haya salido en los anteriores ensayos.

De esta forma, si le decimos al sujeto que una relación es aleatoria, y le presentamos


3 ensayos en los que el EC va seguido del EI, al preguntarle que cree que ocurrirá al 4º
ensayo el sujeto nos dirá que probablemente aparecerá el EC sólo (y viceversa). Cuantos
más ensayos seguidos sean iguales más seguro estará el sujeto de que ocurrirá lo
contrario en el siguiente. Sin embargo, el condicionamiento va por otro lado:

- Si durante 4 ensayos se presenta EC – EI (condicionamiento): al 5º el sujeto producirá


la RC, aunque él estaba casi seguro de que vendría un ensayo de EC sólo, sin soplo, por
lo que no debería parpadear.

- Si durante 4 ensayos se presenta el EC sólo (extinción): al 5º habrá disminuido la


probabilidad de que el sujeto de la RC de parpadeo, sin embargo, él estaba casi seguro de
que vendría un ensayo de EC – EI, por lo que habría soplo y tendría que parpadear.

(Ej: EC: tono, EI: soplo, RC: parpadeo). Esto se obtiene con condicionamiento de
demora pero no con condicionamiento de huella.
RESUMEN DE RESULTADOS SOBRE CONDICIONAMIENTO CLÁSICO Y
CONCIENCIA:

- Adquisición sin conciencia:

 En condicionamiento de la respuesta electrodérmica, la conciencia suele ser


condición necesaria pero no análoga al condicionamiento.

 Es posible adquisición sin concienciaron estímulos relevantes de miedo.

 En condicionamiento de respuestas motoras, se puede disociar entre expectativa y


condicionamiento.

- Ejecución sin conciencia:

 Una vez condicionado, el EC puede producir RCs aún cuando los sujetos no son
conscientes de su presentación.

- Conciencia sin condicionamiento:

 Efecto de las instrucciones de contingencia: las instrucciones afectan a la RC,


pero no la determinan. Ej: en condicionamiento palpebral, los sujetos que
conocen el patrón de reforzamiento (RRN) no responden diferencialmente
(Martin & Levey, 1987). Se les dice a los sujetos que la contingencia se produce
en 2/3 de los ensayos, pero aunque son conscientes de esto, siguen dando RC al
tercer ensayo.

 Efecto de las instrucciones de fin de contingencia: las instrucciones afectan a la


RC pero no la eliminan inmediatamente. Aunque le digas que no se va a
presentar ningún EI más, incluso cuando le retiras los electrodos (sabe que no se
va a dar descarga pero el sujeto mantiene la RC, no es porque no se lo crea).

Es posible que los sujetos sepan una regla conscientemente y que sus RCs sin
embargo, sigan otro patrón.
¿Qué implica esto en relación con las técnicas terapéuticas del comportamiento? Cuando nos
planteamos objetivos clínicos como la intervención en problemas de ansiedad o fobias
¿podemos utilizar técnicas basadas en esto, manipulando las creencias del sujeto
(conciencia) además de otros factores del sujeto (condicionamiento)?

IMPLICACIONES TEÓRICAS:

RAZRAN (1971): Niveles de aprendizaje. El condicionamiento constituye un nivel


de aprendizaje automático, filogenéticamente más antiguo, pero cuyas condiciones
coinciden casi siempre con las que dan lugar a procesos de aprendizaje consciente.
Razran plantea la existencia de niveles de aprendizaje jerarquizados a lo largo del
desarrollo de las distintas especies.

En las especies más evolucionadas estarían presentes los niveles más básicos
junto con otros más complejos. En los seres humanos, las creencias, expectativas,
representaciones de la realidad (niveles más complejos) conviven con los niveles más
básicos de aprendizaje, de modo que todos actúan simultáneamente, y son de tipo
adaptativo, por lo que covarían en las mismas condiciones.

Cuando aprendemos la relación entre dos estímulos (EC- EI) se da un proceso


de condicionamiento a la vez que el aprendizaje de una regla consciente. En general,
estos dos procesos se dan juntos, aunque en ocasiones es posible separarlos/distinguirlos.

OHMAN (1979): Teoría de doble proceso (basado en Shiffrin & Schneider, 1977).

- Los mecanismos preatencionales activan automáticamente contenidos de memoria,


pero normalmente no producen efectos de aprendizaje.

- Un EI relevante suscita una llamada de atención al canal de procesamiento central


(supervisado- consciente). La información causante de esa llamada se procesa junto con
la información activada en ese momento en la MCP, y da lugar a asociaciones a largo
plazo (generalmente conscientes).

- En ocasiones, estímulos especialmente preparados, esa llamada de atención puede


ejercer sus efectos aún cuando el canal central no tenga tiempo de finalizar su tarea.

Ohman sigue un Modelo General de condicionamiento basado en una teoría que


distingue entre procesos automáticos (sin atención, procesamiento en paralelo) y
procesos conscientes (con atención, procesamiento en serie).

Según este modelo de procesamiento de la información, ante cualquier estímulo, el


sistema cognitivo comienza analizando todos los factores del Es de forma preatencional,
y esto activa en la MCP un subconjunto formado por las representaciones de lo que está
fuera. Sin embargo, los mecanismos preatencionales actúan de forma no consciente,
hasta que llega a la MCP.
Por ejemplo, si entrenamos a un sujeto en la discriminación de dos tonos, y luego
emparejamos uno de ellos con una descarga (EC+) y el otro con la no descarga (EC-), el
EC+ provocará una llamada de atención al canal de procesamiento controlado, y esa
llamada será la protagonista del aprendizaje.

Después, se activa la información de la MCP de forma más aguda, dejando


residuos a largo plazo (aprendizaje), y ese estímulo se asociará al contexto en el que se
ha presentado (ej. Con una descarga), y así el sujeto se da cuenta de la relación. Por esta
razón los estímulos salientes dan lugar a aprendizaje más eficazmente.

La RC forma parte del complejo que Ohman denomina “consecuencia de esa


llamada de atención”, es como la R.O. (respuesta de orientación). Estos efectos son los
que acaban apareciendo por sí solos ante la presentación del EC. Una vez adquirido el
condicionamiento, esa respuesta puede darse aunque la presentación del EC no haya sido
consciente (luego se convierte en aprendizaje consciente a largo plazo).

¿Por qué los estímulos potencialmente fóbicos producen el efecto condicionado?


¿podrían producir por sí mismos esa llamada de atención de forma previa al
condicionamiento o se activa la representación de esos Es más fuertemente en la MCP?
3) APRENDIZAJE EVALUATIVO: ME GUSTA, PERO NO SÉ POR QUÉ.

Algunos autores opinan que el aprendizaje de una asociación entre un E neutro y un EI


motivacionalmente potente se puede encontrar en la vida diaria, de modo que el estímulos
neutro de contagia de la desagradabilidad/ agradabilidad del otro.

Estos autores aplican este aprendizaje al desarrollo general de preferencias: muchos de


nuestros gustos son adquiridos, se desarrollan con la práctica, de modo que sabemos que
algo nos gusta o no pero no sabemos por qué. Así actúan los publicistas.

En base a los experimentos realizados, parece que es cierto que al asociar un E neutro
con otro EI desagradable se produce un contagio. Se trabajó con fotos, sabores, olores… El
procedimiento es el siguiente:

 Selección y valoración de estímulos (paisajes, caras, sabores…). Se le pide al sujeto


que evalúe un gran número de estímulos, clasificándolos en agradables, neutros o
desagradables.

 Emparejamiento de Es neutros con otros neutros, positivos o negativos. El


experimentador empareja un grupo de Es neutros con Es desagradables, otro grupo
con Es agradables y otro con Es neutros (según la clasificación anterior del sujeto, ya
que se utilizaron EIs más o menos neutros en principio). El refuerzo es directo.

 Reevaluación de todos los Es: algunos de los que antes habían sido evaluados como
neutros ahora los son como agradables o desagradables, según con el EI que se
hubieran asociado (positivo o negativo). ¿Esto ocurre porque el sujeto se acuerda de
con qué iba emparejado cada Es o porque realmente ha cambiado su juicio?

 Evaluación de la conciencia: tarea de reconocimiento de parejas. El sujeto debe


reconocer las parejas que le habían sido presentadas entre otras distintas. El
rendimiento en esta tarea fue bajo, por lo que el cambio de juicio no se debe al
recuerdo.

LEVEY & MARTIN (1978; 1987): Estos autores plantean que el aprendizaje se produce
de forma que los Es neutros que se juntaron con Es desagradables o negativos se hacen
más desagradables/ negativos, y los Es neutros que se juntaron con Es agradables o
positivos se hacen más agradables/ positivos. Es decir, la evaluación se contagia.

- No se produce aprendizaje sin conciencia. Se trata de un aprendizaje automático,


sin conciencia, no de tipo predictivo.

- No es aprendizaje predictivo sino “transferencia de valor hedónico”. En


Condicionamiento Clásico el orden EC-EI es muy importante ya que establece una
relación de predicción de uno con respecto al otro, sin embargo, aquí el orden de las
parejas no influye.

- La asociación se produce en cualquier dirección y es difícil de extinguir. Aunque


presentemos el Es “neutro” sólo en varios ensayos consecutivos, seguirá siendo evaluado
como desagradable de forma relativamente permanente, y lo mismo si lo presentamos
con uno positivo/ negativo (lo contrario a antes). Se trata de un aprendizaje de la vida
real.

Sin embargo, se presentaron diversos problemas metodológicos en cuanto a este


procedimiento.

SHANKS & DICKINSON (1990); FIELD & DAVEY (1999): Problemas


metodológicos:

 Puede no ser aprendizaje asociativo (se emparejan estímulos en función de su


parecido). Estos autores se plantean que podría producirse un aprendizaje que no
depende del emparejamiento del Es neutro con el Es positivo/negativo, sino que se
produce aprendizaje por la repetida presentación del Es (procesos de habituación y
sensibilización).

En el experimento original, el investigador selecciona los Es que se


emparejan con otros en base a su semejanza (entre el Es neutro y el Es
positivo/negativo), por tanto, no es un emparejamiento aleatorio. Levey & Martin
justifican esto aludiendo ser algo similar a lo que ocurre en el condicionamiento de
segundo orden (el EC resultante de un primer experimento se convierte en EI para un
nuevo experimento), donde es importante que los Es que se asocien sean similares entre
sí.
Shanks y Dickinson dicen que esto puede dar lugar a artefactos que pueden
parecer aprendizaje asociativo pero que no lo son. Puede que el mero hecho de la
presentación repetida de un Es neutro similar a uno desagradable acabe produciendo
sensibilización y se haga más desagradable, y lo mismo en el caso de los Es que se
parecen a los agradables. Por lo tanto, el experimento original tiene un importante
problema metodológico, ya que los emparejamientos deberían ser aleatorios (para que se
produzca aprendizaje asociativo).

 Puede no ser aprendizaje no consciente. Otro problema importante es el relacionado


con la evaluación de la conciencia de los sujetos: la tarea de reconocimiento de las
parejas iniciales. El sujeto puede ser consciente, basta con que reconozca cuales son
los Es neutros que se asociaron con los positivos y cuales son los que se asociaron
con los negativos. Más tarde, se produjeron otros estudios para intentar superar estos
problemas metodológicos.

FIELD & MOORE (2005):

- Se obtiene con emparejamientos aleatorios y en comparación con grupo no-


emparejado. Realmente esta forma de aprendizaje se puede obtener cuando los sujetos no
son conscientes de los emparejamientos. Las preferencias de los sujetos pueden
modificarse de forma automática.

- El aprendizaje depende de la atención, pero puede darse con Es enmascarados. Estos


autores incluso presentaron los Es negativos enmascarados, y a pesar de todo se producía
ese aprendizaje, y lo mismo con los positivos, aunque el sujeto no sepa con cuál de ellos
se ha emparejado (no consciente, E subliminales). Pero este aprendizaje con Es
subliminales desaparece cuando el sujeto realiza otra tarea simultánea, por lo que se
necesita atención, aunque no conciencia de los Es positivos o negativos. Es decir, tiene
que estar procesándose la información.

Condicionamiento evaluativo en publicidad: utilizan este tipo de aprendizaje, como en


los anuncios de coches: se venden por las sensaciones que su publicidad produce (BMW)
o intentan contrarrestar esto (Dacia).

4) CONDICIONAMIENTO INSTRUMENTAL EN HUMANOS:

¿También en Condicionamiento Instrumental se puede disociar el aprendizaje automático del


aprendizaje de una regla consciente?

Conducta moldeada (Ley del efecto, Thorndike) vs. Conducta gobernada por reglas (Efecto
de la ley).

 Ley del Efecto: en un contexto determinado existen varias R disponibles, y de ellas,


aquellas que se asocien más con efectos positivos se conectan más fuertemente con la
situación y tendrán mayor probabilidad de volver a producirse en el futuro.

“…de entre las Rs hechas en una situación, las que fueron seguidas por la
satisfacción del animal se conectan más fuertemente con la situación, de forma que ante
esa misma situación volverán a ejecutarse…”

 Aprendizaje de reglas: el descubrimiento de una regularidad es lo que luego lleva al


sujeto a repetir esa acción que en principio tuvo éxito. En este caso, el refuerzo no es
directo, sino mediado por el descubrimiento de esa regularidad.

“…si el animal descubre una regla acerca de la relación entre la respuesta R y


la consecuencia positiva C+ en el contexto Ed, seguramente la aplicará…”
¿Es posible que se dé el refuerzo de una R sin que el sujeto llegue a darse cuenta de la
regla?

PREPARACIONES:

a) Efecto Greenspoon: Condicionamiento operante verbal. Greenspoon, discípulo de


Skinner se interesó por los cambios de conducta que se producían en situaciones de
terapia. Él planteaba que lo que ocurre no es que el sujeto cambie de forma de
pensar, sino que cambia lo que dice en base al refuerzo que obtiene del terapeuta
(psicoanalista).

El experimento se lleva a cabo en un contexto de verbalización, como puede


ser una tarea de capacidad de vocabulario. El experimentador da un tiempo determinado
al sujeto para que diga todas las palabras que se le ocurrieran, y cuándo éste pronunciaba
una palabra de cierta categoría (como nombres de animales, palabras en plural…) el
experimentador les reforzaba (afirmando con la cabeza, aham…). El resultado era que el
sujeto aumentaba la emisión de ese tipo de palabras sin haberse dado cuenta del criterio
de refuerzo que llevaba a cabo el experimentador.

Algunos autores realizaron la “Crítica de las contingencias relacionadas” a


esta preparación. Esta crítica consiste en que es cierto que el sujeto no es consciente de
la regla que sigue el experimentador para dar el refuerzo, sin embargo, el propio sujeto
puede buscar una regla relacionada y actuar en base a ella. Por ejemplo, si lo que el
experimentador refuerza las palabras plurales, el sujeto puede pensar que la relación de
reforzamiento es otra que puede coincidir más o menos, sin llegar a conocer el criterio
real del investigador (por ejemplo puede pensar que recibe refuerzo al pronunciar
adjetivos referidos a sus padres), pero entonces estará usando una regla consciente,
aunque no coincida con la realidad.

b) Condicionamiento de respuestas fisiológicas no conscientes: biofeedback. Podemos


aprender a realizar respuestas sin darnos cuenta de cómo lo hacemos, por ejemplo,
podemos aprender a disminuir nuestra tasa cardiaca cuando suena un pitido
informando de que lo hemos hecho (refuerzo), y aunque no sabemos cómo la hemos
disminuido, podríamos estar buscando objetivos relacionados: sentarnos, relajarnos,
cerrar los ojos, no pensar en nada…Es decir, que seguimos metas relacionadas que
producen el mismo resultado que la real (del experimentador). Este experimento se
realiza también reforzando cuando el sujeto mantiene el tono muscular entre dos
niveles, por ejemplo.

¿Cómo demostramos que las metas que sigue el sujeto no están relacionadas
con la meta principal? Ocurre lo mismo que en el efecto Greenspoon. En estas
situaciones, entrenamos al sujeto explícitamente para alcanzar esa meta, ese objetivo,
pero no le decimos cómo hacerlo.

Este problema aparece en casi todas las preparaciones experimentales. Para


encontrar que se produce condicionamiento instrumental sin conciencia le contamos al
sujeto unas reglas alternativas que sean plausibles para el sujeto pero que en realidad no
se relacionan con las que estudiamos.
c) Condicionamiento Operante Enmascarado de la fuerza (Svartdal): ofreciendo unas
reglas plausibles al sujeto, aunque no relacionadas con la verdadera, conseguimos
evitar que el sujeto busque contingencias alternativas.

 En primer lugar tenemos una tarea de discriminación de secuencias de


estímulos, consistente en que el sujeto diga si dos secuencias son idénticas o
no. Esta según Svartdal es la tarea fácil.

 En segundo lugar tenemos una tarea similar pero mucho más compleja, que
consiste en decir si la segunda secuencia es la inversa de la primera secuencia
o no.

 A los sujetos se les dice que el refuerzo (un sonido por ejemplo) se les da
dependiendo de si realizan bien o mal esta tarea, sin embargo, en realidad lo
que se les refuerza es la fuerza con la que el sujeto presiona la tecla. A un
grupo se les refuerza cuando presionan más fuertemente y a otro cuando
presionan más débilmente (teniendo como referencia la línea base del sujeto
registrada primero).

En la tarea de discriminación más difícil, como la explicación resulta convincente


para los sujetos, éstos se dejan llevar, mientras que el refuerzo produce efectos sobre la
fuerza con que cada sujeto presiona la tecla (más o menos dependiendo del grupo). Este
efecto no es consciente, y no se relaciona con las contingencias que el sujeto considera
reales. En este caso, los sujetos no se dan cuenta de que el refuerzo no coincide con la
contingencia que le han contado ya que la tarea es tan compleja que no tienen forma de
averiguar cuando lo hacen bien y cuando no.

En la tarea más fácil es más complicado que ocurra esto, ya que el sujeto
probablemente se dará cuenta de que el bien y el mal no coinciden con la regla que le
han contado, ya que él sabe cuando lo hace bien y cuando no (más o menos), por tanto,
buscará otras reglas de contingencia alternativas.

Es difícil encontrar situaciones donde se puedan producir refuerzos directos, ya que


casi siempre los seres humanos buscamos la regularidad. En condicionamiento
Instrumental la conducta se da en base a una meta, dirigida a algo, por lo que es muy
complicado que se dé refuerzo directo sin que el sujeto busque una regla, una regularidad
entre su conducta y la consecuencia. Sin embargo, esto demuestra que es posible el
aprendizaje instrumental por refuerzo directo sin buscar reglas o contingencias
relacionadas.

d) Conciencia de la contingencia vs. Conciencia del programa de reforzamiento


(intervalo fijo): En Condicionamiento Instrumental, la conducta del sujeto depende
del patrón de reforzamiento (de intervalo, de razón, fijo, variable…). ¿La ejecución
de la conducta depende de que el sujeto descubra ese patrón?

En un programa de reforzamiento de intervalo fijo tiene que transcurrir un


tiempo determinado entre un refuerzo y otro, mientras ese tiempo no haya pasado, las Rs
del sujeto no serán reforzadas, la primera respuesta emitida tras ese tiempo sí será
reforzada.

De este modo, se crea en la gráfica el denominado festón de intervalo fijo: el


sujeto termina dejando de responder tras el refuerzo y aumenta su tasa de R cuando va
pasando el tiempo tras el último refuerzo. Este patrón sólo se observa en animales, niños
humanos y adultos distraídos (en situación de doble tarea). ¿Se trata de un efecto
automático o depende de la interpretación del sujeto?

En situaciones normales, los adultos pueden presentar dos tipos de patrones


distintos al anterior, dos patrones muy distintos en los que la ejecución de los sujetos
dependerá de la interpretación que hagan del patrón de reforzamiento.

1-. El primero de ellos: en este caso el sujeto pone todos sus recursos atencionales y
descubre el patrón, por lo que sólo responde cuando sabe que está próximo al intervalo.
Por tanto, depende de la interpretación consciente del patrón de intervalo fijo de
reforzamiento.

2-. El segundo: otros sujetos responden con tasas altas de respuesta todo el tiempo. El
sujeto puede pensar que al dar un determinado número de respuestas (ej. 10) se le da
refuerzo, es decir, puede pensar que se trata de un patrón de razón fija.

Estos dos patrones muestran que se trata de dos interpretaciones cognitivas


distintas ante el mismo entrenamiento. Probablemente el patrón de los animales sí sea
automático, por condicionamiento instrumental y de contexto, sin embargo, estos dos
últimos se basan en interpretaciones cognitivas, ya que cuando no están atentos o se
encuentran en una situación de doble tarea se produce el primero (automático, de los
animales) ya que no hay interpretación cognitiva.
RESULTADOS:

 La conducta instrumental se define como un comportamiento dirigido a metas, y por


ello es difícil distinguir entre conciencia de la contingencia real y contingencias
correlacionadas.

 Los resultados más convincentes se obtiene cuando se dirige al sujeto a una meta
plausible pero no correlacionada con la contingencia real (Svartdal, 1993).

 El programa de intervalo fijo produce un patrón de disminución de la respuesta justo


después de un refuerzo, y aumento progresivo a medida que se acerca el final del
intervalo (festón de intervalo fijo). Este patrón aparece en animales, en niños
pequeños y en adultos bajo condiciones de doble tarea. En adultos, en cambio, el
patrón depende de la interpretación consciente.

CONCLUSIONES:

Los sujetos aprenden relaciones de contingencia pero además también hay un


segundo efecto más relacionado con efectos automáticos (preferencias, R de miedo…) tanto
en Condicionamiento Clásico como en Instrumental. Lo difícil es disociar estos dos efectos
del aprendizaje, ya que es así porque los dos mecanismos de aprendizaje surgen para cubrir
los mismos objetivos, y normalmente actúan en las mismas condiciones.

Esto es compatible con la idea de los distintos niveles de aprendizaje (los más básicos
son simultáneos a los más sofisticados en los seres humanos debido a la herencia
filogenética). Como psicólogos, debemos actuar sobre todos los niveles si queremos
intervenir en la conducta. Además, según el tipo de aprendizaje que se dé (más automático o
más elaborado) se activan áreas neurológicas distintas.

 En humanos, las situaciones de condicionamiento producen dos tipos de efectos:


aprendizaje de reglas de contingencia y producción de respuestas (miedos,
preferencias, reacciones automáticas…).

 La investigación que trata de disociar ambos efectos ha encontrado multitud de


dificultades, dada la relación que existe entre las condiciones que causan ambos
efectos.

 La conclusión general es compatible con planteamientos como los de Razran acerca


de la existencia de diferentes niveles de aprendizaje cuyos efectos se encuentran
solapados en nuestro comportamiento, aunque no son idénticos. Probablemente esos
efectos han evolucionado sucesivamente a lo largo de la escala filogenético, tienen
diferentes sustratos neurales y requieren un abordaje diferente desde el punto de vista
aplicado.
TEMA 5: APRENDIZAJE DE RELACIONES DE CONTINGENCIA Y CAUSALIDAD:

1) TAREAS DE DETECCIÓN DE CONTINGENCIA Y CAUSALIDAD:

 Aprendizaje causal: proceso mediante el cual los organismos son capaces de captar
las relaciones de dependencia entre acontecimientos de su medio. Los individuos
tendemos a plantearnos los antecedentes de un estado o situación. El aprendizaje
causal es un proceso por el cual los sujetos somos capaces de adquirir información
sobre este tipo de contingencias, relaciones predictivas de dependencia.

 Aprendizaje de contingencia: similar (aunque no idéntico) al aprendizaje causal. En


ambos las relaciones son asimétricas, es decir, un antecedente se relaciona con una
consecuencia (ap. Causal) o un Es antecedente se relaciona con la aparición de otro
Es (ap. Contingencias).
Las relaciones de contingencia son distintas a las covariaciones y correlaciones. Dos
estímulos son contingentes si uno se puede considerar como contenido del otro
(siempre que éste aparezca, y sólo cuando éste aparezca…), por tanto, el consecuente
estará contenido en el antecedente. Sin embargo, una correlación es sólo cuando dos
Es tienden a aparecer juntos, por lo que es una relación simétrica, uno no contiene al
otro.

 Aprendizaje de contingencias vs. Aprendizaje causal: la contingencia es algo menos


que la causalidad, ya que no todas las relaciones de contingencia son causales, pero
seguramente todas las relaciones causales son de contingencia.

a) Además, la relación perfecta de contingencia no implica causalidad, ya


que puede existir un tercer elemento que esté mediando en esa relación
(ej. Puntuación en un test-tamaño del pie-edad). Sin embargo, en el
aprendizaje causal es necesario descartar terceras variables que puedan
influír.

Estudiar  Cansancio  Dolor de cabeza


Música alta  Dolor de cabeza

b) Aunque sepamos que hay una relación de contingencia muy fuerte entre
antecedente y consecuente, no lo consideramos causalidad a menos que
tengamos una teoría explicativa convincente de cómo de produce esa
causa-efecto. Por tanto, es necesario disponer de una teoría explicativa.

c) A pesar de todo esto, pragmáticamente se consideran equivalentes, muy


similares.

¿Cómo se estudian estas relaciones? De forma similar al condicionamiento, excepto en


que se usan estímulos más simples en lugar de eventos (motivacionalmente más relevantes),
es decir, se utilizan símbolos, y se suele medir mediante juicios, no a través de RC.
Existe una estructura común a ambos tipos de relaciones (causales y de contingencia):
siempre tenemos una clave predictora (variable de entrada) y un resultado (variable de
salida) que es lo que queremos predecir. La conclusión será un juicio de contingencia.

- Tareas predictivas vs. Tareas diagnósticas:

 Tareas Predictivas: clave = causa, resultado = consecuencia. Son las más comunes.
La relación entre las claves es de causa-efecto, y la relación de contingencia va en
ese mismo sentido.

 Tareas Diagnósticas: clave = síntoma, resultado = causa. En estos casos se plantea al


revés, tenemos resultados de una posible causa y tenemos que saber si esa causa se
dio o no partiendo de los síntomas. Lo que buscamos es la causa de ese efecto,
mientras que en las tareas predictivas queríamos conocer el efecto a partir de las
causas.

Esta direccionalidad de los juicios causales es muy importante tenerla en cuenta, la tarea
dependerá del objetivo del experimento que llevemos a cabo.

- Tareas Estímulo- Estímulo vs. Tareas Acción- Resultado:

 Tareas Es- Es: independiente del sujeto, es similar a lo que ocurre en Cond. Clásico,
ya que se trata de descubrir si hay relación entre dos Es. En este caso el sujeto sólo
puede observar, ir recibiendo información y registrarla, sin manipular la situación. En
este tipo de tareas el experimentador sin embargo tiene mayor posibilidad de manejo,
de manipulación.

 Tareas Acción- Resultado: se trata de predecir el resultado de una acción del sujeto.
Se parece más al Cond. Instrumental, ya que el sujeto produce una R y observa sus
consecuencias, la relación entre acción y resultado. En este caso, desde el punto de
vista del sujeto experimental, la tarea instrumental le permite tomar más la iniciativa
para experimentar en la situación, para descubrir la relación de contingencia entre su
acción y el resultado.
Sin embargo, el experimentador en estas situaciones no puede determinar la
contingencia que el sujeto va a ver, ya que que el sujeto reciba el resultado depende de
que éste realice o no la acción. Por tanto, la información real sobre la covariación clave-
consecuencia no puede darse del todo determinada por el experimentador.

Estas dos tareas serían predictivas (Es- Es, Acción- Resultado).

¿Cómo se presenta la información? Presentación Tabulada vs. Presentación Secuencial:

 Presentación tabulada: tabla de proporciones/ porcentajes, de modo que en


nuestros juicios de contingencia activaríamos mecanismos de inferencia distintos
a la asociación, aplicando algún tipo de regla.

 Presentación secuencial: ensayo a ensayo, relacionado con el aprendizaje de


contingencias más asociativo.

¿Cómo evaluar el aprendizaje? Juicios de contingencia vs. Tareas de predicción:

 La medida más frecuente es un juicio de contingencia, que indica la fuerza y el


sentido de la relación clave/ resultado. Indica el sentido mediante signo + ó – (puede
ser una contingencia negativa, que indique ausencia de resultado). La fuerza la
indica mediante un valor que oscila entre +1 y -1, o entre +100 y -100 (para no
trabajar con decimales).

 Además, podemos pedir al sujeto juicios de predicción en cada ensayo, es decir, que
el sujeto diga o intente predecir si se va a dar o no el resultado en base a la
presencia/ausencia de las claves.

 Agregadas: indica probabilidad del resultado en presencia de la clave. En términos


de probabilidades, y al final del entrenamiento, le preguntamos al sujeto: ¿crees que
en un ensayo en el que está presente la clave se dará el resultado? ¿crees que en un
ensayo en el que no está presente la clave se dará el resultado? El sujeto tiene que
responder en proporción/porcentaje. Es igual que el anterior pero se hace al final.
Esto es distinto del juicio de contingencia, el cual combina los dos juicios de
probabilidades: cuando está presenta la clave y cuando no lo está.

Pero, ¿Cómo aprendemos esto al ir viendo los ensayos?


2) MODELOS EXPLICATIVOS:

A) MODELOS BASADOS EN REGLAS.

1. DELTA P: Los sujetos estiman el valor normativo de la contingencia:

Se trata de la diferencia entre la probabilidad (P) de que ocurra el resultado (R) estando
presente la clave (C) y la probabilidad de que ocurra el resultado estando ausente la clave
(no C). Esto es lo que se haría a nivel matemático, y parece que es lo que hace nuestro
sistema cognitivo, ya que normalmente estimamos bastante bien esta contingencia.

En esto se basa el modelo delta P (diferencia entre probabilidades): ¿es posible que
nuestra inferencia de la contingencia siga esta diferencia de probabilidades? Al aprender una
relación predictiva haríamos lo mismo que un estadístico aplicando la regla matemática.

Una relación predictiva es perfecta cuando el resultado aparece si y sólo si está presente
la clave (rel. Positiva) o si y sólo si está ausente la clave (rel. Negativa).

Ejemplo: ¿Existe una relación positiva entre ir a clase y aprobar una asignatura? ¿en qué
grado?

- Probabilidad de aprobar yendo a clase: 90%


- Probabilidad de aprobar sin ir a clase: 20%

- Relación de Contingencia: 70% (.70)  relación positiva.

Si pasamos a un grupo de sujetos una tarea como esta, el resultado de la media de juicios
se aproximará mucho a este valor, .70.

Si los errores no son aleatorios, si hay un sesgo de error sistemático significa que las
personas no aplicamos exactamente delta P a la hora de realizar un juicio de contingencia.
Existen desviaciones conductuales que parecen difíciles de explicar desde este modelo:
 Sesgo de densidad: para un nivel fijo de contingencia (sobre todo de contingencia
nula) la estimación aumenta en función directa de la probabilidad del resultado. En
algunas situaciones, sobre todo cuando la clave y el resultado no están relacionados,
se produce en los sujetos una ilusión de esa relación si el resultado aparece bastantes
veces, aunque la contingencia real sea 0 (nula). Si el resultado es muy frecuente
tendemos s juzgar la relación como positiva.

Ejemplo: en un sitio como Santiago, que llueve muy a menudo, podemos tener la
sensación de que siempre que decidimos ir andando llueve, cuando esa relación en
realidad es nula: tanto cuando vamos en coche como cuando vamos andando llueve el
75% de las veces (75/100, 15/20), pero llueve muy a menudo (90/120).

Sin embargo, en un sitio más seco el resultado es menos frecuente, llueve el 25% de
las veces, por lo que la ilusión es más difícil que se produzca (la relación sigue siendo
nula).

Que este sesgo se dé de forma sistemática nos indica que seguimos otro tipo de regla, o
un mecanismo que no implica reglas. Pero, ¿cómo se produce este sesgo? Algunos
autores propusieron otras reglas alternativas:

2. DELTA P PONDERADA: Prestamos más atención a ciertas casillas de la tabla de


contingencia e.g. nos centramos más en los ensayos en que la clave está presente. Es algo
similar a delta P pero dándole más relevancia a unas celdas de la tabla de contingencias que
a otras, de modo que prestaríamos más atención cuando la clave está presente que cuando no
(cuando salimos andando).

Si nos fijásemos más en a y en b, el resultado se relaciona con la ilusión del sesgo de


densidad de los ejemplos. En el primer caso hay una probabilidad del 75% de que si salgo
andando llueva (ilusión de relación +), mientras que en el segundo caso ocurriría lo
contrario, ya que hay una probabilidad del 25% de que si salgo andando llueva. Por tanto,
nos fijamos en lo que ocurre en presencia de la clave, sesgando nuestro juicio a un lado o a
otro.
3. DELTA D: otra alternativa es que utilicemos la acumulación de casos en lugar de la regla
del cálculo de probabilidades. En esto se basa delta D: diferencia de diagonales. En este caso
pondríamos juntos los ensayos que nos indican que existe una relación positiva y les
restaríamos los ensayos que nos indican que la relación es negativa:

 Los ensayos tipo a y los tipo d refuerzan la idea de la relación + (en presencia de la
clave se da el resultado, en ausencia de la clave no se da el resultado). Esta diagonal
ofrece información favorable a una relación positiva: cuando salgo andando y
llueve, cuando salgo en coche y no llueve. Proporción de ensayos que confirman la
relación directa.

 Los ensayos tipo b y c: esta diagonal nos proporciona información en sentido


contrario, nos da información de que no hay una relación positiva, sino negativa:
cuando salgo andando y no llueve, cuando voy en coche y llueve. Proporción de
ensayos que confirman la relación inversa.

El resultado de la resta oscila entre +1 y -1. En ambos casos la relación real de


contingencia es nula, pero según delta D, en el primer caso existiría una relación positiva
(.33), mientras que en el segundo caso la relación sería negativa (-.33).

El sesgo de densidad positivo es más fuerte que el sesgo de densidad negativo, por
tanto, delta D explica el positivo (la relación + ilusoria) pero no explica por qué la ilusión de
relación negativa no se da (normalmente no se obtienen juicios de contingencia negativa en
el segundo ejemplo, de la zona seca).

OTROS PROBLEMAS QUE AFECTAN A LOS 3 MODELOS BASADOS EN REGLAS:

 Cuando nos plantemos situaciones realistas, tenemos que tener en cuenta la


existencia de varias claves simultáneas posibles: ¿cuál de ellas predice el resultado?
En este caso, los resultados se alejan más de lo que dicen los modelos basados en
reglas. Estos problemas también se dan en condicionamiento (situación de
competición entre claves).
 Bloqueo (Chapman & Robins, 1990): tendemos a aprender menos sobre la relación
entre una clave y un resultado cuando ese resultado fue relacionado previamente con
otra clave:

- Predictor-resultado (rel.+). El sujeto aprende la relación.


- Predictor B (nuevo) y predictor anterior- resultado.
- Juicio de contingencias: la segunda clave (B) casi no actúa como predictor, no
aporta nada nuevo, por lo que se aprende menos su relación con el resultado.

 Supercondicionamiento (Shanks, 1991): al contrario que el bloqueo:

- Predictor (N)- ausencia de resultado (rel.-).


- Nuevo predictor (C) y antiguo predictor- resultado
- Juicio de contingencias: la nueva clave (C) es un gran predictor, se da el resultado a
pesar de estar presente el predictor negativo.

Si aplicamos delta P, tanto para B como para C, el resultado sería el mismo para
ambos, pero en realidad esto no se cumple. Cuando existen varias claves, ciertos efectos
resultan contradictorios con un modelo basado en la aplicación de reglas.

 Validez relativa (Shanks, 1991): otro efecto problemático derivado de las múltiples
claves, es algo similar al bloqueo. Comparamos dos situaciones en las que un
predictor es igual de mal predictor en ambas, sin embargo, en un caso se presenta
en compañía de otros predictores mejores, y en otro caso se presenta con otros
predictores igual de malos.

- Situación correlacionada: en la que B es un buen predictor del resultado, y C es un


buen predictor de la ausencia del resultado, por lo que A se considera con menor
validez relativa:

A B  Resultado
A C  No resultado
- Situación descorrelacionada: todas las claves son igual de malas predictoras, por lo
que los sujetos juzgan como peor predictor a A que a D, siendo los dos nulos. D se
considera mejor predictor porque no se presenta con otros que son mejores (Validez
relativa).

D E  50% Resultado, 50% Ausencia de resultado


D F  50% Resultado, 50% Ausencia de resultado

Resulta difícil explicar esto en función de reglas, ya que A y D tienen la misma


contingencia (nula), pero se valoran distinto por parte de los sujetos.

 Señalización (Shanks, 1989): en una situación, si todos los ensayos de la casilla


b (por ejemplo) se señalizaran por medio de una clave extra, un predictor
adicional, se observa un aumento del juicio de contingencia. Una explicación es
que descartemos esos ensayos como ensayos adicionales.

En esta situación, los juicios de contingencia varían por añadir una clave
especial a todos los ensayos de una determinada celda (b), por lo que el juicio de
contingencia aumenta. Los sujetos, en cada ensayo, asocian las claves con los
resultados de modo parecido a como asocian los ECs y los EIs (los modelos
explicativos del condicionamiento podrían explicar este fenómeno).

4) DELTA P CONDICIONAL: ¿Qué tipo de ensayos hay que incluir en la tabla de


contingencias? Para saber los ensayos que hacen falta se plantea el delta P condicional o
teoría del contraste probabilístico (Cheng & Holyoak). Esos ensayos que entran dentro de la
tabla de contingencias se denominan conjunto focal, que indica los criterios que tiene que
cumplir un ensayo para entrar dentro de la tabla de contingencias.

Delta P condicional: la contingencia no se calcula sobre todos los ensayos, sino sobre
un conjunto focal: comparamos la probabilidad de que el resultado se presente con o sin la
clave, mientras todo lo demás sigue igual. Esto explica el señalamiento y el bloqueo.
Tenemos que buscar un contexto común para los ensayos donde esté presente la clave y
donde no lo esté. Este delta P condicional explica bastante bien el “efecto de la interacción
entre claves”.
Asumimos un modelo de causalidad y evaluamos la capacidad predictiva de la clave
en ensayos controlados. Por tanto, hacemos delta P pero condicionada a un conjunto
específico, y vemos lo que pasa en presencia o ausencia de la clave cuando el contexto es
invariante (controlado).

Delta P condicional es un modelo un poco más realista, y tiene en cuenta que no sólo
somos estadísticos sino que tenemos en cuenta el control, con la finalidad de ver el efecto de
la presencia de la clave/ ausencia de la clave en una situación controlada, manteniendo todo
lo demás igual. Primero definimos un conjunto focal, un contexto en el que vamos a evaluar
el efecto de la clave, para ver qué cambia cuando está presente o no la clave.

Delta P condicional dice que para computar la contingencia tenemos que decidirnos
por unos ensayos que cumplan una serie de criterios. Hay que eliminar a sujetos
excepcionales (los del grupo b), de este modo conseguimos una relación perfecta (la
estimación aumenta con respecto a lo normativo). Este modelo explica el bloqueo y la
señalización (no tanto la validez relativa), sin embargo, sigue teniendo los problemas que
tenía delta P, como el sesgo de densidad, o que el juicio de contingencias progresa a medida
que aumenta la práctica, como en una curva de aprendizaje. Estos fenómenos no deberían
producirse según delta P.
B) MODELOS ASOCIATIVOS:

Algunos autores se plantearon que quizá los modelos asociativos también podrían estar
presentes en el aprendizaje de contingencias, que quizá los sujetos sólo observan y
establecen asociaciones entre claves y resultados en función de las veces que estos
elementos aparecen juntos, como en una situación de condicionamiento. Por tanto, los
mecanismos que explican aprendizaje causal y condicionamiento pueden ser análogos:
basados en la acumulación de fuerza asociativa entre las representaciones de los estímulos.

RESCORLA Y WAGNER (1972): Cada vez que una clave se empareja con un
resultado esos dos estímulos se van a asociar en función de su saliencia, y del grado en que
el segundo estímulo (resultado) produce sorpresa. Por tanto, el cambio en la fuerza
asociativa depende de la saliencia de la clave ( ), de la saliencia del resultado ( ), y de la
diferencia entre la cantidad máxima de fuerza asociativa que puede conseguirse ( ) y la
acumulada en ese ensayo por todas las claves presentes ( ).

Si un estímulo está completamente predicho por otros, la sorpresa de que se presente


será 0 ( ). Esto se aplica a todas las situaciones de predictores:

 Si ya hay una clave que predice un resultado, la asociación de ese resultado se


asociará menos con una segunda clave predoctora (bloqueo).
 En la situación contraria, si no hay nada que prediga el resultado y éste se
produce, la sorpresa es máxima (máxima diferencia entre ) y el
aprendizaje está determinado por la sorpresa. Supercondicionamiento.

Por lo tanto, este modelo explica fenómenos de competición entre claves (bloqueo,
validez relativa, señalización, supercondicionamiento…).

Sin embargo, el modelo de Rescorla y Wagner presenta problemas para explicar cómo
se aprende acerca de una clave cuando ésta no está presente, como ocurre en el caso del
bloqueo hacia atrás (Shanks, 1985).

Este modelo predice que el resultado sería distinto en los diferentes tipos de bloqueo,
ya que según estos autores, sólo aprendemos relaciones entre estímulos en ensayos en los
que esos estímulos están presentes (sino no existe saliencia). Sin embargo, esto no se
cumple.
 En el bloqueo normal el resultado ya no es sorprendente al añadir el predictor
B (Vx es muy grande). Si el resultado está predicho la diferencia entre
es menor (menos sorpresa), por lo que aprendemos menos esa relación, ya que
está bloqueada por la primera (P  R).

 En el bloqueo hacia atrás, en la fase 1 las dos claves predicen el resultado (se
ensombrecen uno al otro, por lo que la asociación de cada uno con el resultado
es menor) y en la fase 2 sólo uno de ellos está presente y va seguido del
resultado. Esto provoca desconfianza de que B prediga el resultado, por lo que
se produce bloqueo.

Este modelo no explica esta última situación, ya que B está ausente en la fase 2 (por lo
que su saliencia es nula) y por tanto, no se debería aprender nada sobre este predictor B si no
está presente. Sin embargo, el estímulo B se devalúa sin estar presente.

Alternativas como la de WASSERMAN intentan explicar este fenómeno del bloqueo


hacia atrás diciendo que si un sujeto ha aprendido unos predictores (P y B) de un resultado,
cuando se presenta el resultado sin estar presente uno de ellos (B), existe una saliencia de la
ausencia de ese predictor ausente B, por lo que aprendemos acerca de su ausencia.

Es decir, que cuando un estímulo esperado no está presente se computa como si lo


estuviera, pero con una saliencia negativa. Los dos predictores se asocian entre sí en la
primera fase, y el hecho de la no aparición de uno de ellos en la segunda fase se convierte en
un estímulo relevante, con una “saliencia negativa” (- ). Esto provoca una disminución de
la asociación entre ese estímulo (B) y el resultado.

Por otro lado, también la ausencia de un resultado esperado puede ser computada como
saliencia (provocando inhibición).

Parece que hay aspectos que se comportan de modo asociativo y otros de modo más
estratégico.

SIMULACIONES DE LOS MODELOS ASOCIATIVOS EN REDES CONEXIONISTAS:

La ecuación de Rescorla y Wagner es equivalente a la regla delta, que se usa a menudo


como algoritmo de aprendizaje en modelos conexionistas. Sus predicciones son análogas con
respecto a la competición entre predictores, y se ha observado además:

 El efecto del sesgo de densidad se observa en los períodos iniciales de


aprendizaje, pero tiende a perderse al alcanzar la asíntota.

Si observamos la curva de aprendizaje en cuanto al sesgo de densidad, encontramos


que cuando la contingencia es positiva o negativa, el juicio comienza en torno a
cero y se va acercando al valor real. Sin embargo, cuando la contingencia es nula
pero el resultado es frecuente, el juicio comienza en valores positivos y luego se va
aproximando a cero (esto no ocurre cuando el resultado no es frecuente).
Esto se explica porque el punto de partida siempre es la ausencia de predicción, la
predicción 0, sin embargo, la primera vez que la relación aparece como positiva
produce una gran sorpresa, que hará que se empiece juzgando esa relación como
positiva, sobre todo si el resultado es frecuente, aunque a medida que avanzamos el
juicio de contingencia se va aproximando a 0, ya que cada ensayo no contingente
va contrariando la ilusión anterior.

Por tanto, un modelo asociativo es bueno para explicar la mayor parte de los
fenómenos de competencia entre claves, pero tiene problemas para explicar el
bloqueo hacia atrás. Además, también explican que aparezcan sesgos de densidad
en los primeros momentos del aprendizaje: en la asíntota acaba apareciendo una
fuerza asociativa entre la clave de entrada y la clave de salida equivalente al valor
real de la relación de contingencia.

 Efectos de orden de presentación de los ensayos. Si se entrenan dos tipos de


contingencia en serie, la segunda afecta más a los juicios de los sujetos. Según
los autores, no se debe a un mayor recuerdo de los emparejamientos finales,
sino al mayor impacto de la sorpresa en el sentido del cambio.

El orden de presentación de los ensayos puede afectar de forma sistemática a


los juicios de contingencia de los sujetos. Según los modelos de reglas esto no
tendría sentido, pero sí según los modelos asociativos, ya que suponen que
aprendemos más cuanto mayor es la sorpresa. Por lo tanto, si los primeros
ensayos muestran una relación positiva, y luego cambiamos a una negativa en
un segundo grupo de ensayos (o de una contingente a una no contingente y
viceversa), este impacto va a ser mucho mayor que el del grupo de ensayos del
principio, por lo que los juicios de contingencia se sesgarán en la dirección de
estos últimos ensayos debido a la sorpresa que producen.

- En el primer caso A predice el resultado en la fase 1 (contingente), sin


embargo, deja de ser predictivo en la fase 2 (no contingente).

- En el segundo caso, D no predice el resultado en la fase 1 (no contingente),


pero sí lo hace en la fase 2 (contingente).
- A y D se han asociado el mismo número de veces con el resultado, sin
embargo, D será juzgado como mejor predictor que A por parte de los sujetos,
ya que era contingente en los últimos ensayos (después de no serlo en la fase
1). Por tanto, los predictores se ven más afectados por lo que ocurre en la fase 2
que en la 1, debido a la sorpresa que produce el cambio.

Algunos autores propusieron la hipótesis alternativa de que los sujetos


recuerdan más los últimos ensayos que los primeros, sin embargo, una tarea de
reconocimiento al final del experimento descarta esta hipótesis, de modo que el
recuerdo no es la causa de este sesgo de los juicios de contingencia. Este
resultado refuerza la idea de que el aprendizaje se produce de acuerdo con el
modelo de Rescorla-Wagner.

Sin embargo, no sólo existe aprendizaje asociativo, además de este aprendizaje


automático hay una serie de componentes más estratégicos que explican cómo
los sujetos modifican sus juicios de contingencia: expectativas, importancia que
le dan a cada ensayo, contenido de la situación a la que se exponen (si es una
tarea predictiva o diagnóstica)…

3) CAUSALIDAD Y APRENDIZAJE DE CONTINGENCIAS:

 EFECTO DE LA FRECUENCIA DE JUICIOS (Catena et. al, 1998): Este


efecto es difícil de explicar tanto desde los modelos asociativos como desde los
modelos basados en reglas. La frecuencia con la que pedimos a los sujetos que
estimen las contingencias va a influir sobre la importancia que los sujetos le
den a los ensayos previos a ese juicio.

Si le pedimos al sujeto que de un juicio cada 5 – 6 ensayos, él basará


su juicio en lo ocurrido en esos ensayos en general, sin darle más importancia al
último que a otros. Sin embargo, si le pedimos que de un juicio en cada ensayo,
el impacto del ensayo previo será muy grande, y el sujeto creerá que le estamos
pidiendo que cambie su juicio cada vez en base a lo que ocurre en ese último
ensayo. De este modo, influirá si el último ensayo ha sido de tipo a o d (que
aumentarán el juicio de contingencia) o si ha sido de tipo b o c (que
disminuirán el juicio de contingencia.

Así, la importancia de los últimos ensayos en el juicio depende de la


frecuencia de juicio: la revisión de creencias no parece un efecto meramente
asociativo, sino un efecto estratégico. Por tanto, los juicios se modulan en
función de lo que el sujeto cree que le están pidiendo.
 EL PAPEL DEL CONTEXTO: JUICIOS PREDICTIVOS VS.
DIAGNÓSTICOS (Waldmann & Holyoak, 1992): hace referencia a la historia
general que rodea al planteamiento, a que es importante lo que le contamos al
sujeto sobre la tarea y sobre lo que tiene que hacer. También es importante lo
que son los estímulos que presentamos (claves y resultados), y si se trata de
juicios predictivos o diagnósticos (¿las causas son claves o síntomas?).

Hay ciertos efectos que dependen de la historia que le contemos a los


sujetos, no es un simple aprendizaje asociativo, sino que incorporamos parte de
nuestro conocimiento previo sobre como actúa la causalidad, que no es igual en
un sentido que en otro:

- Si tenemos un efecto y encontramos una causa que lo explica bastante bien,


esto hace que prestemos menos atención a otra posible causa. Por tanto, existe
una competición entre posibles causas en nuestro sistema cognitivo.

- Esto no ocurre con los efectos, que confiemos en que una causa provoca un
efecto no hace que desconfiemos de que también provoque otro efecto (como
en el caso de la gripe, que provoca fiebre pero también dolor de cabeza). Por
tanto, los efectos no compiten entre sí, ya que pueden ser varios de una sola
causa.

Nuestro modelo causal asume que las causas compitan entre sí y los efectos no.
Por lo tanto, los fenómenos de competición entre claves se darán en tareas
predictivas, y no cuando las claves son síntomas de una tarea diagnóstica. Así,
los fenómenos de competición se dan cuando la historia contextual es de tipo
causal, de tareas predictivas, ya que nuestro conocimiento de las situaciones
influye.

En resumen, las causas compiten entre sí, pero no los efectos. Si los sujeto no
sólo aprenden relaciones de contingencias, sino que aplican un modelo causal,
la competición entre claves debería darse cuando varias causas compiten por
explicar un resultado (juicio predictivo), pero no cuando varios síntomas se
relacionan con una causa subyacente (diagnóstico).

Pero…(Shanks & López, 1996): hay algunos estudios que encuentran


competición tanto entre causas como entre efectos: el modelo causal es, al
menos en ocasiones, superado por los efectos asociativos (es capaz de producir
competición entre claves en situaciones diagnósticas).
4) CONCLUSIONES SOBRE LOS MODELOS ASOCIACIONISTAS:

En conclusión, hay varios tipos de mecanismos implicados en estas situaciones,


aunque los asociativos explican bastantes cosas:

 A favor:

- Efectos de orden de presentación de los ensayos.


- Sesgo de densidad, comportamiento preasintótico y curva de aprendizaje.
- Competición en situaciones predictivas y diagnósticas.

 En contra:

- Bloqueo hacia atrás (a no ser que asumamos la propuesta de Wassermann).


- Ausencia de competición en algunas situaciones de diagnóstico.
- Efecto de la frecuencia de juicios. (la importancia que le damos a un ensayo).

Por tanto, tenemos que quedarnos con un modelo híbrido, de modo que todos los
niveles del aprendizaje están implicados en el conocimiento que adquirimos sobre relaciones
de contingencia.

PERALES, CATENA, MALDONADO (2002): Los juicios de predicción ensayo a ensayo


están afectados por la información de más bajo nivel (igual que las RCs), y poco afectados
por nuestro conocimiento de orden superior.

A medida que acumulamos información (juicio de contingencia) categorizamos los


ensayos (tipo a, b, c, d), llevando a cabo una elaboración, por lo que no siempre coinciden
con los juicios de predicción.

Para juicios causales no sólo tomamos esa información, incorporamos nuestro


conocimiento previo sobre la causalidad y hacemos inferencias.

También podría gustarte