Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
y tiempo juntos, lo que quiere decir que hay una cierta relación que no es determinista, sino que muchas veces
está sujeta a la incertidumbre, al riesgo, y que, por tanto, nuestro sistema cognitivo está preparado para captar
esas relaciones entre sucesos, lo que algunos llaman la estructura causal del medio ambiente y el aprendizaje
predictivo (basado en la asociación entre eventos, como el CC).
Nosotros no podemos percibir las relaciones ni asociaciones entre eventos porque son conceptos teóricos,
pero sí que podemos percibir la coocurrencia, es decir, según nuestra experiencia llegamos a la conclusión de
que normalmente un evento está relacionado con otro. Ejemplo: percibimos el relámpago y luego el trueno.
El sistema cognitivo evalúa si los eventos están relacionados o no, y si esta relación es causal, pero no todos
los fenómenos que covarían o coocurren tienen una relación causal.
Los modelos que vamos a ver de aprendizaje tienen que resolver distintas cuestiones:
Determinar qué información, de toda la disponible se utiliza
A qué procesos es sometida
No subestimar o (especialmente) sobreestimar los recursos cognitivos de los individuos.
Lo que aparece en la celda es la frecuencia de la conjunción de 2 eventos. Son 20 participantes en total. Pueden
ser 4 fenómenos distintos:
Tratamiento con efectos secundarios
Tratamiento sin efectos secundarios
2
Sin tratamiento con efectos secundarios
Sin tratamiento sin efectos secundarios
*Ejemplo: hay 8 pacientes que han tomado el medicamento y que presentan efectos secundarios.
También puede ser presentada utilizando la información de forma no numérica en una tabla de contingencia,
icónicamente.
3
TUMOR CEREBRAL TUMOR CEREBRAL
MAREOS PRESENTE AUSENTE
PRESENTE 160 a 40 c
AUSENTE 40 b 10 d
Primero, Vamos a determinar si existe una precondición para que haya una relación de contingencia. ¿Hay
una relación entre tener mareos y tener un tumor cerebral?
a => Tener tumor cerebral y tener mareos
b => Tener tumor cerebral sin tener mareos
c => Tener mareos sin tener tumor cerebral
d => No tener mareos ni tener tumor cerebral
Todos se tienen que tener en cuenta para ver si existe una relación de contingencia entre padecer un tumor
cerebral y tener mareos.
Segundo, ¿Está relacionado el mareo con la presencia del tumor cerebral? ¿Causa el tumor los mareos?
Mayoritariamente las respuestas han sido sí.
Para emitir un juicio normativo y para saber la respuesta objetiva de esa relación estadística de contingencia
recurriríamos al cálculo de Delta P. Para ello tenemos que tener en cuenta los 4 tipos de ensayos y también si
están presentes:
- La señal o causa potencial (C) ⮕ el EC o RC
- El efecto o consecuencia (E) ⮕ el EI o RI (reforzador)
Vamos a probar si hay una relación generativa.
La frecuencia de los ensayos es la siguiente:
¿Cómo calculamos si existe una relación de
contingencia? Tenemos en cuenta 2
probabilidades condicionales:
La probabilidad de que se observe el efecto cuando está presente la causa, es decir, en todos los
ensayos en los que está presente la causa (ensayos tipo a y b), en cuántos de ellos se ha observado
también el efecto.
La probabilidad de que se observe el efecto en ausencia de la causa, es decir, en todos los ensayos en
los que no aparece la causa (ensayos tipo c y d), en cuántos de ellos se ha observado el efecto.
Si las dos probabilidades anteriores son más o menos iguales, Delta P es 0 y nos viene a decir que no
existe relación de contingencia. La regla Delta P se expresa como: hasta qué punto la probabilidad de
que aparezca el efecto depende de que previamente se haya presentado la causa potencial.
a= 160 ; b= 10; c=10; d=10 ⮕ Se refiere a la frecuencia de los tipos de ensayo Mareo (M) = efecto;
Tumor (T) = causa
La ilusión de causalidad se manifiesta por el hecho de que siendo la contingencia objetiva 0, se percibe
que existe una relación positiva entre padecer los tumores y los mareos. La tasa base de ocurrencia
de los mareos (efectos) es muy elevada, tanto en presencia de la causa potencial como en su ausencia,
4
lo que nos hace percibir una relación de causalidad donde no existe. Esta tasa de ocurrencia muy
elevada se da tanto en pacientes que tienen tumor como los que no.
a>b=c>d
2.1. DELTA P
Supone un modelo normativo de aprendizaje predictivo: propone un estándar racional de cómo deberíamos
estimar el juicio predictivo basado en la noción estadística de relación de contingencia. Considera una sola
causa potencial y un solo resultado.
El índice estadístico que mide la fuerza de covariación es el índice de contingencia ΔP. Defiende:
Los eventos que están relacionados entre sí no se distribuyen de modo aleatorio.
Co-ocurren de manera dependiente (en el tiempo y en el espacio): “if-then” (si ocurre A, entonces
ocurre/no ocurre B)
Cuanto mayor es la contingencia objetiva entre eventos, mayores son las estimaciones o juicio de
sujetos.
Los sujetos deben llevar a cabo un cierto cálculo de la fuerza de covariación
Cuando Delta P más se acerque a 1, hablamos de que existe una contingencia positiva ⮕ causa
generativa à aprendizaje o condicionamiento excitatorio.
Cuando Delta P más se acerque a -1, hablamos de que existe una contingencia negativa ⮕ causa
preventiva ⮕ aprendizaje o condicionamiento inhibitorio.
Cuando Delta P más se acerque a 0, hablamos de que existe una contingencia nula, no hay relación
causal, no se da aprendizaje, pero sí se da una ilusión de causalidad.
Por tanto, podemos inferir que los sujetos deben llevar a cabo un cierto cálculo de la fuerza de la covariación
mediante el índice de contingencia Delta P. Delta P es una regla de ejecución, no un modelo de aprendizaje.
5
-α, β: intensidad, saliencia o relevancia como el biológico (de claves y resultados respectivamente) de las claves
que consideramos.
- (λ – ΣVn-1): grado de sorpresa (error, discrepancia). Cuando aprendamos=0
- λ: asíntota de aprendizaje (nivel máx. de fuerza asociativa que se puede tener). Vale 0 si no aparece el efecto
después de la señal y 1 si aparece
-Σ: sumatorio de las distintas claves que pueden influir
- ΣVn-1: grado en que el resultado es el esperado en ese ensayo. Lo que creo que va a pasar.
Se da aprendizaje cuando hay una discrepancia (“sorpresa”) entre el estado esperado del mundo (ΣVn-1) y el
resultado o estado actual del mundo (λ, detección del error). Cuando estos dos valores son iguales se deja de
aprender porque ya sabes asociar.
Implica que necesitamos actualizar nuestro conocimiento (fuerza de asociación). En esos casos el resultado
del paréntesis será:
Positivo: incremento de la fuerza asociativa, condicionamiento excitatorio
Negativo: disminución de la fuerza asociativa, condicionamiento inhibitorio. Extinción.
*En el nivel asintótico, cuando solo hay una clave y un contexto invariable, el modelo de R&W y ∆p
convergen, pero sus predicciones difieren en la fase pre-asintótica. Los modelos normativos son modelos de
ejecución, pero no de aprendizaje; no especifican el mecanismo por el cual se establece la relación causal.
Este modelo no es muy bueno para explicar la extinción, la concibe como desaprendizaje, puede llegar a tener
valores incluso cercanos a 0. Pero explica muy bien la condicionada y predice fenómenos nuevos q no se
conocían. La extinción no es desaprendizaje, sino aprender algo nuevo.
La validez predictiva es la capacidad de predecir algo que tiene un estímulo.
Cuando dos estímulos compiten por predecir una determinada clave, el aprendizaje de aquella con valores de
alfa y beta mayores se condicionarán primero. Esto dificulta la asociación de la otra clave cuya saliencia es
menor. A este efecto se le llama ensobrecimiento. Los dos se condicionan menos de lo que harían por
separado.
6
- Los cacahuetes van disminuyendo su valor predictivo. Los juicios de contingencia van disminuyendo.
Cada vez menos relación reacción alérgica.
- Las gambas, en cambio, a pesar de que su valor predictivo se mantiene constante en todos los casos,
los juicios de contingencia de los participantes van disminuyendo. 8 de 16.
Según Wasserman, esto ocurre porque el valor predictivo de una clave se interpreta en términos relativos, y
no en absolutos, es decir, no solo tenemos que tener en cuenta que hay una relación de contingencia además
de que exista un valor predictivo, sino que ese valor predictivo de alguna forma se interpreta en términos
relativos. De forma, que si tenemos una clave con alto valor predictivo (en este caso las fresas), va a producir
una infravaloración de otra clave con un valor predictivo medio (las gambas).
La relación de contingencia es insuficiente para explicar el aprendizaje (p.e., la probabilidad de sufrir una
reacción alérgica con las gambas es la misma en todas las condiciones y esto no se traslada a nuestro juicio,
pues hay un mecanismo selectivo).
Efecto de validez predictiva: se subestima el valor predictivo de claves (G) cuando se condicionan en presencia
de claves con mayor valor predictivo (F).
7
P(E/C)= 0.25 , p(E/noC)= 0.25, delta p= 0.
La probabilidad de que aparezca el efecto o resultado en presencia de la causa potencial es 0’25, pero
también de que aparezca en ausencia es 0’25. Por tanto, calculando delta p (la diferencia entre las dos
probabilidades) sale 0: no existe ninguna relación de contingencia entre la causa potencial y el efecto.
La probabilidad de presencia del efecto tanto cuando la causa potencial está presente como cuando
no lo está, es relativamente baja, por tanto, no se produce esa ilusión de causalidad.
Hay ciertas características de nuestro sistema cognitivo que producen estas desviaciones, como la ilusión de
causalidad. Aplicado al CI, en la ilusión de causalidad se percibe una relación entre 2 sucesos cuando no existe
y en la ilusión de control percibimos una relación entre nuestra conducta y un resultado que tampoco existe.
En una 1ª fase vamos a entrenar una causa potencial (A) como una causa generativa o como un
estímulo condicionado excitatorio, es decir, una clave que en su presencia se produce un resultado.
Cuando no está presente el resultado no aparece. Si intercalamos distintos ensayos de estos dos tipos
a lo largo de la 1ª fase, A se va a establecer como una clave predictora (o generativa) de la presencia
del resultado.
En una 2ª fase entrenamos la clave A para ser una causa preventiva, es decir, cuando están presentes
A y C no aparece ningún resultado, pero cuando está C en solitario, sí que aparece. A señala la ausencia
del resultado, es una clave preventiva.
2º Caso
En una 1ª fase entrenamos una clave D como una causa preventiva, cuando está presente no aparece
un resultado. Pero cuando el estímulo E está presente en solitario, sí aparece resultado. Por tanto, D
es una clave preventiva porque señala la ausencia del resultado.
En una 2ª fase, intercalamos distintos tipos de ensayos: cuando está presente D aparece el resultado
y cuando está ausente, no aparece resultado. Por tanto, en este caso, D es una clave predictora (o
causa generativa).
Hemos observado que los modelos normativos predicen que independientemente del orden de presentación
de los ensayos el juicio final de los participantes debería ser en teoría idéntico, puesto que han experimentado
los mismos tipos y números de ensayos en la fila superior e inferior. Es decir, la experiencia a la que han sido
sometidos es la misma, solo que el orden en el que se han presentado es diferente. Sin embargo, lo que se
observa en los modelos descriptivos es que los juicios tienden a ser más elevados en el 2º caso, es decir,
cuando entrenamos como causa generativa en 2ª fase: el juicio para D es mayor que para A. Se deduce que el
orden sí importa.
Las relaciones estadísticas condicionales son las mismas. Sin embargo, el juicio es mayor en el 2º caso en el
que las contingencias positivas se presentan en el último lugar, después que las negativas. Dicho esto,
8
deducimos que el efecto de orden se explica por un efecto de recencia, que es un efecto en memoria (tienen
más peso los últimos ensayos que estamos considerando).
FALACIA DE LA CONJUNCIÓN
Según el teorema de la conjunción la
probabilidad de la conjunción de dos sucesos
nunca puede ser mayor que la probabilidad de
cada uno de esos sucesos constituyentes.
P(A^B) < p(A), p(B)
Sin embargo, en ocasiones se producen esas desviaciones o sesgos. Para entenderlo tenemos que considerar
la complejidad de los estudios de contingencia y causalidad (que pueden considerar distintos efectos, fases…).
Tenemos en cuenta: una tarea de aprendizaje (T1) y una tarea de juicios (T2), que es donde evaluaríamos el
sesgo.
Tarea diagnóstica
Aparecen 4 síntomas, y consideramos la posibilidad de
que existen 2 enfermedades.
Tarea de aprendizaje => Cada síntoma (Si) se
presenta a lo largo de la tarea en repetidas
ocasiones y en diferentes ensayos asociado a
una de las 2 enfermedades con una determinada
probabilidad. Los participantes tienen que
descubrir la relación probabilística puesto que
los síntomas aparecen en las 2 enfermedades, pero con una distinta probabilidad. ¿Cómo lo hacen?
Se les presenta el síntoma y si padece la enfermedad con el virus 1 o 2, en distintos ensayos. Podemos
entonces estimar las probabilidades condicionales p (Si / R): enfermedad rara y p (Si / C): enfermedad
común.
Tarea de juicios => Al final de la tarea de aprendizaje se presenta la tarea de juicios. En esta tarea los
participantes tienen que estimar la relación de contingencia entre síntomas y virus; podemos
preguntar cuál es la probabilidad de que aparezcan determinados síntomas o conjunción de síntomas
cuando se padece una de las enfermedades p (Si /E), o podemos preguntar por la probabilidad de
sufrir alguna de las dos enfermedades cuando se sufre
alguno/s de los síntomas p (E/Si). Los síntomas 2 y 3 son los
“fillers” (de rellenos) que son ensayos que incluimos pero que
no tenemos predicciones acerca de ellos.
En la tarea de aprendizaje, se refiere a la probabilidad de que se den los 4 síntomas suponiendo que
se da la enfermedad. Los síntomas varían en su representatividad.
En el caso de la enfermedad rara, p (Si /R): el síntoma 1 tiene una relación relativamente alta con la
enfermedad rara, es decir, hay una probabilidad de 0,6 de exhibir el síntoma 1 cuando se padece la
enfermedad rara. Sin embargo, el síntoma 4 es menos representativo porque la probabilidad de padecer el
síntoma 4 cuando se tiene la enfermedad rara es 0,2.
Por otro lado, en el caso de la enfermedad común p (Si /C): la probabilidad de padecer el síntoma 1 cuando se
padece la enfermedad común es 0’2, pero, sin embargo, la probabilidad de padecer el síntoma 4 cuando se
padece la enfermedad común es 0’6.
9
Nos importan los síntomas 1 y 4, porque en los síntomas 3 y 4 se han manipulado las probabilidades y hacen
que sean menos representativos de las enfermedades.
Por último:
P(R)= 0.25 la probabilidad de padecer la enfermedad rara (por su resultado es por lo que se hace llamar ‘rara’)
P(C)= 0.75 la probabilidad de padecer la enfermedad común.
En la tarea de juicios preguntamos por los síntomas 1 y 4 en relación a las
dos enfermedades porque son representativos.
o Enfermedad rara. Suponiendo que se padezca la enfermedad rara,
¿hasta qué punto es más o menos probable que se padezca el síntoma 4, en comparación a
padecer el síntoma 1 y 4 a la vez? (hay que tener en cuenta que en la enfermedad rara hemos
visto que el síntoma 4 es poco representativo, y el síntoma 1 muy representativo).
Su respuesta es que es más probable que se padezcan los síntomas 1 y 4.
o Enfermedad común. Nos interesa ver hasta qué punto se considera que es más probable, si
padecer el síntoma 1 en solitario, que los síntomas 1 y 4 a la vez (hay que tener en cuenta que
en la enfermedad común hemos visto que el síntoma 1 es poco representativo, y el síntoma 4
muy representativo).
Su respuesta es que es más probable que se padezcan los síntomas 1 y 4.
Resultados ⮕ En ambos casos, lo que observamos es que los participantes estiman que es menor la
probabilidad de padecer el síntoma poco representativo que la probabilidad de padecer los dos síntomas a la
vez. Esta es la falacia de la conjunción: se cree que la conjunción de los dos síntomas es mayor que los síntomas
por separado.
TEOREMA DE BAYES
p(s1/R) = 0.6 ; p(S1/C) = 0.2
p(R) = 0.25 ; p(C) = 0.75 p(R/S1) = p(C/S1) = 0.5
En realidad, la probabilidad es exactamente la misma: la probabilidad de padecer la enfermedad rara cuando
se tiene el síntoma 1, y la probabilidad de padecer la enfermedad común cuando se tiene el síntoma 1 es la
misma (0’5).
Sin embargo, los participantes no contestan esto, porque ya hemos visto que los modelos normativos dicen
qué es lo que deberíamos contestar, pero no necesariamente lo que contestamos. Los participantes estiman
que es mayor la probabilidad de padecer la enfermedad rara, ya que se basan en las probabilidades vistas en
la tarea de aprendizaje. Se están cometiendo 2 errores: se ignora la tasa base de ocurrencia de la enfermedad
rara y existe una falacia de la inversión.
p(R/S1) > p(C/S1) porque la p(S1/R) = 0.6 [> p(S1/C) = 0.2].
10
El contenido de la tarea de juicios (Tarea 2) se parece a la tarea de aprendizaje (Tarea 1).
La tarea de aprendizaje (Tarea 1) es compleja, ha de realizarse con presión temporal y/o excede la
capacidad de los recursos de procesamiento controlado y procesos cognitivos superiores
(procesamiento Tipo 2). En este caso, el mecanismo asociativo (procesamiento Tipo 1) asegura
automaticidad y libera recursos cognitivos, pero puede dar lugar a errores o sesgos cognitivos.
Condiciones
La tarea de aprendizaje (Tarea 1) es compleja, se realiza con presión temporal y/o excede la capacidad de los
recursos de procesamiento controlado y procesos cognitivos superiores (procesamiento Tipo 2). En este caso,
el mecanismo asociativo (procesamiento Tipo 1) asegura automaticidad y libera recursos cognitivos, pero
puede dar lugar a errores o sesgos cognitivos.
11