Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 2 - Aprendizaje
Tema 2 - Aprendizaje
Los juicios de probabilidad están muy relacionados con la fuerza de nuestras creencias, manejamos la
evidencia disponible para llegar a nuestra creencia, por lo tanto es una manera de evaluar nuestras creencias.
Los juicios están sujetos a sesgos, ya que utilizamos heurísticos para llegar ellos.
Para explicar cómo realizamos juicios de frecuencia o probabilidad existen dos perspectivas, que corresponden
a dos tipos de modelos:
MODELOS NORMATIVOS
Nos dicen cómo deberíamos pensar. Proponen estándares o normas que definen la forma mejor o más
efectiva para alcanzar la meta (explícita) que persigue el sujeto pensante.
Se basan en modelos formales matemáticos, teoría de la probabilidad, estadística, lógica… Sin embargo, los
humanos no actuamos según una racionalidad normativa en la que cumplimos todos los axiomas y dogmas
matemáticos que nos dicen como tenemos que pensar.
MODELOS DESCRIPTIVOS
Se basan en datos que muestran la forma en la que las personas pensamos o emitimos juicios realmente, no
en cómo deberíamos hacerlo. No proponen cómo deberíamos pensar, sino que recogen datos de cómo
pensamos (esta forma de pensar no tiene por qué ser correcta, no es normativa necesariamente).
Se basan en procesos psicológicos, estos modelos proponen que las personas utilizamos heurísticos (atajos
mentales), en lugar de considerar y procesar información sobre frecuencias o probabilidades.
Una de las finalidades del pensamiento es la de ayudarnos en la toma de decisiones (elegir entre diferentes
cursos de acción) o a evaluar creencias.
Para realizar elecciones necesitamos estimar la probabilidad con la que varios eventos pueden llegar a suceder
en el futuro, debemos predecir las consecuencias. A veces sabemos la probabilidad de ocurrencia de las
consecuencias y otras veces no (situación de ambigüedad). La fuerza de nuestras creencias acerca de los
resultados de nuestras acciones tiene un impacto determinante en la toma de decisiones.
Probabilidad: medida numérica de la fuerza de la creencia en una cierta proposición
Proposición: declaración (afirmación o negación) que puede ser verdadera o falsa y referirse al
pasado, presente o futuro.
Juicio de probabilidad: asignación de un número a una creencia, que se supone incluye una evaluación
de la evidencia disponible con respecto a esa creencia (la evidencia no tiene por qué integrarse de
forma normativa, a veces la ignoramos y utilizamos una evidencia “falsa” de esa creencia).
1.2. EVALUANDO CREENCIAS
1.2.1. DOS TIPOS DE ERRORES RELATIVOS A LOS JUICIOS DE PROBABILIDAD
ERROR DE COHERENCIA
ERROR DE CORRESPONDENCIA
¿Cuál de las siguientes afirmaciones es más probable si elegimos a un varón adulto al azar en USA?
a) Muera por homicidio.
b) Muera por suicidio.
Normalmente se escoge la opción a), cuando estadísticamente la tasa de suicidios es mayor a la de homicidios,
y por tanto la respuesta correcta es la b).
Se comete un error en el juicio, pero no se viola ningún principio lógico de probabilidad, sino un error de
correspondencia entre nuestro juicio y lo que objetivamente se conoce que ocurre en el mundo. La creencia
que tenemos sobre este suceso es de mala calidad, porque hay una falta de correspondencia entre esta y lo
que realmente ocurre.
¿Cómo debo incorporar nueva evidencia para modificar mis creencias actuales sobre las causas de
determinados eventos?
Las creencias se mantienen a lo largo del tiempo, pero cuando nos enfrentamos a una nueva evidencia,
debemos actualizar nuestras creencias para incorporar esta nueva evidencia. El Teorema de Bayes nos expone
cómo incorporar esa nueva evidencia para actualizar las creencias.
Tiene un compromiso con la coherencia, porque es un modelo formal normativo que sigue reglas de la
probabilidad, pero nos permite incorporar la cuestión del estado real del mundo a través de la evidencia.
Se sabe que, de 100 mujeres que tienen cáncer de pecho, 99 tienen una mamografía positiva
(sensibilidad de la prueba).
Sin embargo a 5 de cada 100 mujeres que no tienen cáncer de pecho la mamografía le sale positiva
(falso positivo o falsa alarma).
¿Cuál es ahora, después de conocer el resultado de la prueba, y los datos referentes a la misma, la
probabilidad de que la paciente tenga cáncer?
El Teorema de Bayes es un modelo normativo que nos dice cuánto se debe de ajustar (actualizar) la creencia
inicial (normalmente causal) en una determinada hipótesis (H) teniendo en cuenta la nueva evidencia (E).
La creencia final (p(H/E)) integrará la creencia inicial (p(H)) y la nueva evidencia (p(E)).
CREENCIA INICIAL: PROBABILIDAD ANTERIOR p(H): probabilidad de que mi hipótesis sea verdadera
antes de considerar la nueva evidencia. Es lo que ya se sabe, tanto por observaciones anteriores, otras
evidencias, creencias previas… Ejemplo: probabilidad de que el bulto en el pecho sea debido al cáncer
(antes de conocer el resultado de la mamografía). (lo que ya se (observaciones anteriores…)).
NUEVA EVIDENCIA: p(E): es la nueva evidencia de la que existe información previa, por ejemplo,
estudios epidemiológicos (nueva evidencia de la que existe información previa). Se puede dividir en
dos, según apoye o no la hipótesis inicial:
o p(E/H): suponiendo que la hipótesis sea verdadera. Por ejemplo, la mamografía es positiva
porque la paciente tiene cáncer (acierto).
o p(E/noH): suponiendo que es verdadera la hipótesis alternativa (mi hipótesis es falsa). Por
ejemplo, la probabilidad de tener una mamografía positiva sin padecer cáncer (falso positivo).
CREENCIA FINAL: PROBABILIDAD POSTERIOR p(H/E): la probabilidad de que mi hipótesis sea
verdadera teniendo en cuenta la nueva evidencia. Es lo que se quiere conocer. Por ejemplo, mi
paciente tiene cáncer y la mamografía lo confirma (lo que quiero/necesito conocer).
Para estimar el ajuste se debe considerar:
p(E/H) * p(H): probabilidad de que se dé la evidencia si mi hipótesis fuera correcta. Mi paciente tiene
cáncer y la mamografía positiva es debido al cáncer.
p(E/noH) * p(noH): probabilidad de que se dé la evidencia si la hipótesis no fuera correcta (se
consideran las demás alternativas, llamadas noH). Mi paciente no tiene cáncer y la mamografía
positiva es un falso positivo o una falsa alarma.
Se debe calcular hasta qué punto (proporción) la evidencia apoya la hipótesis (a), frente a la totalidad (a y b),
comparando la primera alternativa (a) con la suma de todas las alternativas (incluida mi hipótesis), es decir
[(a)/(a+b)].
Errores normativos
FALACIA DE LA INVERSIÓN: si nos preguntan que estimemos una probabilidad condicional (p(H/E)),
es complicado, por lo que nos basamos en el valor de (p(E/H). Se invierten los elementos del
condicional. Se da mucho peso a la probabilidad de la evidencia, ya que es un valor muy saliente En
este experimento se sobreestima la probabilidad de que la paciente tenga cáncer, nos centramos en
p(E/H), sobreestimando el riesgo. Se da por supuesto que el paciente tiene cáncer, cuando lo que se
quiere conocer es si lo tiene o no.
IGNORAR LA PROBABILIDAD ANTERIOR O TASA BASE: se cae en el error de ignorar la tasa base (p(H)).
Nos basamos en que el 99% de las mujeres que tienen cáncer tienen mamografía positiva y solo el 0
’05 que tiene una mamografía positiva no tiene cáncer. Al ser valores tan extremos se ignora que la
probabilidad de que el paciente tenga cáncer es de 0 ’001 (después esta aumenta a 0 ’ 02). Si se
considera la tasa base, la probabilidad de que tenga cáncer es 20 veces mayor, pero si no se tiene en
cuenta, podríamos pensar que este valor es pequeño.
FRECUENCIAS NATURALES
Los modelos descriptivos explican cómo las personas realmente emitimos juicios. Estos modelos no presentan
una norma de racionalidad que explique cómo se emiten los juicios, sino que explica cómo cometemos sesgos
cognitivos o errores, cómo procesamos la información y cómo estimamos probabilidades.
2.1. HEURÍSTICOS
Cuando las personas hacemos frente a una decisión complicada o tenemos que emitir juicios en situaciones
complejas, a menudo simplificamos la tarea utilizando heurísticos. Estos heurísticos son reglas generales que
funcionan como un atajo mental, que se dan de forma bastante automática, para llegar a una solución
aproximada a la sugerida por los modelos normativos. Sin embargo, en ocasiones el heurístico conduce a
errores predecibles y sistemáticos, llamados sesgos.
Desde algunas perspectivas, los heurísticos se asocian a los sesgos o ilusiones cognitivas. Y, desde otras (por
ejemplo la de Gigerenzer, que no defiende los procesos duales), los heurísticos son herramientas
seleccionadas evolutivamente para dar respuestas adecuadas en un contexto de incertidumbre (cuando
desconocemos las probabilidades asociadas a distintos eventos o no disponemos de toda la información,
tiempo o capacidad computacional requerida para manejar la información de la que disponemos).
*En este tema se va a estudiar la primera aproximación (heurísticos y sesgos).
Los heurísticos son un procesamiento tipo 1, se realizan de manera intuitiva (sin procesamiento tipo 2, cálculo
ni objetividad).
TIPOS DE HEURÍSTICOS
*EJEMPLO 1
Una población tiene dos hospitales. En el hospital más grande nacen unos 45 bebés cada día, y en el más
pequeño unos 15 bebés cada día. Como se sabe, alrededor del 50 por ciento de los bebés son niños. Pero el
porcentaje exacto varía de día en día. Unas veces puede ser superior al 50 por ciento y otras, inferior.
Para un período de 1 año, cada hospital registra los días en los que más del 60 por ciento de los bebés son
niños. ¿Qué hospital crees que registró más días como estos?
- El hospital grande.
- El hospital pequeño.
- Los dos más o menos lo mismo (es decir, con una diferencia del 5% entre uno y otro).
La respuesta correcta es el hospital más pequeño.
Es más probable que se den sucesos extremos (aquellos inesperados que se debían de la media) en muestras
pequeñas. Si normalmente nacen el 50% de niños y el 50% de niñas, pueden darse pequeñas variaciones
(errores aleatorios) en la media.
Si en general en un hospital nacen más niños/as (porque es más grande), estos pequeños errores se irán
compensando unos con otros. Pero, en muestras pequeñas, como nacen menos niños (número menor de
suceso), es más fácil observar estas desviaciones de la media.
Según la Teoría del Muestreo, los sucesos extremos (altos o bajos), tienden a ocurrir con mayor probabilidad
en muestras pequeñas que en muestras grandes.
Hay veces que pensamos que las desviaciones de la media son igualmente representativas en muestras
grandes y pequeñas, por lo que se produce un error de insensibilidad al tamaño de la muestra, y se elegiría la
opción c (ambos hospitales registraron los mismos días).
*EJEMPLO 2
Genera una secuencia de siete tiradas de una moneda no trucada, donde C es cara y X cruz.
CXCXXCX CXCCCCC
Cuando se pide que se escriba una secuencia aleatoria de una tirada de moneda, sin realmente hacerlo, a
menudo la secuencia realizada es más aleatoria de lo que sería realmente (secuencia de la izquierda). Se
omiten cadenas de tiradas donde aparecen caras o cruces repetidas de forma consecutiva (secuencia de la
derecha). Si se tira una moneda 7 veces, es igual de probable que se dé un patrón que otro, lo cual representa
una concepción errónea.
En ocasiones el heurístico de representatividad lleva a ignorar información relevante como la tasa base de
ocurrencia de un evento (la frecuencia relativa con la que ocurre).
También se puede ignorar la tasa base en situaciones como en el ejemplo del cáncer y el Teorema de Bayes
(se ignora la tasa base de ocurrencia de un fenómeno p(H) y se da mucho peso a p(E/H).
*EJEMPLO
Un panel de psicólogos ha entrevistado y administrado tests personalmente a 30 ingenieros y 70 abogados,
todos con éxito en sus respectivos campos. A continuación, aparece la descripción de uno de ellos:
Juan tiene 45 años, está casado y tiene cuatro hijos. Es en general conservador, cuidadoso y ambicioso. No
muestra interés por cuestiones políticas o temas sociales, y pasa la mayor parte de su tiempo libre ocupado
en alguno de sus muchos hobbies que incluyen carpintería, navegación y rompecabezas matemáticos.
Entonces se pregunta:
- ¿Cuál es la probabilidad de que Juan sea ingeniero?
En esta pregunta los participantes responden una cantidad mayor de lo normal.
- ¿Cuál es la probabilidad de que una persona escogida al azar de esas 100 sea ingeniero?
En esta pregunta los participantes responden 30%.
EXPLICACION PRIMERA RESPUESTA ERRÓNEA
La tasa base de ocurrencia de ser ingeniero es 30/100 (0’3), sin embargo, la mayoría de participantes hacen
un juicio de probabilidad muy elevado, ya que la descripción que se hace de Juan es mucho más representativa
de lo que hace un ingeniero que de lo que hace un abogado.
Kahneman y Tversky explican que los participantes ignoran la información probabilística (procesamiento tipo
2) y se basan en lo que les es representativo, es decir, utilizan el heurístico de representatividad. Se fijan en el
grado en que se parece a lo que sería el estereotipo. Al producirse esa sustitución del atributo, se basan en el
grado en que Juan es representativo de los ingenieros y no atienden al dato estadístico, se ignora la tasa base
de ocurrencia.
El heurístico de disponibilidad es una regla en la que el emisor del juicio o el que toma la decisión “evalúa la
frecuencia de una clase o la probabilidad de un evento por la facilidad con la que ejemplos o (posibles)
ocurrencias acuden a la mente” (Tversky & Kahneman, 1974).
Es un heurístico muy relacionado con la memoria. Por ejemplo, si intentamos recordar ejemplos de una
categoría, y estos vienen a la mente de manera sencilla sin realizar un gran esfuerzo, consideramos que la
categoría es frecuente porque nos ha resultado fácil.
Normalmente el heurístico de disponibilidad trabaja bastante bien, ya que los eventos comunes son más
fáciles de recordar, imaginar o generar (ejemplos) que los no comunes. Sin embargo en ocasiones la regla da
lugar a errores sistemáticos.
Algunos eventos están más disponibles que otros (en memoria) no porque ocurran con mayor probabilidad,
sino porque: han tenido lugar recientemente, es inherentemente más fácil pensar en ellos, tienen un valor
emocional alto, porque son más salientes...
También aunque haya elementos que no tengan mucha saliencia para nosotros, se harán más accesibles por
su frecuencia (por ejemplo la publicidad).
*EJEMPLOS
¿Qué es más probable en EEUU, morir por un tornado, o por un rayo?, ¿por un ataque de un tiburón o la
caída desde el cielo desde un aeroplano?, ¿por diabetes u homicidio? o ¿por cáncer de estómago o
accidente de coche?
Cuando se comparan distintas causas de muerte, es más fácil recordar causas relacionadas con las imágenes
que hayamos podido ver en las noticias de los “destrozos de un tornado”, ya que estas imágenes nos
impactan. Por eso se comete el error de pensar que es más probable morir por un tornado que por un rayo.
También se elige que es más probable morir en un accidente de coche que por cáncer de estómago, cuando
es más probable morir por cáncer de estómago. El hecho de que distorsionemos la estimación de los
sucesos, también tiene consecuencias prácticas.
El heurístico de disponibilidad también produce sesgos cuando los ejemplos de un tipo de eventos son
inherentemente más difíciles de generar que los de otro tipo.
Por ejemplo, Kahneman y Tversky preguntaron si era más frecuente en el idioma inglés la clase de las palabras
que comenzaban por k que las que tenían una k en tercer lugar. A pesar de que existen aproximadamente el
doble de palabras en el segundo caso, los sujetos encontraban más sencillo generar ejemplos de palabras que
empezaban por k, y por tanto juzgaron erróneamente como más frecuente la primera clase de palabras.
2.3. HEURÍSTICO DE ANCLAJE Y AJUSTE
En este heurístico no hay ningún mecanismo establecido, ni un intento de estimar una cantidad numérica a
través de la facilidad de recuerdo.
Este heurístico ocurre que siempre que se realiza un juicio numérico y previamente se ha presentado una
primera cantidad (que puede que esté o no relacionada con la estimación). Este valor numérico previo influye
en la cantidad estimada en una situación posterior (lo usamos como ancla, y luego ajustamos el valor que
tenemos que dar).
*EJEMPLO 1
- Condición 1: se pide que estimemos el resultado de la siguiente operación: 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1
La media de las respuestas es: 2250
-Condición 2: se pide que estimemos el resultado de la siguiente operación: 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8
La media de las respuestas es: 500
Para realizar estas operaciones debemos poner en marcha un procesamiento tipo 2, pero por falta de tiempo
o motivación, utilizamos un heurístico. Ambas respuestas son erróneas, ya que la correcta es 40320, pero en
cada una de las condiciones se han hecho estimaciones diferentes, aun teniendo los mismos números.
En el primer caso el orden de los números de la operación era decreciente (empezaban con los más altos), por
tanto, al empezar a calcularla (8 x 7 x 6…) los números que salen son altos, por lo que estimamos un número
alto.
Sin embargo, en el segundo caso, los números de la operación están en orden creciente (empiezan con los
más bajos), y cuando se empieza a calcular (1 x 2 x 3…) el número que sale es inferior al de la primera condición
son bajos, por lo que ajustamos la respuesta con respecto a este valor bajo y estimamos por lo bajo.
Comenzamos a empezar a multiplicar de manera serial, lo que nos da un valor inicial (ancla) y a partir de este,
estimamos y ajustamos. Al ser distinto el ancla en cada grupo, se ajusta de manera diferente.
*EJEMPLO 2
Imagina que delante de un participante en un estudio hay una ruleta con distintos valores numéricos, como
la del programa La Ruleta de la Fortuna. Después de hacerla girar, aparece el número 65.
Después se le hace la siguiente pregunta: ¿el porcentaje de países africanos representados en las Naciones
Unidas es mayor o menor que 65? Sin conocer el porcentaje exacto, el participante está bastante seguro de
que el porcentaje es menor. A continuación se le pide que estime el porcentaje exacto. Tras pensarlo un rato
da la estimación: 45
Imagina otro participante, y que la tirada inicial de la rueda da como resultado el número 10 en lugar de 65.
Se plantea la misma pregunta, pero en este caso de la siguiente forma: ¿el porcentaje de países africanos
representados en las Naciones Unidas es mayor o menor que 10?
El participante considera que es mayor. Cuando se le pide una estimación exacta el participante responde 25
*EJEMPLO 3
Un trozo de papel de 0.1 milímetros de espesor es doblado por la mitad una y
otra vez. Después de repetir esta operación 100 veces, ¿cuál será su grosor?
Normalmente se da una respuesta de unos pocos metros, cuando la respuesta
correcta es 0.1 * 2 ^100, es decir 1.27*10^29 milímetros.
Parece increíble que un número obtenido por azar (ancla), algo que el participante sabe perfectamente, y que
por tanto no tiene ninguna relación con la pregunta que se plantea, influya de forma tan determinante en el
juicio de probabilidad (o porcentaje). Este procedimiento y resultados promedio fueron descritos por Tversky
y Kahneman (1974).
Desde entonces el efecto se ha demostrado en una variedad de situaciones y contextos, con anclas que no
tienen relación con la cuestión preguntada o que sí la tienen (oferta de precio de una casa, coche…).