Está en la página 1de 9

Modelos de procesamiento multinomial de la monitorización de la

fuente

William H. Batchelder David M. Riefer


School of Social Sciences California State University, San Bernardino
University of California, Irvine

Artículo completo en: Psychological Review, 1990, vol. 97, No. 4, 548-564.

Un paradigma cada vez más popular en la investigación sobre la memoria humana es la


“monitorización de la fuente” (e.g., Eich y Metcalfe, 1989; Lindsay y Johnson, 1989). En un
experimento sobre monitorización de la fuente (MF) los sujetos estudian ítems de dos o más
fuentes diferentes. Por ejemplo, las fuentes podrían ser diferentes puntos de origen de los
ítems (v.g., auto generados o generados por el experimentador, o Lista1 vs. Lista 2). Otra
posibilidad implica ítems que proceden de un único punto espacial pero que difieren en algún
atributo fundamental (v.g., lenguaje o modalidad de input). Una vez que estos ítems han sido
estudiados por los participantes en la fase de estudio, se deja pasar un tiempo para evitar
efectos de recencia y, a continuación, se pasa un test de memoria de reconocimiento para
evaluar la habilidad de detectar ítems viejos (es decir, aquellos presentados previamente) de
ítems nuevos o no presentados previamente (estímulos distractores o nuevos) por un lado y la
habilidad de discriminar la fuente o atributo de los ítems viejos que han sido detectados por
otro.
El trabajo inicial realizado utilizando el paradigma de la MF se interesó por la capacidad
de los sujetos para retener rasgos incidentales de los ítems. Esta investigación mostró que la
discriminación de la fuente fue muy precisa para varios tipos de información incidental, tal
como el tipo de fuente de letra en el que habían sido presentados los ítems de estudio (Arial,
Colibrí, Times New Roman, etc.), el género de la voz cuando la presentación de los ítems fue
auditiva (masculina vs. femenina), o la modalidad del input (v.g., visual vs. auditiva). Este
trabajo se interesó principalmente en el tema de qué atributos de un ítem son codificados en
la memoria a largo plazo y el grado de esfuerzo requerido para codificar estos atributos en la
memoria.
En la década de 1980, la monitorización de realidad emergió como un paradigma
importante en la investigación en memoria. La monitorización de la realidad (MR) es un caso
especial de monitorización de la fuente en donde los sujetos intentan diferenciar entre
memorias de objetos reales e imaginados. Por ejemplo, se podía presentar una lista de
palabras en la que la mitad de los ítems se acompañaban por un dibujo que mostraba la
palabra y en la otra mitad venían acompañados por una instrucción para que el sujeto se
imaginara un dibujo que mostrara la palabra. El paradigma de MR se ha convertido en una
herramienta estándar en varias áreas de la Psicología y ha mostrado que poblaciones de
sujetos particulares pueden tener deteriorada su capacidad para discriminar entre atributos
percibidos e imaginados de un ítem independientemente de su habilidad para detectar ítems
viejos de nuevos. Estudios en esta área han mostrado que los niños pequeños pueden
confundir ciertas fuentes más que los niños mayores, que los esquizofrénicos parecen mostrar
un deterioro en la discriminación de la fuente y que las personas de edad avanzada o con
enfermedades relacionadas con la edad pueden tener más problemas en la discriminación de
la fuente que en la detección de ítems.
Por los estudios mencionados debería ser evidente que los experimentos de
monitorización de la fuente intentan examinar dos diferentes tipos de memoria: memoria de
reconocimiento para ítems viejos y memoria para la fuente de esos ítems. Sin embargo, hemos
revisado más de 50 artículos que utilizan el paradigma de monitorización de la fuente y hemos
encontrado que no hay una medida generalmente aceptada de estas cantidades. En vez de
ello, se han adoptado varios estadísticos ad hoc para separar la discriminabilidad de la fuente
de la detectabilidad global de los ítems viejos (v.g., la puntuación gamma de Kruskal-Wallis,
Aciertos menos Falsas Alarmas para la identificación de la fuente o puntuaciones de la
identificación del origen).
Además, ninguno de los estudios que hemos revisado incluye un modelo sustantivo
para analizar sus datos. La falta de un modelo matemático para el análisis de la monitorización
de la fuente es desafortunada debido a que la medición separada de la detección del ítem, por
un lado, de la discriminación de la fuente por otro, así como los diversos sesgos de juicio es
incluso más complicada que la medición separada de la fuerza de reconocimiento, por un lado,
del sesgo de respuesta por otro en los paradigmas usuales de memoria de reconocimiento.
Esto es cierto ya que el paradigma de reconocimiento Si-No (en este paradigma la respuesta
del sujeto ante cada estímulo de la fase de test es Si o No, es decir, “Sí, el estímulo se presentó
previamente” o “No, el estímulo no se presentó antes”) es un caso especial del paradigma de la
monitorización de la fuente en donde hay solo una fuente. La práctica estándar en el campo de
la memoria es analizar los datos de memoria de reconocimiento Si-No mediante los modelos
matemáticos basados en los principios de la Detección de Señales (Signal Detection Theory o
SDT). Creemos que el área de la monitorización de la fuente podría beneficiarse notablemente
de un tratamiento similar.
Recientemente, Riefer y Batchelder (1988) presentaron una discusión detallada de una
clase de modelos matemáticos conocidos como modelos multinomiales que pueden utilizarse
para medir procesos cognitivos. El paradigma de MF está adaptado muy bien para el modelado
multinomial con estructuras de procesamiento en forma de árbol. El objetivo de un modelo
multinomial (MM) de monitorización de la fuente es proporcionar una parametrización
psicológicamente interpretable de la estructura de probabilidad del espacio muestral de este
paradigma. De esta forma, la medida apropiada y la comparación de varias capacidades
cognitivas en la monitorización de la fuente puede lograrse estimando los parámetros del
modelo y planteando tests de hipótesis de estos parámetros para diversas condiciones.

Modelos multinomiales de monitorización de la fuente

En un experimento de monitorización de la fuente con dos fuentes, A y B, el test de


memoria último consiste en mezclar aleatoriamente ítems viejos A y B junto con nuevos ítems
(ítems no presentados en la fase de estudio, es decir, distractores o nuevos), a los que
llamaremos N. Al sujeto se le pide que clasifique cada ítem como A, B o N. Los datos de un
sujeto individual pueden describirse completamente por una tabla de frecuencia T:
donde 𝑌𝑖𝑗 es la frecuencia de la repuesta j a ítems del tipo i. La frecuencia marginal 𝑌𝑖 = 𝑌𝑖1 +
𝑌𝑖2 + 𝑌𝑖3 es el número total de ítems del tipo i existentes en el test de memoria. Usualmente
𝑌1 = 𝑌2 y 𝑌3 = 𝑌1 + 𝑌2 .
Antes de comenzar a definir y analizar una familia anidada de modelos para la
monitorización de la fuente es instructivo considerar algunos de los problemas potenciales de
las aproximaciones tradicionales. Los métodos más utilizados de análisis de datos es calcular
tres medidas para cada sujeto: éxitos (H), falsas alarmas (F) y puntuaciones de origen de
identificación (I) que, definidos en términos de la Tabla 1, son:

Normalmente se aplican tests estadísticos separados (entre grupos) para cada una de
estas medidas.
Debemos realizar varias observaciones sobre la aproximación al análisis de datos
presentado por los estadísticos H, F e I. En primer lugar, los estadísticos combinan datos de
diversas fuentes y esto puede enmascarar la detectabilidad diferencial y la discriminabilidad de
cada fuente. Algunos autores responden a esta crítica calculando puntuaciones I
separadamente para cada fuente, esto es, trabajan con dos puntuaciones I:
para cada i = 1, 2.
En segundo lugar, si la variable “fuente” se ignora, entonces H y F representan las
medidas usuales de Aciertos y Falsas Alarmas en una tarea de memoria de reconocimiento
Si/No. Está bien documentado que el análisis separado (entre grupos) de los aciertos y las
falsas alarmas puede llevar a una visión errónea de la memoria de reconocimiento. Es por ello
que durante décadas la práctica estándar ha sido combinar los éxitos y las falsas alarmas en un
único estadístico que mide la detectabilidad del ítem (v.g., d’ de la Teoría de Detección de
Señales o su simple diferencia, es decir H-F).
Una tercera observación es que el índice I puede interpretarse como una estimación
de la probabilidad condicional de una identificación de la fuente correcta dado que el ítem se
informó (correctamente) como viejo. Mientras que el estadístico I tiene cierta validez para
medir la discriminabilidad de la fuente, se ha demostrado que estadísticos superficiales tales
como I pueden reflejar los efectos combinados de diferentes procesos cognitivos. Por
consiguiente, estos tipos de estadísticos pueden ser difíciles de interpretar y en algunas
circunstancias incluso pueden llevar a conclusiones erróneas. En definitiva, sin un modelo
sustantivo no hay una forma racional de eliminar del estadístico I de aquellos factores
contaminantes que le pueden afectar (por ejemplo, los sesgos de respuesta o guessing).

Modelos de árboles de procesamiento

Un modelo de MF debería proporcionar una forma de medir separadamente la


detectabilidad global de los ítems viejos (con respecto a los nuevos) de la capacidad para
discriminar la fuente de los ítems. Los modelos basados en los principios de la detección de
señales han facilitado el análisis de los paradigmas de la memoria de reconocimiento y, por
ello, nuestro objetivo en esta sección es ampliar estos modelos a la monitorización de la
fuente.
La monitorización de la fuente es análoga a la tarea de detección de señales Si/No
excepto que la señal es una de dos fuentes de ítems. Por ejemplo, en la detección auditiva, las
señales podrían ser dos frecuencias a niveles de energía diferentes (diferentes intensidades).
En este caso, la capacidad para detectar la señal podría realizarse únicamente mediante un
detector de energía mientras que la capacidad para discriminar la frecuencia podría implicar
algún tipo de detector de frecuencia. En interés de la simplicidad, decidimos construir nuestros
modelos de MF en versiones de umbral-alto de los modelos de la detección de señales.
Nuestro modelo multinomial para la MF se presenta en la Figura 1. Aquí se muestran
los modelos de árboles de procesamiento separadamente para los ítems de la fuente A, los
ítems de la fuente B y los distractores. El modelo asume que las respuestas de los sujetos a los
ítems en una tarea de monitorización de la fuente son una función de tres procesos cognitivos
hipotéticos: detección estimular, discriminación de la fuente y varios sesgos de respuesta.
Figura 1
En la figura se muestran los diagramas de árbol para cada fuente (A, B y N). Cada bifurcación
representa una decisión basada en los procesos de reconocimiento del ítem, reconocimiento
de la fuente y posibles sesgos o inconsistencia en el juicio. El resultado final es la respuesta del
sujeto que sólo puede ser A, B o N en función de los pasos previos.

Detección estimular

En los ensayos de la fase de test de un experimento de memoria se asume que el ítem


se detecta bien como un ítem presentado en la fase de estudio (viejo) y, por lo tanto,
almacenado en la memoria, o no se detecta. Definamos D1 y D2 como las probabilidades de
detección correcta para ítems viejos A y B, respetivamente. Los valores de D1 y D2 pueden
diferir para cada fuente ya que los factores experimentales pueden crear diferentes tasas de
detección. Es por eso que en la Figura 1 se han mostrado en dos diagramas de árbol separados.

Discriminación de la fuente

Condicionado a que un ítem haya sido correctamente detectado como viejo, el sujeto
o bien es capaz de identificar correctamente la fuente de ese ítem o no es capaz de ello.
Definamos d1 y d2 como las probabilidades de discriminar la fuente de ítems detectados A y B,
respectivamente. De nuevo, estos parámetros pueden diferir para una fuente u otra y por ello
se mantienen separados en árboles de procesamiento diferentes y, por ello, con símbolos
diferenciados.

Sesgos de respuesta

Los restantes parámetros son parámetros que denotan varios sesgos de respuesta. El
parámetro b es la probabilidad de responder “viejo” a un ítem no detectado como viejo.
Cuando un ítem es detectado pero la fuente no se puede discriminar (con probabilidad Di (1-
di)), entonces el parámetro a representa la probabilidad de adivinar que el ítem pertenece a la
fuente A. El parámetro g también es la probabilidad de adivinar que un ítem pertenece a la
fuente A pero para ítems no detectados que el sujeto ha “supuesto” o adivinado que son
viejos. En el caso general, permitimos la posibilidad de que los parámetros a y g puedan diferir
ya que en términos psicológicos se podría sesgar los ítems detectados y los no detectados de
manera diferente.
Hay dos rasgos obvios en el modelo de la Figura 1 que son importantes. En primer
lugar, los parámetros individuales son probabilidades condicionales que se corresponden con
los vínculos en los árboles y se producen en más de un lugar en los árboles. En segundo lugar,
a menudo hay varias ramas en los árboles que se combinan en la misma categoría observable.
Así, por ejemplo, en el árbol para los ítems de la fuente A, se puede responder A desde tres
ramas diferentes:

- D1 → d1 → A
- D1 → 1-d1 → a → A
- 1-Dd → b → g → A

De hecho, hay 15 ramas en el modelo de la Figura 1 que se combinan en los 9 eventos


observables Eij correspondiente a las frecuencias Yij de la Tabla T. Es fácil desarrollar
ecuaciones para las probabilidades de cada Eij simplemente sumando las probabilidades de las
ramas sobre cada clase. Estas ecuaciones son, para los ítems de la fuente A:

Para los ítems de la fuente B:

Y para los distractores:

El modelo de la Figura 1 tiene un total de 7 parámetros en el espacio paramétrico:

Ω7 = {< 𝐷1 , 𝐷2 , 𝑑1 , 𝑑2 , 𝑏, 𝑎, 𝑔 >}

en donde cada parámetro es una probabilidad que mide alguna capacidad de procesamiento.
Debido a que el modelo general de las ecuaciones implica sólo 6 grados de libertad (los 9
valores de la tabla T en la población menos 2 grados de libertad ya que para cada fuente deben
cumplirse dos restricciones:
1ª) que los valores de los parámetros, al ser probabilidades, deben situarse entre 0 y 1,
y
2ª) la suma de estos tres valores debe ser igual a la unidad
pero disponemos de 7 parámetros, resulta que el modelo técnicamente no es identificable.
Esto significa que un conjunto de valores numéricos para las probabilidades de la
matriz T puede ser generado, no a través de un único conjunto sino a través de múltiples
conjuntos de parámetros en Ω7 . Esto complica el análisis del modelo ya que los métodos
clásicos de estimación de parámetros y de prueba de hipótesis (v.g., máxima verosimilitud o X2
mínimo) pueden no producir una estimación única de los parámetros. Una forma de solventar
el problema de la falta de identificabilidad para el modelo Ω7 es adoptar una perspectiva
Bayesiana. Una segunda forma de manejar el problema de la no identificabilidad es considerar
casos especiales de Ω7 imponiendo restricciones sobre los parámetros. Hay tres tipos de
restricciones en el modelo actual que son de interés psicológico: a) Asumir que los parámetros
de detección son iguales, es decir, D1 = D2; b) Asumir que los parámetros de discriminación son
iguales, es decir, d1 = d2; c) asumir que las tasas de sesgo son iguales, es decir, a = g.
Combinando la presencia o ausencia de cada restricción independientemente, esto crea ocho
posibles modelos que se presentan en la Figura 2.

Figura 2
El modelo en lo alto de la Figura 2 es el modelo de 7 parámetros original. La segunda
fila de la Figura 2 presenta tres modelos, cada uno con 6 parámetros. El modelo 6a simplifica el
modelo general imponiendo la restricción de que D1 = D2. El modelo 6b exige d1 = d2 y el
modelo 6c exige que a = g. En la siguiente fila hay versiones de 5 parámetros del modelo, cada
una con dos de las restricciones previas (v.g., el modelo 5a agrupa las restricciones de los
modelos 6a y 6b). Por último, la versión del modelo en la parte inferior de la Figura 2 es un
modelo de 4 parámetros que resulta de imponer todas las restricciones.
Desde un punto de vista estadístico, la Figura 2 representa una jerarquía anidada de
árboles de procesamiento para la monitorización de la fuente, cada uno de los cuales se
corresponde con un modelo multinomial para la estructura de datos de T.
Cada uno de los modelos de la Figura 2 impone alguna restricción probabilística sobre
las 9 probabilidades que caracterizan el modelo general. Algunas de estas restricciones son
restricciones de desigualdad. Desafortunadamente, estas restricciones no producen una
disminución en el número de parámetros funcionalmente independientes, es decir, no hay una
reducción en el número de grados de libertad. Un ejemplo familiar de una restricción de este
tipo que no produce disminución de los grados de libertad es imponer la condición de que la
probabilidad de aciertos no sea menor que la probabilidad de falsas alarmas en la mayor parte
de los modelos de detección de señales Si/No, es decir que
𝑃(𝐴) ≥ 𝑃(𝐹)
Otras restricciones implican igualdades entre algunas probabilidades del modelo
general. Estas, normalmente, sí resultan en una reducción en el número de variables
independientes y, por ello, en una reducción del número de grados de libertad. Un ejemplo
familiar de tales restricciones es la regla de las razones constantes de Luce para modelos
probabilísticos.

Análisis de las medidas tradicionales mediante el modelo multinomial

Los problemas con las aproximaciones estadísticas tradicionales a los datos de MF


pueden verse ahora dramáticamente en términos de los modelos sustantivos de la Figura 2.
Por ejemplo, si asumimos que el modelo Ω7 es cierto, entonces la medida I vendrá dada por:

Esta expresión muestra que I depende de los 7 parámetros de Ω7 , en vez de solo d1 o d2, que
son los parámetros reales de discriminación de la fuente en el modelo.

Incluso en el caso extremo en que impongamos restricciones D1 = D2, d1 = d2 y g = a =


½, obtenemos una expresión para I en términos de los tres parámetros restantes:

𝐷(1 − 𝑏 + 𝑑) + 𝑏
𝐼=
2(𝐷(1 − 𝑏) + 𝑏)
Esta ecuación muestra que I depende sistemáticamente de los tres parámetros del
modelo. De hecho, simples cálculos con derivadas parciales muestran que I se incrementa
uniformemente con d, como se desea; sin embargo, también se incrementa uniformemente
con D y decrece uniformemente con b. Esto muestra que el estadístico I depende del nivel de
reconocimiento global. Por ello que el estadístico I no es una buena medida de discriminación
de la fuente excepto en el caso improbable de que los grupos que se comparen estén
igualados en el resto de capacidades de procesamiento. De otra forma, podría cambiar
sistemáticamente entre grupos sin que realmente cambie la capacidad de discriminación de la
fuente.
Debido a estos problemas potenciales con los estadísticos empíricos o superficiales,
recomendamos a cualquiera que realiza investigación en monitorización de la fuente que se
utilice algún tipo de modelo de árbol de procesamiento, al menos, como suplemento a las
medidas empíricas tradicionales. Para decirlo de forma sucinta, simplemente no hay una forma
a-teórica de interpretar los datos sobre monitorización de la fuente. Además, hay buenas
razones teóricas para dudar sobre la validez de un análisis basado en las medidas tradicionales.

Preguntas:

1.- Busque y defina qué es una distribución de probabilidad multinomial.

2.- Busque y explique en qué consiste la Teoría de Detección de Señales y cómo se aplica al
reconocimiento de ítems.

3.- A partir de lo leído ¿cómo definiría un estadístico superficial?

4.- Explique en términos procesuales el árbol de procesamiento para los ítems A y para los
ítems nuevos.

5.- Búsquese en el tema 6 el concepto de identificabilidad y discútase en relación a la no


identificabilidad de Ω7 .

6.- ¿Qué es una restricción de desigualdad? ¿Cree que la restricción de desigualdad que se ha
puesto como ejemplo en el texto es psicológicamente razonable?

7.- ¿Qué aspecto de este resumen sobre los árboles de procesamiento le ha resultado más
impactante o sorprendente?

8.- Busque y explique en qué consiste la regla de las razones constantes de Luce.

También podría gustarte