Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1152 Compendio de pruebas neuropsicológicas
intrínseca a varias medidas neuropsicológicas convencionales que por pruebas primero debe considerar la posibilidad de que estos reflejen déficits cognitivos
estándar de validez de síntomas, las cuales, con pocas excepciones, se de buena fe; las puntuaciones bajas pueden ocurrir en personas con bajo
presentan como pruebas de memoria (ver discusión posterior). Además, los coeficiente intelectual o trastornos neurológicos o psiquiátricos graves (p. ej.,
estudios analógicos han demostrado que las pruebas especiales (p. ej., las Greiffenstein et al., 1994, 1996).
pruebas de validez de los síntomas) no tienen una sensibilidad perfecta y, por Debido a que las personas pueden ser selectivas en qué dominios eligen
lo tanto, siempre pasarán por alto algunos simuladores. Además, dada la fácil fingir o mejorar las quejas (p. ej., memoria, conteo, lectura), existen pruebas
disponibilidad de la literatura neuropsicológica para el público en general (así como la prueba b y el conteo de puntos para capturar estos diferentes enfoques
como para los abogados), los demandantes pueden reconocer los para la magnificación de los síntomas. Aunque la especificidad tiende a ser
procedimientos estándar de elección forzada y evadir su detección. Finalmente, alta para estas tareas, carecen de la sensibilidad adecuada. Por lo tanto, los
como señaló Bernard et al (1993), el desarrollo de controles de validez en hallazgos positivos sugieren SOP, pero el uso de estas tareas de forma aislada
instrumentos neuropsicológicos permite al médico hacer inferencias sobre la dará como resultado altas tasas de falsos negativos. También es importante
vulnerabilidad de las otras pruebas utilizadas en el examen. Teniendo en cuenta señalar que, aunque tienen una buena especificidad, en las prácticas donde las
estas cuestiones, siempre que sea posible realizar un examen en el contexto tasas base de simulación son inferiores al 30 %, el riesgo de resultados falsos
de incentivos para simular o SOP, los médicos deben hacer uso de todos los positivos es alto con estas pruebas. Por tanto, se anima al clínico a complementar
índices bien validados de SOP derivados de las medidas convencionales que estas tareas con otras, en particular con procedimientos de elección forzada.
emplean.
Sin embargo, es importante tener en cuenta que la mayoría de los índices
SOP se han desarrollado para su uso con adultos jóvenes y con el propósito de
Pruebas de validez de síntomas
evaluar el desempeño de las personas con lesiones traumáticas en la cabeza
(que son predominantemente hombres adultos jóvenes). Su uso con personas El segundo tipo de tarea consiste en pruebas de elección forzada y se basa en
fuera de este rango de edad (p. ej., muy jóvenes o muy mayores) o con quienes un análisis probabilístico del desempeño del paciente (Pankratz, 1979). La
se quejan de otras afecciones (p. ej., dolor crónico, depresión, trastornos técnica se usa con mayor frecuencia para evaluar quejas sobre la memoria,
relacionados con el estrés) se ha estudiado relativamente menos y debe pero también se puede usar con otros síntomas (p. ej., sensoriales). La mayoría
llevarse a cabo con la debida precaución. En términos más generales, todas de las pruebas utilizan un formato de respuesta de dos opciones.
las medidas psicométricas de SOP están inherentemente limitadas en el sentido Por ejemplo, en las pruebas de reconocimiento de dos opciones, la probabilidad
de que, si bien pueden detectar de manera confiable el bajo rendimiento, no de responder correctamente en todos los ítems solo por casualidad (es decir,
pueden usarse de forma aislada para diagnosticar la simulación. Tal diagnóstico adivinar) es del 50%. Por lo tanto, el rendimiento general debería aproximarse
requiere la integración de múltiples tipos de información más allá de los al 50 % en los casos más graves de deterioro de la memoria.
puntajes de las pruebas y la consideración completa de las condiciones o Suponiendo respuestas aleatorias a un número dado de ítems de dos opciones,
factores de exclusión (Slick, et al., 1999). se pueden calcular los intervalos de confianza para el desempeño a nivel de
probabilidad. Se supone que las puntuaciones dentro del intervalo de confianza
sobre el rendimiento del nivel de probabilidad reflejan una deficiencia grave o
posiblemente una exageración de las deficiencias. Es muy poco probable que
PRUEBAS ESPECIALMENTE DISEÑADAS las puntuaciones altas o bajas que están fuera de este amplio intervalo de
confianza se den por casualidad. Se supone que tales puntuaciones son el
Se han ideado varias pruebas específicamente para detectar SOP (cuadro 164). producto de una selección intencionada de respuestas correctas o incorrectas
Estos son generalmente de dos tipos. Un tipo se basa en la producción de (en cualquier caso dependiendo de la memoria intacta), siendo esta última
errores que son atípicos para personas con déficits cognitivos genuinos (p. ej., sugestiva de déficits de memoria exagerados o fingidos.
recuerdo incorrecto de conjuntos de caracteres, lectura de letras incorrectas, Debido a que los estudios han demostrado que las personas sospechosas de
conteo de puntos incorrecto). fingir una lesión en la cabeza de leve a moderada (el tipo de caso que es más
Por lo general, emplean tareas que están diseñadas para parecer válidas como probable que se vea en un litigio) a menudo se desempeñan por encima de los
medidas de la capacidad cognitiva, pero que son muy fáciles, por lo que, niveles de probabilidad, la confianza en los límites derivados de la probabilidad
presumiblemente, los pacientes con incluso déficits neuropsicológicos da como resultado decisiones muy conservadoras. Al evaluar a los no litigantes
significativos pueden desempeñarse perfectamente o casi perfectamente con déficits cognitivos significativos (incluido el deterioro profundo de la
(Larrabee, 2005), aunque esta suposición, por supuesto, requiere validación. memoria), los investigadores también han proporcionado puntajes de corte con
El test de 15 ítems de Rey es una de las medidas de este tipo más utilizadas base empírica para mejorar la sensibilidad de estas medidas mientras mantienen
(Slick et al., 2004), a pesar de que es sensible al deterioro cognitivo genuino y los niveles mínimos adecuados.
no suficientemente sensible al SOP. El bajo costo, la disponibilidad inmediata y Existe evidencia que sugiere que estas técnicas especiales, particularmente
la facilidad de administración probablemente explican su popularidad. La las pruebas de validez de síntomas de elección forzada, logran las mejores
prueba no se debe usar de forma aislada y, si se administra, se debe dar al tasas de éxito para la detección de SOP (p. ej., Greiffenstein et al., 1994; Strauss
principio del examen, antes de que el cliente se vea expuesto a pruebas más et al., 2002; Vickery et al., 2001). ; Williamson et al., 2003), aunque, en el caso
difíciles que revelarían la simplicidad de la medida en comparación (Iverson y de las medidas de elección forzada, este es siempre el caso cuando se emplean
Franzen, 1996). . Si se producen puntuaciones bajas en el rango SOP en la límites normativos en lugar de límites por debajo del azar. Considerando las
tarea, los médicos pruebas que se muestran en la Tabla 164, el TOMM parece ser más útil
Machine Translated by Google
Cuadro 164 Algunas características de las pruebas de validez de síntomas
Administración
Medida Rango de edad Tiempo (min) Comentario Precaución
mínimo; desconocido si está psicosis aguda; en prácticas donde la tasa base
contaminado por trastornos de aprendizaje más severos. de simulación es inferior al 30%, el riesgo de
Sensibilidad moderada, alta especificidad falsos positivos es alto
Sensibilidad moderada, alta especificidad. en prácticas donde la tasa base de
simulación es inferior al 30%, el riesgo de falsos
positivos es alto
deterioro cognitivo o trastorno psiquiátrico y en
niños pequeños
culturales, la depresión, la ansiedad y el dolor demencia a severa o moderada
tienen poco impacto en las retraso mental
puntuaciones; el rendimiento es relativamente
insensible al deterioro cognitivo; la especificidad
es alta, pero otras tareas computarizadas
(VSVT, WMT) muestran una mayor
sensibilidad.
sofisticación con síntomas de lesión en la eficaces que las puntuaciones de latencia
cabeza tienen poco impacto en la precisión;
más sensible que el
TOMM y se compara favorablemente con
el WMT
TOMM y tiene mejor validez nominal que
TOMM y VSVT; único en que la prueba mide
tanto el esfuerzo
y memoria
1153
Machine Translated by Google
1154 Compendio de pruebas neuropsicológicas
que pruebas como las pruebas Rey 15Item y 21Item; sin embargo, MÚLTIPLES MEDIDAS
puede ser redundante cuando se usa con otras pruebas de validez
de síntomas como la WMT y la VSVT, que tienen una mejor Como se señaló anteriormente, se puede tener mayor confianza en
sensibilidad (Gervais et al., 2004; Tan et al., 2002), al menos cuando las decisiones de diagnóstico relacionadas con SOP cuando se
se administra la TOMM. cara a cara por un examinador. Es posible emplean múltiples medidas en el contexto de un marco de diagnóstico
que la administración informática de las tareas, como suele ser el lógico y completo. Tal enfoque está respaldado por una base
caso del VSVT y el WMT, aumente su sensibilidad. Es decir, puede estadística, particularmente en lo que respecta a una mayor
ser menos amenazante dar respuestas incorrectas cuando se prueba especificidad. Por ejemplo, Larrabee (2003) examinó a litigantes con
con una computadora que con un experimentador (Bolan et al., evidencia definitiva de simulación y pacientes con TCE moderada o
2002). Alternativamente, las personas pueden sentirse reacias a grave en cinco pruebas: Benton Form Discrimination, Finger Taping,
fingir déficits de memoria no verbal (imagen) en lugar de verbal Reliable Digit Span, WCST FMS y LeesHaley FBS from the MMPI2.
(palabra). No obstante, el TOMM puede ser el instrumento de elección La sensibilidad y la especificidad de las pruebas individuales en
cuando uno se enfrenta a clientes que son de otra cultura (p. ej., de puntajes de corte específicos oscilaron entre .40 (sensibilidad para
un país que no habla inglés), que tienen trastornos significativos de toqueteo con los dedos) y .935 (especificidad para toqueteo con los
la lectura (p. ej., un nivel de lectura inferior al grado 3). ), o que son dedos y rango de dígitos confiable). La evaluación de todas las
niños pequeños (p. ej., menores de 10 u 11 años). posibles combinaciones por pares de puntajes que excedieron el
límite (p. ej., FBS y FMS, FT y RDS) dio como resultado una
Las buenas medidas del estado motivacional deberían ser sensibilidad de .875 y una especificidad de .889. La evaluación de
relativamente insensibles al deterioro real. La evidencia disponible todas las posibles combinaciones de tres vías (es decir, tres pruebas
sugiere que las pruebas como TOMM, VSVT y WMT son relativamente fallidas) dio como resultado una sensibilidad de 0,54 (más alta que
fáciles, incluso para personas con un deterioro neurológico importante las sensibilidades individuales de Discriminación visual de formas,
(p. ej., pacientes con traumatismo craneoencefálico de moderado a Toque de dedos, Intervalo de dígitos confiable y FMS) y una
grave). La evidencia adicional de que estas pruebas evalúan el especificidad de 100% (es decir, sin falsos positivos), un valor mejor que el lograd
esfuerzo en lugar de la habilidad proviene del hallazgo de que una Resultados similares fueron reportados por Vickery et al. (2004),
variedad de factores, como la edad, la baja educación, la depresión, quienes utilizaron un diseño de simulación en el que controles sanos
la ansiedad y el dolor, generalmente no afectan los puntajes en estas pruebas.
y personas con TBI moderado/grave completaron tres pruebas de
Por lo tanto, las puntuaciones bajas no deben atribuirse a estas validez de síntomas (Memoria de dígitos, Memoria de letras y TOMM)
condiciones. bajo instrucciones estándar y de simulación. La sensibilidad disminuyó
Es importante reconocer que las pruebas de validez de los con criterios cada vez más estrictos (es decir, un número creciente de
síntomas, como todas las medidas de SOP, en el mejor de los casos pruebas fallidas), mientras que la especificidad aumentó. La
solo pueden indicar que otros factores además del deterioro cognitivo especificidad perfecta se logró en tres o más pruebas fallidas, el
pueden estar influyendo en el desempeño de un cliente. Para descartar mismo resultado que el informado por Larrabee (2003). Los sujetos
falsos positivos, los médicos deben considerar no solo las puntuaciones con tres o más pruebas fallidas tuvieron una precisión predictiva
en las diversas tareas de validez de los síntomas, sino también el positiva del 100 % independientemente de la tasa base (15 %, 40 %
desempeño en las otras pruebas, así como los datos clínicos, para o 50 %). La inspección de los datos de PPA y NPP a varias tasas
garantizar que el patrón tenga sentido neuropsicológico (consulte los base (consulte la Tabla 165) indica que, en entornos de tasa base
criterios enumerados en Slick et al. , 1999 y reproducido en el cuadro baja (15%), la PPN suele ser alta y la PPA es más baja. Por lo tanto,
161). También es importante tener en cuenta que las puntuaciones en configuraciones de tasa base baja, puede ser apropiado un umbral
que se encuentran dentro del rango normal en estas pruebas no más conservador para predecir la simulación, como exigir que tres o
descartan un defecto motivacional. Por ejemplo, el individuo puede más indicadores fallen. Por el contrario, en entornos donde la tasa
haber estado fingiendo síntomas que percibe como no relacionados base es alta (p. ej., 50 %), el uso de criterios conservadores para
con el desempeño en estas pruebas (p. ej., déficit motor o sensorial). predecir la simulación, como el fracaso en tres o más indicadores,
Cuadro 165 Datos de tasas de clasificación que requieren el fracaso de un número creciente de pruebas de validez de síntomas para identificar la simulación por
tasa base
Número de pruebas fallidas Sensibilidad especificidad Tasa de aciertos PPA central nuclear PPA central nuclear PPA central nuclear
Nota: PPP = Poder Predictivo Positivo; NPP = Poder predictivo negativo.
Fuente: De Vickery et al., 2004, con permiso de Elsevier.
Machine Translated by Google
Evaluación del sesgo de respuesta y el rendimiento subóptimo 1155
daría como resultado una PPP alta (100 %) pero una NPP inaceptablemente mejor tasa de aciertos en una sola sesión de prueba. Además, la
baja (59,4 % en el estudio de Vickery et al. [2004]). Vickery et al. (2004) inconsistencia de la respuesta en la tarea de elección forzada entre las
sugirieron que los criterios más liberales pueden ser apropiados en entornos sesiones de prueba contribuyó de manera única a la precisión de la
de tasa base alta. predicción. Los autores recomendaron que los médicos consideraran
El hallazgo de una mayor especificidad cuando se agregan los datos cambios de 3 o más puntos hacia arriba o hacia abajo en los ítems fáciles
de múltiples medidas refleja la rareza de múltiples puntajes de prueba en el generales del VSVT como un aumento del índice de sospecha. Esta
rango subóptimo en pacientes verdaderamente deteriorados. Es decir, sugerencia se basó en la observación de que ninguno de los controles con
aunque un examinado puede obtener en raras ocasiones una puntuación traumatismo craneoencefálico obtuvo desviaciones de 3 o más puntos en
de "suspenso" en una medida SOP, es poco probable que obtenga los ítems fáciles. Un hallazgo importante aquí es que cualquier inconsistencia
puntuaciones en dos o más medidas en este rango (Larrabee, 2005). entre las evaluaciones que podría estar asociada con una lesión en la
La especificidad normalmente se establece en 0,90 para minimizar los cabeza (p. ej., Bleiberg et al., 1997; Burton et al., 2002; Stuss et al., 1994,
falsos positivos. Usando el Slick et al. (1999) para el sesgo de respuesta 1999) parece diferir de la observada en tareas tan simples en el contexto de
probable, la probabilidad de una puntuación de falso positivo para dos SOP. Finalmente, vale la pena señalar que se incorporó una evaluación
indicadores que excedan el límite, cada uno con una especificidad de .90 y de la consistencia dentro de la prueba en una de las tareas de validez de
con poca correlación entre las dos pruebas en una muestra clínica no síntomas, la WMT. Índices similares también están disponibles para el
litigante, es 1/ 10 × 1/10, o .01 (Larrabee, 2005). Por lo tanto, la CVLTII, aunque no se han reportado datos sobre su valor para la detección
administración de varias técnicas independientes y bien validadas sirve de SOP.
para aumentar sustancialmente la precisión diagnóstica (Boone & Lu, 2003;
Larrabee, 2005).
GESTIÓN DE CLIENTES
EVALUACIONES MÚLTIPLES Los neuropsicólogos identificados en la literatura como expertos en el
manejo de compensación financiera o litigios por lesiones personales fueron
Las personas vistas en contextos médicolegales a menudo se someten a encuestados recientemente con respecto a sus prácticas de evaluación
evaluaciones repetidas durante el curso de su litigio. Cullum et al. (1991) (Slick et al., 2004). Estos expertos informaron que siempre dan al menos
argumentaron que para “producir resultados consistentes (pero exagerados una prueba de validez de síntomas, aunque la medida precisa varió de un
o fingidos), el paciente tendría que replicar los mismos niveles de esfuerzo experto a otro. También indicaron que respaldaban sus impresiones
inadecuado a lo largo de múltiples pruebas y períodos de tiempo”. Esto diagnósticas a partir de múltiples fuentes de evidencia, incluidos índices
puede ser difícil de lograr, particularmente en baterías de prueba largas. derivados de pruebas neuropsicológicas estándar. Estas prácticas son
Sugirieron que la evaluación de la consistencia de la respuesta en las consistentes con las pautas propuestas recientemente por el Comité de
evaluaciones en serie podría resultar una técnica especialmente poderosa Planificación y Políticas de la NAN (Bush et al., 2005).
para detectar resultados no válidos. Hay alguna evidencia de que este es el
caso. Las opiniones están divididas sobre si se debe advertir a los clientes
Por ejemplo, Reitan y Wolfson (1995, 1996, 1997) compararon los antes de la prueba que SOP, exageración o deficiencias fingidas pueden
resultados de las pruebas de dos grupos de adultos con lesiones en la detectarse mediante las pruebas administradas durante el examen
cabeza, un grupo involucrado en litigios y el otro no. Cada paciente fue neuropsicológico. Más de la mitad de los expertos encuestados por Slick et
evaluado dos veces, aproximadamente con 1 año de diferencia, en al. (2004) nunca dieron ningún tipo de advertencia antes de la prueba.
subpruebas de la escala de inteligencia de Wechsler y componentes de la Más de un tercio dio algún tipo de advertencia. Esta división de opiniones
batería HalsteadReitan. Los litigantes tendían a demostrar puntajes más se refleja en la literatura. Algunos autores han expresado su preocupación
inconsistentes en la reevaluación que aquellos que no estaban en litigio. de que advertir a las personas sobre la presencia de medidas específicas
Demakis (1999) usó un diseño analógico y examinó el desempeño en para detectar SOP puede reducir la sensibilidad de varias medidas (p. ej.,
varias tareas neuropsicológicas estándar. Los participantes fueron Suhr & Gunstad, 2000; Youngjohn et al., 1999). Cada vez más, este tema
evaluados en dos ocasiones con una diferencia de aproximadamente 3 se reconoce como un problema, porque casi el 50% de los abogados
semanas. Los simuladores demostraron un patrón de recuerdo menos creen que deben proporcionar a sus clientes información específica sobre
consistente que los controles en las cinco pruebas de aprendizaje CVLT (es pruebas psicológicas, incluida información sobre medidas de validez
decir, recordaron diferentes palabras en pruebas sucesivas). (Wetter & Corrigan, 1995). Youngjohn et al. (1999) advirtieron que la validez
de las evaluaciones neuropsicológicas forenses se verá aún más
Strauss et al. (2002) utilizaron un diseño analógico en el que se pidió a comprometida si los psicólogos también se involucran en esta práctica.
la mitad de los participantes (compuestos por tres grupos: personas sanas Recomiendan que se pregunte a los examinados si hay algo que limite su
ingenuas, profesionales que trabajan con personas con lesiones en la capacidad para responder todas las preguntas con precisión según su leal
cabeza y personas con lesiones en la cabeza que no litigaban) que hicieran saber y entender, o si hay algo además de su lesión que limite su capacidad
su mejor esfuerzo, y al resto se les pidió para fingir una lesión creíble. para esforzarse al máximo en las pruebas de desempeño. A partir de
Los participantes fueron evaluados con la tarea Reliable Digit Span, el entonces, la cuestión de la validez de los síntomas no debe enfatizarse ni
VSVT y una prueba de conteo de puntos computarizada en tres ocasiones volver a enfatizarse durante el curso de la evaluación. Por otro lado, una
separadas con aproximadamente 2 semanas de diferencia. NAN reciente
Independientemente de la experiencia de un individuo, las pruebas de elección forzada lograron el
Machine Translated by Google
1156 Compendio de pruebas neuropsicológicas
El documento de posición recomendaba que los examinadores “informaran Varios autores (p. ej., Boone & Lu, 2003; Larrabee, 2005) recomiendan
al examinado al comienzo de la evaluación que se requerirá un buen que es posible llegar a conclusiones en tales casos, en función de los datos
esfuerzo y honestidad (el examinador puede informar al examinado que de resultados publicados en grupos de pacientes que comparten
dichos factores serán evaluados directamente)” (Bush et al., 2005, p. . 424). características de gravedad de lesiones similares (p. ej., Belanger et al. ,
2005; Dikmen et al., 1995; Rohling et al., 2003; Vander ploeg et al., 2005).
Existe evidencia de que el orden de administración de la prueba puede
afectar las tasas de detección. Guilmette et al. (1996) asignó una tarea de Finalmente, es importante señalar que se han informado casos de
validación de síntomas de reconocimiento de números (procedimiento de personas que buscan en Internet y otras fuentes información sobre
elección forzada de Hiscock), ya sea al comienzo o al final de una batería simulación y sobre cómo evadir la detección. En consecuencia, como
de pruebas neuropsicológicas, a simuladores y solicitantes de discapacidad. medida de precaución para reducir la oportunidad de utilizar dicha
Para ambos grupos se obtuvo un desempeño más pobre en la información aprendida previamente, el cliente no debe ver los nombres de
administración anterior. Los autores recomendaron que las pruebas de las pruebas durante la administración.
validez de los síntomas se administren al comienzo de la sesión, antes de Además, Green (2003) aconsejó que la naturaleza de la tarea (p. ej.,
que el paciente esté expuesto a pruebas clínicas más difíciles, que pueden reconocimiento de números), pero no el nombre de la tarea, debe
servir en comparación para “desenmascarar” el bajo nivel de dificultad de identificarse en el cuerpo del informe. Sin embargo, el nombre de la tarea
las medidas de validez de los síntomas. A pesar de esta evidencia, solo se puede enumerar en el apéndice.
la mitad de los expertos encuestados por Slick et al. (2004) informaron que
siempre brindan medidas diseñadas específicamente para detectar un
esfuerzo subóptimo al comienzo de la evaluación; el resto informó que dan referencias
tales medidas en cualquier momento durante el curso de una evaluación,
según surge la necesidad. Asociación Americana de Psiquiatría. (1994). Manual diagnóstico y estadístico
Una vez que surge la sospecha, más de la mitad de los expertos de los trastornos mentales (4ª ed.). Washington, DC: Autor.
encuestados por Slick et al. (2004) modificaron su rutina de evaluación, al Belanger, HG, Curtiss, G., Demery, JA, Lebowitz, BK y Vander ploeg, RD
menos en algunas ocasiones, fomentando un buen esfuerzo o administrando (2005). Factores que moderan los resultados neuropsicológicos después
pruebas de validez de síntomas adicionales. Una minoría enfrentó o de una lesión cerebral traumática leve: un metanálisis.
advirtió directamente a los clientes, terminó el examen antes de lo planeado Revista de la Sociedad Internacional de Neuropsicología, 11, 215–
227.
o se comunicó con el abogado remitente de inmediato.
Bernard, LC, Houston, W. y Natoli, L. (1993). Simulación en pruebas de
memoria neuropsicológica: Indicadores objetivos potenciales.
Revista de Psicología Clínica, 49, 45–53.
Bleiberg, J., Garmoe, WS, Halpern, EL, Reeves, DL y Nadler, JD (1997).
COMUNICACIÓN DE HALLAZGOS Consistencia del desempeño dentro del día y a lo largo del día después
de una lesión cerebral leve. Neuropsiquiatría, neuropsicología y neurología
La comunicación de hallazgos positivos relacionados con SOP puede ser del comportamiento, 10, 247–253.
difícil, dados los matices peyorativos asociados con el término "simulación", Bolan, B., Foster, JK, Schmand, B. y Bolan, S. (2002). Una comparación de
las consecuencias sustanciales que tal diagnóstico puede tener para un tres pruebas para detectar amnesia fingida: los efectos de la
individuo, la dificultad para confirmar su presencia y las motivaciones retroalimentación y la medición de la latencia de respuesta. Revista de
complejas que subyacen a un diagnóstico. el comportamiento de la Neuropsicología Clínica y Experimental, 24, 154–167.
persona. Prácticamente todos los expertos encuestados por Slick et al. Boone, KB y Lu, PH (2003). Rendimiento cognitivo no creíble en el contexto
de una lesión cerebral grave. The Clinical Neuropsycholo gist, 17, 244–
(2004) afirman que siempre dan alguna opinión en su informe sobre los
254.
indicadores de invalidez. Sin embargo, la mayoría rara vez utilizó el término
Boone, K., Lu, P. y Hertzberg, D. (2002). La prueba de conteo de puntos. Los
“simular”. La mayoría afirmó que los resultados de las pruebas no son
Ángeles: Servicios Psicológicos Occidentales.
válidos, no son coherentes con la gravedad de la lesión o son indicativos Burton, CL, Hultsch, DF, Strauss, E. y Hunter, MA (2002) En tren, la
de exageración. Por ejemplo, un examinador podría afirmar lo siguiente: variabilidad individual en el funcionamiento físico y emocional: Comparación
“Los resultados del examen neuropsicológico plantean la preocupación de de adultos con lesiones cerebrales traumáticas y adultos sanos. El
que la Sra. Jones pueda estar exagerando sus quejas de memoria. Sus neuropsicólogo clínico, 16, 264–279.
puntajes en varias pruebas de reconocimiento de elección forzada fueron Bush, SS, Ruff, RR, Troster, AI, Barth, JT, Koffler, SP, Pliskin, N.
significativamente más bajos de lo esperado. Aunque tales puntajes bajos H., Reynolds, CR y Silver, CH (2005). Evaluación de la validez de los
pueden ocurrir en individuos con demencia severa, rara vez, si es que síntomas: problemas de práctica y necesidad médica. Comité de Política
alguna vez, son obtenidos por personas normales o por individuos que y Planificación de la NAN. Archivos de Neuropsicología Clínica, 20, 419–426.
Cullum, C., Heaton, R. y Grant, I. (1991). Factores psicógenos que influyen
sufren de lesiones cerebrales leves”. O el examinador podría afirmar que
en el rendimiento neuropsicológico: trastornos somatomorfos, trastornos
“los resultados no son consistentes con ningún diagnóstico conocido” o que
facticios y simulación. En HO Doerr & AS Carling (Eds.), Neuropsicología
“los resultados no son consistentes con la queja que se presenta”.
forense: Bases legales y científicas (págs. 141–171). Nueva York: Guilford
Press.
Hay relativamente poca investigación sobre la coexistencia de Demakis, GJ (1999). Simulación en serie sobre la fluidez verbal y no verbal y
disfunción neuropsicológica legítima y SOP y si es posible diferenciar el las medidas de memoria: una investigación analógica. Archivos de
deterioro exagerado del real. neuropsicología clínica, 14, 401–410.
Machine Translated by Google
Evaluación del sesgo de respuesta y el rendimiento subóptimo 1157
Dikmen, SS, Machamer, JE, Winn, HR y Temkin, NR (1995). déficits sensoriales. Revista de Consultoría y Psicología Clínica, 47,
Resultado neuropsicológico al cabo de 1 año del traumatismo craneoencefálico. 409–410.
Neuropsychology, 9, 80–90. Reitan, RM y Wolfson, D. (1995). Consistencia de la respuesta al volver a realizar la
Gervais, RO, Rohling, ML, Green, P. y Ford, W. (2004). Una comparación de las prueba entre sujetos con lesión en la cabeza en litigio versus sujetos con lesión
tasas de fallas de WMT, CARB y TOMM en reclamantes por discapacidad que no en la cabeza que no están en litigio. Neuropsicología aplicada, 2,
son por lesiones en la cabeza. Archivos de neuropsicología clínica, 19, 475–487. 67–71.
Reitan, RM y Wolfson, D. (1996). La cuestión de la validez de las puntuaciones de
Verde, P. (2003). Prueba de memoria de palabras de Green para Microsoft Windows. las pruebas neuropsicológicas entre los litigantes con lesiones en la cabeza:
Edmonton, Alberta: Green's Publishing. desarrollo de un índice de disimulación. Archivos de Neuropsicología Clínica, 11,
Greiffenstein, MF, Baker, WJ y Gola, T. (1994). Validación de medidas de amnesia 573–580.
persistente con una muestra clínica grande. Evaluación psicológica, 6, 218–224. Reitan, RM y Wolfson, D. (1997). Consistencia de los puntajes de las pruebas
neuropsicológicas de sujetos con lesiones en la cabeza involucrados en litigios
Greiffenstein, MF, Baker, WJ y Gola, T. (1996). Comparación de múltiples métodos de en comparación con sujetos con lesiones en la cabeza que no están involucrados
puntuación para las medidas de amnesia simulada de Rey. Archivos de en litigios: desarrollo del índice de consistencia de reevaluación. The Clinical
Neuropsicología Clínica, 11, 283–293. Psychologist, 11, 69–76.
Guilmette, TJ, Whelihan, WM, Hart, KJ, Spaadeo, FR y Buon giorno, G. (1996). Rohling, ML, Meyers, JE y Millis, SR (2003). Deterioro neuropsicológico después de
Efectos de la orden en la tramitación de un procedimiento de elección forzosa una lesión cerebral traumática: un análisis de dosisrespuesta. El neuropsicólogo
para la detección de la simulación en la evaluación de los solicitantes de invalidez. clínico, 17, 289–302.
Habilidades motoras y perceptivas, 83, 1007–1016. Slick, DJ, Sherman, EMS e Iverson, GL (1999). Criterios de diagnóstico para la
Iverson, GL y Franzen, MD (1996). Uso de múltiples procedimientos de memoria de disfunción neurocognitiva simulada: estándares propuestos para la práctica clínica
objetos para detectar simulación simulada. Journal of Clinical and Experimental y la investigación. El Neuropsicólogo Clínico, 13,
Neuropsychology, 8, 1–14. 545–561.
Iverson, GL y Tulsky, DS (2003). Detección de simulación en el WAISIII: patrones de Slick, DJ, Tan, JE, Strauss, EH y Hultsch, DF (2004). Detección de simulación: una
rendimiento Ususual Digit Span en la población normal y en grupos clínicos. encuesta de prácticas de expertos. Archivos de neuropsicología clínica, 19, 465–
Archives of Clinical Neuropsychology, 18, 1–9. 473.
Strauss, E., Slick, DJ, LevyBencheton, J., Hunter, M., MacDonald, S.
Kaye, DH y Koehler, JJ (2003). La mala cuantificación del valor probatorio. Ley y WS y Hultsch, DF (2002). Variabilidad intraindividual como indicador de
comportamiento humano, 27(6), 645–659. simulación en traumatismo craneoencefálico. Archives of Clinical Neuropsychology,
Larrabee, GJ (2003). Detección de simulación utilizando patrones de rendimiento 17, 423–444.
atípicos en pruebas neuropsicológicas estándar. El neuropsicólogo clínico, 17, Streiner, DL (2003). Pruebas de diagnóstico: Uso y mal uso de las pruebas de
410–425. diagnóstico y de detección. Revista de Evaluación de la Personalidad, 81,
Larrabee, GJ (2005). Evaluación de la simulación. En GJ Larrabee (Ed.), 209–219.
Neuropsicología forense: un enfoque científico. Nueva York: Oxford University Stuss, DT, Murphy, KJ y Binns, MA (1999). Los lóbulos frontales y la variabilidad del
Press. rendimiento: evidencia del tiempo de reacción. Journal of the International
Lezak, MD, Howieson, DB y Loring, DW (2004). Evaluación neuropsicológica (4ª ed.). Neuropsychological Society, 5, 123.
Nueva York: Oxford University Press. Stuss, DT, Pogue, J., Buckle, L. y Bonndar, J. (1994). Caracterización de la
estabilidad del desempeño en pacientes con lesión cerebral traumática:
Lindeboom, J. (1989). ¿Quién necesita puntos de corte? Revista de Clínica Variabilidad y consistencia en las pruebas de tiempo de reacción.
Psicología, 45, 679–683. Neuropsychology, 8, 316–324.
Meyers, JE y Volbrecht, ME (2003). Una validación de múltiples métodos de detección Suhr, JA y Gunstad, J. (2000). Los efectos del entrenamiento sobre la sensibilidad y
de simulación persistente en una muestra clínica grande. Archivos de la especificidad de las medidas de simulación. Archivos de neuropsicología clínica,
neuropsicología clínica, 18, 261–276. 15, 415–424.
Millis, SR y Volinsky, CT (2001). Evaluación del sesgo de respuesta en traumatismo Tan, JE, Slick, DJ, Strauss, E. y Hultsch, DF (2002). ¿Cómo lo hicieron? Estrategias
craneoencefálico leve: más allá de las pruebas de simulación. Revista de de simulación en las pruebas de validez de los síntomas. The Clinical
Neuropsicología Clínica y Experimental, 23, 809–828. Neuropsychologist, 16, 495–505.
Mittenberg, W., Patton, C., Canyock, EM y Condit, DC (2002). Vallabhajosula, B. y van Gorp, WG (2001). Admisibilidad postDaubert de la evidencia
Tasas base de simulación y exageración de síntomas. Revista de Neuropsicología científica sobre la simulación de déficits cognitivos. Revista de la Academia
Clínica y Experimental, 24, 1094–1102. Estadounidense de Derecho de Psiquiatría, 29,
Mossman, D. (2000a). El significado de la simulación de datos: otras aplicaciones 207–221.
del teorema de Bayes. Ciencias del Comportamiento y la Ley, 18(6), 761–779. Vanderploeg, RD, Curtiss, G. y Belanger, H. (2005). Resultados neuropsicológicos a
largo plazo después de un traumatismo craneoencefálico leve en jurado. Revista
Mossman, D. (2000b). Interpretación de la evidencia clínica de simulación: una de la Sociedad Internacional de Neuropsicología, 11, 228–236.
perspectiva bayesiana. Revista de la Academia Estadounidense de Psiquiatría y
Derecho, 28(3), 293–302. Vickery, CD, Berry, DTR, Dearth, CS, Vagnini, VL, Baser, RE, Cragar, DE y Orey, SA
Mossman, D. (2003). Daubert, simulación cognitiva y precisión de las pruebas. Ley y (2004). Lesión en la cabeza y la capacidad de fingir déficits neuropsicológicos.
comportamiento humano, 27, 229–249. Archives of Clinical Neuropsy chology, 19, 37–48.
Mossman, D. y Hart, KJ (1996). Presentación de pruebas de simulación ante los
tribunales: conocimientos de la teoría de la decisión. Ciencias del Comportamiento Vickery, CD, Berry, DTR, Inman, TH, Harris, MJ y Orey, SA
y la Ley, 14(3), 271–291. (2001). Detección de esfuerzo inadecuado en pruebas neuropsicológicas: una
Pankratz, L. (1979). Prueba de validez de síntomas y reentrenamiento de síntomas: revisión metaanalítica de procedimientos seleccionados. Archivos de
Procedimientos para la evaluación y tratamiento de neuropsicología clínica, 16, 45–73.
Machine Translated by Google
1158 Evaluación del sesgo de respuesta y el rendimiento subóptimo
Wetter, MW y Corrigan, SK (1995). Brindar información a los clientes sobre pruebas Williamson, DJG, Green, P., Allen, L. y Rohling, ML (2003).
psicológicas: una encuesta sobre las actitudes de abogados y estudiantes de Evaluación del esfuerzo con la prueba de memoria de palabras y la prueba de
derecho. Psicología profesional: investigación y práctica, 26, 474–477. categoría, o no: inconsistencias en una muestra de búsqueda de compensación.
Revista de Neuropsicología Forense, 3, 19–44.
Wetter, MW y Deitsch, SE (1996). Fingir trastornos específicos y consistencia de Youngjohn, JR, LeesHaley, PR y Binder, LM (1999). Comentario: Advertir a los
respuesta temporal en el MMPI2. Evaluación psicológica, 8, 39–47. simuladores produce una simulación más sofisticada.
Archivos de Neuropsicología Clínica, 14, 511–516.
La prueba b
OBJETIVO ADMINISTRACIÓN
La prueba b es una tarea de reconocimiento de letras que está diseñada para detectar un Las instrucciones se encuentran en el manual de prueba. Brevemente, se
esfuerzo sospechoso al realizar la prueba. le indica al paciente que encierre en un círculo todas las letras "b" en las
páginas lo más rápido posible. También se informa al paciente que la
prueba puede volverse más difícil con cada página subsiguiente.
FUENTE Los autores advierten que la prueba no debe administrarse a aquellos
sujetos que tengan deficiencias visuales o motoras significativas, demencia
La prueba b está disponible en Western Psychological Services (http://
de moderada a grave, o psicosis aguda y/o intoxicación por sustancias.
www.wpspublish.com). El kit (que incluye el manual, 10 folletos de estímulo,
1 juego de plantillas de puntuación y 50 formularios de registro) cuesta
$128 USD.
HORA DE ADMINISTRACION
RANGO DE EDAD Se requieren aproximadamente 15 min.
La prueba está diseñada para su uso con personas mayores de 17 años.
PUNTUACIÓN
La puntuación de la prueba b implica registrar el tiempo de respuesta total
y contar los símbolos que el cliente marcó con un círculo (errores "d", que
DESCRIPCIÓN
no son "b"), así como ciertos símbolos ("b") que el cliente puede no haber
La prueba b (Boone et al., 2000, 2002) es una tarea desarrollada marcado. Los puntajes de error y tiempo se utilizan para calcular el puntaje
recientemente que evalúa una habilidad sobreaprendida, la capacidad de E, que es el puntaje principal requerido para la interpretación. En la
detectar "b" de los distractores, una habilidad que es bastante resistente a ecuación utilizada para calcular el puntaje E, los errores de comisión
la lesión cerebral adquirida. Debido a que las personas que fingen o reciben un peso adicional para reflejar su importancia como signos de
exageran los déficits cognitivos pueden no ser conscientes de esta esfuerzo sospechoso.
conservación relativa, pueden verse tentados a mostrar su "deficiencia" y, El desempeño del cliente puede evaluarse contra el de los encuestados
por lo tanto, ser señalados como sospechosos de haber realizado un de esfuerzo normal (cooperativos) y los encuestados cuyo esfuerzo se
esfuerzo. Como anécdota, Boone evaluó a varios simuladores que sabe que es sospechoso. Se proporcionan datos sobre varios grupos de
afirmaron que se habían vuelto disléxicos (es decir, veían las letras al esfuerzo normal, incluido un grupo no neurológico y pacientes con
revés y al revés) después de una lesión en la cabeza equívoca, una queja diversas afecciones neurológicas y psiquiátricas (depresión, esquizofrenia,
que no se informó en los pacientes con lesiones en la cabeza que traumatismo craneoencefálico, accidente cerebrovascular, problemas de
cooperaron. Esta experiencia condujo al desarrollo de esta medida. aprendizaje; véase el cuadro 166). El examinador selecciona un grupo
La prueba consta de un folleto de estímulo de 15 páginas, cada una de de esfuerzo normal cuyo estado clínico se ajuste mejor a la queja que
las cuales contiene una serie de "b" minúsculas intercaladas entre otras presenta el cliente. Los autores indican que la comparación combinada de
letras como "d" y "q" y las mismas letras giradas en un ángulo diagonal o esfuerzo normal debe usarse solo si la queja que presenta el examinado
con doble tallos. En cada presentación sucesiva, la matriz se vuelve no coincide bien con ninguna de las comparaciones específicas de esfuerzo
progresivamente más pequeña, para hacer que la tarea parezca más difícil normal.
mientras mantiene un nivel de dificultad trivial. Se le pide al cliente que grupos
circule todas las “b” que aparecen en cada página, trabajando lo más Se proporciona una tabla (Tabla 5 en el manual de la prueba) que
rápido posible. Los totales de error junto con el tiempo requerido para presenta los puntos de corte recomendados y los valores asociados para
completar la tarea son necesarios para calcular la puntuación del índice de cuatro índices de precisión de clasificación: sensibilidad, especificidad,
esfuerzo (puntuación E), que es la medida principal del esfuerzo para precisión predictiva positiva (PPA) y precisión predictiva negativa (NPA).
realizar el examen. El PPA y el NPA se calculan utilizando tres tasas base hipotéticas: 15 %,
30 % y 45 %. Si la puntuación E es inferior a la especificada
Machine Translated by Google
La prueba b 1159
Cuadro 166 Grupos de comparación de esfuerzo normal para la prueba b
Edad media en Educación media en
Grupo de esfuerzo normal Descripción N (Sexo) años (rango) años (rango)
Grupos de esfuerzo normal
Conjunto Todas las de arriba 161 (82 M, 79 F) 49,8 (18–84) 14,4 (6–22)
corte, se considera que el rendimiento del cliente se encuentra dentro del rango Educación
de esfuerzo normal. Los puntos de corte recomendados se eligieron para
La educación afecta los puntajes E, aunque se informa que la cantidad de
minimizar los falsos positivos mientras se mantiene una sensibilidad adecuada
varianza explicada por la educación es pequeña (R2 = .03; Boone et al., 2002).
para el esfuerzo sospechoso. El Apéndice A del manual de la prueba incluye
tablas que muestran otras puntuaciones límite con valores asociados de
sensibilidad, especificidad, PPA y NPA. Estas tablas permiten al examinador
optar por diferentes puntajes de corte para maximizar la sensibilidad o Etnicidad
especificidad en varias situaciones. A medida que aumenta la puntuación de
No se informan los efectos del origen étnico.
corte, aumentan la especificidad y la PPA, y disminuyen la sensibilidad y la NPA.
Esto ocurre porque un valor de corte más alto reduce la probabilidad de errores
DATOS NORMATIVOS
de falsos positivos.
Aunque el puntaje E es el puntaje principal que se usa para interpretar el
desempeño, los médicos también pueden examinar los puntajes de los Muestra de estandarización
componentes (errores de comisión, errores “d”, errores de omisión, tiempo total)
Como se señaló anteriormente (ver Puntuación), el desempeño se evalúa en
para evaluar si un cliente eligió una respuesta inexacta o lenta como método de
relación con un grupo de esfuerzo sospechoso y un grupo de esfuerzo normal
respuesta. fabricación de síntomas. El Apéndice B del manual de la prueba
que corresponde más a la queja del cliente. Como se muestra en el cuadro 166,
proporciona valores de sensibilidad y especificidad para las puntuaciones de los se incluyeron 161 individuos en el grupo de esfuerzo normal. Ninguno participó
componentes de la prueba.
en litigios ni buscó pagos por discapacidad. El grupo de esfuerzo sospechoso
constaba de 91 personas, 88 de las cuales estaban en litigios por lesiones
personales o buscaban beneficios por discapacidad asociados con presuntos
VARIABLES DEMOGRAFICAS
trastornos médicos o psiquiátricos (37% lesión en la cabeza; 27% estrés/dolor
crónico). Uno fue diagnosticado con un trastorno ficticio y dos eran reclusos en
Edad una cárcel del condado que buscaban obtener más indulgencia.
Boone et al. (2002) informaron que la edad no afectó los puntajes de las pruebas.
oraciones.
Boone et al. (2002) encontraron que solo el 3,3% de los participantes con
Género esfuerzo sospechoso produjeron puntajes E de 50 o menos, mientras que el
32,3% de todos los participantes con esfuerzo normal produjeron tales puntajes.
El género no tiene efecto en las puntuaciones E (Boone et al., 2002). En consecuencia, en base a su análisis de sospechosos y
Machine Translated by Google
1160 Evaluación del sesgo de respuesta y el rendimiento subóptimo
grupos de esfuerzo normal, sugirieron que una puntuación E de 50 o menos es muy produjo sensibilidades de alrededor del 70 % para todos los grupos de comparación
probable que represente un desempeño de esfuerzo normal creíble. Solo el 6,8% excepto esquizofrenia y accidente cerebrovascular, para los cuales la sensibilidad
de los participantes de esfuerzo normal obtuvieron puntuaciones E de 160 o más. fue baja, 56 %.
Por el contrario, el 58,2% de los individuos sospechosos de esfuerzo produjeron Boone et al. (2002) informaron que la prueba b funcionó mejor cuando se usó
tales puntuaciones. En consecuencia, los puntajes E de 160 o más generalmente con el grupo de comparación de lesiones en la cabeza. La puntuación de corte
se asocian con un esfuerzo sospechoso. recomendada de 90 tenía una sensibilidad del 76,9 % y una especificidad del 90 %
para detectar un esfuerzo sospechoso. Los valores predictivos positivos fueron
Los autores de la prueba encontraron que los errores "d" son altamente 57,6 % con una tasa base de esfuerzo subóptimo del 15 %, 76,7 % con una tasa
sugestivos de un esfuerzo sospechoso. Solo el 2,5% de los participantes de esfuerzo base del 30 % y 86,3 % con una tasa base del 45 %. Por lo tanto, el uso de la
normal cometieron tres o más de estos errores. Prueba b parece limitado cuando la tasa base de esfuerzo subóptimo es de alrededor
del 30 % o menos, porque la probabilidad de un error falso positivo es alta (más de
2 de 10 reclamantes serían etiquetados incorrectamente como simulación) .
FIABILIDAD
Boone et al. (2002) no proporcionaron datos sobre la confiabilidad, argumentando
que el esfuerzo para tomar exámenes no es un rasgo o habilidad estable; más bien La prueba b parece ser menos útil en pacientes con esquizofrenia o accidente
“es una capacidad que responde a las contingencias externas del entorno de cerebrovascular que en otros grupos clínicos. Los puntos de corte recomendados
evaluación. Cuando la situación de tomar la prueba en sí misma introduce un tuvieron que establecerse sustancialmente más altos que los otros grupos para
efecto variable en el constructo que se está midiendo, las estadísticas tradicionales evitar falsos positivos, lo que sugiere que las deficiencias cognitivas asociadas con
de confiabilidad tienen poco significado” (p. 23). estas dos condiciones pueden afectar el rendimiento de la prueba independientemente
Argumentaron que la mejor evidencia de la confiabilidad de una prueba de esfuerzo del esfuerzo. Los autores recomiendan que los resultados de la prueba se interpreten
es que la prueba puede discriminar entre grupos cuyos estados de esfuerzo han con cautela al evaluar a estos pacientes.
sido establecidos por otros medios, y que puede hacerlo consistentemente entre
grupos que representan diferentes problemas y estados clínicos.
COMENTARIO
Debido a que los simuladores pueden ser selectivos en cuanto a qué dominios
VALIDEZ
eligen para fingir un deterioro (p. ej., memoria, velocidad mental, lectura), es
importante tener disponibles pruebas como la prueba b que capturan estos
Relaciones con otras medidas
diferentes enfoques para la magnificación de los síntomas. Otros puntos fuertes de
La prueba muestra correlaciones de modestas a moderadas con otras medidas de la prueba incluyen la disponibilidad de diferentes grupos de referencia de esfuerzo
esfuerzo (p. ej., conteo de puntos r = 0,60, Rey 15 elementos r = −0,42; extensión normal y la provisión de puntajes de sensibilidad, especificidad y precisión predictiva
de dígitos r = −0,57, figura compleja r = 0,37, reconocimiento War Rington Memoria correspondientes a diferentes tasas base de esfuerzo sospechoso.
r = −0,18; Nelson et al., 2003).
Las variables de tiempo transcurrido del conteo de puntos y la prueba b estaban Boone et al. (2002) no brindan información sobre confiabilidad, argumentando
altamente correlacionadas, compartiendo alrededor del 42 % de la varianza. que las pruebas de esfuerzo son medidas de “estado”, que reflejan respuestas
Este hallazgo sugiere que estos dos puntajes pueden proporcionar cierta conductuales a contingencias ambientales. Esto no significa que la información
redundancia, pero no total, de información sobre el esfuerzo. sobre confiabilidad no sea interesante o útil, particularmente si uno pudiera aislar
aquellos factores que predijeron el buen o mal desempeño repetido, o la variabilidad.
Uno podría, por ejemplo, esperar que algunos factores que subyacen al desempeño
de la validez de los síntomas sean de hecho “rasgos” estables (por ejemplo,
Hallazgos clínicos
sociopatía o su opuesto) que, en igualdad de condiciones, promuevan puntajes
En apoyo de la validez de la tarea, Boone et al. (2002) encontró que podía confiablemente malos o buenos, aunque admitiendo que las contingencias
discriminar un grupo de esfuerzo sospechoso (91 demandantes por lesiones ambientales podrían superan esas tendencias (p. ej., contingencias por ser
personales) de siete grupos de esfuerzo normal (ver Tabla 166). Para ser incluidos descubierto fingiendo).
en el grupo de esfuerzo sospechoso, los clientes tenían que mostrar un desempeño
no creíble en otras dos tareas y características conductuales consistentes con el
esfuerzo sospechoso (p. ej., síntomas autoinformados inverosímiles). Ninguno de Uno también estaría interesado en saber qué tan confiable es la prueba entre
los individuos en los grupos de esfuerzo normal estuvo involucrado en litigios o un grupo clínico de interés (p. ej., no litigantes con lesión en la cabeza o deterioro
buscando compensación. El grupo sospechoso cometió más errores y tardó mucho grave de la memoria). Aunque no es necesario demostrar la confiabilidad testretest
más tiempo en completar la tarea que los grupos de esfuerzo normal. Los datos de entre los litigantes, sería importante saber que las personas con lesiones legítimas
este estudio se usaron para calcular la sensibilidad, la especificidad, la PPA y la obtienen buenos puntajes de manera confiable.
NPA en un rango de posibles puntuaciones de corte (ver Puntuación). El criterio
principal para seleccionar la puntuación de corte fue obtener una especificidad de al La prueba b se basa en la noción de que ciertas habilidades son altamente
menos el 85%. Las puntuaciones de corte recomendadas resistentes a los efectos de una lesión cerebral y otras enfermedades.
Aunque los autores presentan datos que muestran que la tarea se ve mínimamente
afectada por la presencia de trastornos neurológicos, psiquiátricos o
Machine Translated by Google
La prueba de conteo de puntos (DCT) 1161
discapacidades de aprendizaje, los usuarios deben tener en cuenta que las información independiente. Se necesitan estudios adicionales realizados por otros
deficiencias cognitivas pueden afectar el rendimiento de la prueba (al menos en el investigadores para confirmar estos hallazgos iniciales. Finalmente, los usuarios deben
caso de esquizofrenia o accidente cerebrovascular). Boone et al. (2002) también tener en cuenta que la determinación del estado motivacional no debe basarse
informaron que la prueba podía distinguir a los individuos con un esfuerzo sospechoso únicamente en los resultados de una sola prueba, sino que debe basarse en una
de aquellos con discapacidades de aprendizaje de buena fe. Es importante tener en evaluación integral en la que el médico evalúa múltiples aspectos del desempeño, la
cuenta que los sujetos con problemas de aprendizaje comprendían un grupo de historia y el comportamiento del paciente ( Slick et al., 1999).
estudiantes universitarios con un alto nivel educativo (educación media, 1318 años).
Queda por determinar si la tarea será igualmente efectiva con un grupo más diverso
de personas con discapacidades de aprendizaje. En la actualidad, el instrumento debe
utilizarse con mucha cautela al evaluar a personas con posibles trastornos del referencias
aprendizaje y bajo rendimiento educativo.
Boone, K., Lu, P., Herzberg, DS (2002). La prueba b. Los Ángeles: Servicios
La prueba b parece ser más efectiva en la evaluación de los efectos de una lesión Psicológicos Occidentales.
en la cabeza. Sin embargo, los médicos deben tener en cuenta que su utilidad parece Boone, KB, Lu, P., Sherman, D., Palmer, B., Back, C., Warner Chacon, K. y
más evidente en entornos donde la tasa base de simulación supera el 30%; es decir,
Berman, NG (2000). Validación de una nueva técnica para detectar
simulación de síntomas cognitivos: El Test b.
prácticas que se especializan principalmente en valoraciones médicolegales. En
Archivos de neuropsicología clínica, 15, 227–241.
entornos clínicos con tasas base del 30 % o menos, el riesgo de falsos positivos
Nelson, NW, Boone, K., Dueck, A., Wagener, L., Lu, P. y Grills, C.
puede ser inaceptablemente alto.
(2003). Relaciones entre ocho medidas de esfuerzo sospechoso.
El neuropsicólogo clínico, 17, 263–272.
Los datos proporcionados por los autores de la prueba sugieren que la prueba b
Slick, DJ, Sherman, EMS e Iverson, GL (1999). Criterios de diagnóstico para
es una adición útil para complementar otras medidas del estado motivacional. La tarea la disfunción neurocognitiva simulada: estándares propuestos para la
está moderada pero no altamente correlacionada con otras medidas de esfuerzo, lo práctica clínica y la investigación. El neuropsicólogo clínico, 13, 545–561.
que sugiere que proporciona relativamente
La prueba de conteo de puntos (DCT)
OBJETIVO que son puntos impresos dispuestos al azar. La tarjeta 1 tiene 7 puntos; tarjeta 2, 11;
tarjeta 3, 15; tarjeta 4, 19; tarjeta 5, 23; y tarjeta 6, 27 (ver Figura 161). Las tarjetas se
La prueba de conteo de puntos (DCT) está diseñada para detectar un esfuerzo
muestran al cliente una a la vez en el siguiente orden: 2, 4, 3, 5, 6, 1. Se espera que
sospechoso al tomar la prueba.
el tiempo requerido para contar el número de puntos aumente gradualmente a medida
que aumenta el número de puntos. Más de una desviación pronunciada de este patrón
FUENTE plantea la preocupación de un esfuerzo sospechoso. La segunda parte de la tarea
(agrupada) consta de seis tarjetas que contienen puntos dispuestos en un patrón no
Los usuarios pueden consultar la descripción que sigue para reproducir la tarea.
aleatorio: (1) dos cuadrados de cuatro puntos, (2) dos cuadrados de cinco puntos y
Recientemente, Boone et al. han estandarizado una versión. (2002a) y está disponible
dos puntos separados, (3) cuatro cuadrados de cuatro puntos. rombos de puntos, (4)
a través de Western Psychological Services (http://www.wpspublish.com). El kit incluye
cuatro cuadrados de cinco puntos, (5) cuatro rectángulos de seis puntos y (6) cuatro
el manual, folleto de estímulo y 50 formularios de registro y cuesta $108 US.
cuadrados de cinco puntos y dos cuadrados de cuatro puntos (consulte la figura 161).
El orden de presentación es el mismo que en la primera parte: 2, 4, 3, 5, 6, 1.
RANGO DE EDAD Debido a que los puntos se pueden agrupar y los pacientes pueden aplicar heurísticas
simples (es decir, suma o multiplicación básica de conjuntos), el tiempo necesario para
La prueba está diseñada para su uso con personas mayores de 17 años.
contar los puntos debe ser mucho menor que para los elementos sin agrupar, que
deben contarse individualmente.
DESCRIPCIÓN
Figura 16–1 Ejemplo de elementos agrupados y no agrupados de DCT.
Versión original La
DCT fue desarrollada como dos tareas separadas por Andre Rey (1941; descrita en
Frederick, 2002) y adaptada por Lezak (1983; Lezak et al., 2004) para detectar
esfuerzos subóptimos; las tareas se utilizan actualmente en tándem. Cada tarea
requiere que el cliente cuente el número de puntos que aparecen en seis tarjetas. La
primera parte (Sin agrupar) consta de seis tarjetas de 3 × 5 pulgadas en
Machine Translated by Google
1162 Evaluación del sesgo de respuesta y el rendimiento subóptimo
En consecuencia, el desempeño puede evaluarse en términos de la PUNTUACIÓN
diferencia entre el tiempo requerido para realizar cada tarea, con
desviaciones de las expectativas (poca diferencia entre las condiciones La puntuación de
agrupadas y no agrupadas, agrupadas por más tiempo que las no
la versión original de la DCT original implica registrar el tiempo de respuesta
agrupadas) elevando el índice de sospecha.
de cada elemento. Algunos investigadores también registran errores.
Boone et al.
Boone et al.
La versión ofrecida por Boone et al. (2002a) es similar al original, pero las
Para la versión desarrollada por Boone et al. (2002a), tanto el tiempo como
tarjetas se agrandaron a 5 × 7 pulgadas para facilitar el manejo y los puntos los errores se registran para cada tarjeta, y estos se utilizan para calcular
se limitaron a 1/16 de pulgada. Además, tanto la precisión (errores) como
la puntuación E. Consiste en la suma del número total de errores de
la velocidad (tiempo de conteo) se consideran en la puntuación del índice
conteo, el tiempo medio sin agrupar (primer juego de cartas) y el tiempo
de esfuerzo (puntuación E), que es la medida principal en esta versión de
medio agrupado (segundo juego de cartas).
la DCT.
En Boone et al. versión, el desempeño del cliente puede evaluarse
contra el de los encuestados de esfuerzo normal (cooperativos) y los
encuestados cuyo esfuerzo se sabe que es sospechoso (basado en otros
ADMINISTRACIÓN
criterios cognitivos y conductuales). Se proporcionan varios grupos de
Se le pide al cliente que cuente y diga la cantidad de puntos que aparecen esfuerzo normal, incluido un grupo no neurológico y pacientes con una
en cada tarjeta lo más rápido posible. El examinador presenta cada tarjeta variedad de afecciones neurológicas y psiquiátricas (depresión,
individualmente y registra la latencia y la respuesta de cada tarjeta. El esquizofrenia, traumatismo craneoencefálico, accidente cerebrovascular,
examinador no informa al cliente que hay algunas pruebas con puntos problemas de aprendizaje, demencia leve; consulte el cuadro 167) . El
agrupados y otras con puntos no agrupados. examinador selecciona un grupo de esfuerzo normal cuyo estado clínico
se ajuste mejor a la queja que presenta el cliente. Los autores indican que
la comparación de esfuerzo normal combinado debe usarse solo si la
queja que presenta el examinado no coincide bien con ninguno de los
HORA DE ADMINISTRACION
grupos de comparación de esfuerzo normal específicos.
Se requieren aproximadamente 10 min.
Cuadro 167 Grupos de comparación de esfuerzo normal para la prueba de conteo de puntos
Edad media en Educación media en
Grupo de esfuerzo normal Descripción N (Sexo) años (rango) años (rango)
La prueba de conteo de puntos (DCT) 1163
Se proporciona una tabla (Tabla 5 en el manual de la prueba) que presenta tiempo total para puntos no agrupados, (c) menos de tres respuestas correctas
los puntos de corte recomendados y los valores asociados para cuatro índices en tarjetas de puntos agrupados, (d) menos de una respuesta correcta en
de precisión de clasificación: sensibilidad, especificidad, precisión predictiva tarjetas de puntos no agrupados, y (e) más de cuatro cambios de tendencia
positiva (PPA) y precisión predictiva negativa (NPA). La PPA y la NPA se (casos en los que el encuestado no muestra el patrón esperado de requerir
calculan utilizando tres tasas base hipotéticas: 15 % (ámbito de evaluación más tiempo para contar matrices más grandes de puntos). Sin embargo, la
clínica general), 30 % (prácticas en las que se observa una combinación de sensibilidad de estos puntos de corte es pobre (Boone et al., 2002a; Rose et
referencias clínicas y médicolegales) y 45 % (prácticas que se especializan al., 1998).
en atención médica legal). evaluaciones). Si el puntaje E es menor que el
límite especificado, se considera que el desempeño del cliente está dentro del
rango de esfuerzo normal. Los puntos de corte recomendados se eligieron para Boone et al.
minimizar los falsos positivos y mantener una sensibilidad adecuada para el
Como se señaló anteriormente, el desempeño se evalúa en relación con un
esfuerzo sospechoso. El Apéndice A del manual de la prueba incluye tablas
grupo de esfuerzo sospechoso y un grupo de esfuerzo normal que corresponde
que muestran otras puntuaciones límite con valores asociados de sensibilidad,
más a la queja del cliente. Se incluyó un total de 228 individuos en el grupo de
especificidad, PPA y NPA. Estas tablas permiten al examinador optar por
esfuerzo normal (véase el cuadro 167).
diferentes puntajes de corte para maximizar la sensibilidad o especificidad en
Ninguno estuvo involucrado en litigios o buscando pagos por discapacidad.
diversas situaciones. A medida que aumenta la puntuación de corte, aumentan
El grupo de esfuerzo sospechoso constaba de 99 personas, 85 de las cuales
la especificidad y la PPA, y disminuyen la sensibilidad y la NPA.
estaban en litigios por lesiones personales o buscaban beneficios por
discapacidad asociados con presuntos trastornos médicos o psiquiátricos.
Esto ocurre porque un valor de corte más alto reduce la probabilidad de errores
Todos fueron sospechosos de esfuerzo no creíble en base a otros criterios
de falsos positivos.
conductuales y cognitivos. Los datos de este estudio se usaron para calcular la
sensibilidad, la especificidad, la PPA y la NPA en un rango de posibles
EFECTOS DEMOGRÁFICOS puntuaciones de corte (ver Puntuación). El criterio principal para seleccionar
la puntuación de corte fue obtener una especificidad de al menos el 90%
(alcanzado para todos excepto el grupo con accidente cerebrovascular). Las
Edad
puntuaciones de corte recomendadas alcanzaron una PPA de al menos el 80
La edad está relacionada con el rendimiento (Arnett & Franzen, 1997; Back et
% (excepto en los casos de accidente cerebrovascular), utilizando una
al., 1996); sin embargo, el impacto parece ser mínimo.
suposición de tasa base del 30 % para el esfuerzo sospechoso.
Boone et al. (2002a) informaron que las correlaciones con la edad son inferiores
Boone et al. (2002a) encontraron que solo el 3,5% de todos los participantes
a .20.
de esfuerzo sospechoso produjeron puntajes E de 9 o menos, mientras que el
50,8% de todos los participantes de esfuerzo normal produjeron tales puntajes.
En consecuencia, basándose en su análisis de los grupos de esfuerzo normal
Género
y sospechoso, sugirieron que una puntuación E de 9 o menos es muy probable
El género no tiene efecto en las puntuaciones E (Boone et al., 2002a). que represente un rendimiento de esfuerzo normal creíble. Menos del 10 % de
los participantes con esfuerzo normal produjeron puntajes E de 22 o más, pero
el 55,3 % de los individuos con esfuerzo sospechoso produjeron tales puntajes.
Educación
La educación afecta los puntajes E, aunque se informa que la cantidad de Por lo tanto, los puntajes E de 22 o más generalmente se asocian con un
varianza explicada por la educación es pequeña (R2 = .04; Boone et al., 2002a). esfuerzo sospechoso.
Boone et al. (2002b) también observaron otros indicadores de esfuerzo
sospechoso en la DCT: más de 7 s de tiempo medio de conteo de puntos
agrupados, más de tres errores y una proporción de tiempo de conteo de
Etnicidad puntos no agrupados a agrupados de menos de 1,5. La sensibilidad de estos
indicadores es baja, lo que sugiere que estos hallazgos son relativamente poco
No se informa el efecto del origen étnico.
comunes incluso en aquellos con un esfuerzo sospechoso verificado; sin
embargo, las especificidades tienden a ser altas, lo que significa que estos
DATOS NORMATIVOS signos casi nunca están presentes en aquellos que realizan un esfuerzo
normal.
Versión original
Lezak et al. (2004) proporcionaron normas de percentiles para el tiempo (en
FIABILIDAD
segundos) que se tarda en contar los puntos agrupados y no agrupados en
cada tarjeta. Los datos parecen bastante anticuados porque se basan en Boone et al. (2002a) no proporcionaron datos sobre la confiabilidad,
trabajos publicados hace más de 60 años (Rey, 1941). Otros han descrito argumentando que el esfuerzo para tomar exámenes no es un rasgo o habilidad
diferentes puntos de corte. Por ejemplo, Pablo et al. (1992) recomendaron los estable; más bien “es una capacidad que responde a las contingencias externas
siguientes puntos de corte: (a) más de 130 s de tiempo total en puntos del entorno de evaluación. Cuando la situación de tomar la prueba en sí misma
agrupados, (b) más de 180 s introduce un efecto variable en el constructo que se está midiendo,
Machine Translated by Google
1164 Evaluación del sesgo de respuesta y el rendimiento subóptimo
las estadísticas tradicionales de confiabilidad tienen poco significado” (p. 23). la especificidad fue de alrededor del 90% en una variedad de grupos clínicos.
Argumentaron que la mejor evidencia de la confiabilidad de una prueba de Otros investigadores (p. ej., Beetar & Williams, 1995; Binks et al., 1997; Erdal,
esfuerzo es que la prueba puede discriminar entre grupos cuyos estados de 2004; Martin et al., 1996; Strauss et al., 2002) también han encontrado que
esfuerzo han sido establecidos por otros medios, y que puede hacerlo los simuladores (incluso aquellos con un conocimiento o experiencia
consistentemente entre grupos que representan diferentes problemas y considerables) con respecto a los efectos de las lesiones en la cabeza)
estados clínicos. Nuestro punto de vista es que la confiabilidad testretest suprimen su desempeño, tardan más en responder y son menos precisos
no necesita ser demostrada entre los litigantes; sin embargo, sería importante que los no simuladores. Los simuladores también son más inconsistentes
saber que las personas con jurados legítimos obtienen buenos puntajes de que los controles, mostrando una mayor variabilidad en el desempeño de
manera confiable. una sesión de prueba a otra (Strauss et al., 2002).
Sin embargo, algunos autores (Greiffenstein et al., 1994; Hayes et al.,
VALIDEZ
1997; Hiscock et al., 1994; Rose et al., 1998) han informado que la DCT no
distingue de forma fiable a los simuladores probables o simulados de los
Relaciones dentro de la prueba
pacientes cumplidores. . Además, existe evidencia de que otras pruebas (p.
Los errores totales se correlacionan modestamente con el tiempo de conteo ej., reconocimiento de elección forzada) son más sensibles que la DCT para
de puntos agrupados (r = 0,25) y con la relación entre el tiempo de conteo sospechar esfuerzo (His cock et al., 1994; Martin et al., 1996; Rose et al.,
de puntos no agrupados y agrupados (r = −0,34); sin embargo, la cantidad 1998; Strauss et al., 2002; véase también Vickery et al., 2001 para una
de varianza compartida entre las puntuaciones no supera el 12 %, lo que revisión metaanalítica reciente de varios procedimientos). La DCT parece
sugiere que la velocidad y la precisión del rendimiento del conteo de puntos ser tan eficaz (o ineficaz) como la prueba de 15 ítems de Rey para diferenciar
son constructos separados (Boone et al., 2002a). Cabe destacar que Binks los grupos de encuestados honestos de los disimulados (Vickery et al., 2001).
et al. (1997) encontraron que la precisión del conteo de puntos parecía ser
más importante que las puntuaciones de tiempo para detectar un esfuerzo
subóptimo. Algunos estudios han demostrado que el rendimiento de DCT se
conserva en el contexto de un deterioro real de la memoria (p. ej., abuso de
sustancias, Arnett & Franzen, 1997; síndrome de WernickeKorsakoff,
Relaciones con otras medidas
Pachana et al., 1998). Sin embargo, el estado cognitivo afecta el rendimiento
El DCT muestra correlaciones moderadamente altas con otras medidas que y la tarea no debe usarse con pacientes que tienen deterioros cognitivos más
evalúan la simulación de síntomas cognitivos (por ejemplo, b Test r = .60, extensos (p. ej., accidente cerebrovascular, retraso mental, puntajes MMSE
Rey 15Item r = −.56; Figura compleja r = .69, Warrington Recognition ≤24), porque sus problemas cognitivos pueden interferir con la evaluación
Memory r = .41, Nelson et al., 2003; PDRT r = −0,41, Youngjohn et al., 1995), precisa de esfuerzo (Back et al., 1996; Boone et al., 2002a; Hayes et al.,
lo que sugiere que la tarea proporciona información algo independiente sobre 1996). Los trastornos psiquiátricos (p. ej., depresión, psicosis) parecen tener
el esfuerzo en este ámbito. Sin embargo, la asociación entre DCT (Escore) poco impacto en las puntuaciones de las pruebas (Back et al., Boone et al.,
y Digit Span (puntuación escalada corregida por edad) es alta (r = −0,75; 56 2002a, 2002b; Lee et al., 2000).
% de varianza compartida), lo que indica que estas dos medidas pueden
proporcionar información un tanto redundante.
Una implicación es que puede no ser apropiado usar las puntuaciones de
COMENTARIO
estas dos pruebas como evidencia adicional de un esfuerzo sospechoso
(Nelson et al., 2003). En general, la prueba parece mostrar una sensibilidad moderada y una alta
Las correlaciones son pequeñas entre los indicadores de validez en las especificidad. Los resultados positivos implican un esfuerzo sospechoso,
medidas de psicopatología (p. ej., MMPI2, MCMI) y las puntuaciones en el pero el uso de la tarea de forma aislada puede dar lugar a un número
DCT (Boone et al., 1995; Youngjohn et al., 1995). Por lo tanto, la DCT puede inaceptable de falsos negativos. Por tanto, se anima al clínico a complementar
ser sensible a la exageración del deterioro neuropsicológico pero no de la esta tarea con otras, en particular con procedimientos de elección forzada.
psicopatología.
La DCT aprovecha fuentes de información algo diferentes con respecto
al esfuerzo que otras tareas utilizadas para detectar la simulación de síntomas
cognitivos. Sin embargo, la asociación entre DCT (Escore) y Digit Span
Hallazgos clínicos
(puntuación escalada corregida por edad) es alta, lo que sugiere que estas
La eficacia de la prueba para detectar síntomas cognitivos no creíbles es dos medidas pueden proporcionar algunas fuentes redundantes de
mixta. Por ejemplo, Boone et al. (2002a, 2002b) encontraron que la tarea información sobre el esfuerzo (Nelson et al., 2003).
podía discriminar un grupo de esfuerzo sospechoso (86 demandantes por
lesiones personales) de grupos que mostraban un esfuerzo normal. Usando La tarea parece no verse relativamente afectada por la edad o el nivel
puntajes de corte basados en el tiempo de conteo de puntos no agrupados, educativo. También se ve mínimamente afectado por los trastornos
el tiempo de conteo de puntos agrupados y el número de errores, la emocionales, lo que sugiere que es apropiado para su uso con pacientes con
sensibilidad fue de alrededor del 70 % en esta muestra, y trastornos psiquiátricos. Tampoco se ve afectado por la memoria verdadera.
Machine Translated by Google
La prueba de conteo de puntos (DCT) 1165
discapacidad. Sin embargo, los usuarios deben tener en cuenta que el DCT Erdal, K. (2004). Los efectos de la motivación, el entrenamiento y el conocimiento
no es inmune al deterioro cognitivo. de la neuropsicología en la simulación simulada de una lesión en la cabeza.
La disponibilidad de datos DCT en varios grupos clínicos permite al Archivos de neuropsicología clínica, 19, 73–88.
médico adaptar los puntos de corte al caso individual. Cuando se usó el DCT Frederick, Rhode Island (2002). Una revisión de las estrategias de Rey para
en el contexto de la evaluación de lesiones traumáticas en la cabeza, el detectar el deterioro neuropsicológico persistente. Journal of Forensic
Neuropsychology, 2, 1–25.
puntaje E de corte recomendado de 20 tuvo una sensibilidad del 68,2 % y
Greiffenstein, M., Baker, W. y Gola, T. (1994). Validación de medidas de
una especificidad del 95 % para detectar un esfuerzo sospechoso (Boone et
amnesia simuladas con una muestra clínica grande. Evaluación psicológica,
al., 2002a). Se informó que el VPP era del 70,7 % cuando la tasa base de 6, 218–224.
esfuerzo subóptimo era del 15 %, del 85,4 % cuando era del 30 % y del 91,8 Hayes, JS, Hale, DB y Gouvier, WD (1997). ¿Predicen las pruebas la simulación
% cuando era del 45 %. Por lo tanto, la eficacia de la tarea parece limitada persistente en acusados con retraso mental? La Revista de Psicología, 131,
cuando la tasa base de esfuerzo subóptimo es inferior al 30 %, debido a 575–576.
que el riesgo de un resultado falso positivo es alto (es decir, aproximadamente Hiscock, CK, Branham, JD y Hiscock, M. (1994). Detección de deterioro cognitivo
2 de cada 10 solicitantes serán etiquetados incorrectamente como simulación fingido: el método de elección forzada de dos alternativas en comparación
con las pruebas convencionales seleccionadas.
utilizando una cifra del 30%).
Revista de Psicopatología y Evaluación del Comportamiento, 16, 95–
Los usuarios también deben tener en cuenta que los límites recomendados
110.
por Boone et al. (2002a) son estimaciones que requieren confirmación
Lee, A., Boone, KB, Lesser, I., Wohl, M., Wilkins, S. y Parks, C.
independiente.
(2000). Desempeño de pacientes mayores con depresión en dos pruebas de
Boone et al. (2002a, 2002b) sugirieron que las personas en diferentes
simulación cognitiva: Tasas de falsos positivos para las pruebas Rey 15
entornos pueden adoptar diferentes enfoques para fingir. Item Memo rization y Dot Counting. El neuropsicólogo clínico, 14, 303–308.
Por ejemplo, los reclusos pueden ralentizar su desempeño en ambas tareas,
mientras que los litigantes civiles pueden ralentizar el tiempo agrupado para Lezak, MD (1983). Evaluación neuropsicológica. Nueva York: buey
aproximarse al tiempo no agrupado y cometer errores (Boone et al., 2002a, Prensa de la Universidad Ford.
b). Se necesitan estudios adicionales para confirmar estos hallazgos Lezak, MD, Howieson, DB y Loring, DW (2004). Evaluación neuropsicológica
preliminares. (4ª ed.). Nueva York: Oxford University Press.
Martin, RC, Hayes, JS y Gouvier, WD (1996). Vulnerabilidad diferencial entre el
autoinforme posterior a la conmoción cerebral y las pruebas objetivas de
referencias simulación en la identificación de lesiones leves en la cabeza. Revista de
Neuropsicología Clínica y Experimental, 18, 265–275.
Arnett, PA y Franzen, MD (1997). Desempeño de adictos a sustancias con Nelson, NW, Boone, K., Dueck, A., Wagener, L., Lu, P. y Grills, C.
déficits de memoria en medidas de simulación. (2003). Relaciones entre ocho medidas de esfuerzo sospechoso.
Archivos de neuropsicología clínica, 12, 513–518. El neuropsicólogo clínico, 17, 263–272.
Back, C., Boone, KB, Edwards, C., Burgoyne, K. y Silver, B. Pachana, NA, Boone, KB y Ganzell, S. (1998). Errores falsos positivos en
(1996). El desempeño de los esquizofrénicos en tres pruebas cognitivas de pruebas seleccionadas de simulación. Revista estadounidense de psicología
simulación, la prueba de memoria de 15 ítems de Rey, el conteo de puntos forense, 16, 17–25.
de Rey y el método de elección forzada de Hiscock. evaluación, 3, Paul, D., Franzen, MD, Cohen, SH y Fremouw, W. (1992). Una investigación
449–458. sobre la confiabilidad y validez de dos pruebas utilizadas en la detección de
Beetar, JT y Williams, JM (1995). Simulación de estilos de respuesta en las simulación. International Journal of Clinical Neuropsychology, 14, 1–9.
Escalas de Evaluación de la Memoria y pruebas de validez de síntomas.
Archivos de neuropsicología clínica, 10, 57–72. Rey, A. (1941). L'examen psicologico dans les cas d'en cephalopathie
Binks, PG, Gouvier, WD y Waters, WF (1997). Detección de simulación con la traumatique. Archives de Psychologie, 28, 286–340.
prueba de conteo de puntos. Archives of Clinical Neuropsy chology, 12, 41– Rose, FE, Hall, S. y SzaldaPetree, AD (1998). Una comparación de cuatro
46. pruebas de simulación y los efectos del entrenamiento. Archivos de
Boone, K., Lu, P., Herzberg, DS (2002a). La prueba de conteo de puntos. Los neuropsicología clínica, 13, 349–363.
Ángeles: Servicios Psicológicos Occidentales. Strauss, E., Slick, DJ, LevyBencheton, J., Hunter, M., MacDonald, S.
Boone, KB, Lu, P., Back, C., King, C., Lee, A., Philpott, L., Shamieh, E. y Warner WS y Hultsch, DF (2002). Variabilidad intraindividual como indicador de
Chacon, K. (2002b). Sensibilidad y especificidad del Test de Conteo de simulación en traumatismo craneoencefálico. Archives of Clinical
Puntos de Rey en pacientes con esfuerzo sospechoso y muestras clínicas Neuropsychology, 17, 423–444.
diversas. Archivos de neuropsicología clínica, 17, 625–642. Vickery, CD, Berry, DTR, Inman, TH, Harris, MJ y Orey, SA
(2001). Detección de esfuerzo inadecuado en pruebas neuropsicológicas:
Boone, KB, Sadovnik, I., Ghaffarian, S., Lee, A., Freeman, D. y Berman, NG una revisión metaanalítica de procedimientos seleccionados. Archivos de
(1995). Memoria de 15 ítems Rey y puntajes de conteo de puntos en una neuropsicología clínica, 16, 45–73.
población de indemnización laboral por reclamos de “estrés”: puntajes de Youngjohn, JR, Burrows, L. y Erdal, K. (1995). ¿Daño cerebral o neurosis de
relación con la personalidad (MCMI). Journal of Clinical Psychology, 5, 457– compensación? El controvertido síndrome posconmocional. El neuropsicólogo
463. clínico, 9, 112–123.
Machine Translated by Google
1166 Evaluación del sesgo de respuesta y el rendimiento subóptimo
Prueba Rey de Quince Elementos (FIT)
OTROS NOMBRES DE PRUEBA Figura 16–3 Simulaciones de reconocimiento Rey FIT. Fuente: De
Boone et al., 2002. Reimpreso con la amable autorización de Psychology Press.
La Prueba de Quince Elementos de Rey (FIT) también se llama Prueba de Memoria
de Quince Elementos, Prueba de Memoria de Rey o Prueba 3 × 5 de Rey.
d II B 5 c 2 –
OBJETIVO
A III e
tercero
61 Fa
Esta prueba se utiliza para evaluar la exageración o fingir quejas de memoria. 4 Cb ∆ D
Yo Efe 3 Yo
FUENTE
La prueba se puede realizar utilizando la descripción proporcionada aquí. Otras variantes
Varios autores han sugerido varias modificaciones de la FIT para aumentar la
sensibilidad de la prueba (ver Validez). Por ejemplo, Pablo et al. (1992) desarrollaron
RANGO DE EDAD
una versión de 16 ítems del FIT que consta de cuatro filas y cuatro ítems (ABCD,
La tarea se puede utilizar con personas de aproximadamente 11 años o más. 1234, abcd, I II III IIII). Grifo et al. (1997) rediseñaron las figuras, aumentando la
lógica interna y la redundancia de patrones. Boone et al. (2002) incluyeron un ensayo
de reconocimiento después del ensayo de recuerdo.
DESCRIPCIÓN
Se le pide al cliente que reconozca los 15 estímulos de 15 objetivos y 15 láminas
Andre Rey desarrolló un interés en detectar la simulación en parte en respuesta a las
(vea la figura 163).
acusaciones de las compañías de seguros de que la mayoría de los reclamantes, si
no todos, probablemente solo estaban fingiendo una discapacidad (Frederick, 2002).
El FIT (Rey, 1964) es probablemente el más conocido de los procedimientos de Rey ADMINISTRACIÓN
(Frederick, 2002). Lezak (1983) adaptó la tarea. Actualmente, es una de las tareas
El cliente recibe una hoja de papel en blanco. Las instrucciones para el FIT estándar
de validación de síntomas más utilizadas (Slick et al., 2004). Consta de 15 elementos
(Goldberg & Miller, 1986) se muestran en la figura 164. Otros investigadores han
que están organizados en tres columnas por cinco filas (vea la figura 162). A los
enfatizado diferentes aspectos de las instrucciones. Por ejemplo, Arnett et al. (1995)
pacientes se les muestra una tarjeta (21,5 cm de ancho y 28 cm de alto) que contiene
enfatizan que es una tarea de memoria “difícil” y que el cliente debe “dibujar tantos
los 15 elementos durante 10 s y luego se les pide que dibujen los elementos de
diseños como pueda recordar y acomodarlos de la misma manera que estaban en la
memoria. En las instrucciones, se enfatiza el número “15” para que la prueba parezca
tarjeta”.
difícil (Lezak et al., 2004). En realidad, debido a que esta es principalmente una
prueba de atención y memoria inmediata y debido a la redundancia de ítems (es
decir, ABC, 123, abc, etc.), el FIT es bastante fácil y los pacientes necesitan recordar
solo tres o cuatro ideas para recordar. la mayoría de los artículos. Se cree que los HORA DE ADMINISTRACION
simuladores juzgan mal la dificultad de la tarea y, por lo tanto, se desempeñan peor
Se requieren alrededor de 5 minutos para la prueba.
que todos los pacientes, excepto aquellos con discapacidad intelectual grave. En su
discusión sobre el FIT, Lezak et al. (2004) sugirieron que cualquiera que no tenga
una discapacidad significativa puede recordar al menos tres de los cinco conjuntos PUNTUACIÓN
de caracteres, o 9 de los 15 elementos.
Se pueden calcular varias puntuaciones. Por lo general, los examinadores registran
el número total de ítems recordados correctamente, independientemente
Figura 164 Instrucciones para la prueba de quince ítems de Rey. Fuente:
Figura 162 Prueba de quince ítems de Rey. De Goldberg & Miller, 1986.
AB C 12 3 Les voy a mostrar una tarjeta con 15 (enfatizados) cosas
ab c para recordar. Cuando retire la tarjeta, quiero que escriba
tantas de las 15 cosas como pueda recordar. La tarjeta
de estímulo se retira después de una exposición de 10 s.
I Yo tercero
Machine Translated by Google
Prueba Rey de Quince Elementos (FIT) 1167
de su ubicación espacial. El rango es de 0 a 15. También se puede registrar Aunque la mayoría de los investigadores se centran en el número total
el número de filas correctas en la secuencia adecuada; es decir, el número de elementos recordados, algunos han sugerido esquemas de puntuación
de filas que están en el lugar correcto en la matriz de 3 × 5 y que contienen más complejos que involucran evaluaciones de la ubicación de los
todos los elementos correctos dispuestos en el orden correcto. El rango es elementos y la precisión de las reproducciones. Por ejemplo, los
de 0 a 5. También se puede sumar el número de símbolos colocados examinadores pueden usar un límite de menos de dos filas en la ubicación
correctamente dentro de una fila. Por ejemplo, ACB recibiría una adecuada (Arnett et al., 1995) o menos de nueve símbolos colocados con
puntuación de 1. El rango de puntuaciones es de 0 a 15. El análisis del tipo precisión dentro de las filas (Greiffenstein et al., 1996).
de error (p. ej., rotaciones, distorsiones, perseveraciones) también puede Las cinco filas que componen el FIT difieren en el grado de dificultad.
ser útil (p. ej., Erdal, 2004; Greiff enstein et al. 1996; Griffen et al. 1996; En individuos con daño cerebral que no litigan, lo mejor es recordar las tres
ver también Validez). letras mayúsculas, seguidas de números arábigos, letras minúsculas,
figuras geométricas y números romanos (Morgan, 1991). El error cualitativo
más frecuente es el desorden de las formas geométricas (Morgan, 1991).
EFECTOS DEMOGRÁFICOS
En los respondedores honestos, las perseveraciones/repeticiones de los
estímulos correctos y los errores en la ubicación correcta de las filas
Edad
parecen ser relativamente comunes; sin embargo, otros tipos de errores (p.
Se han informado asociaciones modestas entre el número correcto y la ej., errores disléxicos, como d por b; error gestalt, como >3 elementos
edad. Por ejemplo, Schretlen et al. (1991) encontraron que, en adultos, el seguidos; errores de adorno o confabulación) son raros (Griffin et al., 1996;
número de ítems recordados estaba inversamente relacionado con la edad Lee et al. , 2000). Sin embargo, es importante tener en cuenta que algunos
(r = −0,25). Otros también informaron que las puntuaciones en el FIT de estos errores (p. ej., confabulaciones) pueden ocurrir comúnmente en el
disminuyen con la edad avanzada (p. ej., Boone et al., 2002; Griffin et al., contexto de un coeficiente intelectual bajo o un diagnóstico de demencia
1997; Philpott & Boone, 1994), aunque la cantidad de varianza compartida (Hays et al., 2000).
tiende a ser pequeña (< 10%). En los niños, el rendimiento en las pruebas Si también se da la prueba de reconocimiento, Boone et al (2002)
se correlaciona mucho con la edad (r = 0,61 a 0,72), y las puntuaciones sugieren una puntuación límite combinada (puntuación FIT total +
mejoran con el aumento de la edad (Constantinou y McCaffrey, 2003). [puntuación de reconocimiento falsos positivos]) de menos de 20 para
indicar un desempeño "fallido".
CI/Educación Niños
El nivel intelectual también está relacionado (0,38 a 0,81) con el rendimiento Constantinou y McCaffrey (2003) proporcionaron las puntuaciones medias
en la prueba (p. ej., Goldberg y Miller, 1986; Griffin et al., 1997; Schretlen de 67 niños (44 niñas, 23 niños), de 5 a 12 años de edad, que vivían en el
et al., 1991; pero véase Back et al., 1996, que no pudo encontrar una norte del estado de Nueva York para el FIT. Los datos se muestran en la
relación entre las puntuaciones MMSE y FIT en pacientes esquizofrénicos). tabla 168. Estos autores también proporcionaron datos similares de un
El nivel de educación afecta las puntuaciones en adultos (p. ej., Back et al., segundo sitio (Chipre). Aunque la muestra es muy pequeña, los datos
1996; Boone et al., 2002) y niños (Constantinou y McCaffrey, 2003), y las sugieren que los niveles sin errores se alcanzan alrededor de los 11 años.
puntuaciones aumentan con los niveles educativos más altos. Por lo tanto,
el FIT puede ser inapropiado para personas con un coeficiente intelectual/
FIABILIDAD
educación inferior al promedio.
Confiabilidad de pruebareprueba
Género
La información sobre la fiabilidad testretest no está disponible para el
No se han reportado diferencias entre machos y hembras (Constantinou & protocolo estándar. Sin embargo, Pablo et al. (1992) ideó un
McCaffrey, 2003).
Cuadro 168 Puntuaciones medias de los niños en los Estados Unidos
DATOS NORMATIVOS
Estados en el FIT
Adultos Significar
Edad
norte
Dakota del Sur
1168 Evaluación del sesgo de respuesta y el rendimiento subóptimo
versión de 16 ítems del FIT (descrito anteriormente) y dio la tarea a voluntarios de M = 63,4, DT = 7,54). Descubrieron que todos los pacientes psiquiátricos
la comunidad. Al volver a realizar la prueba después de un intervalo de 2 recordaban al menos 9 de los 15 elementos, y más del 37 % de los sujetos
semanas, los habitantes de la comunidad lograron un coeficiente de confiabilidad retrasados recordaban menos de 9 elementos. Nueve de los 16 adultos retrasados
de .48 (debido al hecho de que los sujetos normales generalmente obtienen no recordaron al menos tres de las cinco filas (ver también Hayes et al., 1997).
puntajes perfectos en ambas pruebas), que aumentó a .88 en condiciones de
simulación. Philpott y Boone (1994) aplicaron el FIT a pacientes con probable demencia
tipo Alzheimer (EA) que variaban en cuanto al nivel de deterioro cognitivo (de leve
a grave según puntuaciones en el MMSE) y a adultos sanos, de 46 a 80 años
Fiabilidad entre
Descubrieron que el rendimiento en el FIT variaba con la gravedad de la demencia.
Goldberg y Miller (1986) informaron que evaluadores independientes mostraron un Solo 2 de los 49 pacientes con EA obtuvieron una puntuación FIT superior a 9.
acuerdo del 95% para los elementos correctos y un acuerdo del 97% para las Incluso los pacientes con deterioro cognitivo leve exhibieron una alta tasa de
puntuaciones correctas de las filas. “fracaso” en esta prueba. Finalmente, Back et al. (1996) informaron que en una
muestra de 30 pacientes con esquizofrenia, el 13% obtuvo una puntuación inferior
a 9.
VALIDEZ
Relaciones con otras medidas
Se ha recomendado ajustar la puntuación de corte a 7 para mejorar la eficiencia
El FIT muestra correlaciones de modestas a moderadas (0,19 a 0,78) con otras diagnóstica (Lee et al., 1992). Lee et al. (1992) aplicaron el FIT a 100 pacientes
medidas cognitivas de esfuerzo (p. ej., b Test, Dot Counting, TOMM, Warrington hospitalizados con epilepsia del lóbulo temporal, 56 pacientes ambulatorios que
Recognition Memory Test; McCaffrey et al., 2003; Nelson et al., 2003) , con no litigaban y 16 pacientes ambulatorios que estaban litigando y cuyo rendimiento
varianzas compartidas que tienden a ser inferiores al 50% (Nelson et al., 2003). óptimo no podía suponerse. Descubrieron que una puntuación de 7 elementos
Por lo tanto, el FIT puede proporcionar información no redundante sobre el estado recordados estaba en o por debajo del percentil 5 para cada grupo de referencia,
motivacional. Parece haber poca relación entre varias escalas de validez del excepto el grupo de pacientes ambulatorios en litigio. Sin embargo, también se han
MMPI2 (p. ej., F, FK) y puntuaciones en tareas cognitivas como la FIT planteado preocupaciones sobre los méritos de este corte. Por ejemplo, Millis y
(Greiffenstein et al., 1995; McCaffrey et al., 2003). La implicación es que el FIT Kler (1995) aplicaron la FIT a siete personas que afirmaban tener graves déficits
mide un constructo diferente al de las escalas de validez tradicionales del MMPI2. cognitivos como resultado de lesiones cerradas en la cabeza, pero que se
consideró que eran simuladores debido a su desempeño significativamente inferior
al azar en la prueba de memoria de reconocimiento. una medida de memoria de
elección forzada.
También se administró el FIT a un grupo de referencia de siete pacientes con
Hallazgos clínicos
lesión cerebral traumática aguda de moderada a grave. Los sujetos con lesión
Idealmente, una prueba diseñada para detectar defectos de memoria simulados cerebral recordaron significativamente más elementos en el FIT que los sujetos
debería ser sensible a la simulación pero insensible a la alteración de la memoria que simularon. Usando una puntuación de corte de 7, el FIT pudo detectar solo
genuina. Sin embargo, el FIT parece estar muy por debajo de este ideal. En alrededor de la mitad de los simuladores, pero no clasificó erróneamente a ningún
general, los que responden honestamente logran puntajes más altos en la prueba sujeto con lesión cerebral. Guilmette et al. (1994) también usaron esta puntuación
que los que disimulan, pero la sensibilidad del FIT para identificar el engaño es de corte modificada y encontraron que la FIT era demasiado sensible al deterioro
débil y más baja que la de otras pruebas (p. ej., Digit Memory Test, TOMM; Shum genuino de la memoria y no lo suficientemente sensible para identificar a las
et al., 2004; Vickery et al., 2001;Vallabhajosula & van Gorp, 2001). personas que simulaban daño cerebral. Utilizando un punto de corte de 7 o menos
elementos correctos, el 40 % de los pacientes que no litigan con daño cerebral
moderado a grave y el 20 % de los pacientes hospitalizados psiquiátricos
Además, los pacientes con trastornos focales de la memoria, así como aquellos deprimidos se habrían clasificado como posibles simuladores. Por el contrario,
con un deterioro cognitivo más extenso, pueden tener un desempeño deficiente solo el 5% de un grupo de sujetos normales a los que se les pidió que fingieran
en la tarea. Por ejemplo, Schretlen et al. (1991) aplicaron la prueba a 76 sujetos déficits creíbles se encontraban en el rango de "simulación".
que fingían diversos trastornos mentales; 148 pacientes con amnesia, demencia,
enfermedad mental grave u otro trastorno neuropsiquiátrico; y 80 controles Otros han recomendado diferentes ajustes para mejorar la utilidad de la
normales. prueba. Arnet et al. (1995) compararon el desempeño de una muestra mixta de
Informaron que el 27 % de los pacientes puntuaron en el rango de “simulación”, y pacientes neurológicos (predominantemente pacientes con lesión cerebral
solo el 15 % de los que recibieron instrucciones para fingir una discapacidad traumática y hemorragia tracerrebral) con individuos normales instruidos para
fueron detectados como simuladores con el FIT. De manera similar, Morgan (1991) simular deterioro en varias variables cuantitativas y cualitativas derivadas del FIT.
examinó a 60 sujetos que no litigaban con deterioro de la memoria de leve a Descubrieron que un punto de corte de menos de dos filas en la ubicación
severo y encontró que 12 de ellos "fallaron" en el FIT cuando se utilizó un criterio adecuada proporcionaba la mejor discriminación de grupos (en comparación con
de tres filas o nueve elementos. Goldberg y Miller (1986) asignaron la tarea a 50 los puntos de corte de menos de tres filas correctas, menos de nueve elementos
pacientes hospitalizados psiquiátricos adultos de inteligencia promedio (M = 101,1, correctos y menos de filas correctas), lo que produce una sensibilidad del 47 %. y
SD = 12,5) y 16 adultos retrasados (rango de CI de WAISR, 40–69, una especificidad
Machine Translated by Google
Prueba Rey de Quince Elementos (FIT) 1169
del 97%. El mismo corte aplicado a un estudio de replicación arrojó una sensibilidad del (2000) evaluaron una muestra de pacientes adultos mayores ambulatorios con depresión
64 % y una especificidad del 96 %. Tenga en cuenta, sin embargo, que su grupo de mayor y encontraron que alrededor del 5% fallaron en el FIT utilizando los puntos de corte
pacientes con daño cerebral no era el ideal, porque sufrieron un daño de moderado a de menos de 9 ítems totales y menos de 9 puntaje espacial (número de ítems colocados
severo. Los pacientes con lesión cerebral traumática menor proporcionarían una con precisión dentro de una fila). Por el contrario, como se señaló anteriormente,
comparación más adecuada. No obstante, el hallazgo de que los pacientes con Guilmette et al. (1994) utilizaron una puntuación de corte de 7 ítems y encontraron que el
evidencia documentada de daño cerebral pueden lograr dos o más filas correctas en el 20% de los pacientes psiquiátricos deprimidos habrían sido clasificados como posibles
FIT sugiere que el rendimiento por debajo de este punto de corte en el contexto de una simuladores.
lesión cerebral menor debe considerarse sospechoso. El rendimiento en la FIT (recuerdo/reconocimiento) no parece estar contaminado
por trastornos leves del aprendizaje. Boone et al. (2002) encontraron que los estudiantes
universitarios con problemas de aprendizaje se desempeñaron bien en las tareas. Sin
Grifo et al. (1996) recomendaron modificar la administración solicitando que los embargo, queda por determinar si el rendimiento está contaminado por trastornos de
sujetos registraran los 15 ítems “tal como aparecen en la tarjeta”. Sugirieron, basándose aprendizaje más graves (por ejemplo, los que se encuentran en estudiantes no
en un estudio de sujetos con discapacidades psiquiátricas y sujetos normales que no universitarios).
simulaban, así como posibles simuladores, que se debería utilizar tanto el análisis Existe evidencia considerable de que las tareas de reconocimiento de elección
cuantitativo como el cualitativo. Aunque las omisiones fueron más comunes, los posibles forzada son más útiles que el FIT estándar (Greiffenstein et al., 1996; Hiscock et al.,
simuladores cometieron significativamente más errores de gestalt (fallo en la reproducción 1994; Vallabhajosula & van Gorp, 2001; Vickery et al., 2001). Por ejemplo, Guilmette et
de la configuración 3 × 5), secuencia de filas, dislexia (inversión de caracteres) y adornos al. (1994) encontraron que una versión del procedimiento de elección forzada de Hiscock
que los no simuladores. Los simuladores también produjeron significativamente más e Hiscock (1989) era superior al FIT como un procedimiento de detección de simulación
errores que los respondedores honestos en una versión rediseñada de la prueba de Rey dentro de la evaluación neuropsicológica (consulte la Prueba de validez de síntomas de
(Griffin et al., 1997). Tenga en cuenta, sin embargo, que estos errores (p. ej., errores de Victoria para una adaptación del procedimiento de Hiscock y Hiscock ) . Utilizando un
Gestalt, elemento incorrecto) son poco comunes incluso entre simuladores o simuladores punto de corte del 90% o menos correcto como sugerencia de simulación en el
probables (Griffin et al., 1996). procedimiento de elección forzada de Hiscock y Hiscock, todos los sujetos con daño
cerebral y todos menos el 15% de los simuladores se clasificaron correctamente.
El hecho de que algunos de estos errores (p. ej., adornos/confabulaciones) ocurran
comúnmente en el contexto de un coeficiente intelectual bajo o demencia (Hays et al.,
2000) indica que es importante descartar estas condiciones antes de aceptarlas como Iverson y Franzen (1996) evaluaron a estudiantes, pacientes psiquiátricos y un grupo
signos patognomónicos de esfuerzo sospechoso. mixto de pacientes con problemas de memoria en varias tareas, incluida la versión de 16
ítems del FIT.
Greiffenstein et al. (1996) examinó la utilidad de algunas otras modificaciones de La versión de 16 ítems no resultó eficaz para clasificar a las personas a las que se les
puntuación. En 60 pacientes con lesión cerebral traumática grave y 90 pacientes que indicó que simulen (22,5 %), aunque los procedimientos de elección forzada tuvieron
litigaron después de una conmoción cerebral que probablemente estaban fingiendo, las tasas relativamente altas de clasificación correcta. Greiffenstein et al. (1994) evaluaron
tasas de aciertos (64 % de sensibilidad, 72 % de especificidad) con el método de una muestra de 106 pacientes que habían sufrido una conmoción cerebral con y sin
puntuación original de Rey (≤9 ítems) podrían mejorar un poco (69 % de sensibilidad, 77 signos evidentes de simulación (p. ej., bajo rendimiento improbable en dos o más
% de especificidad) con un sistema de puntuación espacial en el que se calculan las medidas neuropsicológicas, contradicción entre las fuentes colaterales y el historial de
reproducciones correctas dentro de la fila. Tenga en cuenta que los niveles de síntomas) en una batería de pruebas neuropsicológicas (p. ej., RAVLT , WMS, WMSR)
especificidad son bastante bajos, con una tasa de error de falsos positivos de alrededor y una serie de medidas de amnesia simuladas, incluida la FIT. Los simuladores probables
del 33%. Una prueba de memoria de reconocimiento de elección forzada de 15 palabras no pudieron diferenciarse de los pacientes con lesiones cerebrales graves en las medidas
demostró ser más efectiva que la FIT. de recuerdo libre de las escalas de Wechsler y el RAVLT. Por el contrario, los simuladores
probables se desempeñaron mal en las medidas de simulación, incluida la FIT, aunque
Más recientemente, Boone et al. (2002) sugirieron otro enfoque más para mejorar la Prueba de reconocimiento de dígitos de Portland logró una mejor tasa de aciertos.
la eficacia de la prueba. Desarrollaron una prueba de reconocimiento para seguir la
prueba de recuerdo en la que se le pide al paciente que encierre en un círculo los 15
estímulos (de 15 objetivos y 15 láminas) reconocidos de la página de estímulos original.
Boone et al. sugirieron que la sensibilidad aumenta en un 50 % en relación con el Greiffenstein et al. (1995) señalaron, sin embargo, que las medidas de amnesia
recuerdo solo cuando se agrega la prueba de reconocimiento (hasta >70 %), sin una simulada, incluida la FIT, eran generalmente más sensibles al incumplimiento que las
pérdida apreciable de especificidad (>90 %). Tenga en cuenta que los pacientes con medidas del MMPI2.
retraso mental y demencia fueron excluidos del estudio, lo que probablemente mejoró
los valores de especificidad. Con una tasa base de esfuerzo sospechoso del 28 %, una
COMENTARIO
puntuación combinada (calculada como recuperación correcta más reconocimiento
correcto menos reconocimientos falsos positivos) de 20 o menos arrojó un valor Una encuesta reciente sobre las prácticas de neuropsicólogos expertos en el manejo
predictivo positivo (VPP) del 77,8 % y un valor predictivo negativo. (VAN) del 89,5%. de casos de compensación financiera o litigios por lesiones personales reveló que la FIT
es una de las medidas más utilizadas (Slick et al., 2004). El bajo costo, la disponibilidad
inmediata y la facilidad de administración probablemente explican su popularidad.
La depresión parece tener un impacto relativamente pequeño en los puntajes de las
pruebas, al menos cuando se evalúan pacientes ambulatorios. Lee et al.
Machine Translated by Google
1170 Evaluación del sesgo de respuesta y el rendimiento subóptimo
La evidencia disponible sugiere que la FIT puede proporcionar Back, C., Boone, KB, Parks, C., Burgoyne, K. y Silver, B. (1996).
información complementaria a la de otras medidas del estado El desempeño de los esquizofrénicos en tres pruebas cognitivas de simulación,
motivacional. Por otro lado, parece ser sensible a la disfunción cognitiva Rey 15Item Memory Test, Rey Dot Counting y el método de elección forzada
de Hiscock. Evaluación, 3, 449–457.
genuina (incluyendo demencia, amnesia y problemas visoespaciales)
Beetar, JT y Williams, JM (1994). Simulación de estilos de respuesta en las Escalas
e insuficientemente sensible a la simulación (p. ej., Arnott et al., 1995;
de Evaluación de la Memoria y pruebas de validez de síntomas.
Beetar & Williams, 1994; Greiffenstein et al. al., 1996; Guilmette et al.,
Archivos de neuropsicología clínica, 10, 57–72.
1994; Iverson & Franzen, 1996; Morgan, 1991; Schretlen et al., 1991;
Bernard, LC y Fowler, W. (1990). Evaluación de la validez de las quejas de
Vickery et al., 2001). Un enfoque potencial para mejorar la sensibilidad
memoria: rendimiento de individuos normales y con daño cerebral en la tarea
es incluir la prueba de reconocimiento en la administración (Boone et de Rey para detectar simulación. Journal of Clinical Psychology, 46, 432–436.
al., 2002). Sin embargo, cabe señalar que el FIT, incluso con la adición
del ensayo de reconocimiento, no cumple con el estándar de Daubert Boone, KB, Salazar, X., Lu, P., WarnerChacon, K. y Razani, J.
para la admisibilidad de la evidencia científica con base en su (2002). Prueba de reconocimiento de 15 elementos de Rey: una técnica para
incapacidad para lograr un criterio de VPP del 80 % o más utilizando mejorar la sensibilidad de la prueba de memorización de 15 elementos de Rey.
una tasa base de esfuerzo sospechoso del 30% (Vallabhajosula & van Revista de Neuropsicología Clínica y Experimental, 24, 561–573.
Gorp, 2001). Constantinou, M. y McCaffrey, RJ (2003). Uso del TOMM para evaluar el esfuerzo
de los niños para desempeñarse de manera óptima en medidas
El FIT no debe utilizarse de forma aislada. Si los médicos eligen neuropsicológicas. Neuropsicología infantil, 9, 81–90.
Erdal, K. (2004). Los efectos de la motivación, el entrenamiento y el conocimiento
usar el FIT en combinación con otras medidas, su mayor utilidad puede
de la neuropsicología en la simulación simulada de una lesión en la cabeza.
ser detectar estrategias de simulación evidentes después de una
Archivos de neuropsicología clínica, 19, 73–88.
lesión cerebral leve (Millis & Kler, 1995; Palmer et al., 1995). En tales Frederick, Rhode Island (2002). Una revisión de las estrategias de Rey para
casos, la prueba debe administrarse al comienzo de la evaluación, detectar el deterioro neuropsicológico simulado. Revista de Neuropsicología
antes de que el paciente esté expuesto a pruebas más difíciles y, Forense, 2, 1–25.
posteriormente, comprenda la simplicidad del procedimiento (Iverson & Goldberg, JO y Miller, HR (1986). Desempeño de psiquiatras en pacientes e
Franzen, 1996). No se recomienda el uso de la prueba en pacientes individuos con deficiencia intelectual en una tarea que evalúa la validez de las
con disfunción cerebral severa. De hecho, si se obtienen puntajes quejas de memoria. Revista de Psicología Clínica, 42, 792–795.
bajos en el FIT estándar, los médicos primero deben considerar la
Greiffenstein, M., Baker, WJ y Gola, T. (1994). Validación de medidas de amnesia
posibilidad de un coeficiente intelectual bajo y/o un trastorno neurológico
simuladas con una muestra clínica grande. Evaluación psicológica, 6, 218–224.
grave antes de sacar conclusiones sobre la validez de los puntajes de
simulación (p. ej., Greiffenstein et al., 1994, 1996; Hayes et al., 1997).
Greiffenstein, MF, Baker, WJ y Gola, T. (1996). Comparación de múltiples métodos
Nosotros, como otros, preferimos los procedimientos de elección
de puntuación para las medidas de amnesia simulada de Rey. Archivos de
forzada (p. ej., Greiffenstein et al., 1994; Guil mette et al., 1994; Iverson Neuropsicología Clínica, 11, 283–293.
& Franzen, 1996; Millis & Kler, 1995; Vickery et al., 2001). Greiffenstein, MF, Gola, T. y Baker, WJ (1995). Escalas de validez MMPI2 versus
medidas específicas de dominio en la detección de lesión cerebral traumática
Cabe señalar que la motivación que tenga un individuo puede ficticia. El neuropsicólogo clínico, 9, 230–
afectar la magnitud de su disimulación en el FIT. 240.
Erdal (2004) usó un paradigma de simulación e informó que las Griffin, GA, Glassmire, DM, Henderson, EA y McCann, C.
personas que están motivadas para obtener una compensación fingen (1997). Rey II: Rediseño de la prueba Rey Screening de simulación. Revista
de Psicología Clínica, 53, 757–766.
más flagrantemente que aquellas que están motivadas para evitar la culpa.
Griffin, GAE, Normington, J. y Glassmire, D. (1996). Dimensiones cualitativas en la
La mayoría de las investigaciones sobre el esfuerzo subóptimo han
puntuación del Rey Visual Memory Test of finging. Evaluación psicológica, 8,
examinado a los adultos ignorando la posibilidad de que los niños no
383–387.
realicen un esfuerzo óptimo. El FIT no debe utilizarse con niños
Guilmette, TJ, Hart, KJ, Giuliano, AJ y Leininger, BE (1994).
pequeños cuya experiencia con formas geométricas, letras y números Detección del deterioro de la memoria simulada: Comparación de la Prueba de
sea limitada (Constantinou y McCaffrey, 2003). Quince Elementos de Rey y el Procedimiento de Elección Forzada de Hiscock.
Si es útil para evaluar el estado motivacional en niños mayores requiere El neuropsicólogo clínico, 8, 283–294.
estudio. Además, aunque el impacto de los trastornos leves del Hays, JR, Emmons, J. y Stallings, G. (2000). Demencia y retraso mental en el Rey
aprendizaje en el desempeño de la tarea parece ser mínimo, no se 15Item Visual Memory Test. Informes psicológicos, 86, 179–182.
sabe si la tarea está contaminada por deficiencias en el procesamiento
del lenguaje que se encuentran en formas más graves de discapacidad Hayes, JS, Hale, DB y Gouvier, WD (1997). ¿Las pruebas predicen la simulación
persistente en los acusados con retraso mental? La Revista de Psicología, 131,
del aprendizaje.
575–576.
Hiscock, M. y Hiscock, CK (1989). Refinando el método de elección forzada para
la detección de simulación. Revista de Neuropsicología Clínica y Experimental,
referencias 11, 967–974.
Hiscock, C., Branham, J. y Hiscock, M. (1994). Detección de deterioro cognitivo
Arnett, PA, Hemmeke, TA y Schwartz, L. (1995). Rendimiento cuantitativo y fingido: el método de elección forzada de dos alternativas en comparación con
cualitativo del Test de 15 ítems de Rey en pacientes neurológicos y pruebas convencionales seleccionadas. Revista de Psicopatología y Evaluación
disimuladores. El neuropsicólogo clínico, 9, 17–26. del Comportamiento, 16, 95–109.
Machine Translated by Google
Prueba de simulación de memoria (TOMM) 1171
Iverson, GL y Franzen, MD (1996). Uso de múltiples procedimientos de memoria Paul, DS, Franzen, MD, Cohen, SH y Fremouw, W. (1992). Una investigación
de objetos para detectar simulación simulada. Journal of Clinical and sobre la fiabilidad y validez de dos pruebas utilizadas en la detección de
Experimental Neuropsychology, 8, 1–14. disimulo. Revista Internacional de Neuropsicología Clínica, 14, 1–9.
Lee, A., Boone, KB, Lesser, I., Wohl, M., Wilkins, S. y Parks, C. (2000).
Desempeño de pacientes mayores deprimidos en dos pruebas de simulación Philpott, LM y Boone, KB (1994). Los efectos del deterioro cognitivo y la edad
cognitiva: tasas de falsos positivos para las pruebas Rey 15Item Memorization en dos pruebas de simulación: una investigación de la prueba de memoria
y Dot Counting. El neuropsicólogo clínico, 14, 303–308. de Rey y la prueba de conteo de puntos de Rey en pacientes con Alzheimer
Lee, GP, Loring, DW y Martin, RC (1992). Prueba de memoria visual de 15 ítems y adultos normales de mediana edad/mayores. Trabajo presentado a la
de Rey para la detección de simulación: Observaciones normativas en Sociedad Internacional de Neuropsicología, Cincinnati, Ohio.
pacientes con trastornos neurológicos. Evaluación psicológica, 4, 43–46. Rey, A. (1964). El examen clínico en psicología. París: Press Uni
Versitaires de Francia.
Lezak, MD (1983). Evaluación neuropsicológica (2ª ed.). Nueva York: Oxford Schretlen, D., Brandt, J., Krafft, L. y Van Gorp, W. (1991). Algunas advertencias
University Press. sobre el uso de la prueba de memoria de 15 elementos de Rey para detectar
Lezak, MD, Howieson, DB y Loring, DW (2004). Evaluación neuropsicológica (4ª amnesia fingida. Evaluación psicológica, 3, 667–672.
ed.). Nueva York: Oxford University Press. Shum, DHK, O'Gorman, JGO y Alpar, A. (2004). Efectos del incentivo y el
tiempo de preparación en el rendimiento y la precisión de la clasificación en
McCaffrey, RJ, O'Bryant, SE, Ashendorf, L. y Fisher, JM (2003). las pruebas de memoria estándar y específicas de la memoria. Archivos de
Correlaciones entre las escalas de validez TOMM, Rey15 y MMPI2 en una neuropsicología clínica, 19, 817–823.
muestra de litigantes por TCE. Revista de neuropsicología forense, 3, 45– Slick, DJ, Tan, JE, Strauss, EH y Hultsch, DF (2004). Detección de simulación:
53. una encuesta de prácticas de expertos. Archivos de neuropsicología clínica,
Millis, SR y Kler, S. (1995). Limitaciones de la prueba Rey FifteenItem en la 19, 465–473.
detección de simulación. El Neuropsicólogo Clínico, 9, Taylor, LA, Kreutzer, JS y West, DD (2003). Evaluación de puntajes de corte
241–244. persistentes para la prueba Rey de 15 ítems: una serie de estudios de casos
Morgan, SF (1991). Efecto del verdadero deterioro de la memoria en una prueba de lesiones cerebrales. Lesión cerebral, 17, 295–308.
de validez de quejas de memoria. Archivos de neuropsicología clínica, 6, Vallabhajosula, B. y van Gorp, WG (2001). Admisibilidad postDaubert de la
327–334. evidencia científica sobre la simulación de déficits cognitivos.
Nelson, NW, Boone, K., Dueck, A., Wagener, L., Lu, P. y Grills, C. Revista de la Academia Estadounidense de Psiquiatría y Derecho, 29,
(2003). Relaciones entre ocho medidas de esfuerzo sospechoso. 207–215.
El neuropsicólogo clínico, 17, 263–272. Vickery, CD, Berry, DTR, Inman, TH, Harris, MJ y Orey, SA
Palmer, BW, Boone, KB, Allman, L. y Castro, DB (1995). Coaparición de lesiones (2001). Detección de esfuerzo inadecuado en pruebas neuropsicológicas:
cerebrales y exageración del déficit cognitivo. una revisión metaanalítica de procedimientos seleccionados. Archivos de
El neuropsicólogo clínico, 9, 68–73. neuropsicología clínica, 16, 45–73.
Prueba de simulación de memoria (TOMM)
OBJETIVO experto en el manejo de casos de lesiones personales (Slick et al., 2004).
Es similar a la Prueba de reconocimiento de memoria: caras (Warringon,
La prueba de simulación de memoria (TOMM) se utiliza para evaluar la
1984) en que implica el reconocimiento de estímulos pictóricos. Se
exageración o la simulación de deterioro de la memoria.
eligieron estímulos visuales porque la literatura sugiere que la memoria
de reconocimiento de imágenes es notablemente robusta en adultos
FUENTE mayores y en varias poblaciones con deterioro neurológico.
El kit completo (que incluye dos folletos de estímulo, 25 hojas de
El TOMM consta de dos pruebas de aprendizaje y una prueba de
puntuación y un manual) se puede solicitar a Multi Health Systems
retención. En cada ensayo de aprendizaje, al paciente se le muestran
(MHS), Inc., 908 Niagara Falls Blvd, North Tonawanda, NY 141202060
50 dibujos lineales (dibujos objetivo) de objetos comunes, durante 3 s
(http://www. .mhs.com), a un costo de $131 US.
cada uno, a intervalos de 1 s. Luego se le muestran al paciente 50
Hay software disponible que administra, califica e informa los resultados
del TOMM. El manual del software y los tres usos cuestan $45 US. paneles de reconocimiento, uno a la vez. Cada panel contiene una de
las imágenes objetivo presentadas anteriormente y una nueva imagen.
En esta tarea de reconocimiento de elección forzada, se requiere que el
paciente seleccione la imagen de destino mostrada anteriormente. Se
RANGO DE EDAD
proporciona retroalimentación explícita sobre la corrección de la
La prueba se puede utilizar con personas de 5 años o más. respuesta en cada ítem. Se utilizan las mismas 50 imágenes en cada
prueba. Sin embargo, se presentan en un orden diferente durante la
segunda prueba de aprendizaje. Hay una prueba de retención opcional
DESCRIPCIÓN
que se administra unos 15 minutos después de la prueba 2. Es similar a
El TOMM (Tombaugh, 1996) es la prueba de validez de síntomas las pruebas anteriores, excepto que las imágenes objetivo no se vuelven
(SVT) más comúnmente utilizado por los neuropsicólogos que están a administrar. Tombaugh (1996) sugirió que las dos pruebas de aprendizaje suelen s
Machine Translated by Google
1172 Evaluación del sesgo de respuesta y el rendimiento subóptimo
evaluar la simulación. Sin embargo, el uso de la prueba de retención ayuda a Etnicidad/Cultura
corroborar los resultados.
No se encontraron diferencias entre los niños que viven en Nueva York y en
Chipre (Constantinou y McCaffrey, 2003).
ADMINISTRACIÓN De manera similar, Donders (2005) no informó ningún impacto del origen étnico
en una muestra pediátrica en los Estados Unidos.
Ver Fuente. Brevemente, se le dice al paciente que el examinador evaluará la
capacidad del paciente para recordar 50 imágenes de objetos comunes.
Luego, el examinador presenta los estímulos de la prueba, registra las DATOS NORMATIVOS
respuestas en la hoja de registro para la prueba de reconocimiento de dos
opciones y brinda retroalimentación sobre la corrección de la respuesta. Muestras de estandarización
La versión computarizada parece dar resultados equivalentes a la versión
estándar del folleto, al menos en un paradigma de simulación (Rees et al., La prueba se desarrolló en muestras de personas que viven en la comunidad,
con edades comprendidas entre 16 y 84 años, y en una muestra de pacientes
1998). Sin embargo, pueden surgir diferencias en el contexto de las evaluaciones
remitidos para evaluación neuropsicológica (véase el cuadro 169). Tombaugh
clínicas, con la versión computarizada que produce una mayor sensibilidad al
(1996, 1997) informó que el desempeño en el Ensayo 2 fue muy alto para los
esfuerzo subóptimo (ver Validez y comentario). También se puede preferir la
no simuladores independientemente de la disfunción neurológica (excepto en
versión computarizada para evitar desafíos basados en procedimientos
el caso de la demencia).
administrativos imprecisos (Tombaugh, 2002).
Más del 95% de los adultos que viven en la comunidad obtuvieron una
puntuación de 49 o 50 en la segunda prueba. Además, las puntuaciones de
diferentes muestras clínicas mostraron que la mayoría de los individuos sin
HORA DE ADMINISTRACION demencia obtuvieron una puntuación perfecta en la prueba 2. Por el contrario,
los simuladores tendieron a obtener una puntuación inferior a 45 en la prueba
Se requieren alrededor de 15 minutos para la prueba.
2 o en la prueba de retención. En consecuencia, Tombaugh (ver Fuente)
recomienda que cualquier puntaje inferior a 45 en la Prueba 2 o en la Prueba
PUNTUACIÓN de Retención debe generar preocupación de que el individuo no está haciendo
el máximo esfuerzo. Otros (Powell et al., 2004; Teichner & Wagner, 2004)
Se otorga un punto por cada respuesta correcta proporcionada por el paciente
también informaron que los adultos sin demencia obtienen puntajes altos en el
en las pruebas de reconocimiento y retención. Por lo tanto, la puntuación
máxima en cada ensayo es 50. TOMM, con un punto de corte de 5 o más errores en el ensayo 2 o el ensayo
de retención, lo que arroja una alta tasa de aciertos. clasificación.
Tombaugh (ver Fuente) recomienda que, en lugar de usar la puntuación
EFECTOS DEMOGRÁFICOS de 45 como un punto de corte rígido, debe verse como una guía, con la
probabilidad de simulación aumentando a medida que la puntuación se desvía
Edad más del rendimiento de muestras clínicas específicas (ver Tablas 35 y 37 en
fuente).
Algunos han informado que la edad tiene poco impacto en los puntajes de las
Normalmente, se evalúa el número de respuestas correctas.
pruebas (Tombaugh, 1996, 1997); otros han notado relaciones moderadamente
Sin embargo, la versión informatizada también permite examinar las latencias
fuertes para el Ensayo 2 (r = −0,40) y el ensayo de Retención (r = −0,50) en
de respuesta. Rees et al. (1998) encontraron que las latencias de respuesta
adultos mayores (Teichner & Wagner, 2004). En los niños, la edad no tiene
son más largas (en promedio alrededor de 1 a 2 s) para los simuladores.
una asociación significativa con las puntuaciones del ensayo 2 (Constantinou y
McCaffrey, 2003; Donders, 2005).
Niños
Educación/coeficiente intelectual
Constantinou y McCaffrey (2003) proporcionaron datos normativos para una
La educación tiene poca relación con el desempeño en adultos (Gervais et al., muestra de 67 niños (44 niñas, 23 niños) que vivían en el norte del estado de
Nueva York. Estos datos se muestran en el cuadro 1610. Se obtuvieron
2004; Teichner & Wagner, 2004; Tombaugh, 1996) o niños (Constantinou &
McCaffrey, 2003). Por ejemplo, Gervais et al. (2004) reportaron una correlación valores similares para un grupo de niños que vivían en Chipre. Es de destacar
de .06 entre el TOMM y los años de educación. Por lo tanto, el logro educativo que 9 niños (4 chipriotas, 5 estadounidenses) tenían antecedentes médicos o
limitado probablemente no puede explicar el fracaso en el TOMM. No se psiquiátricos significativos. No obstante, todos se desempeñaron por encima
del límite de 45 en la Prueba 2.
informa la influencia del CI, aunque el déficit cognitivo de moderado a severo
parece tener un impacto (ver Validez).
FIABILIDAD
Consistencia interna
Género
Según Tombaugh (comunicación personal, noviembre de 1996), los coeficientes
El género no tiene impacto en los puntajes de las pruebas (Constantinou & Mc alfa (n = 40) fueron altos para cada prueba (prueba 1 = 0,94, prueba 2 = 0,95,
Caffrey, 2003; Donders, 2005; Rees et al., 1998). prueba de retención = 0,94).
Machine Translated by Google
Prueba de simulación de memoria (TOMM) 1173
Cuadro 169 Características de la muestra de estandarización TOMM
Número Experimento 1: 475 adultos que viven en la comunidad
Experimento 2: 70 adultos residentes en la comunidad
Experimento 3: 135 pacientes hospitalizados y ambulatorios en Boston VA diagnosticados
con una variedad de trastornos que incluyen amnesia, MS, PD, afasia,
demencia, lesión en la cabeza; También se incluyeron 23 personas con lesiones en la
cabeza involucradas en un estudio en Ottawa, Canadá.
Años de edad) Experimento 1: 16–84. M = 54,8, SD = 20,2
Experimento 2: 17–73, M = 37,8, SD = 14,2
Experimento 3: 19–90, M = 56,2, SD = 18,8
Ubicación geográfica Experimentos 1 y 2: Ottawa, Canadá
Experimento 3: Boston y Ottawa
Tipo de ejemplo Experimento 1 y 2: Individuos de la comunidad que participan en estudios de
envejecimiento en la memoria; reclutados en centros comerciales, organizaciones
sociales, trabajo, clases de psicología, boca a boca Experimento 3:
138 pacientes consecutivos remitidos para examen neuropsicológico en Boston VA (3
excluidos por demencia severa); 23 participantes con traumatismo craneoencefálico en
un estudio para tesis doctoral
Educación (años) Experimento 1: 8–21, M = 13,1, SD = 3,2
Experimento 2: 7–20, M = 12,7, SD = 1,9
Experimento 3: 4–21, M = 12,7, SD = 2,8
Género Experimento 1: 223 M, 252 F
Experimento 2: 44 M, 26 F
Experimento 3: NA No
Raza/Etnicidad informado
Poner en pantalla Experimentos 1 y 2: Se excluyó a cualquier persona con antecedentes autoinformados
de enfermedad neurológica, enfermedad psiquiátrica, lesión en la cabeza o accidente cerebrovascular
Experimento 3: No involucrado en litigios o audiencias de compensación
Nota: En el estudio de validación inicial (Experimento 1, Tombaugh, 1997), a individuos normales se les mostró el objetivo y tres distractores en la fase
de prueba. No se proporcionaron comentarios explícitos sobre la corrección de cada respuesta. En el Experimento 2 y los estudios de validación clínica
subsiguientes, el TOMM se convirtió en una prueba de reconocimiento de dos opciones, en lugar de cuatro opciones, para facilitar la evaluación del
rendimiento por debajo del azar. Además, se proporcionó retroalimentación prueba por prueba, lo que permitió a las personas realizar un seguimiento
más preciso de su desempeño y ajustarlo en consecuencia. Además, los efectos de la negligencia visual y la hemianopsia homónima se minimizaron
colocando las imágenes verticalmente en la página.
Confiabilidad de pruebareprueba Con una puntuación de corte de 45 en el Ensayo 2, los estudios de Tombaugh
(Rees et al., 1998; Tombaugh, 1996, 1997) revelaron tasas de especificidad
No hay información disponible.
superiores al 90 % cuando se consideraban personas con deterioro cognitivo
(de una variedad de afecciones neurológicas), afásicas y sin compensación.
VALIDEZ buscando pacientes con TBI. Sin embargo, la clasificación correcta de los
pacientes dementes como no simuladores fue deficiente. Alrededor del 27% de
Hallazgos clínicos
Una prueba diseñada para detectar defectos de memoria simulados debe ser Cuadro 1610 Puntuaciones medias y SD de los niños en el
sensible al engaño pero insensible al deterioro genuino de la memoria. La Estados Unidos en el TOMM
evidencia disponible sugiere que el TOMM muestra una promesa considerable
Edad
norte
Prueba 1 DE Prueba 2
en este sentido.
Dakota del Sur
medida de memoria. Además, el rendimiento parece ser relativamente 10 1 50,00 — 50,00 —
11 1 48,00 — 50,00 —
insensible al deterioro neurológico, aunque el deterioro cognitivo profundo
12 7 47.57 2.29 50.00 —
parece afectar el rendimiento. Usando un criterio
Fuente: Adaptado de Constantinou & McCaffrey, 2003.
Machine Translated by Google
1174 Evaluación del sesgo de respuesta y el rendimiento subóptimo
los pacientes diagnosticados con demencia obtuvieron puntajes inferiores a En apoyo de esta propuesta, existe evidencia de que las escalas de validez
45 en el Ensayo 2. De manera similar, Teicher y Wagner (2004) informaron del MMPI2 miden un constructo diferente a las pruebas de validez de las
que los adultos mayores (incluidos aquellos con deterioro cognitivo leve) se quejas cognitivas. McCaffrey et al. (2003) encontraron que las escalas de
desempeñan casi perfectamente en el Ensayo 2 y en el ensayo de Retención; validez del MMPI2 no se correlacionaron con ningún ensayo del TOMM, con
sin embargo, las tasas de clasificación errónea fueron altas (>70%) para los la excepción de la escala FB , que se correlacionó negativamente (r =
pacientes con demencia. −0,34) con el Ensayo 1 del TOMM.
Colby (2001) sugirió que los errores de falsos positivos se reducen (sin No obstante, la tarea puede tener alguna utilidad en la detección de
una disminución sustancial de la sensibilidad) en personas con y sin trastornos motivacionales en entornos psiquiátricos forenses. Las personas
demencia cuando se aplica un límite de más de 14 errores en el Ensayo 2 y sospechosas de fingir incompetencia para comparecer en juicio (por ejemplo,
Retención combinados (o >13 errores si solo se utiliza el Ensayo 2). 2) se las que enfrentan cargos por asesinato) tienden a obtener puntajes bajos en
utiliza y no se puede descartar demencia. Weinborn et al. (2003) apoyó el el TOMM (Heinze & Purisch, 2001; Weinborn et al., 2003). Usando los puntos
uso de estos puntos de corte entre pacientes con retraso mental leve. de corte descritos en el manual de la prueba, la especificidad tiende a ser
alta (90 % o más), aunque la sensibilidad es más baja (alrededor de 60 % a
El rendimiento en el TOMM no está relacionado con la duración del coma 67 %) en estos entornos.
(Donders, 2005) y solo está modestamente relacionado con las medidas de Tombaugh (1996, 2002) advirtió que la interpretación del TOMM involucra
aprendizaje y memoria. Tombaugh (1996) informó que las puntuaciones de muchos factores y que los pacientes pueden fallar en un tipo de prueba de
TOMM muestran correlaciones que van de .20 a .35 con medidas de validez de síntomas más que en otra debido a la relevancia del material de
aprendizaje verbal y visual de recuerdo libre (reproducción visual de WMS la prueba para sus quejas de presentación. Por ejemplo, Moore y Donders
R, CVLT y subprueba de lista de palabras de LAMB). Del mismo modo, Hill (2004) examinaron las derivaciones de TBI a un centro de rehabilitación y
et al. (2003) examinaron la relación entre las medidas de memoria encontraron que el TOMM y el ensayo Forced Choice del CVLTII eran
declarativa y el TOMM en pacientes con y sin disfunción del lóbulo temporal. igualmente sensibles al rendimiento inválido de la prueba. Hubo un fuerte
Informaron que la disfunción del lóbulo temporal podría afectar el rendimiento acuerdo, pero no perfecto, entre los dos instrumentos, lo que sugiere que los
del ensayo de retención, pero no hasta el punto de que el rendimiento de médicos no deben confiar únicamente en los resultados de una sola medida.
TOMM cayera por debajo de los criterios de corte para la simulación. En McCaffrey et al (2003) observaron que, aunque las puntuaciones en el
resumen, las personas que obtienen puntajes en el rango de deterioro en TOMM y en la prueba Rey de 15 ítems estaban moderadamente
las pruebas estandarizadas de aprendizaje y retención generalmente se correlacionadas entre sí (0,89 a 0,78), el TOMM identificó más del doble de
desempeñan bien en el TOMM. litigantes (27 %). como posibles simuladores que el Rey 15Item Test (11%).
Además, el TOMM parece ser moderadamente sensible a los defectos
motivacionales. Por ejemplo, Tombaugh (ver Fuente) entregó una batería de Aunque el TOMM parece ser más eficiente que el Rey para detectar un
pruebas neuropsicológicas, incluido el TOMM, a un grupo de 27 estudiantes esfuerzo subóptimo, otras pruebas parecen ser indicadores más potentes.
universitarios a quienes se les pidió que simularan los síntomas después de Tan et al (2002) utilizaron un paradigma de simulación para comparar la
una lesión en la cabeza y 22 controles. eficacia del TOMM; la prueba de memoria de palabras (WMT), una tarea de
Los participantes en la simulación demostraron puntuaciones más bajas reconocimiento de palabras; y la Prueba de Validez de Síntomas de Victoria
que los controles. En el Ensayo 2 en particular, todos los controles lograron (VSVT), una tarea de reconocimiento de dígitos.
una puntuación de 49 o más (100 % de especificidad), mientras que el 93 Aunque todas las tareas diferenciaron grupos, el TOMM demostró ser menos
% de los simuladores obtuvieron una puntuación inferior a 49 (93 % de efectivo. Usando los cortes sugeridos de los manuales de prueba, TOMM
sensibilidad). El análisis de los cuestionarios de información reveló que los clasificó erróneamente el 4 % de los controles como sospechosos, mientras
participantes no distinguieron el TOMM de otras pruebas como medida de que tanto VSVT como WMT clasificaron correctamente todos los controles
simulación. En un estudio posterior, se comparó el rendimiento de los en su grupo. Todos los simuladores fueron identificados con precisión por el
pacientes con TCE litigantes (n = 11) con el de un grupo de control que no WMT; El 12% no fueron identificados por el VSVT y el 20% no fueron
litigaba (n = 17), un grupo de sujetos normales cognitivamente intactos (n = identificados por el TOMM.
11) y un grupo de pacientes con afectación neuropsicológica focal reclutados Resultados similares fueron reportados recientemente por Gervais et al.
de una unidad neurológica (n = 12). En el ensayo 1, los pacientes con TBI (2004). Le dieron a 519 solicitantes de discapacidad el TOMM y otros dos
que "no estaban en riesgo" de simulación tuvieron un desempeño SVT, uno basado en el reconocimiento de dígitos (Evaluación computarizada
ligeramente más bajo que los sujetos normales o los pacientes con deterioro del sesgo de respuesta, CARB) y otro que emplea la memoria de
focal, pero se desempeñaron a niveles comparables en los otros dos reconocimiento verbal (WMT). Del total de la muestra, el 35% reprobó uno o
ensayos. Esto fue en marcado contraste con el desempeño sustancialmente más de los SVT. Más importante aún, las tasas de fracaso variaron
más bajo del grupo TBI "en riesgo". En los tres ensayos, las puntuaciones ampliamente de un SVT a otro. Más del doble de personas reprobaron el
del grupo de TBI "en riesgo" fueron significativamente más bajas que las de WMT que el TOMM. Las tasas de falla de CARB fueron intermedias entre
los otros grupos, que no diferían entre sí. las de las otras dos pruebas, pero más cercanas a las de TOMM. En
particular, solo una persona reprobó el TOMM pero pasó el WMT. Por lo
Los clientes que inflan las preocupaciones cognitivas también pueden tanto, las pruebas de memoria de reconocimiento utilizando estímulos
exagerar la angustia psicológica (Hill et al., 2003). Sin embargo, Tombaugh pictóricos, dígitos o estímulos verbales dieron como resultado tasas de
(2002) advirtió que el TOMM no es una prueba adecuada para evaluar si fracaso muy diferentes. La menor tasa de fallas en el TOMM puede sugerir
una persona está fingiendo un trastorno psiquiátrico. En una falta de inclinación general a fingir
Machine Translated by Google
Prueba de simulación de memoria (TOMM) 1175
alteraciones de la memoria no verbal a favor de los déficits de la memoria afectar negativamente el rendimiento de TOMM. Por lo tanto, las puntuaciones
verbal. Sin embargo, las puntuaciones inferiores a 45 en el TOMM fueron muy bajas no deben atribuirse a estas condiciones. Sin embargo, la sensibilidad
específicas, identificando correctamente un esfuerzo subóptimo en casi el es más baja que la de otras pruebas como la VSVT, la WMT y la CARB, lo
100% de los casos en los que se utilizó como criterio externo el fallo en el que da como resultado una alta tasa de clasificaciones falsas negativas.
WMT y/o CARB.
La búsqueda de una compensación financiera y un historial psiquiátrico Existe alguna evidencia de que el TOMM es redundante cuando se usa
previo aumentan el riesgo de un desempeño inválido en la prueba TOMM con otros SVT (p. ej., WMT, VSVT) para detectar el sesgo de respuesta
(Moore & Donders, 2004). Las personas con dificultades emocionales de (Gervais et al., 2004; Tan et al., 2002). Además, se percibe más a menudo
larga data pueden ser más propensas a cometer errores de atribución, como una medida de simulación que otras pruebas (WMT, VSVT), al menos
asociados con la subestimación de sus problemas premórbidos y el aumento cuando un examinador las administra cara a cara (Tan et al., 2002; pero ver
selectivo de los síntomas cognitivos y somáticos debido a la percepción de Tombaugh, 1997). Es posible que la administración informatizada aumente
que la disfunción como resultado de un trauma físico es más aceptable la sensibilidad de la tarea. Bolan et al. (2002) propusieron que puede ser
socialmente (Moore & Donders, 2004). menos amenazador dar respuestas incorrectas cuando se prueba con una
computadora (p. ej., como se hace típicamente con el WMT y el VSVT) que
Cabe señalar que la depresión (incluso de forma grave; Ashendorff et al., cuando lo prueba un experimentador (como se hace comúnmente con el
2004; Rees et al., 2001) y la ansiedad (Ashendorff et al., 2004) no afectan TOMM). Alternativamente, las personas pueden no estar dispuestas a fingir
negativamente el rendimiento en el TOMM. déficits de memoria no verbal (reconocimiento de imágenes) en lugar de
Incluso el deterioro cognitivo asociado con la psicosis en general no afecta verbal (reconocimiento de palabras).
el rendimiento de TOMM a un nivel que produciría un hallazgo falso positivo
(Duncan, 2005). No obstante, el TOMM puede ser una medida útil de la extensión del
Los puntos de corte de Colby (2001) pueden ayudar a reducir aún más el defecto motivacional, con el fracaso de la tarea asociado con formas más
riesgo de evaluaciones falsas positivas en casos de enfermedad mental flagrantes de exageración (Gervais et al., 2004).
psicótica grave (Weinborn et al., 2003). La experiencia del dolor (p. ej., bajo, También puede ser útil cuando se evalúan clientes de otras culturas
alto) dentro de la evaluación tampoco parece estar relacionada con los (Tombaugh, 2002) y, por lo tanto, tiene un rango de aplicación más amplio que
puntajes de las pruebas (Etherton et al., 2005; Gervais et al., 2004). otras tareas como Rey 15Item, VSVT y WMT. Recuérdese que Tombaugh
(1996) encontró que incluso los pacientes con trastornos afásicos logran
Gran parte de la literatura sobre el esfuerzo subóptimo se ha centrado en puntajes altos en el TOMM. Además, Constantinou y McCaffrey (2003)
los adultos. Hay evidencia de que el TOMM también tiene potencial para examinaron a niños en Chipre y Estados Unidos y encontraron que el
identificar a los niños que no se esfuerzan al máximo. desempeño de TOMM no se vio afectado por las diferencias en los
Constantinou y McCaffrey (2003) encontraron que el rendimiento de los niños antecedentes culturales.
tanto en los Estados Unidos como en Chipre era comparable al de los adultos
(con puntajes > 45 en el Ensayo 2). Un estudio de simulación reciente sugirió que la prueba es relativamente
De manera similar, Donders (2005) informó que el 97 % de una muestra insensible a diferentes paradigmas de entrenamiento (orientado por síntomas,
pediátrica (más de la mitad de los cuales había sufrido una lesión cerebral orientado por pruebas; Powell et al., 2004). Sin embargo, el editor de la prueba
traumática) superó el límite de esfuerzo suficiente para adultos en la segunda prueba.
ha notado instancias de personas que buscan en Internet información sobre
Por lo tanto, es posible que los hallazgos inusuales no se atribuyan a factores simulación y cómo responder a pruebas específicas de uso común, como el
como la edad o los antecedentes culturales. TOMM, para evadir la detección. En consecuencia, como precaución, el editor
recomienda que el encuestado no vea el nombre de la prueba en ningún
momento durante la administración, lo que reduce la oportunidad de utilizar
COMENTARIO
cualquier información aprendida previamente.
El TOMM parece ser más útil que el Rey 15Item Test para detectar la
exageración de las dificultades cognitivas. También se ha sugerido que el
TOMM posee suficiente validez para cumplir con los criterios de Daubert para
la admisibilidad de evidencia científica en la sala del tribunal (Vallabhajosula
& van Gorp, 2001; Tombaugh, 2002). La especificidad es alta, lo que genera referencias
pocos falsos positivos cuando se puede descartar la demencia o el retraso
mental. En el contexto de demencia leve, psicosis residual o retraso mental Ashendorf, L., Constantinou, M. y McCaffrey, RJ (2004). El efecto de la
leve, se recomienda el uso de los puntos de corte de Colby (2001). No se depresión y la ansiedad en el TOMM en adultos mayores que viven
recomienda el uso de la prueba si no se puede descartar un retraso mental en la comunidad. Archivos de Neuropsicología Clínica, 19,
moderado o formas moderadas/graves de demencia. 125–130.
Bolan, B., Foster, JK, Schmand, B. y Bolan, S. (2002). Una comparación
de tres pruebas para detectar amnesia fingida: los efectos de la
retroalimentación y la medición de la latencia de respuesta. Revista
Los incentivos financieros y la inadaptación psiquiátrica premórbida son
de Neuropsicología Clínica y Experimental, 24, 154–167.
factores de riesgo importantes con respecto al desempeño inválido. Los
Colby, F. (2001). Uso de la distribución binomial para evaluar el esfuerzo:
usuarios deben tener en cuenta que una variedad de factores como la edad, pruebas de elección forzada en entornos neuropsicológicos.
la baja educación, la depresión, la ansiedad y el dolor no Neurorehabilation, 16, 253–265.
Machine Translated by Google
1176 Evaluación del sesgo de respuesta y el rendimiento subóptimo
Constantinou, M. y McCaffrey, RJ (2003). Uso del TOMM para evaluar el esfuerzo Rees, LM, Tombaugh, TN y Boulay, L. (2001). La depresión y la prueba de la
de los niños para desempeñarse de manera óptima en medidas simulación de la memoria. Archives of Clinical Neuropsy chology, 16, 501–
neuropsicológicas. Neuropsicología infantil, 9, 81–90. 506.
Donders, J. (2005). Rendimiento en el Test de Simulación de Memoria en una Rees, LM, Tombaugh, TN, Gansler, DA y Moczynski, NP
muestra pediátrica mixta. Neuropsicología infantil, 11, 221–227. (1998). Cinco experimentos de validación del Test of Memory Malingering
Duncan, A. (2005). El impacto del deterioro cognitivo y psiquiátrico o de los (TOMM). Evaluación psicológica, 10, 10–20.
trastornos psicóticos en el Test of Memory Simulating (TOMM). Evaluación, Slick, DJ, Tan, JE, Strauss, EH y Hultsch, DF (2004). Detección de simulación:
12, 123–129. una encuesta de prácticas de expertos. Archivos de neuropsicología clínica,
Etherton, JL, Bianchini, KJ, Greve, KW y Ciota, MA (2005). 19, 465–473.
Prueba de memoria El rendimiento de simulación no se ve afectado por el Tan, JE, Slick, DJ, Strauss, E. y Hultsch, DF (2002). ¿Cómo lo hicieron?
dolor inducido en el laboratorio: implicaciones para la indicación clínica. Estrategias de simulación en las pruebas de validez de los síntomas. The
Archivos de neuropsicología clínica, 20, 375–384. Clinical Neuropsychologist, 16, 495–505.
Gervais, RO, Rohling, ML, Green, P. y Ford, W. (2004). Una comparación de Teicher, G. y Wagner, MT (2004). La prueba de simulación de memoria (TOMM):
las tasas de fallas de WMT, CARB y TOMM en reclamantes por discapacidad datos normativos de pacientes con demencia cognitivamente intactos,
que no son por lesiones en la cabeza. Archivos de neuropsicología clínica, cognitivamente deteriorados y ancianos. Archivos de neuropsicología clínica,
19, 475–487. 19, 455–464.
Heinze, M. y Purisch, AD (2001). Debajo de la máscara: uso de pruebas Tombaugh, Tennessee (1996). Test de Simulación de Memoria (TOMM).
psicológicas para detectar y subtipificar simulación en acusados penales. North Tonawanda, Nueva York: Multi Health Systems.
Revista de Práctica de Psicología Forense, 1, 23–52. Tombaugh, T. (1997). La prueba de simulación de memoria (TOMM): datos
Hill, SK, Ryan, LM, Kennedy, CH y Malamut, BL (2003). La relación entre las normativos de individuos cognitivamente intactos y con deterioro cognitivo.
medidas de memoria declarativa y la prueba de simulación de memoria en Evaluación psicológica, 9, 260–268.
pacientes con y sin disfunción del lóbulo temporal. Revista de Neuropsicología Tombaugh, T. (2002). El Test of Memory Malingering (TOMM) en neuropsicología
Forense, 3, 1–18. forense. Diario de Neuropsicología Forense, 2,
McCaffrey, RJ, O'Bryant, SE, Ashendorf, L. y Fisher, JM (2003). 69–96.
Correlaciones entre las escalas de validez TOMM, Rey15 y MMPI2 en una Vallabhajosula, B. y van Gorp, WG (2001). Admisibilidad postDaubert de la
muestra de litigantes por TCE. Revista de neuropsicología forense, 3, 45– evidencia científica sobre la simulación de déficits cognitivos.
53. Revista de la Academia Estadounidense de Psiquiatría y Derecho, 29,
Moore, BA y Donders, J. (2004). Predictores del rendimiento inválido de pruebas 207–215.
neuropsicológicas después de una lesión cerebral traumática. Lesión Warrington, E. (1984). Prueba de memoria de reconocimiento. Windsor, Inglaterra:
cerebral, 18, 975–984. NFERNelson.
Powell, MR, Gfeller, JD, Hendricks, BL y Sharland, M. (2004). Weinborn, M., Orr, T., Woods, SP, Canover, E. y Feix, J. (2003). Una validación
Detección de simuladores entrenados por síntomas y pruebas con la prueba de la prueba de simulación de memoria en un entorno psiquiátrico forense.
de simulación de memoria. Archivos de Neuropsicología Clínica, 19, Revista de Neuropsicología Clínica y Experimental, 25, 979–990.
693–702.
Prueba de 21 ítems
OBJETIVO paradigma de validez de síntoma que fue popularizado por Pankratz (1983;
Pankratz et al., 1975). Se compone de una lista objetivo de 21 sustantivos que
La prueba de 21 ítems está diseñada para identificar la exageración o la
se leen al cliente (consulte la Figura 165). Las listas de palabras contienen 7
simulación de un deterioro de la memoria.
pares de palabras que riman, 7 pares de palabras semánticamente similares
y 7 pares de palabras sin relación semántica. Después de la presentación de la
FUENTE lista, se le indica al cliente que recuerde libremente
El manual y los protocolos de prueba se pueden solicitar a Grant Iverson, Ph.D.,
Department of Psychiatry, 2255 Wesbrook Mall, University of British Columbia, Figura 165 Palabras objetivo en la prueba de 21 ítems. Fuente: Copyright
Grant Iverson y Michael Franzen. Reproducido con permiso de los autores.
Vancouver, BC, Canada V6T 2A1, a un costo de $23 USD o $28 Cdn.
Prueba de 21 ítems 1177
tantas palabras como sea posible. Una segunda lista de 21 sustantivos se utiliza Etnicidad
como complemento en una tarea de reconocimiento. Inmediatamente después
No se informan los efectos del origen étnico.
de la prueba de recuerdo libre, se le da al cliente la tarea de reconocimiento de
elección forzada de dos alternativas y se le indica que seleccione la palabra que
se presentó previamente de la lista de objetivos. DATOS NORMATIVOS
Se recomienda una puntuación de corte de 9 en el componente de elección
ADMINISTRACIÓN forzada, porque parece aproximarse a un límite inferior de rendimiento para
individuos reales con problemas de memoria (Iverson y Franzen, 1996; véase
Se le dice al cliente que el examinador presentará una lista de palabras y que el
también Gontkovsky y Souheaver, 2000). La respuesta aleatoria en el componente
cliente debe recordar tantas como sea posible. Luego, el examinador lee la lista
de elección forzada de la prueba da como resultado una puntuación de entre 7 y
de palabras a una velocidad de una palabra cada 1,5 s (tomando alrededor de
14. Por lo tanto, si una persona obtiene una puntuación de 6 o menos, se puede
30 a 33 s para leer la lista completa). Inmediatamente después de leer la última
suponer que eligió deliberadamente respuestas incorrectas.
palabra, se le pide al cliente que recuerde todas las palabras que escuchó.
Después de que el cliente haya recordado la última palabra, el examinador lee
Dos puntajes adicionales en la Prueba de 21 ítems se han mostrado
una lista de pares de palabras y se le pide al cliente que elija la palabra que
prometedores como indicadores de respuestas sesgadas. La puntuación de
estaba en la lista original. Tanto en las pruebas de recuerdo libre como en las de
inconsistencia representa el número de palabras recordadas en el recuerdo libre
elección forzada, el examinador registra las respuestas del cliente en el formulario
que posteriormente se pierden en el reconocimiento de elección forzada.
de respuestas.
Este hallazgo es raro en las muestras de control y en los pacientes que se
esfuerzan al máximo. Iverson (1998) recomendó una puntuación límite de
HORA DE ADMINISTRACION inconsistencia de 3 como indicador de sesgo de respuesta. La segunda
puntuación significativa es el mayor número de fallos consecutivos. Un gran
La prueba completa tarda unos 5 minutos en administrarse y puntuarse.
número de fallos consecutivos en la tarea de elección forzada es tanto
clínicamente improbable como estadísticamente improbable. Cinco fallos
PUNTUACIÓN consecutivos en el componente de elección forzada rara vez ocurren entre
individuos que están haciendo su mejor esfuerzo. La probabilidad de perder 5
La puntuación principal derivada de la prueba es el número total de respuestas respuestas consecutivas, suponiendo una estrategia de respuesta aleatoria, es
correctas en la tarea de elección forzada. Los puntajes adicionales incluyen el 0,03.
número total de respuestas correctas en el recuerdo libre que posteriormente se Iverson (1998) proporcionó un esquema de interpretación para ser utilizado
pierden en la elección forzada (puntaje de inconsistencia) y el mayor número de con pacientes que tienen lesiones leves en la cabeza u otras formas de deterioro
errores consecutivos en la tarea de elección forzada. cerebral leve. El esquema se proporciona en el cuadro 1611 y se informa que
se basa en muestras de pacientes atendidos para evaluación neuropsicológica
de trastornos neurológicos o psiquiátricos significativos.
EFECTOS DEMOGRÁFICOS
Edad FIABILIDAD
Iverson et al. (1994) encontraron una relación negativa moderada entre las
puntuaciones de recuerdo libre y la edad (r = −0,38) entre los individuos que no Consistencia interna
simulaban. Arnett y Franzen (1997) también reportaron hallazgos similares. La
El coeficiente alfa en los simuladores que simulan una lesión en la cabeza es
edad no mostró relación con el rendimiento de elección forzada en sujetos no
marginal a bueno (0,65 a 0,81; Inman et al., 1998).
simuladores (Iverson et al., 1994).
Confiabilidad de pruebareprueba
Educación
No hay información disponible.
Iverson et al. (1994) informó que la educación no estaba relacionada con el
rendimiento de recuerdo libre. Por el contrario, Arnett y Franzen (1997) notaron
que, en una población que abusa de sustancias, la educación se correlacionó
significativamente (valor no informado) con el número correcto en la puntuación Tabla 1611 Interpretación del rendimiento de la prueba de 21 ítems
de recuerdo libre. La educación no se correlacionó con el rendimiento de elección
Puntaje Sospechoso Altamente sospechoso Sesgado
forzada en sujetos no simuladores (Iverson et al., 1994).
Decisión forzada 12 9–11 8 o menos
No se informan los efectos de género. Fuente: Adaptado de Iverson, 1998.
Machine Translated by Google
1178 Evaluación del sesgo de respuesta y el rendimiento subóptimo
COMENTARIO
VALIDEZ
Las puntuaciones de reconocimiento de la prueba de 21 ítems muestran una
Hallazgos clínicos alta especificidad pero una baja sensibilidad, lo que sugiere que el uso de esta
medida como una sola pantalla daría como resultado una cantidad inaceptable
Iverson y sus colegas (Iverson & Franzen, 1996; Iverson et al., 1991, 1994)
de decisiones negativas falsas (Vickery et al., 2001). Por lo tanto, el clínico
demostraron que los controles se desempeñan mejor que los simuladores en la
debe usar más que este único procedimiento. Dada su brevedad y alta
tarea. Por ejemplo, Iverson y Franzen (1996) aplicaron la prueba de 21 ítems
especificidad, la prueba de 21 ítems se puede utilizar mejor al comienzo de un
junto con varias medidas (cuestionario de orientación/historia personal,
examen neuropsicológico, como una pantalla rápida como parte de una batería
modificación de la prueba de 15 ítems de Rey, extensión de dígitos, memoria
de tareas para un esfuerzo menos que óptimo.
lógica WMSR con suplemento de elección forzada) a 20 estudiantes
Es probable que la prueba resulte menos sensible a la exageración si se usa
universitarios y 20 pacientes psiquiátricos hospitalizados. Las pruebas se
de forma reactiva; es decir, si se usa a la mitad de la evaluación, después de
realizaron dos veces en un diseño contrabalanceado de medidas repetidas. En
que surjan sospechas de un esfuerzo sesgado. El cliente habrá estado expuesto
una condición, se instruyó a los sujetos para que hicieran su mejor esfuerzo,
a una variedad de medidas neuropsicológicas difíciles, de modo que la Prueba
y en la otra condición, se les instruyó para simular un deterioro de la memoria.
de 21 ítems parecerá relativamente simple y directa. Los usuarios deben tener
Los sujetos simulados se desempeñaron peor tanto en el reconocimiento de
en cuenta que las personas que tienen algún conocimiento práctico de la
recuerdo libre como en el de elección forzada que los controles o los
memoria normal pueden evitar fácilmente la detección en esta tarea. La
participantes con problemas de memoria. Sin embargo, el procedimiento de
puntuación de recuerdo libre parece ser sensible al verdadero deterioro de la
elección forzada fue más sensible a los efectos del disimulo.
memoria y, por lo tanto, no debe usarse para inferir simulación.
La aplicación de una puntuación de corte de 9, que eliminó los falsos positivos
Las listas de palabras contienen pares de palabras que riman, pares de
en el componente de elección forzada, dio como resultado una tasa de
palabras semánticamente similares y pares de palabras sin relación semántica.
clasificación correcta del 100 % para el control normal y los sujetos con
El emparejamiento se hizo para determinar si alguna de estas variables tendría
problemas de memoria, del 22,5 % para los simuladores experimentales y del
valor discriminante (Iverson, 1998). Hasta la fecha, no ha habido ninguna
69 % en general. Una puntuación de corte de 13 dio como resultado una tasa
investigación que respalde el valor discriminante de estas variables.
de clasificación mucho más alta, pero también algunas clasificaciones de falsos
positivos. Las actuaciones de los sujetos también se compararon con el azar.
En el componente de elección forzada, las personas que emplean una estrategia
de respuesta aleatoria obtendrían entre 7 y 15 respuestas correctas el 95 % de
referencias
las veces. Los sujetos con una puntuación de 6 o menos se están desempeñando
por debajo del azar, lo que indica claramente que no están realizando un esfuerzo óptimo.
Arnett, PA y Franzen, MD (1997). Desempeño de adictos a sustancias con déficits
Ninguno de los sujetos de control o con problemas de memoria en estos tres
de memoria en medidas de simulación.
estudios se desempeñó por debajo del azar, mientras que entre el 10% y el
Archivos de neuropsicología clínica, 12, 513–518.
60% de los simuladores experimentales obtuvieron puntajes en este rango Franzen, MD y Martin, N. (1996). ¿Las personas con conocimiento fingen mejor?
(Iverson & Franzen, 1993). Neuropsicología aplicada, 3, 82–85.
Vale la pena señalar que los individuos sofisticados (p. ej., individuos con Frederick, RI, Sarfaty, SD, Johnston, JD y Powel, J. (1994). Validación de un
formación en psicología) pueden fácilmente evitar ser detectados en esta tarea detector de sesgo de respuesta en una prueba de capacidad no verbal de
y desempeñarse por encima del límite recomendado (Franzen & Martin, 1996). elección forzada. Neuropsicología, 8, 118–125.
Sin embargo, estos mismos individuos se detectan fácilmente mediante otras Gontkovsky, ST y Souheaver, GT (2000). ¿Los pacientes con daño cerebral son
técnicas (p. ej., evaluación de rango de dígitos, puntajes de reconocimiento de etiquetados de manera inapropiada como simulación utilizando la prueba de 21
ítems y la prueba de reconocimiento de elección forzada de memoria lógica
memoria lógica).
WMSR? Informes psicológicos, 87, 512–514.
Una revisión metaanalítica reciente (Vickery et al., 2001) de una variedad
Inman, TH, Vickery, CD, Lamb, DG, Edwards, CL y Smith, GT
de procedimientos para detectar fingir/exageración sugirió que la prueba de
(1998). Desarrollo y validación inicial de un nuevo procedimiento para evaluar
21 elementos muestra una alta especificidad (100 %) pero poca sensibilidad
la adecuación del esfuerzo realizado durante las pruebas neuropsicológicas:
(22 %). Otras pruebas (p. ej., el procedimiento de reconocimiento de dígitos The Letter Memory Test. Evaluación psicológica, 10, 128–139.
de Hiscock & His cock, la prueba de reconocimiento de dígitos de Portland, la Iverson, GL (1998). Manual de investigación de prueba de 21 ítems. Vancouver, BC:
prueba de capacidad no verbal de elección forzada, la prueba de memoria de Autor.
letras) son más eficaces para distinguir a los respondedores honestos de los Iverson, GL y Franzen, MD (1993). Un breve instrumento de evaluación diseñado
que disimulan (Frederick et al., 1994; Inman et al. al., 1998; Rose et al., 1998; para detectar déficits de memoria simulados. The Behav ior Therapist, mayo,
véase Vickery et al., 2001 para una revisión). La baja sensibilidad de la prueba 134–135.
de 21 ítems sugiere que es posible que sea necesario considerar alguna Iverson, GL y Franzen, MD (1994). La prueba de memoria de reconocimiento, la
extensión de dígitos y la prueba del cubo de Knox como marcadores de deterioro
modificación de la puntuación de corte (Vickery et al., 2001).
de la memoria simulada. Evaluación, 1, 323–334.
Iverson, GL y Franzen, MD (1996). Uso de múltiples procedimientos de memoria
Arnett y Franzen (1997) encontraron que la medida de recuerdo libre era
objetiva para detectar simulación simulada. Revista de Neuropsicología Clínica
sensible al deterioro real de la memoria en un grupo que abusaba de
y Experimental, 18, 38–51.
sustancias. Notaron una correlación de .52 entre el índice de memoria retrasada Iverson, GL, Franzen, MD y McCracken, LM (1991). Evaluación de una técnica de
WMSR y el índice de recuerdo libre de la prueba de 21 ítems. evaluación objetiva para la detección de déficits de memoria simulados. Ley y
comportamiento humano, 15, 667–676.
Machine Translated by Google
Prueba de validez de síntomas de Victoria (VSVT) 1179
Iverson, GL, Wilhelm, K. y Franzen, MD (1992). Evaluación objetiva de los Pankratz, L., Fausti, SA y Peed, S. (1975). Una técnica de elección forzada
déficits de memoria simulados: Criterios de calificación adicionales para para evaluar la sordera en el paciente histérico o simulador. Revista de
la Prueba de 21 ítems. Trabajo presentado a la Academia Nacional de Consultoría y Psicología Clínica, 433,
Neuropsicología, Pittsburgh, Penn. 421–422.
Iverson, GL, Franzen, MD y McCracken, LM (1994). Aplicación de un Rose, FE, Hall, S., SzaldaPetree, AD y Bach, PJ (1998). Una comparación
procedimiento de memoria de elección forzada diseñado para detectar de cuatro pruebas de simulación y los efectos del entrenamiento.
simulación experimental. Archivos de Neuropsicología Clínica, 9, Archivos de neuropsicología clínica, 13, 349–363.
437–450. Vickery, CD, Berry, DTR, Inman, TH, Harris, MJ y Orey, SA
Pankratz, L. (1983). Una nueva técnica para la evaluación y modificación (2001). Detección de esfuerzo inadecuado en pruebas neuropsicológicas:
del déficit de memoria fingido. Habilidades perceptivas y motoras, 57, una revisión metaanalítica de procedimientos seleccionados. Archivos
367–372. de neuropsicología clínica, 16, 45–73.
Prueba de validez de síntomas de Victoria (VSVT)
OBJETIVO Se consideran válidos los protocolos en los que el número de elementos
correctos está por encima del azar.
La Prueba de Validez de Síntomas de Victoria (VSVT) se utiliza para evaluar
Slick et al. (1994, 1996, 1997) modificaron la tarea de varias formas. En
la exageración o fingir quejas de memoria.
primer lugar, el tiempo de administración de la tarea original fue bastante
largo, entre 30 y 40 minutos. Por lo tanto, el número de ítems se redujo de 72
a 48, reduciendo a la mitad el tiempo de administración. En segundo lugar,
FUENTE
se manipuló la dificultad de los elementos, haciendo que los elementos
La versión computarizada de esta prueba (incluido el disco para uso ilimitado parecieran más difíciles de lo que en realidad son. Los elementos fáciles son
y el manual) puede solicitarse a Psychological Assessment Resources, Inc., aquellos en los que la hoja y el número de estudio no comparten dígitos
PO Box 998, Odessa, FL 33556 (http://www.parinc.com). El costo es de $499 comunes (p. ej., 34092 y 56187), por lo que el reconocimiento del primer,
dólares estadounidenses. Se puede hacer una versión de tarjeta invertida, último o cualquier otro dígito o patrón de dígitos del número de estudio
utilizando la descripción provista aquí, si no hay una computadora disponible. facilitará una elección correcta. . Los artículos duros son aquellos en los que
la lámina es idéntica al número de estudio con la excepción de una
transposición del segundo y tercer o tercer y cuarto dígito (por ejemplo, 46923
y 46293). Para elegir correctamente en artículos duros, se debe recordar el
RANGO DE EDAD orden de los dígitos del medio; el reconocimiento del primer o último dígito del
número de estudio no ayudará a hacer una elección correcta. Al igual que el
La prueba se ha utilizado con personas mayores de 18 años.
aumento en los intervalos de retención, se supone que la diferencia en la
dificultad real entre los elementos fáciles y difíciles es pequeña.
DESCRIPCIÓN
En tercer lugar, también se registra el tiempo de respuesta. El rendimiento
Hiscock y Hiscock (1989) desarrollaron una tarea de reconocimiento de por debajo del azar en p < 0,05 se etiqueta como inequívocamente inválido/
elección forzada de dos alternativas para evaluar las quejas de memoria. En simulado, y el rendimiento significativamente por encima del azar en p < 0,05
su tarea, se presenta un número de cinco dígitos en una tarjeta durante un se etiqueta como inequívocamente válido. Una tercera categoría, etiquetada
período de estudio de 5 s, seguido después de un breve retraso por otra como “cuestionable”, consta de puntajes que caen dentro del intervalo de
tarjeta que contiene la opción correcta y un florete. Las respuestas correctas confianza del 90% restante del desempeño al azar. Los datos más recientes
siempre se pueden distinguir de las láminas reconociendo el primer o el basados en pacientes con trastornos graves de la memoria de buena fe han
último dígito. Para aumentar la validez aparente de la tarea, el período entre resultado en pautas adicionales (consulte Datos normativos).
el estudio y el reconocimiento se aumenta abiertamente a 10 y luego a 15 s.
A los sujetos que simulan se les indica que se desempeñen mal al decirles El VSVT incluye un total de 48 ítems, presentados en tres bloques de 16
que la prueba es difícil para aquellos con problemas de memoria y que el ítems cada uno. En cada bloque, se presenta un número de cinco dígitos en
nivel de dificultad aumenta con el intervalo de retención. Debido a que todos el centro del monitor de una computadora, seguido de un intervalo de retención
los elementos tienen dos posibilidades de respuesta, las tasas de error de pantalla en blanco, después del cual se muestran el número de estudio
generales deben ser de aproximadamente el 50 % en condiciones de mostrado anteriormente y una lámina de cinco dígitos, uno a cada lado del
respuesta aleatoria. bloque. pantalla central. Los sujetos responden presionando una de las dos
Es decir, las puntuaciones en este rango serían el resultado de (a) teclas (desplazamiento a la izquierda o a la derecha) en el teclado. El lado
alteraciones graves en la atención y/o la memoria o (2) exageración de los de las opciones correctas y las láminas están contrabalanceadas y
síntomas. Es menos probable que las tasas de error que se apartan del 50 % pseudoaleatorizadas. El intervalo de retención es de 5 s en el primer bloque
se hayan producido solo por casualidad, con una probabilidad asociada que y aumenta a 10 y luego a 15 s en el segundo y tercer bloque, respectivamente.
se calcula fácilmente. El rendimiento por debajo del azar con una probabilidad Las tres secciones contienen el mismo número (ocho cada una) de elementos
baja (p. ej., p < 0,05) es indicativo de una elección deliberada de respuestas fáciles y difíciles. Dentro de las secciones, el orden de los elementos fáciles y
incorrectas (es decir, simulación). difíciles.
Machine Translated by Google
1180 Evaluación del sesgo de respuesta y el rendimiento subóptimo
y la ubicación de la pantalla (izquierda o derecha) de las láminas se pseudoaleatoriza. EFECTOS DEMOGRÁFICOS
Edad
En adultos (mayores de 18 años), la edad no tiene (Grote et al., 2000; Slick et al.,
ADMINISTRACIÓN
1997; Strauss et al., 2002) o tiene poco (Loring et al., 2005) impacto en la precisión.
La presentación de la prueba es controlada por el programa de computadora. El
examinador debe asegurarse de que el paciente esté correctamente orientado hacia
el monitor y el teclado. El examinador puede ingresar respuestas para clientes que
Educación
no pueden usar ambas manos para el teclado. Los clientes deben estar familiarizados
con la lectura de números arábigos. Los años de educación no influyen en las puntuaciones de precisión en el VSVT
(Slick et al., 1997; Strauss et al., 2002).
HORA DE ADMINISTRACION Género
Se requieren alrededor de 15 a 20 minutos para la prueba. De manera similar, el género no tiene impacto en los puntajes de las pruebas (Slick
et al., 1997; Strauss et al., 2002).
PUNTUACIÓN
Etnicidad
La calificación de la prueba es proporcionada por el programa de computadora. Los
No se informan los efectos del origen étnico.
resultados se imprimen para la prueba como un todo (es decir, de 48), así como
para cada sección. Se proporciona la siguiente información resumida.
DATOS NORMATIVOS
1. El número de intentos correctos para cada nivel de dificultad de bloque La interpretación de las puntuaciones VSVT generadas por computadora se ha
y elemento, junto con el número máximo de elementos correctos (p. basado en gran medida en la teoría de la probabilidad binomial (Slick et al., 1996,
ej., 6/8). 1997). Este enfoque proporciona un indicador de la validez del desempeño del
2. Puntajes Z derivados de una curva de probabilidad binomial centrada encuestado en relación con lo que se predeciría basándose únicamente en el azar
en el desempeño del nivel de oportunidad (50% correcto). (es decir, si un encuestado hubiera aprobado los elementos de manera completamente
Una puntuación z de 0 indica un rendimiento de nivel de probabilidad aleatoria). Las puntuaciones de los ítems total, fácil y difícil se pueden evaluar con
exacto, con la mitad de los elementos aprobados. Los puntajes Z se referencia a la tabla 1612. Estas son las pautas utilizadas en el informe generado
traducen directamente a valores p , lo que indica la probabilidad por computadora. Es importante señalar que los puntajes de corte no tienen en
de que un paciente obtenga un puntaje particular solo por casualidad cuenta las diferentes condiciones de la tasa base. En consecuencia, una matriz de
(es decir, respondiendo aleatoriamente). Las puntuaciones confianza de clasificación está disponible en el manual de prueba para que los
positivas altas (z > 1,65) indican un rendimiento mejor que el azar, y puntajes en los ítems difíciles puedan evaluarse con respecto a varias condiciones
las puntuaciones negativas bajas (z < −1,65) representan un de tasa base.
rendimiento peor que el azar.
3. El sesgo es una medida de la tendencia a usar una mano más que la otra. Los puntajes de probabilidad binomial responden a la pregunta: ¿qué tan
Las puntuaciones pueden variar desde −1 (usando solo la mano probable es que este puntaje ocurra solo por casualidad? Un método alternativo
izquierda) hasta +1 (usando solo la mano derecha). Las puntuaciones para determinar la probabilidad de simulación es evaluar los datos normativos
altas (< 0,6) plantean la cuestión de una percepción (p. ej., un defecto obtenidos de individuos sanos y de personas con deterioro cognitivo genuino. De
del campo visual), un defecto motor o algún otro conjunto de esta manera, se puede evaluar la rareza clínica de las puntuaciones de un cliente
respuestas inusuales. (en litigio). Si el individuo se desempeñó peor que la mayoría de los no litigantes con
4. Latencia de respuesta media (y desviación estándar) a elementos lesiones o condiciones de similar
fáciles y difíciles en milisegundos.
Cuadro 1612 Clasificación del desempeño del cliente por puntajes en el VSVT derivado
Del Análisis Probabilístico
Prueba de validez de síntomas de Victoria (VSVT) 1181
Cuadro 1613 Clasificación del desempeño del cliente por puntuaciones en el VSVT
derivadas de pacientes con deterioro de la memoria que no litigan
cuestionablemente Probablemente
o mayor gravedad que las del cliente, se debe considerar la simulación. criterios alternativos: 3 s para los ítems fáciles y 4 s para los difíciles
elementos.
Slick et al. (1996) encontraron que ningún individuo sano o paciente que Las puntuaciones de desviación estándar para las latencias de respuesta
no buscaba compensación obtuvo una puntuación de 15 o menos en los se proporcionan en la copia impresa de la computadora. Los pacientes que
ítems difíciles. Estudios posteriores (Doss et al., 1999; Grote et al., 2000; Slick buscan compensación tienden a ser más variables en sus latencias de
et al., 2003) han validado y ampliado los hallazgos iniciales de Slick y sus respuesta que los clientes que no buscan compensación. Grote et al. (2000)
colegas. Al evaluar a los no litigantes con déficits cognitivos significativos recomendaron un punto de corte para la desviación estándar de 1,9 so menos.
(incluido el deterioro profundo de la memoria), han proporcionado puntajes
de corte con base empírica para mejorar la sensibilidad de la medida. Por
ejemplo, Slick et al. (2003) evaluaron a seis pacientes no litigantes con FIABILIDAD
deterioro significativo de la memoria (p. ej., debido a un aneurisma de la
ACA, enfermedad de Korsakoff). Todos obtuvieron puntajes perfectos en los
Consistencia interna
ítems fáciles y puntajes casi perfectos (≥22) en los ítems difíciles. Doss et al.
(1999) observaron que uno de sus pacientes con un diagnóstico de probable Slick (1996) informó que los alfas para los 24 ítems fáciles, los 24 ítems
demencia pudo obtener puntajes muy por encima del azar en la VSVT (ítems difíciles y el conjunto completo de 48 ítems fueron .82, .87 y .89,
fáciles, 23/24; ítems difíciles, 20/24) a pesar de puntajes extremadamente respectivamente.
bajos en tareas de memoria tradicionales. . Grote et al. (2000) encontraron
que 28 (93%) de 30 pacientes con epilepsia intratable que no buscaban
Confiabilidad testretest
compensación tenían puntajes VSVT de 21 o más, en comparación con solo
19 (36%) de 53 pacientes que buscaban compensación. El VSVT se administró dos veces a 31 participantes sanos ya 27 pacientes
que buscaban compensación (Slick et al., 1997). La mediana del intervalo de
repetición de la prueba fue de 14 días para los controles y de 31 días para los
Recientemente, Loring et al. (2005) informaron que 86 de 97 (89%) pacientes pacientes que buscaban compensación (rango = 1 a 550 días). Las
con epilepsia intratable que no litigaban obtuvieron puntajes de al menos correlaciones testretest para las medidas seleccionadas del VSVT fueron
21/24 en los ítems VSVT duros. Sobre la base de estos datos clínicos, bajas (0,53 a 0,54 para las medidas de latencia) entre la muestra de control,
estamos de acuerdo con Grote et al. (2000) que las puntuaciones correctas muy probablemente como reflejo de la restricción del rango. Entre el grupo de
entre 16 y 20 en los elementos fáciles o difíciles no deben considerarse búsqueda de compensación, las correlaciones fueron más altas (.56 RT fácil
"válidas", sino como un nivel de rendimiento que rara vez se observa entre los a .84 total de ítems correctos). Todos los participantes de control obtuvieron
pacientes que no buscan compensación con daño cerebral documentado. la misma clasificación en la nueva prueba (válida) que en la primera prueba.
Con base en la revisión de la investigación publicada, la tabla 1613 Entre los pacientes que buscaban compensación, el 86% obtuvo la misma
proporciona algunas etiquetas "cualitativas" para varios rangos de puntuación clasificación en la nueva prueba. En general, estos hallazgos sugieren que la
de VSVT, con la advertencia de que los usuarios deben considerarlas como VSVT exhibe una confiabilidad adecuada y sugiere que los cambios en la
hipótesis que deben confirmarse o rechazarse cuando se integran con otros clasificación a lo largo de los intervalos testretest probablemente reflejen la
datos. sensibilidad de la VSVT a los cambios en el esfuerzo o el rendimiento
Hay una serie de otras medidas del VSVT que pueden resultar útiles. Slick exhibidos por los pacientes y no la variación del error (Thompson, 2002).
et al. (1996) notaron que las caídas pronunciadas en las puntuaciones a lo
largo de los intervalos de retención eran inusuales en individuos con daño
cerebral genuino. Además, es raro que un paciente que no busque una
VALIDEZ
compensación obtenga puntajes de 0 a 5 (donde 8 es el puntaje más alto
posible) en cualquiera de los seis bloques de puntajes a los que se hace
Hallazgos clínicos
referencia en la impresión VSVT (Grote et al., 2000) .
Slick et al. (1996) sugirieron que los tiempos de respuesta promedio El VSVT parece ser sensible a los defectos motivacionales (para una discusión
superiores a 4 s en pacientes que no parecen estar confundidos o del procedimiento original de Hiscock e Hiscock [1989], ver Binder, 1990;
desorientados pueden ser indicativos de problemas de motivación. Guilmette et al., 1993, 1994). Los simuladores analógicos y los individuos
Sobre la base de un examen de pacientes que no buscan compensación y que buscan una compensación obtienen puntajes más bajos en esta tarea
pacientes que buscan compensación, Grote et al. (2000) sugirió (especialmente en los ítems difíciles) que
Machine Translated by Google
1182 Evaluación del sesgo de respuesta y el rendimiento subóptimo
encuestados honestos y personas que no buscan compensación (Doss et al., los ítems fáciles (24/24) y puntajes casi perfectos (≥22) en los ítems difíciles.
1999; Grote et al., 2000; Slick et al., 1994, 1996; Strauss et al., 1999, 2002; Tan
et al., 2002). Por ejemplo, Slick et al. (1994, 1996) asignaron la tarea a adultos La depresión tiene poco impacto en el desempeño de VSVT (Slick et al.,
sanos (n = 43), individuos normales instruidos para simular los síntomas 1996; ver también Guilmette et al., 1994, con respecto a una versión abreviada
posteriores a la conmoción cerebral (n = 42), pacientes que buscaban del procedimiento de Hiscock e Hiscock).
compensación (n = 121) y pacientes que no buscaban compensación (n = 42 ) . De manera similar, la experiencia con lesiones en la cabeza (p. ej., personas
26). Descubrieron que los participantes de la simulación demostraron puntajes con lesiones en la cabeza, profesionales que trabajan con personas con lesiones
más bajos en los elementos difíciles. La adopción del sistema de clasificación en la cabeza) no afecta la sensibilidad de la prueba (Strauss et al., 2002).
de tres categorías (por debajo del azar, por encima del azar y cuestionable) La validez divergente también ha sido demostrada por pequeñas
mostró una excelente especificidad, produciendo cero clasificaciones de falsos correlaciones entre el VSVT y las puntuaciones en pruebas diseñadas para
positivos y una sensibilidad razonable. Todos los participantes que buscaban el medir constructos diferentes. Slick et al. (1996) informaron que ninguna prueba
control y la no compensación se desempeñaron por encima del azar. Alrededor de memoria (p. ej., RAVLT, Figura de Rey) compartió más del 5 % de su varianza
del 83 % de las personas que simularon una discapacidad se encontraban dentro con las puntuaciones de ítems fáciles o difíciles del VSVT, lo que indica que el
del rango cuestionable o inválido. Aproximadamente el 83% de los pacientes VSVT no se ve afectado en gran medida por el nivel de función cognitiva. La
que buscaban compensación lograron puntajes por encima del azar. Además, implicación es que las puntuaciones bajas probablemente reflejen cierto grado
los individuos que produjeron protocolos inválidos tardaron aproximadamente de exageración. Sin embargo, los tiempos de respuesta a los ítems fáciles y
el doble en responder que aquellos que produjeron protocolos válidos, lo que difíciles mostraron una validez considerablemente menos divergente, con una
sugiere que el tiempo de respuesta puede ser un complemento útil para medir correlación moderada (.32 a .53) con Digit Span y medidas con componentes de
la validez de los síntomas. Aunque la ralentización de la respuesta (y de la alta velocidad de procesamiento (p. ej., Stroop, Trails), lo que sugiere precaución
consistencia de la respuesta) tiende a ocurrir más comúnmente entre aquellos en la interpretación de los tiempos de respuesta.
con desempeño sospechoso, la utilidad diagnóstica de la puntuación de precisión
en los ítems difíciles parece ser mayor (p. ej., Grote et al., 2000; Strauss et al. ., Surge la pregunta sobre la eficacia de la VSVT en relación con otros
1999, 2002). procedimientos. Tan et al. (2002) utilizaron un paradigma de simulación para
comparar la eficacia de VSVT, TOMM y Word Memory Test (WMT). El VSVT se
Existe evidencia de que los simuladores (incluso aquellos con una comparó favorablemente con el WMT y fue mejor que el TOMM para detectar el
experiencia considerable con respecto a lesiones en la cabeza) tienden a ser deterioro fingido asociado con una lesión en la cabeza. Sin embargo, el uso de
más inconsistentes en las pruebas en serie. Utilizando un diseño analógico, la puntuación de reconocimiento retardado TOMM en combinación con VSVT o
Strauss et al. (1999, 2002) encontraron que los simuladores fluctúan más que WMT mejoró significativamente la predicción. También hay evidencia de que la
los controles en términos de precisión (en elementos duros) y latencia de tarea muestra una precisión de clasificación superior, en comparación con otros
respuesta. Fingir con éxito el mismo nivel de desempeño en diferentes sesiones procedimientos como la prueba de 15 ítems de Rey, la prueba de 21 ítems y las
de prueba parece requerir niveles más altos de autocontrol o un conocimiento pruebas de reconocimiento de dígitos de Portland (PDRT) (Vickery et al., 2001).
más sofisticado del comportamiento humano que el que poseen la mayoría de El VSVT (elementos difíciles) también ha demostrado ser un mejor predictor del
los simuladores. Por lo tanto, la evaluación de la consistencia de la respuesta conjunto de instrucción (responder honestamente, fingir lesión en la cabeza) que
a través de ocasiones de prueba puede aumentar la precisión de la detección. el conteo de puntos, la extensión de dígitos confiable o el vocabulario menos las
Los médicos deben considerar cambios de tres o más puntos hacia arriba o medidas de extensión de dígitos (Strauss et al., 1999, 2002) , en consonancia
hacia abajo en los ítems fáciles como un aumento del índice de sospecha. con otras investigaciones que muestran que las tareas de reconocimiento de
elección forzada logran la mejor tasa de aciertos en la detección de
incumplimiento (p. ej., Greiffenstein et al., 1994; Rose et al., 1998).
Además, los datos disponibles indican que el deterioro cognitivo severo tiene
un impacto mínimo en el VSVT (Berry, comunicación personal, julio de 1995;
Doss et al., 1999; Grote et al., 2000; Slick et al., 2003). Por ejemplo, Berry et al.
(comunicación personal, julio de 1995) encontró una baja tasa de falsos En términos de validez aparente, el WMT obtiene mejores resultados, ya
positivos cuando se administró el VSVT a un grupo de 30 adultos con lesiones que alrededor de un tercio de los individuos lo perciben como una medida
en la cabeza de moderadas a graves (cantidad media de días de inconsciencia legítima de la memoria, seguido por alrededor de una cuarta parte que percibe
= 21, SD = 29) que no buscaban compensación en el momento de la evaluación. el VSVT de esta manera (Tan et al., 2002). Menos del 10% de los sujetos
Veintinueve (97%) de los pacientes obtuvieron puntuaciones en el rango válido percibieron el TOMM como una medida legítima de la función cognitiva en
y solo un paciente (3%) obtuvo una puntuación en el rango cuestionable. Estos oposición a la simulación (Tan et al., 2002).
datos demuestran que las puntuaciones en el rango cuestionable son poco
probables en pacientes que no tienen una función manifiestamente alterada (p. Las correlaciones entre las escalas de validez del MMPI2 y las puntuaciones
ej., trastorno grave de la atención o alteración de la conciencia). Slick et al. de VSVT están en el rango de pequeño a mediano (Slick et al., 1996).
(2003) examinaron a seis pacientes no litigantes con deterioro severo de la Para la puntuación Easy Items Correct y la puntuación T de la escala F del
memoria cuyas puntuaciones en las tareas de memoria convencionales MMPI2, r = −0,29, lo que indica que las puntuaciones más altas de la escala F
generalmente estaban por debajo del primer percentil. A pesar de su evidente se asociaron con puntuaciones más bajas de Easy Correct VSVT. Es de destacar
deficiencia en estas tareas, obtuvieron puntuaciones perfectas en que las correlaciones de elementos fáciles y difíciles con la escala FBS de Lees
Haley fueron más altas (0,42 y 0,43, respectivamente), en consonancia con la
noción de que la escala FBS tiene una mayor utilidad que la escala F.
Machine Translated by Google
Prueba de validez de síntomas de Victoria (VSVT) 1183
puntajes en el contexto de reclamos de neurotrauma exagerados (consulte el el desempeño no descarta definitivamente la fabricación o exageración de la
Inventario de personalidad multifásica de Minnesota–2). Sin embargo, cuando sintomatología (Guilmette et al., 1993, 1994).
se comparan las clasificaciones de los participantes de las dos pruebas, se Además, Slick et al. (1996) advirtieron que las pruebas de validez de los
encuentra una baja tasa de concordancia entre el MMPI2 y el VSVT. Esto síntomas como el VSVT son, en el mejor de los casos, sólo capaces de indicar
quizás no sea sorprendente, porque las pruebas difieren considerablemente que factores distintos a, o tal vez además de, ciertas formas de deterioro
en la tarea (autoinforme versus desempeño real) y en el dominio (memoria cognitivo pueden estar influyendo en el desempeño del cliente (ver también
versus evaluación de la personalidad; véase también Greiffenstein et al., 1995, Palmer et al., 1995). ). Incluso en los casos en los que existen incentivos
con respecto a otras medidas de amnesia simuladas y el MMPI2). financieros o de otro tipo y se sospecha del desempeño del paciente, el
paciente puede verse perjudicado legítimamente y/o actuar sin intención
consciente (ver Slick et al., 1999). Por ejemplo, los pacientes con deterioro
del juicio (quizás reflejando una disfunción ejecutiva) pueden exhibir un
desempeño de nivel aleatorio.
COMENTARIO
Si se detecta un desempeño sospechoso, se recomienda el uso de múltiples
Los datos disponibles sugieren que las puntuaciones VSVT subnormales medidas para aclarar si el desempeño deficiente es intencional y para evaluar
obtenidas por los litigantes deben considerarse como un indicador de posible explicaciones alternativas para puntajes sospechosos.
simulación. La edad, la educación, la depresión y la sofisticación con
respecto a los efectos de las lesiones en la cabeza tienen poco impacto en
los puntajes de las pruebas. Incluso la presencia de un deterioro cognitivo o
de la memoria profundo afecta mínimamente al rendimiento de la TVSV. referencias
Además, el VSVT incluye una puntuación de preferencia izquierdaderecha
que podría alertar a los médicos sobre una de las pocas condiciones que
Carpeta, LM (1990). Simulación después de un traumatismo craneoencefálico menor. El
podrían causar resultados falsos positivos falsos en el VSVT (p. ej., negligencia Neuropsicólogo clínico, 4, 25–36.
izquierda). El VSVT también demuestra una fiabilidad adecuada y parece Doss, RC, Chelune, GJ y Naugle, RI (1999). Prueba de validez de síntomas de
sensible a los cambios en el esfuerzo y el rendimiento del paciente. El hecho Victoria: Pacientes que buscan compensación frente a pacientes que no buscan
de que el VSVT se administre por computadora probablemente mejora su compensación en un entorno clínico general. Revista de neuropsicología
confiabilidad al minimizar cualquier variación de error que podría estar forense, 14, 5–20.
Greiffenstein, MF, Baker, WJ y Gola, T. (1994). Validación de medidas de amnesia
asociada con variaciones menores con las que los diferentes médicos
administran la prueba. En consecuencia, en base a su facilidad de uso, persistente con una muestra clínica grande. Evaluación psicológica, 6, 218–
224.
tiempo de administración corto y otras características positivas, Thompson
Greiffenstein, MF, Gola, T. y Baker, WJ (1995). Escalas de validez MMPI2 versus
(2002) concluyó que el VSVT muy probablemente cumple con los estándares
medidas específicas de dominio en la detección de lesión cerebral traumática
de Daubert para la admisibilidad de la evidencia científica presentada en la ficticia. El neuropsicólogo clínico, 9, 230–240.
sala del tribunal. Grote, CL, Kooker, EK, Garron, DC, Nyenhuis, DL, Smith, C.
En sus estudios iniciales, los autores de la prueba se basaron en la teoría de A. y Mattingly, ML (2000). Realización de muestras de compensación y no
la probabilidad binomial como guía para la interpretación de VSVT. compensación en la Prueba de Validez de Síntomas de Victoria: Validación
Esto resultó en valores de corte bastante conservadores para el desempeño cruzada y extensión de un estudio de estandarización. Revista de
sospechoso. Estudios más recientes han sugerido algunas puntuaciones de neuropsicología clínica y experimental, 22, 709–719.
corte empíricas para el VSVT que pueden servir para mejorar su sensibilidad.
Guilmette, TJ, Hart, KJ y Giuliano, AJ (1993). Detección de simulación: el uso de
un método de elección forzada para identificar el deterioro de la memoria
Nosotros, al igual que otros (Doss et al., 1999), consideramos el
orgánico versus el simulado. El neuropsicólogo clínico, 7, 59–69.
desempeño en los ítems fáciles como un indicador básico del esfuerzo
general y la atención a la tarea. Es decir, si un paciente obtiene una
Guilmette, TJ, Hart, KJ, Giuliano, AJ y Leininger, BE (1994).
puntuación casi perfecta en los ítems fáciles, parece haber menos Detección del deterioro de la memoria simulada: Comparación de la Prueba de
probabilidades de que una puntuación baja en los ítems difíciles se pueda Quince Elementos de Rey y el Procedimiento de Elección Forzada de Hiscock.
atribuir a un esfuerzo insuficiente oa un déficit de atención. El neuropsicólogo clínico, 8, 283–294.
Aunque el procedimiento VSVT es útil, se deben tener en cuenta varias Hartman, DE (2002). La mentira no examinada es una mentira que vale la pena
cuestiones. Primero, la ubicación del VSVT en la batería de prueba podría mentir: la simulación neuropsicológica y la prueba de memoria de palabras.
influir en el rendimiento. El trabajo de Guilmette et al. (1996) sugiere que Archivos de neuropsicología clínica, 17, 709–714.
ocurren más fallas cuando se coloca al comienzo de la batería de pruebas, Hiscock, M. y Hiscock, CK (1989). Refinando el método de elección forzada para
la detección de simulación. Revista de Neuropsicología Clínica y Experimental,
antes de que los clientes hayan tenido experiencia con medidas de memoria
11, 967–974.
más exigentes.
Loring, DW, Lee, GP y Meador, KJ (2005). Rendimiento de la prueba de validez de
En segundo lugar, la tarea se usa comúnmente con adultos. Aunque el
síntomas de Victoria en candidatos a cirugía de epilepsia no litigantes. Revista
procedimiento básico de Hiscock y Hiscock se validó inicialmente en un niño
de Neuropsicología Clínica y Experimental, 27, 610–617.
pequeño, se necesita investigación para desarrollar normas para niños.
Tercero, aunque el VSVT es fácil de administrar, ha generado relativamente Palmer, BW, Brauer Boone, K., Allman, L. y Castro, DB (1995).
poca investigación (Hartman, 2002), y gran parte de lo que existe proviene de Coocurrencia de lesiones cerebrales y exageración del déficit cognitivo.
los autores de la prueba. Cuarto, perfecto El neuropsicólogo clínico, 9, 68–73.
Machine Translated by Google
1184 Evaluación del sesgo de respuesta y el rendimiento subóptimo
Rose, FE, Hall, S. y SzaldaPetree, AD (1998). Una comparación de cuatro Slick, DJ, Tan, JE, Strauss, E., Mateer, CA, Harnadek, M. y Sherman, EMS
pruebas de simulación y los efectos del entrenamiento. Archivos de (2003). Puntuaciones de la prueba de validez de síntomas de Victoria de
neuropsicología clínica, 13, 349–363. pacientes con discapacidad profunda: estudios de casos no litigantes. El
Slick, D. (1996). La prueba de validez de los síntomas de Victoria: una nueva neuropsicólogo clínico, 17, 390–394.
medida clínica del sesgo de respuesta. Doctor. disertación, Universidad de Strauss, E., Hultsch, DF, Hunter, M., Slick, DJ, Patry, B. y Levy Bencheton, J.
Victoria, Columbia Británica, Canadá. (1999). Uso de la variabilidad intraindividual para detectar simulación en el
Slick, D., Hopp, G., Strauss, E., Hunter, M. y Pinch, D. (1994). Detección del rendimiento cognitivo. The Clinical Neuropsychol ogist, 14, 420–432.
disimulo: perfiles de simuladores simulados, pacientes con lesiones
cerebrales traumáticas y controles normales en una versión revisada de Strauss, E., Slick, DJ, LevyBencheton, J., Hunter, M., MacDonald, S.
Hiscock y la prueba de memoria de elección forzada de Hiscock. Journal WS y Hultsch, DF (2002). Variabilidad intraindividual como indicador de
of Clinical and Experimental Neuropsychology, 16, 472–481. simulación en traumatismo craneoencefálico. Archives of Clinical
Slick, D., Hopp, G., Strauss, E. y Spellacy, F. (1996). Victoria Symp tom Validity Neuropsychology, 17, 423–444.
Test: Eficiencia para la detección de alteraciones de memoria fingidas y Tan, JE, Slick, DJ, Strauss, E. y Hultsch, DF (2002). ¿Cómo lo hicieron?
relación con pruebas neuropsicológicas y escalas de validez del MMPI2. Estrategias de simulación en las pruebas de validez de los síntomas. The
Journal of Clinical and Experimental Neuropsychology, 18, 911–922. Clinical Neuropsychologist, 16, 495–505.
Thompson, GB III. (2002). La prueba de validez de los síntomas de Victoria: una
Slick, D., Hopp, G., Strauss, E. y Thompson, GB (1997). Prueba de Validez de prueba mejorada de la validez de los síntomas. Revista de neuropsicología
Síntomas de Victoria. Odessa, Fla.: Evaluación psicológica Re forense, 2, 43–67.
fuentes. Vickery, CD, Berry, DTR, Inman, TH, Harris, MJ y Orey, SA
Slick, DJ, Sherman, EMS e Iverson, GL (1999). Criterios de diagnóstico para (2001). Detección de esfuerzo inadecuado en pruebas neuropsicológicas:
la disfunción neurocognitiva simulada: estándar propuesto para la práctica una revisión metaanalítica de procedimientos seleccionados. Archivos de
clínica. El neuropsicólogo clínico, 13, 545–561. neuropsicología clínica, 16, 45–73.
Prueba de memoria de palabras (WMT)
OBJETIVO Tombaugh, 1996; RMT, Warrington, 1984) y reconocimiento de palabras
(WMT, Green et al., 1997). El WMT es una medida de uso común (Slick et
La prueba de memoria de palabras (WMT) evalúa la exageración o fingir
al., 2004) que evalúa el reconocimiento inmediato y tardío de 20 pares
quejas de memoria.
de palabras vinculadas semánticamente (p. ej., cerdo—tocino). La lista se
presenta dos veces (ya sea en la pantalla de la computadora o leída en
FUENTE voz alta por el examinador); a esto le sigue una prueba de reconocimiento
inmediato (IR) en la que el cliente debe seleccionar cada una de las
La prueba de memoria de palabras de Green para Windows (Green, 2003)
palabras originales de 40 pares nuevos (p. ej., "cerdo" del par vacacerdo).
se puede solicitar a Paul Green, 1866INFOWMT (18664636968) o
Se proporciona información sobre la corrección para ayudar a los
(17804845550), o desde http:/ /www.pruebadememoriadepalabras.com.
pacientes motivados a aprender para las subpruebas posteriores. Sin
Comuníquese con Paul Green (paulgreen@shaw.ca) para obtener
previo aviso, se administra una segunda subprueba de reconocimiento
información sobre precios. La tarifa de la licencia incluye el disco
similar después de un retraso de 30 minutos (DR), y se requiere que el
compacto y el manual de prueba en cualquier idioma disponible (inglés,
cliente seleccione cada una de las 40 palabras en la lista original de pares
español, francés, alemán, holandés y turco), 1 año de uso ilimitado,
que incorporan nuevas láminas (p. ej., feed—pig ). Los puntajes IR y DR,
actualizaciones gratuitas, membresía en el grupo de Internet WMT USER
así como la consistencia de la respuesta (Cons) entre los dos ensayos,
y apoyo). Hay una tarifa de licencia adicional después de 1 año. La versión
son las medidas principales del estado motivacional. La definición
oral no se vende por separado, pero viene gratis con la compra de la
convencional de falla de WMT es IR o DR o Cons por debajo del valor
versión WMT Windows. de corte.
Las medidas de esfuerzo son seguidas por una serie de pruebas de
RANGO DE EDAD
memoria de dificultad gradualmente creciente, destinadas a ser sensibles
al deterioro de la memoria verbal. Después de la prueba DR, al cliente se
La prueba se puede utilizar con personas de 7 años o más. le presenta una tarea de opción múltiple (MC) en la que se le muestra la
primera palabra de cada par y se le pide que seleccione la palabra
correspondiente de una lista de ocho opciones. También se puede
DESCRIPCIÓN
administrar una subprueba de asociado emparejado (PA). Aquí, el
Se utiliza una variedad de formatos de validez de síntomas forzados para probador dice la primera palabra de cada par y el cliente debe proporcionar
detectar problemas cognitivos exagerados, incluido el reconocimiento de la palabra que se emparejó con él. A esto le sigue una subprueba de
dígitos (p. ej., CARB, Allen et al., 1997; PDRT, Binder & Willis, 1991; recuerdo libre diferido (DFR, por sus siglas en inglés), en la que se le pide
VSVT, Slick et al., 1997), reconocimiento de imágenes (TOMM, al cliente que recuerde todas las palabras de la lista en cualquier orden mientras el eva
Machine Translated by Google
Prueba de memoria de palabras (WMT) 1185
respuestas en la computadora o en una hoja de papel. Después de una demora lesión, pacientes neurológicos, pacientes con memoria verbal normal, pacientes con
adicional de 20 minutos, se puede volver a probar la memoria libre de la lista de memoria verbal deteriorada y controles normales brillantes.
palabras (LDFR).
Las subpruebas IR y DR cumplen una doble función como medidas de esfuerzo
y también como pruebas de aprendizaje adicionales, porque se presentan todas las
EFECTOS DEMOGRÁFICOS
palabras de la lista y se brinda retroalimentación sobre la corrección de las
respuestas. Las pruebas de MC y PA brindan una mayor exposición a las 20
Pruebas de esfuerzo
primeras palabras de los pares, nuevamente sirviendo un doble propósito como
pruebas de memoria y como pruebas de aprendizaje, antes de las pruebas de
Edad. Las puntuaciones en las tareas de esfuerzo (IR, DR) no están
recuerdo libre. Por lo tanto, el WMT genera tres puntajes de esfuerzo (IR, DR, Cons)
relacionadas con la edad en adultos (Green, 2003; Green et al., 2002). Aunque
y cuatro puntajes de memoria (MC, PA, DFR, LDFR).
Green y Flaro (2003) no informaron ningún impacto de la edad en individuos de 7 a
18 años, Courtney et al. (2003) reportaron relaciones moderadamente fuertes (.54
Aunque las subpruebas de reconocimiento (IR, DR) son muy fáciles, las
a .58) entre la edad y las medidas de esfuerzo.
subpruebas de MC y PA son más difíciles y las subpruebas de DR son aún más
difíciles. Green (2003) propuso que los diferentes niveles de dificultad de las
subpruebas producen un gradiente característico de puntajes en aquellos que se
Educación, coeficiente intelectual y nivel de lectura. Las puntuaciones en las
esfuerzan al máximo y que las desviaciones de este patrón aumentan el índice de
tareas de esfuerzo (IR, DR) no están relacionadas con la inteligencia y la educación
sospecha.
en adultos (Green, 2003; Green et al., 2002). Tampoco parecen estar relacionados
Las puntuaciones de recuerdo libre se interpretan como una medida de la memoria
con el nivel intelectual de los niños (Courtney et al., 2003; Green & Flaro, 2003). Sin
solo cuando se ha descartado un esfuerzo deficiente o inconsistente.
embargo, el nivel de lectura está correlacionado con las puntuaciones de esfuerzo
WMT (0,23 a 0,62) (Courtney et al., 2003; Green & Flaro, 2003) y con las
ADMINISTRACIÓN puntuaciones de memoria (0,40 a 0,61; Green & Flaro, 2003).
El WMT se puede administrar por vía oral o parcialmente sin supervisión con el
cliente trabajando en una computadora. El WMT requiere al menos un nivel de
Género. El género no tiene impacto en las medidas de esfuerzo (Courtney et
lectura de grado 3 (Green & Faro, 2003). Al tomar el WMT computarizado, las
al., 2003; Green et al., 2002).
personas reciben asistencia para leer y comprender las instrucciones de la tarea, si
es necesario. Si hay una pregunta sobre problemas de lectura, el examinador puede
pedirle a la persona que diga en voz alta cada palabra tal como aparece (Green, Pruebas de memoria
2003). Si hay un error, el examinador corrige la palabra inmediatamente.
Edad. La edad tiene un efecto significativo en las pruebas de memoria, con
Si se espera que la persona tenga dificultades en la tarea computarizada (p. ej., puntajes que mejoran con el aumento de la edad en la niñez (Green & Flaro, 2003).
dificultad para leer, ceguera), se puede administrar la versión oral. En individuos de 15 a 68 años, la edad tuvo un efecto significativo para PA, pero no
para MC, FR o LDFR (Green, 2003). Sin embargo, tenga en cuenta que solo había
11 personas mayores de 60 años.
HORA APROXIMADA DE ADMINISTRACIÓN
Se requieren unos 20 minutos para la prueba (excluyendo los retrasos). Educación, coeficiente intelectual y nivel de lectura. La educación tiene solo
una relación débil (r = .10) con las puntuaciones de recuerdo tardío (Gervais et al.,
2004). El nivel de lectura se correlaciona con las puntuaciones de memoria (.40 a
PUNTUACIÓN
.61). Las puntuaciones de memoria aumentan con el aumento del coeficiente
La calificación de la prueba es proporcionada por el programa de computadora. Se intelectual verbal (Green, 2003).
pueden derivar múltiples medidas de la tarea, incluidas las siguientes:
Género. Hay diferencias de género en las medidas de memoria, con mujeres
que obtienen puntajes más altos que los hombres tanto en FR como en LDFR.
1. El número correcto en las pruebas IR y DR 2. Una
medida de consistencia de respuesta entre IR y DR 3. El número correcto en
las pruebas MC, PA y DR
DATOS NORMATIVOS
La copia impresa de la computadora muestra gráficamente los resultados del
paciente (p. ej., un gráfico traza el porcentaje correcto para cada subprueba, un
Muestra de estandarización
gráfico de puntuación z traza las puntuaciones de la persona en términos del número
de desviaciones estándar por encima o por debajo de la media de un grupo de Cuando el WMT fue ideado por Paul Green, se le administró a todos los pacientes
referencia) y como una lista de puntajes brutos en todas las medidas. Se ambulatorios que se le derivaron para una evaluación neuropsicológica. Durante
proporcionan tablas para que las puntuaciones de la persona puedan compararse varios años, el WMT se entregó a más de 1000 adultos consecutivos en esta serie,
con las puntuaciones medias obtenidas de cada uno de los grupos de referencia, todos involucrados en reclamos de compensación o discapacidad. Este es el
incluidos los pacientes con trastornos cerebrales de moderados a graves. conjunto de datos central.
Machine Translated by Google
1186 Evaluación del sesgo de respuesta y el rendimiento subóptimo
a partir de la cual ha evolucionado gran parte de la investigación de WMT FIABILIDAD
(Green et al., 2002).
Los puntos de corte para adultos se establecieron inicialmente en el Consistencia interna
percentil 2 en relación con 157 pacientes con traumatismo craneoencefálico
Green (2003) informó que, en 1207 pacientes ambulatorios consecutivos, las
de moderado a grave u otros trastornos neurológicos, después de excluir al
correlaciones fueron altas entre IR y DR (r = 0,88), MC y PA (r = 0,90) y FR y
10 % de los individuos en los que había una fuerte evidencia independiente de
LDFR (r = 0,86).
esfuerzo deficiente (p. ej., puntajes peores que el azar). sobre otras pruebas;
Green & Flaro, 2003). Los adultos se clasificaron como "aprobados" si IR, DR
y Cons estaban por encima del 82,5 %. Si no, la persona fue clasificada como
Confiabilidad de pruebareprueba
reprobada en la prueba de esfuerzo WMT.
Las normas para niños se basan en datos de 130 niños, entre las edades Green (2003) informó que 33 individuos fueron atendidos para volver a
de 7 y 18 años, con una variedad de trastornos clínicos (p. ej., esquizofrenia, realizar la prueba después de 1 año o más. En cualquier momento dado, se
FAS, TDAH; Green & Flaro, 2003). La puntuación media en las subpruebas IR encontró que las medidas de esfuerzo WMT se correlacionan altamente entre
y DR fue igual o superior al 97,5 % en todos los grupos de diagnóstico infantil. sí (IR y DR r = .87 en la prueba inicial y .94 en la repetición de la prueba). Sin
Después de excluir a 5 niños en los que hubo evidencia de poco esfuerzo (p. embargo, debido a que el esfuerzo puede fluctuar notablemente de una ocasión
de prueba a otra, las correlaciones fueron modestas (r = 0,43 para IR y r =
ej., reprobaron inicialmente el WMT, pero lo aprobaron cuando se les dio un
0,33 para DR).
incentivo; Green y Faro, 2003), se derivaron puntajes de corte en el percentil
5. Estos son 82.5% para IR y DR y 75% para Cons. Los valores de IR y DR
son los mismos que los límites de los adultos, por debajo de los cuales el
VALIDEZ
esfuerzo debe considerarse inadecuado.
Hallazgos clínicos
Courtney et al. (2003), sin embargo, encontraron que el rendimiento variaba
en función de la edad en los niños, y solo los mayores de 11 años producían Las puntuaciones de esfuerzo de la WMT parecen sensibles a los defectos
resultados similares a los de los adultos. En consecuencia, recomendaron no de motivación. Los pacientes con traumatismos craneales de moderados a
usar normas basadas en adultos con niños menores de 11 años. graves se desempeñaron mejor en estas medidas que aquellos con
traumatismos craneales leves (Green, presentado; Green & Faro, 2003; Green
et al., 1999, 2002). Esto se explica por un menor esfuerzo, en promedio, en
Green (2003, presentado) revisó recientemente estos límites (consulte la el grupo leve. Además, los simuladores (p. ej., Dunn et al., 2003; Iverson et al.,
Tabla 1614). Informó que los controles adultos normales obtienen puntajes 1999; Tan et al., 2002) y las personas que buscan compensación (p. ej.,
perfectos en la WMT (Iverson et al., 1999) y que se obtienen puntajes casi Gervais et al., 2001; Green et al., 2002) suprimen su desempeño en esta tarea.
perfectos de adultos y niños con enfermedades neurológicas o retraso mental. Son menos precisos y sus latencias de respuesta son más largas y más
En consecuencia, recomendó que las puntuaciones correctas de menos del 91 variables que las de los respondedores honestos (Dunn et al., 2003).
% en las subpruebas de esfuerzo deberían plantear la preocupación de poco
esfuerzo, con raras excepciones, como las personas con demencia que Además, las puntuaciones bajas en la WMT se asocian con una supresión
necesitan atención las 24 horas del día o los niños menores de 7 años con general de las puntuaciones de las pruebas, en particular de las pruebas de
menos que un nivel de lectura de grado 3. aprendizaje y memoria (Gervais et al., 2001, 2004; Green & Faro, 2003; Green
et al., 2001, 2002) , pero otros dominios (p. ej., identificación de olores, Green
Green (2003) indicó que, aunque MC y PA pueden verse afectados por un et al., 2003; estado de ánimo, Rohling et al., 2002; ver Green, presentado,
deterioro neurológico real, son bastante fáciles incluso para aquellos con para una revisión reciente) también se ven afectados. Por lo tanto, la falla en
lesiones cerebrales graves. Sugirió que las puntuaciones correctas de menos los componentes de esfuerzo de la WMT también sugiere resultados inválidos
del 70% en MC o menos del 60% en PA deben considerarse sospechosas, en otras pruebas (Green et al., 2002). Las puntuaciones de las pruebas
excepto en personas con demencia o amnesia profunda. Las discrepancias neuropsicológicas tienden a reducirse progresivamente hasta un grado
(inconsistencias) en el gradiente esperado de desempeño a través de las correspondiente al nivel de esfuerzo indicado por la WMT (Green, presentado).
subpruebas también plantean la preocupación de un esfuerzo sospechoso. También existe una asociación entre el fracaso en las medidas de esfuerzo
Se puede realizar una interpretación más precisa de los resultados de la WMT y un sobreinforme general de los síntomas (Gervais et al., 2001).
prueba WMT de una persona seleccionando los grupos de comparación
apropiados disponibles a través del programa de puntuación y consultando el Las buenas medidas de esfuerzo deben ser tan insensibles como sea
manual de la prueba. posible al deterioro real. La evidencia disponible sugiere que las pruebas de
esfuerzo de WMT son muy fáciles, incluso para adultos con un deterioro
neurológico significativo (p. ej., traumatismo craneoencefálico de moderado a
Cuadro 1614 Directrices para la interpretación de WMT
grave, esclerosis múltiple, tumor, TDAH, trastorno de la conducta; Green &
Prueba de memoria de palabras (WMT) 1187
La puntuación en estas medidas de esfuerzo fue similar (ver también Tan et al., Los simuladores sofisticados (psicólogos, pacientes a los que se les pide que
2002). Además, dentro del grupo con lesión cerebral, las medidas de esfuerzo de simulen una discapacidad) se desempeñan mal en la tarea (Green et al., 2002). El
WMT no estaban relacionadas con las medidas de gravedad de la lesión en la entrenamiento de los individuos sobre cómo evitar la detección mejora el
cabeza, incluidas las puntuaciones de GCS, la duración de la amnesia postraumática desempeño, aunque esos individuos aún se desempeñan peor que los controles
y la duración de la pérdida del conocimiento. En los niños, las pruebas de esfuerzo (Dunn et al., 2003).
tampoco parecen verse afectadas por una variedad de trastornos, como la El uso de las tareas de memoria WMT para medir la memoria ha sido objeto de
esquizofrenia, el FAS y el TDAH (Green y Faro, 2003). menos estudio. Las medidas de memoria (MC, PA, DFR) se correlacionan mucho
Otra señal de que las puntuaciones de esfuerzo de la WMT miden el esfuerzo entre sí (r > 0,80) y muestran correlaciones moderadamente fuertes con medidas
en lugar de la capacidad es que parecen no estar relacionadas con la edad en niños independientes de memoria verbal (p. ej., CVLT Total r = 0,67), lo que respalda la
y adultos (Green y Faro, 2003; pero véase Courtney et al., 2003, que encontraron validez de WMT (Green et al., 1997). Aunque las puntuaciones de esfuerzo de la
que el rendimiento se ve afectado en los menores de 10 años). años de edad). WMT muestran fuertes efectos de techo, las puntuaciones de memoria de la WMT
Además, tener una discapacidad específica de lectura no implica, en sí mismo, parecen estar normalmente distribuidas y se ven afectadas por el compromiso
dificultad con el WMT, siempre que el nivel de lectura del individuo esté por encima neurológico (Green et al., 2002).
del grado 2 (Green & Faro, 2003).
El logro educativo o intelectual limitado no afecta el desempeño en las pruebas de
IR y DR (Gervais et al., 2004; Green & Faro, 2003). De hecho, Green y Faro (2003)
informaron que incluso aquellos niños con coeficiente intelectual bajo (VIQ <75) se
COMENTARIO
desempeñaron bien en la parte de esfuerzo. Su puntuación media de IR fue del 95
% (SD = 4,5), su puntuación media de DR fue del 98,2 % (SD = 2,4) y su puntuación Hartman (2002) sugirió una serie de criterios para evaluar la eficacia de las TSV.
media de Cons fue del 93,5 % (SD = 5,5). El dolor en el momento de la evaluación Ellos deberían
tampoco afectó rendimiento de la prueba (Gervais et al., 2004).
Medir la voluntad de ejercer un esfuerzo básico y ser insensible a la disfunción
cognitiva (sensible y específica)
El efecto del trastorno del estado de ánimo en el desempeño de WMT en no
Aparecer al paciente como una medida realista de la faceta cognitiva
litigantes ha sido objeto de algunos estudios. Los pacientes que se esfuerzan poco
en estudio (validez aparente)
parecen más propensos a producir quejas elevadas de angustia subjetiva, según
Mida las habilidades que probablemente sean exageradas por los
lo indica el MMPI2 (Williamson et al., 2003b). Rohling et al (2002) encontraron que,
pacientes que alegan daño cerebral
después de la eliminación de los casos de litigio/discapacidad con puntajes
Tener una sólida base normativa subyacente a los resultados de las pruebas
reprobados en las pruebas de esfuerzo (WMT o CARB), no hubo asociación entre
para satisfacer las preocupaciones científicas y de Daubert
los síntomas de depresión autoinformados y los puntajes en las pruebas
Estar basado en estudios de validación que incluyan
neuropsicológicas convencionales. Argumentaron que, si la depresión no afectaba
sujetos, poblaciones de pacientes e individuos sospechosos y/o
las puntuaciones en las pruebas neuropsicológicas relativamente difíciles, no
simuladores verificados en condiciones reales de evaluación forense o de
debería explicar el fracaso en las pruebas de esfuerzo.
discapacidad Ser difíciles de falsificar o
entrenar Ser relativamente fáciles de
Las medidas de esfuerzo WMT se correlacionan fuertemente entre sí (>.80;
administrar Estar respaldados por
Green et al., 1997). También muestran relaciones moderadas con las puntuaciones
investigaciones continuas.
de otras TSV (p. ej., r > 0,60 con el CARB; > 0,6 con el Test de memoria a corto
plazo de Amsterdam (ASTM), > 0,6 con el Test de 21 ítems y > 0,68 con TOMM El WMT claramente cumple con todos estos criterios, y es único entre los SVT en el
Trial 2; Green, presentado; Green et al., 1997). Además, existe concordancia en la sentido de que mide tanto el esfuerzo como la memoria (Lynch, 2004). A diferencia
clasificación (aprobadorechazado) entre la WMT y otras pruebas de validez de de muchas de las otras técnicas de validez de síntomas, la validación de la WMT
síntomas (p. ej., CARB muestra una concordancia del 85%; Green et al., 1997). se ha basado principalmente en solicitantes en lugar de simuladores. Tiene una
Sin embargo, las pruebas de validez de los síntomas varían considerablemente en gran base de datos derivada de entornos forenses clínicos. Se puede utilizar con un
su sensibilidad al sesgo de respuesta. Recientemente, Gervais et al. (2004) amplio rango de edad, desde niños hasta adultos. Además, las medidas de esfuerzo
compararon el WMT, CARB y TOMM en 519 reclamantes remitidos para son bastante insensibles a las diferencias en los niveles de habilidad y pueden
evaluaciones relacionadas con discapacidad o lesiones personales. El WMT usarse incluso con personas de inteligencia verbal limitada. El dolor tampoco explica
demostró ser más sensible que las otras dos tareas. Más del doble de personas el fracaso del paciente en las porciones de esfuerzo (Green et al., 2002), aunque
reprobaron el WMT que las que reprobaron el TOMM, con el CARB ocupando una el impacto de la angustia emocional significativa requiere un estudio adicional.
posición intermedia. Del mismo modo, Tan et al. (2002) compararon VSVT, TOMM
y WMT en un paradigma de simulación. Usando las puntuaciones de corte
convencionales, el WMT demostró ser más eficiente, clasificando todos los controles Cabe destacar que los hallazgos del autor del WMT y sus colaboradores han
y todos los simuladores con precisión. El TOMM resultó menos eficiente y la generado preguntas importantes con respecto al efecto del esfuerzo en la
eficacia del VSVT se acercó a la del WMT. En términos de validez aparente, al interpretación de los datos de las pruebas neuropsicológicas (Hartman, 2002). Por
WMT le fue mejor, ya que alrededor de un tercio de los participantes lo percibieron ejemplo, Green y sus colegas (Green, presentado; Green et al., 2001, 2002) han
como una medida legítima de la memoria, seguido de alrededor de un cuarto para sugerido que aproximadamente la mitad de la variación en los resultados de las
el VSVT y el 10 % para el TOMM. pruebas neuropsicológicas puede explicarse por la motivación; ese esfuerzo tiene
un efecto mucho mayor en los puntajes de las pruebas neuropsicológicas que la
edad, la educación, la gravedad de la lesión cerebral o la enfermedad neurológica;
Machine Translated by Google
1188 Evaluación del sesgo de respuesta y el rendimiento subóptimo
y ese esfuerzo impulsado por la compensación puede dar cuenta de los Gervais, RO, Rohling, ML, Green, P. y Ford, W. (2004). Una comparación de las tasas de
hallazgos a menudo atribuidos a enfermedades o lesiones. fallas de WMT, CARB y TOMM en reclamantes por discapacidad que no son por
Claramente, el WMT es una herramienta importante, especialmente en lesiones en la cabeza. Archivos de neuropsicología clínica, 19, 475–487.
casos de compensación financiera (p. ej., trauma neurológico, dolor, fibromialgia,
Verde, P. (2003). Prueba de memoria de palabras de Green para Microsoft Windows.
trastorno emocional; p. ej., Gervais et al., 2001; Rohling et al., 2002). Sin
Edmonton, Alberta: Green's Publishing Inc.
embargo, también se recomienda el uso de la WMT (u otras medidas similares)
Green, P. (Presentado). La influencia generalizada del esfuerzo en la neuropsia
en otros entornos (incluidos los de investigación) para descartar posibles efectos
pruebas chológicas.
contaminantes de un esfuerzo subóptimo (por ejemplo, Green et al., 2001;
Green, P., Allen, LM y Astner, K. (1997). La prueba de memoria de palabras: una guía del
Williamson et al. , 2003a). Por ejemplo, Williamson et al. (2003a) informaron usuario para los formularios orales y administrados por computadora, versión de EE.
que la mayoría de los pacientes con convulsiones psicógenas obtuvieron UU. 1.1. Durham, Carolina del Norte: CogniSyst.
puntajes WMT en el rango inválido. Verde, P. y Faro, L. (2003). Rendimiento en pruebas de memoria de palabras en niños.
Neuropsicología infantil, 9, 189–207.
Es importante que los médicos no malinterpreten las puntuaciones WMT. Green, P., Iverson, G. y Allen, L. (1999). Detección de simulación en litigios por lesiones en
Para descartar falsos positivos, los médicos deben considerar no solo las la cabeza con la prueba de memoria de palabras. Lesión cerebral, 13, 813–819.
puntuaciones en las medidas de esfuerzo sino también el desempeño en las
Green, P., LeesHaley, P. y Allen, L. (2002). La prueba de memoria de palabras y la validez
otras subpruebas (así como otros datos clínicos y de prueba), para asegurarse
de las puntuaciones de las pruebas neuropsicológicas. Neuropsicología forense, 2,
de que el patrón de resultados tenga sentido neuropsicológico.
97–124.
La tarea se puede dar ya sea oralmente o por computadora. Sin embargo,
Green, P., Rohling, ML, Iverson, GL y Gervais, RO (2003). Relaciones entre la discriminación
los usuarios deben tener en cuenta que aún no se dispone de estudios que
olfativa y la gravedad de las lesiones en la cabeza. Lesión cerebral, 17, 479–496.
comparen la equivalencia de ambos procedimientos. El WMT puede ser más
fácil de fingir cuando es administrado por una computadora que por una persona. Green, P., Rohling, ML, LeesHaley, PR y Allen, LM (2001). El esfuerzo tiene un mayor
Los usuarios también deben tener en cuenta que la versión computarizada del efecto en los puntajes de las pruebas que las lesiones cerebrales graves en los
WMT requiere algunas habilidades básicas de lectura y no es apropiada para solicitantes de compensación. Lesión cerebral, 15, 1045–1060.
personas con un nivel de lectura inferior al grado 3. En consecuencia, es Hartman, DE (2002). La mentira no examinada es una mentira que vale la pena mentir: la
importante medir las habilidades de identificación de palabras, para no simulación neuropsicológica y la prueba de memoria de palabras.
Archivos de neuropsicología clínica, 17, 709–714.
confundirse con respecto al significado de las puntuaciones bajas en las pruebas.
Iverson, G., Green, P. y Gervais, R. (1999). Uso de la prueba de memoria de palabras para
La porción de esfuerzo de la versión computarizada se puede usar con niños
detectar respuestas sesgadas en litigios por lesiones en la cabeza. Revista de
(con al menos un nivel de lectura de grado 3), aunque se necesitan normas
Rehabilitación Cognitiva, 17, 4–8.
para las subpruebas de memoria.
Lynch, WJ (2004). Determinación del nivel de esfuerzo, exageración y simulación en la
Green ha argumentado que la consideración del gradiente de puntajes en
evaluación neurocognitiva. Revista de rehabilitación de traumatismos craneales, 19,
las tareas de esfuerzo y memoria tiene una utilidad de diagnóstico. Se necesita 277–283.
investigación sobre la fiabilidad y la validez incremental de las puntuaciones Rohling, ML, Green, P., Allen, LM e Iverson, GL (2002). Síntomas depresivos y puntajes
contenidas en todo el perfil. Finalmente, gran parte de la literatura actual sobre de pruebas neurocognitivas en pacientes que pasan pruebas de validez de síntomas.
el WMT se deriva de Green y sus colegas. Serían útiles estudios adicionales de Archives of Clinical Neuropsychology, 17, 205–222.
otros investigadores.
Slick, D., Hopp, G., Strauss, E. y Thompson, GB (1997). Prueba de Validez de Síntomas de
Victoria. Odessa, FL: Evaluación psicológica Re
fuentes.
Slick, DJ, Tan, JE, Strauss, EH y Hultsch, DF (2004). Detección de simulación: una encuesta
referencias de prácticas de expertos. Archivos de neuropsicología clínica, 19, 465–471.
Allen, LM, Condor, RL, Green, P. y Cox, DR (1997). Manual CARB 97 para la evaluación Tan, JE, Slick, DJ, Strauss, E. y Hultsch, DF (2002). ¿Cómo lo hicieron? Estrategias de
computarizada del sesgo de respuesta. Durham, Carolina del Norte: CogniSyst. simulación en las pruebas de validez de los síntomas. The Clinical Neuropsychologist,
16, 495–505.
Binder, LM y Willis, SC (1991). Evaluación de la motivación después de un traumatismo Tombaugh, T. (1996). Test de Simulación de Memoria (TOMM). Norte
craneoencefálico menor compensable económicamente. Evaluación psicológica: Tonawanda, NY: Sistemas de Salud Múltiples.
Revista de consultoría y psicología clínica, 3, 175–181. Warrington, EK (1984). Manual de prueba de memoria de reconocimiento. windsor,
Courtney, JC, Dinkins, JP, Allen, LM y Kuroski, K. (2003). Efectos relacionados con la edad Inglaterra: NFERNelson.
en niños que toman la evaluación computarizada del sesgo de respuesta y la prueba de Williamson, DJ, Drane, DL, Stroup, ES, Miller, JW y Holmes. MD (2003a). La mayoría de los
memoria de palabras. Neuropsicología infantil, 9, 109–116. pacientes con convulsiones psicógenas no ejercen un esfuerzo válido en las pruebas
neurocognitivas. Afiche presentado en la Reunión Anual de la Sociedad Americana de
Dunn, TD, Shear, PK, Howe, S. y Ris, MD (2003). Detección de simulación neuropsicológica: Epilepsia, Boston, MA.
efectos de la información de entrenamiento.
Archivos de neuropsicología clínica, 18, 121–134. Williamson, DJG, Green, P., Allen, L. y Rohling, ML (2003b).
Gervais, RO, Russell, AS, Green, P., Allen, LM, Ferrari, R. y Pieschl, SD (2001). Pruebas de Evaluación del esfuerzo con la prueba de memoria de palabras y la prueba de categoría,
esfuerzo en pacientes con fibromialgia con incentivos de discapacidad. Revista de o no: inconsistencias en una muestra de búsqueda de compensación.
reumatología, 28, 1892–1899. Revista de Neuropsicología Forense, 3, 19–44.
Machine Translated by Google
Índice de prueba
Nota: los números de página seguidos de f y t indican figuras y tablas.
1189
Machine Translated by Google
1190 Índice de prueba
Prueba Beery de desarrollo de la motricidad visual Prueba SpottheWord y relaciones entre, 274, 278t resumen
Integración (VMI), 832 de, 912
Inventario de calificación de comportamiento de la función ejecutiva validez de, 911–912
(BREVE) Prueba de estimación cognitiva de Biber (BCET) efectos de la inteligencia
funcionamiento adaptativo y, 1096 administración de, 439f verbal en el rendimiento, 904
TDAH, 1096 características de, 403t Prueba breve de atención (BTA)
ADHDRSIV y, 1095 administración condiciones que afectan, 442 administración de, 550 rango
de, 1091 rango de edad para, descripción de, 439 de edad para, 547
1090 escalas de efectos del estado cognitivo general en, 442 artículos pruebas de atención correlacionadas con, 552
Índice de prueba 1191
1192 Índice de prueba
de, 230f datos muestra de
normativos, 232, 232t fiabilidad de, estandarización, 446 resumen de, 449
233 pruebas, 444t
El logro del Sistema de Evaluación Cognitiva (CAS) Comprehensive Trail Making Test (CTMT) administración de,
se correlacionó con, 142 administración de, 558–559 rango de edad para, 557 WCST y, correlación entre, 448
558, 558f, 558t
Subprueba de atención expresiva, estructura validez de , 561 Puntuaciones escaladas de estudios normativos afroamericanos
factorial 136t , 140–141, 143 de Mayo, 146–147, 151t–155t
Subprueba de memoria de figuras, 136t Puntuaciones escaladas de estudios normativos sobre
formas de, 135 estadounidenses mayores de Mayo, 146, 146t–150t
Subprueba de preguntas de oración, 137t psicométricas de, 574 propósito de, 562
Subprueba de repetición de oraciones, 136t confiabilidad de, 569–570 evaluación repetida
Subpruebas simultáneas, 136t fuente de, 565–566 Prueba de fluidez de diseño
de, 133 puntuación de, 563–566, 564t administración de, 450, 451f–452f características
Subprueba de velocidad del habla, 137t fuente de, 562 muestra de estandarización de, 403t en niños, 453 estudios
validez de, 139–142
Índice de prueba 1193
descripción de, 755–756 928 estructura de,
NART y, 757 datos normativos, 929 resumen de, Índice de Habilidad General (GAI)
757–758, 758t propósito de, 755 932–933 validez de, Escala de inteligencia para adultos de Wechsler—III, 286, 287t
confiabilidad de, 758 931–932 Escala de inteligencia de Wechsler para niños—
puntuación de, 756 fuente de, 755 Cuarta Edición, 312, 316t, 319t
estandarización Escala de depresión geriátrica (GDS)
muestra, 757 resumen Prueba de reconocimiento facial (FRT) administración de, 1099, 1104 rango de
Finger Tapping (FTT) de, 1102–1104
administración de, 1043–1044 en
adolescentes, 1046–1047 rango de
edad para, 1043 Golden Version (Prueba de Stroop)
412–414. Ver también Evaluación conductual del características de, 1042t en administración de, 479 en
1194 Índice de prueba
validez de, 1056–1058 muestra de estandarización para, 991–992
resumen de, 995–996 validez Evaluación de la orientación de línea (JLO)
Versión Gronwall de la serie auditiva de ritmo de, 994–996 administración de, 998 rango
Prueba de adición Prueba de aprendizaje verbal de Hopkins—Revisada de edad para, 997
administración de, 584 (HVLTR) características de, 964t en
características de, 583t, 585t administración de, 760 para niños, 1003 estudios
Índice de prueba 1195
demográficos, 165 descripción de, 1123 efectos de lesiones en la cabeza,
164 –165 pruebas de cociente de 1118 detección de simulación usando, 1120t, TEA y, correlación entre, 634 validez de, 196–
características de, 583t, 585t formulario (MAE) para, 933 estudios clínicos de,
limitaciones de, 939 Design Fluency Test, 456 efectos
Mini Examen del Estado Mental (MMSE). normas MOANS, 936–937, 937t datos étnicos en, 204, 206 estructura factorial
Véase también 3MS normativos, 935–937 propósito de, de, 211 flexibilidad de, 216
corte, 185 Escala de datos normativos para, 206–208
calificación de demencia 2 y, correlación entre, 151, 156t, propiedades psicométricas de, 215 propósito
183t efectos demográficos de, 176– de, 201 confiabilidad
177 descripción de, 104, 168–169 efectos de, 208–211 puntuaciones y
educativos, 176, 178t–179t efectos puntuación de conversión de,
étnicos en, 177 estudios analíticos factoriales 207–208 descripción de, 204
de, 183 efectos de género, interpretación de, 215–216
Sensibilidad de 176 ítems, 184 Modificado. sensibilidad de, 215 fuente de, 201
Ver 3MS Modified Mini muestra de
194 descripción de, 190–192 evaluación visual usando, 217
desarrollo de, 107
Machine Translated by Google
1196 Índice de prueba
Índice de prueba 1197
estandarización, 770 demográficos, 1167
resumen de, 774– descripción de, 1152, 1166 eficacia Prueba de memoria conductual de Rivermead—E
775 validez de, 772–775 de, 1169 instrucciones para, 1166f (RBMTE)
propósito de, 1166 condiciones que afectan el desempeño en, 848 descripción
confiabilidad de , 1167–1168 de, 841 puntuación de,
811 detección de simulación trastornos del estado de ánimo que afectan,
Efectos de la enfermedad de Parkinson en, 254, 256 usando, 834–835 848 datos normativos, 843–844, 844t –845t
resumen de , 257 edad para, 610 pruebas
validez de, 249–257 precisión de, 821, 836 de atención correlacionadas con, 614
calidad de, 821
Machine Translated by Google
1198 Índice de prueba
Índice de prueba 1199
1200 Índice de prueba
de edad para, 655 administración de, 280
características de, 549t en efectos de la práctica, 514–517 características de, 103t efectos
niños, 663 efectos propósito de, 499 demográficos, 280 descripción de,
demográficos, 657–658 descripción de, confiabilidad de, 514–517 101, 279–280 historia de, 311f Prueba
655 instrucciones para, efectos de la esquizofrenia en, 519–520 breve de inteligencia
656f–657f simulación de detección puntuación de, 502–503 de Kaufman y correlación entre, 166 datos
usando, 670 correlatos neuroanatómicos, 670 administración de normativos, 281 propósito de, 279
déficits neurocognitivos y, 669–670 en fluidez semántica de, 502f confiabilidad de, 281
Índice de prueba 1201
1202 Índice de prueba
Índice de prueba 1203
Índice de materias
Nota: los números de página seguidos de f y t indican figuras y tablas.
capacidad y el rendimiento Atención
preescolar y primaria de Wechsler: tercera edición y 344 Examen multilingüe de afasia y, 935
Evaluación de amplio rango de memoria y aprendizaje: Prueba de nombres de Boston: 2 y 904 Prueba de adición en serie auditiva estimulada y,
segunda edición y 885 Pruebas Breve Test de Atención y, 550 594–595
Prueba de recordatorio selectivo de Buschke y, 716 Prueba de memoria de reconocimiento y, 770
Prueba de aprendizaje verbal de California—Niños Batería repetible para la evaluación de
Versión (CVLTC) y, 738 Estado neuropsicológico y, 239
usos clínicos de, 363 Prueba de aprendizaje verbal de CaliforniaII y, 731 Prueba Rey de Aprendizaje Auditivo Verbal y, 782
consideraciones de puntuación para, 365 Prueba neuropsicológica de Cambridge Prueba de memoria de quince ítems de Rey y, 1167
Actividades de la vida diaria, 1083, 1107, 1134 Baterías y Automatizados, 416 Prueba de figura compleja de ReyOsterrieth y, 826
Descripción del funcionamiento Prueba de categoría y, 427 Orientación DerechaIzquierda y, 1018
adaptativo de, 1083 Prueba de dibujo del reloj y, 975–976 Prueba de memoria conductual de Rivermead—Segunda
pruebas de, 1082t Prueba de estimación cognitiva y, 440 Edición (RBMTII) y, 843
1204
Machine Translated by Google
Índice de materias 1205
Prueba Wechsler de lectura de adultos y, 348 Prueba de estimación cognitiva de Biber y, 442
Prueba de rendimiento de rango amplio: 3 y 385 Examen de diagnóstico de afasia de Boston en pacientes Déficits de
1206 Índice de materias
estimación de, 22–23 poder Coeficiente alfa, 9, 25, 9t. Ver también Confiabilidad
predictivo y, 22 de deterioro, 28, Fuerza de agarre y, 1055 interna Habilidades cognitivas
Prueba de rendimiento táctil y National Adult Reading Test, 196–198 de Paced
Escalas Bayley de Desarrollo Infantil y, 114 1034 Prueba de 81–82 Prueba de atención diaria Auditory Serial Adding Test, 601 de Raven's Progressive
Prueba de cancelación de campanas y, 970 para niños y 638 Prueba de simulación de Matrices, 233 de Scales of Independent Behavior
Prueba de retención visual de Benton y, 694–695 memoria y 117, 1175 —Revised,
Prueba de nombres de Boston: 2 y 907–908, 912 Prueba de inteligencia no verbal y 268 Prueba de 1139
Prueba de categoría y, 424 Función, 1094–1095 de la
Escala de Memoria Infantil y, 746 Escala de memoria infantil, 751 de Prueba
Prueba de dibujo del reloj en, 975–977, 976t, 979, 981 integral de creación de senderos, 561
Machine Translated by Google
Índice de materias 1207
Prueba de estimación cognitiva y, 442 desempeño táctil, 1038 de la prueba de atención
1208 Índice de materias
Examen multilingüe de afasia y, 935 étnicamente ajustadas, 49 –50 Efectos
Prueba de adición en serie auditiva estimulada y, 595 étnicos. Véase también Raza, Aculturación Pruebas WoodcockJohnson III de cognición
Prueba de vocabulario en imágenes de Peabody—Tercera Inventario de depresión de Beck—Segunda edición y, 1085 Habilidades y, 356
Edición (PPVTIII) y, 942 Criterios de exclusión, 52
Inventario de Evaluación de la Personalidad y, 1129 Prueba de cancelación de campanas y, 970 Función ejecutiva
Prueba de tablero perforado de Purdue y, 1069 Prueba de retención visual de Benton y, 693 recomendaciones de evaluación, 407, 407t definición
Prueba de fichas y, 956 Prueba de organización visual de Hooper y, 991
Prueba de creación de senderos y, 658 Prueba de aprendizaje verbal de Hopkins—Revisada Validez nominal, 18
Prueba de 21 ítems y, 1177 y, 761 Fatiga, 537, 605
Prueba de fluidez verbal y, 504 Sentencia de Orientación de Línea y, 999
Batería de Percepción Visual de Objetos y Espacios y, MMSE y, 176 Retroalimentación durante la evaluación neuropsicológica,
1008 Examen multilingüe de afasia y, 935 79 de resultados, 95
Machine Translated by Google
Índice de materias 1209
Aprendizaje dicótico: palabras y, 917 sección informe neuropsicológico,
Vocabulario expresivo de imágenes de una sola palabra 87–88 Estimacion
Prueba—Tercera edición y, 923 cuestionarios utilizados en Prueba de memoria de reconocimiento y, 770
Golpeteo con los dedos y, 1044 para adultos, 57f–66f Prueba Rey de Aprendizaje Auditivo Verbal y, 783
Prueba de cinco puntos y, 458 para niños, 67f–73f Prueba de memoria de quince ítems de Rey y, 1167
Escala de Depresión Geriátrica y, 1100–1101 VIHSIDA, 614, 669, 704, 767, 804, 1027, 1065 Prueba de figura compleja de ReyOsterrieth y, 826
Fuerza de agarre y, 1053 Orientación DerechaIzquierda y, 1018
Tablero ranurado y, 1062 Terapia de reemplazo hormonal, 848 Prueba de memoria conductual de Rivermead—Segunda
Pruebas de Hayling y Brixton y, 461 Enfermedad de Huntington, 155, 183, 254, 301, 350, 421, Edición (RBMTII) y, 843
Prueba de aprendizaje verbal de Hopkins—Revisada y, 448, 475, 493, 519–520, 552, 625, 697, 804, Prueba de atención selectiva de Ruff 2 y 7 y, 612
760–761 832, 874, 1010, 1027 Prueba de fluidez figurativa de Ruff y, 467
Actividades Instrumentales de la Vida Diaria y, Hidrocefalia, 744, 1097 métodos de detección, 101, 103–104
1110 Hiperbilirrubinemia, 959 Prueba de repetición de oraciones y, 858
Integrado Visual y Auditivo Continuo hiperexia, 919 Prueba Stroop y, 481
Prueba de rendimiento y, 578 Hipoglucemia, 605 Prueba de rendimiento táctil y, 1033
Sentencia de Orientación de Línea y, 999 Prueba de Atención Diaria a Niños y Niñas, 640
Personalidad multifásica de Minnesota Memoria implícita, 679
Inventario—2 y, 1117 Consentimiento informado Prueba de simulación de memoria y, 1172
MMSE y, 176 descripción de, 78 Test de Variables de Atención y, 647
Examen multilingüe de afasia y, 935 diagrama de flujo para, Prueba de fichas y, 956
Prueba de adición en serie auditiva estimulada y, 595 79f muestra, 80f Prueba de creación de senderos y, 658
1210 Índice de materias
Multiphasic Personality de Brixon Tests, 463 de
batería de evaluación neuropsicológica, 223, 228 de la Trail Making Test, 560 de DelisKaplan Executive
prueba de Function Coeficiente de fiabilidad de KuderRichardson, 9, 9t
adición en serie auditiva de ritmo, 597 de la prueba de Sistema, 446
vocabulario en imágenes de Peabody: tercero descripción de, 12 de Síndrome de LandauKleffner, 919
Edición, 944 del Prueba de puertas y personas, 759 de Idioma, 504–505
Inventario de Evaluación de la Personalidad, 1129 de la Vocabulario expresivo de imágenes de una palabra Pruebas de idioma, 891, 892t
Prueba de Memoria de Reconocimiento, Test—Tercera edición, 925 de Distribución de LaplaceGauss, 3
771 de la Batería Repetible para la Evaluación de Gray Oral Reading Tests—Cuarta edición, Lateralidad, 759, 769, 833, 848, 874, 917–920, 1003, 1038, 1047–
Estado neuropsicológico, 244 368 1048, 1056–1057, 1065, 1077
Machine Translated by Google
Índice de materias 1211
Prueba Rey de Aprendizaje Auditivo Verbal, Símbolo Dígito Modalidades Prueba en pacientes con,
Trastorno depresivo mayor. Ver Depresión, Trastornos 788t–795t 625
práctica efectos sobre, 686 81 presencia de terceros durante, 79, 81 baterías
Detección de prueba de adición en serie auditiva estimulada fiabilidad de, 686 neuropsicológicas, 103104 informe neuropsicológico.
de, 606 meningitis, 960 Ver Informe Pruebas neuropsicológicas Efecto Flynn,
Matrices progresivas de Raven y, 234–235 Menopausia, 697 45–46 imprecisión de, 28 precisión
Detección de prueba de memoria de reconocimiento de, 774 Registros de salud mental, 56t de, 9 selección de, 75–76
Detección de prueba de aprendizaje verbal auditivo Rey de, Retraso mental, 155, 156, 266, 271, 282, 336, estándares para, 3
805–806 804, 921, 931, 849, 1164, 1186 Registros traducción de, 83
Detección de prueba de figura compleja de ReyOsterrieth de, militares, 56t Grupos variabilidad entre, 3
834–835 minoritarios. Véase también Etnicidad factores causantes
Criterios pulidos para, 1145, 1146t normas de base demográfica para, 51 normas de no normalidad, 8
Prueba de identificación de olores detección de, 1028 para, 50 Trastornos efectos techo, 8 efectos
Prueba Stroop y, 495 del estado de ánimo. Ver también Ansiedad, Depresión, suelo, 8 distribución
Test de Variables de Atención y, 652 Trastornos Psiquiátricos casi uniforme, 8
Detección de prueba de token de, 960 Rivermead Behavioral Memory Test—Second Edition y, 848 Test descripción general
Trail Making Test en, 671 of Memory Simulating de, 7–8 derivaciones
Prueba de clasificación de tarjetas de Wisconsin para la detección de, Autobiográfica de
538 Esclerosis Múltiple
Prueba de nombres de Boston2, 907t definición de, 3
1212 Índice de materias
población, 47 en Test, 966–967 de Beck Depression
informe, 92 selección Inventory—Second
de, 44 tamaño de, 1111 Edición, 1086, 1088 del
para niños, 35f–40f DelisKaplan Executive Function System, 446, 447t de
Pearson, Carlos, 3 Parálisis supranuclear progresiva, 1077 Design
Correlaciones de Pearson Trastornos psiquiátricos, 197, 256, 422, 571, 635, Fluency Test, 453–454 de Didotic Learning
ventajas de, 12 804, 833, 926, 988, 995, 1164, 1174, 1175. —Words, 917 de Doors and People Test, 758
descripción de, 12 Véase también Depresión, Esquizofrenia, de Dot Counting Test, 1163–1164
Informes de rango percentil, 91 Ansiedad evaluación de, 13 de Vocabulario expresivo
Percentiles Descripción de trastornos de imágenes de una
definición de, 4 psicológicos de, 1080 sola palabra
interpretación de, 4 Historia de, 1080 Prueba: tercera edición, 925 de la
Prueba de adición en serie auditiva estimulada y, 604 Actividades instrumentales de la vida diaria, 1110
Machine Translated by Google
Índice de materias 1213
auditiva estimulada, puntuaciones
597–598, 601 de Habilidades, 357–359 de de exámenes, 90–93
la Prueba de vocabulario en imágenes de Peabody—Tercero Prueba de memoria de palabras, 1186 redacción de, 86
Edición, 944–945 del Coeficientes de confiabilidad
Inventario de Evaluación de la Personalidad, 1129 de la adecuación de, 13–14
Prueba de Memoria de Reconocimiento, 771–772 de varianza del error y, 9, 9t factores Sesgos de respuesta, 66
la Batería Repetible para la Evaluación de que afectan, 9
en Prueba de golpeteo con los dedos, Prueba de categoría y, 433
1138 1047 en Escala de depresión geriátrica, 1101–1102 en Prueba de dibujo de reloj y, 979,
de Prueba de Señalamiento Autoordenado, 474, 476 Fuerza de agarre, 1056 en Prueba de estimación cognitiva y, 442
de Prueba de Repetición de Oraciones, 858 Tablero ranurado, 1064 en Prueba Prueba de rendimiento continuo de Conners y, 572
de Prueba de Identificación de Olores, 1026 revisada de aprendizaje verbal de Hopkins,
de Velocidad y Capacidad del Lenguaje 765–766 Prueba de escucha dicótica y, 920
Prueba de procesamiento en el MiniExamen del Estado Mental, 181 en el Prueba de conteo de puntos y, 1162
Prueba de velocidad de comprensión, 274–275 de la Inventario de Evaluación de la Personalidad, 1129 en la Prueba de Hayling y Brixton y, 464–465
prueba SpottheWord, 275–276 de las Prueba de Memoria de Reconocimiento, 772 Prueba Nacional de Lectura para Adultos, 197
escalas de inteligencia StanfordBinet: quinto en la Batería Repetible para la Evaluación de Prueba de adición en serie auditiva estimulada y, 605
Edición, 263–264 de Estado neuropsicológico, 244–257 en la prueba de Tablero perforado de Purdue y, 1077
Stroop Test, 490–492 de Symbol aprendizaje auditivo verbal de Rey, 800, 804t en la figura compleja Batería repetible para la evaluación de
Digit Modalities Test, 620, 622–623 de Tactual Performance de Rey Osterrieth, 830 en la prueba de fluidez figurativa Estado neuropsicológico, 250, 256
Test, 1036–1037 de Test of Everyday Attention, 632– de Ruff, 468 en la prueba de modalidades de Prueba de memoria conductual de Rivermead y, 847
633 de Test of Everyday Attention for Children, 641– dígitos de símbolos, 622–623 en la prueba de rendimiento Prueba de Ruff 2 y 7 y, 614
en la prueba de clasificación de cartas de Wisconsin, 531–534 Prueba de memoria de palabras y, 1186
Informe Exactitud de las
10091010 apéndices, 93 pruebas de detección de,
de la escala abreviada de inteligencia de Wechsler, observaciones de comportamiento en, 89 20t, 21 descripción de,
281 generado por computadora, 94–95 20 eficiencia de, 21
de la Escala de Inteligencia para Adultos de Wechsler—III, confidencialidad de, 87 Autoconocimiento, 688.
294–298 contenido de, 87, 87t Autoinforme, 104
Machine Translated by Google
1214 Índice de materias
Factores sociodemográficos Puntajes de cambio basados en regresión
Interacción con normas más antiguas, 46 estándar (SRB). Administración de pruebas
Estimaciones premórbidas basadas en, 111 basada en computadora, 77–78
Estatus socioeconómico Ver Cambio toma de notas durante, 77
Examen de diagnóstico de afasia de Boston y, 895 Muestra estandarizada, 53 orden de, 78
educación Puntuaciones estandarizadas por psicometrista, 77 en
para padres y, 120 interpretación de, 6 informe, 93
Escala de inteligencia para adultos de Wechsler—III y 289, transformación lineal de, 4, 5t no tiempo requerido para, 77
291 normalidad de los tiempo de, 76–77
Pruebas de función somatosensorial, 1012–1013 factores causales, 8
imágenes de una palabra prueba de retención visual de Benton, 696 del
Prueba—Tercera edición, 925 de examen de diagnóstico de afasia de Boston, 896 de la prueba de
la Prueba de vocabulario expresivo, 930 de las convencional, 1150–1152 cortes, denominación de Boston—2, 910–911 de la prueba
Pruebas de lectura oral de Gray—Cuarta edición, 1150, 1151t descripción breve de atención, 551–552 de la prueba breve
367 de, 1148 índices de pruebas de memoria visuoespacial—revisada,
de Kaufman Brief Intelligence Test, 165–166 de Minnesota convencionales, 1151–1152 703
Multiphasic Personality de Brixton Tests, 463 de
Índice de materias 1215
prueba de vocabulario expresivo, 930 de la Prueba de memoria conductual de RivermeadII y,
prueba de reconocimiento facial, 987 de 10091010 847–848
Pegboard Test, 1070, 1076 de Recognition estimado, 14–16
Memory Test, 772, 774 de Repeatable Battery for puntajes obtenidos vs., 17
the Assessment of confiabilidad y, 15t
Estado neuropsicológico, 244–246 de la Prueba Distribuciones truncadas, 8, 52 Síndrome
Digit Modalities Test, 620, 622 de Tactual Performance examen de afasia de diagnóstico de Boston,
Test, 1036–1037 PASAT y, 604 896–899
Machine Translated by Google
1216 Índice de materias
and People Test, de Prueba de memoria de palabras, 1186–1187
759, 760 de Dot Counting Test, 1164 evaluación de Escalas de Comportamiento IndependienteRevisado, Coeficiente de validez, 19–20
de, 18–19 de Vocabulario expresivo 11381139 Demencia vascular, 155,183, 767, 832, 1027
de imágenes de una sola de la Prueba de Señalamiento Autoordenado, 474– Síndrome velocardiofacial, 1010
palabra 476 de la Prueba de Repetición de Oraciones, Defecto del campo visual, 234, 979, 966, 988
Prueba—Tercera edición, 925–927 de la 858–859 de la Prueba de Identificación de Olores, Descuido visual, 234, 834, 979, 970, 964–966, 987, 1003
Prueba de vocabulario expresivo, 931–932 de la 1026–1028 de la Velocidad y Capacidad del Lenguaje
Prueba de reconocimiento facial, 987–988 de Prueba de procesamiento Pruebas de percepción visual, 963–965
Localización de dedos, 1016–1017 de Toque Prueba de velocidad de comprensión, 276 Trastornos visoespaciales, 964
de dedos, 1047–1049 de Prueba de Prueba de SpottheWord, 276–278
cinco puntos, 459 de informes Estándares de Educación y Psicología Hiperintensidades de sustancia blanca, 1077, 1103
forenses, 94 de la Escala de Descripción de la prueba, 17 de Síndrome de Williams, 988, 1065
Depresión Geriátrica, 1102–1104 de las Pruebas de las escalas de inteligencia de StanfordBinet: quinto Normalización dentro del grupo, 50
Lectura Oral de Gray—Cuarta Edición, Edición, 264–266 de Pruebas de lectura de
368–369 Stroop Test, 492–495 subtipos palabras descripción de, 107
of Grip Strength, 1056–1058 of Grooved de, 18 de Symbol Descripción de la
Pegboard, 1065–1066 of Hayling Tests, 463– Digit Modalities Test, 623–626 de Tactual Performance memoria de trabajo de, 678–
465 of Hooper Visual Organisation Test, 1037–1038 de Test of Everyday Attention, 633– 679 correlatos neurales de, 684–685
Test, 994–996 of Hopkins Verbal Learning Test—Revised 635 de Test of Everyday Attention for Children,
puntuaciones Z