Documentos de Académico
Documentos de Profesional
Documentos de Cultura
com
El neuropsicólogo clínico
Para citar este artículo:Stella H. Kim, Adriana M. Strutt, Laiene Olabarrieta-Landa, Anthony H.
Lequerica, Diego Rivera, Carlos Jose De Los Reyes Aragon, Oscar Utria & Juan Carlos Arango-
Lasprilla (2018): Análisis de ítems de la versión en español del Boston Naming Test con población
adulta hispanohablante de Colombia, El Neuropsicólogo Clínico, DOI:
10.1080/13854046.2018.1441908
Estela H. Kima, Adriana M. Struttb, Laiene Olabarrieta LandaC, Antonio H. Lequericad, Diego
Riverami, Carlos José De Los Reyes AragónF, Óscar Utríagramoy Juan Carlos Arango Lasprillae,h
aDepartamento de Neurología, Centro de Ciencias de la Salud de la Universidad de Texas – Facultad de Medicina Mcgovern, Houston,
TX, EE. UU.;bDepartamento de neurología, Baylor College of Medicine, Houston, TX, EE. UU.;CDepartamento de Psicología y
Educación, Universidad de Deusto, Bilbao, España;dFundación Kessler y Departamento de Medicina Física y Rehabilitación, Rutgers,
Facultad de Medicina de Nueva Jersey, Newark, Nueva Jersey, Estados Unidos;miInstituto de Investigación Sanitaria BioCruces,
Hospital Universitario de Cruces, Barakaldo, España;FDepartamento de Psicología, Universidad del Norte, Barranquilla, Colombia;
gramoDepartamento de Psicología, Universidad San Buenaventura, Bogotá, Colombia;hiKerBasQue, Fundación Vasca para la Ciencia,
Bilbao, España
Objetivo:La Boston Naming Test (BNT) es una medida ampliamente utilizada de la recibido el 17 de julio de 2017 aceptado
Introducción
El Boston Naming Test (BNT) es una prueba cognitiva ampliamente utilizada que se desarrolló para
evaluar la capacidad de nombrar por confrontación (Kaplan, Goodglass y Weintraub,1983). La prueba
consta de 60 dibujos lineales de varios objetos y se desarrolló originalmente en inglés utilizando una
muestra caucásica. Posteriormente se desarrolló una versión corta del BNT de 15 ítems, utilizando los
ítems del formulario original, para reducir el tiempo de administración y para su uso con individuos.
que tienen afasia (Aranciva et al.,2011; Hobson y otros,2011; Kaplan, Goodglass y Weintraub, 2001;
del Toro et al.,2011).
Hay traducciones directas del BNT disponibles en otros idiomas (Strauss, Sherman y
Spreen, 2006) y se han estandarizado variaciones del BNT en muchos países como España
(Peña-Casanova, Quiñones-Ubeda et al.,2009; Rami et al.,2008), Canadá (Graves, Bezeau,
Fogarty y Blair,2004), Brasil (Miotto, Sato, Lucia, Camargo y Scaff,2010), Colombia (Quijano et
al.,2015), Argentina (Allegri et al.,1997; Olabarrieta-Landa et al.,2015), El Salvador, Guatemala,
Bolivia, Perú, Paraguay, Chile, México, Honduras, Puerto Rico, Cuba (Olabarrieta-Landa et al.,
2015), Australia (Elkadi et al.,2006), Suecia (Tallberg,2005), Holanda (Marien, Mampaey,
Vervaet, Saerens y De Deyn,1998) y Estados Unidos (Zec, Burkett, Markwell y Larsen,2007). Sin
embargo, los estudios normativos del BNT han utilizado diferentes variaciones, incluidas
versiones segunda y corta.
Las versiones españolas del BNT de 60 y 15 ítems son las más utilizadas a nivel internacional. Aunque
el BNT español es una versión traducida de la medida inglesa, los estímulos difieren. En concreto, el punto
14 (champiñón) es una zanahoria, artículo 19 (galleta salada) es un muffin, artículo 28 (guirnalda) es una
corona, artículo 40 (aldaba) es un chupete, artículo 48 (nudo corredizo) es una aguja, artículo 51 (pestillo)
es un ojo de cerradura, y el elemento 57 (conducción) es una regadera. A pesar de su uso frecuente por
parte de médicos e investigadores, la versión española del BNT ha sido criticada por su cuestionable
validez de constructo cuando se administra a personas cuyo idioma principal no es el inglés. Por ejemplo,
la ausencia de palabras que coincidan directamente con los ítems originales plantea una barrera para una
interpretación precisa del desempeño de la prueba (de la Plata et al.,2009). Cuando el BNT se administra a
personas bilingües tanto en inglés como en un segundo idioma, los análisis de ítems de las respuestas
correctas para evaluar la validez de constructo revelan que estos individuos no demuestran un
desempeño equivalente en ambas versiones de la prueba (Kohnert, Hernandez y Bates, 1998; Sheppard,
Kousaie, Monetta y Taler,2016).
A medida que los investigadores y médicos continúan desarrollando nuevas pruebas y datos
normativos, el conocimiento y la aplicación de las propiedades psicométricas se vuelven críticos. Los
estudios han comenzado a evaluar pruebas utilizando la teoría de respuesta al ítem (TRI), que es un
paradigma que se usa comúnmente para desarrollar y evaluar ítems de pruebas psicométricas. El uso de
IRT para fines de construcción de pruebas también se destacó en la publicación más reciente deLos
Estándares para las Pruebas Educativas y Psicológicas(2014). Hasta donde sabemos, sigue habiendo un
número limitado de estudios de TRI que han identificado preocupaciones sobre las propiedades
psicométricas del BNT de 60 y 15 ítems para grupos no caucásicos (Jahn et al.,2013; Pedraza, Sachs,
Ferman, Rush y Lucas,2011; Pedraza et al.,2009). El propósito de este estudio es investigar la dificultad de
los ítems y la validez de constructo del BNT español utilizado en una muestra colombiana utilizando el
enfoque TRI para evaluar el impacto cultural y lingüístico en esta medida de resultado.
Métodos
Asignaturas
La muestra original estuvo compuesta por 1318 adultos hispanohablantes sanos de seis ciudades
de Colombia: Barranquilla, Bogotá, Cali, Ibagué, Manizales y Neiva (Tabla1). Un total de 20 sujetos
fueron excluidos del análisis final debido a datos incompletos; la muestra final estuvo compuesta
por 1298 sujetos. La edad de los sujetos osciló entre 18 y 90 años (METRO=57,64, DE = 19,75). La
educación osciló entre 1 y 25 años (METRO=9,75, DE = 5,26; Mesa2). La mayoría eran mujeres
(58,4%) y la muestra era principalmente urbana (92,3%).
EL NEUROPSICOLOGO CLÍNICO 3
Tabla 1.Demografía.
Ubicación mín. máx. METRO Dakota del Sur
Criterios de inclusión
Los sujetos elegibles tenían entre 18 y 90 años, siendo Colombia su lugar de nacimiento y lugar de
residencia actual, y el español como idioma principal. Los sujetos habían completado al menos un
año formal de formación académica, lo que equivale a un nivel de educación de primer grado en los
Estados Unidos. La capacidad de leer y escribir se confirmó con base en su desempeño en el Mini
Examen del Estado Mental (MMSE; Lobo, Saz, & Marcos, 2002). Para la inclusión en el estudio, los
sujetos debían poder completar correctamente las tareas de lectura y escritura. La tarea de
escritura requirió el uso de una oración completa con la inclusión de sustantivo, verbo y predicado.
En las medidas de detección de cognición y estado de ánimo, se pidió a los sujetos que
obtuvieran ≥23 puntos en las versiones en español del MMSE (Folstein, Folstein y McHugh,1975;
Villaseñor-Cabrera, Guàrdia-Olmos, Jiménez-Maldonado, Rizo-Curiel, & Peró-Cebollero,2010), ≤4 en
el Cuestionario de Salud del Paciente (PHQ-9; Kroenke, Spitzer, & Williams,2001), y ≥90 en el índice
de Barthel (Mahoney & Barthel,1965).
Criterio de exclusión
Procedimiento
Adultos sanos de habla hispana de seis ciudades colombianas aceptaron participar en este estudio.
Las regiones de Colombia se caracterizan por el relieve terrestre, el clima y la vegetación (Instituto
Geográfico Agustín Codazzi,2012), lo que puede contribuir a diferencias socioeconómicas como el
acceso a la educación. En este estudio, cuatro de las seis ciudades eran de la región andina (la más
grande de Colombia), una ciudad del lado caribeño (Barranquilla) y una ciudad del lado pacífico
(Cali). Cuando la muestra se dividió en dos grupos (región andina versus las otras dos regiones), no
se encontraron diferencias estadísticamente significativas entre los grupos en el rendimiento de
denominación en la versión estándar ni en la versión corta. Por lo tanto, este estudio examinó la
posible variabilidad regional que puede contribuir a las diferencias socioeconómicas de los sujetos.
Las pruebas neuropsicológicas se compraron a los editores y cada prueba fue revisada por un mínimo de dos
nativos colombianos que se especializaban en neuropsicología para garantizar que los sujetos pudieran entender
correctamente las instrucciones dadas las variaciones del idioma español en todo el país. Se nombró a un
profesional de investigación en psicología en cada universidad para gestionar la recopilación de datos, los
materiales de prueba y los manuales de prueba. También se les proporcionó herramientas y ayudas audiovisuales
para lograr la estandarización de la administración de las pruebas.
A los individuos se les administró un cuestionario sociodemográfico sobre su edad, nivel de
educación, sexo, lateralidad, raza, empleo y estado civil. A las personas que cumplieron con los
criterios de elegibilidad se les administró una batería de 10 pruebas neuropsicológicas, que incluían
el BNT. Se utilizó una función de aleatorización en Microsoft Excel para codificar el orden de las
pruebas en la batería para cada participante con el fin de evitar sesgos de orden y minimizar la
interferencia entre las pruebas de lenguaje y las pruebas de memoria verbal. El Comité Ético de la
Universidad de Deusto (Bilbao, España) aprobó este estudio como institución coordinadora.
Medidas
Las versiones corta (15 ítems) y estándar (60 ítems) del BNT en español difieren ligeramente del BNT original
(Kaplan, Goodglass y Weintraub.,1983). Por ejemplo, el artículo 14 es una zanahoria en lugar de un champiñón, el
artículo 19 es un panecillo en lugar de un pretzel, el artículo 28 es una corona en lugar de una corona, el artículo
40 es un chupete en lugar de una aldaba, el artículo 48 es una aguja en lugar de una soga, el artículo 51 es un ojo
de cerradura en lugar de un pestillo, y el artículo 57 es una regadera en lugar de un enrejado. Las respuestas
alternativas no se incluyeron como respuestas correctas (Kaplan, Goodglass y Weintraub,2005).
Análisis
El análisis de Rasch se realizó utilizando el software estadístico Winsteps (Linacre). Se tomaron los
siguientes pasos para evaluar múltiples aspectos del BNT:
En el análisis de Rasch, la jerarquía de ítems creada por la estimación de la dificultad del ítem proporciona una indicación
de la validez de constructo. El BNT fue diseñado para que la dificultad de los ítems aumente a medida que avanza la
prueba. Los valores de las medidas deben ser los más bajos para los elementos más simples o iniciales, mientras que los
valores de las medidas deben ser los más altos para los elementos más difíciles o que aparecen más tarde en el BNT. El
mapa de Wright muestra simultáneamente personas y elementos medidos en la misma escala logit (ver figura1). Las
personas están dispuestas en la mitad izquierda del mapa de Wright de modo que aquellas con mayor capacidad deberían
estar en la parte superior del mapa, mientras que las personas con menor capacidad deberían estar cerca de la parte
inferior del mapa. De manera similar, los elementos que se muestran en la mitad derecha del mapa de Wright muestran
que los elementos más difíciles deberían aparecer hacia la parte superior, mientras que los elementos anteriores o más
fáciles deberían aparecer hacia la parte inferior. Para el BNT, esperaríamos que esto último, más difícil
Los elementos aparecerían en la parte superior o superior del mapa, mientras que antes los elementos más
simples deberían aparecer en el extremo inferior.
Análisis 3: focalización
En una situación ideal, la gama de habilidades queda bien reflejada en la gama de dificultades de los ítems de la prueba. El
propósito de la focalización es identificar la dificultad del ítem según la capacidad de la población. Una buena selección de
objetivos se juzgará aquí inspeccionando el mapa de Wright y asegurándose de que la diferencia entre las medias de
personas y elementos sea inferior a 1,0 logit (Khadka et al.,2011). También se inspeccionará el mapa de personas-
elementos de Wright para determinar qué tan bien coincide el rango de personas con el rango de elementos.
Teniendo en cuenta el gran tamaño de la muestra, se utilizaron valores de ajuste cuadrático medio (MNSQ) superiores a
1,20 para identificar los elementos que no se ajustaban al modelo de Rasch (Wright & Linacre,1994). Según Linacre (2002),
artículos conzLas puntuaciones (ZSTD) de 2,00 o más se consideran demasiado impredecibles. Por lo tanto, se decía que
Resultados
Unidimensionalidad
Como se puede observar en la tabla3, la varianza en los datos explicada por las medidas fue del 49,7%.
Menos del 15% de la varianza fue explicada por el primer componente principal de los residuos (3,6%). La
relación entre la varianza explicada por las medidas y la varianza explicada por el primer componente de
los residuos fue de 13,81:1, satisfaciendo así los tres requisitos establecidos aquí para juzgar la
unidimensionalidad. Como medida unidimensional, se consideraría pobre en términos de varianza
contabilizada, cayendo por debajo del 50% según los criterios de Fisher (Fisher,2007).
Jerarquía de artículos
La jerarquía de ítems se puede ver en el mapa persona-ítem de Wright con un mayor nivel de dificultad
del ítem ubicado en la parte superior del mapa (Figura2). Dieciséis de los artículos se movieron al menos
EL NEUROPSICOLOGO CLÍNICO 7
Tabla 3.Análisis de componentes principales de las estadísticas de residuos para el formulario estándar BnT-60 (norte=1298).
valor propio %
Varianza bruta total en observaciones 119.33 100.00
Varianza bruta explicada por medidas 59.33 49,70
varianza bruta explicada por personas 25.29 21.20
varianza bruta explicada por elementos 34.04 28.50
varianza bruta inexplicable total 60.00 50.30
varianza inexplicable en el primer contraste 4.31 3.60
varianza inexplicable en el segundo contraste 2.21 1,90
15 posiciones de su clasificación esperada de dificultad (cambio ≥25%). Para ocho de estos elementos, su
posición cambió a una de mayor dificultad y se puede ver cerca de la parte superior del mapa (15 perchas,
19 muffins, 5 silbatos, 32 bellotas, 30 armónica, 33 iglú, 25 dardos, 29 castores). Para los ocho elementos
restantes, la posición cambió a una de menor dificultad y se puede encontrar cerca del extremo inferior
del mapa (57 regadera, 39 hamaca, 47 acordeón, 48 aguja, 46 embudo, 50 brújula, 54 tenazas, 35 fichas
de dominó). ).
Orientación
La diferencia entre las medias de personas y elementos fue de 1,71 logits, lo que indica una mala focalización, ya que las
personas obtuvieron puntuaciones más altas que los elementos más difíciles. Esto se puede ver en el mapa de Wright,
donde no hay suficientes elementos en la parte superior del continuo para capturar niveles más altos de habilidad. Mesa4
muestra esto cuantitativamente donde el límite superior para las personas es 7,21 logits pero el límite superior para los
Hubo varios elementos que no encajaban en el constructo o no se comportaban como se esperaba. En mesa 5
abajo,casatenía el equipo más alto MNSQ y ZSTD. También tuvo una correlación negativa de medida de puntos, lo
que sugiere que las respuestas correctas en este ítem no estaban asociadas con la puntuación total de la prueba.
Una mirada más cercana a las respuestas mostró que era un ítem con un nivel de dificultad muy bajo, sin
embargo, los sujetos que omitieron este ítem tenían una medida de habilidad media más alta que aquellos que lo
nombraron correctamente (1,81 frente a 1,71). Los patrones de respuesta anecdóticos sugieren que esto podría
ocurrir si un gran número de individuos respondiera con una palabra común para describir la imagen que no se
considerara una respuesta correcta. Por ejemplo, el dibujo representa una casa bastante grande a la que muchos
pueden responder conmansión.
Unidimensionalidad
Como se puede observar en la tabla6, la varianza en los datos explicada por las medidas fue del 54,0%.
Menos del 15% de la varianza fue explicada por el primer componente principal de los residuos (5,7%). La
relación entre la varianza explicada por las medidas y la varianza explicada por el primer componente de
los residuos fue de 9,47:1, satisfaciendo así los tres requisitos establecidos para juzgar.
8 SH KIM Y AL.
Tabla 4.Estadísticas generales de personas y artículos para el formulario estándar BnT-60 (norte=1298).
Significar 1.71 . 00
Máximo 7.21 4.25
Mínimo − 2,97 - 4,88
separación 3.13 16.34
fiabilidad . 91 1.00
inadaptado Atuendo
Tabla 6.Análisis de componentes principales de las estadísticas de residuos para la forma corta BnT-15 (norte=1298).
Jerarquía de artículos
La jerarquía de elementos se puede ver en el mapa persona-elemento de Wright (Figura3) con mayor nivel
de dificultad del elemento ubicado hacia la parte superior del mapa. Un total de cinco ítems avanzaron al
menos cuatro posiciones desde su clasificación de dificultad esperada (cambio >25%). Cuatro de los cinco
ítems cambiaron de posición a uno de mayor dificultad (ítem 8 castor, ítem 11 estetoscopio, ítem 5 banco,
ítem 2 peine). El quinto elemento (elemento 10, hamaca) fue más fácil de lo previsto y pasó de una
posición del 10 al 3.
Orientación
La diferencia entre las medias de personas y elementos fue de 1,17 logits, lo que indica una mala focalización, ya que las
personas obtuvieron puntuaciones más altas que las de los elementos más difíciles. Esto se puede ver en el mapa de
Wright, donde no hay suficientes elementos en la parte superior del continuo para capturar niveles más altos.
10 SH KIM Y AL.
Figura 3.Mapa de persona-elemento de Wright para la forma abreviada BnT-15 (norte=1298). nota: personas conspiradas contra
artículos. cada '#' representa 13 participantes. cada '.' representa de 1 a 12 participantes.
EL NEUROPSICOLOGO CLÍNICO 11
de habilidad. Mesa7muestra esto cuantitativamente donde el límite superior para las personas es 5,54 logits pero el límite
Hubo varios elementos que no encajaban en el constructo o no se comportaban como se esperaba. Con la
excepción deestetoscopio, la mayoría de los elementos que no encajaban parecían deberse a que sujetos de alta
capacidad los interpretaron incorrectamente. Conestetoscopio, hubo varios individuos de baja capacidad que lo
puntuaron correctamente. En general, estos elementos, que se muestran en la Tabla8no se comportó como se
esperaba dentro del contexto del modelo de Rasch.
Discusión
Se han hecho esfuerzos para abordar las barreras lingüísticas y culturales del uso de versiones traducidas
directamente del BNT que simplemente intentan hacer coincidir los ítems originales de la prueba creando
nuevas tareas de confrontación de nombres en otros idiomas usando ítems culturalmente destacados y
desarrollando datos normativos para diferentes razas/étnicas. poblaciones. Desafortunadamente, las
prácticas clínicas y de investigación actuales no siempre permiten versiones alternativas de las medidas
de evaluación y, por lo tanto, este estudio utilizó un análisis de Rasch basado en un modelo IRT para
investigar el nivel de dificultad y la validez de constructo de las versiones de 60 y 15 ítems. del BNT en
población colombiana hispanohablante.
En general, ambas versiones del BNT demostraron unidimensionalidad y buena confiabilidad entre los
ítems. En cuanto a la jerarquía de ítems, muchos de los ítems más difíciles no se comportaron como
Tabla 7.Estadísticas generales de personas y artículos para el formulario abreviado BnT-15 (norte=1298).
Significar 1.17 . 00
Máximo 5.54 3.10
Mínimo − 4,48 − 4,20
separación 1,73 20.98
fiabilidad . 75 1.00
inadaptado Atuendo
esperado. Varios alumnos de alto rendimiento en el BNT omitieron los elementos más fáciles, mientras que los
individuos con menor nivel de habilidad nombraron correctamente los elementos más difíciles, violando así el
modelo de Rasch. Es posible que los elementos más difíciles hayan sido nombrados incorrectamente en esta
muestra normativa debido al nivel de prominencia de los estímulos dentro de una cultura determinada. Si las
personas con una gran capacidad para nombrar objetos se equivocan, puede deberse a la falta de familiaridad
con el objeto o a una terminología diferente utilizada para nombrarlo. Otra posible explicación para este hallazgo
puede deberse a la estricta administración de la investigación y al método de puntuación del BNT. Las personas
con alta capacidad para nombrar nombres pueden haber proporcionado respuestas alternativas y más
sofisticadas que fueron aceptables pero no incluidas en la puntuación general según la administración y
puntuación estandarizadas (p. ej.mansiónen lugar decasa). A la inversa, las personas con menor capacidad para
nombrar pueden haber recibido puntos por no proporcionar nombres menos comunes o más sofisticados para
los objetos representados. Por lo tanto, los médicos deben describir cualitativamente los tipos específicos de
errores que llevaron a la puntuación general para proporcionar contexto si deciden adherirse al mismo enfoque
de puntuación estricto utilizado en este estudio. También puede ser útil para investigaciones futuras investigar
respuestas clínicas alternativas y aceptables que cuenten para la puntuación general (p. ej.harmónicayórgano
bucalambos son aceptables para la puntuación e interpretación clínica).
En términos de discriminación del nivel de capacidad, los ítems del BNT pudieron evaluar adecuadamente a
los individuos en los niveles de capacidad inferior y medio, pero no en los niveles superiores, lo que sugiere una
escasa utilidad a los efectos de las pruebas de rendimiento. Sin embargo, debido a que el BNT está diseñado para
ser una prueba para medir el deterioro, sería más deseable su capacidad para discriminar el extremo inferior del
espectro. Si el objetivo fuera capturar todos los niveles de habilidad, incluidos niveles altos como en las pruebas
de rendimiento, elementos adicionales con un mayor nivel de dificultad podrían ser útiles para ampliar la
capacidad de discriminar entre individuos con niveles más altos de habilidad.
Al igual que en hallazgos anteriores, hubo una redundancia considerable dentro de la versión de 60
ítems (Pedraza et al.,2011). En otras palabras, estos ítems redundantes aportaron muy poco valor
predictivo al total de las escalas. Muchos de los ítems de la versión de 60 ítems parecían agregar ruido o
inexactitud a la medición de los nombres debido a que no se ajustaban al modelo de Rasch. Esto es
consistente con hallazgos previos de un estudio de análisis de ítems de que el BNT no pudo discriminar
con precisión la capacidad de nombrar, ya que la dificultad de los ítems no coincidía con el nivel de
habilidad, y había ítems que eran psicométricamente redundantes al comparar grupos caucásicos y
afroamericanos (Pedraza et al. Alabama.,2009). Un estudio de seguimiento realizado por los mismos
investigadores utilizando sujetos en Florida reveló que el orden de los ítems no se correlacionaba
fuertemente con el nivel de dificultad (Pedraza et al.,2011). Además, se observó redundancia en los ítems,
y la evaluación de la capacidad para nombrar fue buena para los individuos con un rango de promedio
bajo, pero no para los individuos con un nivel de capacidad más alto. Por lo tanto, los hallazgos de este
estudio son consistentes con la literatura actual en que la validez de constructo del BNT sigue siendo una
preocupación cuando se administra a poblaciones no caucásicas o que no hablan inglés.
Un estudio anterior sugirió que la forma corta puede ser un instrumento útil para evaluar a pacientes
ancianos de habla hispana que requieren métodos de prueba más cortos por sospecha de deterioro
cognitivo severo o bajo nivel de educación, ya que demostró una buena validez de criterio con respecto a
otras medidas de demencia y a la BNT completo (Calero, Arnedo, Navarro, Ruiz-Pedrosa y Carnero,2002).
Sin embargo, contrariamente a esta sugerencia, los hallazgos de este estudio no mostraron que el BNT de
15 ítems fuera capaz de detectar adecuadamente diferencias entre los de alto y bajo rendimiento.
Tampoco parece haber una solución rápida para esta limitación dado que la eliminación de elementos que
no ajustan bien disminuiría la confiabilidad y reduciría aún más la capacidad del
EL NEUROPSICOLOGO CLÍNICO 13
prueba para capturar el espectro completo de habilidades. Desarrollar nuevos formularios breves y ejecutar IRT
en los BNT españoles existentes pueden ser opciones viables. Si bien hay muchos estudios que desarrollan
formas cortas para diversos fines en inglés (Katsumata et al.,2015), existen pocos estudios que utilicen la TRI para
desarrollar formas cortas apropiadas en español. Fernández-Blázquez et al., (2012) utilizaron métodos TRI para
crear dos versiones equivalentes de 15 ítems. Sin embargo, su muestra se limitó a personas mayores de 65 años.
Se justifica realizar investigaciones adicionales que extiendan estos hallazgos a muestras más grandes con un
rango más amplio de edades.
Una advertencia a estos hallazgos es que no se incluyó una medida independiente de validez del
desempeño en la batería de pruebas. Por lo tanto, existe la posibilidad de que el esfuerzo inadecuado
pueda ser una fuente de variación, ya que los individuos sin antecedentes de deterioro cognitivo, o en
ausencia de incentivos, pueden realizar un esfuerzo deficiente en un experimento de investigación. Los
estudios futuros deberían integrar medidas de validez del desempeño para examinar el papel del
esfuerzo/compromiso en el desempeño del BNT. Hubo varias otras limitaciones para este estudio. El BNT
administrado en este estudio es la versión en español del BNT en inglés publicado por la Editorial Médica
Panamericana y vendido por TEA Ediciones, con artículos seleccionados que fueron reemplazados por
otros más destacados cultural y lingüísticamente. Por lo tanto, Los resultados del estudio deben
interpretarse con precaución en adultos no hispanohablantes que hablan español. Además, como se
mencionó anteriormente, la administración del BNT siguió un estricto protocolo de investigación y no tuvo
en cuenta respuestas alternativas aceptables, lo que puede haber afectado la evaluación de la dificultad y
la discriminación de los ítems. Esto también puede plantear un desafío para la aplicación práctica, ya que
la administración y la puntuación en entornos clínicos no suelen seguir un protocolo tan estricto. Por lo
tanto, las investigaciones futuras deberían incluir la investigación e identificación de respuestas
alternativas específicas que deberían considerarse correctas para una mejor traducción y aplicación al uso
de la medida en el mundo real. Otra limitación de este estudio es que la muestra proviene de un país de
habla hispana y puede no ser apropiado generalizar estos hallazgos a otros grupos de habla hispana. Se
recomienda encarecidamente a los investigadores y médicos que consideren las poblaciones normativas y
eviten la suposición incorrecta de que todas las palabras en español y los datos normativos son aplicables
a todos y cada uno de los individuos de habla hispana.
En este análisis, la educación no se estratificó para capturar la gama más amplia de habilidades y mapear las
dificultades de los ítems utilizando el modelo de Rasch. Por lo tanto, se necesitan más estudios para determinar
elementos específicos que se deben retener mediante un análisis más detallado. Dada la amplia gama de
educación en esta muestra, otro estudio de investigación está investigando actualmente la educación como una
variable moderadora para determinar si conjuntos separados de ítems pueden ser más apropiados para personas
con niveles de educación más altos y más bajos. Puede haber una interacción compleja entre cultura y educación
en el sentido de que es más probable que los individuos con niveles más altos de educación hayan encontrado
elementos poco comunes en la región geográfica, como "bellotas" o "castores", en sus estudios, donde una
formación más avanzada en botánica y La zoología puede ser parte del plan de estudios. Para aquellas personas
con bajos niveles de educación, se deben considerar factores contribuyentes adicionales que impactan
negativamente el desarrollo cognitivo de un individuo. Esas posibles privaciones pueden incluir el acceso a una
nutrición adecuada (especialmente para aquellos en el grupo socioeconómico más bajo), la falta de acceso al
transporte para asistir a programas académicos formales (lo que afecta a quienes viven en áreas rurales con
recursos locales limitados), la falta de educación formal y una educación limitada o nula. exposición a tareas y
aprendizaje de tipo académico
14 SH KIM Y AL.
entornos secundarios al ingreso temprano a la fuerza laboral y alfabetización limitada: habilidades de escritura y
lectura de bajo nivel con posibles discapacidades de aprendizaje no detectadas. Es probable que la influencia
negativa de estos datos sociodemográficos se observe en la mayoría de las medidas de resultados
neuropsicológicos, dada la base académica subyacente de la mayoría de las herramientas utilizadas. En un
intento por mejorar aún más las propiedades psicométricas de esta medida, las consideraciones de investigación
futuras incluyen generar datos normativos ajustados por edad, educación y sexo (que pueden servir como
indicador del nivel de educación) para presentar una versión en español más psicométricamente sólida. Además,
puede ser beneficioso realizar más investigaciones para identificar un punto de corte para determinar la
sensibilidad, especificidad y poder predictivo del BNT español con diferentes muestras clínicas.
También destaca el valor de utilizar el modelo TRI al evaluar críticamente la validez de constructo del BNT
y otros instrumentos psicométricos. Puede ser útil para los médicos utilizar un estándar de comparación
para reducir las tasas de falsos positivos en varios idiomas (por ejemplo, la prueba de vocabulario de
imágenes de Peabody), dado que las normas para otros grupos culturales generalmente están por debajo
de las normas inglesas, lo que genera un problema de altas tasas de falsos positivos en inglés. que en
español (Gasquoine, Croyle, Cavazos-González y Sandoval,2007). Otras sugerencias para los médicos en
términos de administración e interpretación de las pruebas incluyen comparar la información
demográfica de los pacientes con la del BNT para guiar la interpretación caso por caso, estar
familiarizados con los cambios significativos en la clasificación clínica ya que no es una medida sensible de
logro. y considerar el perfil cognitivo integral del paciente para determinar si esto puede ser o no una
variable aislada del desempeño en lugar de un deterioro cognitivo. Los médicos también pueden
beneficiarse de la generación de datos normativos utilizando respuestas correctas alternativas para cada
uno de los ítems del BNT. Las investigaciones futuras deben continuar desarrollando y evaluando pruebas
de denominación alternativas que tengan en cuenta objetos culturalmente destacados al organizarlos
según la dificultad del ítem para discriminar mejor entre individuos cognitivos intactos y con deterioro.
Dada su escasa utilidad actual a la hora de evaluar el rendimiento o un mayor nivel de capacidad, las
investigaciones futuras también deberían investigar el BNT de 60 ítems en una muestra con datos
demográficos similares, pero de una población clínica, para determinar la utilidad de detectar el deterioro.
Declaración de divulgación
Referencias
Alegret, M., Espinosa, A., Vinyes-Junqué, G., Valero, S., Hernández, I., Tárraga, L., … Boada, M. (2012).
Datos normativos de una batería neuropsicológica breve para españoles mayores de 49 años.Revista
de Neuropsicología Clínica y Experimental, 34(2), 209–219.
Allegri, R., Mangone, C., Fernández Villavicencio, M., Rymberg, S., Taragano, F. y Baumann, D. (1997).
Normas del examen de denominación de Boston en español.El neuropsicólogo clínico, 11(4), 416–420.
Asociación Estadounidense de Investigación Educativa, Asociación Estadounidense de Psicología, Consejo Nacional
sobre Medición en Educación y Comité Conjunto sobre Estándares para Pruebas Educativas y Psicológicas (EE.
UU.). (2014).Normas para las pruebas educativas y psicológicas. Washington, DC: Autor. Aranciva, F., Casals-
Colla, M., Sánchez-Benavidesa, G., Quintana, M., Manero, R., Rognoni, T., … Peña-
Casanovab, J. (2011). Estudios normativos españoles en población adulta joven (proyecto NEURONORMA
adultos jóvenes): Normas para el Boston Naming Test y el Token Test.Neurología, 27(7), 394–399. Calero, MD,
Arnedo, ML, Navarro, E., Ruiz-Pedrosa, M. y Carnero, C. (2002). Utilidad de un ítem de 15
Versión de la prueba de denominación de Boston en la evaluación neuropsicológica de personas mayores con
demencia con bajo nivel educativo.Revistas de Gerontología Serie B: Ciencias Psicológicas y Ciencias Sociales, 57(2),
P187-P191.
Cherner, M., Suarez, P., Lazzaretto, D., Fortuny, LA, Mindt, MR, Dawes, S.,… Grupo HNRC. (2007).
Normas demográficamente corregidas para la prueba de memoria visuoespacial breve revisada y la prueba de aprendizaje
verbal de Hopkins revisada en hispanohablantes monolingües de la región fronteriza entre Estados Unidos y México.Archivos de
Neuropsicología Clínica, 22(3), 343–353.
Cuetos, F., Ellis, A. y Álvarez, B. (1999). Horas de nombrar las imágenes de Snodgrass y Vanderwart en
Español.Métodos, instrumentos y computadoras de investigación del comportamiento, 31, 650–658.
de la Plata, C., Arango-Lasprilla, JC, Alegret, M., Moreno, A., Ta ŕraga, L., Lara, M., … Cullum, C. (2009).
Análisis de ítems de tres pruebas de denominación en español: una investigación transcultural.Neurorrehabilitación, 24(1), 75–
85.
dieciséis SH KIM Y AL.
del Toro, CM, Bislick, LP, Comer, M., Velozo, C., Romero, S., Rothi, LJG y Kendall, DL (2011).
Desarrollo de una versión breve del Boston Naming Test para personas con afasia.Revista de
investigación del habla, el lenguaje y la audición, 54(4), 1089-1100.
Duncan, PW, Bode, RK, Lai, SM, Perera, S. y antagonistas de glicina en neuroprotección en las Américas
Investigadores. (2003). Análisis de Rasch de una nueva escala de resultados específica del accidente cerebrovascular: la escala de impacto del
Elkadi, S., Clark, MS, Dennerstein, L., Guthrie, JR, Bowden, SC y Henderson, VW (2006). Normativo
datos de mujeres australianas de mediana edad sobre fluidez de categorías y una versión breve del Boston Naming Test.
Psicólogo australiano, 41 años.(1), 37–42.
Embretson, SE y Reise, SP (2000).Teoría de la respuesta al ítem para psicólogos. Mahwah, Nueva Jersey: Erlbaum.
Fernández, AL (2013). Desarrollo de un test de confrontación de naming para hispanohablantes: El Córdoba
prueba de denominación.El neuropsicólogo clínico, 27(7), 1179-1198.
Fernández-Blázquez, MA, de León Ruiz-Sánchez, JM, López-Pina, JA, Llanero-Luque, M., Montenegro-
Peña, M., & Montejo-Carrasco, P. (2012). Una nueva versión abreviada del Boston Naming Test para mayores de 65
años: una aproximación desde la teoría de respuesta al ítem.Revista de Neurología,55(7), 399–407. Pescador, WP (2007
). Criterios de calidad del instrumento de escala de calificación.Transacciones de medición de Rasch, 21(1), 1095. Folstein,
MF, Folstein, SE y McHugh, PR (1975). 'Mini-estado mental': un método práctico para calificar
el estado cognitivo de los pacientes para el médico.Revista de investigación psiquiátrica, 12(3), 189-198.
Gasquoine, PG, Croyle, KL, Cavazos-González, C. y Sandoval, O. (2007). Idioma de administración
y rendimiento de pruebas neuropsicológicas en adultos bilingües hispanoamericanos neurológicamente
intactos.Archivos de Neuropsicología Clínica, 22(8), 991–1001.
Graves, RE, Bezeau, SC, Fogarty, J. y Blair, R. (2004). Formas cortas del Boston Naming Test: una comparación
de formas anteriores con nuevas formas basadas en la teoría de respuesta al ítem.Revista de Neuropsicología Clínica y
Experimental, 26(7), 891–902.
Hobson, V., Hall, J., Harvey, M., Cullum, CM, Lacritz, L., Massman, P.,… O'Bryant, W. (2011). Un
Examen de la prueba de nombres de Boston: cálculo de la puntuación estimada de 60 ítems a partir de puntuaciones
de 30 y 15 ítems en una población con deterioro cognitivo.Revista Internacional de Psiquiatría Geriátrica, 26(4), 351–
355.
Instituto Geográfico Agustín Codazzi. (2012).Atlas de la Distribución de la Propiedad Rural en Colombia.
Bogotá: Imprenta Nacional de Colombia.
Jahn, DR, Mauer, CB, Menon, CV, Edwards, ML, Dressel, JA y O'Bryant, SE (2013). Una breve
Versión equivalente español-inglés del Boston Naming Test: un estudio del proyecto FRONTIER.Revista
de Neuropsicología Clínica y Experimental, 35(8), 835–845.
Jones, enfermero registrado (2003). Sesgo racial en la evaluación del funcionamiento cognitivo de adultos mayores.Envejecimiento y
Salud Mental, 7(2), 83-102.
Kaplan, E., Goodglass, H. y Weintraub, S. (1983).Prueba de nombres de Boston. Filadelfia: Lea y Feibiger.
Kaplan, E., Goodglass, H. y Weintraub, S. (2001).Prueba de nombres de Boston. Austin: Pro-ed.
Kaplan, E., Goodglass, H. y Weintraub, S. (2005).Prueba de vocabulario de Boston(2ª ed.). Madrid: Editorial
Médica Paramericana, SA
Katsumata, Y., Mathews, M., Abner, EL, Jicha, GA, Caban-Holt, A., Smith, CD,… Fardo, DW (2015).
Evaluación de la capacidad discriminante, la confiabilidad y la comparabilidad de múltiples formas cortas de la prueba de
denominación de Boston en una cohorte de un centro de enfermedad de Alzheimer.Demencia y trastornos cognitivos geriátricos,
39, 215–227. doi:10.1159/000370108
Khadka, J., Pesudovs, K., McAlinden, C., Vogel, M., Kernt, M. y Hirneiss, C. (2011). Reingeniería del
Cuestionario de calidad de vida del glaucoma-15 con análisis de Rasch.Oftalmología de Investigación y Ciencias
Visuales, 52(9), 6971–6977. doi:10.1167/iovs.11-7423
Kohnert, KJ, Hernández, AE y Bates, E. (1998). Rendimiento bilingüe en la prueba de nombres de Boston:
Normas preliminares en español e inglés.Cerebro y lenguaje, 65(3), 422–440.
Kroenke, K., Spitzer, RL y Williams, JB (2001). El PHQ-9.Revista de Medicina Interna General, 16(9),
606–613.
Linácre, JM (2002). ¿Qué significan infit y outfit, media cuadrática y estandarizado?Medición de Rasch
Transacciones, 16(2), 878.
Linácre, JM (2006). Variación de datos explicada por medidas.Transacciones de medición de Rasch, 20, 1045–
1047.
EL NEUROPSICOLOGO CLÍNICO 17
Lobo, A., Saz, P. y Marcos, G. (2002).MMSE examen cognoscitivo mini-mental. Madrid: TÉ Ediciones. Mahoney, FI y
Barthel, DW (1965). Evaluación funcional: El índice de Barthel.Médico del estado de Maryland
Diario, 14, 61–65.
Marien, P., Mampaey, E., Vervaet, A., Saerens, J. y De Deyn, PP (1998). Datos normativos para Boston.
Naming Test en ancianos belgas nativos de habla holandesa.Cerebro y lenguaje, 65(3), 447–467. Miotto,
EC, Sato, J., Lucia, M., Camargo, CH y Scaff, M. (2010). Desarrollo de una versión adaptada
del Boston Naming Test para hablantes de portugués.Revista Brasileira de Psiquiatria, 32(3), 279–282.
Olabarrieta-Landa, L., Rivera, D., Morlett-Paredes, A., Jaimes-Bautista, A., Garza, MT, Galarza-del-
Ángel, J., … Luna, M. (2015). Forma estándar del Boston Naming Test: datos normativos para la
población adulta hispanohablante latinoamericana.NeuroRehabilitación, 37(4), 501–513. Pedraza,
O., Graff-Radford, NR, Smith, GE, Ivnik, RJ, Willis, FB, Petersen, RC y Lucas, JA (2009).
Funcionamiento diferencial de los ítems del Boston Naming Test en adultos mayores afroamericanos y
caucásicos cognitivamente normales.Revista de la Sociedad Internacional de Neuropsicología, 15(5),
758–768. Pedraza, O., Sachs, BC, Ferman, TJ, Rush, BK y Lucas, JA (2011). Dificultad y discriminación
parámetros de los elementos de la Boston Naming Test en una serie clínica consecutiva.Archivos de
Neuropsicología Clínica, 26, 434–444.
Peña-Casanova, J., Blesa, R., Aguilar, M., Gramunt-Fombuena, N., Gómez-Anson, B., Oliva, R., … Sol, JM
(2009a). Estudios normativos multicéntricos españoles (Proyecto NEURONORMA): Métodos y características de
la muestra.Archivos de Neuropsicología Clínica, 24(4), 307–319.
Peña-Casanova, J., Quiñones-Úbeda, S., Gramunt-Fombuena, N., Aguilar, M., Casas, L., Molinuevo, JL,
…Martínez-Parra, C. (2009). Estudios normativos multicéntricos españoles (Proyecto NEURONORMA): Normas
para Boston Naming Test y Token Test.Archivos de Neuropsicología Clínica, 24(4), 343–354. Quijano, MC,
Olabarrieta Landa, L., Rivera, D., Valdivia Tangarife, RV, Vergara Torres, GP, de los Reyes
Aragón, CJ, … Arango-Lasprilla, JC (2015). Datos Normativos del Test de denominación de
Boston para población colombiana. En JC Arango-Lasprilla y D. Rivera (Eds.),
Neuropsicología en Colombia: Datos normativos, estado actual y retos a futuro[
Neuropsicología en Colombia: datos normativos, estado actual y desafíos futuros] (págs.
210-222). Manizales: Editorial Universidad Autónoma de Manizales.
Rami, L., Serradell, M., Bosch, B., Caprile, C., Sekler, A., Villar, A., …Molinuevo, JL (2008). Datos normativos
para el Boston Naming Test y el Test de Pirámides y Palmeras en población española de edad
avanzada. Revista de Neuropsicología Clínica y Experimental, 30(1), 1–6.
Sheppard, C., Kousaie, S., Monetta, L. y Taler, V. (2016). Rendimiento en la prueba de nombres de Boston en
Bilingues.Revista de la Sociedad Internacional de Neuropsicología, 22(3), 350–363.
Snodgrass, JG y Vanderwart, M. (1980). Un conjunto estandarizado de 260 imágenes: Normas para el acuerdo de nombre,
Concordancia de imagen, familiaridad y complejidad visual.Revista de psicología experimental: aprendizaje y
memoria humanos,5, 174–215.
Strauss, E., Sherman, E. y Spreen, O. (2006).Un compendio de pruebas neuropsicológicas: Administración,
normas y comentarios(3ª ed.). Nueva York, NY: Oxford University Press.
Tallberg, IM (2005). La prueba de nombres de Boston en sueco: datos normativos.Cerebro y lenguaje, 94(1),
19–31.
Villaseñor-Cabrera, T., Guàrdia-Olmos, J., Jiménez-Maldonado, M., Rizo-Curiel, G., & Peró-Cebollero, M.
(2010). Sensibilidad y especificidad del miniexamen del estado mental en la población mexicana.
Calidad y cantidad, 44(6), 1105-1112.
Wright, BD y Linacre, JM (1994). Valores razonables de ajuste cuadrático medio.Transacciones de medición de Rasch,
8(3), 370.
Wright, BD y Masters, GN (mil novecientos ochenta y dos).Análisis de escala de calificación. Chicago, Illinois: MESA Press.
Zec, RF, Burkett, NR, Markwell, SJ y Larsen, DL (2007). Un estudio transversal de los efectos de la edad,
educación y género en el Boston Naming Test.El neuropsicólogo clínico, 21(4), 587–616.