Está en la página 1de 18

Traducido del inglés al español - www.onlinedoctranslator.

com

El neuropsicólogo clínico

ISSN: 1385-4046 (Impreso) 1744-4144 (En línea) Página de inicio de la revista:http://www.tandfonline.com/loi/ntcn20

Análisis de ítems de la versión en español del Boston


Naming Test con una población adulta
hispanohablante de Colombia

Stella H. Kim, Adriana M. Strutt, Laiene Olabarrieta-Landa, Anthony H.


Lequerica, Diego Rivera, Carlos José De Los Reyes Aragón, Oscar Utria y Juan
Carlos Arango-Lasprilla

Para citar este artículo:Stella H. Kim, Adriana M. Strutt, Laiene Olabarrieta-Landa, Anthony H.
Lequerica, Diego Rivera, Carlos Jose De Los Reyes Aragon, Oscar Utria & Juan Carlos Arango-
Lasprilla (2018): Análisis de ítems de la versión en español del Boston Naming Test con población
adulta hispanohablante de Colombia, El Neuropsicólogo Clínico, DOI:
10.1080/13854046.2018.1441908

Para enlazar a este artículo:https://doi.org/10.1080/13854046.2018.1441908

Publicado en línea: 23 de febrero de 2018.

Envíe su artículo a esta revista

Ver artículos relacionados

Ver datos de Crossmark

Los términos y condiciones completos de acceso y uso se pueden encontrar en


http://www.tandfonline.com/action/journalInformation?journalCode=ntcn20
La neuropsia clínica ChologisT, 2018 https://
doi.org/10.1080/13854046.2018.1441908

Análisis de ítems de la versión en español del Boston Naming Test


con una población adulta hispanohablante de Colombia

Estela H. Kima, Adriana M. Struttb, Laiene Olabarrieta LandaC, Antonio H. Lequericad, Diego
Riverami, Carlos José De Los Reyes AragónF, Óscar Utríagramoy Juan Carlos Arango Lasprillae,h

aDepartamento de Neurología, Centro de Ciencias de la Salud de la Universidad de Texas – Facultad de Medicina Mcgovern, Houston,
TX, EE. UU.;bDepartamento de neurología, Baylor College of Medicine, Houston, TX, EE. UU.;CDepartamento de Psicología y
Educación, Universidad de Deusto, Bilbao, España;dFundación Kessler y Departamento de Medicina Física y Rehabilitación, Rutgers,
Facultad de Medicina de Nueva Jersey, Newark, Nueva Jersey, Estados Unidos;miInstituto de Investigación Sanitaria BioCruces,
Hospital Universitario de Cruces, Barakaldo, España;FDepartamento de Psicología, Universidad del Norte, Barranquilla, Colombia;
gramoDepartamento de Psicología, Universidad San Buenaventura, Bogotá, Colombia;hiKerBasQue, Fundación Vasca para la Ciencia,
Bilbao, España

ABSTRACTO HISTORIA DEL ARTÍCULO

Objetivo:La Boston Naming Test (BNT) es una medida ampliamente utilizada de la recibido el 17 de julio de 2017 aceptado

capacidad de denominación de confrontación que ha sido criticada por su el 12 de febrero de 2018

cuestionable validez de constructo para personas que no hablan inglés. Este


PALABRAS CLAVE
estudio investigó la dificultad de los ítems y la validez de constructo de la versión
Prueba de nombres de Boston; español;
española del BNT para evaluar el impacto cultural y lingüístico en el desempeño. denominación; idioma; validez de
Métodos:Los sujetos fueron 1298 adultos hispanohablantes sanos de Colombia. Se constructo
les administró la versión en español del BNT de 60 y 15 ítems. Se calculó un análisis
de Rasch para evaluar la dimensionalidad, la jerarquía de los ítems, la focalización,
la confiabilidad y el ajuste de los ítems.Resultados:Ambas versiones del BNT
cumplían los requisitos de unidimensionalidad. Aunque la consistencia interna fue
excelente para el BNT de 60 ítems, el orden de dificultad no aumentó
consistentemente con el número de ítems y hubo varios ítems que no se ajustaban
al modelo de Rasch. Para el BNT de 15 ítems, un total de 5 ítems cambiaron de
posición en la jerarquía de ítems y 7 ítems no encajaban bien. La consistencia
interna fue aceptable.Conclusiones:La validez de constructo del BNT sigue siendo
una preocupación cuando se administra a poblaciones que no hablan inglés. Al
igual que en hallazgos anteriores, el orden de presentación de los ítems no se
correspondía con el aumento de la dificultad de los ítems, y ambas versiones
fueron inadecuadas para evaluar la alta capacidad de denominación.

Introducción

El Boston Naming Test (BNT) es una prueba cognitiva ampliamente utilizada que se desarrolló para
evaluar la capacidad de nombrar por confrontación (Kaplan, Goodglass y Weintraub,1983). La prueba
consta de 60 dibujos lineales de varios objetos y se desarrolló originalmente en inglés utilizando una
muestra caucásica. Posteriormente se desarrolló una versión corta del BNT de 15 ítems, utilizando los
ítems del formulario original, para reducir el tiempo de administración y para su uso con individuos.

CONTACTOJuan Carlos Arango Lasprilla jcalasprilla@gmail.com

© 2018 informa uK Limited, operando como Taylor & Francis Group


2 SH KIM Y AL.

que tienen afasia (Aranciva et al.,2011; Hobson y otros,2011; Kaplan, Goodglass y Weintraub, 2001;
del Toro et al.,2011).
Hay traducciones directas del BNT disponibles en otros idiomas (Strauss, Sherman y
Spreen, 2006) y se han estandarizado variaciones del BNT en muchos países como España
(Peña-Casanova, Quiñones-Ubeda et al.,2009; Rami et al.,2008), Canadá (Graves, Bezeau,
Fogarty y Blair,2004), Brasil (Miotto, Sato, Lucia, Camargo y Scaff,2010), Colombia (Quijano et
al.,2015), Argentina (Allegri et al.,1997; Olabarrieta-Landa et al.,2015), El Salvador, Guatemala,
Bolivia, Perú, Paraguay, Chile, México, Honduras, Puerto Rico, Cuba (Olabarrieta-Landa et al.,
2015), Australia (Elkadi et al.,2006), Suecia (Tallberg,2005), Holanda (Marien, Mampaey,
Vervaet, Saerens y De Deyn,1998) y Estados Unidos (Zec, Burkett, Markwell y Larsen,2007). Sin
embargo, los estudios normativos del BNT han utilizado diferentes variaciones, incluidas
versiones segunda y corta.
Las versiones españolas del BNT de 60 y 15 ítems son las más utilizadas a nivel internacional. Aunque
el BNT español es una versión traducida de la medida inglesa, los estímulos difieren. En concreto, el punto
14 (champiñón) es una zanahoria, artículo 19 (galleta salada) es un muffin, artículo 28 (guirnalda) es una
corona, artículo 40 (aldaba) es un chupete, artículo 48 (nudo corredizo) es una aguja, artículo 51 (pestillo)
es un ojo de cerradura, y el elemento 57 (conducción) es una regadera. A pesar de su uso frecuente por
parte de médicos e investigadores, la versión española del BNT ha sido criticada por su cuestionable
validez de constructo cuando se administra a personas cuyo idioma principal no es el inglés. Por ejemplo,
la ausencia de palabras que coincidan directamente con los ítems originales plantea una barrera para una
interpretación precisa del desempeño de la prueba (de la Plata et al.,2009). Cuando el BNT se administra a
personas bilingües tanto en inglés como en un segundo idioma, los análisis de ítems de las respuestas
correctas para evaluar la validez de constructo revelan que estos individuos no demuestran un
desempeño equivalente en ambas versiones de la prueba (Kohnert, Hernandez y Bates, 1998; Sheppard,
Kousaie, Monetta y Taler,2016).
A medida que los investigadores y médicos continúan desarrollando nuevas pruebas y datos
normativos, el conocimiento y la aplicación de las propiedades psicométricas se vuelven críticos. Los
estudios han comenzado a evaluar pruebas utilizando la teoría de respuesta al ítem (TRI), que es un
paradigma que se usa comúnmente para desarrollar y evaluar ítems de pruebas psicométricas. El uso de
IRT para fines de construcción de pruebas también se destacó en la publicación más reciente deLos
Estándares para las Pruebas Educativas y Psicológicas(2014). Hasta donde sabemos, sigue habiendo un
número limitado de estudios de TRI que han identificado preocupaciones sobre las propiedades
psicométricas del BNT de 60 y 15 ítems para grupos no caucásicos (Jahn et al.,2013; Pedraza, Sachs,
Ferman, Rush y Lucas,2011; Pedraza et al.,2009). El propósito de este estudio es investigar la dificultad de
los ítems y la validez de constructo del BNT español utilizado en una muestra colombiana utilizando el
enfoque TRI para evaluar el impacto cultural y lingüístico en esta medida de resultado.

Métodos

Asignaturas

La muestra original estuvo compuesta por 1318 adultos hispanohablantes sanos de seis ciudades
de Colombia: Barranquilla, Bogotá, Cali, Ibagué, Manizales y Neiva (Tabla1). Un total de 20 sujetos
fueron excluidos del análisis final debido a datos incompletos; la muestra final estuvo compuesta
por 1298 sujetos. La edad de los sujetos osciló entre 18 y 90 años (METRO=57,64, DE = 19,75). La
educación osciló entre 1 y 25 años (METRO=9,75, DE = 5,26; Mesa2). La mayoría eran mujeres
(58,4%) y la muestra era principalmente urbana (92,3%).
EL NEUROPSICOLOGO CLÍNICO 3

Tabla 1.Demografía.
Ubicación mín. máx. METRO Dakota del Sur

Barranquilla (norte=234) edad 18 90 58.1 21.3


F=63,2% educación 1 24 9.4 4.9
Bogotá (norte=156) edad 19 84 55.1 18.0
F=50% educación 1 25 11.0 5.2
Cali (norte=233) edad 18 90 58.0 20,5
F=70,4% educación 1 25 10.2 5.2
ibague (norte=223) edad 18 88 56.3 20.8
F=52,5% educación 1 23 8.8 5.1
Manizales (norte=213 ) edad 18 90 59.1 17.9
F=58,2% educación 1 24 9.8 5.3
neiva (norte=239) edad 18 88 58,5 19.1
F=53,1% educación 1 25 9.7 5.6
nota:F=porcentaje de Mujeres, Min = Mínimo, Max = Máximo,METRO=Media, sD = Desviación estándar.

Tabla 2.nivel de educación.

Nivel de educación Frecuencia % % acumulativo


1 a 5 años 421 32.4 32.4
6 a 9 años 221 17.0 49.5
10 a 11 años 171 13.2 62,6
> 11 años 485 37.4 100.0
Total 1298 100.0 –

Criterios de inclusión

Los sujetos elegibles tenían entre 18 y 90 años, siendo Colombia su lugar de nacimiento y lugar de
residencia actual, y el español como idioma principal. Los sujetos habían completado al menos un
año formal de formación académica, lo que equivale a un nivel de educación de primer grado en los
Estados Unidos. La capacidad de leer y escribir se confirmó con base en su desempeño en el Mini
Examen del Estado Mental (MMSE; Lobo, Saz, & Marcos, 2002). Para la inclusión en el estudio, los
sujetos debían poder completar correctamente las tareas de lectura y escritura. La tarea de
escritura requirió el uso de una oración completa con la inclusión de sustantivo, verbo y predicado.

En las medidas de detección de cognición y estado de ánimo, se pidió a los sujetos que
obtuvieran ≥23 puntos en las versiones en español del MMSE (Folstein, Folstein y McHugh,1975;
Villaseñor-Cabrera, Guàrdia-Olmos, Jiménez-Maldonado, Rizo-Curiel, & Peró-Cebollero,2010), ≤4 en
el Cuestionario de Salud del Paciente (PHQ-9; Kroenke, Spitzer, & Williams,2001), y ≥90 en el índice
de Barthel (Mahoney & Barthel,1965).

Criterio de exclusión

Se administró un cuestionario de autoinforme para recopilar información sobre el historial médico


y el estado de salud de los sujetos. Se determinó que los sujetos no eran elegibles si informaban o
respaldaban lo siguiente: (1) servicios médicos recibidos por afecciones neurológicas o psiquiátricas
diagnosticadas, (2) consumo diario y/o uso de una sustancia ilícita, (3) antecedentes de enfermedad
sistémica (p. ej. diabetes mellitus), (4) uso regular de analgésicos u otros medicamentos que
puedan afectar el funcionamiento cognitivo y/o (5) déficit visual y/o auditivo grave.
4 SH KIM Y AL.

Procedimiento

Adultos sanos de habla hispana de seis ciudades colombianas aceptaron participar en este estudio.
Las regiones de Colombia se caracterizan por el relieve terrestre, el clima y la vegetación (Instituto
Geográfico Agustín Codazzi,2012), lo que puede contribuir a diferencias socioeconómicas como el
acceso a la educación. En este estudio, cuatro de las seis ciudades eran de la región andina (la más
grande de Colombia), una ciudad del lado caribeño (Barranquilla) y una ciudad del lado pacífico
(Cali). Cuando la muestra se dividió en dos grupos (región andina versus las otras dos regiones), no
se encontraron diferencias estadísticamente significativas entre los grupos en el rendimiento de
denominación en la versión estándar ni en la versión corta. Por lo tanto, este estudio examinó la
posible variabilidad regional que puede contribuir a las diferencias socioeconómicas de los sujetos.

Las pruebas neuropsicológicas se compraron a los editores y cada prueba fue revisada por un mínimo de dos
nativos colombianos que se especializaban en neuropsicología para garantizar que los sujetos pudieran entender
correctamente las instrucciones dadas las variaciones del idioma español en todo el país. Se nombró a un
profesional de investigación en psicología en cada universidad para gestionar la recopilación de datos, los
materiales de prueba y los manuales de prueba. También se les proporcionó herramientas y ayudas audiovisuales
para lograr la estandarización de la administración de las pruebas.
A los individuos se les administró un cuestionario sociodemográfico sobre su edad, nivel de
educación, sexo, lateralidad, raza, empleo y estado civil. A las personas que cumplieron con los
criterios de elegibilidad se les administró una batería de 10 pruebas neuropsicológicas, que incluían
el BNT. Se utilizó una función de aleatorización en Microsoft Excel para codificar el orden de las
pruebas en la batería para cada participante con el fin de evitar sesgos de orden y minimizar la
interferencia entre las pruebas de lenguaje y las pruebas de memoria verbal. El Comité Ético de la
Universidad de Deusto (Bilbao, España) aprobó este estudio como institución coordinadora.

Medidas
Las versiones corta (15 ítems) y estándar (60 ítems) del BNT en español difieren ligeramente del BNT original
(Kaplan, Goodglass y Weintraub.,1983). Por ejemplo, el artículo 14 es una zanahoria en lugar de un champiñón, el
artículo 19 es un panecillo en lugar de un pretzel, el artículo 28 es una corona en lugar de una corona, el artículo
40 es un chupete en lugar de una aldaba, el artículo 48 es una aguja en lugar de una soga, el artículo 51 es un ojo
de cerradura en lugar de un pestillo, y el artículo 57 es una regadera en lugar de un enrejado. Las respuestas
alternativas no se incluyeron como respuestas correctas (Kaplan, Goodglass y Weintraub,2005).

Análisis
El análisis de Rasch se realizó utilizando el software estadístico Winsteps (Linacre). Se tomaron los
siguientes pasos para evaluar múltiples aspectos del BNT:

Análisis 1: determinar la dimensionalidad


Se supone que el BNT mide el constructo de denominación de modo que todos los elementos
deben medir el mismo constructo. Para determinar si el BNT dentro de la muestra del estudio es
EL NEUROPSICOLOGO CLÍNICO 5

unidimensional, se utilizó un análisis de componentes principales de residuos. Los criterios de


unidimensionalidad fueron:

(1) la varianza explicada por la dimensión de medición sea ≥40% (Linacre,2006)


(2) la varianza explicada por el primer componente principal de los residuos ≤15%
(3) la proporción de (1):(2) anterior es al menos 3:1 (Embretson & Reise,2000)

Análisis 2: examinar la jerarquía de elementos

En el análisis de Rasch, la jerarquía de ítems creada por la estimación de la dificultad del ítem proporciona una indicación

de la validez de constructo. El BNT fue diseñado para que la dificultad de los ítems aumente a medida que avanza la

prueba. Los valores de las medidas deben ser los más bajos para los elementos más simples o iniciales, mientras que los
valores de las medidas deben ser los más altos para los elementos más difíciles o que aparecen más tarde en el BNT. El

mapa de Wright muestra simultáneamente personas y elementos medidos en la misma escala logit (ver figura1). Las

personas están dispuestas en la mitad izquierda del mapa de Wright de modo que aquellas con mayor capacidad deberían
estar en la parte superior del mapa, mientras que las personas con menor capacidad deberían estar cerca de la parte

inferior del mapa. De manera similar, los elementos que se muestran en la mitad derecha del mapa de Wright muestran

que los elementos más difíciles deberían aparecer hacia la parte superior, mientras que los elementos anteriores o más

fáciles deberían aparecer hacia la parte inferior. Para el BNT, esperaríamos que esto último, más difícil

Figura 1.ejemplo de un mapa de persona-elemento de Wright (norte=1298).


nota: X en el lado izquierdo representa una cantidad de personas, mientras que X en el lado derecho representa elementos particulares.
6 SH KIM Y AL.

Los elementos aparecerían en la parte superior o superior del mapa, mientras que antes los elementos más
simples deberían aparecer en el extremo inferior.

Análisis 3: focalización
En una situación ideal, la gama de habilidades queda bien reflejada en la gama de dificultades de los ítems de la prueba. El

propósito de la focalización es identificar la dificultad del ítem según la capacidad de la población. Una buena selección de

objetivos se juzgará aquí inspeccionando el mapa de Wright y asegurándose de que la diferencia entre las medias de

personas y elementos sea inferior a 1,0 logit (Khadka et al.,2011). También se inspeccionará el mapa de personas-

elementos de Wright para determinar qué tan bien coincide el rango de personas con el rango de elementos.

Análisis 4: evaluación de la confiabilidad y separación de las personas


Se realizó un examen de la confiabilidad de la persona. Este valor es similar al alfa de Cronbach. Un
coeficiente de confiabilidad personal de .70 representa un nivel aceptable de confiabilidad, .80
representa un buen nivel y .90 representa un nivel excelente (Duncan, Bode, Lai, Perera, & Glycine
Antagonist in Neuroprotection Americas Investigators,2003).
El análisis de Rasch también proporciona una estadística llamada separación de personas. Esto indica
qué tan bien se pueden distinguir los sujetos de la muestra entre sí en función de su capacidad. Wright y
Masters (mil novecientos ochenta y dos) encontraron que la separación de personas puede determinar
qué tan bien se separa la muestra en diferentes grupos de desempeño. El número de estratos (h) se
calculará basándose en la fórmula (4GRAMO+1)/3 dondeGRAMO=el índice de separación. Un índice de
separación de personas de 1,50 representa un nivel de separación aceptable, un índice de 2,00 representa
un buen nivel de separación y un índice de 3,00 representa un nivel de separación excelente (Duncan et
al.,2003).

Análisis 5: ajuste del ítem

Teniendo en cuenta el gran tamaño de la muestra, se utilizaron valores de ajuste cuadrático medio (MNSQ) superiores a

1,20 para identificar los elementos que no se ajustaban al modelo de Rasch (Wright & Linacre,1994). Según Linacre (2002),

artículos conzLas puntuaciones (ZSTD) de 2,00 o más se consideran demasiado impredecibles. Por lo tanto, se decía que

los ítems no se ajustaban al modelo si se alcanzaban ambos valores de corte.

Resultados

Formulario estándar de 60 ítems del BNT

Unidimensionalidad
Como se puede observar en la tabla3, la varianza en los datos explicada por las medidas fue del 49,7%.
Menos del 15% de la varianza fue explicada por el primer componente principal de los residuos (3,6%). La
relación entre la varianza explicada por las medidas y la varianza explicada por el primer componente de
los residuos fue de 13,81:1, satisfaciendo así los tres requisitos establecidos aquí para juzgar la
unidimensionalidad. Como medida unidimensional, se consideraría pobre en términos de varianza
contabilizada, cayendo por debajo del 50% según los criterios de Fisher (Fisher,2007).

Jerarquía de artículos

La jerarquía de ítems se puede ver en el mapa persona-ítem de Wright con un mayor nivel de dificultad
del ítem ubicado en la parte superior del mapa (Figura2). Dieciséis de los artículos se movieron al menos
EL NEUROPSICOLOGO CLÍNICO 7

Tabla 3.Análisis de componentes principales de las estadísticas de residuos para el formulario estándar BnT-60 (norte=1298).

valor propio %
Varianza bruta total en observaciones 119.33 100.00
Varianza bruta explicada por medidas 59.33 49,70
varianza bruta explicada por personas 25.29 21.20
varianza bruta explicada por elementos 34.04 28.50
varianza bruta inexplicable total 60.00 50.30
varianza inexplicable en el primer contraste 4.31 3.60
varianza inexplicable en el segundo contraste 2.21 1,90

15 posiciones de su clasificación esperada de dificultad (cambio ≥25%). Para ocho de estos elementos, su
posición cambió a una de mayor dificultad y se puede ver cerca de la parte superior del mapa (15 perchas,
19 muffins, 5 silbatos, 32 bellotas, 30 armónica, 33 iglú, 25 dardos, 29 castores). Para los ocho elementos
restantes, la posición cambió a una de menor dificultad y se puede encontrar cerca del extremo inferior
del mapa (57 regadera, 39 hamaca, 47 acordeón, 48 aguja, 46 embudo, 50 brújula, 54 tenazas, 35 fichas
de dominó). ).

Orientación
La diferencia entre las medias de personas y elementos fue de 1,71 logits, lo que indica una mala focalización, ya que las

personas obtuvieron puntuaciones más altas que los elementos más difíciles. Esto se puede ver en el mapa de Wright,

donde no hay suficientes elementos en la parte superior del continuo para capturar niveles más altos de habilidad. Mesa4

muestra esto cuantitativamente donde el límite superior para las personas es 7,21 logits pero el límite superior para los

artículos es solo 4,25.

Confiabilidad y separación de personas


La confiabilidad de la persona fue de .91, lo que indica una excelente consistencia interna. Esto no es
sorprendente dada la gran cantidad de ítems de la prueba. La separación de personas fue de 3,13, lo que sugiere
que la prueba puede diferenciar entre aproximadamente cuatro niveles de capacidad.

Ajuste del artículo

Hubo varios elementos que no encajaban en el constructo o no se comportaban como se esperaba. En mesa 5
abajo,casatenía el equipo más alto MNSQ y ZSTD. También tuvo una correlación negativa de medida de puntos, lo
que sugiere que las respuestas correctas en este ítem no estaban asociadas con la puntuación total de la prueba.
Una mirada más cercana a las respuestas mostró que era un ítem con un nivel de dificultad muy bajo, sin
embargo, los sujetos que omitieron este ítem tenían una medida de habilidad media más alta que aquellos que lo
nombraron correctamente (1,81 frente a 1,71). Los patrones de respuesta anecdóticos sugieren que esto podría
ocurrir si un gran número de individuos respondiera con una palabra común para describir la imagen que no se
considerara una respuesta correcta. Por ejemplo, el dibujo representa una casa bastante grande a la que muchos
pueden responder conmansión.

Forma corta de 15 ítems del BNT

Unidimensionalidad
Como se puede observar en la tabla6, la varianza en los datos explicada por las medidas fue del 54,0%.
Menos del 15% de la varianza fue explicada por el primer componente principal de los residuos (5,7%). La
relación entre la varianza explicada por las medidas y la varianza explicada por el primer componente de
los residuos fue de 9,47:1, satisfaciendo así los tres requisitos establecidos para juzgar.
8 SH KIM Y AL.

Figura 2.Mapa de persona-elemento de Wright para el formulario estándar BnT-60 (norte=1298).


nota: personas conspiradas contra artículos. cada '#' representa 10 participantes. cada '.' representa de 1 a 9 participantes.
EL NEUROPSICOLOGO CLÍNICO 9

Tabla 4.Estadísticas generales de personas y artículos para el formulario estándar BnT-60 (norte=1298).

Medida (en logits) Persona Artículo

Significar 1.71 . 00
Máximo 7.21 4.25
Mínimo − 2,97 - 4,88
separación 3.13 16.34
fiabilidad . 91 1.00

Tabla 5.Artículos que no se ajustan al formulario estándar BnT-60 (norte=1298).

inadaptado Atuendo

Artículo MNSQ ZSTD MNSQ ZSTD Medida Correlación de medida puntual

4 casa 1.07 . 30 9.55 9.90 − 4.17 − . 01


15 percha 1.26 6.90 1,58 5.70 3.08 . 29
40 chupete 1.22 7.30 1.30 4.80 2.23 . 37
37 escalera mecánica 1.21 7.10 1.24 4.30 1,50 . 39
57 regadera 1.18 3.50 1,45 3.40 − . 36 . 32
56 yugo 1.17 3.60 1.42 3.20 3.70 . 31
39 hamaca 1.08 . 70 2.56 4.10 − 2,59 . 15
9 vio 1.06 . 40 1,94 2.50 − 3,24 . 11
14 zanahoria 1.06 . 50 1,66 2.10 − 2,73 . 19
1 Cama 1.03 . 20 2.76 3.90 − 4,40 . 06
2 árbol 1.02 . 20 2.30 3.30 - 4,88 . 05
nota: MnsQ = estadística de ajuste cuadrático medio, ZsTD = estadística de ajuste estandarizada.

Tabla 6.Análisis de componentes principales de las estadísticas de residuos para la forma corta BnT-15 (norte=1298).

BNT formato corto de 15 elementos valor propio %


Varianza bruta total en observaciones 32,61 100.00
Varianza bruta explicada por medidas 17.61 54.00
varianza bruta explicada por personas 7,78 23.80
varianza bruta explicada por elementos 9,83 30.10
varianza bruta inexplicable total 15.00 46.00
varianza inexplicable en el primer contraste 1,86 5.70
varianza inexplicable en el segundo contraste 1.27 3.90

unidimensionalidad. Como medida unidimensional, se consideraría justa en términos de


varianza contabilizada, situándose entre el 50 y el 60% según el criterio de Fisher (Fisher, 2007
).

Jerarquía de artículos

La jerarquía de elementos se puede ver en el mapa persona-elemento de Wright (Figura3) con mayor nivel
de dificultad del elemento ubicado hacia la parte superior del mapa. Un total de cinco ítems avanzaron al
menos cuatro posiciones desde su clasificación de dificultad esperada (cambio >25%). Cuatro de los cinco
ítems cambiaron de posición a uno de mayor dificultad (ítem 8 castor, ítem 11 estetoscopio, ítem 5 banco,
ítem 2 peine). El quinto elemento (elemento 10, hamaca) fue más fácil de lo previsto y pasó de una
posición del 10 al 3.

Orientación
La diferencia entre las medias de personas y elementos fue de 1,17 logits, lo que indica una mala focalización, ya que las

personas obtuvieron puntuaciones más altas que las de los elementos más difíciles. Esto se puede ver en el mapa de

Wright, donde no hay suficientes elementos en la parte superior del continuo para capturar niveles más altos.
10 SH KIM Y AL.

Figura 3.Mapa de persona-elemento de Wright para la forma abreviada BnT-15 (norte=1298). nota: personas conspiradas contra
artículos. cada '#' representa 13 participantes. cada '.' representa de 1 a 12 participantes.
EL NEUROPSICOLOGO CLÍNICO 11

de habilidad. Mesa7muestra esto cuantitativamente donde el límite superior para las personas es 5,54 logits pero el límite

superior para los elementos es solo 3,10.

Confiabilidad y separación de personas


La confiabilidad de la persona fue de 0,75, lo que indica una consistencia interna aceptable pero subóptima. Esto
no es sorprendente dado que la prueba sólo tiene 15 ítems. La separación de personas fue de 1,73, lo que sugiere
que la prueba sólo puede diferenciar entre aproximadamente dos niveles de capacidad. Según el criterio de
Fisher, esto se considera pobre o regular en el mejor de los casos (Fisher,2007).

Ajuste del artículo

Hubo varios elementos que no encajaban en el constructo o no se comportaban como se esperaba. Con la
excepción deestetoscopio, la mayoría de los elementos que no encajaban parecían deberse a que sujetos de alta
capacidad los interpretaron incorrectamente. Conestetoscopio, hubo varios individuos de baja capacidad que lo
puntuaron correctamente. En general, estos elementos, que se muestran en la Tabla8no se comportó como se
esperaba dentro del contexto del modelo de Rasch.

Discusión
Se han hecho esfuerzos para abordar las barreras lingüísticas y culturales del uso de versiones traducidas
directamente del BNT que simplemente intentan hacer coincidir los ítems originales de la prueba creando
nuevas tareas de confrontación de nombres en otros idiomas usando ítems culturalmente destacados y
desarrollando datos normativos para diferentes razas/étnicas. poblaciones. Desafortunadamente, las
prácticas clínicas y de investigación actuales no siempre permiten versiones alternativas de las medidas
de evaluación y, por lo tanto, este estudio utilizó un análisis de Rasch basado en un modelo IRT para
investigar el nivel de dificultad y la validez de constructo de las versiones de 60 y 15 ítems. del BNT en
población colombiana hispanohablante.
En general, ambas versiones del BNT demostraron unidimensionalidad y buena confiabilidad entre los
ítems. En cuanto a la jerarquía de ítems, muchos de los ítems más difíciles no se comportaron como

Tabla 7.Estadísticas generales de personas y artículos para el formulario abreviado BnT-15 (norte=1298).

Medida (en logits) Persona Artículo

Significar 1.17 . 00
Máximo 5.54 3.10
Mínimo − 4,48 − 4,20
separación 1,73 20.98
fiabilidad . 75 1.00

Tabla 8.Artículos inadaptados para la forma corta BnT-15 (norte=1298).

inadaptado Atuendo

Artículo MNSQ ZSTD MNSQ ZSTD Medida Correlación de medida puntual

1 casa 1.05 . 30 3.45 5.20 − 4,20 . 11


10 hamaca 1.13 1.20 3.36 5.90 − 3.04 . 15
5 banco 1.25 6.90 1.61 7.30 . 30 . 43
2 peine 1.17 3.90 1,48 3.80 − . 66 . 41
7 canoa 1.16 2.70 2.10 4.70 − 1,67 . 30
3 cepillo de dientes 1.05 . 40 2.01 3.00 − 3,24 . 19
11 estetoscopio 1.05 1.10 2.71 8.50 3.10 . 53
nota: MnsQ = estadística de ajuste cuadrático medio, ZsTD = estadística de ajuste estandarizada.
12 SH KIM Y AL.

esperado. Varios alumnos de alto rendimiento en el BNT omitieron los elementos más fáciles, mientras que los
individuos con menor nivel de habilidad nombraron correctamente los elementos más difíciles, violando así el
modelo de Rasch. Es posible que los elementos más difíciles hayan sido nombrados incorrectamente en esta
muestra normativa debido al nivel de prominencia de los estímulos dentro de una cultura determinada. Si las
personas con una gran capacidad para nombrar objetos se equivocan, puede deberse a la falta de familiaridad
con el objeto o a una terminología diferente utilizada para nombrarlo. Otra posible explicación para este hallazgo
puede deberse a la estricta administración de la investigación y al método de puntuación del BNT. Las personas
con alta capacidad para nombrar nombres pueden haber proporcionado respuestas alternativas y más
sofisticadas que fueron aceptables pero no incluidas en la puntuación general según la administración y
puntuación estandarizadas (p. ej.mansiónen lugar decasa). A la inversa, las personas con menor capacidad para
nombrar pueden haber recibido puntos por no proporcionar nombres menos comunes o más sofisticados para
los objetos representados. Por lo tanto, los médicos deben describir cualitativamente los tipos específicos de
errores que llevaron a la puntuación general para proporcionar contexto si deciden adherirse al mismo enfoque
de puntuación estricto utilizado en este estudio. También puede ser útil para investigaciones futuras investigar
respuestas clínicas alternativas y aceptables que cuenten para la puntuación general (p. ej.harmónicayórgano
bucalambos son aceptables para la puntuación e interpretación clínica).
En términos de discriminación del nivel de capacidad, los ítems del BNT pudieron evaluar adecuadamente a
los individuos en los niveles de capacidad inferior y medio, pero no en los niveles superiores, lo que sugiere una
escasa utilidad a los efectos de las pruebas de rendimiento. Sin embargo, debido a que el BNT está diseñado para
ser una prueba para medir el deterioro, sería más deseable su capacidad para discriminar el extremo inferior del
espectro. Si el objetivo fuera capturar todos los niveles de habilidad, incluidos niveles altos como en las pruebas
de rendimiento, elementos adicionales con un mayor nivel de dificultad podrían ser útiles para ampliar la
capacidad de discriminar entre individuos con niveles más altos de habilidad.

Al igual que en hallazgos anteriores, hubo una redundancia considerable dentro de la versión de 60
ítems (Pedraza et al.,2011). En otras palabras, estos ítems redundantes aportaron muy poco valor
predictivo al total de las escalas. Muchos de los ítems de la versión de 60 ítems parecían agregar ruido o
inexactitud a la medición de los nombres debido a que no se ajustaban al modelo de Rasch. Esto es
consistente con hallazgos previos de un estudio de análisis de ítems de que el BNT no pudo discriminar
con precisión la capacidad de nombrar, ya que la dificultad de los ítems no coincidía con el nivel de
habilidad, y había ítems que eran psicométricamente redundantes al comparar grupos caucásicos y
afroamericanos (Pedraza et al. Alabama.,2009). Un estudio de seguimiento realizado por los mismos
investigadores utilizando sujetos en Florida reveló que el orden de los ítems no se correlacionaba
fuertemente con el nivel de dificultad (Pedraza et al.,2011). Además, se observó redundancia en los ítems,
y la evaluación de la capacidad para nombrar fue buena para los individuos con un rango de promedio
bajo, pero no para los individuos con un nivel de capacidad más alto. Por lo tanto, los hallazgos de este
estudio son consistentes con la literatura actual en que la validez de constructo del BNT sigue siendo una
preocupación cuando se administra a poblaciones no caucásicas o que no hablan inglés.
Un estudio anterior sugirió que la forma corta puede ser un instrumento útil para evaluar a pacientes
ancianos de habla hispana que requieren métodos de prueba más cortos por sospecha de deterioro
cognitivo severo o bajo nivel de educación, ya que demostró una buena validez de criterio con respecto a
otras medidas de demencia y a la BNT completo (Calero, Arnedo, Navarro, Ruiz-Pedrosa y Carnero,2002).
Sin embargo, contrariamente a esta sugerencia, los hallazgos de este estudio no mostraron que el BNT de
15 ítems fuera capaz de detectar adecuadamente diferencias entre los de alto y bajo rendimiento.
Tampoco parece haber una solución rápida para esta limitación dado que la eliminación de elementos que
no ajustan bien disminuiría la confiabilidad y reduciría aún más la capacidad del
EL NEUROPSICOLOGO CLÍNICO 13

prueba para capturar el espectro completo de habilidades. Desarrollar nuevos formularios breves y ejecutar IRT
en los BNT españoles existentes pueden ser opciones viables. Si bien hay muchos estudios que desarrollan
formas cortas para diversos fines en inglés (Katsumata et al.,2015), existen pocos estudios que utilicen la TRI para
desarrollar formas cortas apropiadas en español. Fernández-Blázquez et al., (2012) utilizaron métodos TRI para
crear dos versiones equivalentes de 15 ítems. Sin embargo, su muestra se limitó a personas mayores de 65 años.
Se justifica realizar investigaciones adicionales que extiendan estos hallazgos a muestras más grandes con un
rango más amplio de edades.

Limitaciones e investigaciones futuras.

Una advertencia a estos hallazgos es que no se incluyó una medida independiente de validez del
desempeño en la batería de pruebas. Por lo tanto, existe la posibilidad de que el esfuerzo inadecuado
pueda ser una fuente de variación, ya que los individuos sin antecedentes de deterioro cognitivo, o en
ausencia de incentivos, pueden realizar un esfuerzo deficiente en un experimento de investigación. Los
estudios futuros deberían integrar medidas de validez del desempeño para examinar el papel del
esfuerzo/compromiso en el desempeño del BNT. Hubo varias otras limitaciones para este estudio. El BNT
administrado en este estudio es la versión en español del BNT en inglés publicado por la Editorial Médica
Panamericana y vendido por TEA Ediciones, con artículos seleccionados que fueron reemplazados por
otros más destacados cultural y lingüísticamente. Por lo tanto, Los resultados del estudio deben
interpretarse con precaución en adultos no hispanohablantes que hablan español. Además, como se
mencionó anteriormente, la administración del BNT siguió un estricto protocolo de investigación y no tuvo
en cuenta respuestas alternativas aceptables, lo que puede haber afectado la evaluación de la dificultad y
la discriminación de los ítems. Esto también puede plantear un desafío para la aplicación práctica, ya que
la administración y la puntuación en entornos clínicos no suelen seguir un protocolo tan estricto. Por lo
tanto, las investigaciones futuras deberían incluir la investigación e identificación de respuestas
alternativas específicas que deberían considerarse correctas para una mejor traducción y aplicación al uso
de la medida en el mundo real. Otra limitación de este estudio es que la muestra proviene de un país de
habla hispana y puede no ser apropiado generalizar estos hallazgos a otros grupos de habla hispana. Se
recomienda encarecidamente a los investigadores y médicos que consideren las poblaciones normativas y
eviten la suposición incorrecta de que todas las palabras en español y los datos normativos son aplicables
a todos y cada uno de los individuos de habla hispana.
En este análisis, la educación no se estratificó para capturar la gama más amplia de habilidades y mapear las
dificultades de los ítems utilizando el modelo de Rasch. Por lo tanto, se necesitan más estudios para determinar
elementos específicos que se deben retener mediante un análisis más detallado. Dada la amplia gama de
educación en esta muestra, otro estudio de investigación está investigando actualmente la educación como una
variable moderadora para determinar si conjuntos separados de ítems pueden ser más apropiados para personas
con niveles de educación más altos y más bajos. Puede haber una interacción compleja entre cultura y educación
en el sentido de que es más probable que los individuos con niveles más altos de educación hayan encontrado
elementos poco comunes en la región geográfica, como "bellotas" o "castores", en sus estudios, donde una
formación más avanzada en botánica y La zoología puede ser parte del plan de estudios. Para aquellas personas
con bajos niveles de educación, se deben considerar factores contribuyentes adicionales que impactan
negativamente el desarrollo cognitivo de un individuo. Esas posibles privaciones pueden incluir el acceso a una
nutrición adecuada (especialmente para aquellos en el grupo socioeconómico más bajo), la falta de acceso al
transporte para asistir a programas académicos formales (lo que afecta a quienes viven en áreas rurales con
recursos locales limitados), la falta de educación formal y una educación limitada o nula. exposición a tareas y
aprendizaje de tipo académico
14 SH KIM Y AL.

entornos secundarios al ingreso temprano a la fuerza laboral y alfabetización limitada: habilidades de escritura y
lectura de bajo nivel con posibles discapacidades de aprendizaje no detectadas. Es probable que la influencia
negativa de estos datos sociodemográficos se observe en la mayoría de las medidas de resultados
neuropsicológicos, dada la base académica subyacente de la mayoría de las herramientas utilizadas. En un
intento por mejorar aún más las propiedades psicométricas de esta medida, las consideraciones de investigación
futuras incluyen generar datos normativos ajustados por edad, educación y sexo (que pueden servir como
indicador del nivel de educación) para presentar una versión en español más psicométricamente sólida. Además,
puede ser beneficioso realizar más investigaciones para identificar un punto de corte para determinar la
sensibilidad, especificidad y poder predictivo del BNT español con diferentes muestras clínicas.

Una consideración importante en la adaptación cultural de las pruebas es la equivalencia lingüística.


Aunque es posible que se hayan hecho esfuerzos para elegir estímulos con un número limitado de
nombres aceptables en inglés, puede haber numerosos términos para un objeto determinado en otros
países. Estos términos pueden diferir según la ubicación geográfica o los efectos educativos. Por lo tanto,
cuando las respuestas aceptables son pocas, los objetos que utilizan términos de jerga regional pueden
marcarse como omitidos. Es importante tener en cuenta estas cuestiones durante la administración de la
prueba para que se pueda determinar si las respuestas "incorrectas" proporcionan alguna información
útil que contribuya al propósito de evaluar la capacidad cognitiva adecuada para nombrar que la prueba
fue diseñada para evaluar. Al mismo tiempo, varios dialectos del español presentan una variedad de
posibles respuestas alternativas ante los mismos estímulos (p. ej.molletepodría denominarse como
magdalenaen España pero no es una palabra muy común en Colombia donde se suele denominar como
ponqué). Los médicos deben tener esto en cuenta al evaluar la capacidad de nombrar a personas de habla
hispana, especialmente si tienen experiencia limitada trabajando con esta población.
Otra consideración clínica son las variables demográficas. En cuanto a la metodología, los datos
sociodemográficos, el historial médico y el estado de salud de los sujetos se recopilaron mediante un
cuestionario demográfico de autoinforme. Las medidas de autoinforme pueden carecer de confiabilidad,
por lo que las investigaciones futuras pueden beneficiarse de la inclusión de datos objetivos, como los
registros médicos disponibles. La literatura sugiere que variables demográficas como la edad, la
educación y el nivel socioeconómico tienen un impacto significativo en el desempeño del BNT; Las
personas mayores con menor educación e ingresos más bajos suelen demostrar un desempeño más
pobre y revelan una mayor variabilidad en el desempeño (Alegret et al.,2012; jones,2003; Olabarrieta-
Landa et al.,2015; Zec et al., 2007). Se ha descubierto que esto también se aplica a otros instrumentos
cognitivos, como las estimaciones inexactas de la memoria cuando se aplican normas caucásicas
originales a hispanohablantes sin utilizar normas demográficamente corregidas (Cherner et al.,2007). Por
lo tanto, los médicos deben utilizar normas ajustadas por edad y educación cuando estén disponibles.
Esto también se aplica a la escrupulosidad con respecto a la demografía de la muestra utilizada para
desarrollar las pruebas. Por ejemplo, el 42% de la muestra utilizada para desarrollar el TNT reportó
analfabetismo con un nivel educativo promedio de cinco años en el grupo cognitivamente intacto y un
año en el grupo con demencia (Cuetos, Ellis, & Alvarez,1999; Snodgrass y Vanderwart,1980). Por el
contrario, la muestra de la CNT era principalmente argentina con un nivel educativo medio
significativamente mayor, 14 años (Fernández,2013). Por lo tanto, es fundamental estar familiarizado con
la confiabilidad y validez de las medidas neuropsicológicas, ya que es posible que los resultados no se
generalicen entre poblaciones según la demografía de la muestra.
En conclusión, este estudio respalda la literatura actual sobre las limitaciones de las pruebas de denominación
actuales para evaluar la capacidad de denominación de poblaciones que no hablan inglés y la necesidad de
continuar abordando las barreras lingüísticas y culturales de la evaluación neuropsicológica. Él
EL NEUROPSICOLOGO CLÍNICO 15

También destaca el valor de utilizar el modelo TRI al evaluar críticamente la validez de constructo del BNT
y otros instrumentos psicométricos. Puede ser útil para los médicos utilizar un estándar de comparación
para reducir las tasas de falsos positivos en varios idiomas (por ejemplo, la prueba de vocabulario de
imágenes de Peabody), dado que las normas para otros grupos culturales generalmente están por debajo
de las normas inglesas, lo que genera un problema de altas tasas de falsos positivos en inglés. que en
español (Gasquoine, Croyle, Cavazos-González y Sandoval,2007). Otras sugerencias para los médicos en
términos de administración e interpretación de las pruebas incluyen comparar la información
demográfica de los pacientes con la del BNT para guiar la interpretación caso por caso, estar
familiarizados con los cambios significativos en la clasificación clínica ya que no es una medida sensible de
logro. y considerar el perfil cognitivo integral del paciente para determinar si esto puede ser o no una
variable aislada del desempeño en lugar de un deterioro cognitivo. Los médicos también pueden
beneficiarse de la generación de datos normativos utilizando respuestas correctas alternativas para cada
uno de los ítems del BNT. Las investigaciones futuras deben continuar desarrollando y evaluando pruebas
de denominación alternativas que tengan en cuenta objetos culturalmente destacados al organizarlos
según la dificultad del ítem para discriminar mejor entre individuos cognitivos intactos y con deterioro.
Dada su escasa utilidad actual a la hora de evaluar el rendimiento o un mayor nivel de capacidad, las
investigaciones futuras también deberían investigar el BNT de 60 ítems en una muestra con datos
demográficos similares, pero de una población clínica, para determinar la utilidad de detectar el deterioro.

Declaración de divulgación

Los autores no informaron ningún posible conflicto de intereses.

Referencias

Alegret, M., Espinosa, A., Vinyes-Junqué, G., Valero, S., Hernández, I., Tárraga, L., … Boada, M. (2012).
Datos normativos de una batería neuropsicológica breve para españoles mayores de 49 años.Revista
de Neuropsicología Clínica y Experimental, 34(2), 209–219.
Allegri, R., Mangone, C., Fernández Villavicencio, M., Rymberg, S., Taragano, F. y Baumann, D. (1997).
Normas del examen de denominación de Boston en español.El neuropsicólogo clínico, 11(4), 416–420.
Asociación Estadounidense de Investigación Educativa, Asociación Estadounidense de Psicología, Consejo Nacional
sobre Medición en Educación y Comité Conjunto sobre Estándares para Pruebas Educativas y Psicológicas (EE.
UU.). (2014).Normas para las pruebas educativas y psicológicas. Washington, DC: Autor. Aranciva, F., Casals-
Colla, M., Sánchez-Benavidesa, G., Quintana, M., Manero, R., Rognoni, T., … Peña-
Casanovab, J. (2011). Estudios normativos españoles en población adulta joven (proyecto NEURONORMA
adultos jóvenes): Normas para el Boston Naming Test y el Token Test.Neurología, 27(7), 394–399. Calero, MD,
Arnedo, ML, Navarro, E., Ruiz-Pedrosa, M. y Carnero, C. (2002). Utilidad de un ítem de 15
Versión de la prueba de denominación de Boston en la evaluación neuropsicológica de personas mayores con
demencia con bajo nivel educativo.Revistas de Gerontología Serie B: Ciencias Psicológicas y Ciencias Sociales, 57(2),
P187-P191.
Cherner, M., Suarez, P., Lazzaretto, D., Fortuny, LA, Mindt, MR, Dawes, S.,… Grupo HNRC. (2007).
Normas demográficamente corregidas para la prueba de memoria visuoespacial breve revisada y la prueba de aprendizaje
verbal de Hopkins revisada en hispanohablantes monolingües de la región fronteriza entre Estados Unidos y México.Archivos de
Neuropsicología Clínica, 22(3), 343–353.
Cuetos, F., Ellis, A. y Álvarez, B. (1999). Horas de nombrar las imágenes de Snodgrass y Vanderwart en
Español.Métodos, instrumentos y computadoras de investigación del comportamiento, 31, 650–658.
de la Plata, C., Arango-Lasprilla, JC, Alegret, M., Moreno, A., Ta ŕraga, L., Lara, M., … Cullum, C. (2009).
Análisis de ítems de tres pruebas de denominación en español: una investigación transcultural.Neurorrehabilitación, 24(1), 75–
85.
dieciséis SH KIM Y AL.

del Toro, CM, Bislick, LP, Comer, M., Velozo, C., Romero, S., Rothi, LJG y Kendall, DL (2011).
Desarrollo de una versión breve del Boston Naming Test para personas con afasia.Revista de
investigación del habla, el lenguaje y la audición, 54(4), 1089-1100.
Duncan, PW, Bode, RK, Lai, SM, Perera, S. y antagonistas de glicina en neuroprotección en las Américas
Investigadores. (2003). Análisis de Rasch de una nueva escala de resultados específica del accidente cerebrovascular: la escala de impacto del

accidente cerebrovascular. Archivos de Medicina Física y Rehabilitación, 84(7), 950–963.

Elkadi, S., Clark, MS, Dennerstein, L., Guthrie, JR, Bowden, SC y Henderson, VW (2006). Normativo
datos de mujeres australianas de mediana edad sobre fluidez de categorías y una versión breve del Boston Naming Test.
Psicólogo australiano, 41 años.(1), 37–42.
Embretson, SE y Reise, SP (2000).Teoría de la respuesta al ítem para psicólogos. Mahwah, Nueva Jersey: Erlbaum.
Fernández, AL (2013). Desarrollo de un test de confrontación de naming para hispanohablantes: El Córdoba
prueba de denominación.El neuropsicólogo clínico, 27(7), 1179-1198.
Fernández-Blázquez, MA, de León Ruiz-Sánchez, JM, López-Pina, JA, Llanero-Luque, M., Montenegro-
Peña, M., & Montejo-Carrasco, P. (2012). Una nueva versión abreviada del Boston Naming Test para mayores de 65
años: una aproximación desde la teoría de respuesta al ítem.Revista de Neurología,55(7), 399–407. Pescador, WP (2007
). Criterios de calidad del instrumento de escala de calificación.Transacciones de medición de Rasch, 21(1), 1095. Folstein,
MF, Folstein, SE y McHugh, PR (1975). 'Mini-estado mental': un método práctico para calificar
el estado cognitivo de los pacientes para el médico.Revista de investigación psiquiátrica, 12(3), 189-198.
Gasquoine, PG, Croyle, KL, Cavazos-González, C. y Sandoval, O. (2007). Idioma de administración
y rendimiento de pruebas neuropsicológicas en adultos bilingües hispanoamericanos neurológicamente
intactos.Archivos de Neuropsicología Clínica, 22(8), 991–1001.
Graves, RE, Bezeau, SC, Fogarty, J. y Blair, R. (2004). Formas cortas del Boston Naming Test: una comparación
de formas anteriores con nuevas formas basadas en la teoría de respuesta al ítem.Revista de Neuropsicología Clínica y
Experimental, 26(7), 891–902.
Hobson, V., Hall, J., Harvey, M., Cullum, CM, Lacritz, L., Massman, P.,… O'Bryant, W. (2011). Un
Examen de la prueba de nombres de Boston: cálculo de la puntuación estimada de 60 ítems a partir de puntuaciones
de 30 y 15 ítems en una población con deterioro cognitivo.Revista Internacional de Psiquiatría Geriátrica, 26(4), 351–
355.
Instituto Geográfico Agustín Codazzi. (2012).Atlas de la Distribución de la Propiedad Rural en Colombia.
Bogotá: Imprenta Nacional de Colombia.
Jahn, DR, Mauer, CB, Menon, CV, Edwards, ML, Dressel, JA y O'Bryant, SE (2013). Una breve
Versión equivalente español-inglés del Boston Naming Test: un estudio del proyecto FRONTIER.Revista
de Neuropsicología Clínica y Experimental, 35(8), 835–845.
Jones, enfermero registrado (2003). Sesgo racial en la evaluación del funcionamiento cognitivo de adultos mayores.Envejecimiento y
Salud Mental, 7(2), 83-102.
Kaplan, E., Goodglass, H. y Weintraub, S. (1983).Prueba de nombres de Boston. Filadelfia: Lea y Feibiger.
Kaplan, E., Goodglass, H. y Weintraub, S. (2001).Prueba de nombres de Boston. Austin: Pro-ed.
Kaplan, E., Goodglass, H. y Weintraub, S. (2005).Prueba de vocabulario de Boston(2ª ed.). Madrid: Editorial
Médica Paramericana, SA
Katsumata, Y., Mathews, M., Abner, EL, Jicha, GA, Caban-Holt, A., Smith, CD,… Fardo, DW (2015).
Evaluación de la capacidad discriminante, la confiabilidad y la comparabilidad de múltiples formas cortas de la prueba de
denominación de Boston en una cohorte de un centro de enfermedad de Alzheimer.Demencia y trastornos cognitivos geriátricos,
39, 215–227. doi:10.1159/000370108
Khadka, J., Pesudovs, K., McAlinden, C., Vogel, M., Kernt, M. y Hirneiss, C. (2011). Reingeniería del
Cuestionario de calidad de vida del glaucoma-15 con análisis de Rasch.Oftalmología de Investigación y Ciencias
Visuales, 52(9), 6971–6977. doi:10.1167/iovs.11-7423
Kohnert, KJ, Hernández, AE y Bates, E. (1998). Rendimiento bilingüe en la prueba de nombres de Boston:
Normas preliminares en español e inglés.Cerebro y lenguaje, 65(3), 422–440.
Kroenke, K., Spitzer, RL y Williams, JB (2001). El PHQ-9.Revista de Medicina Interna General, 16(9),
606–613.
Linácre, JM (2002). ¿Qué significan infit y outfit, media cuadrática y estandarizado?Medición de Rasch
Transacciones, 16(2), 878.
Linácre, JM (2006). Variación de datos explicada por medidas.Transacciones de medición de Rasch, 20, 1045–
1047.
EL NEUROPSICOLOGO CLÍNICO 17

Lobo, A., Saz, P. y Marcos, G. (2002).MMSE examen cognoscitivo mini-mental. Madrid: TÉ Ediciones. Mahoney, FI y
Barthel, DW (1965). Evaluación funcional: El índice de Barthel.Médico del estado de Maryland
Diario, 14, 61–65.
Marien, P., Mampaey, E., Vervaet, A., Saerens, J. y De Deyn, PP (1998). Datos normativos para Boston.
Naming Test en ancianos belgas nativos de habla holandesa.Cerebro y lenguaje, 65(3), 447–467. Miotto,
EC, Sato, J., Lucia, M., Camargo, CH y Scaff, M. (2010). Desarrollo de una versión adaptada
del Boston Naming Test para hablantes de portugués.Revista Brasileira de Psiquiatria, 32(3), 279–282.
Olabarrieta-Landa, L., Rivera, D., Morlett-Paredes, A., Jaimes-Bautista, A., Garza, MT, Galarza-del-
Ángel, J., … Luna, M. (2015). Forma estándar del Boston Naming Test: datos normativos para la
población adulta hispanohablante latinoamericana.NeuroRehabilitación, 37(4), 501–513. Pedraza,
O., Graff-Radford, NR, Smith, GE, Ivnik, RJ, Willis, FB, Petersen, RC y Lucas, JA (2009).
Funcionamiento diferencial de los ítems del Boston Naming Test en adultos mayores afroamericanos y
caucásicos cognitivamente normales.Revista de la Sociedad Internacional de Neuropsicología, 15(5),
758–768. Pedraza, O., Sachs, BC, Ferman, TJ, Rush, BK y Lucas, JA (2011). Dificultad y discriminación
parámetros de los elementos de la Boston Naming Test en una serie clínica consecutiva.Archivos de
Neuropsicología Clínica, 26, 434–444.
Peña-Casanova, J., Blesa, R., Aguilar, M., Gramunt-Fombuena, N., Gómez-Anson, B., Oliva, R., … Sol, JM
(2009a). Estudios normativos multicéntricos españoles (Proyecto NEURONORMA): Métodos y características de
la muestra.Archivos de Neuropsicología Clínica, 24(4), 307–319.
Peña-Casanova, J., Quiñones-Úbeda, S., Gramunt-Fombuena, N., Aguilar, M., Casas, L., Molinuevo, JL,
…Martínez-Parra, C. (2009). Estudios normativos multicéntricos españoles (Proyecto NEURONORMA): Normas
para Boston Naming Test y Token Test.Archivos de Neuropsicología Clínica, 24(4), 343–354. Quijano, MC,
Olabarrieta Landa, L., Rivera, D., Valdivia Tangarife, RV, Vergara Torres, GP, de los Reyes
Aragón, CJ, … Arango-Lasprilla, JC (2015). Datos Normativos del Test de denominación de
Boston para población colombiana. En JC Arango-Lasprilla y D. Rivera (Eds.),
Neuropsicología en Colombia: Datos normativos, estado actual y retos a futuro[
Neuropsicología en Colombia: datos normativos, estado actual y desafíos futuros] (págs.
210-222). Manizales: Editorial Universidad Autónoma de Manizales.
Rami, L., Serradell, M., Bosch, B., Caprile, C., Sekler, A., Villar, A., …Molinuevo, JL (2008). Datos normativos
para el Boston Naming Test y el Test de Pirámides y Palmeras en población española de edad
avanzada. Revista de Neuropsicología Clínica y Experimental, 30(1), 1–6.
Sheppard, C., Kousaie, S., Monetta, L. y Taler, V. (2016). Rendimiento en la prueba de nombres de Boston en
Bilingues.Revista de la Sociedad Internacional de Neuropsicología, 22(3), 350–363.
Snodgrass, JG y Vanderwart, M. (1980). Un conjunto estandarizado de 260 imágenes: Normas para el acuerdo de nombre,
Concordancia de imagen, familiaridad y complejidad visual.Revista de psicología experimental: aprendizaje y
memoria humanos,5, 174–215.
Strauss, E., Sherman, E. y Spreen, O. (2006).Un compendio de pruebas neuropsicológicas: Administración,
normas y comentarios(3ª ed.). Nueva York, NY: Oxford University Press.
Tallberg, IM (2005). La prueba de nombres de Boston en sueco: datos normativos.Cerebro y lenguaje, 94(1),
19–31.
Villaseñor-Cabrera, T., Guàrdia-Olmos, J., Jiménez-Maldonado, M., Rizo-Curiel, G., & Peró-Cebollero, M.
(2010). Sensibilidad y especificidad del miniexamen del estado mental en la población mexicana.
Calidad y cantidad, 44(6), 1105-1112.
Wright, BD y Linacre, JM (1994). Valores razonables de ajuste cuadrático medio.Transacciones de medición de Rasch,
8(3), 370.
Wright, BD y Masters, GN (mil novecientos ochenta y dos).Análisis de escala de calificación. Chicago, Illinois: MESA Press.

Zec, RF, Burkett, NR, Markwell, SJ y Larsen, DL (2007). Un estudio transversal de los efectos de la edad,
educación y género en el Boston Naming Test.El neuropsicólogo clínico, 21(4), 587–616.

También podría gustarte