Está en la página 1de 18

Propiedades psicomtricas del Stroop,

test de colores y palabras en poblacin


colombiana no patolgica*
Psychometric Properties of the Stroop color-word Test
in non-pathological Colombian Population

Luca Carlota Rodrguez Barreto **


Ninfa del Carmen Pulido ***
Carlos Alejandro Pineda Roa ****
Universidad Pedaggica y Tecnolgica de Colombia,
Tunja, Colombia

Resumen
El objetivo del presente artculo es revisar las propiedades psicomtricas del
Stroop, test de colores y palabras de Golden (2007) en poblacin colombiana
no clnica. 1332 participantes, 561 varones (42.1%) y 771 mujeres (57.9%)
entre 7 y 80 aos de edad, (M= 29.80 DE= 17.95). agrupados en los rangos
de edad de 16 a 44 aos (48.5%), 7 a 15 (28.1%), 45 a 64 (18.1%) y 65 a
80 (5.2 %). La confiabilidad fue evaluada utilizando test-retest a travs del
coeficiente de correlacin intraclase con IC al 95% con diferencia de diez
minutos entre las dos aplicaciones. La validez de constructo fue medida
mediante el Anlisis de componentes principales ACP. La validez conver-
gente fue calculada a travs de r de Pearson entre las subescalas de Stroop
y el TMT-B. El Anlisis paralelo de horn y el ACP arrojaron evidencia de
tres componentes que explican el 86.84% de la varianza. Las correlaciones
r de Pearson, el Stroop y TMT-B fueron significativas a 0.01 con valores de
-0.41 para P; -0.35 para C; de -0.40 para PC, y de -0.14 para interferencia. La
confiabilidad encontrada fue superior a 0.70 en todas las lminas del Stroop.
La validez discriminante no hall diferencias entre hombres y mujeres, pero
si para edad, estrato y escolaridad. Las medias y desviaciones estndar en la
poblacin colombiana fueron inferiores en todas las escalas a la versin espa-
ola, lo que puede ser explicado por diferencias culturales importantes. Los
doi:10.11144/Javeriana.upsy15-2.ppst resultados permiten afirmar que el Stroop es vlido y confiable para diversos
grupos etarios de poblaciones no patolgicas en Colombia.
Palabras clave
Para citar este artculo: Rodrguez Barreto, L. C.,
Stroop; validez de constructo y convergente; confiabilidad test-retest; poblacin
Pulido, N. del C., & Pineda Roa, C. A. (2016). Psy-
colombiana
chometric properties of the Stroop color-word test
in non-pathological Colombian population. Uni-
versitas Psychologica, 15(2), 255-272. http://dx.doi. Abstract
org/10.11144/Javeriana.upsy15-2.ppst The aim of this article is to review the psychometric properties of the Stroop
Color and Word Test Golden (2007) in Colombian nonclinical population.
*
Artculo de investigacin cientfica y tecnolgica.
1,332 participants, 561 males (42.1%) and 771 women (57.9%) between 7
and 80 years old, (M = 29.80 SD = 17.95) grouped into age ranges of 16-44
**
Ph.D. en Neurociencias. Docente investigadora
Grupo Psicologa Clnica y de la Salud. Correo
years (48.5%), 7-15 (28.1%), 45-64 (18.1%) and 65-80 (5.2%). Reliability
electrnico: lucia.rodriguezb@uptc.edu.co was assessed using test-retest through intraclass correlation coefficient with
***
Mg. en Psicologa. Docente investigadora Grupo
IC95% far ten minutes between the two applications. Construct validity
de investigacin Salud Trabajo y Calidad de Vida. was measured by Principal Component Analysis ACP. Convergent validity
Correo electrnico: ninfa.pulido@uptc.edu.co was calculated by Pearson r between Stroop subscales and TMT-B. Parallel
****
Mg. en Salud Sexual y Reproductiva. Docente in- analysis of Horn and gave evidence ACP three components explaining
vestigador grupo de investigacin Clnica y Salud. 86.84% of the variance. Pearson r correlations Stroop and TMT-B were
Correo electrnico: carlos.pineda01@uptc.edu.co significant at 0.01 to -0.41 values for P; -0.35 for C; from -0.40 to -0.14

Univ. Psychol. Bogot, Colombia V. 15 No. 2 PP. 255-272 abr-jun 2016 ISSN 1657-9267 255
L uca C arlota R odrguez B arreto , N infa del C armen P ulido , C arlos A lejandro P ineda R oa

for PC and Interference. Reliability found was higher than 1993; Squire & Shimamura, 1996, citado por Prez,
0.70 in all Stroop scales. Discriminant validity found no 2009). La presente validacin toma en consideracin
difference between men and women, but if for age stratum
and schooling. Means and standard deviations were lower solamente poblacin sana.
Colombian population at all scales to the Spanish version, El ejercicio del quehacer responsable y tico exi-
which can be explained by significant cultural differences. ge, entonces, adelantar estudios de validacin que
These results support the Stroop is valid and reliable for diffe-
permitan contar con una informacin tcnica que
rent age groups of no pathological populations in Colombia.
Keywords derive en el uso adecuado de los instrumentos de
Stroop; construct validity and convergent; test-retest reliability; evaluacin en nuestro contexto. De esta manera, y
Colombian population
dadas las limitaciones existentes de instrumentos
de evaluacin neuropsicolgica para la poblacin
colombiana, se presenta como alternativa el estudio
Introduccin psicomtrico la versin del Stroop, test de colores
y palabras de Charles J. Golden (2007), que fue
En Colombia, la mayora de instrumentos psico- adaptado para la poblacin espaola por el depar-
lgicos y neuropsicolgicos que se utilizan para tamento de I-+D de TEA ediciones S.A en el ao
evaluar y emitir diagnsticos carecen de criterios de de 1994 (Golden, 2007).
calidad tcnica que permitan garantizar la validez y El Stroop se utiliza ampliamente en el mbito
la confiabilidad, con las respectivas consecuencias de evaluacin neuropsicolgica, inclusive en el con-
ticas y prcticas, con el impacto que esto conlleva texto colombiano; no obstante, no se cuenta con
en la calidad del servicio en los cuales se utilizan un estudio amplio que revele las caractersticas de
indiscriminadamente. Las malas prcticas incluyen validez y confiabilidad en poblacin no patolgica
el uso de pruebas que en su mayora son realizadas en Colombia.
y normalizadas con las caractersticas de lenguaje,
nivel socioeconmico y cultural de otros pases, lo Antecedentes y generalidades
que constituye una preocupacin permanente de del Stroop (efecto Stroop)
su aplicacin en nuestra poblacin (Len 2013).
La prueba de J. R. Stroop se utiliza para evaluar El test Stroop inicialmente pretenda conocer los
atencin, flexibilidad cognitiva y el efecto Stroop, efectos de la interferencia perceptual y conocer qu
que consiste en la inhibicin de respuestas autom- efectos tena esta interferencia sobre la conducta.
ticas en favor de otras ms inusuales (Stroop, 1935). Ms tarde se present como un test sensible para
La prueba ha sido validada y aplicada en personas discriminar personas con dao cerebral, siendo ca-
entre 7 y 80 aos para orientar diagnsticos como paz, incluso, de describir la localizacin de la lesin
daos cerebrales, drogadiccin, demencia senil, (Bausela & Santos, 2006).
psicopatologa o estrs. (Golden, 2007). Tambin El test Stroop comenz su progreso a partir de
ha sido utilizada para la identificacin del trastor- investigaciones de los primeros psiclogos empricos
no de estrs postraumtico (Bremner et al., 2004, quienes observaron que la tipificacin de colores era
citados por Golden, 2007) y el reconocimiento de siempre ms tarda en adultos que saban leer que la
dficit de atencin con hiperactividad, pacientes lectura de los nombres de los colores. Posteriormen-
con esquizofrenia, Alzheimer, depresin, distimia te, Stroop en 1935, sugiri que la discrepancia entre
o dolor crnico, entre otros (Golden, 2007). las tareas leer las palabras y nombrar el color se
La valoracin en poblacin sana o disfuncional deba a que los colores estaban relacionados a una
requiere la aplicacin de instrumentos vlidos y variedad de respuesta conductual mientras que las
confiables diseados y adaptados especficamente palabras solo estaban asociadas a la lectura.
para la poblacin que se pretende evaluar, adems Existen varias versiones de la prueba. En 1967,
de contar con datos normativos adecuados para es- Houston y Jones emplearon la versin tradicional
tablecer el diagnstico (Bauer, Tobias, & Valenstein, del Stroop colocando un elemento distractor de la

256 U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016


P ropiedades psicomtricas del S troop , test de colores y
palabras en poblacin colombiana no patolgica

presencia o no de ruido (Bausela & Santos, 2006). son las palabras de la primera lmina impresas en
En 1972, Darylmple present combinaciones ade- los colores de la segunda coincidiendo en el orden
cuadas de colores y palabras relacionadas con el de representacin de las mismas.
color (p. ej., la palabra SANGRE en tinta roja) y
encontr que las latencias de denominacin fueron Antecedentes de validacin del Stroop
apreciablemente ms rpidas que las que se obtuvie- en poblaciones de diversas culturas
ron con palabras incongruentes relacionadas con el
color (p. ej., la palabra HIERBA en tinta roja) o con Antecedentes relacionados a confiabilidad
palabras no relacionadas (p. ej., la palabra CUA- y validez (validez interna)
DRADO en tinta roja) (Bausela & Santos, 2006).
Hay otras versiones, como la de Dodrill (1978), Maureira, Aravena, Glvez, & Flores (2014) en
que consiste en una nica lamina que contiene 176 Chile, aplicaron el test de Stroop en la versin Es-
tems (11x16) palabras-color (rojo, naranja, verde, paola del Stroop realizada por el Departamento
azul) impresas al azar en estos colores. En la primera I + D de TEA Ediciones (Golden, 1994) con 85
parte la persona lee el nombre de la palabra. En la estudiantes de educacin fsica, cuyas edades os-
segunda parte el participante debe denominar el cilaban entre 17 y 31 aos con promedio de 20.78
color en que est impresa la palabra. Dodrill evala (DT=2.81). El espacio entre las dos aplicaciones fue
la ejecucin de la prueba sobre la base del tiempo de 15 das. Conforme a la teora, los autores sealan
total empleado en la primera parte y la diferencia que el rendimiento, como el Stroop, debe mante-
entre la segunda y la primera. La versin Victoria nerse similar en estas edades, (Ostrosky, Ardila, &
(Regard, 1981), la cual es un instrumento notable Rosselli, 1991) debido a lo cual se realiz un anlisis
para la evaluacin de la atencin selectiva y control estadstico a travs de una prueba t para verificar
de la inhibicin y es muy utilizado en los aspectos de si existan diferencias significativas entre el cuartil
investigacin de las funciones ejecutivas del cerebro inferior y superior de las edades del grupo. Los au-
(Malek, Hekmati, & Amiri, 2013). tores encontraron que el test de Stroop presenta
La versin informatizada (Douchamps, 1988, un valor de confiabilidad test-retest de 0.884 y que
citado por Bausela & Santos, 2006) se trata de los valores de las puntuaciones entre los cuartiles de
un software: los estmulos consisten en cuatro edad ms bajos y ms altos no presentaron diferen-
colores-palabra (amarillo, rojo, verde o azul) pre- cias significativas (t=1.771; gl=72; p=0.081) lo que
sentados de uno en uno en diferentes colores entrega informacin sobre la validez de constructo
(amarillo, rojo, verde o azul) y aparecen de manera del instrumento (Maureira et al., 2014, p. 346).
aleatoria. Sin embargo, la versin normalizada Rognoni et al. (2013) obtuvieron resultados si-
de Golden (1975) es la ms manipulada y en la milares a los encontrados por Maureira et al. (2014)
que se ha fundado la versin espaola. Consta en grupos etarios semejantes. En el 2013, el equipo
de tres lminas de 100 tems distribuidos al azar de investigacin de Rognoni obtuvo datos norma-
en cinco columnas de 20 elementos. La prime- tivos para el Stroop (Golden, 2001) y la Tower of
ra lmina est establecida por las palabras roja, London-Drexel University versin (TOL) en una
verde y azul, dado que el efecto de interferencia muestra de 179 participantes entre 18 y 49 aos de
era el mismo independientemente del nmero de edad, sin deterioro cognitivo y con puntuaciones
colores empleados impresos en color negro. La mayores a 24 en el Mini-mental State Examination y
segunda lmina consiste en otros 100 elementos el Memory Inmairment Screen. No hallaron efectos
iguales (XXXX) impresos en las diferentes tintas de la edad y el gnero en las pruebas. La escolaridad
de color (rojo, verde y azul). El mismo color no influyo en las variables del Stroop (explicando el 4
aparece dos veces seguidas en la misma colum- al 10% de la varianza) y en algunas del TOL en la
na y los colores no siguen el mismo orden de las que el nivel de escolaridad explic el 9% de la va-
palabras de la primera lmina. La tercera lmina rianza en la variable movimientos totales y tiempo

U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016 257


L uca C arlota R odrguez B arreto , N infa del C armen P ulido , C arlos A lejandro P ineda R oa

de latencia, indicndose como posibilidad que a velocidad como funcin cognitiva, encontraron una
mayor escolaridad hay menores movimientos que consistencia interna total (intervalo de confianza
implican mayor control inhibitorio y planificacin del 95%) con valores alfa de Cronbach en P=0.78,
de la conducta (Rognoni et al., 2013, p. 76). C=0.75 y PC=0.78. En cuanto a la poblacin general
Espinosa (2008), en Bogot, Colombia, cal- se encontraron valores de alfa para P de 0.74, C de
cul la confiabilidad por estabilidad mediante 0.72 y para PC de 0.74. El mismo estudio de Henao-
test-retest. Realiz la aplicacin en un primer mo- Arboleda et al. (2010) en la replicabilidad test-retest
mento y a los tres das resultando valores r de Pear- (un mes entre primera y segunda aplicacin) con
son para P=0.538**; C=0.421**; PC=0.311**, y una muestra de 119 sujetos, obtuvo puntuaciones
INT=0.225* (significancia bilateral 0.01** y 0.05*). medias en la primera aplicacin de P=30.4; C=41.1,
Para la validez de constructo realiz un anlisis y PC=83.9 y en la segunda de P=28.6; C=39.3, y
factorial mediante el mtodo de componentes PC=75.7, con un coeficiente de correlacin intracla-
principales obteniendo tres factores que explica- se (CCI) de P=0.86, C=0.79 y PC=0.84 para cada
ron el 98.6%. tarea del Stroop.
En la adaptacin portuguesa del Stroop realizada
por Soares (2009) se hizo la comparacin de tres Antecedentes relacionados a variables
muestras, una con 290 sujetos saludables entre 25 y socio demogrficas (validez externa
80 aos, otra con 32 participantes con diagnstico o con relacin a un criterio)
de enfermedad tipo Alzheimer de inicio tardo y
una tercera muestra de comparacin con caracte- La validacin de un test no viene slo a travs de un
rsticas similares al primer grupo. Adicionalmente, anlisis de componentes principales o de un anlisis
este autor realiz una sola aplicacin y encontr factorial comn y calculando el alfa de Cronbach
consistencia interna global medida a travs del alfa de la prueba y sus subpruebas; es preciso demostrar
de Cronbach =0.663. Mediante anlisis factorial tambin que el atributo (y subatributos) discrimina
exploratorio hall una estructura de tres componen- entre las personas que componen la muestra que
tes similar a Golden (2001, citado por Soares, 2009) hemos utilizado (Crocker & Algina, 1986).
con una correlacin fuerte que explic el 96.16% de
la varianza total. Las puntuaciones medias para la Diferencias por la variable edad
poblacin general en el test de Stroop de la muestra
portuguesa fueron P=90 (DT=24); C=66 (DT=17); El Stroop es una prueba de amplio uso en la investi-
PC=41(DT=10); INT= 3.9 (DT=8.1). Las puntua- gacin de problemas de atencin y en el diagnstico
ciones en P, C y PC fueron menores en la poblacin de trastornos atencionales, adems permite explo-
portuguesa en comparacin con las puntuaciones rar la flexibilidad mental, la atencin selectiva, la
espaolas de Golden; sin embargo, los portugueses inhibicin cognitiva y la velocidad de procesamien-
tuvieron puntuaciones mayores en interferencia. to de la informacin (MacLeod, 1991; Rognoni et
En el estudio realizado por Henao-Arboleda et al., 2013).
al. (2010) en Medelln, Colombia, los autores esta- En 1932, Ligon hall con una prueba similar
blecieron datos normativos para poblacin colom- al Stroop, en una muestra de 635 estudiantes de
biana de una batera de pruebas neuropsicolgicas escuelas pblicas, diferencias significativas en las
que inclua el test de Stroop, con una investigacin tareas palabracolor, encontrando adems, que la
de tipo observacional y longitudinal que evalu la velocidad aumentaba con la edad. Por su parte, Co-
confiabilidad mediante testretest en 848 partici- malli, Wapner, & Werner (1962) en una muestra de
pantes de poblacin general, 151 personas con de- 235 sujetos con edades entre 7 a 80 aos, hallaron
mencia tipo Alzheimer (DTA) y 36 con deterioro resultados similares a Ligon, evidenciando que en
cognitivo Leve (DCL), mayores de 50 aos o ms y nios de 7 aos la velocidad era ms lenta que en
residentes en la ciudad de Medelln. En relacin a la el grupo de sujetos de 17 a 19 aos.

258 U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016


P ropiedades psicomtricas del S troop , test de colores y
palabras en poblacin colombiana no patolgica

En el estudio de Rand, Wapner, Werner, & variable independiente distribuida en seis grupos (6-
MacFarland (1963, citado por Golden, 2007) con 3 a 7-4, 7-5 a 8-4, 8-5 a 9-4, 9-5 a 10-4, 10-5 a 11-4
cuatro grupos de edad entre los 6 a 16 aos, hallaron y 11-5 a 12-4), aplicando el test de Stroop (Golden,
que los errores disminuan con la edad y aumenta- 2001) adems del test de cinco dgitos (Five-Digit
ban al pasar de P a C y de C a PC; los autores evalua- Test, FDT) como alternativa no lectora para de-
ron otras caractersticas, como las inadecuaciones terminar capacidad de interferencia, mediante un
(decir respuestas que no se referan ni a la tinta ni anlisis de varianza, encontr que P, C, PC e INT
a la palabra escrita), las respuestas mal articuladas, presentaron diferencias significativas en las pun-
repeticin de palabras entre tems, las omisiones, tuaciones medias en funcin de la edad (Martn et
frases lingsticas y no lingsticas insertadas. Se al., 2012, p. 45).
encontr que la ejecucin en la mayora de caracte- As, para el test de Stroop, Martn et al. (2012)
rsticas decreci con la edad. Por su parte, Cramer encontraron que P present diferencias significa-
(1967, citado por Golden, 2007) adapt el Stroop tivas para la mayora de los grupos, excepto para
para nios en edad escolar y concluy que el con- el rango de edad 10-5 a 11-4 vs. 11-5 a 12-4. En C,
cepto primordial en este grupo etario es la forma. las medias fueron diferentes para los tres primeros
En Chile, Conca & Ibarra (2004) estandariza- grupos, excepto para los grupos de mayor edad que
ron el test de Stroop. La muestra estuvo conforma- no mostraron diferencias. Para PC no se hallaron
da por 615 participantes con edades comprendida diferencias en el grupo 6-3 a 7-4 y 7-5 a 8-4. Para
entre 8 a 12 aos, pertenecientes al sector urbano INT, el grupo de menor edad present puntuacio-
y de niveles socioeconmicos alto, medio y bajo. nes elevadas, similares a los grupos de mayor edad.
Utilizando Anova de un factor y test de Scheff, En los resultados para FDT se hall menor
el estudio mostr diferencias estadsticamente sig- control de interferencia en nios prelectores, esta
nificativas para la edad (p=0), lo que llev a las prueba sirvi como mejor predictor para evaluar la
autoras a concluir que se requieren tres normas capacidad de inhibicin en estas edades, se encon-
diferenciales: una para los 8 aos, otra para los 9 y tr que con el crecimiento progresivo de la capaci-
10 aos y una ltima para los 11 y 12 aos para P, dad de inhibicin aumenta entre los nueve y once
C y PC. En INT la media disminuy a medida que aos (Martn et al., 2012).
aumentaba la edad. En sntesis, edad es una variable que afecta los
En Holanda, Van der Elst, Van Boxtel, Van resultados con las diferentes lminas del Stroop.
Breukelen, & Jolles (2006) administraron el test
de Stroop a 1856 participantes, entre 24 a 81 aos, Diferencias por la variable sexo
los datos normativos fueron clasificados por edad,
sexo y nivel educativo. Los resultados mostraron En relacin a las diferencias por sexo, Peretti (1969,
que todas las lminas P, C, PC e interferencia fue- como se cito en Golden, 2007) estudi una mues-
ron significativamente afectadas por la edad. La tra de 50 varones y 50 mujeres encontrando una
ejecucin en todas las lminas disminuy con la puntuacin media para PC de 48.2 en mujeres y
edad. A partir de sus hallazgos, los autores expli- 55.1 varones que lo condujo a concluir la existencia
can el concepto de reserva cognitiva, en el que la de una diferencia significativa al 0.01 a favor de los
educacin se convierte en un factor protector ante varones. En la traduccin, adaptacin y validacin
los daos producidos por el envejecimiento. espaola del Stroop realizada por el Departamento
Un estudio con escolares realizado en Tenerife, I+D de TEA Ediciones en 1994 (en adelante TEA)
Espaa, cuyo objetivo fue hallar datos normativos para poblacin general, se encontraron puntuacio-
para el test de Stroop en una muestra de 1032 es- nes medias de P=118 (DT=18), C= 77 (DT=14),
tudiantes entre 6 y 12 aos (edad tomada en aos y PC=49 (DT=10) e INT=2.70 (DT=8.53); los re-
meses), sin enfermedad neurolgica ni psiquitrica, sultados para esta validacin fueron superiores a
mediante un diseo transversal con la edad como muestras americanas, el estudio encontr diferencias

U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016 259


L uca C arlota R odrguez B arreto , N infa del C armen P ulido , C arlos A lejandro P ineda R oa

significativas para INT en varones con 3.63 y muje- Diferencias segn inteligencia y
res 1.88, pero no hubo diferencias significativas para problemas de aprendizaje
P, C y PC en la variable sexo. TEA (1994) seal
que en relacin a nios y ancianos se hace necesario En cuanto a validez de criterio, Espinosa (2008) rea-
contar con muestras ms representativas para llegar liz un trabajo de tipo psicomtrico para validar y
a datos ms concluyentes. estandarizar el test de Stroop en una muestra de 381
Contrario a los resultados de Peretti, en el estu- nios, nias y adolescentes, en edades comprendi-
dio de Van der Elst et al. (2006) las mujeres tuvieron das entre 7 y 16 aos. La autora utiliz la versin del
mejor desempeo en las lminas C, PC e interfe- test de Stroop de Golden (1999). Los participantes
rencia que los hombres, pero no hubo diferencias fueron diagnosticados y divididos en diferentes
en la lmina P. grupos: (a) coeficiente intelectual (CI) alto; (b) CI
Por otro lado, Conca & Ibarra (2004) no encon- normal; (c) problemas de aprendizaje; (d) problemas
traron diferencias significativas en todo el Stroop de atencin, y (e) problemas emocionales. Mediante
segn la variable sexo. En efecto, se observ que Anova se encontraron diferencias significativas en
las mujeres tienen un mejor desempeo en las dos P, con puntuacin media ms alta en personas con
primeras lminas P y C de la prueba, sin embargo, CI alto y ms baja para personas con problemas de
este desempeo se invierte a favor de los hombres aprendizaje; en C, las puntuacin media ms alta la
en la tercera lmina. Al realizar el anlisis estads- obtuvo el grupo con CI alto y la ms baja el grupo
tico a travs de t de student para cada una de las de problemas emocionales; para PC, las puntuacin
lminas del test, se concluy que no existen diferen- media ms alta la obtuvo el grupo con CI alto y la
cias significativas en dicha variable (p= 0.051). A ms baja el grupo de problemas emocionales; para
la misma conclusin llegaron Espinosa (2008) y en INT no se encontraron diferencias entre los grupos.
Colombia Soares (2009) en Portugal al sealar que Actualmente, y a pesar del uso extendido del
no encontraron diferencias en cuanto a la variable Stroop entre los neuropsiclogos colombianos, no
sexo para ninguna de las puntuaciones del Stroop. se encontr un estudio cuyo objetivo fuera la va-
En conclusin, la evidencia actual es contradic- lidacin de la prueba en poblacin colombiana no
toria respecto a las diferencias por sexo respecto de clnica. El objetivo de la presente investigacin fue
cada una de las lminas del Stroop. validar el test de Stroop en poblacin colombiana
sana en edades comprendidas entre 7 y 80 aos.
Diferencias por la variable estrato
Mtodo
Siguiendo a Conca & Ibarra (2004), se hallaron
diferencias significativas en el nivel socioeconmico Diseo
(p=0), lo que permiti concluir que para las lminas
P, C y PC se requieren dos normas diferenciales: una En esta investigacin se utiliz un estudio instru-
para los estratos alto y medio y otra para el estrato mental de carcter psicomtrico, de acuerdo a los
bajo. A partir de los resultados obtenidos se puede conceptos y tcnicas que se utilizan en esta rea
concluir que, para el ndice de interferencia, hubo (Montero & Len, 2007).
diferencias estadsticamente significativas (p=
0.002) solamente entre el nivel socioeconmico Participantes
alto y el bajo.
Criterios de inclusin-exclusin

Para la seleccin de los participantes se tuvo en


cuenta que se encontraran en un rango de edad

260 U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016


P ropiedades psicomtricas del S troop , test de colores y
palabras en poblacin colombiana no patolgica

comprendidas entre 7 y 80 aos de edad, supieran este estudio, el mayor porcentaje se concentr en el
leer, que participaran voluntariamente y que fir- rango de 16 a 44 aos (48.5%), seguidos de los de 7
maran el consentimiento informado. En menores a 15 (28.1%), 45 a 64 (18.1%) y la menor cantidad
de edad, consentimiento firmado por padres o de participantes en el rango de 65 a 80 (5.2 %). Pa-
representantes legales; no presentar dficit cogni- ra el estrato, 86 hacan parte del estrato uno, 424
tivo, alteraciones perceptivo visuales (incluyendo del dos, 589 del tres, 172 para el cuatro y 61 para el
el daltonismo), dficits auditivos o motores que cinco. El estrato se agrupo en bajo (1 y 2), medio
dificultaran o impidieran realizar la prueba, y no (3) y alto (4 y 5).
haber estado medicado (psicofrmacos, Ritalina o El muestreo que se utiliz fue de tipo no probabi-
anticonvulsionantes). lstico por conveniencia, que constituye una mues-
tra seleccionada por medio de mtodos no aleato-
Poblacin y muestra rios (Cerd, 1978; Malhotra, 2004); para Casal &
Mateu (2003) consiste en la eleccin por mtodos
La poblacin la conformaron hombres y mujeres no aleatorios de una muestra cuyas caractersticas
entre 7 y 80 aos de edad, vinculados a colegios, sean similares a las de la poblacin objetivo.
universidades, empresas y programas del adulto En cuanto a la escolaridad, se encontr que el
mayor o pensionado en entidades pblicas, privadas 22.8% de la muestra tena estudios secundarios,
o mixtas que pertenecieran a los estratos compren- seguidos de pregrado (16.9%), primaria (16.4%),
didos entre uno y cinco de la ciudad de Tunja. No profesionales (15.6%), bachilleres (10.1%), posgrado
obstante, los participantes provenan de diversas (10.3%) y finalmente, con el menor porcentaje, los
regiones del pas como lugar de nacimiento. tcnicos (7.8%).
Para el clculo del tamao muestral se tom
como referencia la proyeccin del Departamento Instrumentos
Administrativo Nacional de Estadstica (DANE)
para el 2013 de infancia, adolescencia, juventud Los instrumentos utilizados fueron el Stroop, test
y tercera edad de la ciudad de Tunja, segn la de colores y palabras en la adaptacin realizada
proyeccin por grupo poblacional 2011-2015 que por Golden en 1994 y el Trail Making Test forma
es de 84.565 personas, dando como resultado B (TMT- B) (Reitan, 1992). A continuacin, se
n= 1054 participantes con 95% de confianza y describe cada una de las pruebas.
error de 3%.
La muestra inicial encuestada estuvo confor- Stroop, test de colores y palabras (TEA, 1994)
mada por 1357 participantes de los cuales 26 no se
incluyeron en la investigacin; 18 nios no llevaron Instrumento adaptado para la poblacin espaola
el consentimiento informado firmado por los padres por de TEA ediciones S.A. en el ao de 1994 (Gol-
o representante legal y dos no asistieron cuando den, 2007). El test permite indagar la atencin a
estaban citados; de los adultos, uno era daltnico, travs de la integracin de los subpuntajes: palabra
tres eran analfabetas, uno tena retardo mental y (P), color (C), palabracolor (PC), y dentro de este
uno tena ms de 80 aos. La muestra final qued proceso psicolgico, la capacidad de flexibilidad
conformada por 1332 participantes, 561 varones cognitiva, resistencia a la interferencia y grado de
(42.1%) y 771 mujeres (57.9%) entre 7 y 80 aos de complejidad cognitiva (Chapi, 2011). Golden &
edad (Media= 29.80 DT= 17.95). Malloy (2001, 2000, citados por Soares, 2009) indi-
En relacin a la edad de los participantes, toma- can que la prueba evala las dimensiones asociadas
da en aos cumplidos, se agruparon en rangos de a la flexibilidad mental, habilidades de inhibicin
7 a 15, 16 a 44, 45 a 64 y 65 a 80 aos, de acuerdo y a la resistencia a la interferencia en relacin a
a los criterios del Stroop, test de colores y palabras estmulos externos.
para la adaptacin espaola (Golden, 1994); para

U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016 261


L uca C arlota R odrguez B arreto , N infa del C armen P ulido , C arlos A lejandro P ineda R oa

Generalidades de la prueba. El test consta de tres TMT consta de dos partes, la parte A y la B, con
lminas en tamao de papel A4, cada una con cinco un ensayo que se debe pasar antes de administrar la
columnas y veinte elementos intercalados, para un prueba que se califica. En la A (para nios y adul-
total de 100 en cada una. El participante cuenta con tos), los crculos van de 1 al 8 y en la B (para nios
45 segundos para leer cada lmina. En la primera y adultos), los nmeros del 1 a 4 y las letras de A a
lee una lista de palabras que sealan los colores D. Se explica la tarea hasta que se est seguro de
rojo, verde, azul, escritas en tinta negra; en la que las instrucciones fueron comprendidas por la
segunda lee solo el color en que estn escritas una persona a la que se le aplicar la prueba. Se entrega
serie de cuatro letras XXXX, XXXX, XXXX un lpiz negro para realizar los trazos.
que incluyen los colores de la primera lmina; en TMT-B: para los nios son 15 crculos del 1 al 8
la ltima, la persona debe nombrar el color en que y las letras de la A a la G; en adultos consta de 25
est escrita la palabra que no corresponde a la crculos pero esta vez van del 1 al 13 y las letras de
palabra rojo, azul, verde. Se deben seguir las la A a la L, la tarea consiste en que se deben unir
instrucciones de aplicacin descritas en el manual. de forma alternada un nmero y una letra (1A, 2 B,
La prueba de Stroop permite obtener las siguien- 3C) y as sucesivamente hasta terminar la secuencia
tes puntuaciones: (a) primera lmina, nmero co- en el circulo con el nmero 8 para los nios y en 13
rrecto de palabras ledas (palabra P); (b) segunda para los adultos. Se debe tener en cuenta el orden
lmina, nmero correcto de colores ledos (color ascendente para los nmeros y las letras. Se registra
C), y (c) tercera lmina, nmero correcto de tems el tiempo que emplea el participante en realizar la
ledos (palabra-color PC). Para calcular la inter- tarea (en segundos).
ferencia INT se deben aplicar las siguientes for- En la presente investigacin se eligi el TMT
mulas: a) PC= P x C/ P+ C y b) INT= PC PC. forma B para evaluar validez convergente por ser
una prueba corta, de fcil administracin y prin-
El Trail Making Test (TMT) cipalmente porque, al igual que el Stroop, evala
atencin, flexibilidad cognitiva e interferencia co-
La prueba del TMT (Reitan, 1992) fue desarrollada mo parte de las funciones ejecutivas (Portellano,
en 1938 y Partington y Leiter (1949) la adaptaron 2009).
del original titulndola Partingtons Pathways Test.
Se dio a conocer con el nombre de Distributed At- Procedimiento
tention Test y en espaol como Test de atencin
distribuida; la prueba tambin se conoce como El proyecto fue desarrollado en varias fases. Se
Test del trazo. Inicialmente formo parte de la Ar- realiz una bsqueda bibliogrfica en bases de da-
my individual Test Battery (1944) y posteriormente tos como Proquest, Ebsco, ScienceDirect, Scopus,
de la batera neuropsicolgica de Halstead Reitan Google Acadmico, entre otras, para construir el
(Reitan & Wolfson, 1993, citados por Burin, Drake marco terico. En la segunda fase se seleccionaron
& Harris, 2007). los participantes de la muestra de acuerdo a las
Este instrumento consta de dos formas, A y B, edades propuestas (7 a 80 aos). Las edades son el
para nios de 9 a 14 y adultos de 15 a 89 aos. La criterio para ubicar los posibles sitios de aplicacin:
parte A mide habilidades motoras, visoespaciales se eligen, entonces, para el rango de 7 a 18 aos
de bsqueda visual y atencin sostenida. La forma cuatro colegios, dos de carcter pblico y dos priva-
B evala de forma adicional la flexibilidad cogni- dos; de 18 a 64, dos universidades pblicas y cinco
tiva y atencin dividida; esta parte B exige mayor privadas (estudiantes, docentes y administrativos),
esfuerzo en la realizacin de la tarea. En el modelo as como seis empresas privadas y tres pblicas
de atencin planteado por Mirsky (1996, citado por (nivel administrativo y operativo), y, finalmente,
Burin, Drake, & Harris, 2007), la tarea del Stroop para 65 a 80 aos, los programas de la tercera edad
respondera al componente focalizadorejecutor. El

262 U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016


P ropiedades psicomtricas del S troop , test de colores y
palabras en poblacin colombiana no patolgica

o pensionados en programas de cuatro empresas tiempo que utiliza para realizarlo, se anota (en mi-
pblicas y una mixta. nutos) y se registran las calificaciones en el formato
En la tercera fase se pidieron autorizaciones en creado para tal fin.
cada uno de los sitios tentativamente seleccionados, Al finalizar las aplicaciones se procedi a la fase
inicialmente con citas para presentar la propues- seis: la elaboracin de una base de datos en Excel
ta y posteriormente con solicitudes escritas para y SPSS versin 19. En dicha fase se transcribieron
formalizar las autorizaciones y realizar visitas a las los formatos de registro y calificaciones en Excel,
instalaciones fsicas para establecer los requisitos realizando varias revisiones para verificar la co-
de aplicacin de la prueba en aspectos como luz, rrecta transcripcin de los datos o posibles errores
privacidad y ausencia de ruido. Se establece la de digitacin.
dinmica para que los participantes se retiren del
aula de clase o sitio de trabajo de manera que las Aspectos ticos
personas que participen no entorpezcan el trabajo
de clase o en las empresas. Se siguieron los lineamientos de la Ley 1090 de
En la cuarta fase se hicieron capacitaciones, 2006 y la Resolucin 008430 de 1993. Se cont
entrenamientos y simulacin para la aplicacin. Se con el aval del comit de tica de la Direccin de
contrataron un psiclogo, tres psiclogas y cuatro Investigaciones (DIN) de la UPTC, a quienes se so-
estudiantes de ltimo semestre de Psicologa para la cializ la propuesta y el consentimiento informado
aplicacin de las pruebas. Cada uno fue capacitado y se realizaron los ajustes respectivos de acuerdo a
por la investigadora principal para aplicar la prueba las recomendaciones de dicho comit.
y para realizarla teniendo en cuenta las instruccio-
nes y pasos en la aplicacin. En los colegios, para los Anlisis estadsticos
nios menores de edad se entregaron los consenti-
mientos informados a las directoras de curso para Se aplicaron las frmulas para obtener las pun-
que los nios lo llevaran a la casa y una vez que los tuaciones PC y la interferencia de acuerdo a lo
devolvieron firmados, se prepar la actividad. Cada sealado en el manual y el tiempo del TMT-B es
aplicador lleva los consentimientos, las pruebas, transformado de minutos a segundos, para cada uno
formatos de registro, cronmetro, lpiz y esfero en de los datos. Se realizaron las transformaciones es-
paquetes ordenados para cada participante. pecificadas en el manual segn los rangos de edad.
La quinta fase, de aplicacin, se hizo de mane- Se calcularon los anlisis psicomtricos de confia-
ra individual. Las sesiones estaban establecidas de bilidad y la validez que corresponde al objetivo de
manera que todos los aplicadores las realizaran de este estudio. La confiabilidad usando el mtodo test
la misma forma. Una vez recibido, se proceda a dar retest por el mtodo de coeficiente de correlacin
las instrucciones y cuando se estaba seguro(a) que intraclase CCI con intervalo de confianza del 95%.
se comprenda la tarea, se daba inicio y se crono- Es importante resaltar que comnmente se hace
metraron los 45 segundos establecidos para cada uso del r de Pearson en el clculo de la confiabilidad
lmina. La segunda aplicacin se realiz en un lapso test-retest. Sin embargo, este mide nicamente la
de tiempo de diez minutos, teniendo en cuenta que fuerza de la asociacin lineal entre dos variables y
esta tarea no es susceptible de aprendizaje, pero s no el acuerdo entre ellas. Para Serra & Pea (2006)
de cambios madurativos o fisiolgicos asociados a la r de Pearson es un coeficiente interclase ms
la edad. Para la aplicacin del Trail Making Test que intraclase y por ello tiende a sobreestimar la
forma B se pasa primero un ensayo en el que se da confiabilidad. El CCI evala el grado de variacin
un ejemplo de la tarea en una forma corta, si es ne- entre un tiempo 1 y un tiempo 2, si la diferencia es
cesario se corrige cualquier error, cuando el ensayo pequea, el CCI ser grande (cercano a 1). Adems,
termina y la tarea se finaliza con xito, se entrega el CCI mide la relacin entre variables que com-
entonces la hoja que se califica, se cronometra el parten la misma mtrica y varianza. Para la validez

U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016 263


L uca C arlota R odrguez B arreto , N infa del C armen P ulido , C arlos A lejandro P ineda R oa

convergente se utilizaron los puntajes de la prueba educativo y el estrato de cada uno de los rangos
TMT-B de Reitan (1992) y se correlacionan con los de edad para cada uno de las puntuaciones trans-
puntajes del Stroop para P, C y PC mediante la r de formadas de P, C y PC.
Pearson. Para la validez de constructo se utiliz el
mtodo de extraccin de componentes principales Resultados
analizando el porcentaje de varianza explicado y los
distintos componentes extrados. Una confirmacin De acuerdo a los objetivos del presente trabajo, los
del nmero de componentes es establecida mediante resultados sern presentados primero en lo relacio-
el Anlisis paralelo de Horn (1965). nado al estudio psicomtrico del Stroop, test de
Se realiz un anlisis descriptivo mediante colores y palabras de Golden (2007) respecto de la
medias y desviacin estndar segn grupo etario. confiabilidad y la validez. Seguidamente se presen-
Se revis el cumplimiento de los supuestos de tan los estadsticos descriptivos por cada rango de
normalidad (prueba de Kolmogorov-Smirnov), edad. Posteriormente se verifica el cumplimiento de
se verific el supuesto de igualdad de varianzas los supuestos de normalidad y homocedasticidad en
mediante la prueba de Levene y se realizaron los las variables P, C y PC, luego de lo cual se presentan
tratamientos estadsticos inferenciales de acuerdo los anlisis inferenciales.
a las diferentes variables contempladas, como el
sexo, la edad, la escolaridad y el estrato. Usando Anlisis de los resultados de la
la prueba t student se verific si haba diferencias confiabilidad del Stroop
significativas entre hombres y mujeres de cada
uno de los rangos de edad para cada una de las La estimacin de la confiabilidad se realiz utili-
puntuaciones transformadas de P, C y PC. Segui- zando testretest calculando el coeficiente de corre-
damente, usando la prueba F de Fisher se verific lacin intraclase CCI entre las dos aplicaciones de
si haba diferencias significativas segn el nivel cada subprueba a un nivel de 95% para el intervalo

Tabla 1.
Resultados de confiabilidad del Stroop mediante test-retest

Subescala CCI IC 95% p valor


P 0.91 (0.90;0.92) 0
C 0.87 (0.83;0.90) 0
PC 0.78 (0.51;0.88) 0
Fuente: elaboracin propia.

Tabla 2.
Resultados correlacionales entre las escalas del Stroop y TMT-B

Resultados correlacionales entre las escalas del Stroop y TMT-B


Lmina 1: (P) 0.416**
Lmina 2: (C) 0.355**
Lmina 3: (PC) 0.404**
Interferencia (INT) 0.140**
Significancia bilateral 0
n 860
Nota: **La correlacin es significativa a nivel 0.01
Fuente: elaboracin propia.

264 U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016


P ropiedades psicomtricas del S troop , test de colores y
palabras en poblacin colombiana no patolgica

de confianza. El CCI mide tanto la consistencia en importantes. Por su parte, la correlacin INT
el tiempo como entre evaluadores. Indica en qu TMT-B es dbil porque no cumple con este supuesto
grado diferentes evaluadores puntuarn de manera (vase tabla 2).
idntica la ejecucin en una tarea.
La tabla 1 muestra los coeficientes de correla- Resultados validez de constructo
cin intraclase encontrados en cada subescala P, C
y PC, valores que son muy buenos (superiores a 0.78 El procedimiento estndar para dar cuenta de la
para las subescalas P, C y PC). Esto es congruente validez de constructo de una prueba psicolgica es
con la consistencia reportada en los estudios co- el anlisis factorial. Permite explicar la varianza de
lombianos, espaoles y norteamericanos (Henao- un conjunto de variables a un nmero ms reducido
Arboleda et al., 2010). de factores o componentes. Golden (1994) utiliz el
Anlisis factorial exploratorio (AFE) con el fin de
Anlisis de los resultados saber cul de las puntuaciones del Stroop permita
de validez del Stroop aportar una informacin nica y original (p. 15).
Es importante aclarar que durante muchos aos
En el presente estudio se hallaron validez conver- ha existido una fuerte controversia entre los que
gente y de constructo. La validez convergente se afirman que el mtodo ms adecuado para realizar
correlacion a travs de r de Pearson, los puntajes un AFE es el anlisis factorial comn (Factoriza-
de las pruebas Stroop (Golden, 1994) y el TMT-B cin de ejes principales - FEP) y los que aconsejan el
(Reitan, 1992). uso del Anlisis de componentes principales (ACP)
(Henson & Roberts, 2006; Widaman, 2007).
Resultados validez convergente De acuerdo con Widaman (2007), ambas tc-
nicas tienen grandes diferencias y algunas similitu-
Los resultados mostraron una correlacin negativa y des. Lo comn es que los mtodos FEP y ACP no
significativa con valores entre -0.35 y -0.41 para las permitan obtener errores tpicos de los parmetros
tres subescalas P, C y PC con las puntuaciones en el que producen. La diferencia ms importante es
TMT-B, lo que indica que a mayor nmero de tems que el mtodo FEP separa la varianza comn de la
ledos en la primera, se emplea menor tiempo en la varianza especfica, mientras que el ACP incluye
segunda prueba; las tres primeras escalas presentan en la solucin dimensional tanto una como otra, y
correlaciones significativas y aceptables, en tanto tiende a sobredimensionar la matriz de componen-
estn por encima de 0.30 que, segn Norman & tes interpretativa.
Steiner (1995, p. 105), se consideran correlaciones

Tabla 3.
Varianza total explicada por los tres componentes del ACP

Sumas de las saturaciones


Componente Autovalores iniciales
al cuadrado de la extraccin
Total % de la varianza % acumulado Total % de la varianza % acumulado
1 3.742 46.777 46.777 3.742 46.777 46.777
2 1.865 23.312 70.088 1.865 23.312 70.088
3 1.340 16.755 86.844 1.340 16.755 86.844
4 0.773 9.665 96.509
5 0.276 3.454 99.963
6 0.003 0.037 100
Mtodo de extraccin: anlisis de componentes principales.
Fuente: elaboracin propia.

U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016 265


L uca C arlota R odrguez B arreto , N infa del C armen P ulido , C arlos A lejandro P ineda R oa

Debido a que en el presente estudio no se cum- lor propio de 3.74, incluye tems con saturaciones
plieron los supuestos para el AFE mediante FEP, se entre 0.74 y 0.98 y explica el 47% de la varianza
procedi a establecer el nmero de componentes y total, refirindose al nmero de palabras ledas en
la explicacin de su varianza total. En consecuen- la primera pgina del test (P), al nmero de colores
cia, se hablar de componentes y no de factores.
denominados en la pgina dos del test (C), a la suma
Como se observa en la tabla 3, conforme la reco-
de esta dos puntuaciones (C1+P1) y al nmero de
mendacin Kaiser y Guttman, los tres componentes
encontrados con autovalores mayores a 1 explican respuestas correctas en la pgina tres del test que
el 86.84% de la varianza total (Guttman, 1953; contiene la interferencia (PC1).
Kaiser, 1960). Sin embargo, y pese a la polmica El segundo componente, con un valor propio
acerca del nmero de factores o componentes a de 1.86, est constituido por tems que contribu-
retener en un anlisis factorial, hemos realizado el yen a explicar el 23% de la varianza total y cuyas
procedimiento de Anlisis paralelo de Horn (1965), saturaciones fluctan entre 0.64 y 0.92. Este
el cual ha ganado bastante terreno en la literatura componente incluye lo relacionado esencialmente
psicomtrica al ser ms objetivo que la regla de con medidas de interferencia, observando que las
Kaiser como procedimiento para determinar el
puntuaciones PC1-PC1 y PC1-C1son medidas de
nmero de factores a retener en un AFE (Ruiz &
interferencia pura, corregidas por factores de
San Martn, 1992). El anlisis paralelo compara
los valores propios de los datos del estudio real con velocidad (Soares, 2009).
valores propios aleatorios. El mtodo consiste en Anlogamente, el tercer componente hallado
aceptar aquellos factores o componentes siempre en el presente estudio con un valor propio de 1.34
que se cumpla que el valor propio del estudio real incluye un tem con saturacin de 0.84, explicando
supere el valor propio del estudio aleatorio o simu- el 16% de la varianza total. El tem que constituye
lado (Brett, Brown, & Onsman, 2010). este factor est relacionado con la relacin entre el
El resultado encontrado confirm los mismos nmero de palabras ledas en la primera pgina del
tres componentes encontrados en el ACP (vase test y los colores nombrados en la pgina dos del
tabla 4). Los componentes encontrados tienen la
test (P1/C1).
agrupacin presentada en la tabla 5 y confirman
El presente estudio confirma tambin al propio
una solucin componencial similar a la encontrada
por Soares (2009), lo cual indica que la estructura Golden cuando afirma que es el segundo compo-
del Stroop encontrada en la muestra portuguesa nente el que mejor representa las medidas de inter-
es similar a la estructura encontrada en la muestra ferencia pura (PC1-PC1 y PC1-C1) corregidas por
colombiana. El primer componente, con un va- factores de velocidad (Golden, 1994, p. 15).

Tabla 4.
Valores propios de los datos reales, medias y percentiles de los valores propios simulados

Variable Datos en bruto Medias Percentiles Decisin


1 3.74 1.11 1.15 Aceptar
2 1.86 1.07 1.09 Aceptar
3 1.34 1.04 1.06 Aceptar
4 0.77 1.01 1.03 Rechazar
5 0.27 0.98 1 Rechazar
6 0.002 0.95 0.97 Rechazar
7 0 0.92 0.94 Rechazar
8 0 0.89 0.91 Rechazar
Fuente: elaboracin propia.

266 U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016


P ropiedades psicomtricas del S troop , test de colores y
palabras en poblacin colombiana no patolgica

La distribucin por rangos de edad en la muestra final estuvo compuesta as:

Nios (7 a 15 aos) 375


Adultos jvenes (16-44 aos) 647
Adultos (45-64 aos) 241
Adultos mayores (65-80 aos) 69

Tabla 6.
Resultados descriptivos del Stroop en poblacin colombiana, corregidos por edad

P C PC INT
Media (DE) Media (DE) Media (DE) Media (DE)
Poblacin general 103 (15) 69 (12) 41 (8) -0.21 (6.53)
Varones 103 (15) 67 (12) 40 (8) -0.14 (6.80)
Mujeres 103 (15) 71 (11) 42 (8) -0.47 (6.32)
Nios (7 a 15 aos) 106 (13) 70 (11) 41 (8) -0.51 (5.65)
Adultos jvenes (16-44 aos) 104 (14) 71 (12) 41 (9) -0.61 (6.70)
Adultos (45-65 aos) 99 (18) 65 (12) 38 (8) -0.56 (6.45)
Adultos mayores (65-80 aos) 91 (20) 63 (12) 43 (7) 6.29 (6.42)
Fuente: elaboracin propia.

Tabla 7.
Pruebas de normalidad para la subprueba P en los diversos grupos etarios

ADULTOS ADULTOS
NIOS ADULTOS
JOVENES MAYORES
Diferencias ms Absoluta 0.136 0.054 0.109 0.224
extremas Positiva 0.136 0.054 0.109 0.044
Negativa 0.034 -0.052 -0.001 -0.224
Z de Kolmogorov-Smirnov 1.313 0.682 0.844 0.919
Sig. asintt. (bilateral) 0.064 0.741 0.474 0.367
Fuente: elaboracin propia.

U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016 267


L uca C arlota R odrguez B arreto , N infa del C armen P ulido , C arlos A lejandro P ineda R oa

Anlisis descriptivo del Stroop en Resultados del anlisis de los supuestos


la muestra colombiana, 2013 de normalidad y homocedasticidad

La versin Stroop de TEA (1994) fue aplicada a Como se aprecia en la tabla 7, las pruebas de Kolmogo-
un total de 1332 personas con rangos de edad en- rov-Smirnov confirman que los datos de la subprueba
tre 7 y 80 aos con un promedio de 29.8 aos (DE P provienen de poblaciones normalmente distribuidas;
= 17.94). La muestra se compuso de 771 mujeres las dems subpruebas bsicas C y PC arrojaron una dis-
(57.88%) y 561 hombres (42.11%). tribucin de probabilidad similar. As mismo, mediante
La tabla 6 muestra las medias y desviaciones la prueba de Levene, confirmaron que se cumple el
estndar en cada uno de los rangos de edad para supuesto de homocedasticidad o igualdad de varianzas.
las subescalas P, C, PC e INT. Cada uno de estos
estimadores fue calculado luego de haber realiza- Anlisis de las subescalas segn
do la correccin para los rangos de edad de nios, variables sociodemogrficas
adultos y adultos mayores sealada en el manual
de la prueba. El Anova de un factor arroj diferencias signifi-
Con base en las puntuaciones en cada subescala cativas en todos los rangos de edad para todas las
P, C, PC e INT con respecto a los estadsticos des- subescalas P, C, PC e Interferencia. Para el caso
criptivos obtenidos, es preciso sealar lo siguiente: de la subescala P, F (3.1328) = 13.25; p=0; para la
Los resultados descriptivos de la muestra subescala C, F(3.1328) = 18.36, p =0; en la subes-
colombiana son inferiores a los obtenidos cala PC, F(3.1328) = 14.17, p =0. Finalmente para
en poblaciones espaolas en las cuatro pun- el caso de la Interferencia se encontr F(16.1315)
tuaciones del Stroop, Golden (1994, p. 41). = 1.88, p = 0.018.
No se aprecian grandes diferencias entre va- Conforme se aprecia en la tabla 8, las pruebas t
rones y mujeres en cada una de las distintas para muestras independientes confirmaron que no
sub escalas. hubo diferencias significativas con respecto al sexo
Con relacin a las puntuaciones de interfe- en las subescalas P, PC e INT una vez estas se corri-
rencia, se encuentra que los adultos mayo- gieron por la edad. nicamente la subescala C arroj
res obtuvieron un mayor promedio, lo que diferencias significativas segn la variable sexo.
se interpreta como mayor resistencia a la Igualmente, el Anova de un factor arroj diferen-
interferencia. No obstante, no se aprecian cias significativas segn estrato socioeconmico slo
diferencias importantes en los puntajes para la subescala P [F(1326.4) = 2.77, p = 0.026] y pa-
promedio entre los nios, jvenes y adultos.

Tabla 8.
Prueba de homogeneidad de varianzas y prueba T entre hombres y mujeres para diferencia de medias

Prueba de
Prueba T para la igualdad de medias segn la
Levene variable sexo
Sig. Diferencia Error tp. de
F Sig. T gl
(bil.) de medias la diferencia
Puntaje P corregido Se han asumido varianzas iguales 0.91 0.34 1.28 1330 0.2 1.12 0.87
Puntaje C corregido Se han asumido varianzas iguales 0.17 0.68 4.65 1330 0 3.07 0.66
Puntaje PC
Se han asumido varianzas iguales 0.05 0.83 1.41 1330 0.16 0.65 0.46
corregido
interferencia general Se han asumido varianzas iguales 1.26 0.26 -1.73 1330 0.08 -0.63 0.36
Fuente: elaboracin propia.

268 U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016


P ropiedades psicomtricas del S troop , test de colores y
palabras en poblacin colombiana no patolgica

ra la subescala PC [F(1326.4) = 3.53, p = 0.007]. Sin yores que 1). En nuestro estudio se encuentran
embargo, no se encontraron diferencias significativas los mismos tres factores, resultado que pudimos
en la subescala C ni en la Interferencia. En cuanto a P, confirmar a travs de Anlisis paralelo de Horn,
mediante la prueba de Tukey, el anlisis post hoc con los cuales explican el 86% de la varianza total. En
alfa = 0.05 arroja dos subconjuntos homogneos as: consecuencia, los resultados permiten confirmar
para los estratos 1, 2, 3 y 5 niveles promedio entre 99 que el constructo subyacente del Stroop, test de
y 103; mientras que el estrato 4 posee un valor pro- colores y palabras de Golden (2007) es el mismo
medio en la escala P de 105. Anlogamente, para la que para el presente estudio.
subescala PC los dos subconjuntos homogneos son: En cuanto a la validez de convergente, los re-
uno conformado los estratos 1, 2 y 3 con promedios sultados mostraron una correlacin negativa entre
entre 39 y 41 y el otro conformado por los estratos 4 las puntuaciones del Stroop (Golden, 2007) y el
y 5 con niveles promedio entre 42 y 42.4. TMT-B (Reitan, 1992) que indica que entre mayor
Finalmente, con relacin al nivel educativo se es el nmero de tems correctos en las lminas del
encontraron diferencias significativas en todos los Stroop, menor es el tiempo en la tarea del TMTB.
niveles educativos. Para la subescala P, F (16.1315) Sin duda, un hallazgo importante de la presen-
= 3.33; p = 0; en la subescala C, F(16.1315) = 5.89; te investigacin es que las medias y desviaciones
p =0; en la subescala PC se obtuvo F(16.1315) = estndar para cada una de las subescalas son in-
6.02; p =0, y finalmente para la escala de Inter-
feriores en la poblacin colombiana respecto de la
ferencia se obtuvo F(16.1315) = 1.88; p = 0.018.
poblacin espaola, lo que justifica la importancia
de estudios de validacin que den cuenta de los
Conclusiones y discusiones
parmetros en la poblacin en la cual se use el
instrumento.
Concluimos que el Stroop, test de colores y pala-
En el desempeo de la prueba se evidenciaron
bras de Golden (2007), versin en espaol de TEA
puntuaciones directas que en promedio decrecen
(1994), posee adecuadas propiedades psicomtricas
con el avance de la edad en P y en C, pero no de
en diversos grupos etarios de poblacin colombiana
manera clara en PC e INT. Por ejemplo, encontra-
no clnica. Esta versin ha sido una de las ms apli-
mos que en las subescalas PC e INT el grupo etario
cadas en forma individual en diversos estudios de
entre 16 a 44 tienden a puntuar ms alto que los
evaluacin neuropsicolgica en todo el mundo de
habla hispana, principalmente junto a otras pruebas dems grupos etarios. A partir de los 45 aos estos
y no de manera aislada. puntajes tienden a decrecer en estas dos escalas.
Con respecto a confiabilidad, el test mide con Respecto a estos resultados, es importante destacar
precisin en el tiempo y se confirman los hallazgos que otros estudios (Wright & Wanley, 2003) resal-
de estudios previos como el de Henao-Arboleda et tan la importancia de la edad que en la infancia es
al. (2010) en Medelln con valores de coeficiente de una variable significativa en el rendimiento de las
correlacin intraclase muy similares a los encontra- pruebas neuropsicolgicas y especialmente las que
dos en la presente investigacin para P, C y PC (todos evalan habilidades ejecutivas, abstraccin y aten-
superiores a 0.70). La confiablidad, usando el mtodo cin. Es a partir de los 44 aos que el rendimiento
test-retest encontr puntuaciones mayores a las de en las puntuaciones disminuye debido a que ste
la adaptacin espaola en P, C y PC, pero ms baja se ve afectado por la edad y de manera especial
en INT, Golden, 1994. en lo relacionado con la atencin y las funciones
Con relacin a la validez de constructo, el ejecutivas (Saltohuse, 1996; Wecker et al., 2005;
anlisis de componentes principales confirma Zahr, 2009, citado por Soares, 2009. La mayora
una estructura similar a la encontrada por Soares de las tareas de desempeo disminuyen a medida
(2009) en Portugal (con un 96.16% de varianza que aumenta la edad (Perea Bartolom & Ladera
explicada por tres factores con autovalores ma- Fernndez, 1995).

U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016 269


L uca C arlota R odrguez B arreto , N infa del C armen P ulido , C arlos A lejandro P ineda R oa

Adems, los estudios previos que hemos citado 5(1) Recuperado de http://www.psiquiatria.com/
realizaron normalizaciones y lo hicieron nicamen- revistas/index.php/asmr/article/view/912/
te en algunos rangos de edad, de 7 a 16 (Espinosa, Brett, W., Brown, T., & Onsman, A. (2010). Exploratory
2008; Agudelo, 2012); de 6 a 12 aos en Espaa factor analysis: A five-step guide for novices. Aus-
(Martn, 2012); de 8 a 12 aos en Chile (Conca tralasian Journal of Paramedicine, 3(8). Recuperado
& Ibarra, 2004); de 18 a 49 aos (Rognoni et al., de http://ro.ecu.edu.au/jephc/vol8/iss3/1
2011) y de 24 a 81 (Van der Elst et al., 2006) por Burin, D. I., Drake, M. A., & Harris, P. (2007). Evaluacin
lo que se toman como referentes tericos, pero neuropsicolgica en adultos. Buenos Aires: Paids.
dificultan la realizacin de comparaciones ya que Casal, J. & Mateu, E. (2003). Muestreo por con-
no cumplen las mismas condiciones de edad que el veniencia. Slideshare. Recuperado de http://
presente estudio. www.slideshare.net/selene1524/muestreo-por-
En este estudio se encuentra que, en general, no conveniencia#btnPrevious
hay diferencia significativa entre hombres y muje- Cerd, E. (1978). Psicometra general [segunda edicin].
res, al igual que en el estudio de la adaptacin de la Barcelona, Espaa: Editorial Herder.
muestra espaola, el cual encontr diferencias slo Chapi, J. (2011). Rendimiento neuropsicolgico de
para INT en varones con 3.63 y mujeres 1.88, pero personas con esquizofrenia pertenecientes a un
no hubo diferencias significativas para P, C y PC en programa de rehabilitacin integral. Revista Elec-
la variable sexo. Resultados similares fueron halla- trnica de Psicologa Iztacala, 14(4), 136-159. Recu-
dos por Conca & Ibarra (2004), Espinosa (2008) y perado de http://www.medigraphic.com/pdfs/epsicolo-
Soares (2009). Sin embargo, en el presente estudio
gia/epi-2011/epi114h.pdf
se encontr que el Stroop discrimina adecuada-
Comalli Jr., P. E., Wapner, S., & Werner, H. (1962).
mente por estrato y nivel educativo, confirmando
Interference effects of Stroop color-word test in
hallazgos como los de Perea Bartolom & Ladera
childhood, adulthood, and aging. The Journal of
Fernndez (1995), Soares (2009) y Van der Elst et
Genetic Psychology, 100(1), 47-53.
al. (2006).
Conca Binfa, B., & Ibarra Gonzlez, M. (2004). Es-
La principal conclusin del presente estudio es
tandarizacin de la prueba de colores y palabras de
que el Stroop, posee adecuadas caractersticas de
STROOP en nios de 8 a 12 aos para la Regin
validez y confiabilidad y, en consecuencia, puede
Metropolitana. Tesis de grado indita. Santiago:
ser usado en evaluacin neuropsicolgica de po-
Universidad de Chile. Recuperado de http://re-
blacin colombiana sana teniendo como base los
estadsticos descriptivos (medias y desviaciones positorio.uchile.cl/handle/2250/113385
tpicas) de la presente validacin y no las normas Crocker, L., & Algina, J. (1986).Introduction to classical
de la versin espaola. and modern test theory. New York: Holt, Rinehart
and Winston.
Referencias Dodrill, C. B. (1978). A neuropsychological battery for
epilepsy. Epilepsia, 19(6), 611-623.
Agudelo, E., & Guzmn, C. (2012). Normalizacin y Car- Espinosa, A. (2008). Validacin y estandarizacin del Test
actersticas Psicomtricas del Stroop, Test de Colores de Colores y Palabras STROOP con una muestra de
y Palabras en una muestra de escolares entre 7 y 16 nios y adolescentes Bogotanos. Tesis indita. Bo-
aos de la ciudad de Tunja. Tunja: Uptc. got: Universidad Nacional de Colombia.
Bauer, R.M., Tobias, B. & Valenstein, E. (1993). Am- Golden, C. J. (2007). Stroop test de colores y palabras,
nesic disorders. En Heilman, K.M., & Valenstein, manual (5 Ed.). Madrid: TEA Ediciones.
E. (Eds.), Clinical Neuropsychology (pp.214-228). Golden, J. (2001). Stroop test de colores y palabras, manual
New York: Oxford University Press. (3 Ed.). Madrid: TEA Ediciones.
Bausela, E., & Santos, J. (2006). Utilidad Del Stroop en Golden, C. J. (1994). Stroop: test de colores y palabras:
la Psicologa Clnica. Revista Internacional On-line, manual. Madrid: TEA Ediciones.

270 U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016


P ropiedades psicomtricas del S troop , test de colores y
palabras en poblacin colombiana no patolgica

Golden, C. J. (1975). A group version of the Stroop Color European Journal of Education & Psychology, 5(1),
and Word Test. Journal of personality assessment, 39-51.
39(4), 386-388. Maureira, F., Aravena, C., Glvez, C., & Flores, E.
Golden, C. J. (1974). Sex differences in performance on (2014). Propiedades Psicomtricas y datos norma-
the Stroop Color and Word Test. Perceptual and tivos del test de stroop y del test torre de Hanoi
Motor Skills, 39(3), 1067-1070. en estudiantes de educacin fsica de Chile. Rev
Guttman, L. (1953). Image theory for the structure of GPU, 10(3), 344-349.
quantitative variates.Psychometrika, 18, 277-296. Montero, I., & Len, O. G. (2007). A guide for naming
Henao-Arboleda, E., Muoz, C., Aguirre-Acevedo, D. research studies in Psychology.International Jour-
C., Lara, E., Pineda, D. A., & Lopera, F. (2010). nal of Clinical and Health Psychology,7(3), 847-862.
Datos normativos de pruebas neuropsicolgicas Norman, G.R. & Streiner D.L. (1996). Bioestadstica.
en adultos mayores en una poblacin Colombiana. Madrid: Mosby-Doyma libros
Revista Chilena de Neuropsicologa, 5(3), 214-226. Ostrosky F, Ardila A, Rosselli M (1991). Evaluacin neu-
Henson, R. K., & Roberts, J. K. (2006). Use of explorato- ropsicolgica breve en espaol-NEUROPSI. Mxico:
ry factor analysis in published research: common Publingenio S.A.
errors and some comments on improved practice. Partington, J.E. & Leiter, R.G.(1949). Partington`s
Educational and Psychological Measurement, 66, Pathway Test. The Psychological Service Center
393-416. Bulleton. 1, 9-20
Horn, J. L. (1965). A rationale and test for the num- Perea Bartolom, M., & Ladera Fernndez, V. (1995).
ber of factors in factor analysis. Psychometrika, Rendimientos neuropsicolgicos: edad, educacin
30,179-185. y sexo. Psicothema, 7(1), 105-112.
Houston, B. K., &Jones, T. M. (1967). Distraction and Prez, M. (2009). Manual de Neuropsicologa Clnica.
Stroop Color Word Performance. Journal of Experi- Madrid: Pirmide.
mental Psychology, 74, 5456. Portellano, A. (2009). ENFEN Evaluacin Neuropsi-
Kaiser, H. F. (1960). The application of electronic com- colgica de las Funciones Ejecutivas en Nios. Ma-
puters to factor analysis.Educational and Psycho- drid: TEA Ediciones.
logical Measurement,20, 141-151. Regard, M. (1981). Cognitive rigidity and flexibility: A
Len, F. (2013). Proyecto Tesis de Maestra: Desarrollo de neuropsychological study. Unpublished Ph.D. dis-
un modelo de estndares de Prueba para uso de prue- ertation, University of Victoria
bas Psicolgicas en Colombia. Bogot: Universidad Reitan, R. M. (1992). Trail Making Test Manual for Ad-
Nacional de Colombia. ministratin and Scoring. Tucson: Reitan Neurop-
MacLeod, C. M. (1991). Half a century of research on sichology Laboratory.
the Stroop effect: An integrative review. Psycho- Rognoni, M. T., Casals-Coll, G., Snchez-Benavides, M.,
logical Bulletin, 109(2), 163-203. Quintana, R. M., Manero, L., Calvo, R., Palomo,
Malek, A., Hekmati, I., & Amiri, S. (2013). The Stan- F., Aranciva, F., Tamayo, J., & Pea-Casanova.
dardization of Victoria Stroop Color-Word Test (2013). Spanish normative studies in young adults
among Iranian Bilingual Adolescents. Archives of (NEURONORMA young adults project): Norms
Iranian Medicine, 380. for Stroop ColorWord Interference and Tower
Malhotra, N. (2004). Investigacin de mercados un en- of London-Drexel University tests. Neurologa
foque aplicado (cuarta edicin). Mxico: Pearson (English Edition), 28(2), 73-80. Recuperado de
educacin. http://www.elsevier.es/es-revista-revista-generica-
Martn, R., Hernndez, S., Rodrguez, C., Garca, E., 295-articulo-estudios-normativos-espanoles-po-
Daz, A., & Jimnez, J. E. (2012). Datos normativos blacion-adulta-90193606
para el Test de Stroop: patrn de desarrollo de la Ruiz, M. A., & San Martn, R. (1992). Una simulacin
inhibicin y formas alternativas para su evaluacin. sobre el comportamiento de la regla K1 en la esti-
macn del nmero de factores [The behavior of the

U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016 271


L uca C arlota R odrguez B arreto , N infa del C armen P ulido , C arlos A lejandro P ineda R oa

K1 rule estimating the number of factors: A study influence of age, sex, and education; and norma-
with simulated data]. Psicothema, 4(2), 543-550. tive data for a large sample across the adult age
Serra, A. & Pea, J. (2006). Fiabilidad test-retest e in- range. Assessment, 13(1), 62-79.
terevaluador del Test Barcelona.Neurologa,21(6), Widaman, K. F. (2007). Common factors versus com-
277-281. ponents: Principals and principles, errors and
Soares, S. (2009). Adaptacin del test de colores y palabras misconceptions. En R. Cudeck, & R. C. MacCal-
de stroop en una muestra portuguesa. Influencia de lum (Eds.). Factor analysis at 100: Historical devel-
la reserva cognitiva en la funcin ejecutiva de sujetos opments and future directions. Mahwah, NJ: LEA.
sanos y con enfermedad tipo alzheimer de inicio tardo. Wright, B. C., & Wanley, A. (2003). Adults versus chil-
Tesis indita. Salamanca: Universidad Salamanca. drens performance on the Stroop task: Interfer-
Stroop, J. R. (1935). Studies of interference in serial ence and facilitation. British Journal of Psychology,
verbal reactions. Journal of experimental psychology, 94(4), 475-485.
18(6), 643-662.
Van der Elst, W., Van Boxtel, M. P., Van Breukelen, G.
J., & Jolles, J. (2006). The Stroop Color-Word Test

272 U n i v e r s i ta s P s yc h o l o g i c a V. 15 No. 2 a b r i l-j u n i o 2016

También podría gustarte