Está en la página 1de 12

Revista Iberoamericana de Neuropsicología, Vol. 3, No. 1: 29-40, enero-junio, 2020.

Principios básicos en estadística para


neuropsicólogos clínicos e investigadores:
utilidad práctica e interpretación de análisis de
variables continuas

Javier Oltra-Cucarella1, Ph.D., Diego Rivera2, Ph.D.,


Juan Carlos Arango-Lasprilla3,4,5, Ph.D.

Resumen

Objetivo. La calidad de la evaluación neuropsicológica y el seguimiento de programas de


rehabilitación se apoyan en gran medida en tests, escalas e inventarios neuropsicológicos.
Sin embargo, la interpretación de las pruebas estadísticas utilizadas en investigación neu-
ropsicológica puede ser difícil para muchos neuropsicólogos. El objetivo de este trabajo es
proporcionar un texto científico de consulta para los neuropsicólogos interesados en la re-
alización de estudios de investigación y en la interpretación de resultados científicos.

Método. Se realiza una revisión y explicación detallada de diferentes análisis es-


tadísticos relacionados con variables continuas, utilizando ejemplos de estudios
científicos relacionados con la neuropsicología.

Resultados. Con el presente trabajo los clínicos y los investigadores conocerán de


manera pormenorizada los fundamentos y la interpretación de los análisis estadísti-
cos relacionados con diferencias de medias, análisis de varianza, correlaciones y re-
gresión lineal.

Conclusión. El presente trabajo pretende ser una herramienta de consulta rápida


para clínicos e investigadores interesados en interpretar y realizar investigaciones
científicas con personas con daño neurológico. Los profesionales interesados en pro-
fundizar en el estudio de cada una de las técnicas deberán acceder a textos especial-
izados donde se explique cada técnica de manera más pormenorizada.
Palabras clave:

Análisis de datos; estadística; investigación;


modelo lineal general; neuropsicología

Autor de correspondencia:
1
Departamento de Psicología de la Salud, Universidad Miguel Hernández de Elche, Avda de la Uni-
versidad s/n Edificio Altamira, 03202 Elche (Alicante, España).
2
Departamento de Ciencias de la Salud, Universidad Pública de Navarra. Campus Arrosadia, s/n. 31006.
Dr. Juan Carlos Arango-Lasprilla
Pamplona, España.
BioCruces Bizkaia Health Re- 3
BioCruces Bizkaia Health Research Institute, Cruces University Hospital Barakaldo, Bizkaia, Spain. 48903.
search Institute 4
IKERBASQUE. Basque Foundation for Science, Bilbao, Spain. 48013.
Cruces University Hospital 5
Department of Cell Biology and Histology, University of the Basque Country UPV/EHU, Leioa,
48903 Barakaldo, Bizkaia, Spain. Spain. 48940
30 Revista Iberoamericana de Neuropsicología  Vol. 3, No. 1, enero-junio 2020.

INTRODUCCIÓN neuropsicológicos. De igual modo, es necesario sa-


ber cómo calcular las desviaciones estándar, puesto
La neuropsicología es un área de la psicología en- que determinados criterios diagnósticos de algunas
cargada de estudiar la relación entre el funciona- patologías (p. ej. deterioro cognitivo leve, demen-
miento cerebral y el comportamiento humano, tan- cias) exigen que el rendimiento del paciente se si-
to en personas sanas como en personas que han túe determinadas desviaciones estándar por debajo
sufrido algún tipo de daño cerebral1–3. En la actuali- de la media8. A su vez, el clínico debe tener cono-
dad la labor del neuropsicólogo cobra cada vez más cimiento sobre la mayor probabilidad que se tiene
importancia no sólo por su capacidad para evaluar de obtener puntuaciones bajas al aplicar una bate-
y diagnosticar a pacientes con daño cerebral, sino ría de pruebas más o menos larga. Esto es, cuantas
también por su papel activo y relevante en el proce- más pruebas se administren, mayor probabilidad de
so rehabilitador4. obtener puntuaciones bajas, al margen de ser sig-
no o no de deterioro de alguna función cognitiva9–11.
La calidad de la evaluación neuropsicológica
y el seguimiento de programas de rehabilitación Otro de los puntos clave en la labor como neu-
se apoyan en gran medida en tests neuropsicoló- ropsicólogo es saber si la intervención está dan-
gicos, escalas e inventarios. Estos deben cumplir do resultados positivos. Esto es, el clínico necesita
con ciertas características tales como adecuada saber si su intervención está favoreciendo la recu-
validez y fiabilidad, adaptación cultural y disposi- peración del paciente, su mayor integración en los
ción de datos normativos5. Estas características diferentes ámbitos de la vida diaria: familia, escue-
son esenciales puesto que de ello dependerá la la, trabajo, etc. Actualmente existen herramientas
adecuada interpretación de la puntuación de una estadísticas que permiten conocer el cambio en el
persona3,5. Los datos normativos ajustados por rendimiento neuropsicológico del paciente12, pero
características demográficas han llegado a ser de se requiere de conocimiento estadístico para su
gran uso y de administración rutinaria en neurop- correcto uso.
sicología. En general se pueden encontrar normas
corregidas por edad y nivel educativo, aunque en Por otra parte, desde los años 30 del siglo pa-
algunos casos también se corrige según el sexo. sado (1929), la psicología se ha caracterizado por
Actualmente se reconoce la importancia de gene- ser una ciencia que realiza sus aportes científicos
rar, adicionalmente, normas según grupos defini- a partir de análisis estadísticos basados en grupos
dos por raza/origen étnico5–7. muestrales (n>1) gracias a los aportes de Fischer13.
Los conocimientos estadísticos permiten a los clí-
Sin embargo, la adecuada interpretación final nicos entender los avances que se están realizando
de los datos recopilados para conseguir un diag- bien en evaluación y diagnóstico, bien en rehabilita-
nóstico clínico siempre depende del juicio clínico. ción, cuando acuden a revistas científicas. Esto es,
Esto es, los tests neuropsicológicos, las escalas e les permitirá leer un artículo de manera crítica y de-
inventarios, y las técnicas de observación son he- terminar si es útil para su práctica clínica. Por ejem-
rramientas que sirven de ayuda para que el clínico plo, conocer si la muestra con la que se ha realizado
pueda realizar su labor. Esto supone que, además el estudio puede ser equivalente a la población a la
de los conocimientos clínicos, los neuropsicólogos que atiende, valorar si una prueba cumple con los
deben adquirir a su vez conocimientos en estadís- requisitos mínimos de fiabilidad o validez, interpre-
tica para poder realizar de manera adecuada su la- tar los valores de las pruebas estadísticas (valores
bor. Por ejemplo, el conocimiento de la estadística t, F, r, etc.), dominar conceptos como tamaño del
permite una adecuada interpretación y equivalen- efecto, cambios estadísticamente significativos,
cia de las diferentes distribuciones y las puntua- cambios clínicamente significativos, etc.
ciones derivadas, tales como las puntuaciones z,
puntuaciones t, puntuaciones CI, entre otras, usa- Sin embargo, adquirir una alfabetización en es-
das para la calificación e interpretación de los tests tadística no siempre es una tarea fácil14, y a pesar de
Principios básicos en estadística para neuropsicólogos clínicos e investigadores: utilidad práctica... 31

que desde las universidades se admite su importan- encontrada si la hipótesis nula (de μ2 – μ1 = 0 en la
cia para la formación del psicólogo y se incluye en población) es cierta17.
el currículum formativo de los grados de psicolo-
gía, no suele contar con la valoración positiva de los Sin embargo, el estadístico que está tomando
estudiantes15,16. Esto puede deberse a que esta asig- mayor importancia frente al valor de p es el ta-
natura es impartida por estadísticos sin experien- maño del efecto, el cual indica la magnitud de las
cia en el ámbito de la psicología o neuropsicología, diferencias con independencia de la significación
por lo que el alumnado no ve una conexión entre estadística. El estadístico del tamaño del efecto
el conocimiento estadístico y su uso para la prácti- más utilizado para la diferencia de medias es la d
ca clínica. Además, por lo general se acude a textos de Cohen18 el cual indica cuántas desviaciones típi-
complejos con terminología altamente técnica, lo cas se desvía la media de un grupo respecto de la
que en muchas ocasiones desmotiva y,/o no permi- media del otro grupo. No obstante, se han calcula-
ten una adecuada adquisición de las herramientas do estimadores insesgados para muestras peque-
estadísticas por parte del psicólogo. ñas19. Siguiendo las guías de Cohen, las diferencias
de medias se interpretan como pequeñas, mode-
El objetivo del presente trabajo es presentar radas o grandes cuando el valor de d es igual o su-
una guía sencilla de algunas de las pruebas esta- perior a 0.20, 0.50 y 0.80 respectivamente. Como
dísticas más usadas en investigación neuropsico- indicador adicional, se puede conocer el porcen-
lógica. La finalidad del presente texto es servir de taje de solapamiento entre las distribuciones de
consulta rápida por parte de los clínicos y los in- puntuaciones en las dos muestras a partir del va-
vestigadores interesados en analizar e interpretar lor de la d de Cohen20.
datos derivados de estudios científicos. Para un
conocimiento más exhaustivo de las técnicas es- La importancia del tamaño del efecto es que
tadísticas se remite al lector a los manuales de re- indica si es interesante tomar en consideración la
ferencia citados a lo largo del texto. asociación entre variables. Por ejemplo, un tamaño
del efecto demasiado grande podría indicar que esa
ANÁLISIS ESTADÍSTICOS Y NEUROPSICOLOGÍA variable diferencia suficientemente entre grupos y
no es necesario incluirla como variable de estudio
Comparación de medias: dos grupos (p.ej., la diferencia de peso entre niños de 4 años y
adultos de 30). Por su parte, un tamaño del efecto
En ocasiones los neuropsicólogos están intere- demasiado pequeño, o incluso insignificante, indica
sados en conocer si las puntuaciones medias que que la distribución de frecuencias entre los grupos
obtiene un grupo de participantes en una variable se solapa tanto que no es útil para diferenciar entre
(M1) son diferentes de las puntuaciones medias que los grupos (p.ej., la diferencia de peso entre perso-
obtiene otro grupo de participantes en esa misma nas de 20 años y personas de 22 años).
variable (M2). La variable bajo estudio se denomina
variable dependiente (VD), mientras que los grupos Como ejemplo, Garcia-Diaz y sus colaborado-
de comparación son la variable independiente (VI). res21 administraron una tarea de velocidad de pro-
Mediante una prueba de comparación de medias se cesamiento de la información a una muestra de 20
resta la media de un grupo de la media del otro gru- personas mayores cognitivamente sanas [Media
po, y se divide el resultado entre el error estándar (M) = 46.90, Desviación Típica (DT) = 10.26] y a
de esa diferencia (esto es, se estandariza). Poste- una muestra de 36 personas con Enfermedad de
riormente se compara la diferencia estandarizada Parkinson (M = 32.60, DT = 22.04) y deterioro cog-
con una tabla de frecuencias de la que se obtiene nitivo leve. La VD es el número de ítems correctos
el valor de probabilidad (o valor de p). Estadística- tras 90 segundos. La prueba t para muestras inde-
mente, el valor de p asociado a la diferencia estan- pendientes indica que la diferencia en las medias
darizada indica la probabilidad de encontrar una entre los dos grupos es estadísticamente signifi-
diferencia entre medias igual o más extrema que la cativa (t = 2.73, p = 0.008), lo que sugiere que las
32 Revista Iberoamericana de Neuropsicología  Vol. 3, No. 1, enero-junio 2020.

personas con Enfermedad de Parkinson y dete- se analiza la diferencia entre medias de los grupos,
rioro cognitivo leve identifican menos ítems en la lo que se considera un reflejo de la diferencia en-
misma prueba durante el mismo periodo de tiem- tre los grupos más el error. Si las dos estimaciones
po. La conclusión principal de este análisis es que de varianza no difieren considerablemente, es de-
las personas con Enfermedad de Parkinson y dete- cir, si la varianza entre-grupos es similar a la varian-
rioro cognitivo leve presentan un enlentecimiento za intra-grupos, se concluye que todas las medias
en la velocidad de procesamiento. provienen de la misma distribución de medias y que
cualquier pequeña diferencia se debe al error de
El estadístico d de Cohen para estos estadísti- muestreo. Por el contrario, si las medias de los gru-
cos es igual a 0.83, lo que indica un tamaño del pos difieren más de lo esperable, se puede concluir
efecto de moderado a grande. Asimismo, una d = que esas medias provienen de diferentes distribu-
0.83 se asocia con un porcentaje de solapamiento ciones y se rechaza la hipótesis nula de igualdad de
de alrededor del 50%, lo que indica que aproxima- medias23. Sin embargo, el ANOVA que indica que las
damente el 50% de las puntuaciones en el gru- medias no son iguales entre los grupos no indica
po con Enfermedad de Parkinson está por debajo entre qué grupos existen diferencias. Para ello es
de la puntuación más baja observada en el grupo necesario realizar pruebas adicionales.
cognitivamente sano.
En cuanto al tamaño del efecto relacionado
Es importante saber que aumentando los ta- con el ANOVA, el más utilizado es η2 parcial (eta
maños muestrales se reduce el error de medida cuadrado parcial), que indica la varianza en la VD
y, por tanto, la desviación típica, lo cual tiene un atribuible al efecto de interés más el error23. El ta-
impacto en el tamaño del efecto. Aunque la dife- maño del efecto relacionado con η2 parcial para
rencia puede ir en cualquier dirección, el aumen- cada variable independiente es de 0.010, 0.058 y
to del tamaño muestral suele estar asociado a una 0.137 para un tamaño del efecto pequeño, mode-
reducción del tamaño del efecto, lo que indica que rado y grande respectivamente24.
los estadísticos del tamaño del efecto asociados a
un valor de p menor de 0.05 y obtenidos en mues- Como ejemplo, Smith, Dawes, Smith y Pal25 com-
tras pequeñas no son fiables, por lo que deben in- pararon el procesamiento auditivo entre un grupo
terpretarse con mucha cautela22. de 40 niños y adolescentes con epilepsia rolándica
(G1), un grupo de 32 de los hermanos de los miem-
Comparación de medias: varios grupos bros del G1 (G2) y un grupo de 99 de los padres de
los participantes del G1 (G3). Mediante escucha di-
Cuando lo que se pretende es comparar las pun- cótica se presentaba una palabra en cada oído de
tuaciones en una misma VD entre más de dos gru- manera simultánea, y se les solicitaba que repitieran
pos, la prueba utilizada es el análisis de varianza la palabra que se les presentaba en uno u otro oído.
(ANOVA) de un factor. En el ANOVA se cambia el Las puntuaciones (y su DT) de los grupos G1, G2 y
término VI por el término factor, siendo el factor G3 fue de 7.3 (3.8), 7.6 (3.7) y 8.9 (2.8) respectiva-
la variable relacionada con los grupos. En el ANO- mente. Los datos indican que la variabilidad dentro
VA, la hipótesis nula es que todas las medias son de los grupos es ligeramente inferior en el G3, y que
iguales entre ellas (i.e., μ = μ2 = μk, donde k es el las medias son similares entre los grupos G1 y G2. El
número de grupos). ANOVA indica que la variabilidad entre las medias es
superior a la esperable según la variabilidad debida
El ANOVA se basa en dos estimaciones de varian- al error de muestreo (F = 4.3, p = 0.015), con lo que
za . Por un lado, se analiza la varianza dentro de
23
se concluye que existen diferencias entre los gru-
cada grupo, esto es, si las puntuaciones dentro de pos en la tarea de memoria. El ANOVA no permite
cada grupo son similares o presentan una marcada conocer entre qué grupos ocurren las diferencias,
dispersión. Esta varianza intra-grupo se considera pero pruebas post-hoc mostraron que los grupos
varianza aleatoria o varianza de error. Por otro lado, G1 y G2 obtuvieron puntuaciones significativamente
Principios básicos en estadística para neuropsicólogos clínicos e investigadores: utilidad práctica... 33

más bajas que el G3, sin diferencias entre los grupos uno de los grupos (F1) obtiene una puntuación di-
G1 y G2. El estadístico η2 parcial es de 0.38, lo que in- ferente en función de la edad (F2). Los análisis mos-
dica que el 38% de la varianza en la puntuación del traron un efecto principal del grupo (F = 20.30, p <
test de escucha dicótica se asocia con la pertenen- 0.001) y un efecto principal de la edad (F = 8.02, p
cia a uno de los grupos. = 0.005). También se encontró una interacción sig-
nificativa (F = 3.95, p = 0.048), indicando que las
Extensión del Análisis de Varianza: ANOVA de personas mayores que habían sufrido un TCE pre-
dos factores sentaban la menor independencia vocacional. Esta
independencia vocacional era menor que la en-
Una de las particularidades del ANOVA es que es contrada en las personas mayores con daño orto-
una técnica versátil que permite ampliar los aná- pédico y menor que las personas más jóvenes con
lisis considerablemente. La primera extensión del independencia del daño que hubieran sufrido.
ANOVA es la introducción de uno o más factores
en el análisis. Así, el ANOVA permite analizar si las Análisis de covarianza
diferencias en la variable dependiente se deben a
un factor, a otro factor o la interacción entre am- La segunda ampliación del ANOVA es que permite
bos. En el caso más simple se incluyen dos facto- incluir el efecto de una tercera variable, en este
res, lo que permite conocer dos efectos simples caso continua, en el análisis de la relación entre
y un efecto de interacción. Los efectos simples factores y la VD. Cuando se incluye una variable
indican si las diferencias en la VD se deben a los continua (denominada covariable) en un análisis
efectos de cada uno de los factores considerados de varianza, la nomenclatura cambia a Análisis de
de manera aislada. La interacción, por el contrario, Covarianza (ANCOVA). En el ANCOVA, se analiza la
indica si las diferencias entre los diferentes niveles relación entre factores y VD después de ajustar los
de un factor se repiten en los diferentes niveles valores de la VD en función de las diferencias en
del otro factor23. la covariable introducida (y que correlaciona con
la VD)23. Mediante el ANCOVA, se ajustan las me-
Como ejemplo, Testa, Malec, Moessner y dias de los grupos en la VD al valor que tomaría
Brown26 analizaron la relación entre la edad y el esta VD si todos los sujetos puntuaran igual en la
tipo de daño en la independencia en tareas re- covariable, por lo que las diferencias existentes se
lacionadas con el trabajo. Para ello, reclutaron a deben únicamente a los factores introducidos en
195 personas con traumatismo craneoencefálico el análisis (más otros desconocidos que no se han
(TCE) y 82 personas con daño físico de tipo or- podido controlar). Esto indica que los efectos de
topédico. Los participantes de ambos grupos fue- la covariable en el ANCOVA se basan en una regre-
ron, a su vez, separados en dos grupos de edad: de sión lineal (ver más abajo).
18 a 49 años, y de 50 a 89 años. La VD en este estu-
dio fue la puntuación en el cuestionario Vocational Como ejemplo, Wobrock y sus colaboradores27
Independence Scale. Este diseño incluye dos facto- compararon el rendimiento en tareas de funcio-
res: el factor Grupo (F1) y el factor Edad (F2). El nes ejecutivas entre un grupo de 11 personas con
análisis del factor simple F1 permite conocer si el primer episodio de esquizofrenia, 13 personas con
rendimiento difiere, de manera general, entre per- esquizofrenia crónica, 18 personas con trastorno
sonas con TCE y personas con daño ortopédico. bipolar y 23 controles sanos. La VD es el núme-
Por otro lado, el análisis del factor simple F2 per- ro de intentos administrados en el Wisconsin Card
mite conocer si el rendimiento difiere, de manera Sorting Test (WCST). Para realizar el ANCOVA com-
general, en pacientes más mayores en compara- pararon la puntuación en el WCST ente los grupos
ción con pacientes más jóvenes. controlando el sexo, la edad y el nivel educativo.
En este ANCOVA introdujeron dos factores cate-
Lo más interesante, sin embargo, es la interac- góricos (grupo y sexo) y dos covariables (edad y
ción entre factores, que en este caso mostraría si nivel educativo). Los resultados mostraron que,
34 Revista Iberoamericana de Neuropsicología  Vol. 3, No. 1, enero-junio 2020.

controlando por edad, sexo y nivel educativo, exis- estables en un periodo de tres años. Este diseño
tían diferencias significativas en el WCST, con el incluyó una variable entre-sujetos con dos niveles
grupo de controles sanos realizando la tarea en un (factor Grupo, F1) y una variable intra-sujetos (fac-
menor número de intentos (M = 88.45, DT = 16.77) tor Tiempo, F2) con dos niveles: puntuaciones en la
en comparación con las personas con primer epi- última serie de recuerdo inmediato vs. puntuacio-
sodio de esquizofrenia (M = 110.91, DT = 18.56), las nes en el recuerdo diferido.
personas con esquizofrenia crónica (M =104.09,
DT = 18.42) y las personas con trastorno bipolar El ANOVA de medidas repetidas mostró un
(M = 103.25, DT = 20.92). Los autores no indicaron efecto principal del factor grupo (F = 79.03, p <
el efecto de la edad o el nivel educativo sobre la 0.001), un efecto principal del factor tiempo (F =
VD, por lo que no es posible conocer si las puntua- 330.8, p < 0.001), y una interacción significativa (F
ciones en el WCST disminuyeron en función de la = 9.33, p < .001). En cuanto al factor grupo, los
edad o los años de escolaridad. controles sanos obtuvieron en global puntuacio-
nes superiores a los dos grupos con DCL, mien-
ANOVA de medidas repetidas tras que las personas con DCL que progresaron a
Enfermedad de Alzheimer obtuvieron puntuacio-
La tercera ampliación del ANOVA, y quizá de las nes en global significativamente más bajas que las
más importantes para interpretar estudios sobre personas con DCL que se mantuvieron estables.
intervenciones cognitivas en personas con daño En cuanto al factor tiempo, las puntuaciones en la
neurológico, es el análisis de una VD en varios mo- última serie del recuerdo inmediato fueron, en ge-
mentos temporales (intra-sujetos), manteniendo neral y contando con todos los grupos, mayores
la posibilidad de incluir tanto factores entre-suje- que las puntuaciones en el recuerdo diferido.
tos como covariables. En este caso, denominado
ANOVA de medidas repetidas (o ANOVA mixto si Lo más importante en este diseño, sin embar-
incluye factores entre-sujetos y factores intra-su- go, es la interacción entre factores. La interacción
jetos), se analizan tanto los efectos de los factores entre grupo y tiempo mostró que las personas en
simples como la interacción entre factores, como los dos grupos con DCL mostraron una pérdida en-
se describe en la sección dedicada al ANOVA de tre la última serie del recuerdo inmediato y la serie
dos factores. La diferencia fundamental entre el de recuerdo diferido similar (p = 0.07), significati-
ANOVA de dos factores y el ANOVA de medidas vamente más marcada que la encontrada en el gru-
repetidas es la independencia de los datos. En el po de controles sanos (ps < 0.001). Por lo tanto,
ANOVA de dos factores entre-sujetos, cada fac- la interacción significativa entre factores muestra
tor incluye datos de dos grupos diferentes y, por que lo que ocurre en alguno de los grupos de un
tanto, independientes23. En el caso del ANOVA de factor no ocurre en alguno de los grupos del otro
medidas repetidas, el factor intra-sujetos incluye factor. En un estudio de intervención, se escogen
valores obtenidos en los mismos sujetos en varios dos grupos de personas con patología neurológica.
momentos diferentes (p.ej., antes y después de la A uno de los grupos se le realiza una intervención
intervención), por lo que los datos están relacio- cognitiva, mientras que el otro grupo no la recibe, y
nados entre sí y no son independientes. ambos grupos son evaluados con las mismas prue-
bas en los mismos momentos temporales (antes y
Como ejemplo, De Simone, Perri, Fadda, Calta- después de la intervención en el grupo experimen-
girone y Carlesimo28 analizaron el rendimiento de tal). El investigador está interesado en encontrar
80 personas con Deterioro Cognitivo Leve (DCL) una interacción significativa entre los factores gru-
y 62 controles sanos en una tarea de memoria ver- po y tiempo, de manera que las puntuaciones en
bal. El grupo DCL fue, a su vez, dividido en dos un grupo antes y después sean diferentes a las del
grupos: un grupo de 39 personas con DCL que otro grupo. Si el grupo sin intervención se mantie-
progresaron a Enfermedad de Alzheimer y un gru- ne estable, se espera que el grupo con intervención
po de 41 personas con DCL que se mantuvieron mejore; si el grupo sin intervención empeora, se
Principios básicos en estadística para neuropsicólogos clínicos e investigadores: utilidad práctica... 35

espera que el grupo con intervención mejore o se relacionadas con la memoria, la fluencia verbal, el ra-
mantenga estable. zonamiento y la flexibilidad cognitiva en 165 personas
mayores cognitivamente sanas. Sus resultados mos-
Análisis de asociación: Correlaciones traron que la edad correlacionó de manera significa-
tiva con la velocidad de procesamiento (r = -0.36),
En ocasiones los investigadores están interesados la memoria (r = -0.24), la fluencia verbal (r = -0.15),
en conocer si los cambios en una variable continua el razonamiento (r = -0.43) y la flexibilidad cogniti-
se relacionan con cambios en otra variable conti- va (r = -0.40). El signo negativo de las correlaciones
nua, dentro de un grupo. En este caso, los análisis indica que las puntuaciones en los diferentes tests
de correlaciones bivariadas (dos variables) permi- cognitivos disminuía conforme aumentaba la edad.
ten conocer si el aumento o disminución en los va- En cuanto a la velocidad de procesamiento, los re-
lores de una variable se asocian con un aumento sultados mostraron una asociación significativa con
o una disminución en los valores de otra variable23. la memoria (r = 0.47), la fluencia verbal (r = 0.62),
Las correlaciones bivariadas más utilizadas en in- el razonamiento (r = 0.64) y la flexibilidad cognitiva
vestigación son la r de Pearson, para variables que (r = 0.34). El signo positivo de las correlaciones indi-
se distribuyen normalmente, y la Rho de Spearman ca que las puntuaciones en los diferentes tests au-
para variables que no se distribuyen normalmente. mentaban conforme aumentaban las puntuaciones
en tests de velocidad de procesamiento. Sin embar-
El estadístico de correlación puede tomar va- go, pese a la significación estadística, las medidas de
lores entre ±1. Los valores positivos indican que el tamaño del efecto indican que la relación entre va-
aumento en los valores de una variable se asocia riables es generalmente baja, explicando porcentajes
con el aumento en los valores de la otra variable. de varianza entre el 2.25% y el 22%. Las asociaciones
Los valores negativos de r indican que los valores más importantes se encontraron entre la velocidad
de una variable disminuyen conforme aumentan de procesamiento y la fluencia verbal (r2 = 38.4%),
los valores de la otra variable. Una correlación no por un lado, y la velocidad de procesamiento y el ra-
significativa o con valores cercanos a 0 indica que zonamiento por otro (r2 = 41%).
no existe asociación entre variables y, por tanto,
los cambios en una variable no tienen relación con Análisis de asociación: regresión lineal
los cambios en la otra variable.
Los análisis de correlación indican la asociación
El tamaño del efecto indica una asociación pe- entre dos variables continuas, esto es, cómo los
queña, moderada o grande para valores r = 0.10, r cambios en una variable afectan a otra variable. Si
= 0.30 y r = 0.50 respectivamente18. Por otra par- dos variables están relacionadas se puede prede-
te, el cuadrado de la correlación (r2) indica la pro- cir, con cierto grado de confianza, los valores de
porción de varianza en una variable explicada por una variable en función de los valores de la otra
la otra variable, y puede tomar valores entre 0 y 1. variable. Este análisis de predicción se realiza a tra-
Cuanto mayor es la varianza explicada más cerca- vés de análisis de regresión30. Cuando la variable
no es r2 a 1, mayor es la asociación entre variables y dependiente que se quiere predecir, denominada
mejor pueden predecirse los valores de una varia- criterio, es una variable continua el análisis ade-
ble en función de las puntuaciones en la otra varia- cuado es la regresión lineal. Las variables indepen-
ble23. Es muy importante tener presente que, como dientes utilizadas para predecir la variable criterio,
en el caso de las diferencias de medias, los análisis denominadas predictores, pueden ser variables
de correlación indican asociación, pero en ningún categóricas y variables continuas.
caso causalidad.
Los análisis de regresión se utilizan para respon-
Como ejemplo, Borghesani y sus colaboradores29 der a dos cuestiones generales de investigación30.
analizaron la asociación entre la edad y la velocidad En primer lugar, aportan información acerca de la
de procesamiento con otras variables cognitivas asociación de variables. Si se utiliza una variable
36 Revista Iberoamericana de Neuropsicología  Vol. 3, No. 1, enero-junio 2020.

dicotómica como predictor de una variable conti- funcional. La variable dependiente en el análisis
nua, el coeficiente asociado al predictor es igual al de regresión fue el tiempo de estancia (en valo-
que se obtendría con un análisis de diferencia de res logarítmicos), con el que los autores preten-
medias. En segundo lugar, los coeficientes obteni- dían conseguir la normalidad de la distribución de
dos en los análisis de regresión son útiles para pre- los datos. Aunque no es el objetivo del presente
decir los valores de la variable criterio a partir de trabajo, esta transformación indica que los auto-
los valores del conjunto de variables predictoras. res malinterpretaron los supuestos del análisis de
regresión. Según el Modelo Lineal General son los
Dos son los estadísticos más relevantes para los residuos, y no las variables, quienes deben distri-
investigadores en un análisis de regresión lineal. Los buirse normalmente32.
estadísticos relacionados con cada predictor se de-
nominan coeficientes, e indican el cambio medio Los resultados indicaron que el tiempo medio
en la variable criterio por cada aumento de una uni- de estancia fue de 11 días (DT = 14). La mayoría de
dad en la variable predictora. Cuando hay dos o más los pacientes (62%) sufrió un ictus por oclusión de
predictores, el coeficiente de cada predictor indica pequeño vaso, seguido de aterosclerosis (25%) y
el cambio medio en la variable criterio por cada au- cardioembolismo (12%). La mayoría de los pacien-
mento de una unidad en el predictor manteniendo tes (81%) ingresó dentro de las primeras 24 horas
el resto de predictores constantes. El segundo es- tras el ictus. De los 330 pacientes, 17 (5%) murie-
tadístico relevante es R2, que indica el porcentaje de ron durante la hospitalización aguda, 86 (26%)
varianza de la variable criterio que se explica por la fueron trasladados al servicio de rehabilitación in-
combinación de predictores. R2 puede tomar valo- tensiva, y 227 (69%) fueron dados de alta y regre-
res entre 0 y 1. Los valores más cercanos a 1 indican saron a su residencia habitual u otros servicios de
una relación absoluta entre predictores y criterio, atención médica.
mientras valores cercanos a 0 indican que no existe
asociación entre la variable criterio y los predicto- Los datos del análisis de regresión se presen-
res. R2 es útil para calcular el tamaño del efecto del tan en la tabla 3-1. El tiempo de estancia aumentó
modelo, con valores de 0.02, 0.13 y 0.26 indicando en hombres respecto a mujeres, en no-fumado-
un tamaño del efecto pequeño, moderado y grande res respecto a fumadores, en los casos con mayor
respectivamente18. gravedad, en casos con mayor dependencia fun-
cional y en los casos con tipo de ictus diferente a
Como ejemplo, Chang y sus colaboradores31 la oclusión de pequeño vaso.
analizaron el tiempo de estancia hospitalaria en
330 pacientes con primer ictus isquémico. Con Sin embargo, lo relevante de los análisis de re-
el fin de identificar variables relacionadas con el gresión es que no solo indican si existe una re-
tiempo de estancia recogieron datos sobre el sexo lación estadísticamente significativa, sino que
del paciente, la edad, la gravedad del ictus, inde- aportan la posibilidad de conocer cuál es la aso-
pendencia funcional, tiempo pasado desde el ic- ciación de cada predictor con la variable criterio
tus (<24h o >24h), comorbilidad (hipertensión, controlando el resto de predictores. En el ejemplo
diabetes mellitus, hipercolesterolemia), tabaquis- de la tabla 1 se observa que los hombres presentan
mo, problemas cardiacos, subtipo de ictus (oclu- una estancia media 1.24 días superior que las mu-
sión de pequeño vaso o no), y niveles de colesterol jeres cuando se controlan los demás predictores.
y triglicéridos. La gravedad del ictus se analizó me- Respecto a la historia de tabaquismo, la estancia
diante la escala National Institutes of Health Stroke media se reduce de media en 0.84 días en los fu-
Scale (NIHSS), con un rango de 0 a 38 y mayores madores respecto a los no-fumadores.
puntuaciones indicando mayor gravedad. La inde-
pendencia funcional se analizó mediante el Índice Además de la asociación entre predictores y va-
de Barthel Modificado (rango 0-20), en el que ma- riable criterio, los análisis de regresión permiten
yores puntuaciones indican mayor independencia predecir los valores de la variable criterio a partir
Principios básicos en estadística para neuropsicólogos clínicos e investigadores: utilidad práctica... 37

Tabla 3-1. Regresión lineal sobre tiempo de estancia hospitalaria


Predictores Coeficiente β Error estándar p
Sexo (0=mujer) 0.212 0.073 .004
Tabaquismo -0.178 0.088 .043
NIHSS 0.060 0.018 .001
NIHSS cuadrático -0.002 0.000 .001
MBI -0.020 0.010 .042
Oclusión de pequeño vaso -0.436 0.080 <.001
Constante (Intercept) 2.019 0.339 <.001
Error de estimación: 3.186. R = 36.9%. Significación del modelo <.001. La constante (o intercept en
2

inglés), se interpreta como la puntuación media en la variable criterio cuando la puntuación en todas
las variables predictoras es 0. Tomado de Chang et al., 2002.

de los diferentes valores de los predictores. En el análisis de residuos es esencial para comprobar la
caso del ejemplo de la tabla 3-1, se podría predecir adecuación del modelo. Aunque el tamaño de la
la estancia hospitalaria con la fórmula: muestra no modifica los coeficientes asociados a
cada predictor, las muestras pequeñas se asocian
Ŷ𝑖=β1 * X𝑖1 + β2 * X𝑖2 + βj * X𝑖j + ε𝑖j con mayores residuos y, por tanto, un mayor error
de la predicción, lo cual puede llegar a invalidar la
donde Ŷ𝑖 es la puntuación predicha para el su- utilidad para predecir la variable criterio con esos
jeto 𝑖, βj es el coeficiente de la variable j, X𝑖j es la predictores32,33.
puntuación del sujeto 𝑖 en la variable j, y ε𝑖j es el
error. Utilizando los valores de la tabla 1, la predic- DISCUSIÓN
ción del tiempo de estancia hospitalaria para un
varón fumador con una puntuación NIHSS=10, una La estadística es una herramienta fundamental para
puntuación en el Índice de Barthel=15, y diagnós- el correcto desarrollo de la neuropsicología como
tico de ictus por oclusión de pequeño vaso sería: especialidad clínica para la evaluación, el diagnósti-
co y la intervención en patologías neurológicas. Sin
Ŷ𝑖 = 2.019 + (0.212 * 1)- (0.178 * 1) + (0.060 * 10) - embargo, dominar conceptos estadísticos puede
(0.002*102 ) - (0.020 * 15) - (0.436 * 1) = 1.717 llegar a ser complejo para muchos neuropsicólo-
gos14–16. Esta dificultad provoca que muchos profe-
Puesto que la variable criterio era el logaritmo sionales no cuenten con las herramientas necesa-
del tiempo de estancia, hay que invertir el valor del rias para interpretar correctamente los resultados
logaritmo (e1.717), lo cual indica que la estancia hos- de los estudios científicos a partir de los cuales fun-
pitalaria en este paciente ascendería a 5.57 días. damentar la elección de pruebas para la evaluación
neuropsicológica, la interpretación de los resulta-
Las diferencias entre los valores reales y los dos obtenidos en las pruebas seleccionadas, la elec-
valores predichos por el modelo de regresión en ción de las técnicas de intervención más eficaces, o
cada individuo se conocen como residuos, e in- la interpretación de los resultados tras la aplicación
dican si las predicciones del modelo son adecua- de diferentes intervenciones cognitivas. El presente
das. Cuanto mayores son los residuos, menor es trabajo pretende proporcionar a los neuropsicólo-
la capacidad predictora del modelo y mayor es el gos que desarrollan labores clínica e investigadora
error23. Es importante que los investigadores ten- una herramienta de consulta rápida para la elección
gan en cuenta que, en los análisis de regresión, el de las herramientas estadísticas más adecuadas en
38 Revista Iberoamericana de Neuropsicología  Vol. 3, No. 1, enero-junio 2020.

función de la pregunta de investigación que preten- un verdadero deterioro cognitivo a través de valores
dan responder. como la sensibilidad y la especificidad34.

Con ayuda del presente trabajo, los neuropsi- Como resumen, el presente trabajo pretende ser
cólogos pueden consultar de manera rápida y sen- una herramienta de consulta rápida para clínicos
cilla los análisis estadísticos utilizados en trabajos e investigadores interesados en interpretar y rea-
de investigación de su interés, y conocer si las téc- lizar investigaciones científicas con personas con
nicas utilizadas son adecuadas. Asimismo, pueden daño neurológico, de una manera sencilla y asocia-
identificar de manera rápida si los estudios consul- da a ejemplos prácticos fácilmente comprensibles.
tados incluyen la información relevante asociada a De esta manera, se puede convertir en un texto de
los valores de significación estadística y tamaños consulta tato para estudiantes de psicología como
del efecto. De esta manera, les facilita la interpre- para profesionales que desarrollen su labor en uni-
tación de la importancia de los resultados desde dades de neuropsicología. No obstante, la consul-
un punto de vista estadístico (significación) y clí- ta de este texto debe ser solo el primer paso para
nico (tamaño del efecto). un conocimiento más profundo de las herramientas
estadísticas. Una vez identificada la técnica estadís-
Es importante remarcar, no obstante, que el pre- tica más adecuada para responder a una pregunta
sente trabajo se centra en las pruebas estadísticas de investigación, los investigadores deben acudir a
utilizadas más frecuentemente para el análisis de da- los manuales especializados para conocer más pro-
tos cuando la variable de estudio es continua. Fu- fundamente cada técnica23,30. Uno de los principa-
turos trabajos proporcionarán información para les mensajes de este trabajo es que, como se ha
interpretar puntuaciones derivadas de los tests neu- comentado en la sección dedicada a la regresión
ropsicológicos5, así como herramientas para enten- lineal, la correcta utilización de las pruebas esta-
der e interpretar datos cuando la variable de estudio dísticas depende de que se cumplan unos supues-
es dicotómica. Así, por ejemplo, en neuropsicología tos estadísticos32,35. Los clínicos e investigadores en
se estudia si las variables cognitivas se asocian a la neuropsicología deben conocer los supuestos de
probabilidad de desarrollar deterioro cognitivo (Sí/ cada análisis estadístico antes de reclutar su mues-
No)9, o también la utilidad de diferentes puntos de tra, realizar sus estudios o cuando interprete los da-
corte en los tests neuropsicológicos para identificar tos derivados de su investigación.

Declaración de intereses:
Los autores declaran no tener conflicto de intereses

REFERENCIAS

1. Barth JT, Pliskin N, Axelrod B, et al. Introduction to the NAN 2001 Definition of a Clinical Neuropsy-
chologist. NAN Policy and Planning Committee. Arch Clin Neuropsychol Off J Natl Acad Neuropsy-
chol. 2003;18(5):551-555.
2. Boller F, Grafman J, eds. Handbook of Neuropsychology. Amsterdam: Elsevier; 1997.
3. Lezak MD, Howieson DB, Loring DW. Neuropsychological Assessment. 4th ed. New York: Oxford
University Press; 2004.
4. Goldstein LH, McNeil JE, eds. Clinical Neuropsychology: A Practical Guide to Assessment and Man-
agement for Clinicians. 2nd ed. Chichester, West Sussex ; Malden, MA: Wiley-Blackwell; 2013.
Principios básicos en estadística para neuropsicólogos clínicos e investigadores: utilidad práctica... 39

5. Strauss EH, Sherman EHS, Spreen O. A Compendium of Neuropsychological Tests. Administration,


Norms and Comments. New York: Oxford University Press; 2006.
6. Fletcher-Janzen E, Strickland TL, Reynolds CR. Handbook of Cross-Cultural Neuropsychology. New
York: Klewer Academic; 2000.
7. Neil V. Cross-Cultural Neuropsychological Assessment. Theory and Practice. Mahwah, NY: Lawrence
Erlbaum; 2000.
8. Petersen R, Smith G, Waring S, Ivnik R, Tangalos T, Kokmen E. Mild cognitive impairment: Clinical char-
acterization and outcome. Arch Neurol. 1999; 56(3):303–308. doi:10.1001/archneur.56.3.303
9. Oltra-Cucarella J, Sánchez-SanSegundo M, Lipnicki DM, et al. Using the base rate of low scores
helps to identify progression from amnestic MCI to AD. J Am Geriatr Soc. 2018; 66(7):1360-1366.
doi:10.1111/jgs.15412
10. Oltra-Cucarella J, Sánchez-SanSegundo M, Rubio-Aparicio M, Arango-Lasprilla JC, Ferrer-Cascales
R. The Association Between the Number of Neuropsychological Measures and the Base Rate of Low
Scores. Assessment. July 2019:107319111986464. doi:10.1177/1073191119864646
11. Rivera D, Olabarrieta-Landa L, Brooks BL, et al. Multivariate Base Rates of Low Scores on Tests of
Learning and Memory Among Latino Adult Populations. J Int Neuropsychol Soc. 2019; 25(08):834-
844. doi:10.1017/S135561771900050X
12. Crawford JR, Garthwaite PH. Statistical Methods for Single-Case Studies in Neuropsychology:
Comparing the Slope of a Patient’s Regression Line with those of a Control Sample. Cortex. 2004;
40(3):533-548. doi:10.1016/S0010-9452(08)70145-X
13. Arnau Grass J. Diseños experimentales en psicología y educación. México: Trillas; 1990.
14. Cardona LZ. ¿Cómo contribuir a la alfabetización estadística? Rev Virtual Univ Católica Norte.
2011;1(33):234-247.
15. Arango-Lasprilla JC, Olabarrieta-Landa L, Rivera D, Olivera Plaza SL, De Los Reyes Aragón CJ, Qui-
jano MC. Situación actual de la neuropsicología en Colombia. In: Arango-Lasprilla JC, Rivera D, eds.
Neuropsicología En Colombia: Datos Normativos, Estado Actual y Retos a Futuro. Manizales, Colom-
bia: Editorial Universidad Autónoma de Manizales; 2015:21-46.
16. Fonseca-Aguilar P, Olabarrieta-Landa L, Rivera D, et al. Situación actual de la práctica profesional de
la neuropsicología en México. Psicol Desde El Caribe. 2015; 32(3):343-364.
17. Cassidy SA, Dimova R, Giguère B, Spence JR, Stanley DJ. Failing Grade: 89% of Introduction-to-Psy-
chology Textbooks That Define or Explain Statistical Significance Do So Incorrectly. Adv Methods Pract
Psychol Sci. 2019;2(3):233-239. doi:10.1177/2515245919858072
18. Cohen J. A power primer. Psychol Bull. 1992; 112(1):155–159. doi:10.1037/0033-2909.112.1.155
19. Fritz CO, Morris PE, Richler JJ. Effect size estimates: Current use, calculations, and interpretation. J Exp
Psychol Gen. 2012;141(1):2–18. doi:10.1037/a0024338
20. Zakzanis KK. Statistics to tell the truth, the whole truth, and nothing but the truth: formulae, illustrative nu-
merical examples, and heuristic interpretation of effect size analyses for neuropsychological research-
ers. Arch Clin Neuropsychol. 2001; 16(7):653–67. doi:10.1016/S0887-6177(00)00076-7
21. Garcia-Diaz AI, Segura B, Baggio HC, et al. Structural Brain Correlations of Visuospatial and Vi-
suoperceptual Tests in Parkinson’s Disease. J Int Neuropsychol Soc. 2018; 24(01):33-44. doi:10.1017/
S1355617717000583
22. Button KS, Ioannidis JP a, Mokrysz C, et al. Power failure: why small sample size undermines the reli-
ability of neuroscience. Nat Rev Neurosci. 2013; 14(5):365–76. doi:10.1038/nrn3475
23. Tabachnick BG, Fidell LS. Using Multivariate Statistics. Sixth Ed. New Jersey: Pearson Education Inc; 2013.
24. Richardson JTE. Eta squared and partial eta squared as measures of effect size in educational research.
Educ Res Rev. 2011; 6(2):135-147. doi:10.1016/j.edurev.2010.12.001
25. Smith AB, Dawes P, Smith S, Pal DK. A specific deficit of auditory processing in children with Rolandic
Epilepsy and their relatives. Epilepsy Behav. 2017; 72:135-139. doi:10.1016/j.yebeh.2017.04.043
40 Revista Iberoamericana de Neuropsicología  Vol. 3, No. 1, enero-junio 2020.

26. Testa JA, Malec JF, Moessner AM, Brown AW. Outcome After Traumatic Brain Injury: Effects of Aging
on Recovery. Arch Phys Med Rehabil. 2005; 86(9):1815-1823. doi:10.1016/j.apmr.2005.03.010
27. Wobrock T, Ecker UKH, Scherk H, Schneider-Axmann T, Falkai P, Gruber O. Cognitive impairment of
executive function as a core symptom of schizophrenia. World J Biol Psychiatry. 2009; 10(4-2):442-
451. doi:10.1080/15622970701849986
28. De Simone MS, Perri R, Fadda L, Caltagirone C, Carlesimo GA. Predicting progression to Alzheimer’s
disease in subjects with amnestic mild cognitive impairment using performance on recall and recogni-
tion tests. J Neurol. 2019; 266(1):102-111. doi:10.1007/s00415-018-9108-0
29. Borghesani PR, Madhyastha TM, Aylward EH, et al. The association between higher order abilities,
processing speed, and age are variably mediated by white matter integrity during typical aging. Neu-
ropsychologia. 2013; 51(8):1435-1444. doi:10.1016/j.neuropsychologia.2013.03.005
30. Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE. Regression Methods in Biostatistics: Linear, Lo-
gistic, Survival, and Repeated Measures Models. New York: Springer; 2005.
31. Chang K-C, Tseng M-C, Weng H-H, Lin Y-H, Liou C-W, Tan T-Y. Prediction of Length of Stay of First-Ev-
er Ischemic Stroke. Stroke. 2002; 33(11):2670-2674. doi:10.1161/01.STR.0000034396.68980.39
32. Williams MN, Gómez Grajales CA, Kurkiewicz D. Assumptions of Multiple Regression: Correcting
Two Misconceptions. Pract Assess Res Eval. 2013; 18(11):1-14.
33. Osborne JW. Normality of residuals is a continuous variable, and does seem to influence the trustwor-
thiness of confidence intervals: A response to, and appreciation of, Williams, Grajales, and Kurkiewicz
(2013). Pract Assess Res Eval. 2013; 18(12):1-9.
34. De Jager CA, Hogervorst E, Combrinck M, Budge MM. Sensitivity and specificity of neuropsychologi-
cal tests for mild cognitive impairment, vascular cognitive impairment and Alzheimer’s disease. Psychol
Med. 2003; 33(6):1039-1050. doi:10.1017/s0033291703008031
35. Cohen J, Cohen P, West SG, Aiken LS. Applied Multiple Regression/Correlation Analysis for the Be-
havioral Sciences. 3rd ed. Mahwah, N.J: L. Erlbaum Associates; 2003.

También podría gustarte