Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Leonardo Medrano
Introducción
1. Delimitación conceptual
Una de las principales dificultades en el desarrollo de instrumentos psicométricos es que
un mismo constructo puede ser definido de diferentes maneras. Por ello los usuarios de
tests no sólo deben conformarse con la etiqueta denominativa del instrumento, sino que
deben realizar un exhaustivo análisis de los ítems y la definición teórica del constructo
evaluado.
Un claro ejemplo puede observarse en el contexto de evaluación de la inteligencia.
De hecho, la escala Weschsler para niños (WISC-IV) supone la existencia de un factor
cognitivo general (factor g) que puede obtenerse a partir de la sumatoria de puntajes
obtenidos en las subescalas de organización perceptual, memoria de trabajo, comprensión
verbal y velocidad de procesamiento. Por otra parte, el test de Matrices Progresivas de
Raven mide el factor g de inteligencia mediante una serie de ítems no verbales, en los que
el examinado debe responder completando la secuencia faltante de una serie de figuras.
De esta manera puede observarse que ambas escalas miden el mismo constructo teórico
(factor g), pero una de ellas contiene medidas de razonamiento verbal, mientras que la
otra no.
Sumado a lo anterior, debe considerarse que muchas pruebas no poseen una clara
delimitación del constructo o dominio que están evaluando. En consecuencia, los ítems
de la escala resultan ambiguos e inespecíficos, lo cual trae aparejado puntuaciones
imprecisas y cuyo resultado final resulta difícil de interpretar (Carretero-Dios y Pérez,
2007).
5. Análisis de la confiabilidad
La confiabilidad de un test constituye un criterio crucial al momento de seleccionar un
test. Más aún, se observa en los usuarios una sobrevaloración de los índices de
confiabilidad en relación a otros criterios igualmente relevantes para evaluar las
propiedades psicométricas de una escala. Sin embargo, la justificación de la elección de
una prueba no sólo debe basarse en la confiabilidad de la misma, sino que debe
considerarse todo el proceso de construcción del instrumento (Carretero-Dios y Pérez,
2007). De hecho hasta que no se conozca con exactitud la estructura interna del
instrumento, no resulta aconsejable efectuar estudios de confiabilidad en la escala.
La confiabilidad hace referencia a la precisión o exactitud de las mediciones de
un test. Para determinar la confiabilidad de un test habitualmente son dos las dimensiones
consideradas: 1) la estabilidad de la prueba y 2) la consistencia interna. Los estudios de
estabilidad pretenden evaluar en que medida el puntaje de un test está libre de errores de
medición causados por los cambios personales aleatorios del examinado, o por los
cambios en las condiciones de administración. El método más utilizado para evaluar esta
dimensión es el método test-retest, el cual consiste en correlacionar dos conjuntos de
datos obtenidos por la aplicación repetida de una misma prueba. Cuando el objetivo del
test es el diagnóstico o la clasificación de personas se recomienda seleccionar escalas que
presenten coeficientes de correlación con valores superiores a r =.80 (Buela-Casal &
Sierra, 1997).
La consistencia interna de un test hace referencia al grado en que los ítems de una
prueba son homogéneos, vale decir miden un mismo constructo. La homogeneidad de
una prueba es deseable en tanto permite una interpretación relativamente directa del rasgo
examinado (Cohen & Swerdlik, 2006). En la actualidad, el coeficiente alfa de Cronbach
es el procedimiento más utilizado para estimar la consistencia interna de una escala (Liu
& Zumbo, 2007). Sin embargo, no se observa un acuerdo unánime respecto a que tan
elevado debe ser el valor obtenido para considerar adecuada la consistencia de una
prueba. Por ejemplo, Nunnally y Bernstein (1994) consideran que un valor de α=.95 debe
ser la norma aceptable. Por el contrario, Manzano y Tobio (2003) señalan que un valor
de alfa superior a .90 es demasiado alto e indica redundancia de reactivos. En general, se
acepta que estimaciones de .80 o superiores son consideradas entre moderadas y elevadas,
mientras que puntajes cercanos a .70 resultan aceptables para fines de investigación
(Hogan, 2004).
Consideraciones Finales
Un trabajo de investigación sólo puede considerarse completo cuando los resultados
obtenidos se comparten con la comunidad científica (APA, 2002). Aunque la
comunicación entre profesionales puede efectuarse por medio de diferentes canales,
formales e informales, el medio tradicional para la comunicación de resultados es el
artículo científico. En este tipo de documentos se presenta de manera clara y ordenada
información sobre los éxitos o fracasos de diversas investigaciones. Por ello, la lectura de
artículos de investigación constituye una actividad ineludible para ser profesionales
idóneos y actualizados.
Especial atención merece la lectura de artículos instrumentales. De hecho, la
psicometría constituye un campo de reciente desarrollo en nuestro medio. De esta manera,
la lectura de artículos sobre investigación en psicometría no sólo permitirá formarnos en
el campo de la medición y evaluación en psicología, sino que también estaremos
promoviendo el crecimiento de esta disciplina en nuestro contexto.
Cabe destacar que, si bien la lectura de artículos científicos no es una tarea simple,
esta dificultad no proviene de una incapacidad personal. Tal como ocurre con otras
actividades en las que no tenemos experiencia, debemos adquirir ciertas destrezas para
ejecutar eficientemente la nueva tarea. El objetivo de la presente guía se orienta en esta
dirección, esperemos que la misma contribuya a estimular la lectura de artículos de
investigación en psicometría y favorezca la adquisición de herramientas necesarias para
la lectura crítica de los mismos.
Actividad Práctica: