Está en la página 1de 5

NATURALEZA Y USOS DE LAS PRUEBAS PSICOLÓGICAS

Autor: Robert J. Gregory


Si se pregunta al ciudadano promedio “¿qué sabe usted acerca de las pruebas psicológicas?”, es
probable que mencione algo sobre pruebas de inteligencia, manchas de tinta y cuestionarios de
verdadero y falso como el muy conocido MMPI. Muy probablemente su idea de las pruebas se
concentrará en la cuantificación de la inteligencia y en la detección de problemas de personalidad;
esta es la perspectiva común del uso de las pruebas en nuestra sociedad. Desde luego, hay algo de
verdad en este punto de vista tan generalizado: las medidas de la personalidad y de la inteligencia
aún son las bases esenciales de la evaluación psicológica. Sin embargo, los diseñadores de las
pruebas modernas han elaborado muchos otros tipos de instrumentos para fines diversos y
novedosos, que los pioneros de la evaluación ni siquiera imaginaron. El objetivo de este capítulo es
analizar las variadas aplicaciones de las pruebas psicológicas, así como revisar las consecuencias
éticas y sociales de esta actividad.
En esa sección se examinan los linchamientos profesionales que tienen efecto sobre la aplicación de
pruebas y se revisa la influencia de los antecedentes culturales sobre los resultados de las mismas.
CONSECUENCIAS DE LA EVALUACIÓN
Desde el nacimiento hasta la vejez, nos enfrentamos a evaluaciones casi en cualquier momento
crucial de nuestra vida. La primera evaluación de un bebé, que se realiza inmediatamente después
del nacimiento, es la prueba Apgar, una valoración rápida y multivariada de la frecuencia cardiaca,
la respiración, el tono muscular, la irritabilidad refleja y la coloración. La calificación total de
Apgar (de 0 a 10) ayuda a determinar la necesidad de cualquier atención médica inmediata.
Posteriormente, un recién nacido que obtuvo una calificación baja de Apgar, podría ser candidato
para la evaluación de un problema del desarrollo.
El niño en edad preescolar tal vez tenga que responder pruebas para verificar si está listo para
ingresar a la escuela. Una vez que inicia su vida escolar, el estudiante enfrentará cientos, quizás
miles, de evaluaciones académicas antes de graduarse, sin mencionar la posible aplicación de
pruebas para problemas de aprendizaje, talentos excepcionales, intereses vocacionales y admisión
universitaria.
Después de la graduación, los adultos suelen responder pruebas para obtener un empleo, la licencia
de conducir, pases de seguridad, diagnóstico de la personalidad, compatibilidad marital, problemas
del desarrollo, disfunción cerebral; la lista es interminable. Incluso algunas personas deben
enfrentar la deshonra en la fragilidad de su vejez: una prueba para determinar su capacidad para
manejar asuntos financieros.
Las pruebas se utilizan casi en cualquier país del mundo con fines de orientación, selección y
colocación, en escenarios tan diversos como escuelas, oficinas gubernamentales, industrias, clínicas
médicas y centros de orientación. La mayoría de las personas han resuelto docenas de pruebas sin
siquiera reparar en ello. No obstante, en el momento en el que el individuo típico alcanza la edad de
jubilación, es muy probable que los resultados de las pruebas psicológicas hayan afectado su
destino. Es probable que la desviación del curso de la vida, motivada por los resultados de pruebas
psicológicas, sea sutil, como ocurre cuando un futuro matemático es aceptado en un curso acelerado
de cálculo con base en sus calificaciones de primer año de bachillerato. De manera más común, los
resultados de las pruebas psicológicas alteran el destino de los individuos en forma profunda. El
hecho de que una persona sea admitida en una universidad y no en otra, que se le ofrezca un empleo
pero que se le rechace en otro, que se le diagnostique o no una depresión, y toda una serie de
decisiones dependen, en parte, del significado de los resultados de las pruebas, tal como los
interpretan las personas con autoridad para ello. En términos sencillos, los resultados de las pruebas
psicológicas cambian vidas. Por esta razón, es prudente (de hecho, casi obligatorio) que los
estudiantes de psicología conozcan los usos y abusos ocasionales contemporáneos de las pruebas.
Por consiguiente, la idea de una prueba es un elemento influyente en nuestra cultura, un aspecto que
damos por sentado. Sin embargo, el concepto que tiene el individuo común de una prueba no
necesariamente coincide con la perspectiva más restrictiva de la psicometría.
Hay psicólogos que se especializan en diseñar y evaluar pruebas psicológicas. Debido a los malos
entendidos generalizados sobre la naturaleza de las pruebas, lo más adecuado es iniciar este tema
con una pregunta fundamental que define el alcance de todo el libro: ¿qué es una prueba?

DEFINICIÓN DE PRUEBA
Una prueba es un procedimiento estandarizado para obtener una muestra de la conducta y
describirla con base en categorías o puntuaciones. Además, la mayoría de las pruebas incluyen
normas o estándares que permiten utilizar los resultados para predecir otras conductas más
importantes. En las siguientes secciones se describen esas características; pero, antes, es
conveniente plantear el alcance de la definición. Según esta perspectiva, existen pruebas
tradicionales como cuestionarios de personalidad e inventarios de inteligencia, aunque la definición
también incluye diversos procedimientos que tal vez el lector no reconozca como pruebas. Por
ejemplo, según la definición utilizada en este libro, todo lo siguiente podría ser una prueba: una lista
de cotejo para calificar las habilidades sociales de un joven con retraso mental; una medida no
cronometrada del dominio de sumar pares de números de tres dígitos; evaluaciones en
microcomputadoras del tiempo de reacción; e incluso pruebas situacionales como observar a un
individuo mientras trabaja en una tarea de grupo con dos “auxiliares” que son obstructivos y poco
cooperativos.
En resumen, las pruebas son sumamente variadas tanto en sus formatos como en sus aplicaciones.
No obstante, la mayoría de las pruebas poseen ciertas características que las definen:
• Son procedimientos estandarizados
• Consideran una muestra de la conducta
• Permiten obtener puntuaciones o derivar categorías
• Contemplan normas o estándares
• Predicen conductas no evaluadas
En las siguientes secciones se examina cada una de estas características con mayor detalle. La
descripción que aquí hacemos se refiere especialmente a las pruebas referidas a la norma (pruebas
que utilizan una población de personas bien definida para su interpretación). Sin embargo, las
características definitorias de una prueba difieren ligeramente para el caso especial de las pruebas
referidas al criterio (pruebas que miden lo que una persona puede hacer, en lugar de comparar sus
resultados con los niveles de desempeño de otros individuos). Por esta razón, se incluye un análisis
separado de las pruebas referidas al criterio.
Un procedimiento estandarizado es una característica esencial de cualquier prueba psicológica. Se
considera que una prueba es estandarizada si los procedimientos para aplicarla son uniformes de un
examinador a otro y de una situación a otra. Desde luego, la estandarización depende hasta cierto
punto de las habilidades del examinador.
Incluso la mejor prueba puede resultar inútil si la administra un evaluador descuidado, poco
capacitado o mal informado, como lo descubrirá el lector más adelante en este capítulo. Sin
embargo, la mayoría de los examinadores son competentes. La estandarización, por consiguiente,
depende principalmente de las instrucciones de aplicación que se encuentran en el manual que suele
acompañar a las pruebas.
La formulación de instrucciones es un paso esencial en la estandarización de una prueba para
garantizar procedimientos de administración uniformes, el diseñador de la prueba debe presentar
materiales con estímulos similares a todos los evaluadores, especificar con gran precisión las
instrucciones orales para cada reactivo o subprueba, y aconsejar al examinador sobre la forma de
manejar diversos tipos de dudas por parte del examinado.
Para ilustrar esto, considere las diversas maneras en que el diseñador de una prueba podría enfocar
la evaluación de la retención de dígitos, es decir, el número máximo de dígitos presentados
verbalmente que un sujeto puede recordar de memoria. Una prueba no estandarizada de retención
de dígitos podría sugerir que el examinador presente de manera verbal series cada vez más largas de
números hasta que el sujeto falle. El número de dígitos en la serie más larga recordada sería, por lo
tanto, la capacidad de retención de dígitos del sujeto. La mayoría de los lectores puede darse cuenta
de que una prueba con tal definición tan general carecerá de uniformidad de un examinador a otro.
Si el examinador tiene la libertad de improvisar cualquier serie de dígitos, ¿qué podría impedirle
que presentara, con la inflexión familiar de un locutor de televisión, “1-800-325-3535”? Esta serie
sería mucho más fácil de recordar que un conjunto más aleatorio, por ejemplo, “7-2-8-1-9-4-6-3-7-
4-2”. La velocidad de presentación también puede tener un efecto crucial sobre la uniformidad de
una prueba de retención de dígitos. Para fines de estandarización, es esencial que todos los
examinadores presenten cada serie a una velocidad constante, por ejemplo, un dígito por segundo.
Por último, el examinador necesita saber cómo reaccionar ante respuestas inesperadas, como:
“¿Podría repetir los números de nuevo?”. Como es evidente, la respuesta habitual es “no”.
Una prueba psicológica también es una muestra limitada de conducta. Ni el sujeto ni el
examinador tienen tiempo suficiente para una prueba realmente detallada, incluso cuando esta se
dirige a un dominio conductual bien definido y finito. Así, las restricciones prácticas dictan que una
prueba solo es una muestra de conducta. No obstante, la muestra de conducta es de interés
únicamente en la medida en que permita que el examinador haga inferencias acerca del dominio
total de conductas relevantes. Por ejemplo, el objetivo de una prueba de vocabulario consiste en
determinar el repertorio total de palabras del examinado, al pedir definiciones de una muestra muy
pequeña, pero cuidadosamente seleccionada, de palabras. El hecho de que el sujeto sea capaz de
definir las 35 palabras específicas de una subprueba de vocabulario (por ejemplo, en la Escala
Wechsler de Inteligencia para Adultos-IV o WAIS-IV) tiene pocas consecuencias directas. Sin
embargo, el significado indirecto de estos resultados es de gran importancia debido a que señala el
conocimiento general de vocabulario del individuo evaluado.
Un aspecto interesante — del que el público en general tiene escaso conocimiento— es que los
reactivos de prueba no necesitan parecerse a las conductas que esta intenta pronosticar. La
característica esencial de una buena prueba es que permite que el examinador pronostique otras
conductas, y no que refleje aquellas que desea predecir. Si resultara que responder “verdadero” a la
afirmación “bebo mucha agua” ayudara a predecir la depresión, entonces esta afirmación
aparentemente no relacionada sería un índice útil de la depresión. Así, el lector observará que la
predicción exitosa es una cuestión empírica que se resuelve a través de la investigación apropiada.
Aunque la mayoría de las pruebas toman una muestra directa del dominio de conductas que esperan
predecir, esto no constituye un requisito psicométrico.
Una prueba psicológica también debe permitir la derivación de puntuaciones o categorías.
Thorndike (1918) expresó el axioma esencial de las pruebas en su famosa aseveración: “Aquello
que existe de alguna manera, existe en cierta cantidad”. McCall (1939) fue un paso más allá al
declarar que “cualquier cosa que existe en cierta cantidad, puede medirse”. Las pruebas se esfuerzan
por ser una forma de medición similar a los procedimientos de las ciencias físicas, donde los
números representan dimensiones abstractas, como peso o temperatura. Toda prueba arroja una o
más puntuaciones o evidencias de que un individuo pertenece a una categoría y no a otra.
En pocas palabras, las pruebas psicológicas resumen el desempeño en números o clasificaciones. La
suposición implícita del punto de vista psicométrico es que las pruebas miden diferencias
individuales respecto a rasgos o características que existen en cierto sentido vago de la palabra. En
la mayoría de los casos, se supone que los individuos poseen el rasgo o la característica que se
mide, aunque en diferentes cantidades. El objetivo de las pruebas consiste en estimar la cantidad del
rasgo o la cualidad que posee un individuo.
En este contexto, vale la pena mencionar dos advertencias. Primero, toda puntuación de prueba
reflejará siempre cierto grado de error de medición. La imprecisión de las pruebas es inevitable:
estas deben basarse en una muestra externa de conducta para estimar una característica no
observable y, por lo tanto, inferida. Los psicólogos a menudo expresan este aspecto fundamental
con la siguiente ecuación:
X=T+e
Donde X es la puntuación observada, T: es la puntuación verdadera, y e: es el componente de error
positivo o negativo.
Lo mejor que puede hacer un evaluador es procurar que sea muy pequeño. Nunca se puede eliminar
por completo ni tampoco es posible conocer su efecto exacto sobre el caso individual. En el tema
3B, Conceptos de confiabilidad, se analizará el concepto de error de medición.
La segunda advertencia dirigida a los usuarios de las pruebas es que deben evitar materializar las
características medidas. Los resultados no representan un objeto que tenga realidad física, sino que
suelen representar una abstracción que ha demostrado ser útil para predecir conductas que no se
evalúan. Por ejemplo, al analizar el CI de un individuo, los psicólogos se refieren a una abstracción
que no tiene existencia directa o material, pero que, a pesar de ello, es útil para predecir el
rendimiento escolar y otros resultados.
Una prueba psicológica también debe considerar normas o estándares. Por lo general, la
puntuación de prueba de un individuo se interpreta al compararla con las puntuaciones obtenidas
por otros individuos en la misma prueba. Para ello, los diseñadores de las pruebas comunican
normas, es decir, un resumen de los resultados de la prueba obtenidos en un grupo grande y
representativo de individuos (Petersen, Kolen y Hoover, 1989).
El grupo normativo se conoce como muestra de estandarización. La selección y evaluación de la
muestra de estandarización es crucial para la utilidad de una prueba. Este grupo debe ser
representativo de la población a la que se dirige la prueba o, de otra manera, será imposible
determinar la posición relativa de un sujeto examinado. En el caso extremo de que no se
proporcionen normas, el examinador no podría utilizar los resultados de la prueba en absoluto. Una
excepción a esta característica ocurre en el caso de las pruebas referidas al criterio, las cuales se
analizarán más adelante.
Las normas no solo establecen un desempeño promedio, sino que también sirven para indicar la
frecuencia con la que se obtienen diferentes puntuaciones altas y bajas. Así, las normas permiten
que el examinador determine el grado en que se desvía una puntuación respecto a las expectativas.
Esta información podría ser muy importante para predecir la conducta no evaluada del individuo
examinado. Las normas tienen una importancia tan trascendental en la interpretación de las pruebas,
que se estudiarán con detenimiento en una sección específica de este libro.
Por último, las pruebas no son un fin en sí mismas. En general, el propósito último de una prueba
consiste en predecir conductas adicionales, diferentes a las que se muestran directamente en la
prueba. Así, el examinador podría tener mayor interés en las conductas no evaluadas que la prueba
pronostica, que en las respuestas de la prueba en si Quizás un ejemplo concreto aclarará esto.
Suponga que un examinador aplica una prueba de manchas de tinta a un paciente de un hospital
psiquiátrico, y que el paciente responde a una mancha de tinta describiéndola como “unos ojos que
miran fijamente”. Con base en normas establecidas, el examinador podría predecir que el sujeto será
sumamente suspicaz y que no sería un buen candidato para la psicoterapia individual.
El propósito de las pruebas es llegara esta y otras predicciones similares, y no determinar si la
persona percibe ojos que lo miran fijamente desde las manchas.
La capacidad de una prueba para pronosticar conductas que no se evalúan se determina por un
amplio cuerpo de investigación de validación, cuya mayor parte se realiza después de que la prueba
se publica. Sin embargo, no existen garantías en el mundo de la investigación psicométrica.
Es común que un investigador publique una prueba prometedora y años después se entere de que
otros investigadores la han encontrado deficiente. He aquí una lección para los usuarios de las
pruebas: el hecho de que una prueba exista y afirme medir cierta característica no es garantía de que
esa afirmación sea verdadera. Una prueba puede tener un título llamativo, instrucciones precisas,
normas elaboradas, empaque atractivo y hallazgos preliminares, pero si en el estudio desapasionado
de investigadores independientes la prueba no logra pronosticar conductas apropiadas, entonces es
inútil.

También podría gustarte