Está en la página 1de 8

Pueden encontrarse algunos intentos de hacer medición muy antiguos: el Imperio Chino,

los griegos, la edad media y hasta la Biblia; tal vez el ejemplo más reportado sobre estos
primeros intentos es la clasificación del médico griego Galeno, quien clasifica a los seres
humanos según los ‘humores’ en sanguíneo, colérico, flemático y melancólico en lo que
podría verse como una primera propuesta de escala nominal para medición de la
personalidad. Aunque la literatura está llena de ejemplos como el anterior, lo que se
conoce hoy como psicometría empezó a tomar forma sólo hasta el siglo XIX.
El famoso episodio del joven auxiliar en el Observatorio Astrológico de Greenwich, cuyos
registros del tiempo de paso de las estrellas a través de una línea del campo visual del
telescopio, diferían sistemáticamente de los de su maestro, se convirtió gracias a las
elaboraciones de los psicofísicos, en la evidencia de que algunas diferencias humanas
podían cuantificarse. Mediante monitoreos de los registros de los astrónomos en dicho
observatorio Bessel (1816) observó que había variaciones en la rapidez con que
reaccionaban los individuos a estímulos visuales, dando lugar a lo que se conocería como la
ecuación personal. Quetelet, matemático belga, fue el primero en plantear que la teoría
matemática de la probabilidad podía aplicarse a las mediciones humanas.
Por otra parte, los trabajos de Esquirol (1838), médico francés que se interesó por el
estudio del retraso mental, constituyen un avance interesante en la medición de este
trastorno que tendría implicaciones en el futuro desarrollo de técnicas más refinadas para
la medición del mismo. Pueden resumirse en tres los aportes de Esquirol: Por una parte
hace distinción entre los ‘alienados’, con profundos trastornos emocionales y los retrasados
mentales con deficiencias de tipo intelectual; de otra parte intenta algunas clasificaciones
de los diversos grados de retraso mental y finalmente, identifica ‘el lenguaje’ como el
criterio más fiable para evaluar y clasificar los trastornos mentales. En esta misma línea se
encuentran las contribuciones de su compatriota y colega Seguín (1866) quien, con su
rechazo a la noción de incurable del retraso mental, crea la primera escuela para
retrasados y diseña algunos procedimientos de adiestramiento básicamente sensorio-
motor, algunos de los cuales forman parte de los llamados ‘test no verbales de
inteligencia’.
Desde una perspectiva muy diferente, ya que estaban más interesados por plantear
generalizaciones que por analizar diferencias, se encuentran los primeros psicólogos
experimentales del laboratorio de Wuntd, (1879) en Leipzig. Estos personajes, a quienes la
historia reconoce como los fundadores de la psicología experimental, tuvieron gran
importancia en los desarrollos de la medición en psicología: Por una parte diseñaron
algunas pruebas de sensibilidad y tiempos de reacción a estímulos visuales, auditivos y de
otros sentidos, marcando la pauta para la mayoría de trabajos que en la misma línea se
desarrollaron a finales de siglo XIX y por otra, con su rigor científico, pusieron de
manifiesto la necesidad de controlar las condiciones de prueba y tipificar procedimientos.
Sin duda uno de los personajes que ha merecido el mayor reconocimiento por sus
interesantes aportes no sólo en la medición en psicología sino en otros campos como la
biología, es Sir Francis Galton. Este polifacético inglés interesado por el estudio de la
herencia, sintió rápidamente la necesidad de medir las características humanas así que
creo un laboratorio antropométrico en Londres (1884) para el cual diseñó varias pruebas
de agudeza y discriminación sensorial con la convicción de que éstos le permitían medir el
intelecto. Algunos de tales instrumentos como la barra de Galton y el silbato de Galton se
han utilizado para medición de la discriminación visual de longitud y del grado de
sensibilidad a tonos altos, respectivamente, hasta hace muy poco tiempo. Además del
diseño de instrumentos de medición sensorial, Galton fue el primero en utilizar las escalas
de estimación, los cuestionarios y la asociación libre; pero tal vez el aporte que no ha sido
suficientemente reconocido fue el haber seleccionado y adaptado algunas técnicas
matemáticas para el análisis de los resultados de sus pruebas y la medición de las
diferencias individuales y el haber introducido la idea de variación concomitante entre dos
medidas[1], constituyéndose en el precursor de lo que hoy se conoce como coeficientes de
correlación, análisis de regresión y otros procedimientos de análisis cuantitativos en
investigación con humanos.
De acuerdo con las ideas de Galton sobre la medición de la inteligencia y convencido de
que era casi imposible medir objetivamente funciones complejas, el psicólogo
norteamericano James McKeen Catell, discípulo de Wundt en el laboratorio de Leipzig,
diseñó y aplicó un sinnúmero de test de discriminación sensorial, tiempo de reacción,
memoria y otras. A Catell se le debe además, la rápida difusión de aplicación de pruebas
en Norte América y los primeros intentos por validarlas con criterios externos; sin embargo,
el hecho que con mayor frecuencia se reporta en torno a sus aportes es haber introducido
en la literatura psicológica el término de test mental (1890). Aunque, por este hecho, a
Catell se le reconoce como el ‘padre’ de los test mentales, las dos últimas décadas del siglo
pasado fueron testigos de una gran cantidad de trabajos que pretendían desarrollar
medidas de funciones psicológicas complejas. Entre ellos se encuentran los trabajos de los
alemanes Oehrn (1889), Kraepelin (1895) y Ebbinghaus (1897), los norteamericanos
Jastrow (1891), Münsterberg (1891), Bolton (1892), J. A. Gilbert (1897), los italianos
Guicciardi y Ferrari (1896) y muchos otros, algunos de los cuales empezaban a cuestionar
el hecho de que los resultados de los test mentales no guardaran correspondencia con el
éxito académico.
Dos de estos trabajos merecen capítulo aparte: Por un lado, los intentos de medición de
procesos psicológicos complejos en el campo de la psicopatología presentado por Kraepelin
(1895), quien construyó una cantidad de test que pretendían medir diversos rasgos que
permitieran caracterizar a los individuos, se constituyeron en los precursores de las
mediciones objetivas de la personalidad. Por otra parte, los tests de completación de
frases de Ebbinghaus (1897) fueron los únicos de los desarrollados en esa época, que
permitieron una predicción adecuada del rendimiento académico y aún hoy forman parte
de la mayoría de pruebas de inteligencia.
Sin embargo, el honor de la publicación de la primera escala de medida de inteligencia le
correspondió al francés Alfred Binet, quien en compañía de Henri había publicado en 1895,
un artículo que criticaba los tests existentes hasta el momento por dedicarse a mediciones
muy precisas de funciones muy elementales; y proponía otros que abarcaban funciones
más complejas aunque medidas menos precisas. En este contexto, la primera escala de
medida de inteligencia, que reunió las experiencias anteriores e introdujo además
preguntas sobre juicio, comprensión y razonamiento, fue desarrollada por Binet y Simon y
se publicó en 1905. En la segunda revisión de esta escala se propone un procedimiento
sistemático para obtener los puntajes de prueba y se introduce el concepto de Edad mental
(1908), y en la revisión de Terman (1916), conocida como Stanford-Binet, aparece la idea
de Cociente Intelectual.
La edad mental de Binet y Simon se obtenía gracias al ordenamiento de los elementos de
la escala en orden creciente de dificultad y su agrupación por niveles de edad. Tal
agrupación obedecía a criterios empíricos, reuniendo los elementos que podían ser
contestados correctamente por niños normales de cada edad cronológica desde 3 a 13
años; la edad mental era el nivel al que llegaba cada examinado, esto es, el nivel que
alcanzaba dentro de esta graduación. Tratándose de un índice tan sencillo tuvo gran
aceptación por ser la primera propuesta de una unidad de medida que aunque no
alcanzaba el nivel de precisión de las utilizadas hasta el momento dentro de los mediciones
sensoriales, tenía el gran mérito de ser propia de la psicología. La principal limitación de
esta unidad era sin embargo, que su interpretación dependía de lo que se esperaría de la
ejecución del examinado dada su edad cronológica; es decir, saber que un niño tenía una
edad mental de 4 años no reportaba mayor información a cerca de si su nivel estaba
dentro de lo ‘normal’ o por el contrario estaba por encima o por debajo de lo que se
esperaría de él. La propuesta de Terman supera tal limitación construyendo una unidad
cuyo resultado es interpretable: el famoso C.I. no era otra cosa que la razón edad mental
de Binet sobre la edad cronológica multiplicado por 100, de manera que los puntajes al
rededor de 100 (edad mental = edad cronológica) indicaban normalidad, para cualquier
nivel de edad del examinado. Esta unidad de medida de inteligencia, con todas sus
limitaciones, tiene una gran importancia en la psicometría ya que con ella, los test
psicológicos lograron un reconocimiento nunca antes alcanzado hasta el punto de que el
C.I. se convirtió casi en un mito.
Terminada la segunda década del presente siglo los tests psicológicos gozaban de gran
popularidad, el concepto de C.I. era ya ampliamente conocido y la Americana Psychological
Association (A.P.A.) mostraba gran interés en el desarrollo de pruebas psicológicas. La
decisión de Estados Unidos de participar en la Primera Guerra Mundial y de la APA en
colaborar en dicha empresa, puso de manifiesto algunas limitaciones de los tests
psicológicos conocidos hasta el momento. Por una parte, se trataba de instrumentos que
debían ser aplicados de manera individual y por psicólogos experimentados lo cual no
resultaba conveniente si se trataba de seleccionar grandes números de personas para el
ejército norte americano. Robert Yerkes (1917) y su equipo designado precisamente por la
APA, recolectó todos los tests disponibles y algunos no publicados y conformaron una
primera prueba de aplicación colectiva conocida como Test Army Alfa, basada en los
trabajos aún no publicados de Arthur Otis. Por otra parte, las pruebas conocidas hasta el
momento no permitían la evaluación de personas analfabetas, con deficiencias de lenguaje
o que no conocieran el idioma, nuevamente los trabajos de Otis sirvieron como base para
el desarrollo del primer test de inteligencia no verbal conocido como el Test Army Beta.
Finalmente, el concepto de C.I., a partir de edad mental y edad cronológica no resultaba
muy adecuado cuando se trataba de evaluar adultos, así que nacieron las primeras formas
de puntuación de los tests a partir de normas de grupo; basadas en la comparación de la
ejecución de un individuo en la prueba, con el desempeño promedio del grupo (población)
al que pertenece según algunas variables de interés como sexo, edad o escolaridad. Este
tipo de unidad de medida sigue siendo utilizado hoy.
Así la tercera década del presente siglo fue testigo de una inusitada popularización del uso
de los ‘tests psicológicos’ hasta el punto de que la psicología se asociaba con términos
como ‘test’ o ‘C.I.’. Según Anastasi (1974) “... el florecimiento de los test, ocurrido en los
años veinte, basado en el uso indiscriminado de los mismos, puede haber causado tanto
retraso como progreso en los test psicológicos.”. Sin embargo, mientras en Norte América
estaba en pleno auge el desarrollo y uso de test psicológicos para muchísimos fines, otros
autores se preocupaban más por los análisis matemáticos que brindaran mayor soporte a
sus resultados y por el desarrollo de modelos teóricos y de análisis sobre todo en el campo
de la medición de la inteligencia. Se destacan en esta línea los trabajos de los ingleses
Spearman, Thompson y Burt, que fueron continuados y perfeccionados por los norte
americanos Kelley y Thurstone.
Charles Spearman, basado en las ideas de Galton y en los posteriores trabajos de Karl
Pearson sobre su medida de correlación, había iniciado desde 1904 una serie de trabajos
sobre las funciones cognoscitivas. Apoyado en la observación de que las matrices de
correlaciones entre tests cognoscitivos eran positivas y jerárquicas[2], plantea su famosa
teoría de dos factores y sustenta matemáticamente sus conclusiones (1927). Según esta
teoría las puntuaciones en los testscognoscitivos pueden explicarse a través de dos
factores: uno general, conocido como el factor g, que es común a todas las funciones
medidas en los tests y uno específico, s, que sería exclusivo de cada una. El principal
contradictor de las ideas de Spearman es su compatriota Thompson quien, basado en las
mismas evidencia demuestra con el mismo rigor matemático que las correlaciones
observadas por Spearman pueden explicarse por las leyes del azar operando sobre un
conjunto complejo de elementos independientes que constituyen la inteligencia. Por su
parte, otro inglés Burt (1941) venía sosteniendo que las correlaciones entre
los tests podían ser satisfactoriamente explicadas a través de: a) un factor general, varios
factores comunes de mayor o menor nivel de generalidad y c) tantos factores específicos
como tareas o tests. Sin embargo, el desarrollo y refinamiento de lo que hoy se conoce
como análisis factorial o multifactorial en psicometría, se le debe al norteamericano
Thurstone.
El psicólogo estadounidense L. L. Thurstone (1935, 1947) inicia lo que Béla Székely (1978)
ha denominado la segunda etapa del análisis factorial, al introducir los principios del
álgebra matricial en el análisis de las tablas de correlación logrando así
representaciones n dimensionales de las relaciones entre test, la extracción de los posibles
factores explicativos para resumir de manera más o menos fiel la misma información de la
matriz original, y el desarrollo de métodos de rotación de tales ejes buscando la ‘estructura
simple’ que facilitara la interpretación de los resultados. Es evidente que el diseño de estos
procedimientos abría las puertas para la medición de aptitudes más específicas y para dar
respuestas más satisfactorias a los cuestionamientos que venían planteándose desde la
década anterior a cerca de las diferencias intraindividuales observadas en el desempeño
frente a pruebas de inteligencia general. En lo que a desarrollo de instrumentos se refiere,
el resultado directo de las investigaciones de Thurstone sobre el análisis factorial y la
identificación de aptitudes primarias, fue la batería conocida como test de Chicago de
Aptitudes Mentales Primarias (PMA), publicada por primera vez en 1941. La versión de esta
batería en 1962, con algunas adaptaciones y modificaciones sigue utilizándose hoy en el
contexto educativo y laboral; y las técnicas de análisis factorial propuestas por Thurstone
son aún muy utilizadas para el análisis de diversas pruebas psicológicas.
Mientras esto ocurría se habían desarrollado una serie de pruebas de uso en diversas áreas
de aplicación de la psicología. Por una parte, en 1939 se publicaba la escala de Inteligencia
de Wechsler-Bellevue con la intención de proponer un instrumento de medida adecuado
para adultos, que presentara elementos y sistemas de puntuación más adaptados para este
tipo de población. Esta escala fue la primera versión de la que hoy se conoce como Escala
de inteligencia para adultos de Wechsler (WAIS), muy utilizada en diferentes contextos.
Por otra parte se adelantaban los trabajos del neurólogo alemán Kurt Goldstein y el
psicólogo Gelb, quienes una vez terminada la primera guerra mundial habían iniciado el
desarrollo de algunos instrumentos de medición neuropsicológica, con base en la
observación de jóvenes soldados que habían sufrido lesiones cerebrales. Como resultado
de este trabajo se diseñaron los test de formación de conceptos que pretendían evaluar el
deterioro de la actitud abstracta como consecuencia de la lesión cerebral, y que siguen
utilizándose hoy en evaluación neuropsicológica. Sin embargo Goldstein sólo logró el diseño
definitivo de su prueba, compuesta por 5 test, después de haber emigrado a Estados
Unidos y en compañía de Scheerer, trabajo que fue publicado en 1941. En esta misma
línea se desarrolló el test de formación de conceptos de Hanfman y Kasanin (1942), con
base en un instrumento de clasificación de objetos que había sido elaborado por Vigotsky.
En mediciones de personalidad también se habían hecho avances interesantes en lo que a
desarrollo de pruebas se refiere: Una de ellas es la hoja de datos personales de
Woodworth, considerada el precursor de los hoy llamados inventarios de personalidad, que
se había desarrollado durante la primera guerra mundial pero sólo se conoció y empleó
fuera del contexto militar después de que ésta terminara. Por otra parte Hartshorne y May
(1928-1930) habían desarrollado algunos test de ejecución con la intensión de medir
aspectos como mentira, robo y espíritu de cooperación en niños escolares. Con una
perspectiva diferentes E. K. Strong publicaba en 1943 sus cuestionarios de intereses
vocacionales para hombres y mujeres. Pero tal vez el trabajo de mayor trascendencia en
esta línea es el registro multifásico de la personalidad de Hathaway y Mckinley (1940),
primera versión del Inventario Multifasético de Personalidad de Minnesota MMPI que tiene
varias traducciones, adaptaciones y estandarizaciones y sigue siendo utilizado hoy. Tal vez
hasta el momento ningún instrumento de medición de la personalidad ha sido objeto de
tantos estudios, aplicaciones e investigaciones en diferentes áreas de la psicología (clínica,
laboral, educativa), como el MMPI.
En este contexto: la popularización del uso de los tests psicológicos, el reconocimiento de
diferencias intraindividuales en el desempeño en test de funciones intelectuales, los fuertes
avances en el desarrollo de métodos matemáticos y estadísticos para el análisis de los
resultados de los mismos y el diseño de algunas pruebas psicológicas de utilidad en
psicología clínica, educativa, laboral y en neuropsicología; Estado Unidos decide intervenir
en la segunda guerra mundial y nuevamente los psicólogos norteamericanos se ven
enfrentados a algunas demandas por parte del ejército. Esta vez la respuesta fue la
creación de las ‘baterías de aptitud múltiple’ o ‘pruebas diferenciales’ de la línea del PMA,
que permitían la evaluación de funciones mucho más específicas y la clasificación de
personal para tareas especializadas como pilotos, bombarderos, operadores de radio y
otras. Ejemplos de estos instrumentos son la Aircrew Classification Battery, el Army
General Classification Test (AGCT) y el Armed Forced Qualification Test (AFQT)[3]. Con las
dos últimas se levantaron escalas de calificación estandarizadas conocidas como Army
Standard Scores.
Sin embargo, la mayoría de baterías o pruebas diferenciales se conocieron después de
terminada la guerra cuando el ejercito las cedió para uso civil y en los años subsiguientes
se observó un incremento significativo en el número de trabajos que buscaban el diseño de
esta clase de instrumentos, la mayoría de ellos construidos con base en el procedimiento
recientemente conocido de análisis factorial. Algunos de los instrumentos más conocidos de
esta generación son el Test de clasificación de aptitudes de Flanagan (FACT), la batería
de test de aptitud general (GATB) y el test de aptitudes diferenciales (DAT). El primero de
ellos, cuyos progresos empezaron a conocerse en 1947, fue el resultado de algunos
trabajos iniciados durante la segunda guerra mundial con el objeto de diseñar instrumentos
de clasificación de personal de las fuerzas aéreas y se orienta hacía el consejo profesional y
la selección de personal. La GATB fue diseñada por el State Employment
Service estadounidense (1956) con base en resultados de análisis factorial de baterías
preliminares y con el objeto de contar con un instrumento útil para consejo profesional y
laboral. Finalmente, el DAT, que fue publicado originalmente en 1947, fue construida como
instrumento para orientación vocacional en el campo educativo, ha sido objeto de muchos
estudios en esa área y en consecuencia han aparecido varias revisiones algunas de las
cuales se siguen utilizando hoy.
En este mismo período la evaluación educativa, que había venido reemplazando sus formas
convencionales por los famosos test, desde la aparición de la primera versión del Stanford
Achiement Test hacía ya un par de décadas; entra definitivamente en la honda de las
mediciones objetivas y estandarizadas. Vale destacar aquí los trabajos de E. L. Thorndike y
otros educadores y psicólogos dedicados a aplicar y refinar las técnicas de construcción,
utilización y calificación de pruebas de rendimiento escolar; y la creación, en 1947, del
Educational Testing Service (ETS) encargado de la construcción y evaluación de pruebas en
el área educativa y laboral. Tal vez el instrumento más conocido en esta línea es
el Graduate Record Examination (GRE), que se había originado en 1936, pasó a manos del
ETS en 1948 y sigue utilizándose como instrumento de selección de estudiantes
universitarios en Estados Unidos. En este contexto llegó formalmente la psicología a
Colombia y lo hizo precisamente como psicometría en el campo Educativo. En 1940? se
crea la sección de psicotecnia en la Facultad de Medicina de la Universidad Nacional de
Colombia con el fin de seleccionar los aspirantes a ingresar a esta institución y en 1948 se
inicia la enseñanza de la psicología en la carrera de medicina de la Universidad Nacional de
Colombia en lo que Mejía (1993) llama la ‘época dorada de la psicometría’ en Colombia
(1939-19??).
Durante las dos décadas siguientes se desarrollaron nuevos instrumentos de medición en
muchas áreas y se revisaron y publicaron nuevas versiones y adaptaciones de los ya
existentes; sin embargo, lo que parece caracterizar este periodo es la aparición de trabajos
sobre teoría de la medición, los principios y fundamentos de la medición en psicología, los
problemas de validez y confiabilidad y en síntesis, la construcción de una teoría
psicométrica. En lo que tiene que ver con desarrollo y revisión de pruebas se pueden
mencionar, entre muchos otros: el cuestionario de 16 factores de la personalidad de Catell
(16PF) desarrollado mediante análisis factorial y publicado en 1951; el cuestionario de
personalidad de Eysenck, resultado de las investigaciones que sobre estructura de
personalidad había venido adelantando desde 1947; el inventario de temperamento de
Guilford-Zimmerman (1956), las escalas Wechsler de inteligencia[4]; la tercera revisión de
la escala de inteligencia de Stanford-Binet (Terman y Merrill, 1960) y los inventarios de
intereses vocacionales (1966) e intereses generales de Kuder (1964), revisiones de la hoja
de intereses vocacionales de Kuder que había sido publicada en 1948. De otra parte, una
ligera revisión de la bibliografía existente permite verificar que en este periodo se
produjeron las grandes obras sobre teoría y procedimientos psicométricos que son de uso
corriente aún. Corriendo el riesgo de omitir algunos de mucha importancia, se pueden citar
trabajos como la publicación de Gulliksen, H. (1950) titulado ‘teoría de los test mentales’;
los trabajos de Cronbach y colaboradores sobre validez y confiabilidad en las pruebas
psicológicas, publicados entre 1951 y 1957; las publicaciones de Guilford (1954) sobre
métodos psicométricos, de Rasch (1960) sobre modelos probabilísticos para pruebas de
logro e inteligencia y de Guiselli (1964) sobre teoría de la medición psicológica; la teoría
de Guilford sobre la estructura de la inteligencia humana, cuya primera edición apareció en
1967; la gran cantidad de artículos publicados por Paul Horst entre 1949 y 1960 y su libro
sobre medición y predicción psicológica en 1968; la teoría estadística de los puntajes de
test mentales de Lord y Novick (1968), los trabajos de Eysenck sobre estructura de la
personalidad, publicados a partir de los 50’s y el muy conocido texto de Magnusson sobre
teoría de los test (1969).
A pesar de la gran producción de trabajos sobre teoría psicométrica y el empeño de
algunos psicólogos por brindar sustento teórico y técnico al uso de los mismos en una gran
diversidad de campos; a partir de la década de los sesenta se puede identificar lo que
Anastasi (1974) denomina la ‘revuelta anti-test’. Esta época, si así puede llamarse, se
caracterizó no sólo por un evidente escepticismo por parte de académicos y público en
general a cerca de la utilidad de las pruebas psicológicas, sino por algunas posiciones
abiertamente en contra de los mismos. Algunas de las publicaciones que tal vez tuvieron
más impacto en este sentido fueron las de Gross en 1962, Hoffman en el mismo año y
Black en 1963 (Citados por Anastasi, 1974); con títulos tan sugestivos como ‘The brain
watchers’, ‘The tyranny of testing’ y ‘They shall not pass’, respectivamente; en las que no
sólo se ponía en duda la utilidad de los tests sino que se hacían serias críticas a su uso.
Algunas de tales críticas de tipo técnico: cuestionaban la capacidad de las pruebas para
brindar información confiable sobre las aptitudes, la inteligencia o la personalidad del
examinado y por tanto la utilidad de los resultados con fines predictivos útiles en el campo
educativo, laboral o clínico. Otras eran de tipo ético y filosófico con afirmaciones a cerca de
la violación de la intimidad del examinado; la indebida divulgación y utilización de los
resultados de las pruebas; la falta de responsabilidad en el manejo de las implicaciones
emocionales de la aplicación y conocimiento de resultados de las pruebas; la visión
limitada y reduccionista del individuo a partir de los resultados de las pruebas y en fin, la
pretensión de cuantificar lo no cuantificable: el ser humano. Finalmente, había objeciones
de tipo político: las pruebas pretendían medir conformismo social o, en todo caso
favorecían a quienes mostraban determinadas preferencias políticas o filosóficas; las
pruebas desfavorecían a determinados grupos étnicos o con diferencias culturales; y en
nuestro medio el uso de pruebas llegó a identificarse con imperialismo norteamericano.
Probablemente algunas de las críticas eran razonables y se debían al abuso de los
instrumentos de medición por parte de profesionales inescrupulosos o no capacitados,
otras podrían atribuirse a desconocimiento de las limitaciones de las pruebas y otras,
podrían verse como reacción al fenómeno aceleradísimo de implementación y uso de
pruebas. En fin, dejemos que algún historiador se interese por analizar estos hechos desde
una óptica mucho más completa que la que podemos tener desde aquí.
Como era de esperarse, la ‘revuelta anti-test’ ha dejado sentir sus efectos. Probablemente
uno de ellos sea el hecho de que los modelos de análisis de instrumentos psicológicos que
se generaron entre las décadas de los 70 y 80 son aún hoy muy poco conocidos, al menos
en nuestro medio, y apenas se están empezando a valorar y a utilizar sobretodo en el
campo educativo. Uno de ellos es el modelo bayesiano. A pesar de que Thomas Bayes
había expuesto los fundamentos de lo que hoy se conoce como teoría estadística bayesiana
en 1763, se necesitaron casi dos siglos[5] para que algunos estadísticos vieran en él una
alternativa de análisis de algún interés y sólo hasta hace un par de décadas empezaron a
verse sus aplicaciones y utilidad en el análisis de pruebas psicológicas. De manera muy
sintética puede expresarse el sentido del teorema de Bayes como el enunciado formal de
las relaciones entre la conocida probabilidad a priori, la información que se tenga sobre el
fenómeno de interés y la probabilidad a posteriori; lo cual permite hacer estimaciones
teniendo en cuenta la información adicional que se tenga proveniente de p.e. experiencias
previas. Este principio general ha tenido implicaciones en la interpretación de resultados de
pruebas psicológicas y en el diseño y construcción de las mismas. Por una parte, permite
estimar la posición de un sujeto en un nivel del atributo que pretende medir la prueba
teniendo en cuenta tanto su desempeño actual como la información previa que se tenga
sobre él. Por otra parte, si lo que se desea con la construcción y aplicación de una prueba
es estimar con precisión el nivel del examinado en el atributo, el análisis bayesiano permite
identificar el ‘punto’ más adecuado para obtener información que permita el
posicionamiento rápido y preciso del sujeto. Estas aplicaciones y el uso de nuevas
tecnologías como los cumputadores, han permitido el desarrollo de los instrumentos
conocidos como ‘pruebas hechas a la medida’ en las cuales cada elemento de la prueba es
seleccionado con base en la información que se tenga sobre el sujeto y en la respuesta que
dé al elemento anterior.
Otro interés de los psicólogos en las últimas décadas ha sido el sesgo de las pruebas y los
elementos que las componen. Tal sesgo puede verse de manera muy sencilla, a través de
las discrepancias de dificultad y discriminación de los elementos de la prueba o de puntaje
promedio y confiabilidad de la prueba total, en grupos diferentes. Rasch había propuesto
en 1960 un procedimiento, que no depende de la población a la que se aplicó la prueba,
para posicionar sus elementos en un nivel del atributo. Sin embargo, ha sido Wright en
compañía de Panchapakesan (1969) y de Stone (1979), quienes han mostrado la utilidad
de este tipo de análisis en algunas de sus publicaciones sobre análisis de ítems y diseño de
pruebas.
Finalmente, dos modelos de análisis multivariados que han sido objeto de estudio de
algunos psicólogos y sociólogos en los últimos años han sido el ‘Patn Analysis’ y los
‘Structural equation modeling‘. Estos modelos han mostrado utilidad en la comprobación de
hipótesis de relaciones entre grupos de variables, el primero de ellos como una extensión
de los análisis de regresión donde se puede analizar más de una variable dependiente
(Klem, L, 1995) y el segundo como procedimiento para poner a prueba modelos que
incluyen tanto variables observadas como variables latentes y diferentes tipos de relaciones
entre ellas. Algunas publicaciones sobre este último tema son Bollen, K. A. (1989);
Apodaka y Páez (1992) y Hoyle, R. (1995).
Aunque en la actualidad no se ha iniciado en Colombia un estudio cuidadoso de los últimos
avances en modelos cuantitativos de aplicación en psicología, lo cual se evidencia por la
ausencia de estos temas dentro de los programas de los cursos de psicometría o de
métodos cuantitativos en las Facultades de Psicología en nuestro país; algunos hechos
parecen indicar un cambio de actitud frente a la medición psicológica. El fortalecimiento del
Servicio Nacional de Pruebas, pese a todos sus contradictores; la implementación cada vez
más generalizada de procedimientos de selección en las grandes universidades; la
exigencia explícita de la Constitución Nacional de Colombia (1991) en cuanto al ingreso a
las entidades del Estado, por sistemas de méritos; y los subsecuentes desarrollos legales
en las diferentes ramas del Poder Público, que prevén la utilización de medidas objetivas
dentro de los concursos de ingreso; se están convirtiendo en demandas apremiantes que
exigen de los psicólogos volcar su atención sobre los métodos cuantitativos. Desde esa
perspectiva, probablemente quien escriba la historia de la Psicología en Colombia dentro de
unas décadas, podrá afirmar que el principio del segundo milenio fue la época del
resurgimientode la psicometría.
[1] En sus ‘Notas sobre la historia de la correlación’ Karl Pearson (1920), refiriéndose al
trabajo de Galton titulado ‘Typical laws of heredity in man’ (1877), escribe: ‘ Aquí aparece
por primera vez una medida numérica ‘ r’ de lo que se conoce como ‘reversión’, que más
tarde Galton llamó ‘regresión’ . Esta ‘ r’ es la fuente de nuestro símbolo para el coeficiente
de correlación”. Maxwell (1979).
[2] Una matriz de correlaciones es una tabla que presenta los valores de todas las
correlaciones entre un grupo de variables, dos a dos. Es entonces simétrica, los elementos
de la diagonal principal son iguales a 1 y se dice que es jerárquica cuando sus columnas
son proporcionales.
[3] Una presentación detallada de las características de estos instrumentos y otros
desarrollados en el mismo contexto, se encuentra en Anastasi (1974)
[4] Son tres instrumentos conocidos como escala Wechsler de inteligencia para niños
(WISC) publicada en 1950; la escala Wechsler de inteligencia para adultos (WAIS)
publicada en 1955 y la escala Wechsler de inteligencia para niveles preescolar y primario
(WPPSI) publicada en 1967. Todas han sido traducidas al español y estandarizadas en
varios países y son de uso muy común en diversas áreas como educación, psicología clínica
y neuropsicología.
[5] El artículo de Bayes apareció publicado nuevamente en 1958 en la revista Biometrika,
despertando el interés de algunos académicos (Martz y Waller, 1982)

También podría gustarte