Está en la página 1de 8

https://wppsiunah.wordpress.

com/2009/10/08/historia-de-la-psicometria-2/
Tomado de: Notas de psicometría- Aura Nidia Rojas Herrera (1998)
Pueden encontrarse algunos intentos de hacer medición muy antiguos: el Imperio Chino, los
griegos, la edad media y hasta la Biblia; tal vez el ejemplo más reportado sobre estos primeros
intentos es la clasificación del médico griego Galeno, quien clasifica a los seres humanos según
los ‘humores’ en sanguíneo, colérico, flemático y melancólico en lo que podría verse como una
primera propuesta de escala nominal para medición de la personalidad. Aunque la literatura
está llena de ejemplos como el anterior, lo que se conoce hoy como psicometría empezó a
tomar forma sólo hasta el siglo XIX.
El famoso episodio del joven auxiliar en el Observatorio Astrológico de Greenwich, cuyos
registros del tiempo de paso de las estrellas a través de una línea del campo visual del
telescopio, diferían sistemáticamente de los de su maestro, se convirtió gracias a las
elaboraciones de los psicofísicos, en la evidencia de que algunas diferencias humanas podían
cuantificarse. Mediante monitoreos de los registros de los astrónomos en dicho observatorio
Bessel (1816) observó que había variaciones en la rapidez con que reaccionaban los individuos
a estímulos visuales, dando lugar a lo que se conocería como la ecuación personal. Quetelet,
matemático belga, fue el primero en plantear que la teoría matemática de la probabilidad
podía aplicarse a las mediciones humanas.
Por otra parte, los trabajos de Esquirol (1838), médico francés que se interesó por el estudio
del retraso mental, constituyen un avance interesante en la medición de este trastorno que
tendría implicaciones en el futuro desarrollo de técnicas más refinadas para la medición del
mismo. Pueden resumirse en tres los aportes de Esquirol: Por una parte hace distinción entre
los ‘alienados’, con profundos trastornos emocionales y los retrasados mentales con
deficiencias de tipo intelectual; de otra parte intenta algunas clasificaciones de los diversos
grados de retraso mental y finalmente, identifica ‘el lenguaje’ como el criterio más fiable para
evaluar y clasificar los trastornos mentales. En esta misma línea se encuentran las
contribuciones de su compatriota y colega Seguín (1866) quien, con su rechazo a la noción de
incurable del retraso mental, crea la primera escuela para retrasados y diseña algunos
procedimientos de adiestramiento básicamente sensorio-motor, algunos de los cuales forman
parte de los llamados ‘test no verbales de inteligencia’.
Desde una perspectiva muy diferente, ya que estaban más interesados por plantear
generalizaciones que por analizar diferencias, se encuentran los primeros psicólogos
experimentales del laboratorio de Wundt, (1879) en Leipzig. Estos personajes, a quienes la
historia reconoce como los fundadores de la psicología experimental, tuvieron gran
importancia en los desarrollos de la medición en psicología: Por una parte diseñaron algunas
pruebas de sensibilidad y tiempos de reacción a estímulos visuales, auditivos y de otros
sentidos, marcando la pauta para la mayoría de trabajos que en la misma línea se
desarrollaron a finales de siglo XIX y por otra, con su rigor científico, pusieron de manifiesto la
necesidad de controlar las condiciones de prueba y tipificar procedimientos.
Sin duda uno de los personajes que ha merecido el mayor reconocimiento por sus interesantes
aportes no sólo en la medición en psicología sino en otros campos como la biología, es Sir
Francis Galton. Este polifacético inglés interesado por el estudio de la herencia, sintió
rápidamente la necesidad de medir las características humanas así que creo un laboratorio
antropométrico en Londres (1884) para el cual diseñó varias pruebas de agudeza y
discriminación sensorial con la convicción de que éstos le permitían medir el intelecto. Algunos
de tales instrumentos como la barra de Galton y el silbato de Galton se han utilizado para
medición de la discriminación visual de longitud y del grado de sensibilidad a tonos altos,
respectivamente, hasta hace muy poco tiempo. Además del diseño de instrumentos de
medición sensorial, Galton fue el primero en utilizar las escalas de estimación, los cuestionarios
y la asociación libre; pero tal vez el aporte que no ha sido suficientemente reconocido fue el
haber seleccionado y adaptado algunas técnicas matemáticas para el análisis de los resultados
de sus pruebas y la medición de las diferencias individuales y el haber introducido la idea de
variación concomitante entre dos medidas[1], constituyéndose en el precursor de lo que hoy
se conoce como coeficientes de correlación, análisis de regresión y otros procedimientos de
análisis cuantitativos en investigación con humanos.
De acuerdo con las ideas de Galton sobre la medición de la inteligencia y convencido de que
era casi imposible medir objetivamente funciones complejas, el psicólogo norteamericano
James McKeen Catell, discípulo de Wundt en el laboratorio de Leipzig, diseñó y aplicó un
sinnúmero de test de discriminación sensorial, tiempo de reacción, memoria y otras. A Catell
se le debe además, la rápida difusión de aplicación de pruebas en Norte América y los
primeros intentos por validarlas con criterios externos; sin embargo, el hecho que con mayor
frecuencia se reporta en torno a sus aportes es haber introducido en la literatura psicológica el
término de test mental (1890). Aunque, por este hecho, a Catell se le reconoce como el ‘padre’
de los test mentales, las dos últimas décadas del siglo pasado fueron testigos de una gran
cantidad de trabajos que pretendían desarrollar medidas de funciones psicológicas complejas.
Entre ellos se encuentran los trabajos de los alemanes Oehrn (1889), Kraepelin (1895) y
Ebbinghaus (1897), los norteamericanos Jastrow (1891), Münsterberg (1891), Bolton (1892),
J. A. Gilbert (1897), los italianos Guicciardi y Ferrari (1896) y muchos otros, algunos de los
cuales empezaban a cuestionar el hecho de que los resultados de los test mentales no
guardaran correspondencia con el éxito académico.
Dos de estos trabajos merecen capítulo aparte: Por un lado, los intentos de medición de
procesos psicológicos complejos en el campo de la psicopatología presentado por Kraepelin
(1895), quien construyó una cantidad de test que pretendían medir diversos rasgos que
permitieran caracterizar a los individuos, se constituyeron en los precursores de las mediciones
objetivas de la personalidad. Por otra parte, los tests de completación de frases de
Ebbinghaus (1897) fueron los únicos de los desarrollados en esa época, que permitieron una
predicción adecuada del rendimiento académico y aún hoy forman parte de la mayoría de
pruebas de inteligencia.
Sin embargo, el honor de la publicación de la primera escala de medida de inteligencia le
correspondió al francés Alfred Binet, quien en compañía de Henri había publicado en 1895, un
artículo que criticaba los tests existentes hasta el momento por dedicarse a mediciones muy
precisas de funciones muy elementales; y proponía otros que abarcaban funciones más
complejas aunque medidas menos precisas. En este contexto, la primera escala de medida de
inteligencia, que reunió las experiencias anteriores e introdujo además preguntas sobre juicio,
comprensión y razonamiento, fue desarrollada por Binet y Simon y se publicó en 1905. En la
segunda revisión de esta escala se propone un procedimiento sistemático para obtener los
puntajes de prueba y se introduce el concepto de Edad mental (1908), y en la revisión de
Terman (1916), conocida como Stanford-Binet, aparece la idea de Cociente Intelectual.
La edad mental de Binet y Simon se obtenía gracias al ordenamiento de los elementos de la
escala en orden creciente de dificultad y su agrupación por niveles de edad. Tal agrupación
obedecía a criterios empíricos, reuniendo los elementos que podían ser contestados
correctamente por niños normales de cada edad cronológica desde 3 a 13 años; la edad
mental era el nivel al que llegaba cada examinado, esto es, el nivel que alcanzaba dentro de
esta graduación. Tratándose de un índice tan sencillo tuvo gran aceptación por ser la primera
propuesta de una unidad de medida que aunque no alcanzaba el nivel de precisión de las
utilizadas hasta el momento dentro de los mediciones sensoriales, tenía el gran mérito de ser
propia de la psicología. La principal limitación de esta unidad era sin embargo, que su
interpretación dependía de lo que se esperaría de la ejecución del examinado dada su edad
cronológica; es decir, saber que un niño tenía una edad mental de 4 años no reportaba mayor
información a cerca de si su nivel estaba dentro de lo ‘normal’ o por el contrario estaba por
encima o por debajo de lo que se esperaría de él. La propuesta de Terman supera tal
limitación construyendo una unidad cuyo resultado es interpretable: el famoso C.I. no era otra
cosa que la razón edad mental de Binet sobre la edad cronológica multiplicado por 100, de
manera que los puntajes al rededor de 100 (edad mental = edad cronológica) indicaban
normalidad, para cualquier nivel de edad del examinado. Esta unidad de medida de
inteligencia, con todas sus limitaciones, tiene una gran importancia en la psicometría ya que
con ella, los test psicológicos lograron un reconocimiento nunca antes alcanzado hasta el
punto de que el C.I. se convirtió casi en un mito.
Terminada la segunda década del presente siglo los tests psicológicos gozaban de gran
popularidad, el concepto de C.I. era ya ampliamente conocido y la Americana Psychological
Association (A.P.A.) mostraba gran interés en el desarrollo de pruebas psicológicas. La decisión
de Estados Unidos de participar en la Primera Guerra Mundial y de la APA en colaborar en
dicha empresa, puso de manifiesto algunas limitaciones de los tests psicológicos conocidos
hasta el momento. Por una parte, se trataba de instrumentos que debían ser aplicados de
manera individual y por psicólogos experimentados lo cual no resultaba conveniente si se
trataba de seleccionar grandes números de personas para el ejército norte americano. Robert
Yerkes (1917) y su equipo designado precisamente por la APA, recolectó todos los tests
disponibles y algunos no publicados y conformaron una primera prueba de aplicación colectiva
conocida como Test Army Alfa, basada en los trabajos aún no publicados de Arthur Otis. Por
otra parte, las pruebas conocidas hasta el momento no permitían la evaluación de personas
analfabetas, con deficiencias de lenguaje o que no conocieran el idioma, nuevamente los
trabajos de Otis sirvieron como base para el desarrollo del primer test de inteligencia no verbal
conocido como el Test Army Beta. Finalmente, el concepto de C.I., a partir de edad mental y
edad cronológica no resultaba muy adecuado cuando se trataba de evaluar adultos, así que
nacieron las primeras formas de puntuación de los tests a partir de normas de grupo; basadas
en la comparación de la ejecución de un individuo en la prueba, con el desempeño promedio
del grupo (población) al que pertenece según algunas variables de interés como sexo, edad o
escolaridad. Este tipo de unidad de medida sigue siendo utilizado hoy.
Así la tercera década del presente siglo fue testigo de una inusitada popularización del uso de
los ‘tests psicológicos’ hasta el punto de que la psicología se asociaba con términos como ‘test’
o ‘C.I.’. Según Anastasi (1974) “... el florecimiento de los test, ocurrido en los años veinte,
basado en el uso indiscriminado de los mismos, puede haber causado tanto retraso como
progreso en los test psicológicos.”. Sin embargo, mientras en Norte América estaba en pleno
auge el desarrollo y uso de test psicológicos para muchísimos fines, otros autores se
preocupaban más por los análisis matemáticos que brindaran mayor soporte a sus resultados y
por el desarrollo de modelos teóricos y de análisis sobre todo en el campo de la medición de la
inteligencia. Se destacan en esta línea los trabajos de los ingleses Spearman, Thompson y
Burt, que fueron continuados y perfeccionados por los norte americanos Kelley y Thurstone.
Charles Spearman, basado en las ideas de Galton y en los posteriores trabajos de Karl Pearson
sobre su medida de correlación, había iniciado desde 1904 una serie de trabajos sobre las
funciones cognoscitivas. Apoyado en la observación de que las matrices de correlaciones
entre tests cognoscitivos eran positivas y jerárquicas[2], plantea su famosa teoría de dos
factores y sustenta matemáticamente sus conclusiones (1927). Según esta teoría las
puntuaciones en los testscognoscitivos pueden explicarse a través de dos factores: uno
general, conocido como el factor g, que es común a todas las funciones medidas en
los tests y uno específico, s, que sería exclusivo de cada una. El principal contradictor de las
ideas de Spearman es su compatriota Thompson quien, basado en las mismas evidencia
demuestra con el mismo rigor matemático que las correlaciones observadas por Spearman
pueden explicarse por las leyes del azar operando sobre un conjunto complejo de elementos
independientes que constituyen la inteligencia. Por su parte, otro inglés Burt (1941) venía
sosteniendo que las correlaciones entre los tests podían ser satisfactoriamente explicadas a
través de: a) un factor general, varios factores comunes de mayor o menor nivel de
generalidad y c) tantos factores específicos como tareas o tests. Sin embargo, el desarrollo y
refinamiento de lo que hoy se conoce como análisis factorial o multifactorial en psicometría,
se le debe al norteamericano Thurstone.
El psicólogo estadounidense L. L. Thurstone (1935, 1947) inicia lo que Béla Székely (1978) ha
denominado la segunda etapa del análisis factorial, al introducir los principios del álgebra
matricial en el análisis de las tablas de correlación logrando así
representaciones n dimensionales de las relaciones entre test, la extracción de los posibles
factores explicativos para resumir de manera más o menos fiel la misma información de la
matriz original, y el desarrollo de métodos de rotación de tales ejes buscando la ‘estructura
simple’ que facilitara la interpretación de los resultados. Es evidente que el diseño de estos
procedimientos abría las puertas para la medición de aptitudes más específicas y para dar
respuestas más satisfactorias a los cuestionamientos que venían planteándose desde la década
anterior a cerca de las diferencias intraindividuales observadas en el desempeño frente a
pruebas de inteligencia general. En lo que a desarrollo de instrumentos se refiere, el resultado
directo de las investigaciones de Thurstone sobre el análisis factorial y la identificación de
aptitudes primarias, fue la batería conocida como test de Chicago de Aptitudes Mentales
Primarias (PMA), publicada por primera vez en 1941. La versión de esta batería en 1962, con
algunas adaptaciones y modificaciones sigue utilizándose hoy en el contexto educativo y
laboral; y las técnicas de análisis factorial propuestas por Thurstone son aún muy utilizadas
para el análisis de diversas pruebas psicológicas.
Mientras esto ocurría se habían desarrollado una serie de pruebas de uso en diversas áreas de
aplicación de la psicología. Por una parte, en 1939 se publicaba la escala de Inteligencia de
Wechsler-Bellevue con la intención de proponer un instrumento de medida adecuado para
adultos, que presentara elementos y sistemas de puntuación más adaptados para este tipo de
población. Esta escala fue la primera versión de la que hoy se conoce como Escala de
inteligencia para adultos de Wechsler (WAIS), muy utilizada en diferentes contextos. Por otra
parte se adelantaban los trabajos del neurólogo alemán Kurt Goldstein y el psicólogo Gelb,
quienes una vez terminada la primera guerra mundial habían iniciado el desarrollo de algunos
instrumentos de medición neuropsicológica, con base en la observación de jóvenes soldados
que habían sufrido lesiones cerebrales. Como resultado de este trabajo se diseñaron
los test de formación de conceptos que pretendían evaluar el deterioro de la actitud abstracta
como consecuencia de la lesión cerebral, y que siguen utilizándose hoy en evaluación
neuropsicológica. Sin embargo Goldstein sólo logró el diseño definitivo de su prueba,
compuesta por 5 test, después de haber emigrado a Estados Unidos y en compañía de
Scheerer, trabajo que fue publicado en 1941. En esta misma línea se desarrolló el test de
formación de conceptos de Hanfman y Kasanin (1942), con base en un instrumento de
clasificación de objetos que había sido elaborado por Vigotsky. En mediciones de personalidad
también se habían hecho avances interesantes en lo que a desarrollo de pruebas se refiere:
Una de ellas es la hoja de datos personales de Woodworth, considerada el precursor de los
hoy llamados inventarios de personalidad, que se había desarrollado durante la primera guerra
mundial pero sólo se conoció y empleó fuera del contexto militar después de que ésta
terminara. Por otra parte Hartshorne y May (1928-1930) habían desarrollado algunos test de
ejecución con la intensión de medir aspectos como mentira, robo y espíritu de cooperación en
niños escolares. Con una perspectiva diferentes E. K. Strong publicaba en 1943 sus
cuestionarios de intereses vocacionales para hombres y mujeres. Pero tal vez el trabajo de
mayor trascendencia en esta línea es el registro multifásico de la personalidad de Hathaway y
Mckinley (1940), primera versión del Inventario Multifasético de Personalidad de Minnesota
MMPI que tiene varias traducciones, adaptaciones y estandarizaciones y sigue siendo utilizado
hoy. Tal vez hasta el momento ningún instrumento de medición de la personalidad ha sido
objeto de tantos estudios, aplicaciones e investigaciones en diferentes áreas de la psicología
(clínica, laboral, educativa), como el MMPI.
En este contexto: la popularización del uso de los tests psicológicos, el reconocimiento de
diferencias intraindividuales en el desempeño en test de funciones intelectuales, los fuertes
avances en el desarrollo de métodos matemáticos y estadísticos para el análisis de los
resultados de los mismos y el diseño de algunas pruebas psicológicas de utilidad en psicología
clínica, educativa, laboral y en neuropsicología; Estado Unidos decide intervenir en la segunda
guerra mundial y nuevamente los psicólogos norteamericanos se ven enfrentados a algunas
demandas por parte del ejército. Esta vez la respuesta fue la creación de las ‘baterías de
aptitud múltiple’ o ‘pruebas diferenciales’ de la línea del PMA, que permitían la evaluación de
funciones mucho más específicas y la clasificación de personal para tareas especializadas como
pilotos, bombarderos, operadores de radio y otras. Ejemplos de estos instrumentos son
la Aircrew Classification Battery, el Army General Classification Test (AGCT) y el Armed Forced
Qualification Test (AFQT)[3]. Con las dos últimas se levantaron escalas de calificación
estandarizadas conocidas como Army Standard Scores.
Sin embargo, la mayoría de baterías o pruebas diferenciales se conocieron después de
terminada la guerra cuando el ejercito las cedió para uso civil y en los años subsiguientes se
observó un incremento significativo en el número de trabajos que buscaban el diseño de esta
clase de instrumentos, la mayoría de ellos construidos con base en el procedimiento
recientemente conocido de análisis factorial. Algunos de los instrumentos más conocidos de
esta generación son el Test de clasificación de aptitudes de Flanagan (FACT), la batería
de test de aptitud general (GATB) y el test de aptitudes diferenciales (DAT). El primero de
ellos, cuyos progresos empezaron a conocerse en 1947, fue el resultado de algunos trabajos
iniciados durante la segunda guerra mundial con el objeto de diseñar instrumentos de
clasificación de personal de las fuerzas aéreas y se orienta hacía el consejo profesional y la
selección de personal. La GATB fue diseñada por el State Employment Service estadounidense
(1956) con base en resultados de análisis factorial de baterías preliminares y con el objeto de
contar con un instrumento útil para consejo profesional y laboral. Finalmente, el DAT, que fue
publicado originalmente en 1947, fue construida como instrumento para orientación vocacional
en el campo educativo, ha sido objeto de muchos estudios en esa área y en consecuencia han
aparecido varias revisiones algunas de las cuales se siguen utilizando hoy.
En este mismo período la evaluación educativa, que había venido reemplazando sus formas
convencionales por los famosos test, desde la aparición de la primera versión del Stanford
Achiement Test hacía ya un par de décadas; entra definitivamente en la honda de las
mediciones objetivas y estandarizadas. Vale destacar aquí los trabajos de E. L. Thorndike y
otros educadores y psicólogos dedicados a aplicar y refinar las técnicas de construcción,
utilización y calificación de pruebas de rendimiento escolar; y la creación, en 1947, del
Educational Testing Service (ETS) encargado de la construcción y evaluación de pruebas en el
área educativa y laboral. Tal vez el instrumento más conocido en esta línea es el Graduate
Record Examination (GRE), que se había originado en 1936, pasó a manos del ETS en 1948 y
sigue utilizándose como instrumento de selección de estudiantes universitarios en Estados
Unidos. En este contexto llegó formalmente la psicología a Colombia y lo hizo precisamente
como psicometría en el campo Educativo. En 1940? se crea la sección de psicotecnia en la
Facultad de Medicina de la Universidad Nacional de Colombia con el fin de seleccionar los
aspirantes a ingresar a esta institución y en 1948 se inicia la enseñanza de la psicología en la
carrera de medicina de la Universidad Nacional de Colombia en lo que Mejía (1993) llama la
‘época dorada de la psicometría’ en Colombia (1939-19??).
Durante las dos décadas siguientes se desarrollaron nuevos instrumentos de medición en
muchas áreas y se revisaron y publicaron nuevas versiones y adaptaciones de los ya
existentes; sin embargo, lo que parece caracterizar este periodo es la aparición de trabajos
sobre teoría de la medición, los principios y fundamentos de la medición en psicología, los
problemas de validez y confiabilidad y en síntesis, la construcción de una teoría psicométrica.
En lo que tiene que ver con desarrollo y revisión de pruebas se pueden mencionar, entre
muchos otros: el cuestionario de 16 factores de la personalidad de Catell (16PF) desarrollado
mediante análisis factorial y publicado en 1951; el cuestionario de personalidad de Eysenck,
resultado de las investigaciones que sobre estructura de personalidad había venido
adelantando desde 1947; el inventario de temperamento de Guilford-Zimmerman (1956), las
escalas Wechsler de inteligencia[4]; la tercera revisión de la escala de inteligencia de Stanford-
Binet (Terman y Merrill, 1960) y los inventarios de intereses vocacionales (1966) e intereses
generales de Kuder (1964), revisiones de la hoja de intereses vocacionales de Kuder que había
sido publicada en 1948. De otra parte, una ligera revisión de la bibliografía existente permite
verificar que en este periodo se produjeron las grandes obras sobre teoría y procedimientos
psicométricos que son de uso corriente aún. Corriendo el riesgo de omitir algunos de mucha
importancia, se pueden citar trabajos como la publicación de Gulliksen, H. (1950) titulado
‘teoría de los test mentales’; los trabajos de Cronbach y colaboradores sobre validez y
confiabilidad en las pruebas psicológicas, publicados entre 1951 y 1957; las publicaciones de
Guilford (1954) sobre métodos psicométricos, de Rasch (1960) sobre modelos probabilísticos
para pruebas de logro e inteligencia y de Guiselli (1964) sobre teoría de la medición
psicológica; la teoría de Guilford sobre la estructura de la inteligencia humana, cuya primera
edición apareció en 1967; la gran cantidad de artículos publicados por Paul Horst entre 1949 y
1960 y su libro sobre medición y predicción psicológica en 1968; la teoría estadística de los
puntajes de test mentales de Lord y Novick (1968), los trabajos de Eysenck sobre estructura
de la personalidad, publicados a partir de los 50’s y el muy conocido texto de Magnusson sobre
teoría de los test (1969).
A pesar de la gran producción de trabajos sobre teoría psicométrica y el empeño de algunos
psicólogos por brindar sustento teórico y técnico al uso de los mismos en una gran diversidad
de campos; a partir de la década de los sesenta se puede identificar lo que Anastasi (1974)
denomina la ‘revuelta anti-test’. Esta época, si así puede llamarse, se caracterizó no sólo por
un evidente escepticismo por parte de académicos y público en general a cerca de la utilidad
de las pruebas psicológicas, sino por algunas posiciones abiertamente en contra de los
mismos. Algunas de las publicaciones que tal vez tuvieron más impacto en este sentido fueron
las de Gross en 1962, Hoffman en el mismo año y Black en 1963 (Citados por Anastasi, 1974);
con títulos tan sugestivos como ‘The brain watchers’, ‘The tyranny of testing’ y ‘They shall not
pass’, respectivamente; en las que no sólo se ponía en duda la utilidad de los tests sino que se
hacían serias críticas a su uso. Algunas de tales críticas de tipo técnico: cuestionaban la
capacidad de las pruebas para brindar información confiable sobre las aptitudes, la inteligencia
o la personalidad del examinado y por tanto la utilidad de los resultados con fines predictivos
útiles en el campo educativo, laboral o clínico. Otras eran de tipo ético y filosófico con
afirmaciones a cerca de la violación de la intimidad del examinado; la indebida divulgación y
utilización de los resultados de las pruebas; la falta de responsabilidad en el manejo de las
implicaciones emocionales de la aplicación y conocimiento de resultados de las pruebas; la
visión limitada y reduccionista del individuo a partir de los resultados de las pruebas y en fin, la
pretensión de cuantificar lo no cuantificable: el ser humano. Finalmente, había objeciones de
tipo político: las pruebas pretendían medir conformismo social o, en todo caso favorecían a
quienes mostraban determinadas preferencias políticas o filosóficas; las pruebas desfavorecían
a determinados grupos étnicos o con diferencias culturales; y en nuestro medio el uso de
pruebas llegó a identificarse con imperialismo norteamericano. Probablemente algunas de las
críticas eran razonables y se debían al abuso de los instrumentos de medición por parte de
profesionales inescrupulosos o no capacitados, otras podrían atribuirse a desconocimiento de
las limitaciones de las pruebas y otras, podrían verse como reacción al fenómeno
aceleradísimo de implementación y uso de pruebas. En fin, dejemos que algún historiador se
interese por analizar estos hechos desde una óptica mucho más completa que la que podemos
tener desde aquí.
Como era de esperarse, la ‘revuelta anti-test’ ha dejado sentir sus efectos. Probablemente uno
de ellos sea el hecho de que los modelos de análisis de instrumentos psicológicos que se
generaron entre las décadas de los 70 y 80 son aún hoy muy poco conocidos, al menos en
nuestro medio, y apenas se están empezando a valorar y a utilizar sobretodo en el campo
educativo. Uno de ellos es el modelo bayesiano. A pesar de que Thomas Bayes había expuesto
los fundamentos de lo que hoy se conoce como teoría estadística bayesiana en 1763, se
necesitaron casi dos siglos[5] para que algunos estadísticos vieran en él una alternativa de
análisis de algún interés y sólo hasta hace un par de décadas empezaron a verse sus
aplicaciones y utilidad en el análisis de pruebas psicológicas. De manera muy sintética puede
expresarse el sentido del teorema de Bayes como el enunciado formal de las relaciones entre
la conocida probabilidad a priori, la información que se tenga sobre el fenómeno de interés y la
probabilidad a posteriori; lo cual permite hacer estimaciones teniendo en cuenta la información
adicional que se tenga proveniente de p.e. experiencias previas. Este principio general ha
tenido implicaciones en la interpretación de resultados de pruebas psicológicas y en el diseño y
construcción de las mismas. Por una parte, permite estimar la posición de un sujeto en un
nivel del atributo que pretende medir la prueba teniendo en cuenta tanto su desempeño actual
como la información previa que se tenga sobre él. Por otra parte, si lo que se desea con la
construcción y aplicación de una prueba es estimar con precisión el nivel del examinado en el
atributo, el análisis bayesiano permite identificar el ‘punto’ más adecuado para obtener
información que permita el posicionamiento rápido y preciso del sujeto. Estas aplicaciones y el
uso de nuevas tecnologías como los cumputadores, han permitido el desarrollo de los
instrumentos conocidos como ‘pruebas hechas a la medida’ en las cuales cada elemento de la
prueba es seleccionado con base en la información que se tenga sobre el sujeto y en la
respuesta que dé al elemento anterior.
Otro interés de los psicólogos en las últimas décadas ha sido el sesgo de las pruebas y los
elementos que las componen. Tal sesgo puede verse de manera muy sencilla, a través de las
discrepancias de dificultad y discriminación de los elementos de la prueba o de puntaje
promedio y confiabilidad de la prueba total, en grupos diferentes. Rasch había propuesto en
1960 un procedimiento, que no depende de la población a la que se aplicó la prueba, para
posicionar sus elementos en un nivel del atributo. Sin embargo, ha sido Wright en compañía
de Panchapakesan (1969) y de Stone (1979), quienes han mostrado la utilidad de este tipo de
análisis en algunas de sus publicaciones sobre análisis de ítems y diseño de pruebas.
Finalmente, dos modelos de análisis multivariados que han sido objeto de estudio de algunos
psicólogos y sociólogos en los últimos años han sido el ‘Patn Analysis’ y los ‘Structural equation
modeling‘. Estos modelos han mostrado utilidad en la comprobación de hipótesis de relaciones
entre grupos de variables, el primero de ellos como una extensión de los análisis de regresión
donde se puede analizar más de una variable dependiente (Klem, L, 1995) y el segundo como
procedimiento para poner a prueba modelos que incluyen tanto variables observadas como
variables latentes y diferentes tipos de relaciones entre ellas. Algunas publicaciones sobre este
último tema son Bollen, K. A. (1989); Apodaka y Páez (1992) y Hoyle, R. (1995).
Aunque en la actualidad no se ha iniciado en Colombia un estudio cuidadoso de los últimos
avances en modelos cuantitativos de aplicación en psicología, lo cual se evidencia por la
ausencia de estos temas dentro de los programas de los cursos de psicometría o de métodos
cuantitativos en las Facultades de Psicología en nuestro país; algunos hechos parecen indicar
un cambio de actitud frente a la medición psicológica. El fortalecimiento del Servicio Nacional
de Pruebas, pese a todos sus contradictores; la implementación cada vez más generalizada de
procedimientos de selección en las grandes universidades; la exigencia explícita de la
Constitución Nacional de Colombia (1991) en cuanto al ingreso a las entidades del Estado, por
sistemas de méritos; y los subsecuentes desarrollos legales en las diferentes ramas del Poder
Público, que prevén la utilización de medidas objetivas dentro de los concursos de ingreso; se
están convirtiendo en demandas apremiantes que exigen de los psicólogos volcar su atención
sobre los métodos cuantitativos. Desde esa perspectiva, probablemente quien escriba la
historia de la Psicología en Colombia dentro de unas décadas, podrá afirmar que el principio
del segundo milenio fue la época del resurgimientode la psicometría.
En sus ‘Notas sobre la historia de la correlación’ Karl Pearson (1920), refiriéndose al trabajo
de Galton titulado ‘Typical laws of heredity in man’ (1877), escribe: ‘ Aquí aparece por primera
vez una medida numérica ‘ r’ de lo que se conoce como ‘reversión’, que más tarde Galton
llamó ‘regresión’ . Esta ‘ r’ es la fuente de nuestro símbolo para el coeficiente de
correlación”. Maxwell (1979).
[2] Una matriz de correlaciones es una tabla que presenta los valores de todas las
correlaciones entre un grupo de variables, dos a dos. Es entonces simétrica, los elementos de
la diagonal principal son iguales a 1 y se dice que es jerárquica cuando sus columnas son
proporcionales.
[3] Una presentación detallada de las características de estos instrumentos y otros
desarrollados en el mismo contexto, se encuentra en Anastasi (1974)
[4] Son tres instrumentos conocidos como escala Wechsler de inteligencia para niños (WISC)
publicada en 1950; la escala Wechsler de inteligencia para adultos (WAIS) publicada en 1955 y
la escala Wechsler de inteligencia para niveles preescolar y primario (WPPSI) publicada en
1967. Todas han sido traducidas al español y estandarizadas en varios países y son de uso
muy común en diversas áreas como educación, psicología clínica y neuropsicología.
[5] El artículo de Bayes apareció publicado nuevamente en 1958 en la revista Biometrika,
despertando el interés de algunos académicos (Martz y Waller, 1982)

También podría gustarte