Está en la página 1de 7

En general, la psicometría es un conjunto de conceptos teóricos y metodológicos para la

construcción y evaluación de instrumentos de medida en psicología. Los textos clásicos


coinciden en que sus orígenes pueden rastrearse a finales del siglo XIX e inicios del XX, y
señalan, entre otros, a los planteamientos teóricos de la evolución de Darwin, en biología, el
desarrollo de la estadística, con personajes como Spearman y Pearson, y el interés por
medir las capacidades intelectuales de los individuos (Anastasi, 1977; Nunnally, 1970),
además de la insatisfacción con los modelos analíticos de la época y la exigencia de una
psicología científica.

Historia de la psicometría
Tomado de: Notas de psicometría- Aura Nidia Rojas Herrera (1998)
Pueden encontrarse algunos intentos de hacer medición muy antiguos: el Imperio Chino,
los griegos, la edad media y hasta la Biblia; tal vez el ejemplo más reportado sobre estos
primeros intentos es la clasificación del médico griego Galeno, quien clasifica a los seres
humanos según los ‘humores’ en sanguíneo, colérico, flemático y melancólico en lo que
podría verse como una primera propuesta de escala nominal para medición de la
personalidad. Aunque la literatura está llena de ejemplos como el anterior, lo que se conoce
hoy como psicometría empezó a tomar forma sólo hasta el siglo XIX. (19)
El famoso episodio del joven auxiliar en el Observatorio Astrológico de Greenwich, cuyos
registros del tiempo de paso de las estrellas a través de una línea del campo visual del
telescopio, diferían sistemáticamente de los de su maestro, se convirtió gracias a las
elaboraciones de los psicofísicos, en la evidencia de que algunas diferencias humanas
podían cuantificarse. Mediante monitoreos de los registros de los astrónomos en dicho
observatorio Bessel (1816) observó que había variaciones en la rapidez con que
reaccionaban los individuos a estímulos visuales, dando lugar a lo que se conocería como la
ecuación personal. Quetelet, matemático belga, fue el primero en plantear que la teoría
matemática de la probabilidad podía aplicarse a las mediciones humanas.
Por otra parte, los trabajos de Esquirol (1838), médico francés que se interesó por el estudio
del retraso mental, constituyen un avance interesante en la medición de este trastorno que
tendría implicaciones en el futuro desarrollo de técnicas más refinadas para la medición del
mismo. Pueden resumirse en tres los aportes de Esquirol: Por una parte hace distinción
entre los ‘alienados’, con profundos trastornos emocionales y los retrasados mentales con
deficiencias de tipo intelectual; de otra parte intenta algunas clasificaciones de los diversos
grados de retraso mental y finalmente, identifica ‘el lenguaje’ como el criterio más fiable
para evaluar y clasificar los trastornos mentales. En esta misma línea se encuentran las
contribuciones de su compatriota y colega Seguín (1866) quien, con su rechazo a la noción
de incurable del retraso mental, crea la primera escuela para retrasados y diseña algunos
procedimientos de adiestramiento básicamente sensorio-motor, algunos de los cuales
forman parte de los llamados ‘test no verbales de inteligencia’.
Desde una perspectiva muy diferente, ya que estaban más interesados por plantear
generalizaciones que por analizar diferencias, se encuentran los primeros psicólogos
experimentales del laboratorio de Wuntd, (1879) en Leipzig. Estos personajes, a quienes la
historia reconoce como los fundadores de la psicología experimental, tuvieron gran
importancia en los desarrollos de la medición en psicología: Por una parte diseñaron
algunas pruebas de sensibilidad y tiempos de reacción a estímulos visuales, auditivos y de
otros sentidos, marcando la pauta para la mayoría de trabajos que en la misma línea se
desarrollaron a finales de siglo XIX y por otra, con su rigor científico, pusieron de
manifiesto la necesidad de controlar las condiciones de prueba y tipificar procedimientos.
Sin duda uno de los personajes que ha merecido el mayor reconocimiento por sus
interesantes aportes no sólo en la medición en psicología sino en otros campos como la
biología, es Sir Francis Galton. Este polifacético inglés interesado por el estudio de la
herencia, sintió rápidamente la necesidad de medir las características humanas así que creo
un laboratorio antropométrico en Londres (1884) para el cual diseñó varias pruebas de
agudeza y discriminación sensorial con la convicción de que éstos le permitían medir el
intelecto. Algunos de tales instrumentos como la barra de Galton y el silbato de Galton se
han utilizado para medición de la discriminación visual de longitud y del grado de
sensibilidad a tonos altos, respectivamente, hasta hace muy poco tiempo. Además del
diseño de instrumentos de medición sensorial, Galton fue el primero en utilizar las escalas
de estimación, los cuestionarios y la asociación libre; pero tal vez el aporte que no ha sido
suficientemente reconocido fue el haber seleccionado y adaptado algunas técnicas
matemáticas para el análisis de los resultados de sus pruebas y la medición de las
diferencias individuales y el haber introducido la idea de variación concomitante entre dos
medidas[1], constituyéndose en el precursor de lo que hoy se conoce como coeficientes de
correlación, análisis de regresión y otros procedimientos de análisis cuantitativos en
investigación con humanos.
De acuerdo con las ideas de Galton sobre la medición de la inteligencia y convencido de
que era casi imposible medir objetivamente funciones complejas, el psicólogo
norteamericano James McKeen Catell, discípulo de Wundt en el laboratorio de Leipzig,
diseñó y aplicó un sinnúmero de test de discriminación sensorial, tiempo de reacción,
memoria y otras. A Catell se le debe además, la rápida difusión de aplicación de pruebas en
Norte América y los primeros intentos por validarlas con criterios externos; sin embargo, el
hecho que con mayor frecuencia se reporta en torno a sus aportes es haber introducido en la
literatura psicológica el término de test mental (1890).
Aunque, por este hecho, a Catell se le reconoce como el ‘padre’ de los test mentales, las dos
últimas décadas del siglo pasado fueron testigos de una gran cantidad de trabajos que
pretendían desarrollar medidas de funciones psicológicas complejas. Entre ellos se
encuentran los trabajos de los alemanes Oehrn (1889), Kraepelin (1895) y Ebbinghaus
(1897), los norteamericanos Jastrow (1891), Münsterberg (1891), Bolton (1892), J. A.
Gilbert (1897), los italianos Guicciardi y Ferrari (1896) y muchos otros, algunos de los
cuales empezaban a cuestionar el hecho de que los resultados de los test mentales no
guardaran correspondencia con el éxito académico.
Dos de estos trabajos merecen capítulo aparte: Por un lado, los intentos de medición de
procesos psicológicos complejos en el campo de la psicopatología presentado por Kraepelin
(1895), quien construyó una cantidad de test que pretendían medir diversos rasgos que
permitieran caracterizar a los individuos, se constituyeron en los precursores de las
mediciones objetivas de la personalidad. Por otra parte,  los tests de completación de frases
de Ebbinghaus (1897) fueron los únicos de los desarrollados en esa época, que permitieron
una predicción adecuada del rendimiento académico y aún hoy forman parte de la mayoría
de pruebas de inteligencia.
Sin embargo, el honor de la publicación de la primera escala de medida de inteligencia le
correspondió al francés Alfred Binet, quien en compañía de Henri había publicado en 1895,
un artículo que criticaba los tests existentes hasta el momento por dedicarse a mediciones
muy precisas de funciones muy elementales; y proponía otros que abarcaban funciones más
complejas aunque medidas menos precisas. En este contexto, la primera escala de medida
de inteligencia, que reunió las experiencias anteriores e introdujo además preguntas sobre
juicio, comprensión y razonamiento, fue desarrollada por Binet y Simon y se publicó en
1905. En la segunda revisión de esta escala se propone un procedimiento sistemático para
obtener los puntajes de prueba y se introduce el concepto de Edad mental (1908), y en la
revisión de Terman (1916), conocida como Stanford-Binet, aparece la idea de Cociente
Intelectual.
La edad  mental de Binet y Simon se obtenía gracias al ordenamiento de los elementos de la
escala en orden creciente de dificultad y su agrupación por niveles de edad. Tal agrupación
obedecía a criterios empíricos, reuniendo los elementos que podían ser contestados
correctamente por niños normales de cada edad cronológica desde 3 a 13 años; la edad
mental era el nivel al que llegaba cada examinado, esto es, el nivel que alcanzaba dentro de
esta graduación. Tratándose de un índice tan sencillo tuvo gran aceptación por ser la
primera propuesta de una unidad de medida que aunque no alcanzaba el nivel de precisión
de las utilizadas hasta el momento dentro de los mediciones sensoriales, tenía el gran
mérito de ser propia de la psicología. La principal limitación de esta unidad era sin
embargo, que su interpretación dependía de lo que se esperaría de la ejecución del
examinado dada su edad cronológica; es decir, saber que un niño tenía una edad mental de
4 años no reportaba mayor información a cerca de si su nivel estaba dentro de lo ‘normal’ o
por el contrario estaba por encima o por debajo de lo que se esperaría de él.  La propuesta
de Terman supera tal limitación construyendo una unidad cuyo resultado es interpretable: el
famoso C.I. no era otra cosa que la razón edad mental de Binet sobre la edad cronológica
multiplicado por 100, de manera que los puntajes al rededor de 100 (edad mental = edad
cronológica) indicaban normalidad, para cualquier nivel de edad del examinado. Esta
unidad de medida de inteligencia, con todas sus limitaciones, tiene una gran importancia en
la psicometría ya que con ella, los test psicológicos lograron un reconocimiento nunca antes
alcanzado hasta el punto de que el C.I. se convirtió casi en un mito.
Terminada la segunda década del presente siglo los tests psicológicos gozaban de gran
popularidad, el concepto de C.I. era ya ampliamente conocido y la Americana
Psychological Association (A.P.A.) mostraba gran interés en el desarrollo de pruebas
psicológicas. La decisión de Estados Unidos de participar en la Primera Guerra Mundial y
de la APA en colaborar en dicha empresa, puso de manifiesto algunas limitaciones de los
tests psicológicos conocidos hasta el momento. Por una parte, se trataba de instrumentos
que debían ser aplicados de manera individual y por psicólogos experimentados lo cual no
resultaba conveniente si se trataba de seleccionar grandes números de personas para el
ejército norte americano. Robert Yerkes (1917) y su equipo designado precisamente por la
APA, recolectó todos los tests disponibles y algunos no publicados y conformaron una
primera prueba de aplicación colectiva conocida como Test Army Alfa, basada en los
trabajos aún no publicados de Arthur Otis.  Por otra parte, las pruebas conocidas hasta el
momento no permitían la evaluación de personas analfabetas, con deficiencias de lenguaje
o que no conocieran el idioma, nuevamente los trabajos de Otis sirvieron como base para el
desarrollo del primer test de inteligencia no verbal conocido como el Test Army Beta.
Finalmente, el concepto de C.I., a partir de edad mental y edad cronológica no resultaba
muy adecuado cuando se trataba de evaluar adultos, así que nacieron las primeras formas
de puntuación de los tests a partir de normas de grupo; basadas en la comparación de la
ejecución de un individuo en la prueba, con el desempeño promedio del grupo (población)
al que pertenece según algunas variables de interés como sexo, edad o escolaridad. Este
tipo de unidad de medida sigue siendo utilizado hoy.
Así la tercera década del presente siglo fue testigo de una inusitada popularización del uso
de los ‘tests psicológicos’ hasta el punto de que la psicología se asociaba con términos
como ‘test’ o ‘C.I.’. Según Anastasi (1974) “... el florecimiento de los test, ocurrido en los
años veinte, basado en el uso indiscriminado de los mismos, puede haber causado tanto
retraso como progreso en los test psicológicos.”. Sin embargo, mientras en Norte América
estaba en pleno auge el desarrollo y uso de test psicológicos para muchísimos fines, otros
autores se preocupaban más por los análisis matemáticos que brindaran mayor soporte a sus
resultados y por el desarrollo de modelos teóricos y de análisis sobre todo en el campo de la
medición de la inteligencia. Se destacan en esta línea los  trabajos de los ingleses
Spearman, Thompson y Burt, que fueron continuados y perfeccionados por los norte
americanos Kelley y Thurstone.
Charles Spearman, basado en las ideas de Galton y en los posteriores trabajos de Karl
Pearson sobre su medida de correlación, había iniciado desde 1904 una serie de trabajos
sobre las funciones cognoscitivas. Apoyado en la observación de que las matrices de
correlaciones entre tests cognoscitivos eran positivas y jerárquicas[2], plantea su famosa
teoría de dos factores y sustenta matemáticamente sus conclusiones (1927). Según esta
teoría las puntuaciones en los testscognoscitivos pueden explicarse a través de dos factores:
uno general, conocido como el factor g, que es común a todas las funciones medidas en
los tests  y uno específico, s, que sería exclusivo de cada una. El principal contradictor de
las ideas de Spearman es su compatriota Thompson quien, basado en las mismas evidencia
demuestra con el mismo rigor matemático que las correlaciones observadas por Spearman
pueden explicarse por las leyes del azar operando sobre un conjunto complejo de elementos
independientes que constituyen la inteligencia. Por su parte, otro inglés Burt (1941) venía
sosteniendo que las correlaciones entre los tests podían ser satisfactoriamente explicadas a
través de: a) un factor general, varios factores comunes de mayor o menor nivel de
generalidad y c) tantos factores específicos como tareas o tests. Sin embargo, el desarrollo y
refinamiento de lo que hoy se conoce como análisis factorial  o multifactorial en
psicometría, se le debe al norteamericano Thurstone.
El psicólogo estadounidense L. L. Thurstone (1935, 1947) inicia lo que Béla Székely
(1978) ha denominado la segunda etapa del análisis factorial, al introducir los principios
del álgebra matricial en el análisis de las tablas de correlación logrando así
representaciones n dimensionales de las relaciones entre test, la extracción de los posibles
factores explicativos para resumir de manera más o menos fiel la misma información de la
matriz original, y el desarrollo de métodos de rotación de tales ejes buscando la ‘estructura
simple’ que facilitara la interpretación de los resultados. Es evidente que el diseño de estos
procedimientos abría las puertas para la medición de aptitudes más específicas y para dar
respuestas más satisfactorias a los cuestionamientos que venían planteándose desde la
década anterior a cerca de las diferencias intraindividuales observadas en el desempeño
frente a pruebas de inteligencia general. En lo que a desarrollo de instrumentos se refiere, el
resultado directo de las investigaciones de Thurstone sobre el análisis factorial y la
identificación de aptitudes primarias, fue la batería conocida como test de Chicago de
Aptitudes Mentales Primarias (PMA), publicada por primera vez en 1941. La versión de
esta batería en 1962, con algunas adaptaciones y modificaciones sigue utilizándose hoy en
el contexto educativo y laboral; y las técnicas de análisis factorial propuestas por Thurstone
son aún muy utilizadas para el análisis de diversas pruebas psicológicas.
Mientras esto ocurría se habían desarrollado una serie de pruebas de uso en diversas áreas
de aplicación de la psicología. Por una parte, en 1939 se publicaba la escala de Inteligencia
de Wechsler-Bellevue con la intención de proponer un instrumento de medida adecuado
para adultos, que presentara elementos y sistemas de puntuación más adaptados para este
tipo de población. Esta escala fue la primera versión de la que hoy se conoce como Escala
de inteligencia para adultos de Wechsler (WAIS), muy utilizada en diferentes contextos.
Por otra parte se adelantaban los trabajos del neurólogo alemán Kurt Goldstein y el
psicólogo Gelb, quienes una vez terminada la primera guerra mundial habían iniciado el
desarrollo de algunos instrumentos de medición neuropsicológica, con base en la
observación de jóvenes soldados que habían sufrido lesiones cerebrales. Como resultado de
este trabajo se diseñaron los test de formación de conceptos que pretendían evaluar el
deterioro de la actitud abstracta como consecuencia de la lesión cerebral, y que siguen
utilizándose hoy en evaluación neuropsicológica. Sin embargo Goldstein sólo logró el
diseño definitivo de su prueba, compuesta por 5 test, después de haber emigrado a Estados
Unidos y en compañía de Scheerer, trabajo que fue publicado en 1941. En esta misma línea
se desarrolló el test de formación de conceptos de Hanfman y Kasanin (1942), con base en
un instrumento de clasificación de objetos que había sido elaborado por Vigotsky. En
mediciones de personalidad también se habían hecho avances interesantes en lo que a
desarrollo de pruebas se refiere: Una de ellas es la hoja de datos personales de Woodworth,
considerada el precursor de los hoy llamados inventarios de personalidad, que se había
desarrollado durante la primera guerra mundial pero sólo se conoció y empleó fuera del
contexto militar después de que ésta terminara. Por otra parte Hartshorne y May (1928-
1930) habían desarrollado algunos test de ejecución con la intensión de medir aspectos
como mentira, robo y espíritu de cooperación en niños escolares. Con una perspectiva
diferentes E. K. Strong publicaba en 1943 sus cuestionarios de intereses vocacionales para
hombres y mujeres. Pero tal vez el trabajo de mayor trascendencia en esta línea es el
registro multifásico de la personalidad de Hathaway y Mckinley (1940), primera versión
del Inventario Multifasético de Personalidad de Minnesota MMPI que tiene varias
traducciones, adaptaciones y estandarizaciones y sigue siendo utilizado hoy. Tal vez hasta
el momento ningún instrumento de medición de la personalidad ha sido objeto de tantos
estudios, aplicaciones e investigaciones en diferentes áreas de la psicología (clínica, laboral,
educativa), como el MMPI.
En este contexto: la popularización del uso de los tests psicológicos, el reconocimiento de
diferencias intraindividuales en el desempeño en test de funciones intelectuales, los fuertes
avances en el desarrollo de métodos matemáticos y estadísticos para el análisis de los
resultados de los mismos y el diseño de algunas pruebas psicológicas de utilidad en
psicología clínica, educativa, laboral y en neuropsicología; Estado Unidos decide intervenir
en la segunda guerra mundial y nuevamente los psicólogos norteamericanos se ven
enfrentados a algunas demandas por parte del ejército. Esta vez la respuesta fue la creación
de las ‘baterías de aptitud múltiple’ o ‘pruebas diferenciales’ de la línea del PMA, que
permitían la evaluación de funciones mucho más específicas y la clasificación de personal
para tareas especializadas como pilotos, bombarderos, operadores de radio y otras.
Ejemplos de estos instrumentos son la Aircrew Classification Battery, el Army General
Classification Test (AGCT) y el Armed Forced Qualification Test (AFQT)[3]. Con las dos
últimas se levantaron escalas de calificación estandarizadas conocidas como Army
Standard Scores.
Sin embargo, la mayoría de baterías o pruebas diferenciales se conocieron después de
terminada la guerra cuando el ejercito las cedió para uso civil y en los años subsiguientes se
observó un incremento significativo en el número de trabajos que buscaban el diseño de
esta clase de instrumentos, la mayoría de ellos construidos con base en el procedimiento
recientemente conocido de análisis factorial. Algunos de los instrumentos más conocidos de
esta generación son el Test de clasificación de aptitudes de Flanagan (FACT), la batería
de test de aptitud general (GATB) y el test de aptitudes diferenciales (DAT). El primero de
ellos, cuyos progresos empezaron a conocerse en 1947, fue el resultado de algunos trabajos
iniciados durante la segunda guerra mundial con el objeto de diseñar instrumentos de
clasificación de personal de las fuerzas aéreas y se orienta hacía el consejo profesional y la
selección de personal. La GATB fue diseñada por el State Employment
Service estadounidense (1956) con base en resultados de análisis factorial de baterías
preliminares y con el objeto de contar con un instrumento útil para consejo profesional y
laboral. Finalmente, el DAT, que fue publicado originalmente en 1947, fue construida
como instrumento para orientación vocacional en el campo educativo, ha sido objeto de
muchos estudios en esa área y en consecuencia han aparecido varias revisiones algunas de
las cuales se siguen  utilizando hoy.
En este mismo período la evaluación educativa, que había venido reemplazando sus formas
convencionales por los famosos test, desde la aparición de la primera versión del Stanford
Achiement Test hacía ya un par de décadas; entra definitivamente en la honda de las
mediciones objetivas y estandarizadas. Vale destacar aquí los trabajos de E. L. Thorndike y
otros educadores y psicólogos dedicados a aplicar y refinar las técnicas de construcción,
utilización y calificación de pruebas de rendimiento escolar; y la creación, en 1947, del
Educational Testing Service (ETS) encargado de la construcción y evaluación de pruebas
en el área educativa y laboral. Tal vez el instrumento más conocido en esta línea es
el Graduate Record Examination (GRE), que se había originado en 1936, pasó a manos del
ETS en 1948 y sigue utilizándose como instrumento de selección de estudiantes
universitarios en Estados Unidos. En este contexto llegó formalmente la psicología a
Colombia y lo hizo precisamente como psicometría en el campo Educativo. En 1940? se
crea la sección de psicotecnia en la Facultad de Medicina de la Universidad Nacional de
Colombia con el fin de seleccionar los aspirantes a ingresar a esta institución y en 1948 se
inicia la enseñanza de la psicología en la carrera de medicina de la Universidad Nacional de
Colombia en lo que Mejía (1993) llama la ‘época dorada de la psicometría’ en Colombia 
(1939-19??).

Referencias
Psicometría y sus Orígenes Darwinianos.Carlos Nava Quiroz1 y Zaira Vega Valer.
Universidad Nacional Autónoma de México Facultad de Estudios Superiores Iztacala

También podría gustarte