Está en la página 1de 9

Introducción 1

La psicometría puede definirse en términos ge­ con los estímulos fisicos, y técnicas multivariadas,
nerales como el conjunto de métodos, técnicas y que junto con el resto de tecnología estadística re­
teorías implicadas en la medición de las variables sultan imprescindibles para la construcción y aná­
psicológicas. Como su nombre indica, trataría de lisis de los instrumentos de medida.
todo aquello relacionado con la medición de lo psi­ Como se puede observar, el campo de referen­
cológico. Ahora bien, de la medición de lo psicoló­ cia del término «psicometría» es amplísimo, y no es
gico se ocupa también cualquier otro acercamiento nuestro objetivo entrar aquí a realizar una descrip­
riguroso al estudio del comportamiento humano; lo ción o definición precisa de los bloques citados,
que constituiría lo específico de la psicometría sería cada uno de los cuales está a su vez altamente es­
su énfasis y especialización en aquellas propiedades pecializado y estructurado en subáreas. En este li­
métricas exigibles a las mediciones psicológicas in­ bro nos centraremos exclusivamente en la teoría de
dependientemente del campo sustantivo de aplica­ los test, abordando los dos grandes enfoques, el clá­
ción y de los instrumentos utilizados. Así, por ejem­ sico y la teoría de respuesta a los ítems (TRI). Solo
plo, aspectos como la fiabilidad o la validez de las subrayar que el término «psicometría» es mucho
mediciones, por citar dos de los más conocidos, más genérico y amplio que el de teoría de los test,
constituyen requisitos exigibles para cualquier eva­ con el que erróneamente se le identifica a menudo,
luación psicológica, sea cual fuere su ámbito de tomando la parte por el todo. A partir de los años
aplicación y enfoque. Este tipo de especialización de sesenta se populariza también el término afín de
la psicometría en las categorías métricas que atra­ «psicología matemática», utilizado para denominar
viesan los distintos campos sustantivos de la psico­ aquellos trabajos caracterizados por un acerca­
logía da lugar a que los tipos de contenidos sobre miento formalizado a los problemas psicológicos,
los que trabajan los psicómetras resulten bastante lo cual es básicamente coincidente con lo que se
amplios y variados. entendía por psicometría. De hecho, Thurstone
Una ojeada a los congresos organizados por las (1937) utiliza el término «psicología matemática»
sociedades psicométricas europea y americana, así para caracterizar en pocas palabras el objeto de la
como a las revistas científicas del área, permite ar­ sociedad psicométrica americana por él fundada.
ticular la mayor parte de la temática psicométrica Lo más específico y diferencial de la psicología ma­
en torno a cinco grandes bloques: teoría de la me­ temática respecto de la psicometría serán los mode­
dición, que abarcaría todo lo relativo a la funda­ los matemáticos elaborados para áreas específicas
mentación teórica de la medida; teoría de los test, de la psicología, tales como aprendizaje, memoria,
donde se explicitan la lógica y los modelos matemá­ percepción, lenguaje, pensamiento, interacción so­
ticos subyacentes a la construcción y uso de los test; cial, etc., que proliferan a partir de los años cin­
escalamiento psicológico, que aborda la problemá­ cuenta y sesenta, y que son en realidad la razón
tica inherente al escalamiento de estímulos psicoló­ fundamental que da sentido y apoya la nueva deno­
gicos; escalamiento psicofisico, que hace lo propio minación de psicología matemática diferenciada de

© Ediciones Pirámide
16 / Introducción a la Psicometría

la anterior de psicometría. Como ocurriera antes en tual será encontrarse con las denominaciones espe­
psicometría, se publican textos con esa denomina­ cíficas de las distintas subáreas. Como modesto
ción genérica (Atkinson, 1964; Coombs, Dawes y ejemplo, en este libro se tratará de las teorías de los
Tversky, 1970; Krantz, Atkinson, Luce y Suppes, test, tanto el enfoque clásico como la teoría de res­
1974; Laming, 1973; Luce, Bush y Galanter, 1963; puesta a los ítems.
Restle y Greeno, 1970), que luego desaparecerá
para dar paso a las subáreas especializadas, apare­
cen sociedades científicas de psicólogos matemáti­ 1. ORÍGENES Y DESARROLLO
cos con reuniones y congresos propios desde 1967 DE LA TEORÍA DE LOS TEST
y se publican revistas, con mención especial para el
Journal of Mathematical Psychology y British Jour- El nacimiento formal de la teoría de los test
nal of Mathematical and Statistical Psychology. puede ubicarse en los primeros trabajos de Spear­
Que ambos términos, «psicometría» y «psicología man (1904, 1907, 1913), en los que establece los
matemática», denotan campos muy solapados se fundamentos de la teoría clásica de los test (TCT).
comprueba empíricamente al observar que los es­ El objetivo central era encontrar un modelo estadís­
pecialistas publican sus trabajos en las revistas de tico que fundamentase adecuadamente las puntua­
uno y otro campo y asisten indistintamente a los ciones de los test y permitiera la estimación de los
congresos y reuniones de las respectivas sociedades errores de medida asociados a todo proceso de me­
científicas. Considerar, como hacen Estes (1975) o dición. El modelo lineal clásico propuesto por
Greeno (1980), la psicometría como la parte de la Spearman, que luego se abordará con cierto detalle,
psicología matemática dedicada a todo lo relacio­ destaca por su sencillez matemática y enjundia psi­
nado con la medida es tan razonable como consi­ cológica, lo que le garantizará una larga vida. Asu­
derar la psicología matemática aquella rama de la me que la puntuación empírica de una persona en
psicometría dedicada a los modelos matemáticos de un test (X ) consta de dos componentes aditivos:
procesos psicológicos, pero, eso sí, aquella resulta uno, la «verdadera» puntuación de la persona en el
menos respetuosa con la historia de la psicología, test (V ), y otro, el error (e) que inevitablemente va
ya que fue «psicometría» el término que originaria­ asociado a todo proceso de medición; es decir, se­
mente se utilizó para tales menesteres. Así, Thur­ gún el modelo:
stone (1937), en su conferencia para la primera re­
unión anual de la sociedad psicométrica que tuvo X=V+e
lugar en 1936, señala como objetivo de la sociedad
«estimular el desarrollo de la psicología como cien­ A partir de este modelo y unas asunciones míni­
cia cuantitativa y racional. O lo que más brevemen­ mas, la teoría clásica desarrollará todo un conjunto
te puede denominarse psicología matemática». de deducciones encaminadas a estimar la cuantía del
Añade, además, algo que se olvida demasiado a error que afecta a las puntuaciones de los test. Los
menudo: «A la larga seremos juzgados por la signi­ inicios fueron como siempre inseguros, pues no era
ficación, relevancia y consistencia de los principios fácil abrirse paso en una psicología poco dada a ve­
psicológicos que descubramos», dejando claro des­ leidades cuantitativas, pero los nuevos enfoques se
de el principio que la formalización y matematiza­ impusieron con rapidez y la mayoría de las univer­
ción propias del enfoque psicométrico están al ser­ sidades incluyeron cursos de teoría de los test en el
vicio de los problemas psicológicos que tratan de currículum de sus licenciados. Cuenta Joncich (1968)
resolver, pero no constituyen un fin en sí mismo en la biografía de E. L. Thorndike que cuando este
para la psicometría. envió una copia de su libro pionero sobre medición
Quede ahí este breve apunte terminológico para (Thorndike, 1904) a su antiguo profesor William Ja­
evitar confusiones y desasosiegos al lector que los mes, incluyó una nota diciéndole que obligase a leer­
topare en su deambular por los reales de la psicolo­ lo a todos sus investigadores, pero que no se le ocu­
gía, aunque no lo hará con mucha frecuencia, pues, rriese abrirlo a él, pues las figuras, curvas y fórmulas
como ya se ha señalado, debido a su amplitud, se que contenía le volverían loco. Ello puede dar una
han vuelto ambos demasiado genéricos y lo habi­ idea de la acogida que se esperaba por parte de la

© Ediciones Pirámide
Introducción / 17

psicología dominante de la época. Los años siguien­ teoría de los test a plantearse el estatus teórico de
tes conocieron una actividad psicométrica frenética sus mediciones, además de sus propiedades empíri­
tanto en el campo de la teoría como en la construc­ cas, así como a terciar en la polémica que se abre
ción y tecnología de los test, así como en el campo entonces, y llega hasta nuestros días (Borsboom,
del escalamiento psicofisico y psicológico (Thur­ 2005; Gaito, 1980; Michell, 1986; Townsend y Ash­
stone, 1927a, 1928b; Thurstone y Chave, 1929), muy by, 1984), sobre las relaciones entre las escalas y sus
cercanos por entonces al ámbito de los test. Guil­ implicaciones en el uso de las distintas técnicas es­
ford (1936) tratará de sintetizar en su clásico manual tadísticas.
Psychometric Methods lo fundamental de los tres Pero la síntesis por antonomasia de la teoría
campos, teoría de los test, escalamiento psicológico clásica de los test será realizada por Gulliksen
y psicofísico, algo que nadie volvería a intentar, sal­ (1950) en su más que clásico libro Theory of Mental
vo la reedición de 1954 de su propio libro (Guilford, Test, que constituye, sin duda, la exposición mejor
1954), pues se habían vuelto lo suficientemente com­ estructurada del corpus clásico. Gulliksen, antiguo
plejos como para exigir cada uno de ellos un trata­ estudiante, luego ayudante y colega de Thurstone,
miento aparte. Esos años de incubación y desarrollo reconoce explícitamente el papel del maestro en su
dan lugar también a la institucionalización, y así, en formación, y en especial de su libro Fiabilidad y va-
1936, se funda la sociedad psicométrica americana lidez de los test (Thurstone, 1931), ya agotado por
con Thurstone a la cabeza y cuyo órgano de expre­ las fechas en las que Gulliksen escribía el suyo.
sión será la revista Psychometrika. Como comple­ También en los años cincuenta aparecerán las pri­
mento de carácter aplicado, frente al más teórico de meras recomendaciones técnicas para el uso de los
Psychometrika, aparecerá unos años más tarde Edu- test (Technical Recommendations for Psychological
cational and Psychological Measurement (1941); lue­ Test and Diagnostic Techniques, 1954), que conoce­
go seguirían otras muchas entre las que cabe destacar rán diversas actualizaciones y revisiones, la última
The British Journal of Mathematical and Statistical en 2014.
Psychology (1948), Journal of Educational Measure- También el escalamiento tendrá su clásico en
ment (1964), Journal of Educational Statistics (1976) los años cincuenta con el libro de Torgerson (1958)
y Applied Psychological Measurement (1977), por ci­ Theory and Methods of Scaling. Las dos ramas her­
tar algunas. manas, teoría de los test y escalamiento, seguirán
En 1947 Thurstone publica su clásico texto sus propios caminos, y aunque en esta como en
Análisis factorial múltiple, técnica estadística con otras divisiones hay algo de arbitrario, pues la ma­
orígenes en el campo psicométrico (Burt, 1941; Ke­ yoría de los modelos podrían generalizarse tanto a
lley, 1928; Spearman, 1927), que aportará un nota­ personas como a estímulos (Mosier, 1940, 1941),
ble avance para la construcción, análisis y valida­ también es verdad que existían bastantes problemas
ción de los test. En un campo como el del análisis específicos que justificaban la división.
factorial y las técnicas multivariadas en general, en Florecer parece haber sido el sino de los años
el que se han producido avances tan gigantescos, sesenta, y la teoría de los test no iba a ser menos.
potenciados por las facilidades informáticas y los Precisamente, en 1968 aparecerá el libro de Lord y
refinamientos estadísticos actuales, resulta, sin em­ Novick (1968) Statistical Theories of Mental Test
bargo, refrescante releer el libro de Thurstone y ad­ Scores, que sintetiza y reanaliza críticamente todo
mirar la cordura psicológica que lo impregna. Y es lo hecho anteriormente en teoría clásica de los test,
que cuando se piensa que un análisis factorial que abriendo nuevas y prometedoras perspectivas. En el
un ordenador personal actual despacha en unos se­ libro se incluye además el trabajo de Birnbaum so­
gundos podía llevar meses a un equipo de investi­ bre los modelos de rasgo latente, que abrirán una
gadores de entonces, se entiende que se afinasen las línea completamente nueva en la teoría de los test,
hipótesis y aguzase el ingenio antes de someterlas conocida hoy como «teoría de respuesta a los ítems»
a prueba. (TRI). Este vuelco del modo de hacer clásico propi­
Por los años cuarenta también publicará Ste­ ciado por la TRI va a oscurecer la mejora, al menos
vens (Stevens, 1946) su famoso trabajo sobre las es­ teórica, que prometía aportar al planteamiento clá­
calas de medida, que obligará a los estudiosos de la sico la teoría de la generalizabilidad (TG) propuesta

© Ediciones Pirámide
18 / Introducción a la Psicometría

por Cronbach y colaboradores (Cronbach, Rajarat­ lado, las propiedades de los instrumentos (test,
nam y Gleser, 1963; Gleser, Cronbach y Rajarat­ ítems) dependían del tipo de personas utilizadas
nam, 1965; Cronbach, Gleser, Nanda y Rajaratnam, para establecerlas, por lo que en puridad no eran
1972). La TG puede considerarse una extensión del propiedades de los instrumentos de medida, sino de
modelo clásico, más que una alternativa. Mediante la interacción de estos con los objetos medidos. Por
el uso masivo del análisis de varianza, la TG preten­ ejemplo, un ítem resultaría fácil o difícil en función
derá analizar las fuentes del error de medida de un de la muestra de personas utilizada. En suma, los
modo sistemático y desglosado, frente al tratamien­ instrumentos de medida no eran invariantes respec­
to globalizado de la teoría clásica. Pero las aparato­ to de las personas evaluadas. Pues bien, los modelos
sas complicaciones introducidas en relación con las de TRI permitirán dar una solución adecuada a
ventajas prácticas aportadas, unidas a la aparición esos dos problemas de fondo, y además aportarán
en la escena psicométrica del enfoque alternativo de todo un conjunto de avances tecnológicos comple­
los modelos de TRI, relegarán la TG a un papel mentarios para la construcción y análisis de los test.
secundario en el campo de la teoría de los test. Una década de investigación intensa sobre los
No sería exacto decir que en el libro de Lord y distintos aspectos de los nuevos modelos, tanto a
Novick aparecen las primeras aportaciones sobre la nivel teórico como aplicado, permitirá a Lord (1980)
TRI (véase Muñiz y Hambleton, 1992, para un sintetizar en un libro hoy clásico los avances acumu­
­es­tu­dio detallado del origen y desarrollo de estos mo­ lados. El libro abre la década de los ochenta, que
delos), pero la exposición y sistematización de Birn­ conocerá una expansión inusitada de la literatura
baum, unidas a la plataforma publicitaria que supu­ psicométrica bajo la óptica de la TRI y revitalizará
so el libro, resultaron fundamentales para la rápida áreas que se encontraban atascadas, tales como los
expansión de los modelos. De hecho ya hacía ocho bancos de ítems, el sesgo o los test referidos al crite­
años que Rasch había publicado su libro (Rasch, rio, por citar solo algunas. Como señala Anastasi
1960) sobre el modelo logístico de un parámetro. (1988) en la sexta edición de su incombustible
Sea como fuere, el libro de Lord y Novick, de Psychological Testing, la década de los ochenta ha
áspera lectura y notación infernal, marca un antes sido un período de avances inusuales en teoría de los
y un después en la teoría de los test: terminaba una test, tanto respecto al progreso tecnológico como a
época, la clásica, y comenzaba otra nueva marcada la sofisticación teórica o la mejora de la responsabi­
por el predominio absoluto de la TRI. La nueva no lidad profesional. Esta década vendrá marcada por
negaba la anterior, aunque, como señalara Lord una hegemonía clara de los modelos de TRI, como
(1980), utilizará poco de ella para su formulación. puede comprobarse echando una ojeada a los con­
Veamos a grandes rasgos cuáles eran las innovacio­ gresos de las sociedades psicométricas europea y
nes que aportaba la TRI. La teoría clásica hallába­ americana, o a las revistas, y por la aparición de
se enfrentada con dos problemas de fondo impor­ monografías independientes para cada una de las
tantes que no encontraban una solución satisfactoria áreas ahora vigorizadas por la TRI. No obstante, no
en el marco clásico. Por un lado, la medición de las debe sacar el lector la impresión de que esta hege­
variables no era independiente del instrumento uti­ monía de la TRI supone la muerte del enfoque clá­
lizado, algo así como si la longitud de los objetos sico, ni mucho menos, pues la parsimonia y sencillez
dependiese del tipo de regleta. Por ejemplo, si la in­ del modelo lineal clásico lo hacen apropiado en nu­
teligencia de dos personas se mide con test distintos, merosas situaciones en las que la maquinaria pesada
los resultados de las mediciones no están en la mis­ de la TRI no puede maniobrar con eficacia.
ma escala; luego estrictamente no sabríamos cuál de A la vista de este panorama general de la teoría
las dos es más inteligente. Naturalmente, se había de los test esbozado en las líneas precedentes, se
desarrollado todo un conjunto de soluciones técni­ comprenderá la limitada dimensión de lo que se
cas para paliar el problema y poder equiparar las pretende presentar en las páginas que siguen, cuyo
puntuaciones, pero se carecía de una solución digna objetivo no es otro que ofrecer al lector de lengua
de una medición aspirante al adjetivo de científica. hispana una exposición clara y comprensiva de los
En pocas palabras, las mediciones no eran invarian­ aspectos fundamentales del enfoque clásico de los
tes respecto de los instrumentos de medida. Por otro test y de la teoría de respuesta a los ítems, indican­

© Ediciones Pirámide
Introducción / 19

do en cada caso las fuentes adecuadas que permitan el primero que aplicó la tecnología estadística para
a quien lo desee una mayor profundización y pre­ analizar los datos provenientes de sus test, labor
paración para comprender cabalmente los recientes que continuará Pearson. Como bien señala Boring
avances de la teoría de los test, que no son pocos. (1950), si la década de los ochenta del siglo pasado
viene marcada por Galton, la de los noventa vendrá
Nota histórica sobre los test por Cattell y la primera de este siglo por Binet. Ja­
mes McKeen Cattell (1860-1944) será el primero en
El desarrollo de la teoría de los test esbozado en utilizar el término «test mental» en su artículo
el apartado anterior corre parejo con la evolución «Mental test and measurements» publicado en la
de los test concretos que van surgiendo, y como es revista Mind en 1890, pero sus test, al igual que los
natural, ambos desarrollos influyen el uno sobre el de Galton, a quien por cierto admiraba, eran de
otro: los avances teóricos sobre los test y estos y sus carácter sensorial y motor fundamentalmente, y el
problemas sobre los progresos teóricos. Bien es ver­ análisis de los datos dejó clara la nula correlación
dad que el avance no ha sido completamente sincro­ entre este tipo de pruebas y el nivel intelectual de
nizado y en algunos momentos históricos una línea las personas (Wissler, 1901).
se ha adelantado por un tiempo a la otra, para lue­ Será Binet (Binet y Simon, 1905a) quien dé un
go volver a equilibrarse, como buenos vasos comu­ giro radical en la filosofía de los test al introducir
nicantes que son. Así como el hacer suele preceder en su escala tareas de carácter más cognoscitivo,
al pensar, los test como instrumentos se han antici­ encaminadas a evaluar aspectos como el juicio, la
pado a su fundamentación teórica. Los orígenes comprensión y el razonamiento, que según él cons­
remotos de los primeros test podrían rastrearse se­ tituían los componentes fundamentales del com­
gún Du Bois (1970) allá por el año 3000 a.C., cuan­ portamiento inteligente. La puntuación de los niños
do los emperadores chinos evaluaban la competen­ en la escala de Binet y Simon se expresaba en tér­
cia profesional de sus oficiales. Pero los orígenes minos de edad mental, que no era otra cosa que la
más cercanos que darán lugar a los actuales test hay edad cronológica de los niños que obtenían la mis­
que ubicarlos en aquellas primeras pruebas senso­ ma puntuación media que el niño evaluado. Segu­
motoras utilizadas por Galton (1822-1911) en su ramente no es ajena al éxito alcanzado por la esca­
famoso laboratorio antropométrico de Kensington. la esta forma tan sencilla y comprensible para los
En 1884, durante la Exhibición Internacional sobre no profesionales de expresar las puntuaciones de
la Salud, que tuvo lugar en Londres, por la módica los niños. En la revisión de la escala que llevó a
suma de tres peniques Galton medía a los visitantes cabo Terman en la Universidad de Stanford, y que
todo un conjunto de índices antropométricos y sen­ se conoce como la revisión Stanford-Binet (Terman,
somotores luego utilizados en sus estudios, como, 1916), se utilizó por primera vez el cociente intelec­
por ejemplo, las dimensiones de la cabeza, estatura, tual (CI) para expresar las puntuaciones. La idea
longitud de los brazos extendidos, peso, fuerza de era originaria de Stern, que en 1911 propuso dividir
ambas manos, capacidad respiratoria, agudeza vi­ la edad mental (EM) entre la cronológica (EC),
sual de ambos ojos, altura sentado, longitud del multiplicando por 100 para evitar los decimales:
brazo, agudeza auditiva, tiempo de reacción visual
y auditivo, precisión al dividir una línea en dos y
EM
tres partes iguales, error al estimar la apertura de CI = × 100
un ángulo de 90 grados y otro de 60, etc. Hoy en­ EC
contramos natural que al tratar de relacionar estas
medidas con el funcionamiento intelectual no se en­ Esta fructífera veta de las escalas individuales
contrase conexión alguna, pero la hipótesis galto­ de inteligencia abierta por Binet en 1905 y que se
niana de origen (Galton, 1883) tenía su lógica: si los continúa hasta nuestros días había intuido, mejor
datos sobre los que operamos han de ser filtrados que la hipótesis galtoniana, que si se desea evaluar
por los sentidos, aquellos que contasen con sensores el potencial intelectual hay que utilizar tareas cog­
más finos dispondrían de un campo más amplio de noscitivamente complejas, que se asemejen de al­
actuación. También cabe a Galton el honor de ser gún modo al tipo de cometidos intelectuales que se

© Ediciones Pirámide
20 / Introducción a la Psicometría

pretende predecir. Puede decirse que el éxito de es­ damentales del funcionamiento inteligente: com­
tas escalas para predecir el rendimiento escolar dé­ prensión verbal, fluidez verbal, aptitud numérica,
bese en gran medida al parecido de las tareas exi­ aptitud espacial, memoria, rapidez perceptiva y ra­
gidas por ambos lados, escala y escuela. De hecho zonamiento general. Dando más importancia a un
la causa próxima para que Binet pusiese manos a factor general de inteligencia que articularía jerár­
la obra de confeccionar su escala fue un encargo quicamente otros factores de grupo (escuela ingle­
del Ministerio de Instrucción Pública para la detec­ sa), o reclamando un plano de igualdad para facto­
ción y educación de los niños con deficiencias de res múltiples (escuela americana), el hecho central
inteligencia que asistían a las escuelas de París. fue que el análisis factorial había permitido estruc­
Para una buena exposición de la escala, así como turar, no sin polémicas, la otrora genérica puntua­
las sucesivas revisiones llevadas a cabo, véase Anas­ ción global de la inteligencia. En ocasiones los mo­
tasi (1988). delos alcanzaron grados de fragmentación rayanos
El paso siguiente en el devenir histórico de los en el desmenuzamiento, como en el caso de Guil­
test vendrá marcado por la aparición de los test de ford (1967), que propone nada menos que 120 ras­
inteligencia colectivos, propiciados por la necesidad gos intelectuales. Los distintos modelos darán lugar
del ejército estadounidense en 1917 de seleccionar y a numerosas baterías de test (PMA, DAT, GATB,
clasificar a los soldados que iban a tomar parte en TEA, etc.) de uso habitual actualmente. Excede por
la Primera Guerra Mundial. Un comité dirigido completo del cometido de estas líneas tratar de de­
por Yerkes diseñó a partir de diverso material ya cir algo acerca del problema subyacente de la natu­
existente, especialmente de test inéditos de Otis, los raleza de la inteligencia; la literatura al respecto es
hoy famosos test Alfa y Beta, el primero para la ciertamente abundante, y se aconseja al lector inte­
población general y el segundo para utilizar con resado la consulta de textos en español como los de
analfabetos o reclutas sin dominio del inglés. Tras Juan-Espinosa (1997) o Colom (1995, 2002).
numerosas revisiones, estos test todavía siguen en A la vez que se producían los desarrollos cita­
uso. Debido a su éxito en el ejército, una vez finali­ dos en el campo de los test cognoscitivos, también
zada la guerra la industria y el resto de las institu­ los test de personalidad se beneficiaban de los avan­
ciones en general adoptaron en masa el uso de los ces técnicos que se iban produciendo, especialmen­
test, conociéndose una expansión sin precedentes te los derivados del análisis factorial y otras técni­
durante la próxima década, aunque no siempre en cas multivariadas afines. Suele citarse como origen
las mejores condiciones, debido por un lado a las próximo de los cuestionarios de personalidad de
limitaciones de los propios test, todavía un tanto carácter psicométrico la hoja de datos personales
rudimentarios, y por otro al uso de las puntuacio­ utilizada por Woodworth en 1917 durante la Prime­
nes más allá de lo que era razonable. ra Guerra Mundial para la detección de neuróticos
Con la experiencia acumulada iba quedando graves. En la actualidad, la sofisticación técnica en
cada vez más claro que una puntuación global de la construcción y análisis de los test de persona­
inteligencia tal como la medían estos test no descri­ lidad, que son legión (CEP, EPI, MMPI, 16PF,
bía con suficiente precisión los diferentes aspectos CPI, etc.), no se diferencia en nada de la utilizada
del funcionamiento intelectual de las personas, y se con los test de aptitudes, si bien existen problemas
imponía la evaluación de características más espe­ específicos en unos y otros. Por su parte, el psi­
cíficas cara a realizar pronósticos particulares más quiatra suizo Rorschach propone en 1921 su famo­
precisos. Si bien ello ya se venía haciendo de un so test proyectivo de manchas de tinta, al que se­
modo más o menos sistemático, con la aparición de guirán otros test proyectivos de muy distinto tipo
las hoy clásicas baterías de aptitudes habrá de espe­ de estímulos y tareas, aunque basados en la discu­
rar a que la técnica del análisis factorial dé sus fru­ tible asunción de la proyección, entre los que cabe
tos a partir de los años treinta y sobre todo cuaren­ citar el TAT, CAT, test de frustración de Rosen­
ta. Su producto más genuino serán las aptitudes zweig, etc. Sin embargo, la técnica proyectiva que
mentales primarias de Thurstone (Thurstone, 1938; puede considerarse pionera es la asociación de pa­
Thurstone y Thurstone, 1941), que conformaban lo labras o test de asociación libre, descrita por Gal­
que entonces se consideraban los componentes fun­ ton y utilizada incluso en el laboratorio por Wundt

© Ediciones Pirámide
Introducción / 21

y Cattell, aunque siguiendo las prácticas de Krae­ TABLA 1.1


pelin y Jung pronto se asoció con la clínica, espe­ Formulación del modelo
cialmente con la psico­analítica.
Quede ahí esta somera nota histórica para ubi­ Modelo: X = V +e
car al lector en el devenir de los test. Una excelen­
te panorámica, así como la descripción y clasifica­ Supuestos: l. V = E(X )
ción de los test más importantes, pueden verse en
Anastasi y Urbina (1997). Para estudios históricos 2. r(n, e) = 0
más detallados véanse Goodenough (1949), Du
3. r(ej, ek) = 0
Bois (1970) o Geisinger y Usher-Tate (2016), y
para una información enciclopédica y detallada so­ Definición: Dos test, j y k, se denominan parale­
bre test concretos, véanse las sucesivas ediciones de los si la varianza de los errores es la
los Mental Mesurement Yearbooks editados por misma en ambos [s 2(ej) = s 2(ek)] y
Buros. también lo son las puntuaciones ver­
daderas de los sujetos (Vj = Vk).

2. MODELO LINEAL CLÁSICO


El modelo establece que la puntuación empíri­
Como ya se ha señalado en el apartado anterior, ca (X ) que obtiene una persona en un test es igual
el modelo lineal clásico hunde sus raíces en los tra­ a la suma de dos componentes: la puntuación ver­
bajos pioneros de Spearman (1904, 1907, 1913). En dadera (V ) de la persona en ese test y el error de
los años siguientes conoce un rápido desarrollo y medida (e) cometido en la medición. Es razonable
Gulliksen (1950) recoge y sistematiza lo hecho has­ pensar que la puntuación empírica que obtiene
ta entonces. Lord y Novick (1968) llevarán a cabo una persona cuando se le aplica un test en un mo­
una reformulación y análisis del modelo, a la vez mento dado no coincida exactamente con su ver­
que abren nuevas y fructíferas vías para la teoría de dadera puntuación en ese test, pues en ese momen­
los test. Exposiciones menos técnicas del corpus clá­ to puntual la persona está afectada por múltiples
sico pueden consultarse en Guilford (1936, 1954), factores de difícil control que inciden en su con­
Magnuson (1967), Allen y Yen (1979), Thorn­dike ducta. Una clasificación bastante exhaustiva de
(1982), Crocker y Algina (1986), y en español Yela estas hipotéticas fuentes de error puede consultar­
(1987), Muñiz (2002), Martínez Arias et al. (2006) se en Stanley (1971). Si estos factores perjudican a
o Abad et al. (2011). la persona, obtendrá una puntuación empírica más
A continuación se exponen los aspectos funda­ baja de la que verdaderamente le correspondería;
mentales del modelo lineal clásico, su formulación, si le benefician, la obtendrá superior. Ahora bien,
asunciones y deducciones más significativas. Aun­ cuando se pasa un test a una persona no hay ma­
que resulte obvio, no conviene perder de vista que nera de saber su puntuación verdadera, lo único
el objetivo central del modelo es la estimación de que tenemos es su puntuación empírica, es decir,
los posibles errores cometidos cuando se utilizan los los puntos que saca en el test; su puntuación ver­
test para medir variables psicológicas. La necesidad dadera habrá que estimarla basándonos en los su­
de un modelo para estimar los errores de medida, puestos del modelo.
en psicología como en cualquier otra ciencia, pro­
viene del hecho elemental de que los errores no son Supuesto 1
observables directamente; lo que se obtiene directa­
mente tras utilizar un instrumento de medida es el La puntuación verdadera (V ) es la esperanza
valor empírico «mezclado» con el error cuya cuan­ matemática de la empírica: V = E(X ), donde X es la
tía se desea estimar. La lógica general para la esti­ variable aleatoria «puntuación empírica de la perso­
mación de los errores es común a todas las ciencias, na». Este primer supuesto constituye en realidad
pero la naturaleza de lo psicológico añadirá incluso una definición de la puntuación verdadera. El lector
algunas complicaciones adicionales. poco familiarizado con el concepto de esperanza

© Ediciones Pirámide
22 / Introducción a la Psicometría

matemática puede hacerse una idea imaginando que Novick (1968) ofrecen formulaciones axiomáticas
se aplicase un test «infinitas» veces a la misma per­ rigurosas del modelo a las que se remite al lector
sona. También debe imaginar que cada aplicación ávido de elegancia matemática.
no afecta a las otras y que la persona no cambia en
el curso de las aplicaciones. En estas condiciones, la
puntuación verdadera de la persona en el test sería Definición
la media aritmética de las puntuaciones empíricas
obtenidas en las «infinitas» aplicaciones. La puntua­ Finalmente, se definen teóricamente los test pa­
ción verdadera es, por tanto, un concepto matemá­ ralelos, asumiéndose implícitamente que se pueden
tico. A partir de los valores de X (puntuaciones em­ construir de hecho. De un modo menos formal que
píricas), y bajo ciertos supuestos que se irán viendo, el señalado en su definición, podría decirse que dos
la TCT permite hacer estimaciones probabilísticas test se consideran paralelos si miden lo mismo pero
razonables acerca del valor de las puntuaciones ver­ con diferentes ítems. Lord y Novick (1968) han de­
daderas (V ). Conviene entenderlo bien, pues a me­ sarrollado además otros tipos de paralelismo. De­
nudo se ha hecho una conceptualización platónica nominan test «tau equivalentes» a aquellos con
de las puntuaciones verdaderas, considerándolas puntuaciones verdaderas iguales para las personas
algo mágico y estático, propiedad de las personas y en ambas formas, pero con varianzas error no ne­
que determina su conducta. Del modelo no se sigue cesariamente iguales. Test «esencialmente tau equi­
esta interpretación circular; la puntuación empírica valentes» serían aquellos en los que la puntuación
en un test es una muestra de conducta que si reúne verdadera de cada persona en uno de ellos es igual
ciertos requisitos de medida, y bajo ciertos supues­ a la del otro más una constante:
tos, permite hacer inferencias probabilísticas funda­
das. De esto trata la teoría de los test. V1 = V2 + K

Los autores desarrollan las implicaciones y ex­


Supuesto 2 tensiones de estas redefiniciones de paralelismo
para la TCT.
Se asume que no existe correlación entre las
puntuaciones verdaderas de las personas en un test
y sus respectivos errores de medida: r(v, e) = 0. En 3. DEDUCCIONES INMEDIATAS
principio no hay razón para pensar que el tamaño DEL MODELO
de los errores vaya sistemáticamente asociado al ta­
maño de las puntuaciones verdaderas. A continuación se presentan algunas de las de­
ducciones que se siguen directamente del modelo y
que se utilizarán más adelante. Véase en el apéndice
Supuesto 3 su obtención.

Los errores de medida de las personas en un test e=X−V [1.1]


no correlacionan con sus errores de medida en otro
test distinto: r(ej, ek) = 0. Si se aplican correctamen­ El error de medida (e) se define, por tanto,
te los test, los errores serán aleatorios en cada oca­ como la diferencia entre la puntuación empírica (X )
sión, y a priori no existe razón para que covaríen y la verdadera (V ).
sistemáticamente unos con otros.
Hay que señalar que ninguna de las asunciones E(e) = 0 [1.2]
del modelo es comprobable empíricamente de un
modo directo tal como están expresadas; por tanto, La esperanza matemática de los errores de me­
aunque plausibles y sensatas a priori, habrá que ha­ dida es cero; luego son errores insesgados.
cer deducciones que sí se puedan contrastar y con­
firmen o falseen el modelo. Novick (1966) y Lord y µx = µv [1.3]

© Ediciones Pirámide
Introducción / 23

La media de las puntuaciones empíricas es igual La correlación entre las puntuaciones empíricas
a la media de las verdaderas. y los errores es igual al cociente entre la desviación
típica de los errores y la de las empíricas.
cov (V, e) = 0 [1.4]
µ1 = µ2 = … = µk [1.9]
Las puntuaciones verdaderas no covarían con
s (X1) = s (X2) = … = s (Xk)
2 2 2
[1.10]
los errores, lo cual es inmediato del supuesto 2 del
modelo. r(X1, X2) = r(X1, X3) = … = r(Xj, Xk) [1.11]

cov (X, V ) = var (V ) [1.5] Es decir, para K test paralelos, las medias [1.9],
las varianzas [1.10] y las intercorrelaciones entre
La covarianza entre las puntuaciones empíricas ellos [1.11] son iguales.
y las verdaderas es igual a la varianza de las verda­ Las ocho primeras deducciones son meras tau­
deras. tologías, no se pueden contrastar empíricamente,
mientras que sí se pueden someter a prueba empí­
cov (Xj, Xk) = cov (Vj, Vk) [1.6] rica las tres últimas. Nótese que el modelo y las de­
ducciones están formulados para los valores para­
La covarianza entre las puntuaciones empíricas métricos de la población. En términos generales
de dos test es igual a la covarianza entre las verda­ —ya se irá matizando esta afirmación—, la teoría
deras. clásica de los test asume que los estadísticos obte­
nidos en muestras suficientemente amplias consti­
var (X ) = var (V ) + var (e) [1.7] tuyen estimadores apropiados de los valores de la
población. Cuanto más amplias sean las muestras,
La varianza de las puntuaciones empíricas es más pertinente será esta lógica. Lord y Novick
igual a la varianza de las verdaderas más la de los (1968) proporcionan algunos estimadores más refi­
errores. nados para el caso de que las muestras no sean su­
ficientemente amplias o no se cumplan estrictamen­
r(X, e) = se /sx [1.8] te las condiciones de paralelismo.

© Ediciones Pirámide

También podría gustarte