Antecedentes Historicos de Las Pruebas Actuales

Antecedentes Histricos de las pruebas actuales
Una breve revisin de los ant ecedentes histricos y los orgenes de las pruebas
psicolgicas nos brindar un panorama til para comprender las pruebas actuales. La
direccin en que stas han avanzado, as como sus limitaciones y ventajas especiales,
podrn entenderse mejor al considerarlas a la luz de sus precursores. En este captulo
nos concretaremos a la revisin de los antecedentes y el desarrollo inicial del movimiento
psicomtrico como un too. En los captulo0s posteriores analizaremos los desarrollos ms
recientes relacionados con algunos instrumentos especficos, como los tests de habilidad
a los de inters, as como con las reas (educativas, industrial, clnica y de consejera) en
las que se utilizan tales instrumentos.
Las races de la aplicacin de pruebas se pierden en la Antigedad. Existen relatos del

sistema de exmenes del servicio civil que prevaleci en el imperio chino durante 2 000
aos (Bowman, 1989). Entre los antiguos griegos, la aplicacin de exmenes formaba
parta del proceso educativo; las pruebas servan para evaluar el dominio de habilidades
fsicas e intelectuales (Doyle.1974). Desde sus inicios en la Edad Media, las
universidades europeas basaron los grados y honores en exmenes formales. Con todo,
no tenemos que ir ms all del siglo XIX para identificar los principales acontecimientos
que forman la base de las pruebas contemporneas, y a ellos dirigimos ahora nuestra
atencin.
INTERS INICIAL EN LA CLASIFICACIN Y LA CAPACITACIN DE LAS PERSONAS

CON RETARDO MENTAL
El siglo XIX atestigu el surgimiento del inters por el tratamiento de las personas
insanas y las que sufran de retardo mental. Hasta ese momento, el destino comn de
tales individuos era el descuido, el ridculo e incluso la tortura. Con la
nueva
preocupacin por el cuidado adecuado de la gente con problemas mentales, se hizo

evidente la necesidad de contar con criterios uniformes para su identificacin y
clasificacin, necesidad que se volvi verdaderamente urgente con la proliferacin de
instituciones sociales dedicadas a estas personas en todo el mundo. Primero era
necesario distinguir entre los individuos insanos y les que sufran de retraso mental. Los
primeros manifestaban trastornos emocionales que podran o no estar acompaados por

un deterioro intelectual a partir de un nivel normal; los segundos se caracterizaban
principalmente por una deficiencia intelectual que estaba presente desde el nacimiento o
la primera infancia. El Primer informe explicito de esta distincin se encuentra quiz en un
trabajo publicado en 1838 por el mdico francs Esquirol. Se trata de dos volmenes en
los que dedica ms de 100 pginas a lo que ahora se conoce como retardo mental.
Esquirol tambin seala que existen muchos grados de retardo, que varan desde la
normalidad hasta la Idiotez profunda. En su esfuerzo por elaborar un sistema para
clasificar los diversos grados y variedades de retardo, Esquirol prob varios
procedimientos y llego a la conclusin de que el habla proporciona el criterio ms
confiable del nivel intelectual del individuo. Es importante decir que los criterios actuales
para determinar el retardo mental tambin son principalmente lingsticos y que los test
actuales inteligencia tienen una fuerte carga de contenido verbal. En los captulos
siguientes mostraremos la importante funcin que cumple la habilidad verbal en nuestro
concepto de inteligencia.
De especial significado las contribuciones de otro mdico francs. Seguin, quin fue
pionero en la capacitacin de los retardos. Luego de rechazar la idea dominante de que el
retardo mental era incurable, Seguin (1866/1907) experiment durante muchos aos con
lo que llam el mtodo fisiolgico de capacitacin, y en 1837 estableci la primera escuela
dedicada a la educacin de los nios retardados. En 1848 emigr a los Estados Unidos,
en donde sus ideas obtuvieron un amplio reconocimiento. Seguin fue el creador de
muchas de las tcnicas de entrenamiento sensorial y muscular que despus fueron
adoptados por las instituciones de asistencia a los retrasados. Con esos mtodos, los
nios con retardo profundo reciben ejercicio intensivo en discriminacin sensorial y para el
desarrollo del control motor. Algunos de los procedimientos que estableci Seguin con
este propsito fueron luego incorporados a los test de inteligencia no verbal o de
ejecucin. Un ejemplo de lo anterior es el Tablero de formas* de Seguin (Seguin Form
Board), en el que el individuo debe insertar bloques de distinta apariencia en los huecos
correspondientes tan rpidamente como prueba.
Ms de medio siglo despus del trabajo de Esquirol y Seguin, el psiclogo francs Alfred
Bidet recomendaba que los nios que no lograran responder a la educacin normal fueran
evaluados antes de expulsarlos y que, de ser considerados educables, fueran asignados
a cursos de educacin especial (T. H. Wolf, 1973). Con sus compaeros de la Sociedad
para el Estudio Psicolgico del Nio, Binet exhort al ministro de instruccin Pblica a
emprender acciones para mejorar las condiciones de los nios retardados. Un resultado
especial fue el establecimiento de una comisin ministerial a cargo de Binet para el
estudio de estos infantes. Tal designacin fue un acontecimiento trascendental en la
historia de las pruebas psicolgicas.
LOS PRIMEROS PSICLOGOS EXPERIMENTALES
En general, los primeros psiclogos experimentales del siglo XIX no estaban interesados
en la medicin de las diferencias individuales. Su objetivo principal era la formulacin de
descripciones generalizadas desde la conducta humana, lo que supone que su atencin
se concentraba en la uniformidades ms que en las diferencias conductuales, y que, por
lo tanto, las diferencias individuales eran ignoradas o aceptadas como un mal necesario
que limitaba la aplicabilidad de las generalizaciones. As, el hecho de que un individuo
reaccionara de manera diferente a otro en las mismas condiciones era considerado como
un error, o variabilidad individual, que disminua la exactitud de las generalizaciones. sta
era la actitud hacia las diferencias individuales que prevaleca en los laboratorios como el
fundado por Wundt en Leipzig en 1879, donde se formaron muchos de los primeros
psiclogos experimentales.
Al elegir sus reas de estudio, como en muchas otras fases de su trabajo, los fundadores
de la psicologa experimental evidenciaban la influencia de sus antecedentes en la
fisiologa y la fsica. Los problemas que estudiaban en sus laboratorios tenan que ver
principalmente con el tiempo de reaccin y con la sensibilidad a estmulos sensoriales
como los visuales y los auditivos. Como veremos en otros captulos, este acento en los
fenmenos sensoriales refleja tambin la naturaleza de las primeras pruebas psicolgicas.
Otra influencia que la psicologa experimental del siglo XIX ejerci en el curso del
movimiento psicomtrico se manifiesta en su insistencia por ejercer un control riguroso de
las condiciones en las que se realizan las observaciones; por ejemplo, la forma de dar las
instrucciones en un experimento de tiempo de reaccin puede aumentar o disminuir de
modo notable la velocidad de la respuesta, y el brillo o el color del fondo puede alterar
marcadamente la apariencia de un estmulo visual, lo que demuestra la importancia de
todos los participantes del experimento sean observados en condiciones estandarizadas.
Esta estandarizacin del procedimiento lleg a convertirse en una de las seales

distintivas de las pruebas psicolgicas.
CONTRIBUCIONES DE FRANCIS GALTON
El bilogo ingls Francis Galton fue el principal responsable del inicio del movimiento
psicomtrico. Un factor comn en las numerosas y variadas actividades de investigacin
de Galton fue su inters por la herencia humana. En el curso de sus investigaciones sobre
esta materia, Galton se dio cuenta de la necesidad de medir las caractersticas de
personas que estaban y no emparentadas, ya que slo de esta manera poda descubrir,
por ejemplo, el grades exacto de parecido entre padres e hijos, hermanos y hermanas,
primos o gemelos. Con este propsito, Galton convenci a diversas instituciones
educativas de que llevaran registros antropomtricos sistemticos de sus estudiantes.
Tambin estableci un laboratorio antropomtrico en la Exposicin internacional de 1884
donde, mediante el pago de tres peniques, se medan ciertos rasgos fsicos de los
visitantes y se los someta a pruebas de agudeza visual y auditiva, fuerza muscular,
tiempo de reaccin y otras funciones sensoriomotoras simples. Cuando la exposicin
cerr, Galton transfiri el laboratorio al Museo de South Kensington, en Londres, donde
trabaj durante seis aos. Con estos mtodos se acumul gradualmente el primer cuerpo
sistemtico de datos sobre diferencias individuales en los procesos psicolgicos simples.
El propio Galton elabor varias de las pruebas aplicadas en su laboratorio, muchas de las
cuales siguen siendo conocidas, sea en su forma original o modificada. Entre los ejemplos
se encuentran la barra de Galton para la discriminacin visual de la longitud, el silbato que
lleva su nombre para determinar el mayor tono audible y una serie graduada de pesos
para medir la discriminacin sensorial podan servir para estimar el intelecto. A este
respecto, haba sido tambin la influencia de las teoras de Loche. As, Galton escribi:
La nica informacin concerniente a los acontecimientos externos que nos alcanza
parece pasar por la avenida ele los sentidos, y entre ms perceptivos sean los sentidos de
las diferencias, mayor ser el campo sobre el que pueden actuar nuestro juicio y nuestra
inteligencia (Galton, 1883, p. 27). Galton tambin se percat de que las personas con
retardo mental extremo tienden a mostrar defectos en su capacidad para discriminar entre
calor, fro y dolor, una observacin que posteriormente fortaleci su conviccin de que la
capacidad de discriminacin sensorial, en conjunto, sera ms elevada entre los

intelectualmente aptos (Galton, 1883, p. 29).
Galton tambin fue pionero en la aplicacin de escalas ele calificacin y cuestionarios, as

como en el uso de la tcnica de asociacin libre que posteriormente fue utilizada con
diversos propsitos. Otra de sus muchas contribuciones se encuentra en la formulacin
de mtodos estadsticos para el anlisis de datos sobre las diferencias individuales.
Galton tom y adapt algunas tcnicas matemticas de forma que pudieran sir utilizadas
por investigadores sin conocimientos en lo materia que desearan tratar en forma
cuantitativa los resultados de sus pruebas. De esta manera extendi considerablemente la
aplicacin de los procedimientos estadsticos al anlisis de datos de las pruebas. Esta
fase del trabajo de Galton fue llevada adelante por muchos de sus estudiantes, de los
cuales Karl Pearson fue el ms eminente.
CATTELL Y LOS PRIMEROS TESTS MENTALES
El psiclogo estadounidense James McKeen Cattell ocupa una posicin prominente en el

adelanto de las pruebas psicolgicas. En su trabajo se combinan la recin establecida
ciencia de la psicologa experimental y el todava ms reciente movimiento psicomtrico.
Para obtener su doctorado en Leipzig redact una tesis sobre el tiempo de reaccin bajo
la direccin de Wundt; y en 1888, mientras enseaba en Cambridge, su trato con Galton
fortaleci su inters por la medicin de las diferencias individuales. A su regreso a los
Estados Unidos, Cattell particip activamente en el establecimiento de laboratorios de
psicologa experimental y en la difusin del movimiento psicomtrico.
El trmino test mental apareci por primera vez en la bibliografa psicolgica en un

artculo escrito por Cattell en 1890, que describe una serle de pruebas que cada ao se
aplicaban a los estudiantes universitarios para determinar su nivel intelectual. Las
pruebas, cuya aplicacin era individual, incluan mediciones de la fuerza muscular,
velocidad de movimiento, sensibilidad al dolor, agudeza visual y auditiva, discriminacin
de pesos, tiempo de reaccin, memoria y cosas similares. En su eleccin de las pruebas,
Cattell comparta la opinin de Galton respecto a la posibilidad de obtener una medida de
las funciones intelectuales con el uso de instrumentos de discriminacin sensorial y de
tiempo de reaccin. La preferencia de Cattell por dichas herramientas tambin se sustent

en el hecho de que le permitan medir con precisin y exactitud las funciones simples,
mientras que la obtencin de mediciones objetivas de funciones ms complejas en ese
tiempo pareca una tarea inalcanzable.
Las pruebas de Cattell son caractersticas de los instrumentos desarrollados en la ltima
dcada del siglo XIX, que se aplicaban a escolares, universitarios y adultos. En la
Exposicin de Columbia realizada en Chicago durante 1893, Jastrow mont una
exhibicin en la que a los visitantes se los invitaba a realizar pruebas de procesos
preceptales, sensoriales y motores simples y a comparar su habilidad con las normas (j.
Peterson, 1926, Philippe, 1894). Los pocos intentos por evaluar estas primeras prueba
arrojaron resultados desalentadores. El desempeo de cada individuo mostraba poca
correspondencia de una prueba a otra (Sharp, 18981899; Wissler, 1901) y su relacin
con estimaciones independientes del nivel intelectual basadas en las calificaciones de los
maestros (T. L. Bolton, 18911892;). A. Gilbert, 1894) o con las calificaciones
acadmicas (Wissler, 1901) era poca o nula.
Algunas pruebas elaboradas por psiclogos europeos de la poca tendan a cubrir

funciones algo ms complejas. Kraepelin (1895), que estaba interesado sobre todo en la
evaluacin clnica de pacientes psiquitricos, prepar una larga serie de pruebas para
medir lo que consideraba factores bsicos en la caracterizacin del individuo. Las
pruebas, que empleaban principalmente operaciones aritmticas simples, estaban
destinadas a medir los efectos de la prctica, la memoria y la susceptibilidad a la fatiga la
distraccin Otro psiclogo alemn, Ebbinghaus (1897), aplico a escolares pruebas de
clculo aritmtico, memoria y completacin de oraciones; esta ltima, que era la ms
compleja, fue la nica que mostr una clara correspondencia con el desempeo escolar,
En un artculo publicado en Francia en 1895, Binet y Henri criticaron el hecho de que casi
todas las pruebas disponibles eran sensoriales y se concentraban indebidamente en
habilidades especializadas simples. Adems argumentaban que en la medicin de las
funciones ms complejas no se requieren de gran precisin, ya que, en tales funciones,
las diferencias individuales son mayores. Propusieron una amplia y variada lista de test
que cubran funciones como la memoria, la imaginacin, la atencin, la comprensin, la
susceptibilidad a la sugestin, la apreciacin esttica y muchos otros, en los que podemos
reconocer las tendencias que a la postre condujeron al desarrollo de las famosas escalas
de inteligencia de Binet.
BINET Y EL SURGIMIENTO DE LOS TESIS DE INTELIGENCIA
Binet y sus colaboradores dedicaron muchos aos a la investigacin activa e ingeniosa de

las formas de medir la inteligencia. Probaron muchos mtodos, incluyendo la medicin de
las formas del crneo, la cara y la mano, as como el anlisis de la escritura; sin embargo,
los resultados los llevaron a la conviccin de que la medicin directa, aunque tosca, de las
funciones intelectuales complejas era la ms promisoria. Entonces una situacin en
particular hizo fructificar los esfuerzos de Binet. En 1904, el Ministerio de Educacin lo
comision para que estudiara procedimientos para la educacin de nios retardados. Fue
en relacin con los objetivos de esta comisin que Binet prepar, en colaboracin con
Simn, la primera escala de Binet-Simn (Binet y Simn,1905).
Esta escala, conocida como la escala de 1905, constaba de 30 problemas o test
arreglados en orden de dificultad creciente. El nivel de dificultad se estableci
empricamente aplicndolos a 50 nios normales de tres a 11 aos y a algunos nios y
adultos retardados. Las pruebas fueron diseadas para cubrir una amplia variedad de
funciones, con nfasis especial en el juicio, la comprensin y el razonamiento, que Binet
consideraba los componentes principales de la inteligencia. Aunque incluyeron pruebas
sensoriales y preceptales, en esta escala se encontraba una proporcin de contenido
verbal mayo que en la generalidad de las pruebas de la poca. Como la escala de 1905
fue presentada como un instrumento preliminar y tentativo, no se formul un mtodo
objetivo preciso para obtener una puntuacin total.
En la segunda escala, la de 1908, aument el nmero de test, se eliminaron algunos de la

primera que resultaron insatisfactorios y todos fueron agrupados en niveles de edad sobre
la base del desempeo de alrededor de 300 nios normales de entre tres y 13 aos. De
este modo, en el nivel de tres aos se ubicaron todos los test que pasaban del 80 al 90
por ciento de los nios normales de tres aos; en el nivel de cuatro aos, los que aprob
el mismo porcentaje de nios normales de esa edad; y as sucesivamente hasta los 13. La
calificacin del nio en toda la prueba poda entonces expresarse como el nivel mental
correspondiente a la edad de los nios normales cuya ejecucin haba igualado. En las
diversas traducciones y adaptaciones de las escalas de Binet el Trmino de nivel mental

fue sustituido por el de edad mental, cuyo fcil comprensin indudablemente contribuy
a popularizar los tests de inteligencia; sin embargo, el propio Binet evitaba el uso del
trmino por sus implicaciones no verificadas de desarrollo y prefera el ms neutral de
nivel mental (T. H. Wolf, 1973)
En 1911, ao en que Binet muri intempestivamente, apareci la tercera revisin de la
Escala de Binet-Simn, que no presenta mayores modificaciones, salvo revisiones
menores, cambios en la localizacin de algunos tests, la adiccin de otros en varios
niveles de edad y la extensin de la escala al nivel adulto.
Incluso antes de la revisin de 1908, los tests de Binet-Simn atrajeron la atencin de los
psiclogos de todo el mundo. En muchos pases, aparecieron traducciones y
adaptaciones, pero la primera fue la de H. H. Goddard, en ese entonces psiclogo
investigador en la Escuela de Capacitacin de Vineland para nios con retardo mental. La
revisin de Goddard result clave para que la profesin mdica aceptara los tests de
inteligencia (Zenderland, 1987). Apareci en un momento propicio para satisfacer la
urgente necesidad de un instrumento estandarizado para diagnosticar y clasificar a las
personas con retardo mental. No obstante, como herramienta de evaluacin pronto fue
dejada atrs por el Stanford-Binet, un instrumento ms extenso y psicomtricamente
refinado, elaboro por L. M. Terman y sus colaboradores en la Universidad de Stanford(
Terman, 1916). Este instrumento utiliz por primera vez el cociente de inteligencia (CL) o
razn entre la edad mental y la cronolgica. La ltima revisin se emplea extensamente y
la estudiaremos de manera ms completa en el captulo 8. Tambin resulta de especial
inters la primera revisin Kuhlmann-Binet, que ampli la escala hasta la edad de tres
meses (Kuhlmann, 1912) y representa uno de los primeros esfuerzos por elaborar test de
inteligencia para preescolares e infantes.
PRUEBAS COLECTIVAS
Los tests de Binet, as como todas sus revisiones, son escalas individuales en el sentido
de que slo pueden aplicarse a una persona y luego a otra. Muchos de los test de esas
escalas requieren respuestas orales del examinado o la manipulacin de materiales.
Algunos exigen tomar el tiempo de las respuestas de cada individuo. Por stas y otras
razones, las pruebas no pueden adaptarse a la aplicacin colectiva. Otras caracterstica
de los tests de Binet es que requieren de un examinador muy capacitado, pues se trata de
instrumentos esencialmente clnicos adecuados para el estudio intensivo de casos
individuales.
Las pruebas de grupo similares a la primera escala de Binet fueron elaboradas para
satisfacer una necesidad prctica. Cuando los Estados Unidos ingresaron en 1917 en la
Primera Guerra Mundial, la asociacin Estadounidense de Psicologa form una comisin
para considerar como poda contribuir la psicologa a la conduccin de la guerra. La
comisin, dirigida por Robert M. Yerkes, reconoci la necesidad de la rpida clasificacin
del nivel intelectual general del milln y medio de reclutas. Esta informacin era
importante para tomar muchas decisiones administrativas, incluyendo el rechazo o la
dispensa del servicio militar, la asignacin a diferentes servicios o la admisin a campos
de entrenamiento de oficiales. En este ambiente se formul el primer test colectivo de
inteligencia. Para realizar la tarea, los psiclogos acudieron a todos los materiales
disponibles, especialmente a un test colectivo de inteligencia no publicado, preparado por
Arthur S. Otis, que cedi al ejrcito. Una contribucin importante de este instrumento,
elaborado por Otis cuando era estudiante en uno de los cursos de grado de Terman, fue
la introduccin de preguntas de opcin mltiple y otros reactivos objetivos.
Las pruebas que finalmente desarrollaron los psiclogos del ejrcito podan aplicarse a
grupos grandes y llegaron a conocerse como Army Alpha y Army Beta (pruebas Alfa y
Beta). La primera se ocupaba de las pruebas generales de rutina, mientras que la
segunda era una escala no lingstica utilizada con reclutas iletrados o procedentes de
pases cuyo idioma no era el ingls.
Poco despus de terminar la Primera Guerra Mundial, las pruebas del ejrcito fueron
liberadas para que se aplicaran a civiles; adems de pasar por muchas revisiones, las
pruebas Alfa y Beta sirvieron como modelo para la mayor parte de los tests colectivos de
inteligencia, lo que contribuy al notable crecimiento del movimiento psicomtrico. Muy

pronto se prepararon tests colectivos de inteligencia para todas las edades y personas,
desde preescolares hasta universitarios. Los programas de evaluacin a gran escala,
otrora imposibles, se emprendieron con gran entusiasmo. Como las pruebas colectivas
fueron diseadas como instrumentos de evaluacin masiva, no slo permitieron la
medicin simultnea de grandes grupos, sino que tambin simplificaron las instrucciones
y los procedimientos de aplicacin, con lo que disminuy la capacitacin requerida del
aplicador. Los maestros empezaron a aplicar en sus grupos los tests de inteligencia y los
estudiantes universitarios eran evaluados de rutina antes de su ingreso; se iniciaron
amplios estudios de grupos especiales de adultos, como los prisioneros, y muy pronto el
pblico general cobr conciencia del CI.
La aplicacin de esos tests colectivos excedi a su mejoramiento tcnico. En la prisa por

obtener puntuaciones y sacar conclusiones prcticas de los resultados, a menudo se
olvidaba que las pruebas an eran tcnicamente imperfectas, de modo que cuando no
lograban cumplir las injustificadas expectativas, se generaba escepticismo e hostilidad
hacia todas las pruebas. De este modo, el auge psicomtrico de los aos veinte, basado
en el uso indiscriminado de los instrumentos, puede haber demorado el progreso de las
pruebas psicolgicas.
TESTS DE APTITUD
Aunque al principio los tests de inteligencia fueron diseados para cubrir una amplia
variedad de funciones que permitieran estimar el nivel general de inteligencia del
individuo, pronto se hizo evidente que su alcance era muy limitado. No todas las funciones
importantes estaban representadas. De hecho, la mayor parte de los tests de inteligencia
eran principalmente mediciones de la habilidad verbal, en menor grado de la habilidad
para manejar relaciones numricas y otras relaciones abstractas y simblicas.
Gradualmente, los psiclogos reconocieron que el trmino test de inteligencia era un
nombre inadecuado, ya que slo medan ciertos aspectos de esta.
Para que resultaran seguros, los instrumentos tocaban habilidades que son de gran
importancia en la cultura para la que fueron diseados, pero pronto se reconoci la
conveniencia de contar con designaciones mas precisas en trminos de la informacin
que podan ofrecer; por ejemplo, ahora se conoce como tests de aptitud escolar a algunos
instrumentos que en los veinte habran sido llamados de inteligencia. Este cambio en la
terminologa procede del hecho de que muchos de los llamados tests de inteligencia
miden la combinacin de habilidades requeridas y fomentadas por el trabajo universitario.
Incluso antes de la Primera Guerra Mundial, los psiclogos empezaban a admitir la

necesidad de contar con tests de aptitudes especiales que complementaran los de
inteligencia global. En especial, se prepararon pruebas de aptitudes especiales para uso
en la orientacin vocacional y en la seleccin y clasificacin de personal industrial y
militar. Entre las ms empleadas estn los tests de aptitud mecnica, profesional, musical
y artstica.
La evaluacin crtica de las pruebas de inteligencia que sigui al uso indiscriminado

durante los veinte tambin revel el hecho notable de que el desempeo del individuo a
menudo mostraba una marcada variacin en diferentes partes de la prueba. Esto result
en especial evidente en las pruebas colectivas, en las que los reactivos suelen separarse
en subpruebas de contenido relativamente homogneo; por ejemplo, una persona poda
obtener una puntuacin ms bien alta en la subprueba verbal y un pobre resultado en la
numrica o viceversa. Dicha variabilidad interna es hasta cierto grado discernible en un
test como el Stanford-Binet en el que, por ejemplo, todos los reactivos que incluyen
palabras pueden resultar difciles para cierro individuo, mientras que los que emplean
imgenes o diagramas geomtricos pueden resultarle ventajosos.
Los usuarios, y sobre todo los clnicos, a menudo se valan de esas comparaciones
ciernas para obtener un conocimiento ms profundo de la estructura psicolgica del
individuo. De este modo, al evaluar un caso individual no slo se examinaba el CI o algn
otro resultado global, sino tambin el desempeo en grupos de reactivos o subtests; sin
embargo, en general no se recomienda esta prctica, porque los tests de inteligencia no
fueron diseados con el propsito de realizar un anlisis diferencial de las aptitudes. Con
frecuencia, los subtests comparados contienen muy pocos reactivos para producir una
estimacin estable o confiable de determinada habilidad. Entonces, la diferencia de las
puntuaciones de los subtests se puede revertir si vuelve a examinarse al Individuo otro da
o con otra forma del mismo instrumento. Para realizar esas comparaciones en el mismo
sujeto, es necesario disear las pruebas con el objeto de que revelen diferencias de
ejecucin en diversas funciones.
Al mismo tiempo que la aplicacin prctica demostraba la necesidad de contar con

mltiples tests de aptitud, un desarrollo paralelo en el estudio de la organizacin de los
rasgos iba proporcionando los medios para elaborarlos.
Los estudios estadsticos sobre la naturaleza de la inteligencia haban explorado las

relaciones entre las puntuaciones obtenidas por muchas personas en una gran variedad
de prueban. El psiclogo ingles Charles Spearman (1904, 1927) inici estas
investigaciones durante la primera dcada del siglo XX. Los desarrollos metodolgicos
subsecuentes, basados en 1 trabajo d estudiosos ingleses y estadounidenses, como T. E.
Kelley (1928) y L. L Thurstone 1938, 1947h), llegaron a conocerse como anlisis factorial.
En el captulo 11 examinaremos de manera exhaustiva las contribuciones de Ios mtodos

del anlisis factorial en la elaboracin de pruebas. Por ahora basta con destacar que los
datos obtenidos con estos procedimientos sealaron la presencia de diversos factores o
rasgos relativamente independientes, algunos representados en diversas proporciones en
los tests tradicionales de inteligencia, como, por ejemplo, la comprensin verbal y el
razonamiento numrico; otros, como la aptitud espacial, perceptual y mecnica, se
encuentran ms a menudo en los instrumentos para la medicin de aptitudes especiales
que en los de inteligencia.
Uno de los principales resultados prcticos del anlisis factorial fue el desarrollo de las
bateras de aptitudes mltiples, diseadas para proporcionar una medida la posicin del
individuo en una serie de rasgos. En lugar de una puntuacin total, o CI. Estos
instrumentos obtienen una puntuacin aparte para rasgos como la comprensin verbal, la
aptitud numrica, la visualizacin espacial, el razonamiento aritmtico y la rapidez
perceptual, lo que permite realizare el anlisis intrasujeto o diagnstico diferencial en el
mismo sujeto que los usuarios trataron de obtener por muchos aos con los resultados
crudos y a menudo errneos de los tests de inteligencia. Adems, dado que cubren
algunos de los rasgos que generalmente no se incluan en ese tipo de instrumentos
tambin incorporaron en un programa amplio y sistemtico de evaluacin gran parte de la
informacin que antes se obtena de las pruebas de aptitud especial.
Las bateras de aptitudes mltiples representan un desarrollo relativamente tarde en el

campo de las pruebas, ya que casi todas aparecieron a partir de 1945.
A este respecto es de destacar el trabajo de los psiclogos militares durante la Segunda
Guerra Mundial. Gran parte de la investigacin conducirla en las fuerzas armadas se bas
en el anlisis de factores y se orient a la preparacin de bateras de aptitudes mltiples;;
por ejemplo, en la fuerza area se construyeron bateras especiales para pilotos,
bomberos, operadores de radio, rastreadores y muchos otros especialistas. El informe las
bateras que elabor la fuerza area ocupa al menos nueve de los volmenes dedicados
al programa psicolgico de la aviacin durante la Segunda Guerra Mundial (Army Air
Forces, 19471948), La investigacin en esas lneas an sigue en progreso con el
patrocinio de varias ramas de las fuerzas armadas, Tambien se han realizarlo bateras
para uso civil y se aplican lo mismo en la orientacin vocacional y educativas que en la
seleccin y clasificacin de personal. En los captulos 10 y 17 presentaremos algunos
ejemplos.
Un adelanto ms reciente, surgido a finales de los ochenta y comienzos de los noventa,

permite la integracin de dos mtodos al principio contradictorios de medicin mental
representados por los tests tradicionales de inteligencia y las bateras de aptitud mltiples
(Anastasi, 1994). En la actualidad, se reconoce que la habilidad del ser humano puede ser
evaluada de manera adecuada a diferentes niveles de profundidad, desde las aptitudes
muy definidas de las pruebas especificas (o incluso de reactivos), pasando por el nivel de
los rasgos hasta una puntuacin global como el tradicional CI. Para cada propsito de
evaluacin hay un nivel apropiado de profundidad.
En correspondencia, los tests de inteligencia que se han desarrollado recientemente,

como las Escalas de Habilidad Diferencial o las Revisiones recientes de tests anteriores,
como la cuarta edicin del Stanford-Binet( que explicaremos en el captulo 8), combinan la
amplia cobertura de diversas aptitudes con calificaciones flexibles de noveles mltiples
para propsitos concretos de evaluacin. Aunque se trata de dos ejemplos de tests de
inteligencia de aplicacin individual, el mismo mtodo amplio y flexible de preparacin y
uso de los instrumentos ha tenido un impacto en las bateras de aplicacin colectiva,
como las que veremos en el captulo 10. En el captulo 11 estudiaremos la base terica y
las implicaciones prcticas de esta combinacin de tests de habilidad en relacin con los
adelantos recientes, relativos a la naturaleza de la inteligencia.
PRUEBAS ESTANDARIZADAS DE APROVECHAMIENTO
Mientras los psiclogos se ocupaban de los tests de inteligencia y de aptitud, los

exmenes escolares tradicionales experimentaban avances tcnicos (O. W. Caldwell y
Courtis, 1923; Ebel y Damrin, 1960). Un paso importante en esta direccin lo dieron las
escuelas pblicas de Boston en
1845 cuando los exmenes escritos sustituyeron al
interrogatorio oral de los estudiantes por examinadores visitantes, Entre los argumentos
ofrecidos en apoyo de esta innovacin estaba que los exmenes escritos ponan a los
estudiantes en una situacin uniforme, permitan una cobertura ms amplia del contenido,
reducan el elemento azaroso en la eleccin de reactivos y eliminaban la posibilidad de
favoritismo por parte del examinador. Todos estos argumentos tiene un sonido familiar:
fueron utilizados mucho despus para justificar la sustitucin de los reactivos de ensayo
por los reactivos objetivos de opcin mltiple.
A la vuelta del siglo empezaron a aparecer las primeras pruebas estandarizadas para
medir los resultados de la instruccin escolar. Encabezadas por el trabajo de E. L.
Thorndike, las pruebas empleaban principios de medicin tomados del laboratorio
psicolgico. Entre los ejemplos se incluyen escalas para calificar la calidad de la escritura
y la redaccin, as como pruebas de ortografa, aritmtica, clculo y razonamiento
aritmtico. Despus llegaron las bateras de aprovechamiento, iniciadas con la publicacin
de la primera edicin de la Prueba de Aprovechamiento de Standard (Standard
Achievement Test) en 1923. Sus autores fueron tres lderes en la elaboracin de pruebas:
Truman L. Kelley, Giles M. Ruch y Lewis M. Terman, Presagiando muchas caractersticas
de la psicometra moderna, esta batera proporcion medidas comparables de ejecucin
en diferentes materias escolares, evaluadas en trminos de un solo grupo normativo.
Al mismo tiempo se acumulaban evidencias de la falta de acuerdo entre los maestros al

calificar las pruebas de ensayo. Para 1930 era ampliamente reconocido que las pruebas
de ensayo no slo requeran ms tiempo para los examinadores y examinados, sino que
tambin arrojaban resultados menos confiables que el nuevo tipo de reactivos objetivos.
En la medida en que estos ltimos llevaron al uso creciente de las pruebas
estandarizadas de aprovechamiento, hubo un nfasis mayor en el diseo de reactivos
para probar la comprensin y la aplicacin del conocimiento y otros objetivos educativos
ms amplios. La dcada de los treinta tambien presenci la introduccin de las mquinas
para calificar exmenes a las cuales podan adaptarse fcilmente las nuevas pruebas
objetivas.
Otro desarrollo digno de la mencin fue el establecimiento en los Estados Unidos de

programas estatales, regionales y nacionales de evaluacin. Probablemente el ms
conocido sea el de la Junta Universitaria de Exmenes de Admisin a la Universidad
(Collage Entrante Examination Borrad, CEEB). Estableci a principios del siglo para
reducir la duplicacin de los exmenes de admisin presentados por los estudiantes de
reciente ingreso a la universidad, el programa ha experimentado cambios profundos en
sus procedimientos de evaluacin de evaluacin y en el nmero y la naturaleza de las
universidades participantes, cambios que reflejan los adelantos tanto en la aplicacin de
pruebas como en la educacin. En 1947, las funciones de evaluacin del CEEB se
combinaron con las bases de la Corporacin Carnegie y las del Consejo Estadounidense
de Educacin para formar el Servicio de Pruebas Educativas (ETS). En los Aos
posteriores, el ETS asumi la responsabilidad de un nmero creciente de programas de
evaluacin
al
servio
de
universidades,
escuelas
profesionales,
dependencias
gubernamentales y otras instituciones. Debe hacerse mencin del Programa de

Evaluacin de
Universidades Estadounidenses (American Collage Testing Program),
Establecido en 1959 para seleccionar a los aspirantes a las universidades no incluidas en

el programa CEEB y de varios programas nacionales de evaluacin para premiar a los
estudiantes talentosos.
Las pruebas de aprovechamiento no slo se utilizan con propsitos educativos, sino

tambin en la seleccin de solicitantes de empleos en la industria y el gobierno. Ya
citamos el uso sistemtico en el servicio civil de exmenes en el imperio chino desde
aproximadamente el ao 150 a.C. (Bowman, 1989). En los tiempos modernos, la
seleccin de empleados gubernamentales por medio de exmenes fue introducida en los
pases europeos a finales del siglo XVIII y comienzos del XIX. En 1883, la Comisin del
Servicio Civil de los Estados Unidos (U.S. Civil Service Comisin) Estableci el uso de
exmenes competitivos como procedimiento regular (Kavruck, 1956). Las tcnicas de
elaboracin de pruebas creadas durante y antes de la Primera Guerra Mundial fueron
introducidas en el programa de evaluacin de Servicio Civil de los Estados Unidos con el
nombramiento de L.J. ORourke como director de la recin establecida divisin de
investigacin en 1922. En la actualidad, este trabajo lo realiza un sofisticado equipo de
investigacin de la Oficina de Administracin de Personal de los Estados Unidos (U.S.

Office of Personnel Management).
En la medida en que creca la participacin en psicometra en la formulacin de pruebas

estandarizadas de aprovechamiento aumentaba la semejanza de sus aspectos tcnicos
con el de los tests de inteligencia y de aptitud. Los procedimientos para la elaboracin y
evaluacin de todas esas nuevas pruebas tenan mucho en comn. Los crecientes
esfuerzos por preparar pruebas de aprovechamiento que midieran la consecucin de
amplias metas educativas, en contraste con el recuerdo de hechos triviales, tambin hizo
que el contenido de las pruebas de aprovechamiento se asemejara al de los tests de
inteligencia. En la actualidad, la diferencia entre los dos instrumentos corresponde
principalmente al grado de especificidad del contenido y el grado en que el instrumento
presupone una instruccin previa.
EVALUACIN DE LA PERSONALIDAD
Otra rea de inters de las pruebas psicolgicas son los aspectos afectivos o no
intelectuales de la conducta, los que revisaremos del captulo 13 al 16. Los instrumentos
diseados con este propsito suelen conocerse como tests de personalidad, aunque
muchos psiclogos prefieren emplear el trmino personalidad en un sentido ms amplio
para referirse
al individuo en su totalidad. De acuerdo con esto, tanto los rasgos
intelectuales como los no intelectuales deberan agruparse bajo dicho rubro; sin embargo,
en la terminologa psicometra es ms comn el uso de la expresin test de personalidad
para referirse a la medicin de caractersticas como los estados emocionales, las
relacionales, las relaciones interpersonales, la motivacin, los intereses y las actitudes.
El uso que hizo Kraepelin de la prueba de asociacin libre con pacientes psiquitricos es
un antecedente de los tests de personalidad. En esta prueba, se presentan al examinar
palabras estmulo especialmente seleccionadas y se le pide que responda a cada una con
la primera palabra que le venga a la mente. Kraepelin (1892) tambin utiliz esta tcnica
para estudiar los efectos psicolgicos de la fatiga, el hambre y las drogas, y concluy que
todos esos agentes incrementan la frecuencia relativa de asociaciones superficiales.
Sommer (1894), que tambin trabaj en la ltima dcada del siglo XIX, surgi que la
prueba de asociacin libre podra utilizarse para diferenciar formas de trastorno mental.
Despus, la tcnica ha sido utilizada con distintos propsitos de evaluacin y an sigue
emplendose. Debe mencionarse el trabajo de Galton, Pearson y Cattell en la preparacin
de cuestionarios estandarizados y escalar de calificacin. Aunque Originalmente estaban
destinados a otros propsitos, estos procedimientos fueron utilizados para elaborar
algunos de los tests de personalidad que hoy son ms comunes.
El prototipo de cuestionario de personalidad, o inventario auto descriptivo (captulo 13), es

la hoja de Datos Personales (Personal Data Sheet) Crada por Woodworth durante la
Primera Guerra Mundial ( Dubois, 1970; Franz, 1919, pp. 171-176; L. R. Goldberg, 1971;
Symonds, 1931, captulo 5). El cuestionario fue diseado como una herramienta de
seleccin para identificar a los individuos gravemente perturbados que deberan ser
excluidos del servicio militar. El cuestionario constaba de una serie de preguntas que
versaban sobre sntomas psicopatolgicos comunes y en las que los
individuos
respondan sobre s mismo. Se obtena una puntuacin total, contando el nmero de

sntomas indicados. Este instrumento no se termin y no pudo emplearse a tiempo, antes
de que terminara la guerra, pero inmediatamente despus se prepararon formas para uso
civil, incluyendo una forma especial para aplicar a nios. Ms an, la Hoja de Datos
Personales de Woodworth sirvi como modelo para la mayor parte de los inventarios de
ajuste emocional. En algunos de estos cuestionarios se haca un intento por subdividir el
ajuste emocional en formas ms especficas, como el ajuste al hogar, el escolar y el
vocacional. Otros instrumentos se concentraban en un rea ms estrecha de conducta o
en respuesta ms claramente sociales, como las de dominacia-sumisin en el trato
personal. El ltimo avance fue la elaboracin de instrumentos para cuantificar la expresin
de actitudes e intereses, que tambin se basaban principalmente en las tcnicas de
cuestionario.
Otro mtodo de medicin de la personalidad se encuentra en la aplicacin de tests

situacionales y de ejecucin, en las que el examinador debe realizar una tarea cuyo
propsito a menudo est encubierto. La mayor parte simula con mucho realismo
situaciones de la vida cotidiana. La primera aplicacin extensa de las tcnicas est en las
pruebas elaboradas por Hartshorne, May y colaboradores a finales de los veinte y
principios de los treinta (1928, 1929. 1930). Esta serie, estandarizada para escolares, se
interesaba en conducta tales como copiar, mentir, robar, cooperar y persistir. Era posible
obtener puntuaciones cuantitativas objetivas en numerosos instrumentos especficos. Otro

ejemplo, ste para los adultos, se encuentra en la serie de tests situacionales preparados
durante la Segunda Guerra mundial por el programa de evaluacin de la Oficina de
Servicios Estratgicos (Office Of Strategic Services, OSS, 1948). Estos tests se
interesaban en la conducta emocional y social sutil y relativamente compleja y su
aplicacin requera de condiciones ms bien elaboradas y de personal capacitado,
adems de que la interpretacin de las respuestas era relativamente subjetiva.
Las tcnicas proyectivas representa el tercer mtodo de estudio de la personalidad que ha

mostrado un crecimiento notable, en especial entre los clnicos. Estos instrumentos
presentan al cliente un estmulo no muy estructurado, lo que permite una considerable
libertad en su solucin. La suposicin que fundamenta este mtodo es que el individuo
proyectar mediante el estmulo su estilo caracterstico de respuesta. Como en los tests
situacionales o de ejecucin, el propsito de las tcnicas proyectivas incluye el dibujo, el
arreglo de juguetes para crear una escena, la dramatizacin extempornea y la
interpretacin de manchas de tinta.
Todos los tests de personalidad disponibles presentan ciertas dificultades prcticas y

tericas. Cada mtodo tiene sus propias ventajas y desventajas. En conjunto, los tests de
personalidad han quedado detrs de los de habilidad en cuento a logros prcticos, pero
esa falta de progreso no puede atribuirse a una esfuerzo insuficiente. La investigacin
sobre la medicin de la personalidad ha alcanzado proporciones impresionantes desde
1950, y muchos instrumentos ingeniosos y mejoras tcnicas estn en investigacin. Lo
que explica el lento avance en el rea son ms bien las dificultades especficas que se
encuentran en la medicin de la personalidad.
A partir de la investigacin actual con los tests de personalidad estn surgiendo dos
tendencias unificadoras importantes (vase Anastasi, 1985p, 1992, 1993; Digman, 1990;
L. R. Goldberg, 1993; Simon, 1994). Primera, cada vez hay ms evidencia de las
influencia recproca de los rasgos afectivos (de personalidad) y cognoscitivos (de
habilidad) tanto en el desempeo de tareas como en el desarrollo conductual. Se ha
llegado a la conclusin de que la distincin tradicional entre los dos rasgos ha sido
impuesta artificialmente por razones de conveniencia en la descripcin y medicin de
diferentes aspectos de la conducta. Segunda, el anlisis terico de la naturaleza y
composicin de la personalidad apoya la integracin de los rasgos cognoscitivos y

afectivos en un modelo amplio de la actividad humana que incluye todas las formas de
conducta. Este modelo relaciona la investigacin bsica de lo rasgos intelectuales y los
afectivos.

Antecedentes Historicos de Las Pruebas Actuales

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Antecedentes Historicos de Las Pruebas Actuales

Cargado por

Copyright:

Formatos disponibles

Antecedentes Histricos de las pruebas actuales

Las races de la aplicacin de pruebas se pierden en la Antigedad. Existen relatos del

INTERS INICIAL EN LA CLASIFICACIN Y LA CAPACITACIN DE LAS PERSONAS

preocupacin por el cuidado adecuado de la gente con problemas mentales, se hizo

primeros manifestaban trastornos emocionales que podran o no estar acompaados por

LOS PRIMEROS PSICLOGOS EXPERIMENTALES

Esta estandarizacin del procedimiento lleg a convertirse en una de las seales

CONTRIBUCIONES DE FRANCIS GALTON

capacidad de discriminacin sensorial, en conjunto, sera ms elevada entre los

Galton tambin fue pionero en la aplicacin de escalas ele calificacin y cuestionarios, as

CATTELL Y LOS PRIMEROS TESTS MENTALES

El psiclogo estadounidense James McKeen Cattell ocupa una posicin prominente en el

El trmino test mental apareci por primera vez en la bibliografa psicolgica en un

tiempo de reaccin. La preferencia de Cattell por dichas herramientas tambin se sustent

Algunas pruebas elaboradas por psiclogos europeos de la poca tendan a cubrir

Binet y sus colaboradores dedicaron muchos aos a la investigacin activa e ingeniosa de

En la segunda escala, la de 1908, aument el nmero de test, se eliminaron algunos de la

diversas traducciones y adaptaciones de las escalas de Binet el Trmino de nivel mental

inteligencia, lo que contribuy al notable crecimiento del movimiento psicomtrico. Muy

La aplicacin de esos tests colectivos excedi a su mejoramiento tcnico. En la prisa por

Incluso antes de la Primera Guerra Mundial, los psiclogos empezaban a admitir la

La evaluacin crtica de las pruebas de inteligencia que sigui al uso indiscriminado

Al mismo tiempo que la aplicacin prctica demostraba la necesidad de contar con

Los estudios estadsticos sobre la naturaleza de la inteligencia haban explorado las

En el captulo 11 examinaremos de manera exhaustiva las contribuciones de Ios mtodos

Las bateras de aptitudes mltiples representan un desarrollo relativamente tarde en el

Un adelanto ms reciente, surgido a finales de los ochenta y comienzos de los noventa,

En correspondencia, los tests de inteligencia que se han desarrollado recientemente,

PRUEBAS ESTANDARIZADAS DE APROVECHAMIENTO

Mientras los psiclogos se ocupaban de los tests de inteligencia y de aptitud, los

1845 cuando los exmenes escritos sustituyeron al

Al mismo tiempo se acumulaban evidencias de la falta de acuerdo entre los maestros al

Otro desarrollo digno de la mencin fue el establecimiento en los Estados Unidos de

gubernamentales y otras instituciones. Debe hacerse mencin del Programa de

Universidades Estadounidenses (American Collage Testing Program),

Establecido en 1959 para seleccionar a los aspirantes a las universidades no incluidas en

Las pruebas de aprovechamiento no slo se utilizan con propsitos educativos, sino

investigacin de la Oficina de Administracin de Personal de los Estados Unidos (U.S.

En la medida en que creca la participacin en psicometra en la formulacin de pruebas

al individuo en su totalidad. De acuerdo con esto, tanto los rasgos

El prototipo de cuestionario de personalidad, o inventario auto descriptivo (captulo 13), es

respondan sobre s mismo. Se obtena una puntuacin total, contando el nmero de

Otro mtodo de medicin de la personalidad se encuentra en la aplicacin de tests

obtener puntuaciones cuantitativas objetivas en numerosos instrumentos especficos. Otro

Las tcnicas proyectivas representa el tercer mtodo de estudio de la personalidad que ha

Todos los tests de personalidad disponibles presentan ciertas dificultades prcticas y

composicin de la personalidad apoya la integracin de los rasgos cognoscitivos y

También podría gustarte