Está en la página 1de 30
Naturaleza y uso de las pruebas Psicoldgicas as pruebas, tests 0 instramentos de. mediciGn psicolégicos son herramientas, y ara obtener los beneficios que proporcionan es necesario tener presente este hecho esencial. Cualquier herramienta puede ser un medio para hacer el bien 0 el mal, dependiendo de cémo se emplee. Las pruebas se han desarrollado a un pa so cteciente, y aunque cada vez som més las dreas de la vida cotidiana a las que contri- buyen,' este crecimiento ha estado acompafiado de algunos abusos y de expectativas poco realistas. El usuario de los tests necesita saber cémo evaluarlos. {Qué tan buena ¢s esta prucba para el propdsito que se pretende que cumpla? ;Qué informacién puede brindar sobre la persona a la que se aplica? ;Cémo pueden integrarse sus resultados en la red de datos que se utiliza en la toma de decisiones? Escribimos este libro desde el unto de vista de estas preguntas, por lo que no se ditige al especialista, sino més bien al estudiante de psicologia. En la actualidad se requicre de ciertos conocimientos bé- sicos sobre los instrumentos de mediciGn no slo entre quienes los elaboran © apli- can, sino tarabién de parte de cualquiera que se sirva de sus resultados como fuente de datos para tomar decisiones acerca de sf mismo o de los demas. USOS Y VARIEDADES DE LAS PRUEBAS PSICOLOGICAS Habitualmente, la funcisn de las pruebas psicolégicas ha sido medir las diferencias entre individuos 0 entre [as reacciones de la misma persona. en ciccunstancias dis- tintas. El diagnéstico del retardo mental fue uno de los. primeros problemas que-esti- {Wéase Dalseom (19936) para una lécdathstracion de las contibuciones de ls prucbas psicoligicas ¢on ejemplos reales. 2 Naturaleza y uso de las pruebas psicologicas 3 _mularon su desarrollo, y, hasta el momento, la deteccidn de las deficiencias intelec- Bine ‘tuales sigue siendo una aplicacién importante de ciettos instrumentes. Los usos clt- nicos incluyen el examen de personas con trastornos emocionales graves y otros problemas de conducta. La evaluacién de las necesidades educativas dio un fuerte impulso al desarrollo inicial de las pruebas, como fue el caso de los famosos tests de Binet que comenzaron el movimiento de las mediciones de la inteligencia. En la ac- tualidad, las escuelas se cuentan entre los principales usuarios, ya que les permiten, entre otras muchas cosas, clasificar a los nifios segGn su capacidad para beneficiarse de las diferentes formas de insteuccién escolar, identificar a los excepcionalmente lentos o répidos para aprender, brindar asesorfa educativa y vocacional a los estu- dianves de educacién media y superior, y seleccionar a los aspirantes a las escuclas profesionales. La seleccién y clasificacién del personal industrial es otra aplicaci6n fundamental de las pruebas psicolégicas. Desde el operador de la linea de montaje y el archivista, hasta las funciones directivas, dificilmente puede encontrarse un puesto para el gue alguna prueba no haya demostrado su utilidad psicolégica en cuanto a contratacién, asignacién de tareas, transferencias, ascensos 0 despidos. En muchas de estas situacio- nes, en especial cuando se relacionan con los puestos de nivel superior, se requiere que las pruebas se empleen junto con una entrevista realizada por un experto que, al interpretar las puntuaciones a la Iuz de otra informaciGn importante sobre el indivi- duo, las aprovecha mejor. Con todo, la aplicacién de pruebas constituye una parte importante del programa global del departamento de personal. Una aplicacién rela- cionada de las pruebas psicoldgicas se encuentra en la seleccién y clasificacién del personal militar. Luego de sus inicios en la Primera Guerra Mundial, el aleance y la variedad de los instrumentos de medicién psicoldgicos usados en contextos militares mostraron un desarrollo notable durante la Segunda Guerra Mundial. Posteriormen- te, su investigacisn y desarrollo ha continuado a gran escala y en todas las ramas de las fuerzas armadas. En la consejerfa individual el uso de pruebas ha aumentado gradualmence de una orientacién limitada a los planes educativos y vocacionales al interés en todos los as- pectos de la vida de la persona. El bienestar emocional y las relaciones personales ade- cuadas se han convertido en objetivos prominentes de la consajerfa. También se observa una tendeneia a servirse de las pruebas para aumentat el desarrollo y la com- prensién personales. En este marco, las puntuaciones de los instrumentos son parte de Ia informacién que se proporciona al individuo para ayudaclo a tomar decisiones, Resulta evidente el uso de los instrumentos de medicién psicolégicos en la solu- cién de una gran variedad de problemas précticos; sin embargo, no hay que perder de vista el hecho de que las prucbas también cumplen funciones importantes en la inves- tigacién bésica. Por ejemplo, en casi todos los problemas de psicologta diferencial se aplican tests para obtener datos, como ocurre con los estudios sobre la naturaleza y el grado dg las diferencias individuales, la organizacidn de los rasgos psicoldgicos, la me~ dicion de las diferencias grupales y la identificacisn de los factores biolgicos y cultu- rales asociados con las variaciones conductuales. En todas estas areas de investigacién —como en muchas otras— es fundamental la medicidn precisa de las diferencias indi- viduales que las pruebas bien formuladas hacen posible. Del mismo modo, las pruebas 4 Funciones y origenes de pruebas, tests o instrumentos de medicién psicol6gicos psicolégicas proporcionan herramientas estandarizadas para investigar problemas tan diversos como los cambios que sufre el individuo a lo largo del ciclo de desarrollo, la eficacia relativa de distintos procedimientos educativos, los resultados de la psicotera- pia, el impacto de los programas comunitarios y la influencia de las variables ambien- tales en el desempefio. * Las pruebas disefiadas para estos diversos propésitos también difieren en otras ca- racteristicas notables. Varfan en la forma en que se aplican, ya sea que cl examinador capacitado trabaje con un individuo y luego con otro o de manera simulténea con srupos grandes, o bien por medio de una computadora. También difieren en los aspec- tos de la conducta que cubren. Algunas se concentran.en la evaluacion de los rasgos: ‘cognoscitivos o las habilidades, que pueden ir de aptitudes generales —como la capaci- dad de beneficiarse de la educacién universitaria— a las habilidades sensoriomotoras muy especializadas que se requieren para realizar una operacién manual sencilla. Otros instrumentos_miden las variables afectivas o de personalidad, como los rasgos emo- cionales o motivacionales, la conducta interpersonal, los intereses, las aptitudes y los valores. Frente a tal diversidad de naturaleza y propésito, ;qué caracterfsticas tienen en co- main las pruebas psicolégicas?, zen qué se diferencian de otros métodos para obtener informacién acerca de los individuos? La respuesta se encuentra en ciertos rasgos fundamentales de su elaboracién y uso, que constituyen el punto de interés de este capitulo. 2QUE ES UNA PRUEBA PSICOLOGICA? Una muestra de conducta. En esencia, la prueba psicolégica es una medida ‘obje- tiva y estandarizada de una muestra de conducta. Con las pruebas psicolégicas, como con las de cualquier otra ciencia, se hacen observaciones sobre una muestra pequefia, pero cuidadosamente elegida, de la conducta del individuo. A este respecto, el psicélo- g0 procede de la misma manera que el bioquimico que analiza la sangre de un paciente o el suministro de agua de la comunidad, examinando una o més muestras. Si el psicd- logo desea probar el léxico de un nifio, la habilidad de un escolar pata realizar calculos arieméticos o la coordinacién visomotora de un piloto, prueba su desempefio en un Conjunto representativo de palabras, problemas aritméticos o pruchas motrices. Que el instrumento cubra adecuadamente o no la conducta considerada depende obvia- mente del ntimero y la naturaleza de los reactivos de la muestra; por ejemplo, una prueba de aritmética que no tenga mas que cinco problemas o que sélo incluya mul- tiplicaciones serfa una mala medida de la habilidad del sujeto para hacer operacio- nes. Una prueba de vocabulario compuesta en exclusiva por términos provenientes de la jerga del béisbol dificilmente podria brindar una estimacién confiable del léxi- co del nifio. EL valor de diagnéstico o predictivo de un test psicoldgico depende de qué tanto fun- cione como indicador de un érea de conducta relativamente amplia y significativa. La medicién de la muestra de conducta que examina la prueba rara vet, si acaso, es el objetivo. El conocimiento del nifio de una lista particular de 50 palabras no es, en sf, de gran interés, como tampoco es de mayor importancia el desemperio de quien soli- Naturaleza y uso de las pruebas psicolégicas 5 ita un empleo en un conjunto de 20 problemas aritméticos. Pero los tests cumplen su propsito si muestran que hay una correspondencia estrecha entre el conocirnien to que cl nifo tiene de la lista de palabras y su dominio del vocabulario o entre la puntuacién que obtiene el solicitante en los problemas aritméticos y su desempedio en cl empleo. ‘Aceste respecto, hay que observar que no es necesario que los reactivos se asemejen a la condueta que la prueba pretende predecit, lo nico que se requiere es demostrat tina eorrespondencia empfrica entre ambos, de abi que el grado de similitud entre la mueste de la prueba y la conducta por predecir varfe mucho. En un extremo, la pruc- ba puede coincidir por complero con una parte de la conducta que se quiere predecit, coma en el caso de una prueba de vocabulario de una lengua extranjera que examina al estudiante en 20 de las 50 palabras estudiadas o el de la prueba de conduccién para Sbrener la licencia de manejo. Un grado menor de semejanza se encuentra en muchas pruebas de aptitud vocacional que se aplican antes de la capacitacisn para el trabajo, tn Tas que hay apenas un parecido modlerado entre las tareas que se realizan en el puesto las que incluye la prueba. En el otro extremo se encuentran los tests proyect> vos de personalidad, como el de manchas de tinta de Rorschach, en el que a partir de las asociaciones que el examinado hace de las manchas se intenta predecir su reaccién otras personas, a estimulos emocionales y a otras situaciones complejas de la vida co- tidiana, A pesar de sus diferencias superficiales, todas esas pruebas constan de mues- tras de conducta del individuo, y cada una debe probar su valor con la demostracién de una correspondencia empfrica entre el desempefio-del examinado en la prueba y.en otfas situaciones, ‘Tamhién representa una distincién menor que se utilice el término “diagnéstico” 0 “prediceisn’. Por lo general, el segundo connota una estimacion temporal; por ejemplo, se pronostica el desempefio del individuo en un trabajo a partir de su ejecu- cién en la prueba, Pero en un sentido mas amplio incluso el diagndstico de una con- dicién actual, como el retardo mental o un trastorno- emocional, lleva implicita la prediecién de lo que el individuo hard en otras situaciones. Légicamente, es més Sencillo considerar todas las pruebas como muestras de conducta a partir de las cua- Tes se hacen predicciones que atafien a otro comportamiento. Entonces, es posible caracterizar las diferentes clases de pruebas o tests como variaciones de este patton hiisico. ‘Ono punto que debemos considerar desde el principio tiene que ver con el.concep- to de capacidad. Por ejemplo, es totalmente posible elaborar una prueba para predecit qué tan bien aprenderd el francés un. alumno antes de que empiece el curso. La prueba seria ineluir una muestra de los comportamientos que se requieren para aprender el ‘nuevo idioma y también presuponer que el estudianve no tiene ningiin conocimiento. En este caso podria decirse que la prueba mide la “capacidad” 0 “potencialidad” del imlividuo para aprender el francés, Sin embargo, hay que tener cautela al emplear ewe cétminos en relacién con las pruebas psicoldgicas. Unicamente podemos decir gque una prucba mide la “capacidad” en el sentido de que una muestra de la ‘conducta ecual puede utilizarse como indicador de otra condueta futura, Ninguna prueba psic col6gica puede hacer més que medi el comportamiento, y que éte sirva como indice Ueotra conducta sdlo lo establece un experimento empirico. 6 Funciones y origenes de pruebas, tests 0 instrumentos dé medicién psicolégicos Estandarizacién. Recordemos que, en la definicién inicial, dijimos que la prueba Psicoldgica es una medida estandarizada. La estandarizaciGn supone Ia uniformidad de los procedimientos en la aplicacién y calificacién de la prueba, Es evidente que si los re- sultados que obtienen distintas personas han de ser comparables, las condiciones del ‘examen tienen que ser las mismas para todos. Tal requisito es sslo una manifestacién de la necesidad de tener condiciones controladas en todas las observaciones cientffi- cas. En una situacién de prueba, la tnica variable independiente es a menudo el indi- viduo examinado. Para asegurar la uniformidad de las condiciones de prueba, quien la elabora propor ciona instrucciones detalladas para la aplicacién de cada nuevo instrumento. La for. mulacién de las instrucciones es una parte importante de la estandatizacién de la nueva prueba, y se extiende a los materiales exactos que debe emplearse, los limites de tiempo, las instrucciones orales, las dlemostraciones previas, las formas de manejar las dudas de los examinados y cualquier otro detalle de la situacién de examinacién. Ast, al dar instrucciones o presentar oralmente los problemas, hay que considerar la velocidad con que se habla, el tono de la voz, la inflexién, las pausas y la expresién del rostro; por ejemplo, en una prucha que consiste en detectar absurdos, uno puede dar la respuesta correcta al sonrefr o al hacer una pausa cuando se lee la palabra cru- cial. En una secci6n posterior del capitulo, que trata de los problemas de la aplicacion de las prucbas, veremos el procedimiento de estandarizaci6n. Otro paso importante en Ja estandarizacién de las pruebas es el establecimiento de normas. Las pruebas psicolégicas no tienen criterios predeterminados de aprobacin 0 reprobacién; el desempefio en cada prucha se evalia sobre la base de los datos em- Pivicos. Para la mayor parte de los propésitos, afin de interpretar el resultado que ob- tiene el individuo en una prueba, éste se compara con los resultados de otros en la ‘misma prueba. Como lo sugieze el rérmino, Ia norma es el desempetio normal o pro- medio. De esta manera, si en una prueba de razonamiento aritmético los nifios nor- males de ocho arios resuelyen correctamente 12 de 50 problemas, entonces, en esta Prueba, la norma para los ocho afios cortesponde a una puntuacién de 12. Esto se co- noce como puntuacién cruda (brura.o directa), y se expresa como el niimero de reac. tivos correctos, el tiempo requerido para completar la tatea, el niimero de errores 0 alguna otra medida objetiva que sea adecuada para el contenido de Ja prueba. Esta Puntuacién cruda no tiene sentido hasta que no se evaltia en términos de datos inter. pretativos adecuados. Durante el proceso de estandarizaci6n, la prueba se aplica a una muestra grande y Tepresentativa de las personas a las que va dirigida. Este grupo, conocido como mues. trade estandarizacisn, sirve para establecer las normas, que indican no sélo el desem- Peo promedio sino también la frecuencia relativa de las desviaciones por encima y por debajo del promedio, Jo que permite evaluar diferentes grados de superioridad ¢ inferioridad. En el capftulo 3 consideraremos las formas coneretas de expresar tales normas, que permiten designar la posicién del individuo en relacién con la muestra normativa o de estandarizacion. También conviene observar que, para los tests de personalidad, las normas se esta- blecen esencialmente de la misma manera que para los de aptitud. En uno de persona- lidad la norma no es por fuerza la ejecuciGn mis deseable o “ideal”, como tampoco Naturaleza y uso de las pruebas psicolégicas 7 una puntuacin perfecta o sin errores es la norma de un test de aptivud. En ambas pruebas [a normaa corresponde a la ejecucisn de la persona promedio, Por ejemplo, en Tas pruebas de dominancia-sumisién, la norma cae en un punto medio que representa lado de dominio o de sumisién que manifiesta la persona promedio. De modo si vailar, on un inventario de ajuste emmocional la norma por lo general no corresponde @ rane cncia absoluta de respuestas inadaptadas o desfavorables. La mayoria de los in- “Yividuos “novmales” de la muestra de estandarizacién presenta algunas de esos Tespucs- tan, y este nmero de respuestas inadaptadas, por consecuenci, pode representa ke norma. Medicién objetiva de la dificultad. Al iniciar este anélisis definimos las pruebas privolégicas como una medicidn objetiva yestandaricada. En qué sontdo espectfico cimos que es objetival Ya tocames algunos aspectos de la objetivided al hablar de fa cotandartsacidn, En efecto, la aplicacién, calificacién e interpretaciGn de los re- u fados serdn objetivas en la medida en que sean independientes del juicio subjeti- sacl examinador, En teoria, cualquier individuo al que se aplique la prueba puede vprenet una puntuacicn idéntica independientemente de quién la aplique, Por sue puesto, esto no es del todo cierto porque en Ta préctica nose han alcancado la estan seearion ni la objetividad perfectas. Pero al menos Ia objetividad es la mera de la “lLihomeidn de instrumentos y casi todos Ta demuestran en un grado razonablemente elevado Hay otras condiciones que permniten seftalar alas prucbas psicoligicas como objet vas Lu determinacin del grado de dificulrad de un reactivo 0 de toda la prucha se bac tran procedimientos objetivos empiricos. Cuando Binet y Simon prepararon en.1905 su escala original para la medicién. de la inteligencia, distribuyeron. Jos 30 reactivos de | aa rier de dificultad creciente, que determinaron luego de probar los rene tivos on 50 nifios normales y en algunos con retardo mental, Tomaron los reactives tque eaalvig correctamente el mayor nimero de nifios, ipso facto, como los més enc Ts mientras que consideraron més diffciles los que pocos solucionaron. Con ese provedimiento,establecieron un orden empiric de dificultad. Este primer ejemplo es vie cteristico de la mediciGn objetiva del nivel de dificultad, que ahora es una pricti- ca comin en la elaboracién de pruebas psicolégicas. Seenélo el endenamiento, sino también la seleccién de reactives para su inclusién enna prueba, puede apoyarse en la proporcidn de sujetos de la muestra que resuelve ce aatdctivo. Ast si hay muchos reactivos en el extremo sencillo o el dificil de la es- care posible desearta algunos. De modo similar, sien ciertas partes de la gradua- cae Fe Lr dlficaltad de los reactivos son escasos, es posible agregar otros para llenar las Tagunas. En el capitulo 7 trataremos aspectos mas técnicos del andlisis de reactivos. Confiabilidad. Qué tan buena es la prueba’ (En realidad funciona? Estas preguntas podrfan —y ocasionalmente To hacen— exigi largas horas de andlisisinfrucruoso- Per una parte, las opiniones subjetivas, las corazonadas y ls sesgos personales pueden pot ucina afrmaciones extravagantes respecto de To que puede lograr una prueba o, for la ota, aun rechazo obstinadbo. La nica forma de que estas preguntas reciban und espuesta coneluyente es realizar una comprobaei6n empirica. La evaluacion objeea 8 Funciones y origenes de pruebas, tests o instrumentos de medicién psicolégicos de las pruebas psicolégicas consiste principalmente en determinar su confiabilidad y validez en situaciones especificadas. ‘Como se emplea en la psicometrfa, el término “confiabilidad” significa b: te consistencia. La confiabilidad de una prueba es la consistencia de las puntuaciones ‘obtenidas por las mismas personas cuando se les aplica la misma prueba o una forma equivalente. Si un nifio tiene un Cl de 110 el lunes y uno de 80 el viernes, es obvio que no se puede confiar mucho en ninguna de las dos puntuaciones. Asimismo, si, de tun grupo de 50 palabras, el examinado identifica bien 40, mientras que, de otro grupo supuestamente equivalente, obtiene una puntuacién de 20 correctas, ninguna de las puntuaciones puede considerarse como un indicador confiable de su comprensién verbal. Es posible que en ambos ejemplos s6lo una de las puntuaciones sea errénea, pero esto sdlo se demuestra con examenes posteriores. De los datos obtenidos, lo tini- co que se conchuye es que no pueden ser correctos ambos, y sin informacién adicional es imposible establecer que uno 0 ninguno sea una estimacisn adecuada de la habili dad del individuo. ‘Antes de permitir la libre circulacién de una prueba psicoldgica debe llevarse a.ca- bo una verificacién cuidadosa y objetiva de su confiabilidad. En el capitulo 4 estudia- remos los distintos tipos de confiabilidad, ast como los métodos de medicién de cada uno. Para comprobar la confiabilidad se comparan las puntuaciones obtenidas por las ‘mismas personas en diversos momentos con diferentes conjuntos de reactivos, exami- nadores 0 calificadores, o en cualquier otra condicién de examinacién pertinente. Es esencial especificar el tipo de confiabilidad y el método empleado para determinarlo, ya que la misma prueba puede variar en esos diferentes aspectos. También hay que in- formar del nimero y la clase de personas con las que se hizo la verificacién. Con estos datos, los usuarios pueden predecir si la prueba sera tan confiable para el grupo al que esperan aplicarla, o si es probable que sea mayor o menor. Valides. Bs indudable que la pregunta més importante sobre cualquier prueba psi- coldgica atafie a su validez —es decir, el grado con el que verdaderamente mide lo que pretende medir—. La validez proporciona una-comprobacién directa de. qué tan bien cumple una prueba su funcién. Por lo general, para deerminarla se requie- re de criterios independientes. y externos de lo que la prueba intenta medir. Por ejemplo, si se quiere emplear una prueba de aptitud médica para seleccionar, entre los aspirantes para ingresar a la escuela de medicina, a los més prometedores, un ctiterio puede ser el éxito de los seleccionados en la escuela. Durante el proceso de validacién, la prueba debe aplicarse a un grupo grande de estudiantes en el momen- to de su admisién. Posteriormente tiene que obtenerse una medida del desempefio académico de cada uno sobre la base de sus notas, la calificacién que reciban de los profesores, la terminacién o el ahandono de sus estudios y cosas similares. Esta me- dida constituye el criterio con el que se correlaciona la puntuaci6n que recibié al principio cada estudiante. Una correlacién, 0 coeficiente de validez, elevada significa que los individuos que en la prueba obtuvieron una calificacién relativamente alta han sido més 0 menos exitosos en la escuela de medicina, mientras que los que obtu- vieron bajas calificaciones en la prueba han tenido un pobre desempefio académico. Una correlacién baja indicarfa que existe poca correspondencia entre la puntuacién Naturalezo y uso de las pruebas psicolégicas 9 obtenida en Ia prueba y la medida considerada como criterio y, por lo tanto, que la validez de la prueba es poca. El coeficiente de valides nos permite determinar qué tan bien se predice el desempefio que se toma como criterio.a partir de las puntuaciones de la prueba. Las pruebas disefiadas para otros propésitos se validan de manera similar contra cri- terios apropiados. Por ejemplo, una prueba de aptitud vocacional puede validarse con el éxito laboral de un grupo experimental de nuevos empleados; una baterfa de aptitud para pilotos, con los resultados en los vuelos de entrenamiento. Las pruebas destinadas ‘a.usos més amplios y variados se validan con una serie de indicadores conductuales ob- tenidos de modo independiente, y su validez s6lo puede establecerse con la acumnula- cién gradual de datos de muchas investigaciones diferentes Tal vez el lector haya notado una paradoja aparente en el concepto de validez de la prueba. Si es necesario hacer un seguimiento de los examinados u obtener de otro modo medidas independientes de lo que la prueba pretende medir, por qué no prescindir de la prueba? La respuesta a este acertijo se encuentra en la distincién entre el grupo de vali- dacién por un lado y, por otto, los grupos a los que se aplicard la prueba con propésitos operativos, Antes de que la prueba esté lista para su uso es necesario establecer su va- lidez con una muestra representativa de personas cuyas calificaciones no se emplean con propdsitos operativos, sino sdlo en el proceso de comprobacién del instrumento. Si la prueba demuestra ser valida con ese método, puede utilizarse con otras muestras en ausencia de las medidas de criterio, Adin podria argumentarse que sdlo se necesita esperar a que la medida de criterio madure —que esté disponible— en cualquier grupo para obtener la informacion que la prueha trata de predecir. Pero semejante procedimiento supone un desperdicio tal de tiempo y energia que resultaria prohibitivo en casi todos los casos. Ast, para determi- nar qué solicitantes tienen éxito en un empleo o qué estudiantes terminan con éxito la universidad, admitirfamos a todo aquel que lo solicite (o a una muestra aleatoria) y esperarfamos a ver que pasé. Las pruebas estén disefiadas para disminuir al minimo el derroche que supone este procedimiento, asf como su nocivo impacto emocional ex los individuos. Por medio de las pruebas es posible evaluar, con un margen de error de- terminable, el nivel actual de la persona en las habilidades requeridas, sus conoci- mientos asf como otras caracterfsticas pertinentes. Entre mayor sea la validez y la confiabilidad de la prueba, menor serd el margen de error. En los capftulos 5 y 6, estudiaremos tanto los problemas especiales que uno enfren- taal determinar la validez de diversas pruebas como los criterios y los procedimientos estadisticos utilizados; sin embargo, en este momento es necesario considerar otro punto. La validez no sélo nos indica el grado en que la prueba cumple con su funcion, pues al estudiar los datos de la validacién podemos determinar con objetividad qué es lo que mide el instrumento. En consecuencia, serfa més preciso definir la yalidez co- mo el grado en que sabemos qué es lo que mide la prueba. La interpretacién de las puntuaciones serfa indudablemente més clara y inenos ambigua si las pruebas recibie~ tan su nombre de acuerdo con las relaciones empfricas que las validaron. Se observa una tendencia en esta direccién en nombres como “prueba de evaluacién académica” y “prueba de clasificacién de personal” en lugar de titulos tan vagos como “test de in- teligencia”. : 10 Funciones y origenes de pruebas, tests o instrumentas de medicién psicolégicos éPOR QUE CONTROLAR EL USO DE LAS PRUEBAS PSICOLOGICAS? “Puede venderme un ejemplar del Stanford-Binet? La proxima semana mi sobrino debe presentar una de las pruebas para ser admitido en la escuela X y necesita practicar para poder pasarla,” “Para mejorar el programa escolar de Iectura necesitamos una prueba de Cl justa ‘que mida el potencial innato de cada nifio.” “Anoche contesté las preguntas de un test de inteligencia publicado en una revista y obtuve un CI de 80. Me parece que las pruebas psicolégicas no tienen senti- do.” “Mi compattera de cuarto, que estudia psicologta, me aplicé un test de personalidad y resulté neurética. Desde entonces me he sentido muy molesta como para ir 2 clases.” “El afio pasado, mientras realizaba una investigacin usted aplicé a nuesttos em- pleades un nuevo test de personalidad. Quisiéramos tener los resultados en sus expedientes.” Estos comentarios no son imaginarios; se basan en incidentes reales y cualquier Psicélogo podria ampliar la lista, Ilustran abusos o malas interpretuciones de los ins- trumentos de medicisn psicolégicos que podrian restarles todo valor o lastimat al in. dividuo. Como cualquier instrumento cientifico © herramienta de precisién, las pruebas deben utilizarse cortectamente para que sean eficaces. En inanos de un usvario Poco escrupuloso o bien intencionado pero ignorance pueden causar un grave dato, Hay dos razones principales para controlar su uso: (a) garantizar que sean aplicadas por ‘un examinador calificado y que los resultados se empleen apropiadamente; y (b) impe- dir una femiliatidad general con su contenido, ya que ello invalidarfa el instrumento, Examinador calificado. La necesidad de un examinador calificado se vuelve evi- dente en cada uno de los tres aspectos principales de la situacién de prueba: la selec. ci6n del test, su aplicacién y calificacién, y la interpretacién de los resultados. Los tests no pueden clegirse como se escoge una podadora de un catélogo. No pueden evaluarse por el nombre, el autor u otras sefias de identificacisn. Para estar seguros, no se requie- re de entrenamiento psicolégico al considerar factores como el costo, el volumen o la facilidad de transportacién de los materiales de Ia prueba, el tiempo requerida para re- solverla y la facilidad, ast como la rapidez para calificarla. Por lo general, es posible ob. tener de un catilogo de tess la informacién sobre esos puntos practicos que desde luego deben ser considerados al planear un programa de evaluacisn. Sin embargo, para que tuna prucha cumpla su funcidn resulta imprescindible evaluar sus méritos tecnicos en ‘érminos de sus caractetisticas de validez, confiabilidad, grado de dificultad y nommas Solo asf es posible que los usuarios determinen qué tan adecuado es un instrumtento pa. "un propésito en particular o para las personas a las que planean aplicatlo. Al hablar de la estandarizacién de las pruebas sefialamos ya la importancia de con- tar con un examinador capacitado. Para que las puntuaciones que obticnen diferentes examinadores sean comparables o para evaluat los resultados de un individuo en tér, Naturaleza y uso de las pruebas psicolégicas 11 minos de las normas publicadas es necesario percatarse de la importancia de seguir con precisién las instrucciones y de familiarizarse con ellas. También resulta funda- mental el control cuidadoso de las condiciones de aplicacién. De modo similar, ka ca~ lificacién incorrecta o inexacta puede inutilizar el resultado. Sin los procedimientos adecuados de supervision, es mucho mas probable que ocurran errores de calificaci6n_ de lo que la gente cree. La interpretacién adecuada de los resultados requiere una comprensién cabal de la prucha, del sujeto que la presents y de las Condiciones en que fue aplicada. S6lo es po- ve determinar con objetividad lo que se mide sise hace referencia a los procedimicn- tos que la validaron. También es pertinente contar con otra clase de informacion relativa a la confiabilidad, la ‘naturaleza del grupo con el que se establecieron las nor- mas, etc. Al interpretar los resultados es importante contar COM algunos antecedentes ‘Tal exarainado. Distintas personas pueden obtener la misma ppuntuaciGn por razones muy diferentes, por lo que las conclusiones a as que se Hegue también deberfan ser di- similes. Por tiltimo, también debe prestarse atencién a factores especiales que pudieran aber afectado una calificacién, como algunas condiciones inusuales de aplicacién, el estado emocional o fisico del examinado y su grado de experiencia con las pruebas. La funcién del usuario. Durante os ochenta y Jos noventa el reconocimiento de In importante funciGn del usuario constiruyé un avance significative en el campo de las prucbas peicolbgicas (Anastasi, 1990b). En este comtexto, ‘el usuario es cualquiera que utiliza los resultados de una prueba como fuente de informacion para tomar decisiones practicas y puede ser, pero no necesariamente, el mismo que la aplicay-la-califica. Co- tuo ejemplos citemos a los maestros, consejetos, ‘administradores de sistemas escolares 0 de personal en la industria o el gobierno La mayor parte ‘de las criticas no se dirige a los rasgos intrinsecos a las pruebas, sino al destino que usuarios mal calificados dan a los te- sultados. El deseo de encontrar atajos, respuestas rapidas y soluciones tutinarias simples para problemas complejos da lugar algunos “besos. La presién temporal de una sobre targa de trabajo puede fomentar tales recursos sin ‘embargo, es probable que la causa raids frecuente sea el conocimiento insuficiente o inadecuado de las pruebas (Eyde, Mo- roland, Robertson, Primoff y Most, 1988; Moreland, Eyde, Robertson, Primoff y Most, 1995; Tyler y Miller, 1986). En los Estados Unidos, comisiones especiales de organizaciones profesionales traba- jan en conjunto con los edivores de las pruchas para prevenit su mal uso. Un ejemplo notable es el proyecto del Test User Qualifications Working Group (“Grupo de Trabajo pa- ra la Certificacién de los Usuarios de las Pruebas”), conocido por las siglas TUQWoG- (Eyde et al., 1988), cuya meva principal es ‘desarrollo de una hase de datos empiricos te las condiciones esenciales que tienen que cumplir ‘Jos usuarios de las pruebas y que los editores deben incluir en sus formas de certificacién para permitir su adquisicién. Luego Je uma investigaci6n llevada a cabo durante cinco afios en 63 pais, el proyecto TUQ- Wot formd una impresionante base de datos. Algunos ‘editores ya han empezado a em- plear los resultados en. Jas formas de certificacién del comprador. Mas adelante se formé, Duro grupo con el propésito de utilizar la base de datos del TUQW0G para elaborar di ectrices y materiales de capacttacién para los usuarios, El primer producto de este nue~ vo grupo, conocido como TUTWoG, Test User Training Working Group (Grupo de 12 Funciones y origenes de pruebas, tests o instrumentos de medicién psicolégicos Trabajo para la Capacitacién de los Usuarios de las pruebas), es un libro que hace un re- cuento de los abusos més comunes con el propésito de prevenilos (Eyde et al., 1993). Los casos se basan en casos reales de abusos observados en diversos medios y que revelé tuna encuesta realizada para el proyecto. Moreland er al. (1995) presentan un resumen. Seguridad del contenido de la prueba y comunicacién de la informacién pertinente. Si una persona memorizara las respuestas correctas de una prueba de ceguera al color, la prueba quedarfa totalmente invalidada dado que ya no podria ser una medida de su vision cromatica. Es evidente que el contenido de las pruebas debe ser restringido pa- ra impedir los intentos por falsear los resultados; sin embargo, en otros casos el efecto dle Ja familiaridad puede set menos evidente o la prueba resultar invalidada de buena fe por personas mal informadas; por ejemplo, un maestro puede hacer que sus alumnos resuelvan problemas muy parecidos a los que presenta un test de inteligencia con el propésito de que “los nifios estén preparados para presentarlo”. Semejante actitud es simplemente un remanente del procedimiento que suele seguitse al preparar a los alumnos para un examen escolar; pero cuando se aplica a un test de inteligencia es probable que eleve las puntuaciones sin afectar de manera apreciable el drea mis am- plia de conducta que la prueba pretende medir. En tales condiciones, se reduce la va- lidez de la prueba como instrumento predictivo o de diagnéstico. Garantizar la seguridad del contenido de una prucha no tiene por qué interferir con la comunicacién de la informacién pertinente a las personas evaluadas, los profesio- nales interesados y el publico en general, pues tal comunicacién cumple varios objeti- xyos. Primero, tiende a desvanecer cualquier velo de mistetio asociado con el uso de las pruebas y en. consecuencia ayuda a corregir los conceptos erréneos que prevalecen acerca de su propésito y el significado de sus resultados; para esto, algunos de los edi- ores mds importantes distribuyen folletos informativos. El segundo tiene que ver con los procedimientos récnicos seguidos al elaborar y evaluar los instrumentos; esta infor- maci6n oftece datos importantes acerca de la confiabilidad, la valider y otras propie- dades psicométricas del instrumento y, por lo general, se incluye en el manual téenico preparado para cada prueba y esta disponible para cualquier persona interesada. El tercer objetivo de Ia informacién consiste en familiarizar a las personas evaluadas con los procedimientos de la prueha, disminuir la ansiedad y lograr que cada una haga su ‘mejor esfuerzo. Para estos fines se han preparado varios flletos explicativos, algunos de naturaleza general y otzos para herramientas especificas como el Test de Evaluacion Esco- lar de la Junta Universitaria (College Board’s Scholastic Assessment Test), materiales que analizaremos en una seccién posterior del capitulo. El cuarto objetivo, muy importante, es la retroalimentacién que se brinda al examinado sobre su deserapefio en la prueba. Los psicologos han prestado una atencién considerable a las formas ms tiles y significa. tivas de entregar esa informaciGn en diferentes contextos. En los capitulos 17 y 18 examinaremos los procedimientos apropiados. La difusin de la informacién acerca de las pruebas es de gran importancia, y existen maneras titiles pero también dafiinas de Ilevar a cabo esta tatea. Un ejemplo se ene cuentra en los precipitados intentos legislativos realizados en los Estados Unidos por introducir controles gubernamentales tanto a nivel estatal como federal (Bersoff, 1981, 1983; B. Lerner, 1980b). A finales de los setenta, fueron aprobadas leyes estatales que Naturaleza y uso de las pruebas psicolégicas 13 regulan la divulgacién de la informacién sobre las pruebas en California y en Nueva York. La de este tiltimo estado, que es la mas extrema, requiere una divulgacién estric- ta de las preguntas y respuestas de las pruebas aplicadas en todos los programas de eva- luaci6n a gran escala para la admisién a instituciones de educacién superior. Como semejante requisito supone la preparacién de una nueva versién de cada prueba en cada ocasin que se aplica, puede tener varios efectos adversos como la dis- minucién en las fechas de aplicacién disponibles durante el afio, el aumento en las cuotas que debe pagar el solicitante y la disminucién en la calidad de los procedimien- tos de control al elaborar la prueba y al igualar las puntuaciones de las pruebas aplica- das en diferentes momentos. También es digno de mencidn que son muy pocas las personas que aprovechan la oportunidad que la legislacién sobre divulgacién les brin- da, y que dicha divulgacién no aumenta de manera significativa el desempefio en la segunda aplicacién con otra forma de examen (Stricker, 1984). Las metas que inapul- saron la promulgacién de las leyes se alcanzan de mejor manera, y sin los nocivos efec- tos colaterales, si se fortalecen los procedimientos disponibles para comunicar la informacién de las pruebas. APLICACION DE LA PRUEBA El fundamento de las pruebas es que pueden generalizar la muestra de conducta obser- vada en la situacién de prucha al comportamiento manifestado en otras situaciones. El resultado de una prueba deberfa ayudarnos a predecir cémo se sentird y actuard el cliente fuera de la clinica, cual ser4 el desempefio académico del estudiante y cual el desempefio laboral de un solicitante. Todas las influencias en la situacién de prueba constituyen un error de varianza y reducen su validez. Por eso es tan importante iden- tificar cualquiera que se relacione con la prueba y que pueda limitar o afectar la gene- talizacién de sus resultados. Podrfamos dedicar todo un volumen al andlisis de los procedimientos deseables de aplicacién de las pruebas, pero tal estudio escapa a los propésitos de este libro. Ade- mis, resulta mAs practico adquitir dichas técnicas en medios especificos ya que, por lo general, no hay quien esté interesado en todas las formas de aplicacién, del examen de infantes a las pruebas clinicas de pacientes psicéticos 0 a la aplicacién de programas masivos de evaluacién para personal militar. En consecuencia, nuestro anilisis se orientaré principalmente a los fundamentos de la aplicacién de pruebas en lugar de abordar preguntas concretas sobre su puesta en préctica. Un excelente ejemplo de ello puede encontrarse en la concienzuda revision de la evaluacién individual infantil he- cha por Sattler (1988, capitulo 5). Preparativos previos a la aplicacién. El requisito més importante de un buen procedimiento de aplicacién son los preparativos. Durante la aplicacisn de la prueba no puede haber emergencias, por lo que tienen que hacerse esfuerzos especiales para antici- parlas e impedirlas. Solo as{ se garantiza la uniformidad del procedimiento. La preparacién para la sesién de aplicacién adopta muchas formas. En la mayor parte de las pruebas individuales resulta esencial memorizar las instrucciones verbales exactas, Incluso en una prueba de aplicacién grupal en la que se leen las instrucciones 14 Funciones y origenes de pruebas, tests 0 instrumentos de medicién psicoldgicos a los examinados, familiarizarse con el material previene los errores y dudas durante la lectura y permite un estilo més natural e informal durante la aplicacién. Otro paso preliminar importante es la preparaciGn de los materiales, que en las pruebas indivi- duales y especialmente en las de desempeiio consiste en disponer todo lo necesario para facilitar su uso con un minimo de busqueda o tropiezos. Es conveniente que los materiales se coloquen en un mueble cercano a la mesa en la que se realizaré la aplica- ci6n de modo que estén al alcance del examinador pero que no distraigan al examina- do. Cuando se emplean aparatos complejos puede ser necesario vigilarlos y calibrarlos de manera periédica. En las pruebas de aplicacién grupal, todos los cuadernillos, las hojas de respuesta, los lépices especiales, o cualquier otro material, deben ser cuidado- samente contados, verificados y arreglados antes del dia de la aplicacién de la prueba. ‘Otro requisito importante, tanto en las pruebas de aplicacién individual como en las de grupo, es la familiaridad absoluta con el procedimiento de aplicacisn. Para las pruebas individuales, suele ser esencial recibir una capacitacién supervisada en la aplicacién de la prucba. Dependiendo de la naturaleza del instrumento y de las perso- nas examinadas; la capacitacién puede requerir desde unas cuantas sesiones de demos- tracién y préctica hasta mds de un afio de instrucciéin, Para las pruebas de grupo, en especial en los proyectos a gran escala, la preparacién puede incluir instrucciones pre- vias a los examinadores y ayudantes, de modo que todos estén completamente infor- maclos sobre las funciones que debe realizar. Por lo general, el examinador lee las instrucciones, se ocupa de Ilevar el tiempo y est a cargo del grupo en el saldn. Los ayudantes entregan y recogen los materiales, se aseguran de que se sigan las instruc- ciones, responden las preguntas de los examainados dentro de los limites especificados en el manual ¢ impiden las copias. Condiciones de aplicacién. El procedimiento estandarizado se aplica no sdlo a Jas instrucciones verbales, el tiempo y otvos aspectos de la prueba, sino también al am- Diente. Es necesario elegir un saldn adecuado para el examen, el cual debe estar libre de ruidos y distracciones y oftecer a los examinados condiciones adecuadas de ilumina- i6n, ventilaci6n, asientos y espacio de trabajo. También deben tomarse precauciones para prevenir interrupciones durante la aplicacién, por lo que es conveniente colocar en la puerta un cartel que indique que se est aplicando la prueba y asegurarse de que todo el personal se haya enterado de que la sefal significa que nadie puede entrar ba- jo ninguna citcunstancia. En las pruebas colectivas, puede ser necesario cerrar la puer- ta o poner aun ayudante afuera para impedir la entrada de los rezagados. Es importante darse cuenta de las condiciones en que se realiza la prueba ya que és- tas pueden influir en sus resultados. Incluso aspectos que parecen menores pueden al- terar de manera apreciable el desempefio; por ejemplo, el uso de pupitres fijos o bien de sillas con paleta para el brazo demostré ser significativo en un proyecto de aplica- ci6n grupal con estudiantes de secundaria, pues el grupo que utiliz6 pupitres tendia a obtener mayores calificaciones (T. L: Kelley, 1943; Traxler y Hilkert, 1942). También hay evidencias que demuestran que la hoja de respuesta que se emplee puede influir en los resultados (F O. Bell, Hoff y Hoyt, 1964). A veces, los examinadores utilizan en sus pruebas colectivas hojas de respuesta diferentes de las que se emplearon en la muestra de estandarizacisn, lo que se debe al establecimiento de oficinas independientes de Naturaleza y uso de las pruebas psicoldgicas 15 calificacién de pruebas y procesamiento de datos que entregan sus propias hojas de respuesta, las que pueden ser calificadas por maquinas. Dado que se carece de una ve- rificacién empitica, no es posible asumir que las hojas son equivalentes. Al examinar a nifios de grados inferiores al quinto, el uso de cualquier hoja diferente puede dismi- nuir de forma notable sus calificaciones (Cashen y Ramseyer, 1969; Ramseyer y Cas- hen, 1971), asf que en esos niveles suele ser preferible hacer que marquen las respuestas en el propio cuadernillo de la prueba. “Todavia més significativas a cualquier edad son las diferencias entre la aplicacién computarizada o de lapiz y papel de la misma prueba, por ello se ha dedicado conside- rable atencién al efecto que tiene sobre las normas, la confiabilidad y la validez en re- acin con la naturalesa de la prueba y la poblacién examinada. Lo anterior ha conducido a la formulacién de lineamientos profesionales para que los usuarios deci- dan qué tan comparables son los resultados de las dos aplicaciones (Butcher, 1987; Hofer y Green, 1985). Se ha demostrado que muchas otras condiciones sutiles afectan el desempefio tan- to en los tests de habilidad como en los de personalidad. Que el examinador sea extra- fio 0 conocido para el examinado puede suponer una diferencia significativa en los resultados (Sacks, 1952; Tsudzuki, Hata y Kuze, 1957). En otro estudio se comprobs que los modales ¥ la conducta del examinador (sonreft, asentir con la cabeza y hacer comentarios como “bien” o “perfecto”), tienen un efecto decisivo en los resultados (Wickes, 1956). Al aplicar una técnica proyectiva que requiere que el examinado es- riba historias que se ajusten a ciertas imagenes, se descubri6 que la presencia del exa- minador en la habitacién tendia a inhibit la inclusién de contenido emocional en las historias (Bernstein, 1956). En la aplicacién de una prueba de mecanograffa, los soli- citantes escribian a una tasa significativamente més alta cuando se les probaba solos que cuando el examen se hacia en grupos de dos o més personas (Kirchner, 1966). Podriamos multiplicar con facilidad los ejemplos, hecho que tiene tres implicacio- nes. Primero, siga con minucioso detalle los procedimientos estandarizados, Es res- ponsabilided del autor de la prueba y del editor explicar los procedimientos de manera clara y completa en el manual de la prueba. Segundo, lleve registro de cualquier con- dicién inusual que tenga lugar durante la aplicacién, aunque sea menor. Tercero, al interpretar los resultados, rome en consideracién las condiciones en las que se llevé.a cabo. En la evaluacién a fondo de un sujeto, el examinador experimentado ocasional- ‘mente puede apartarse del procedimiento estandarizado para obtener informacién adicional por razones especiales. En esos casos, ya no se puede interpretar los resulta- dos en términos de las normas de la prueba. En tales circunstancias, los estfmulos de la prueba se utilizan Gnicamente para una exploracién cualitativa, y las respuestas ten- drfan que tratarse de la misma manera que cualquier otra observacion. informal de la conducta 0 que los datos obtenidos en una entrevista. Presentacién de la prueba: rapport y orientacién del examinado. Al aplicar tuna prueba, se entiende por rapport los esfuerzas del examinadot por despertar el interés del examinado, lograr su cooperacién y animarlo a responder de manera apropiada a los

También podría gustarte