adrid: Pirmide :in sobre el origen y desa- Parte 1 CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA ITEMA 2 PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA Mara Isabel Barbero Garca jSUMARIO 1. Orientaciones didcticas 2. Los tests, escalas, cuestionarios e inventarios 3. El proceso de construccin de un test 4. La finalidad del test 4.1. La variable objeto de estudio 4.2. Poblacin a la que va dirigido 4.3. Utilizacin prevista 5. Especificacin de las caractersticas del test 5.1. Contenido 5.2. Formato de los tems 5.2.1. tems de eleccin 5.2 .2. tems de construccin 5.3. Longitud del test 5.4. Caractersticas psicomtricas de los tems 6. Redaccin de los tems 6.1. Recomendaciones generales 6.2. Recomendaciones para tems de eleccin 6.3. Recomendaciones para tems de construccin 6.4. Los sesgos de respuesta 7. Revisin crtica por un grupo de expertos 8. Confeccin de la prueba piloto 8.1. Instrucciones de administracin 8.2. Formato de presentacin y de registro de las respuestas 9. Aplicacin de la prueba piloto 1 O. Correccin de la prueba piloto y asignacin de puntuaciones a los sujetos 1 0.1. En los tests formados por tems de eleccin 1 0.1.1. Pruebas cognitivas 1 0.1.2. Pruebas no cognitivas 1 0.2. En los tests formados por tems de construccin 1 0.2.1. Mtodo de la puntuacin analtica 1 0.2.2. Mtodo de la puntuacin holstica 11. Ejercicios de autoevaluacin 12. Soluciones a los ejercicios de autoevaluacin 13. Bibliografa complementaria respuestas tu ntuaciones a los sujetos :cin 1. ORIENTACIONES DIDCTICAS A lo largo del tema anterior se ha intentado dar a conocer a los alumnos lo que es la Psicometra y el papel que juega en el marco de la Metodologa de las Ciencias del Comportamiento. Se ha puesto de manifiesto la dificultad que con- lleva el intentar medir variables psicolgicas y la forma de llevar a cabo el pro- ceso de medicin. Despus de exponer, aunque de forma muy esquemtica, las dos vas de desa- rrollo de la Psicometra: la de los estudios de Psicofsica y la de los estudios de las Diferencias Individuales, se hizo una exposicin de los distintos tipos de es- calamiento segn que el objeto a escalar fueran los estmulos, los sujetos o am- bos y, posteriormente, se hizo una breve introduccin a los principales mtodos de escalamiento de estmulos y a los orgenes y desarrollo de los tests como ins- trumentos que van a permitir la medicin de las diferencias individuales y, por lo tanto, el escalamiento de los sujetos. Asimismo, se expusieron las principales teoras que han ido surgiendo a lo largo de los aos para justificar y legitimar las medidas obtenidas al aplicar los tests dndolas una fundamentacin terica. Despus de ese primer tema introductorio, en ste y a lo largo de los temas si- guientes, y desde el marco de la Teora Clsica de los Tests, vamos a centrarnos en todos aquellos aspectos relacionados con la construccin, evaluacin y aplicacin de los instrumentos de medicin que van a permitir, entre otras cosas, el estudio de las diferencias individuales respecto a alguna caracterstica psicolgica, tomar de- cisiones acerca de si los alumnos han conseguido unos objetivos curriculares m- nimos, detectar problemas comportamentales, etc. (ver tabla 2.2, pgina 67). Trataremos de proporcionar a nuestros alumnos una herramienta de trabajo que les permita, en un momento determinado, no slo poder construir un ins- 57 1 PSICOMETRA trumento de medicin psicolgica y evaluar su calidad mtrica, sino poder in- terpretar los resultados obtenidos con su aplicacin y hacer inferencias y tomar decisiones en funcin de ellos. S que para muchos se trata de una asignatura difcil cuya utilidad no descu- bren hasta el momento de la prctica profesional; pero, cuando llega ese mo- mento, echan mano de los viejos apuntes para poder moverse con cierta soltura en algunas situaciones. Se ha intentado utilizar un lenguaje que pudiera ser comprendido por todas aquellas personas que quisieran utilizar este libro como gua en su formacin dentro de nuestro campo. Aunque la mayora de nuestros alumnos no se van a dedicar a la construccin de tests, y por lo tanto tienen un inters relativo por el tema que nos ocupa, es cierto, y lo he constatado a lo largo de los muchos aos de experiencia, que todos ellos se van a enfrentar en algn momento de su vida profesional con los tests y es necesario que, con una mayor o menor profundi - dad, tengan un cierto conocimiento de lo que tienen entre manos. Para poder utilizar un test como instrumento cientfico de medicin es nece- sario cubrir una serie de etapas. Una etapa inicial, que abarcara la elaboracin de una prueba piloto, su aplicacin a una muestra de sujetos y la asignacin de puntuaciones a los mismos; una segunda etapa en la que se evaluara la calidad psicomtrica de cada uno de los tems que componen la prueba piloto as como del conjunto de la misma, y finalizara con la construccin definitiva del test, y una tercera etapa en la que se llevara a cabo la aplicacin del test a una mues- tra representativa de la poblacin a la que va dirigido, se asignaran puntuacio- nes a los sujetos para su evaluacin y se llevara a cabo el proceso de estanda- rizacin de las puntuaciones obtenidas y el establecimiento de normas que permitan su interpretacin. El proceso finalizara con la elaboracin del manual del test que deber incluir toda la informacin necesaria para que pueda ser uti- lizado por los psiclogos especializados. En este tema se va abordar la primera etapa, la etapa inicial que incluye la ela- boracin de una prueba piloto y su aplicacin a una muestra de sujetos, y en los temas siguientes se abordar el estudio del resto de las etapas. Los puntos bsicos en los que han de profundizar los alumnos a la hora de abordar el estudio de este tema son: 58 Tener muy claras las distintas fases que hay que cubrir a la hora de cons- truir la prueba piloto de un test: definicin de la finalidad del test, espe- cificacin de las caractersticas del test, redaccin de los tems, revisin por un grupo de expertos y confeccin de la prueba piloto. PR A saric man 2. 1
E1 col lnve ciert lizac o, p< Didt trica, sino poder in- inferencias y tomar ya utilidad no descu- uando llega ese mo- :rse con cierta soltura mprendido por todas gua en su formacin alumnos no se van a inters relativo por el ro de los muchos aos ~ n momento de su vida oro menor profundi- e manos. J de medicin es nece- oarcara la elaboracin etos y la asignacin de ! se evaluara la calidad prueba piloto as como in definitiva del test, y in del test a una mues- e asignaran puntuacio- D el proceso de estanda- miento de normas que elaboracin del manual a para que pueda ser uti- inicial que incluye la ela- uestra de sujetos, y en los etapas. os alumnos a la hora de cubrir a la hora de cons- a finalidad del test, espe- n de los tems, revisin ueba piloto. PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 Conocer las distintas decisiones que hay que tomar en cada una de las fa- ses y la forma de hacerlo: a) En la fase de definicin de la finalidad del test hay que tomar decisio- nes acerca de qu constructo o variable psicolgica se va a medir, a qu poblacin va a ir destinado el test y cul va a ser la utilizacin pre- vista. b) En la fase de especificacin de las caractersticas del tests se debe de- cidir sobre el contenido del test, qu tipo de formato van a tener los tems, cul va a ser la longitud de la prueba y qu caractersticas psi- comtricas son las ms adecuadas. e) Es necesario que los alumnos conozcan qu tipo de formato es el ms adecuado en funcin de la variable psicolgica que se quiera medir y las reglas que se deben seguir, sean stas de carcter general o espec- ficas de cada tipo de formato, para que la redaccin de los tems sea lo ms correcta posible. d) Una vez redactados los tems se ha de tomar la decisin acerca de qu persona/s han de hacer una revisin crtica de los mismos para conse- guir una mejor calidad. e) La confeccin de la prueba piloto implica tomar decisiones acerca de las instrucciones que se van a incluir, cul va a ser la forma de admi- nistrar la prueba y de qu manera se van a registrar las respuestas de los sujetos Aunque a lo largo del texto se han incluido varios ejemplos, creemos nece- sario que el alumno realice tambin los ejercicios de autoevaluacin; de esta manera podr l mismo controlar su aprendizaje. 2. LOS TESTS, ESCALAS, CUESTIONARIOS E INVENTARIOS En la literatura cientfica los instrumentos utilizados para medir variables psi- colgicas han recibido distintas denominaciones: Tests, Escalas, Cuestionarios, Inventarios, etc., y no siempre ha quedado claro el porqu de esta distincin; es cierto que no siempre es posible diferenciar estos trminos puesto que se han uti- lizado indistintamente, sobre todo algunos; pero vamos a tratar de clarificarlos o, por lo menos, clarificar el sentido que van a tener dentro de estas Unidades Didcticas. 59 1 PSICOMETRA En general, se ha utilizado el trmino Test como un trmino general para re- ferirnos a cualquier instrumento de medicin psicolgica, es el trmino ms uti- lizado, pero sobre todo se utiliza para hacer referencia a los instrumentos de me- dicin de variables de tipo cognitivo: aptitudes, conocimientos, rendimiento, habilidades, etc., en los que las respuestas de los sujetos a cada uno de los ele- mentos que los forman son correctas o incorrectas y la puntuacin total en el test viene dada por la suma de todas las respuestas correctas obtenidas (bien suma directa o ponderada), dando lugar a una escala jerrquica o acumulativa. El trmino Escala se suele utilizar para hacer referencia a los instrumentos elaborados para medir variables no cognitivas: actitudes, intereses, preferencias, opiniones, etc., y se caracterizan porque los sujetos han de responder eligiendo, sobre una escala de categoras graduada y ordenada, aquella categora que me- jor represente su posicin respecto a aquello que se est midiendo, no hay res- puestas correctas o incorrectas, y la puntuacin total de los sujetos en la escala ser la suma de las puntuaciones asignadas a las categoras elegidas por los su- jetos. Los Cuestionarios suelen estn formados a menudo por una serie de tems o elementos que no estn necesariamente relacionados unos con otros, cuyas op- ciones de respuesta no estn ordenadas ni graduadas, que pueden ser puntua- dos e interpretados individualmente y en los que tampoco hay respuestas co- rrectas o incorrectas. Las preguntas que incluyen pueden ser muy variadas con el fin de obtener una mayor informacin acerca del sujeto/s y de su entorno (edad, profesin, nivel de ingresos, nivel de estudios, opiniones acerca del pro- blema que se quiere evaluar, etc). Son el instrumento generalmente utilizado cuando se quiere llevar a cabo una investigacin mediante encuestas. El trmino Inventario suele estar vinculado a los instrumentos elaborados para medir variables de personalidad. Las respuestas de los sujetos a los tems no son correctas o incorrectas, lo nico que demuestran es la conformidad o no de los sujetos con los enunciados de los tems. EJEMPLOS: 60 1. La capital de Espaa es: a) Pars b) Londres e) Madrid 2. Debera estar prohibido fumar en todos los restaurantes: 1) Completamente de acuerdo Tt ti t rr El m rmino general para re- a es el trmino ms uti- ' los instrumentos de me- :imientos, rendimiento, s a cada uno de los ele- Jntuacin total en el test 1s obtenidas (bien suma ca o acumulativa. ncia a los instrumentos , intereses, preferencias, de responder eligiendo, 1uella categora que me- midiendo, no hay res- los sujetos en la escala ras elegidas por los su- r una serie de tems o os con otros, cuyas op- que pueden ser puntua- hay respuestas co- en ser muy variadas con jeto/s y de su entorno niones acerca del pro- generalmente utilizado nte encuestas. mentas elaborados para ujetos a los tems no son conformidad o no de los urantes: PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 2) De acuerdo 3) Indiferente 4) En desacuerdo 5) Completamente en desacuerdo 3. Qu parte de la asignatura de Psicometra le resulta ms fcil de estudiar? a) Fiabilidad b) Validez e) Anlisis de elementos d) La construccin de tests 4. A menudo me siento como si los dems me ignoraran V F El problema de mucha gente es que no toma las cosas en serio V F Creo que me gustara trabajar en unos grandes almacenes V F El primer ejemplo representa una pregunta tpica de lo que denominamos un Test de Conocimientos, el sujeto ha de elegir la respuesta correcta entre las dis- tintas alternativas que se le ofrecen. El segundo ejemplo podra ser una pregunta tpica de una Escala que midiera la actitud ante el tabaquismo. Para cada ele- mento se ofrece una escala de respuesta graduada, en este caso del 1 al 5, de ma- nera que la opcin elegida por los sujetos refleje su posicin personal ante el enunciado del tem. No hay respuestas correctas o incorrectas. El tercer ejemplo, sera una pregunta tpica de un Cuestionario, tampoco hay respuestas correctas o incorrectas, simplemente el sujeto deber elegir la alternativa que refleje su opinin; pero, a diferencia de las alternativas presentadas en las Escalas, en las que el sujeto deba elegir entre una serie de categoras ordenadas en funcin del grado de acuerdo con respecto al enunciado del tem, en los Cuestionarios las distintas opciones no guardan ninguna relacin de orden entre s, de manera que es indiferente su orden de presentacin. Finalmente, los enunciados inclui- dos en el ejemplo cuarto podan ser tpicos de un inventario de personalidad, como se puede observar no hay respuestas correctas o incorrectas, los sujetos de- ben leer cada uno de los enunciados y responder si es verdadero (o habitual- mente verdadero) o falso (o habitualmente falso) para ellos; es decir, su acuerdo o no con los distintos enunciados. EN RESUMEN: El trmino Test suele reservarse, generalmente, para todos aquellos instru- mentos de medicin utilizados en el mbito cognitivo; es decir, para aquellos ins- 61 1 PSICOMETRA trumentos construidos para medir: aptitudes, conocimientos, rendimiento, habi- lidades, etc. Cuando se quieren medir variables que no pertenecen al mbito cognitivo, sino al afectivo u orctico (personalidad, actitudes, intereses, opiniones, etc.), se uti 1 izan las Escalas, los Cuestionarios y los Inventarios. Las escalas muestran el enunciado del elemento junto a una serie de alternativas de respuesta categori- zadas de forma ordenada (escalas de categoras o escalas de clasificacin), de manera que el sujeto pueda mostrar su posicin respecto a lo que se muestra en el enunciado, eligiendo la categora con la que se sienta ms identificado. Los cuestionarios suelen estar formados por elementos cuyas alternativas de res- puesta no forman categoras ordenadas (listados). Cada alternativa es indepen- diente de las dems. En este caso, la tarea del sujeto consiste en elegir la alter- nativa o alternativas que prefiera o la/s que, en su opinin, refleje mejor aquello que se est valorando, y los inventarios se suelen reducir a una serie de enun- ciados ante los que los sujetos han de responder en funcin de su grado de acuerdo o desacuerdo. A lo largo del texto se va a utilizar la palabra Test para hablar en trminos ge- nerales de todos los instrumentos de medicin psicolgica ya que es el trmino ms amplio y aceptado internacionalmente, y se utilizarn los otros trminos cuando se haga referencia expresa a un determinado tipo de instrumentos de medicin. 3. El PROCESO DE CONSTRUCCIN DE UN TEST La construccin de un test es un proceso laborioso que requiere, como paso previo al proceso de construccin propiamente dicho, tener muy claro qu se quiere medir con l, a quin va a ir dirigido y para qu se va a utilizar. El cono- cimiento del objetivo del test es el paso previo que va a condicionar las siguientes etapas de la construccin (Cracker y Algina, 1986; Millman y Greene, 1989). La tabla 2.1 recoge de forma esquemtica las distintas etapas que hay que ir cubriendo desde el momento en que el investigador se plantea la tarea de cons- truir un test hasta el momento de la aplicacin piloto de la prueba desarrollada, recogiendo todos aquellos aspectos a los que hay que dar respuesta. No se in- cluyen las etapas correspondientes a la evaluacin de las caractersticas psico- mtricas de la prueba, ni a las de la aplicacin del test definitivo, porque se ana- lizarn en los temas siguientes tal y como se coment al principio. 62 PRI I o, E ~ R ex Ce A ~ Ce pu 4. lJ - Co cualv medir Sur (ex a m de los pgin en con ntos, rendimiento, habi- :en al mbito cognitivo, eses, opiniones, etc.), se Las escalas muestran el 1 s de respuesta categori- das de clasificacin), de 0 a lo que se muestra en 1 ta ms identificado. Los Jyas alternativas de res- 1 alternativa es indepen- onsiste en elegir la alter- n, refleje mejor aquello cir a una serie de enun- funcin de su grado de ra hablar en trminos ge- ica ya que es el trmino zarn los otros trminos tipo de instrumentos de que requiere, como paso tener muy claro qu se se va a utilizar. El cono- condicionar las siguientes li man y Greene, 1989). s etapas que hay que ir plantea la tarea de cons- de la prueba desarrollada, e dar respuesta. No se in- e las caractersticas psico- definitivo, porque se ana- al principio. PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 Determinar la finali dad del test Especificar las caractersticas del test Redaccin de los tems Revisin crtica de los tems por un grupo de expertos Confeccin de la prueba piloto Aplicacin de la prueba pi loto Correccin de la prueba piloto y asignacin de puntuaciones a los sujetos 4. LA FINALIDAD DEL TEST Decisiones a tomar acerca de: Qu se va a medir A quien se va a medir Para qu se va a medir Cul va a ser el contenido Qu tipo de tems se van a incluir Cuntos tems Caractersticas psicomtricas tems de eleccin tems de construccin Qu tems van a seleccionarse Instrucciones de administracin Formato de presentacin Formato de registro de respuestas Individual -colectiva Papel y lpiz- Informat izada Correo, mediante entrevista personal , por telfono, etc. En los tests formados por tems de eleccin En los tests formados por tems de construccin Como paso previo a la construccin de un test es necesario tener muy claro cual va a ser su objetivo; es decir qu es lo que se quiere medir, a quin se quiere medir y para qu se quiere medir. Supongamos que los profesores de Psicometra queremos construir un test (examen) de Psicometra para evaluar los puntos fuertes y dbiles del conjunto de los alumnos respecto al programa de nuestra asignatura y poder incluir en la pgina Web algunas recomendaciones que les permitan superar las dificultades encontradas durante el estudio. Ya tenemos el objetivo del test: 63 1 PSICOMETRA Qu se quiere medir? A quin se quiere medir? Para qu? Los conocimientos de Psicometra A los alumnos Para detectar puntos fuertes y dbiles en los alumnos respecto al programa de la asignatura. La primera pregunta hace referencia a la variable objeto de estudio, aquella que se quiere medir; la segunda a la poblacin a la que va dirigido y la tercera al uso o utilidad que se va a dar al test. Otro ejemplo podra ser el siguiente: Un grupo de Psiclogos, especialistas en modificacin de conducta, encar- gan a un grupo de psicmetras la construccin de un test que permita medir el nivel de estrs que producen los exmenes de acceso a la Universidad con el fin de buscar algn sistema que permita reducirlo o, al menos, controlarlo. La va- riable a medir sera el estrs, la poblacin objeto de estudio estara formada por todos los alumnos que realizan el examen de acceso a la Universidad, el obje- tivo sera buscar algn sistema para reducir el nivel de estrs o, al menos, con- trolarlo. 4.1. La variable objeto de estudio Quizs pueda parecer una trivialidad el hacer tanto hincapi en la necesidad de conocer claramente lo que se quiere medir antes de iniciar la construccin de un test; a lo mejor lo sera si la variable a medir fuera una variable de tipo f- sico, como la longitud, la altura, etc., ya que son variables que estn bastante cla- ras para todo el mundo y todos saben cmo hay que medirlas. El problema surge cuando lo que se trata de medir es una variable psicolgica, inobservable de forma directa; una variable o atributo latente a la que se le da tambin la deno- minacin de constructo. Los constructos (variables tericas inobservables), tal y como ya hemos ex- puesto anteriormente, se manifiestan a travs de una serie de conductas que ya s son observables de forma directa y, por lo tanto, s son susceptibles de medi- cin. Estas conductas, para que puedan ser consideradas como manifestaciones del constructo han de ser ms o menos uniformes y constantes a lo largo del tiempo y en una serie de situaciones. As, por ejemplo, diremos que una per- sona es agresiva, no porque en una ocasin haya dado muestras de agresividad, 64 l si si di b( m ce C< C< la u C< d 4 rr ci d P' tE Cle Psicometra s fuertes y dbiles en to al programa de la ,jeto de estudio, aquella ~ va dirigido y la tercera in de conducta, encar- ~ s t que permita medir el la Universidad con el fin ~ n o s , controlarlo. La va- dio estara formada por la Universidad, el obje- estrs o, al menos, con- incapi en la necesidad iniciar la construccin una variable de tipo f- que estn bastante cla- irlas. El problema surge lgica, inobservable de le da tambin la deno- 1 y como ya hemos ex- re de conductas que ya n susceptibles de med- como manifestaciones nstantes a lo largo del diremos que una per- muestras de agresividad, PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA sino porque cuando se enfrenta a ciertas situaciones lo normal es que reaccione siempre agresivamente. Ahora bien, en qu consiste dar muestras de agresivi- dad o reaccionar de forma agresiva?, hay una serie de conductas que pueden ser consideradas como tales; por ejemplo, un nio tendr un comportamiento agresivo si en los recreos pelea con los dems nios sin motivo, si cuando se le regaa reacciona violentamente rompiendo alguna cosa, etc. Todas las cuestiones que hacen referencia a estas conductas son las que de- ben ser reflejadas en los tems del test; de ah la importancia de definir clara- mente el constructo que se quiere medir puesto que, en la medida en que el constructo est mejor definido, se tendr un mayor y mejor conocimiento de las conductas en las que se manifiesta, evitndose la omisin de algunas reas de conducta importantes y la inclusin de otras que resulten irrelevantes. Por ejemplo, si quisiramos construir un test para medir la habilidad verbal o la impulsividad lo primero que tenemos que hacer es definir ambos constructos. Una definicin puede ser la propuesta por Thorndike (1989): Habilidad verbal: Se trata de un constructo que se pone de manifiesto por el conocimiento de significados de un gran nmero de palabras y eleccin de la palabra ms adecuada en un determinado contexto. Impulsividad: Constructo que se manifiesta en una tendencia a autodes- cribirse con frases que implican decisiones rpidas y precisas para activi- dades no planificadas, nacidas del momento, a diferencia de las frases autodescriptivas que implican deliberacin, tendencia hacia la planifica- cin cuidadosa y reprimida. Si el constructo est bien definido ser ms fcil determinar cuales son las conductas representativas del misrTlo y, a partir de ellas, especificar el contenido del test. 4.2. Poblacin a la que va dirigido Este es otro punto a tener en cuenta a la hora de construir un test, no es lo mismo construir un test para evaluar algn rasgo o caracterstica en una pobla- cin infantil que en una poblacin de adultos, el contenido de los tems, su re- daccin, la longitud del test y las instrucciones de aplicacin y cumplimentacin, por ejemplo, sern diferentes segn el tipo de poblacin a la que vaya dirigido. Si se quiere construir un test para evaluar el razonamiento numrico, el con- tenido no podr ser el mismo si se va a uti l izar en alumnos del primer ciclo de 65 1 PSICOMETRA enseanza bsica que si se va a utilizar en alumnos de bachillerato. Los conte- nidos del test debern adecuarse al nivel de los alumnos. Si se quiere evaluar algn rasgo de personalidad, el contenido de los tems de- ber adaptarse tambin a la poblacin a la que va dirigido. Aunque el mismo constructo pueda manifestarse a travs de algunas conductas comunes sea cual sea la poblacin de inters, hay otro tipo de conductas, especficas de cada po- blacin, que son las que hay que resaltar. En el caso de que se quisiera construir un test que midiera depresin, a la hora de buscar las conductas a travs de las cuales se manifiesta el constructo se observara que algunas de ellas son comunes a los nios y a los adultos, pero hay otras conductas, especficas de cada poblacin, que son fundamentales para la evaluacin del rasgo y que debern quedar reflejadas en el test. 4.3. Utilizacin prevista Adems de tener en cuenta la poblacin a la que va dirigido el test, otro de los aspectos fundamentales a tener en cuenta es la utilizacin que se le vaya a dar; es decir, para qu se va a utilizar, qu decisiones se van a tomar a partir de las puntuaciones que obtengan los sujetos. Un test puede utilizarse para tomar decisiones diferentes. Por ejemplo, una prueba de ingls puede utilizarse para evaluar el nivel medio de los alumnos en primero de bachillerato, para detectar aquellos alumnos que muestran un nivel deficiente, o puede utilizarse en una academia de idiomas para clasificar a los alumnos segn su nivel de ingls y asignarlos a distintos cursos. Por ejemplo, no es lo mismo querer construir un test de inteligencia general para detectar nios superdotados, que querer construirlo para detectar nios de- ficientes. En el primer caso, los tems del test debern ser en su mayora muy di- fciles, para que slo puedan ser respondidos correctamente por los nios ms inteligentes; mientras que, en el segundo caso, debern ser muy fciles, de ma- nera que slo sean respondidos de forma incorrecta por aquellos nios que muestren una inteligencia deficiente. La tabla 2.2 muestra los usos ms frecuentes de los tests as como las deci- siones que se suelen tomar a partir de las puntuaciones obtenidas por los suje- tos. Del conocimiento de la finalidad del test; es decir, de las respuestas a qu se va a medir, a quin se va a medir y para qu se va a medir, van a depender las 66 bachillerato. Los conte- )S. mtenido de los tems de- gido. Aunque el mismo Ju ctas comunes sea cual especficas de cada po- midiera depresin, a la anifiesta el constructo se y a los adultos, pero hay \n fundamentales para la 2n el test. dirigido el test, otro de izacin que se le vaya a van a tomar a partir de ede utilizarse para tomar puede utilizarse para chillerato, para detectar puede utilizarse en una n su nivel de ingls Y de inteligencia general Jo para detectar nios de- ser en su mayora muy di- ente por los nios ms ser muy fciles, de ma- por aquellos nios que tests as como las deci- es obtenidas por los suje- de las respuestas a qu se medir, van a depender las PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 especificaciones que se deban hacer en cuanto al contenido del test, la dificul- tad de sus tems, la longitud de la prueba, el tiempo de aplicacin, etc. Especi- ficaciones que iremos ampliando a continuacin. Funciones SELECCIN CLASIFICACIN/COLOCACIN DIAGNSTICO CERTIFICACIN ORIENTACIN/CONSEJO DESCRIPCIN/INFORMACIN Decisiones a tomar mbito educativo: Se pueden utilizar para tomar decisiones acerca de si los alumnos han conseguido los objetivos curriculares mni- mos y se les considera Aptos/No aptos. Por ejemplo el examen de acceso a la Universidad. mbito profesional: Se pueden utilizar para llevar a cabo la seleccin de un grupo de aspirantes a un determinado puesto de trabajo. Se pueden utilizar en cualquier mbito. Por ejemplo en el mbito educativo se pueden utilizar para averiguar el nivel de los alumnos al principio de curso y asignarles a diferentes grupos en funcin de su nivel para que tengan un mejor aprovechamiento. Por ejemplo su nivel de Ingls. Sea cual sea su mbito de aplicacin, los tests se pueden utilizar para detectar problemas comportamentales, de aprendizaje, etc. Para, una vez detectados poder poner los medios para tratar de so- lucionarlos; por ejemplo, mediante algn programa de intervencin. Acreditar, en el mbito profesional, la cualificacin o competencia de las personas para el desarrollo de su profesin y, en el mbito aca- dmico, por ejemplo, para garantizar que han alcanzado los conoci- mientos y habilidades necesarias para poder obtener la titulacin acadmica correspondiente. Detectar las capacidades e intereses de las personas para, exami- nando las distintas opciones que se les presentan a nivel educativo, profesional y personal, elegir aquella/s que mejor se adecuen a su perfil. Describir el rendimiento acadmico tanto a nivel individual como co- lectivo. Obtener informacin acerca de la opinin pblica sobre algn aspecto, poltico, social, etc. de inters. 5. ESPECIFICACIN DE LAS CARACTERSTICAS DEL TEST En esta etapa de la construccin de un test juega un papel importante la ha- bilidad del constructor para planificar y desarrollar las especificaciones del mismo. Si consideramos que un test no es ms que una herramienta que nos permite obtener datos para la medicin y evaluaci n de alguna caracterstica o atributo psicolgico (constructo), la medicin no ser vlida, o la evaluacin no tendr ningn sentido, a menos que el test se adecue a su objetivo. 67 1 PSICOMETRA Hay cuatro aspectos fundamentales que hay que tener en cuenta a la hora de desarrollar las especificaciones del test: su contenido, el formato de los tems que se van a incluir, la longitud del test y la forma de aplicacin. 5.1. Contenido Una vez que se ha definido claramente el constructo que se quiere medir, la especificacin del contenido comienza determinando cual es su dominio de conductas; es decir, el conjunto de conductas a travs de las cuales se mani- fiesta. Cuando ya est determinado el dominio de conductas ya se pueden tomar decisiones acerca del contenido del test. Hay ocasiones en las que el constructo no est claramente definido y, por lo tanto, no se tiene una idea clara del conjunto de las reas de conducta a travs de las cuales se puede manifestar. En este caso se recomienda, como seala Mar- tnez-Arias (1995): 68 a) Hacer un anlisis del contenido del constructo: haciendo preguntas abier- tas a los sujetos acerca del constructo y seleccionando las respuestas que aparecen con mayor frecuencia como relevantes para la definicin del mismo. b) Revisar las investigaciones publicadas: una revisin de los trabajos reali- zados con anterioridad acerca del constructo, y de los instrumentos de evaluacin existentes, pueden constituir un buen marco de referencia. e) Llevar a cabo un anlisis de tareas: qu hacen las personas en sus pues- tos de trabajo?, qu conductas son las ms frecuentes?, qu es lo que distingue a los trabajadores ms cualificados de los incompetentes? A par- tir de estas observaciones se puede elaborar una lista de conductas crti- cas que posteriormente se puede utilizar para la evaluacin del rendi- miento en el puesto de trabajo. d) La observacin directa por parte del constructor del test le permitir iden- tificar conductas relacionadas con el constructo a medir. Si el constructo a medir fuera la extraversin o la depresin, se podra analizar qu hacen las personas diagnosticadas como deprimidas. e) Utilizar el juicio de expertos : las opiniones de aquellas personas que ya hayan trabajado en el constructo de inters pueden resultar muy valiosas. f) Revisar los objetivos instruccionales o de programas de intervencin: la re- visin de los contenidos de los programas y/o de los textos u otros mate- PRINC n t( j( Tod1 m i n a r ~ de dos que se se irn camin< conoci En 1 dos al , de un una irr Cu mico, deterrr dido o ca m in una ta reas < cesas 1 gunos preser prueb; AUI quiera unifor par L Benja1 quica1 en cuenta a la hora de ~ 1 formato de los tems l icacin. que se quiere medir, la cual es su dominio de de las cuales se mani- ctas ya se pueden tomar mente definido y, por lo ~ a s de conducta a travs ienda, como seala Mar- aciendo preguntas abier- nando las respuestas que ~ s para la definicin del in de los trabajos reali- r de los instrumentos de ~ marco de referencia. as personas en sus pues- cuentes?, zqu es lo que os incompetentes? A par- a lista de conductas crti- la evaluacin del rend- del test le permitir iden- r a medir. Si el constructo oodra analizar qu hacen aquellas personas que ya Clen resultar muy valiosas. mas de intervencin: la re- :l e los textos u otros mate- PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA riales permite establecer una serie de objetivos que han de evaluarse en el test y que especifican una serie de conductas que debern mostrar los su- jetos. Todo esto nos da una idea de la dificultad de definir un constructo y deter- minar su dominio de conductas. Por otra parte, es fcil deducir que no se trata de dos procesos distintos, sino que estn fuertemente relacionados. A medida que se tiene una mayor informacin acerca del constructo que se quiere medir se ir modificando el contenido de la prueba y viceversa, las investigaciones en- caminadas a determinar el dominio de conductas del constructo aumentarn el conocimiento del mismo y permitirn clarificar su concepcin. En los tests de rendimiento y conocimientos y, sobre todo, en los tests referi- dos al criterio (TRC), en lugar de hablar de un dominio de conductas se hablar de un dominio de contenidos a evaluar y la especificacin del mismo cobrar una importancia extraordinaria. Cuando se quiere construir un test para ser utilizado en el mbito acad- mico, por ejemplo para la evaluacin del rendimiento de los alumnos en una determinada materia, se espera que el test refleje lo que los alumnos han apren- dido o lo que deberan haber aprendido a lo largo del curso; en este caso, el camino que se suele seguir para especificar el contenido del test es construir una tabla de doble entrada, en la que las columnas representen las distintas reas de contenido o facetas del constructo a medir y las filas los distintos pro- cesos u operaciones implicados en la resolucin de las tareas planteadas. En al- gunos casos, como pueden ser pruebas de evaluacin, en las filas se puede re- presentar el grado de dificultad de las preguntas que se quieren incluir en la prueba. Aunque los contenidos de las filas variarn en funcin de aquello que se quiera medir, se ha intentado hacer una categorizacin jerrquica, ms o menos uniforme, de los distintos procesos implicados. La ms popular es la que pre- par un comit de la American Educational Research Association presidido por Benjamn Bloom (1954), que recoge los siguientes procesos ordenados jerr- quicamente en funcin de su mayor o menor complejidad: Conocimiento: Recuerdo del material presentado. Por ejemplo: Los ros de Espaa. Comprensin: Interpretacin o extrapolacin de un concepto de forma distinta a la originalmente presentada. - Aplicacin: Resolucin de problemas nuevos mediante la aplicacin de principios familiares o generalizaciones. 69 1 PSICOMETRA Anlisis: Descomposicin de un problema en sus componentes elemen- tales. Este proceso requiere reconocimiento de elementos mltiples y de las relaciones y/o principios de organizacin entre los elementos. Sntesis: Combinar elementos a partir de una estructura original o resol- ver un problema que requiere la combinacin secuencial de varios prin- cipios. Evaluacin: Empleo de criterios internos (generados por el sujeto) o ex- ternos para hacer juicios crticos. Esta categorizacin completa no siempre es utilizable, hay veces que no es necesaria la evaluacin de tantos procesos en cuyo caso es posible hacer una se- leccin de aquellos que se considere ms importantes o, simplemente, elegir los ms adecuados. Sin embargo, la lista completa facilita la preparacin y seleccin de los tems que van a formar parte de la prueba. EJEMPLO: Supongamos que queremos elaborar un test para evaluar el nivel de conoci- mientos alcanzado por nuestros alumnos en la asignatura de Psicometra. Para ello, elaboramos una tabla de doble entrada (tabla 2.3) situando en las colum- nas las distintas reas de contenido de la Psicometra incluidas en los textos uti- lizados, y en las filas los distintos procesos (se trata de un ejemplo ficticio en el que no se han incluido todas las reas de la Psicometra ni todos los procesos). En lugar de los procesos se podran haber utilizado otros criterios para la selec- cin de los tems, por ejemplo la dificultad de los mismos, tal y como se ha co- mentado anteriormente: fciles, de dificultad media o difciles. Es importante que estn representadas todas las reas de la Psicometra in- cluidas en los textos utilizados para la preparacin de la asignatura para asegu- rar que la prueba que se elabore tenga validez de contenido y que, en cada una de ellas, haya un nmero suficiente de tems para asegurar una alta fiabilidad. Sin embargo, es necesario tener en cuenta las limitaciones que pueda marcar un test demasiado largo tanto en lo que se refiere al tiempo, a la motivacin de los su- jetos, e incluso a las limitaciones debidas a las caractersticas de los mismos como puede ser la edad, su salud, etc. 70 ; componentes elemen- ementos mltiples y de e los elementos. ructura original o resol- cuencial de varios prin- dos por el sujeto) o ex- le, hay veces que no es es posibl e hacer una se- . simplemente, elegir los preparacin y seleccin luar el nivel de conoci- ra de Psicometra. Para situando en las colum- cluidas en los textos uti- n ejemplo ficticio en el ni todos los procesos). criterios para la selec- os, tal y como se ha co- ifci les. de la Psicometra in- a asignatura para asegu- nido y que, en cada una una alta fiabilidad. Sin ue pueda marcar un test la motivacin de los su- rsticas de los mismos PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA reas de contenido Procesos Medicin (20%) Fiabilidad (35%) Validez (35%) A. de tems (10%) Conocimiento (25%) 4 7 7 2 Comprensin (25%) 4 7 7 2 Aplicacin (25%) 4 7 7 2 Anlisis (25%) 4 7 7 2 Total 16 28 28 8 Hay veces que es difcil hacer una categorizacin completa de las distintas reas de contenido, y otras veces es difcil establecer los puntos de corte entre un rea y otra, de manera que las categoras correspondientes a cada rea de contenido sean mutuamente exclusivas. En este caso, es conveniente consultar con expertos para llevar a cabo la categorizacin. Cada casilla de la matriz representa la interaccin entre un rea de conte- nido y un proceso, esto facilita la redaccin de tems que cubran todos los as- pectos que se consideran importantes. No obstante, hay otro punto que hay que aclarar: si a todos los procesos y a todas las reas de contenido se les concede la misma importancia; si esto es as, ser necesario cubrir todas las celdas de la matriz con el mismo nmero de tems. Por el contrario, si se considera que no todas las reas son igualmente importantes, ni todos los procesos, ser necesa- rio establecer una ponderacin para poder establecer el nmero de tems de cada casilla. Supongamos que en nuestro ejemplo las reas de fiabilidad y validez son las ms importantes, que despus es la medicin el rea ms importante y, por l- timo, el anlisis de tems. En este caso una ponderacin que se podra dar sera 35% de los tems para fiabilidad, 35% para validez, 20% para el rea de medi- cin y un 10% para el anlisis de tems. Si se asume que todos los procesos tie- nen la misma importancia para nosotros, a cada uno de ellos le correspondera una ponderacin del 25%. Una vez asignadas las ponderaciones es necesario decidir el nmero de tems que va a tener la prueba piloto. Si queremos que tenga 80 tems (hay que tener en cuenta que en algn tipo de pruebas, la versin piloto debe contar como m- nimo con el doble o triple de los tems de la versin final del test), entonces, en funcin de los pesos asignados a cada rea, hay que establecer el nmero de 71 1 PSICOMETRA tems que hay que elaborar para cada una de ellas. En nuestro caso sera el 20% para el rea de medicin (16 tems), un 35% para fiabilidad y un 35% para va- lidez (28 tems para cada una de ellas) y un 10% para el anlisis de tems (8 tems). Para cada uno de los procesos habra que construir 20 tems puesto que todos tienen la misma ponderacin. Ahora bien, de los 16 tems correspondien- tes al rea de medicin, un 25% corresponden a cada uno de los procesos, as habr que construir 4 tems por cada uno de los procesos. Esos valores son los que aparecen en el interior de cada casilla de la matriz. Los valores del resto de las casillas se obtendran de la misma forma. La especificacin del contenido a la hora de construir un test de aptitudes tiende a ser menos especfica puesto que est pensada para medir una caracte- rstica ms general y persistente de la persona. A veces lo que se especifica es el tipo de tems que la van a conformar. Por ejemplo, si se quiere construir un test para medir la habilidad verbal, constructo que se haba definido anteriormente, se puede especificar que los tems que lo formen sean de analogas verbales, si- nnimos y antnimos, tems de frases incompletas, etc. Cuando lo que se quiere construir es un test (escala, cuestionario, inventario) para medir constructos de naturaleza no cognitiva: intereses, actitudes, tempera- mento, etc., las especificaciones pueden ser bastante esquemticas y a veces el contenido de los tems se deduce fcilmente de la misma definicin del cons- tructo. La definicin ofrecida por Thorndike acerca del constructo impulsividad, y que hemos expuesto anteriormente, sugiere que los tems hagan referencia, en- tre otros, a los siguientes aspectos: a) rapidez en las decisiones, b) inters por las actividades no planificadas, e) desagrado por las cosas y actividades muy plani- ficadas, etc. En este tipo de tests hay veces que a partir del anlisis y reflexin so- bre las teoras existentes acerca del constructo que se quiere medir surgen los tems que se deben incluir. 5.2. Formato de los tems Una vez terminada la etapa anterior ya se sabe lo que se va a medir, ahora hay que dar respuesta a la pregunta de cmo medirlo. Para ello, el primer paso es se- leccionar el tipo de tems que se van a utilizar para construir el test teniendo en cuenta que, como seala Osterlind (1998), el tem puede ser considerado como una unidad de medida dentro del test global y puede aparecer bajo diferentes formatos. Haladyna (1994), considera que una pr imera aproximacin es establecer dos grandes categoras de tems en funcin del tipo de respuesta que exijan de los sujetos: tems de eleccin e tems de construccin. 72 PRINC LOS/ sujetos tas. En 1 Cada ur rn m ~ es de ti 5.2.1. J Losf L o s ~ Falso, S EJEtv L L Este nitivo: ~ de conc usar, pE puesta) correct No E interese dado qL rango d flejar la ElE Este ternativ. puestas correctc: respuesl uestro caso sera el 20% lidad y un 35% para va- 3. el anlisis de tems (8 uir 20 tems puesto que 16 tems correspondien- uno de los procesos, as sos. Esos valores son los . Los valores del resto de ruir un test de aptitudes para medir una caracte- lo que se especifica es el construir un test definido anteriormente, :l e analogas verbales, si- cuestionario, inventario) eses, actitudes, tempera- squemticas y a veces el sma definicin del cons- constructo impulsividad, hagan referencia, en- :isiones, b) inters por las y actividades muy plani- :l el anlisis y reflexin so- quiere medir surgen los e se va a medir, ahora hay ello, el primer paso es se- Instruir el test teniendo en ser considerado como una bajo diferentes formatos. imacin es establecer dos spuesta que exijan de los PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 Los tems de eleccin son tems de respuesta cerrada, en ellos se exige a los sujetos que respondan eligiendo una o varias alternativas de entre las propues- tas. En los tems de construccin, el sujeto deber elaborar su propia respuesta. Cada una de estas grandes categoras incluye distintos tipos de formatos, que se- rn ms o menos adecuados dependiendo de si la variable que se quiere medir es de tipo cognitivo o bien de tipo orctico o afectivo. 5.2.1. tems de eleccin Los formatos ms comunes que presentan son: Dos alternativas: Los sujetos han de elegir una entre dos alternativas. Por ejemplo: Verdadero- Falso, Si -No, Correcto- Incorrecto. EJEMPLO: La capital de Espaa es Madrid ........................................... Si No Los constructos son variables observables directamente ... ... V F Este tipo de formato se utiliza normalmente para medir variables de tipo cog- nitivo: habilidades, aptitudes y, fundamentalmente para la construccin de test de conocimientos y rendimiento. Presenta la ventaja de que es rpido y fcil de usar, pero tiene el inconveniente de que los sujetos que no conozcan la res- puesta y respondan al azar tienen un 50% de posibilidad de elegir la respuesta correcta. No es el formato adecuado para los tests de personalidad y los de actitudes, intereses, etc., es decir, para los tests destinados a medir variables no cognitivas, dadoque en ellos no hay respuestas correctas ni incorrectas y, por otra parte, un rango de respuestas restringido a dos alternativas no es el ms adecuado para re- flejar la posicin de los sujetos en este tipo de variables. Eleccin mltiple: Este tipo de tems consta de :a) el enunciado propiamente dicho y b) las al- ternativas u opciones de respuesta, que consisten en una lista de posibles res- puestas de las cuales una es la correcta, o la ms adecuada, y las otras son in- correctas y se denominan distractores. Se suelen utilizar de 3 a 5 alternativas de respuesta para disminuir la posibilidad de que los sujetos elijan la alternativa co- 73 1 PSICOMETRA rrecta por azar. Por ejemplo, en un tem con cinco alternativas de respuesta, de las cuales slo una es correcta, los sujetos tienen una posibilidad de acertarlo por azar de un 20% (1/5) frente a la del 50% (1/2) que tendran si el tem hubiera te- nido dos alternativas. Tambin este tipo de formato se utiliza para medir varia- bles cognitivas y fundamentalmente en tests de conocimientos y rendimiento. No se utiliza para medir variables de personalidad, intereses, actitudes, etc., es decir, en el mbito orctico o afectivo. Presentan la ventaja de que son fciles de administrar, corregir y puntuar y hoy da se pueden corregir mediante el uso de lectoras pticas y los programas de or- denador adecuados; pero, presentan el inconveniente de que son ms difciles de construir que los de dos alternativas. Es difcil construir alternativas que sean realmente efectivas, hay veces que una alternativa incorrecta es tan obvia que re- sulta improbable que alguien la elija, con lo cual no est actuando como un dis- tractor. En este caso, si el tem tiene 5 alternativas puede suceder que, en reali- dad, est funcionando como un tem con 3 4 opciones de respuesta. Lo ideal sera disponer de un banco de tems del que se pudieran ir eligiendo, en cada ocasin, los ms adecuados. EJEMPLO: La capital de Espaa es: a) Madrid b) Barcelona e) La Corua d) Sevilla Muiz y Garca Mendoza (2002) muestran una clasificacin de los tems de eleccin mltiple en funcin de la estructura que tenga el enunciado y las dis- tintas alternativas. El enunciado, o base del tem, puede presentarse en forma interrogativa, enun- ciativa o como una frase truncada o incompleta. Cada una de estas formas dar lugar a un tipo de tem. La forma ms directa y la ms recomendable de solicitar una respuesta a los sujetos es la interrogativa. En el estudio que realizan los autores antes citados ha- cen una revisin de los exmenes PIR de los aos 1998, 1999 y 2000 y en- cuentran que el porcentaje de tems de forma interrogativa fueron 11%, 10% y 25% respectivamente, un porcentaje muy bajo. 74 e e t a f. e 1 r e f t nati vas de respuesta, de ;ibilidad de acertarlo por an si el tem hubiera te- utili za para medir varia- imi entos y rendimiento. ~ r e s e s , actitudes, etc., es corregir y puntuar y hoy as y los programas de ar- de que son ms difciles uir alternativas que sean recta es tan obvia que re- actuando como un dis- ::le suceder que, en reali- es de respuesta. : se pudieran ir eligiendo, sifi cacin de los tems de ~ a el enunciado y las dis- orma interrogativa, enun- una de estas formas dar licitar una respuesta a los s autores antes citados ha- 998, 1999 y 2000 y en- Jativa fueron 11 %, 1 0% y ~ PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA La forma enunciativa es equivalente a la anterior y puede ser utilizada si el conjunto del tem es coherente; es decir si el enunciado o base del tem con- cuerda con las distintas alternativas y stas son de contenido homogneo y es- tn bien redactadas. Los tems cuya base es una frase incompleta que contina en alguna de las alternativas que se proponen suele utilizarse en tests educativos puesto que es fci 1 de construir a partir de frases de los textos. En relacin con la forma de redactar las alternativas, hay dos tipos de tems: los que presentan una nica respuesta correcta y aquellos en los que todas las alternativas son parcialmente correctas pero hay una que es ms completa y la mejor respuesta de las presentadas. El primer tipo de tems se suele utilizar cuando no hay ambigedad acerca de la veracidad o falsedad de la respuesta, y el segundo cuando se pretenden evaluar procesos mentales complejos. Emparejamiento: Este formato implica que el sujeto empareje los elementos de dos columnas de acuerdo a las instrucciones dadas en el enunciado. Al igual que los formatos presentados anteriormente, est indicado para medir variables de tipo cognitivo y, sobre todo, conocimientos. EJEMPLO: Seleccione de la columna de la derecha la ciudad espaola que pertenece a la Comunidad Autnoma situada en la columna de la izquierda y ponga en el es- pacio en blanco que aparece al lado de cada Comunidad la letra asignada a la ciudad que le corresponde: 1) Casti !la-Len . . . . . . . . . . . .. . . a) Santander 2) Cantabria .................. ... b) Segovia 3) Andaluca .................... e) Cceres 4) Extremadura ................ d) Sevilla Formato Cloze o incompleto: En este tipo de tems se ofrece a los sujetos, por ejemplo, un prrafo o una frase en la que faltan algunas palabras y aparece un espacio en blanco en su lu- gar, a continuacin, se ofrece una lista en la que se incluyen las palabras que fal- tan. La tarea de los sujetos consiste en seleccionar, de la lista de palabras que se le ofrece, la que corresponda a cada espacio en blanco. 75 1 PSICOMETRA EJEMPLO: En el ro haba gran cantidad de ........... que navegaban en ambas direccio- nes. No se poda estar en cubierta debido al fuerte .. . ...... .. , pero como el tra- yecto no era muy ............ .. .. .. . .. .. no era demasiado molesto permanecer en el/la a) Barcos b) Interior e) Viento d) Largo Nota: Recordar que los formatos incluidos hasta ahora se utilizan, fundamental- mente, para la medida de habilidades, aptitudes y conocimientos. En ellos, se decide de antemano cul es la respuesta correcta y las incorrectas. Los tests elaborados con este tipo de tems se denominan tests objetivos. Escalas de clasificacin (rating sea/es): Se trata de un tipo de formato de tems en el que se presenta un enunciado y distintas alternativas de respuesta que estn ordenadas de forma gradual en una serie de categoras a lo largo de un continuo. El sujeto debe responder eligiendo, de entre las alternativas propuestas, aquella que mejor refleje su postura o acti- tud personal ante el enunciado. Dado que a los sujetos se les pide que emitan juicios de valor, puesto que han de mostrar su postura personal, a este tipo de escalas se las denomina escalas valora ti vas. EJEMPLO: El tabaco debera prohibirse en todos los sitios pblicos: a) Totalmente de acuerdo b) De acuerdo e) Me es indiferente d) En desacuerdo e) Totalmente en desacuerdo 76 PRINCIPI AunqL pie, en eL ferencia r ciones so de clasifi, ordenad Este ti respuestc: tudes, in1 Ti ene1 precisa e ni entes; ciones d' nativa o frecuentr den sierr mero im Res pE zado, pE de difen tipo de f Likert er en su tc Las e diendo r AcuE Freet Cant Sent1 Va/o. Ent r( tas ling1 Li: Se tr su opi n aban en ambas direccio- ....... , pero como el tra- esto permanecer en el/la ,, , utilizan, fundamental- _ntos. En ellos, se decide _os tests elaborados con resenta un enunciado y le forma gradual en una be responder eligiendo, efl eje su postura o acti- os de valor, puesto que se las denomina escalas PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 Aunque este formato se parece al que presentan los tems de eleccin mlti- ple, en cuanto que hay un enunciado y varias opciones de respuesta, hay una di- ferencia muy clara entre ellos. En los tems de eleccin mltiple las distintas op- ciones son independientes entre s; por el contrario, las opciones de las escalas de clasificacin son interdependientes y corresponden a categoras de respuesta ordenadas gradualmente. Este tipo de formato no se utiliza en el mbito cognitivo, ya que no implica respuestas correctas o incorrectas, sino para medir variables no cognitivas: acti- tudes, intereses, persona 1 idad, etc. Tienen la ventaja de que los sujetos expresan su postura de una manera ms precisa que en los tems de eleccin mltiple; pero tienen tambin sus inconve- nientes; uno de ellos, muy importante, es que el significado de las distintas op- ciones de respuesta no es el mismo para todos los sujetos. Por ejemplo, la alter- nativa de acuerdo no siempre significa lo mismo para todos. Por otra parte, es frecuente que aparezcan sesgos en las respuestas; es decir, hay sujetos que tien- den siempre a elegir las opciones extremas o, por el contrario, cuando hay un n- mero impar de categoras algunos sujetos tienden a elegi r la categora central. Respecto al nmero de opciones ms adecuado no hay un acuerdo generali- zado, pero lo cierto es que cuando hay ms de 7 los sujetos se sienten incapaces de diferenciar entre los significados de las categoras contiguas. En general, el tipo de formato ms utilizado es el de 5 alternativas de respuesta propuesto por Likert en 1929 para la elaboracin de escalas de actitudes. Osgood (1952, 1976) en su tcnica denominada Diferencial Semntico utiliz 7 categoras de respuesta. Las etiquetas lingsticas asignadas a las distintas categoras variarn depen- diendo del tipo de escala utilizada, en general reflejan los siguientes aspectos: Acuerdo: Totalmente en desacuerdo ........ Totalmente de acuerdo Frecuencia: Siempre .......... ........................ Nunca Cantidad: Mucho ... ...... . .......................... Nada Sentimientos: Completamente satisfecho ...... Completamente insatisfecho Valoracin: Excelente ................................. Muy mala Entre medias de esas categoras extremas se irn asignando distintas etique- tas lingsticas en funcin del nmero de alternativas. Listados ( checklists): Se trata tambin de una escala valorativa en la que los sujetos han de mostrar su opinin respecto a algn hecho (idea, objeto, persona, etc.) presentado en el 77 1 PSICOMETRA enunciado. No se utilizan para la medida de variables de tipo cognitivo. A dife- rencia de las escalas de clasificacin, las opciones de los listados no estn or- denadas sino que son independientes entre s. Tambin se diferencian de los tems de eleccin mltiple en que en los listados no hay respuestas correctas o incorrectas. Por otra parte el nmero de alternativas de respuesta suele ser bastante grande (una lista) y no siempre es necesario elegir una nica opcin, es posible elegir varias opciones. Es un formato tpico de los cuestionarios. EJEMPLOS: En su opinin, cul de los deportes que aparecen a continuacin es su preferido: a) Natacin b) Ftbol e) Tenis d) Golf Los sujetos debern responder marcando la alternativa elegida. De los adjetivos que aparecen a continuacin, seale con una cruz aque- llos que mejor le definan: a) Simptico e) Sociable b) Tmido f) Estudioso e) Paciente g) Trabajador d) Impulsivo h) Perezoso Nota: Las escalas de clasificacin y los 1 istados se u ti 1 izan para la medida de varia- bles de personalidad, actitudes, opiniones, etc. Variables no cognitivas. En este tipo de pruebas no hay respuestas correctas o incorrectas. 5.2.2. tems de construccin En este tipo de tems es el propio sujeto el que ha de elaborar su respuesta, de ah que se denominen de respuesta abierta. Ahora bien, dentro de esta cate- gora de tems hemos de distinguir los de respuesta corta y los de respuesta ex- tensa o de ensayo. 78 S le tipo cognitivo. A dife- los listados no estn or- ~ n se diferencian de los y respuestas correctas o ;uele ser bastante grande Jpcin, es posible elegir os. en a continuacin es su nativa elegida. 'ale con una cruz aque- para la medida de varia- cognitivas. En este tipo elaborar su respuesta, en, dentro de esta cate- rta y los de respuesta ex- PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA tems de respuesta corta: A veces no son ms que modificaciones de los tems de eleccin mltiple pues el sujeto ha de elegir una nica palabra; pero, en lugar de elegirla de entre una serie de alternativas que se le ofrecen, la tiene que construir l mismo; otras veces el sujeto tiene que responder con una frase. EJEMPLO: - El nombre del presidente de Gobierno espaol es ................. . .... . .. . .. .... . tems de respuesta extensa o de ensayo: Se pide a los sujetos, por ejemplo, que desarrollen un tema. EJEMPLO: Describa el origen y desarrollo de la Teora de los Tests. Dado que la realidad de la vida es algo bastante complicado, no siempre es adecuado utilizar un formato de respuesta cerrada en los tems pues la infor- macin que ofrecen es una informacin parcial (Makel, 1998). A veces es pre- ferible dar a los sujetos la oportunidad de que expresen con sus propias pala- bras sus conocimientos, experiencias, opiniones, etc. y, de esta manera, el investigador podr conocer no slo lo que saben, piensan y opinan acerca de aquello sobre lo que se les pregunta, sino cmo lo expresan, pudiendo tambin analizar ciertos aspectos de la respuesta como puede ser la originalidad, la forma de redactar, etc., que en determinadas situaciones son cualidades nece- sarias. Es decir, se podr evaluar no slo el nivel de conocimientos de los suje- tos y su forma de estructurarlos, sino sus habilidades cognitivas de orden supe- rior, los procesos cognitivos que ponen en marcha a la hora de solucionar un problema. Este tipo de formato de los tems se utiliza para medir todo tipo de variables, tanto cognitivas como orcticas y afectivas, pero tiene un inconveniente im- portante y es que las respuestas de los sujetos son ms difciles de analizar y va- lorar que las de los tems de respuesta cerrada, puesto que el investigador tiene que codificarlas en una serie de categoras antes de comenzar el anlisis. La co- dificacin incluye agrupar juntos a los sujetos que han emitido respuestas simi- lares y es muy difcil encontrar a dos sujetos que hayan dado la misma respuesta. En este caso el investigador suele emitir juicios subjetivos acerca de lo que los sujetos queran o no decir cuando emitieron sus respuestas. 79 1 PSICOMETRA En cuanto a la dificultad de construccin a nadie se le escapa que es mucho ms fcil preparar este tipo de pruebas que los tests objetivos, de ah que cuando la poblacin a la que se dirige el test es pequea se suelen utilizar tests con tems de respuesta corta (Nunnally y Bernstein, 1995). 5.3. Longitud del test Al hacer la matriz de especificaciones del contenido (ver tabla 2.3) se explic la forma en que se poda calcular y repartir el nmero de tems de un test, par- tiendo de un nmero inicial de tems, en funcin de las reas de contenido, de los procesos que se iban a evaluar o de cualquier otra variable que se quiera te- ner en cuenta a la hora de construir un test. Ahora bien, cul es el nmero de tems adecuado en cada caso? Realmente no hay una respuesta nica a esta pre- gunta, ya que son muchos los factores que hay que tener en cuenta: la poblacin a la que va dirigido, las limitaciones de tiempo, los objetivos del test, etc. En cuanto a la poblacin a la que va dirigido no es lo mismo construir un test para ser utilizado en una poblacin infantil que en una poblacin adulta, no slo el tiempo que tardan los nios en procesar la respuesta a cada tem y en es- cribirla es distinto, sino que tambin vara su. capacidad de atencin y motiva- cin. Es muy difcil conseguir que los nios puedan responder correctamente a tests muy largos. El tiempo del que se dispone tambin es otro factor a tener en cuenta a la hora de fijar la longitud del test. Si se asume que los bachilleres o universitarios tardan aproximadamente 1 minuto en responder a un tem de eleccin mltiple en un test de conocimientos, difcilmente se podr poner un test de ms de 60 tems cuando se cuente con menos de una hora de tiempo para su realizacin. Como norma general se debera asumir que, a no ser que lo que se desee medir sea la rapidez de respuesta de los sujetos, la longitud del test debe ser tal que to- dos tengan tiempo suficiente para intentar resolver o contestar a todos los tems. Los objetivos del test es otro factor a tener en cuenta, si el test se quiere cons- truir para medir un rea de conocimiento muy concreta deber estar formado por tems muy especficos y similares, pero no ser necesario que sea muy largo; sin embargo, si el test debe cubrir varias reas de conten.ido deber incluir un ma- yor y ms variado nmero de tems. La matriz de especificaciones del contenido nos puede dar una idea acerca del nmero de tems a incluir. En lugar de partir del nmero de tems que debe 80 le escapa que es mucho !tivos, de ah que cuando utilizar tests con tems (ver tabl a 2.3) se explic de tems de un test, par- s reas de con ten ido, de ariable que se quiera te- n, cul es el nmero de nica a esta pre- r en cuenta: la poblacin etivos del test, etc. ) mismo construir un test na poblacin adulta, no 1esta a cada tem y en es- ld de atencin y motiva- sponder correctamente a a tener en cuenta a la chilleres o universitarios tem de eleccin mltiple un test de ms de 60 popara su realizacin. e lo que se desee medir 1 test debe ser tal que to- ntestar a todos los tems. si el test se quiere cons- estar formado por o que sea muy largo; sin deber incluir un ma- e dar una idea acerca mero de tems que debe PRINCIPIOS BSICOS PARA LA CONSTRUCCI N DE INSTRUMENTOS DE MEDICI N PSICOLGICA tener la prueba piloto para hacer el reparto de tems en cada casilla, como se hi zo anteriormente, se puede proceder a la inversa; se puede partir del nmero mnimo de tems que ha de tener una de las casillas y, teniendo en cuenta los fac- tores de ponderacin asignados a cada rea de conducta y a cada proceso a eva- luar, se van calculando el nmero de tems del resto de las casill as. Al final se po- dr contar con el nmero de tems del test total. En cualquier caso, se recomienda que en la prueba piloto se incluya un n- mero de tems que sea mayor que el que se va a utilizar en la versin final , ya que a lo largo de los distintos anlisis que se debern ir haciendo se irn elimi- nando aquellos tems que no renan las propiedades psicomtricas adecuadas. 5.4. Caractersticas psicomtricas de los tems Cuando hablamos de caractersticas psicomtricas de los tems nos referimos fundamentalmente a su nivel de dificultad, a su homogeneidad en rel acin con los dems tems que formen el test y a su capacidad de discriminacin. Aunque no vamos a entrar en la explicacin de los mtodos estadsticos que implica su clculo, puesto que son aspectos que se irn analizando en los temas siguientes, s queremos hacer referencia a su significacin y a la importancia que tienen a la hora de seleccionar los tems para la construccin de un test. En el marco de, la Teora Clsica de los Tests, diremos que un tem es fcil o difcil para una qeterminada poblacin, en funcin de la probabilidad que ten- ; gan los sujetos de responder a l correctamente. Si esta probabilidad es alta, el tem ser fcil y, por el contrario, ser difcil si la probabilidad es baja. Un tem tendr un alto grado de homogeneidad con el resto de los tems que formen el test cuando mida lo mismo que ellos. Un tem tendr poder discriminativo en la medida en que sirva para diferen- ciar entre sujetos que han obtenido en el test puntuaciones extremas. Aunque estas caractersticas se analizarn en profundidad en un tema poste- rior, han de tenerse en cuenta a la hora de construir un test, pues dependi endo del uso que se le vaya a dar ser necesario que los tems seleccionados tengan unas caractersticas determinadas. Respecto a la dificultad de los tems vamos a hacer una distincin entre tres tipos de tests: de velocidad, de ejecucin mxima y de ejecucin tpica. Tests de velocidad: En este tipo de tests los tems deben ser muy fciles de re- solver, la dificultad estriba en que tienen un tiempo limitado de ejecucin y este 81 1 PSICOMETRA es el factor que va a permitir diferenciar y discriminar entre los sujetos. Si no existiera limitacin del tiempo, la mayora de los sujetos seran capaces de re- solver correctamente todos los tems. Algunos tests construidos para medir va- riables cognitivas son tests de velocidad; por ejemplo un test que mida rapidez de clculo. Tests de ejecucin mxima (Tests de potencia). Utilizados fundamentalmente para la evaluacin del rendimiento acadmico y para la medida de las aptitudes y destrezas. En este tipo de tests los tems presentan diferentes grados de difi- cultad, desde tems muy fciles que puedan ser respondidos por todos los suje- tos y que debern estar situados al comienzo de la prueba, hasta tems muy di- fciles que no puedan ser acertados ms que por los sujetos ms aptos y que se colocan al final de la prueba. En este tipo de tests el tiempo no es un factor que deba influir. Los sujetos han de tener el tiempo suficiente para poder intentar re- solver todos los tems, y si no lo hacen no debe ser por falta de tiempo sino por- que no conocen la respuesta. Tests de ejecucin tpica: Son los tests de personalidad, actitudes, intereses, etc. Dado que en ellos no hay respuestas correctas o incorrectas no tiene sentido hablar de dificultad de los tems. El grado de homogeneidad de los tems depende del constructo que se quiera medir con el test. Si se trata de un constructo unidimensional los tems han de ser ms homogneos que si el constructo a medir es multidimensional. Si el cons- tructo es multidimensional y todos los tems del tests miden una nica dimen- sin, habr aspectos del mismo que no sern medidos y, por lo tanto, las infe- rencias que se hagan a partir de las puntuaciones que obtengan los sujetos en el test no sern lo suficientemente vlidas. En cuanto al nivel de discriminacin de los tems depender de la poblacin a la que va dirigido el test. Si el test est dirigido a la poblacin general ser ne- cesario que los tems permitan discriminar entre los distintos niveles (de rendi- miento, conocimientos, aptitud o destreza) que presenten los sujetos. Esto quiere decir que el test deber estar formado por tems que cubran todos los niveles de dificultad, desde los ms fciles a los ms difciles. Dado que los tems que ms discriminan en este tipo de poblaciones son los de dificultad media, el mayor porcentaje de tems deber tener este grado de dificultad. Si se quiere que el test detecte a los sujetos ms brillantes y discrimine entre ellos, los tems debern ser difciles y muy difciles, de manera que los sujetos que presenten un nivel medio y bajo no los puedan responder correctamente y slo lo hagan los ms capacitados. 82 PRI Si , los tr m en< 6. ~ - L una buer A pers( cons 2 3 4 5 6 7 L larg l m ~ hao trat cult del pre( a h; l u e ~ entre los sujetos. Si no )S seran capaces de re- 1struidos para medir va- In test que mida rapidez ados fundamentalmente medida de las aptitudes li ferentes grados de difi- didos por todos los suje- eba, hasta tems muy di- jetos ms aptos y que se mpo no es un factor que te para poder intentar re- falta de tiempo sino por- dad, actitudes, intereses, :orrectas no tiene sentido 1 constructo que se quiera ~ n s i o n a l los tems han de ltidimensional. Si el cons- miden una nica dimen- s y, por lo tanto, las infe- Dbtengan los sujetos en el epender de la poblacin 1oblacin general ser ne- li stintos niveles (de rend- en los sujetos. Esto quiere ubran todos los niveles de tdo que los tems que ms li ficultad media, el mayor Ita d. il lantes y discrimine entre de manera que los sujetos esponder correctamente y PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 Si, por el contrario, ahora se quisiera discriminar entre los menos capacitados, los tems deberan ser fciles y muy fciles, de manera que slo los fallaran los menos capacitados. 6. REDACCIN DE LOS TEMS La realidad es que si queremos construir un buen test hay que tener en cuenta una cosa, que si los tems que lo van a formar son malos el test no puede ser bueno, de ah la importancia de cuidar la redaccin de los mismos. Algunos autores piensan que la construccin de tems es un arte que pocas personas dominan (Nunnally y Bernstein, J 995); sin embargo, hay una serie de consideraciones que pueden ayudarnos en la tarea: 1. Debe existir un alto grado de congruencia entre el tem y el constructo psicolgico que se quiere medir (validez de constructo). 2. Los constructos deben estar claramente definidos. Si no es as difcilmente se podr valorar el grado de congruencia tem-constructo. 3. Hay que tratar de minimizar los errores de medida cometidos al medir el constructo con cada tem. 4. El formato de los tems ha de ser adecuado para los objetivos del test. 5. Los tems deben reunir las caractersticas psicomtricas ms adecuadas en cada caso. 6. Los tems deben estar bien redactados. 7. Los tems deben satisfacer las consideraciones legales y tcnicas perti- nentes. Por ejemplo se deben evitar los plagios. Las cinco primeras consideraciones se han abordado ya, en cierto modo, a lo largo del tema; ahora vamos a ocuparnos de la redaccin de los tems. Todas las personas que nos hemos enfrentado a la tarea de escribir, nos da- mos cuenta de la dificultad que entraa, y del nmero de veces que hay que re- hacer el texto hasta que estamos ms o menos conformes con lo escrito. Si se trata de escribir algo tcnico, por ejemplo redactar los tems de un test, la difi- cultad todava es mayor porque se requiere un alto grado de precisin en el uso del lenguaje (Osterlind, 1998). Ahora bien, para poder alcanzar ese grado de precisin es necesario tener un conocimiento profundo del contenido al que van a hacer referencia los tems. Yo podr ser una artista escribiendo, pero desde luego no podra construir buenos tems para medir el conocimiento de los alum- 83 1 PSICOMETRA nos de Ingeniera Industrial en la asignatura de Resistencia de Materiales porque mi desconocimiento del tema es absoluto. Una vez que se presupone el conocimiento del contenido que han de tener los tems del test, para poder redactar buenos tems conviene aceptar una serie de recomendaciones, unas de carcter general y otras especficas del tipo de for- mato que se vaya a utilizar en la redaccin. 6.1 . Recomendaciones generales Aunque algunas pueden parecer obvias y de sentido comn la experiencia de- muestra la necesidad de recordarlas. Evitar la ambigedad de los enunciados Una forma de hacerlo es redactndolos de forma clara. El significado de las palabras empleadas debe estar claro para todos los sujetos ya que difcilmente seran comparables sus respuestas si cada uno pudiera interpretar de manera dis- tinta el significado del enunciado. Trminos como religiosidad o patriotismo, por ejemplo, pueden ser interpretados de manera diferente por distintos sujetos; en- tonces, cuando se aluda a ellos tiene que quedar muy claro a qu se est ha- ciendo referencia (Fowler, 1995; Weisberg et al. ,1996). Los enunciados cortos y directos tambin contribuyen a evitar la ambigedad ya que la inclusin de palabras innecesarias complican la lectura y pueden pro- vocar confusin en los sujetos (Payne, 1951 ). Es necesario que sean lo ms precisos posible. Hay tems que incluyen pre- guntas acerca de las actividades de las personas en los ltimos aos, o sus pro- yectos para los prximos aos. Esto provoca ambigedad y es necesario preci- sar qu se entiende por los ltimos aos o los prximos aos. Esos trminos pueden tener distinto significado para los sujetos ya que mientras para unos pue- den significar 2 aos, para otros pueden ser 5 o 1 O aos. Evitar enunciados que provoquen respuestas sesgadas Se deben evitar los enunciados que puedan provocar una respuesta sesgada, entendiendo por respuesta sesgada aquella que es ms probable que elijan los sujetos independientemente de su opinin. Por ejemplo un enunciado que im- plique que los sujetos deban admitir conductas o actitudes que no son conside- radas socialmente aceptables puede provocar que los sujetos no manifiesten su verdadera opinin y elijan la respuesta socialmente aceptable. 84 VO( me son no De que suje E L 6.2. A norn
1 . ia de Materiales porque enido que han de tener 1viene aceptar una serie pecficas del tipo de for- :omn la experiencia de- ara. El significado de las Jetos ya que difcilmente hterpretar de manera dis- osidad o patriotismo, por por distintos sujetos; en- claro a qu se est ha- !n a evitar la ambigedad 1 la lectura y pueden pro- ' tems que incluyen pre- ; ltimos aos, o sus pro- ad y es necesario preci- aos. Esos trminos runa respuesta sesgada, s probable que elijan los lo un enunciado que im- des que no son conside- sujetos no manifiesten su le. PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA Expresar una nica idea en el enunciado Es necesario evitar las dobles preguntas en un mismo enunciado ya que pro- vocara confusin en los sujetos y no sabran qu respuesta emitir. EJEMPLO: Est usted a favor de reducir el consumo de alcohol entre los jvenes y au- mentar los impuestos de las bebidas alcohlicas .......... S NO Este enunciado es incorrecto, se incluyen dos conceptos diferentes. Una per- sona puede estar a favor de reducir el consumo de alcohol entre los jvenes pero no a base de aumentar los impuestos, con lo cual no sabra que opcin elegir. De un nico enunciado se podran obtener dos tems: a) Est usted a favor de reducir el consumo de alcohol entre los jvenes .... S NO b) Est usted de acuerdo en que se aumenten los impuestos de las bebidas al- cohlicas para reducir su consumo entre los jvenes ......... S NO Evitar las dobles negaciones en los enunciados: En general es preferible no abusar de los enunciados negativos, pero lo que s que hay que evitar es el uso de las dobles negaciones ya que provocan que los sujetos no sepan cual es la respuesta que representa su punto de vista u opinin. EJEMPLO: Le parece a usted posible o imposible que la llegada del hombre a la luna nunca hubiera ocurrido ....... ........... .... .... ...... ... ..... .... V F Ante este enunciado uno no sabra que responder, sera imposible. 6.2. Recomendaciones para tems de eleccin Adems de las normas generales anteriormente expuestas hay una serie de normas especficas para cada tipo de formato. Dos alternativas: Verdadero-Falso 1. Estar absolutamente convencido de que el tem es sin ninguna duda ver- dadero o falso. 85 1 PSICOMETRA EJEMPLO: Dal fue el mejor pintor del siglo veinte ................................ V F Se trata de un enunciado mal elaborado ya que eso es muy subjetivo. 2. No utilizar frases que sean universalmente verdaderas o falsas. 3. Evitar en el enunciado palabras que puedan, de alguna manera, inducir la respuesta correcta a los sujetos aunque no la conozcan. Trminos como siempre, todo, nada, nunca, exclusivamente, inducen la res- puesta ya que suele ocurrir que cuando se utilizan estos trminos en un tem de dos alternativas (Verdadero-Falso) el tem es falso. Por el contrario trminos como a veces, en general, apenas .. .. hacen mucho ms probable que el enunciado del tem sea verdadero. 86 4. Situar a lo largo del test, de forma aleatoria, los tems cuyo enunciado sea correcto; de esta manera se evitan patrones de respuesta reconocibles por los sujetos. Por ejemplo, si se introdujera un tem falso cada dos tems ver- daderos y los sujetos descubren la secuencia del patrn pueden responder correctamente a un tem sin conocer la respuesta. Eleccin mltiple 1. Asegurarse de que el enunciado del tem formula el problema con claridad. 2. Incluir la mayor parte del texto en el enunciado para evitar repeticiones in- necesarias en las opciones de respuesta. 3. Incluir las distintas opciones de respuesta al final del enunciado. 4. Asegurarse de que los distractores (alternativas incorrectas) son plausibles. 5. Evitar opciones de respuesta como Ninguna de las anteriores, Todas las an- teriores. 6. Que slo haya una opcin correcta (o ms correcta), a no ser que se indi- que lo contrario claramente en las instrucciones. 7. Tratar de que todas las alternativas de respuesta tengan una longitud apro- ximadamente igual y con una construccin gramatical parecida. 8. Aleatorizar la ubicacin de la alternativa correcta. 9. Hacer que todas las alternativas le parezcan igualmente atractivas a una persona no informada del problema al que alude el enunciado. 1 O. Asegurarse de que cada alternativa concuerda gramaticalmente con el enunciado del tem. Si el enunciado est en singular, asegurarse que cada alternativa est en singular. PRINCIPIO Emp. 1. Ase! que Sup' las e el p nes EJEMPI Premis. 1. Esp; 2. Fecl 3. Frar 4. Ale1 Aunqu se sabe e< 2. Util Las zq sen se e poc 3. El E suj< Forr Es nee como altt cer io cor Ese 1. E vi haf 2. In e for ..... ........ V F 2 s muy subjetivo. ~ e r a s o falsas. lguna manera, inducir la ozcan. vamente, inducen la res- 5 trminos en un tem de contrario trminos como ble que el enunciado del ems cuyo enunciado sea spuesta reconocibles por falso cada dos tems ver- patrn pueden responder a. problema con claridad. ra evitar repeticiones in- correctas) son plausibles. 5 anteriores, Todas las an- , a no ser que se indi- almente atractivas a una el enunciado. gramaticalmente con el lar, asegurarse que cada PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA Emparejamiento 1. Asegurarse que tanto las premisas como las opciones de respuesta que hay que emparejar son homogneas. Supongamos que hay dos premisas que hacen referencia a una fecha y en las opciones de respuesta slo hay dos que incluyen los aos; lgicamente el problema se reduce a emparejar esas dos premisas con las dos opcio- nes de respuesta y no hace falta examinar ninguna de las dems. EJEMPLO: Premisas Opciones 1. Espaa a. Berln 2. Fecha del descubrimiento de Amrica b. Pars 3. Francia c. 1492 4. Alemania d. Madrid Aunque un poco exagerado el ejemplo, dado que no hay ms que una fecha se sabe con qu premisa hay que emparejar esa opcin. 2. Utilizar el formato adecuado. Las premisas se deben presentar de forma aleatoria en una columna a la izquierda y en una columna paralela, situada a la derecha, se deben pre- sentar las distintas alternativas de respuesta. Para facilitar la tarea del sujeto se debe dejar un espacio en blando detrs de cada premisa numerada para poder situar la letra correspondiente a la alternativa de respuesta. 3. El enunciado del tem debe reflejar claramente la tarea que se espera del sujeto y la forma en que hay que llevar a cabo el emparejamiento. Formato Cloze o incompleto Es necesario que en el enunciado clel tem haya tantos espacios en blanco como alternativas de respuesta, y en caso de que esto no suceda habr que ha- cerlo constar en las instrucciones. Escalas de Clasificacin 1. Evitar expresiones coloquiales en los enunciados de los tems pues puede haber sectores de la poblacin que las desconozcan. 2. Incluir en el test completo aproximadamente el mismo nmero de tems formulados de manera positiva y negativa. 87 1 PSICOMETRA Dado que las escalas de clasificacin se utilizan, fundamentalmente, para la medida de actitudes, opiniones, valores, etc., el test deber incluir el mismo nmero de tems que denoten una actitud positiva o favorable a lo que se est evaluando y una actitud contraria; evitando, como ya se ha comentado anteriormente, las negaciones en el enunciado. Por ejemplo en lugar de poner: No me gusta mucho la caza que resulta ambigua, queda- ra mejor redactado si pusiera Odio la caza con las distintas etiquetas lin- gsticas asociadas a las distintas categoras de respuesta. 3. Asignar las etiquetas lingsticas. Aunque ya se ha abordado este tema es importante recordarlo. Teniendo en cuenta que las categoras estn ordenadas, hay veces que slo se in- cluyen valores numricos. Es importante que al menos en los extremos de la escala aparezcan las etiquetas lingsticas pues facilitan la respuesta de los sujetos. Tambin es conveniente introducir una categora central que re- presente el punto medio o neutral (por ejemplo No se, Indiferente, Ni de acuerdo ni en desacuerdo) pues refleja la opinin o actitud de muchas personas. Listados Son fciles de construir y su redaccin no reviste ningn problema. Es nece- sario seguir las recomendaciones generales. 6.3. Recomendaciones para los tems de construccin 88 tems de respuesta corta 1. Asegurarse de que el enunciado del tem puede ser contestado con una nica frase o palabra y que hay una nica respuesta correcta. Omitir slo palabras clave. 2. Los espacios en blanco para las respuestas han de ser de la misma longi- tud. La correccin se facilita si estos espacios se presentan en una columna a la derecha de los enunciados. 3. Evitar dar pistas o claves acerca de la respuesta correcta. Si por ejemplo la respuesta correcta lleva un artculo delante, en el enunciado deber apa- recer as: el (a), un (una), para evitar que los sujetos al responder tengan una pista acerca de la palabra que deben elegir. Jndamentalmente, para 2 test deber incluir el positiva 0 favorable a lo vitando, como ya se ha Jnci ado. Por ejemplo en esulta ambigua, queela- 1s distintas etiquetas lin- spuesta. 1 te recordarlo. Teniendo veces que slo se in- en \os extremos de facilitan la respuesta ele categora centra\ que re- o se, Indiferente, Ni de 0 actitud de muchas ser contestado con una correcta. Omitir slo ser de la misma longi- n en una columna cta. Si por ejemplo \a el enunciado deber apa- jetos a\ responder tengan PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 4. Indicar el grado de precisin exigido en la respuesta. Si, por ejemplo, la respuesta al tem requiere hacer clculos numricos con decimales, es ne- cesario expresar el nmero de decimales que se deben utilizar. 5. Evitar determinantes especficos como Todo o Nada y ambiguos como Fre- cuentemente o Algunas veces. tems de respuesta extensa o de ensayo 1. Asegurarse de que el problema est bien enfocado. Se debe comenzar el enunciado con palabras que definan claramente la tarea, por ejemplo: Compare, Contraste .... Los sujetos han ele saber perfectamente que es lo que se les est pregun- tando, de esta manera se evitaran las vaguedades en las respuestas. En los tests de rendimiento y conocimientos, bajo la presin ele una situa- cin de examen, los estudiantes trabajan contra reloj y si no tienen bien de- limitado el tema sobre el que deben hablar es posible que las respuestas sean vagas y pobres. Por otra parte, a medida que est menos estructurada la pregunta es ms difcil ser objetivo a la hora de corregirla puesto que la variabilidad de las respuestas es mayor. 2. No permitir a los sujetos que elijan entre varias preguntas de ensayo. Si se quiere comparar el rendimiento de los sujetos es necesario hacerlo sobre una tarea comn. Si cada sujeto ha tenido opcin de elegir respon- der a tems diferentes la comparacin no es posible. 3. Decidir de antemano cmo se van a puntuar las preguntas de ensayo. Este es uno de los grandes problemas de este tipo de tems ya que es muy difcil conseguir objetividad a la hora de su correccin. Si una prueba de ensayo es corregida por dos personas distintas es fcil que la puntuacin asignada vare considerablemente si no hay unas reglas completas y ex- plcitas acerca de cmo hacerlo. 4. Redactar las preguntas referidas a cuestiones controvertidas de manera que los sujetos que deben responder sean evaluados en relacin a la eviden- cia que presentan no a su posicin personal respecto al tema. 89 1 PSICOMETRA 6.4. los sesgos de respuesta Otro de los aspectos que hay que tener en cuenta a la hora de redactar los tems, sea cual sea su formato, es la posibilidad de respuestas sesgadas. Es cierto que este tipo de respuestas suelen aparecer en tests construidos para la medida de aspectos orcticos y afectivos: personalidad, intereses, actitudes, etc. Algunos de estos sesgos ya han sido puestos de manifiesto a lo largo del tema pero no est de ms recordarlos. Los principales sesgos de respuestas, que hay que tratar de evitar en lo posi- ble, son producidos por: Aquiescencia o tendencia a responder sistemticamente que se est de acuerdo (o en desacuerdo) con el enunciado del tem con independencia de su contenido. Deseabilidad social o tendencia a responder al tem de una manera so- cialmente aceptable y no en funcin de lo que uno sienta, opine o piense. Indecisin o tendencia a seleccionar la alternativa central o neutra co- rrespondiente a etiquetas como No s, Ni de acuerdo ni en desacuerdo, Indiferente. Aunque a veces no es deseable, cuando se observa que la al- ternativa central puede provocar sesgos de respuesta se puede eliminar. Respuesta extrema o tendencia a elegir como respuesta las categoras de los extremos con independencia del contenido del tem. 7. REVISIN CRTICA POR UN GRUPO DE EXPERTOS Una vez que se han redactado los tems del test, y antes de dar forma a la prueba piloto, es conveniente que esos tems sean revisados por un grupo de personas que no hayan intervenido en su elaboracin con el fin de que puedan revisar, no slo si se adaptan al contenido, sino la claridad de la redaccin, si se han cumplido las normas generales y especficas en funcin del tipo de formato, la correccin de la respuesta correcta en los tems de eleccin mltiple, la cali- dad de los distractores elegidos, etc.; en fin, para que analicen todos aquellos as- pectos que contribuyen a la calidad del tem. Cuando un profesor est implicado en una tarea docente, como puede ser escribir un libro de texto de su asignatura, necesita recibir informacin acerca de si lo que ha escrito puede ser comprendido por aquellos a los que va dirigido. 90 Pt d el lo pr s b se fw cri tra rar prL 8. pru ci 8.1 son; que nes Cad nas 2 la hora de redactar los ~ s t a s sesgadas. Es cierto 3truidos para la medida actitudes, etc. Algunos o del tema pero no est tarde evitar en lo posi- amente que se est de em con independencia em de una manera so- l sienta, opine o piense. a central o neutra co- erdo ni en desacuerdo, :l o se observa que la al- sta se puede eliminar. )Uesta las categoras de ~ 1 tem. E EXPERTOS mtes de dar forma a la sados por un grupo de n el fin de que puedan d de la redaccin, si se in del tipo de formato, ccin mltiple, la cali-
1 icen todos aquellos as- nte, como puede ser informacin acerca de a los que va dirigido. PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 Puede tener eso que llamamos deformacin profesional y, debido a su familiari- dad con el tema, no ser consciente de que para los dems las cosas no estn tan claras. Lo mismo ocurre cuando se quiere confeccionar un examen para evaluar los conocimientos de los alumnos, o cuando se quiere construir otro tipo de pruebas. Pues bien, en todos los casos es conveniente que haya una revisin no slo en cuanto a los contenidos, sino a su estilo de redaccin, dificultad, etc. Lo ideal es que la revisin pudiera ser hecha por personas expertas, tanto en los contenidos como en estilo de redaccin, etc.; si esto no es posible, siempre se podr contar con alguna persona ms o menos cualificada. Si tampoco esto fuera posible, lo mejor es que el constructor haga una segunda lectura de lo es- crito al cabo de un cierto tiempo, esta lectura le ofrecer una nueva visin de su trabajo y le permitir corregir los posibles errores. Una vez revisados los tems y eliminados (o corregidos) aquellos que no fue- ran considerados idneos, se puede construir la versin preliminar del test, la prueba piloto, con aquellos que han pasado este primer control de calidad. 8. CONFECCIN DE LA PRUEBA PILOTO Hay algunos aspectos bsicos a tener en cuenta para la confeccin de la prueba piloto: a) las instrucciones de administracin, b) el formato de presenta- cin y de registro de las respuestas. 8.1. Las instrucciones de administracin Salvo raras excepciones, el constructor del test quiere que todas aquellas per- sonas a las que va a ser aplicado entiendan perfectamente lo que deben hacer y que estn motivados para hacerlo; por eso, a la hora de redactar las instruccio- nes para la cumplimentacin del test se deben tener en cuenta estos objetivos. Cada tipo de pruebas requerir unas determinadas instrucciones, pero hay algu- nas que suelen ser bastante comunes y que hemos adaptado de Torndike (1989) . 1. Como norma general, a la hora de redactar las instrucciones se debe evi- tar utilizar lenguajes ampulosos y amenazantes. No se deber decir por ejemJio: Esta prueba nos va a permitir conocer lo inteligente que es usted. 2. En los tests de ejecucin mxima, por ejemplo en las pruebas de aptitudes, se debe explicitar que los tems son de dificultad variable, que hay algu- 91 1 PSICOMETRA nos que resultarn muy difciles para todos los sujetos, y que la prueba est pensada para que haya ejercicios que no puedan resolver. Si se in- cluye esta informacin en las instrucciones se reducir la ansiedad de los sujetos cuando se enfrenten a este tipo de tems. 3. En los tests de velocidad, en los que el tiempo est limitado de manera que slo muy pocos lleguen a completar la prueba, se deber explicitar tambin en las instrucciones. 4. Las instrucciones deben proporcionar uno o ms tems como ejemplo, para informar a los sujetos acerca de cmo deben resolver cada uno de ellos y la forma de elegir la solucin correcta en caso de que la hubiera. A veces se incluyen tambin algunos tems de prctica, sobre todo si se presume que la poblacin a la que va dirigido el test no est familiarizada con este tipo de pruebas. 5. Las instrucciones deben informar acerca de cmo distribuir el tiempo y qu hacer cuando no se conoce la respuesta a un tem. Cuando hay tiempo lmite para responder a la prueba se debe informar a los sujetos para que trabajen con rapidez; no obstante, en cualquier caso no est de ms ad- vertirles que no desperdicien mucho tiempo intentando contestar a un tem cuya respuesta desconocen, que es mejor pasar al siguiente, y que una vez terminada la prueba, si es posible, vuelvan a intentar resolverlos. 6. Las instrucciones deben animar a los sujetos a responder a todas las pre- guntas y favorecer as su rendimiento, dado que la puntuacin de los su- jetos tiende a b;:jar considerablemente cuando se dejan muchas respues- tas en blanco. En los tems de eleccin mltiple se puede sugerir a los sujetos una doble estrategia, en primer lugar se les puede decir que traten de encontrar la alternativa correcta y, en caso de que no la puedan iden- tificar, que traten de identificar una o ms alternativas errneas, eliminar- las, y analizar las alternativas restantes seleccionando una de ellas. 7. Dado que muchas pruebas se corrigen hoy da mediante hoja de lectora ptica, o se apl ican a travs del ordenador, las instrucciones deben expli- citar cl aramente la forma de responder en ellas. 8.2. Formato de presentacin y de registro de las respuestas Una vez elaboradas las instrucciones hay que organizar y ordenar los tems seleccionados para su posterior presentacin a los sujetos y decidir el formato de 92 PRINCI registro una seri La fo instrucc test. Se 1 llo del t aparte q de esta t !izados. facilita l. respuest Si ant ponder < mismo o 1. El do po 2. Se las a pi un. 3. A< prL 4. De En apt ci dif Jar En 1 ces cui< pue 5. Cuc; rez< cier uj etos, y que la prueba edan resolver. Si se in- ucir la ansiedad de los st limitado de manera ba, se deber explicitar s tems como ejemplo, n resolver cada uno de caso de que la hubiera. cti ca, sobre todo si se est no est familiarizada o di stribuir el tiempo y Lem. Cuando hay tiempo H a los suj etos para que :aso no est de ms ad- ando contestar a un tem al sigui ente, y que una intentar resolverlos. sponder a todas las pre- a puntuacin de los su- ~ dejan muchas respues- 2 se puede sugerir a los s puede decir que traten que no la puedan iden- . s errneas, eliminar- do una de ellas. iante hoja de lectora cciones deben expli- las respuestas izar y ordenar los tems y decidir el formato de PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 registro de las respuestas. Esta fase que puede parecer trivial tambin requiere una serie de cuidados. La forma de registrar las respuestas de los sujetos va a influir, no slo en las instrucciones, como hemos apuntado anteriormente, sino en el formato final del test. Se puede optar porque los sujetos respondan en la misma hoja o cuaderni- llo del test o, por el contrario, se puede optar porque respondan en una hoja aparte que les ser entregada junto con la hoja o cuadernillo del test. La ventaja de esta ltima forma de registrar las respuestas es que los tests pueden ser reuti- lizados. Adems, la hoja de respuestas puede ser una hoja de lectora ptica que facilita la correccin de la prueba. En los tests informatizados el registro de las respuestas se hace a travs del ordenador. Si antes hemos dicho que las instrucciones deberan animar a los sujetos a res- ponder a los tems, la presentacin de stos dentro de la prueba ha de tener el mismo objetivo. 1. El formato de presentacin debe ser claro y perfectamente legible por to- dos los sujetos, evitando que se puedan cometer errores involuntarios como por ejemplo saltarse una pregunta, confundir la casilla de respuesta, etc. 2. Se deben solicitar al comienzo de la prueba los datos de identificacin de las personas, su nombre, apellidos, datos de contacto, etc. o, en caso de aplicaciones en las que se requiere el anonimato de los que responden, una clave de identificacin. 3. A continuacin se presentan las instrucciones para la realizacin de la prueba, siguiendo las pautas establecidas en el punto anterior. 4. Despus de las instrucciones se presentan los tems: En las pruebas diseadas para medir variables cognitivas (conocimientos, aptitudes, destrezas ... ) es importante que los tems estn ordenados en fun- cin de su nivel de dificultad. Si al principio de la prueba se pusieran tems difciles es posible que muchas personas se sintieran desmotivadas y de- jaran de responder. En las pruebas diseadas para medir variables no cognitivas, en las que a ve- ces se incluyen preguntas que pueden resultar embarazosas, es necesario cuidar que stas no aparezcan al principio de la prueba ya que los sujetos pueden darla por terminada nada ms empezar al negarse a contestar. 5. Cuando un mismo test incluye tems de varios formatos conviene que apa- rezcan agrupados los de un mismo formato para evitar provocar descon- cierto en los su jetos. 93 1 PSICOMETRA 6. Hay que tratar de que los tems sigan una ordenacin lgica. Las pregun- tas referidas a un mismo tema deben situarse unas a continuacin de otras de manera que los sujetos no tengan que ir saltando de un tema a otro. 9. APLICACIN DE LA PRUEBA PILOTO Una vez construida la prueba es necesario hacer un estudio piloto de la misma para su evaluacin psicomtrica; es decir, para ver si cumple los requi- sitos necesarios que permitan considerarla como un instrumento cientfico de medicin. La aplicacin de la prueba piloto requiere, en primer lugar, decidir acerca de la forma de administracin y, en segundo lugar, seleccionar una muestra de su- jetos que pertenezcan a la misma poblacin que aquellos para los cuales se ha diseado el test. 94 Respecto a la forma de administracin de la prueba hay varias posibilidades: 1 . Colectiva - individual Siempre que se pueda hay que tender a que la aplicacin pueda hacerse de forma colectiva; no obstante hay algunos tests para adultos y nios que requieren aplicacin individual (WAIS y WISC) y algunos manipulativos como La escala de Alexandre. 2. Oral Tanto las instrucciones dadas por el entrevistador como las respuestas emi- tidas por los sujetos son orales. Se puede hacer de forma personal o bien por telfono. En el primer caso hay un contacto personal entre el aplica- dar de la prueba y el sujeto al que se le aplica; en el segundo, la relacin se establece a travs del hilo telefnico. La primera forma de aplicacin suele utilizarse, por ejemplo, con nios pequeos, con personas que no entienden bien el idioma o con analfabetos. La segunda en los estudios de encuestas. 3. Papel y lpiz Tanto la presentacin de la prueba como el registro de las respuestas de los sujetos se hacen en forma impresa. 4. Mediante ordenador Los tems se van presentando en la pantalla del ordenador y los sujetos van respondiendo a cada uno de ellos a travs del teclado. Actualmente PRINI E e 1- e E l. 5. ) E e rE E SE (1 d a< rE Ul m Si pE se ([\ 1 o. (( DI - Una\ tar el inv das por 1 tarea qU< la puntu; est midi EJEMF La cal debe refl debe dep in lgica. Las pregun- 3. continuacin de otras lo de un tema a otro. m estudio piloto de la ver si cumple los requi- strumento cientfico de lugar, decidir acerca de mar una muestra de su- os para los cuales se ha tay varias posibilidades: 1l icacin pueda hacerse Jara adultos y nios que algunos manipulativos :amo las respuestas emi- e forma personal o bien Jersonal entre el aplica- 1 el segundo, la relacin era forma de aplicacin )S, con personas que no gunda en los estudios de o de las respuestas de los ordenador y los sujetos l el teclado. Actualmente PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 este tipo de presentacin est cobrando protagonismo gracias a los avan- ces en el campo de la informtica. Las ventajas de esta forma de aplicacin hacen referencia tanto al menor coste de tiempo como a la mayor estan- darizacin de las condiciones de administracin y a las ventajas que ofrece el ordenador a la hora de registrar las respuestas, puntuarlas e interpretar- las ( Olea y Hontangas, 1999). 5. A travs de correo Esta forma de administracin implica la desaparicin de la figura del apli- cador. La prueba se enva por correo (postal, electrnico), el sujeto que la recibe responde y la devuelve tambin mediante el mismo procedimiento. En general se suele enviar, junto a la prueba, una carta de saludo en la que se explica el objetivo del estudio y se solicita su colaboracin, y un sobre convenientemente timbrado en el que est impresa la direccin a donde debe remitirse la prueba una vez cumplimentada. Se trata de una forma de administracin bastante comn en estudios de opinin y en aquellos que requieran la consulta de documentacin para su cumplimentacin. Tiene una ventaja, y es que de una manera muy sencilla se puede hacer un muestreo y enviar un gran nmero de pruebas para que sean contestadas. Sin embargo tiene algunos inconvenientes, uno de ellos, la alta tasa de personas que no responden (aproximadamente el 50%) y otro, la falta de seguridad de que la persona que responda sea aquella a la que se envi (Navas, 2002). 1 O. CORRECCIN DE LA PRUEBA PILOTO Y ASIGNACIN DE PUNTUACIONES A LOS SUJETOS Una vez que se ha aplicado la prueba piloto, la primera tarea que ha de afron- tar el investigador (el profesor, el educador .... ) es la de valorar las respuestas da- das por los sujetos a cada uno de los tems para asignarles una puntuacin. Esta tarea que puede parecer sencilla no lo es. Es necesario arbitrar la forma de que la puntuacin asignada a cada sujeto refleje su nivel en la caracterstica que se est midiendo y no otra cosa. EJEMPLO: La calificacin obtenida en los exmenes por los alumnos de Psicometra debe reflejar nicamente los conocimientos que tienen de la asignatura y no debe depender, por ejemplo, del profesor que los haya corregido; si esto no fuera 95 1 PSICOMETRA as, estara influyendo en la calificacin obtenida no slo el nivel de los alum- nos en la variable medida, sino los criterios seguidos por los profesores a la hora de corregir los exmenes. Esto hara imposible la comparacin del nivel de los alumnos. Es cierto que siempre que se emite un juicio acerca de algo es inevitable un cierto grado de subjetividad, pero tambin es cierto que es necesario tratar de eliminarla, o al menos controlarla, y para ello se dispone de distintos procedi- mientos. La eleccin de uno u otro depender del formato de los tems que com- ponen la prueba .. 1 0.1. En los tests formados por tems de eleccin Este tipo de tests, tambin llamados de respuesta cerrada, tiene la ventaja de que el examinador no debe realizar ninguna valoracin de las respuestas emiti- das por los sujetos a cada uno de los tems, eliminndose, por lo tanto, la posi- bilidad de introducir subjetividad en la puntuacin que se les asigne. Como se recordar, son los tems utilizados en la mayora de las pruebas de tipo cogni - tivo y en una gran parte de las elaboradas para la medida de variables no cog- nitivas. 1 O. 1.1. En las pruebas cognitivas En este tipo de pruebas, en las que hay respuestas correctas e incorrectas, para cada elemento se conoce de antemano cual es la respuesta correcta; por lo tanto, el proceso de correccin del test se reduce a comprobar si las respuestas emitidas por cada sujeto coinciden o no con las de una plantilla de correccin, asignando un uno por cada respuesta que coincida con la de la plantilla. Una vez corregida la prueba, es necesario combinar las puntuaciones asig- nadas a cada elemento para obtener la puntuacin de cada sujeto en el test to- tal. La forma ms habitual de proceder es sumar sencillamente el nmero de res- puestas correctas. Puntuacin= fxi l [2.1] i=l 96 de un por pur el r pat, tu a, 1 o ( y re: 10 E gun corr con1 ha e 1 O,; las e paE otro tenic o que proo nald la te1 prefe La o bie tems 1 . lo el nivel de los alum- r los profesores a la hora )aracin del nivel de los de algo es inevitable un Je es necesario tratar de me de distintos procedi- to de los tems que com- :in - rrada, tiene la ventaja de de las respuestas emit- ose, por lo tanto, la posi- e se les asigne. Como se tS pruebas de tipo cogni - li da de variables no cog- correctas e incorrectas, esta correcta; por lo probar si las respuestas plantilla de correccin, la de la plantilla. las puntuaciones asig- cada sujeto en el test to- ente el nmero de res- [2 .1] PRI NCIPIOS BSI COS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA Ahora bien, cuando se analizaron las ventajas derivadas del uso de este tipo de tems, se vio tambin que tenan un inconveniente grave: la posibilidad de que un sujeto que desconociera por completo aquello que se le preguntaba eligiera por azar la respuesta correcta. Cuando un sujeto responde de esta manera, su puntuacin final en el test ser una estimacin inflada de su verdadero nivel en el rasgo que se est midiendo. Por otra parte, si los sujetos no siguen el mismo patrn a la hora de responder, es difcil hacer comparaciones acerca de sus pun- tuaciones. EJEMPLO: Supongamos que en el examen de Psicometra hay dos alumnos que conocen 1 O de las 20 preguntas que tiene el examen. Uno de ellos decide no arriesgarse y responde solamente a las 1 O preguntas cuya respuesta conoce dejando las otras 1 O en blanco. El otro alumno, ms arriesgado, decide responder a todas las pre- guntas. Si las preguntas tienen dos alternativas de respuesta (verdadero-falso), ya comentamos que hay una probabilidad del 50% de que una persona que des- conozca la respuesta correcta acierte por azar. En este caso, vamos a suponer que ha contestado correctamente a las 1 O preguntas que conoca y que de las otras 1 O, al responder al azar, ha acertado el 50%, es decir, ha acertado 5 y ha fallado las otras 5. Este sujeto, que conoca el mismo nmero de preguntas que su com- paero y, por lo tanto, debera haber obtenido la misma puntuacin, al utilizar otro patrn de respuestas ha obtenido una mayor puntuacin. El primero ha ob- tenido 1 O puntos y el segundo 15. Dado lo injusto del tema es necesario, o bien incidir en las instrucciones para que los alumnos no dejen ninguna respuesta en blanco, o bien utilizar algn procedimiento que permita controlar el efecto del azar sobre la puntuacin fi- nal de los sujetos. Como no est claro el papel unificador de las instrucciones en la tendencia de los sujetos a responder al azar (Wood, 1987; Navas, 2002), es preferible utilizar una frmula de correccin para llevar a cabo el control. La aplicacin de esta frmula de correccin puede hacerse de dos maneras, o bien penalizando los errores cometidos, o bien bonificando las omisiones o tems no respondidos. 1. Cuando se penalizan los errores es porque se asume que el sujeto no co- noce la respuesta correcta y que todas las alternativas del tem le resultan igualmente atractivas. Entonces las respuestas incorrectas son respuestas dadas al azar. Donde: 97 1 PSICOMETRA E X =A-A =A-- e a K -1 Xc = puntuacin corregida. A = nmero de aciertos. Aa = aciertos obtenidos al responder al azar. E= nmero de errores. K= nmero de alternativas de los tems. Cmo se obtiene esta frmula de correccin? [2.2] Supongamos que el nmero de aciertos de un sujeto en el test viene dado por la puntuacin A, pues bien, en esa puntuacin estn incluidos los aciertos que tuvo el sujeto porque conoca la respuesta y los que tuvo al responder al azar (Aa). El valor de Aa no se puede calcular directamente, hay que inferirlo teniendo en cuenta el nmero de alternativas de respuesta. Si, como hemos apuntado an- tes, cuando un sujeto no conoce la respuesta correcta todas las alternativas son para l igualmente atractivas, la probabilidad de que elija por azar la respuesta correcta, es decir la probabilidad de acierto por azar, es P(A.) = _]_ , siendo K el K nmero de alternativas. La probabilidad de que elija cualquiera de las otras op- ciones, es decir, la probabilidad de que cometa un error es: P(E) = 1 -1 /K puesto que la suma de ambas probabilidades tiene que ser la unidad. Si llamamos Ra al nmero de respuestas aleatorias que emite el sujeto en el total del test, se puede establecer que el nmero de errores ser igual a: es decir, ser igual al nmero de respuestas aleatorias por la probabilidad de error. El nmero de aciertos por azar ser igual a: 98 PRINC es deci 1 azar. Desr y sustitu Si al 1 queda la Si apl mente p< gir el efe 2. Cu sl a n tu a der bla Dado< nmero d del nmer 0 / K). Aplicar ejemplo tE [2.2] !tO en el test viene dado n incluidos los aciertos que tuvo al responder al ay que inferirlo teniendo ~ m o hemos apuntado an- todas las alternativas son lija por azar la respuesta ~ s P(Aal = ~ , siendo K el ualquiera de las otras op- es: P(E) = 1 - 1/K puesto unidad. que emite el sujeto en el rores ser igual a: por la probabilidad de PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 es decir, al nmero de respuestas aleatorias por la probabilidad de acertar por azar. Despejando Raen la frmula de los errores tendremos: R = E ~ a K - 1 y sustituyendo en la frmula de los aciertos por azar tendremos: Si al nmero de aciertos totales le restamos el nmero de aciertos por azar, queda la frmula de correccin tal y como la expusimos (ver 2.2). Si aplicamos la frmula de correccin a las puntuaciones obtenidas anterior- mente por los dos alumnos en el examen de Psicometra vemos cmo al corre- gir el efecto del azar ambos obtienen la misma puntuacin: X= 15 - 5 = 1 O 2. Cuando se bonifican las omisiones se parte del supuesto de que el sujeto slo ha respondido a las preguntas que conoca, no ha respondido al azar a ninguna pregunta y por lo tanto no hay errores. En este caso, a la pun- tuacin obtenida en el test se le aade una bonificacin que correspon- dera a los aciertos ql!e hubiere tenido si en lugar de dejar los tems en blanco hubiera respondido al azar. La frmula de correccin sera: o Xc =A+A =A+ - a K [2.3] Dado que no hay errores, el nmero de respuestas al azar coincidir con el nmero de omisiones (Ra = 0), y el nmero de aciertos al azar ser el producto del nmero de omisiones por la probabilidad de acertar por azar (Aa = 0.7 !K= 0 / K) . Aplicando la frmula a las puntuaciones obtenidas por los dos alumnos del ejemplo tendremos: 10 Xc =10+- = 15 2 99 1 PSICOMETRA Vemos que si se bonifican las omisiones al sujeto que no respondi al azar, ambos sujetos habran obtenido tambin la misma puntuacin. Aunque tambin este procedimiento permitira hacer comparaciones entre las puntuaciones de los alumnos, ambas puntuaciones estaran sobrevaloradas. No corresponderan al verdadero nivel de los sujetos, por lo tanto es ms ade- cuado utilizar el primer procedimiento. Cuando un mismo test est formado por tems con distinto nmero de alter- nativas, para conocer cual es la puntuacin de cada sujeto ser necesario ir apli- cando la correccin del azar por partes; se agruparn los tems en funcin del nmero de alternativas y se calcular la puntuacin del sujeto en cada uno de los grupos. La puntuacin final ser la suma de las puntuaciones parciales obte- nidas. EJEMPLO: Supongamos un test formado por 100 tems de los cuales hay 25 de dos al- ternativas de respuesta (verdadero-falso), 25 de 3 alternativas y 50 de 4 alterna- tivas. Cul ser la puntuacin corregida de un sujeto que contestando a todos los tems acert 14 de verdadero-falso, 21 de los de tres alternativas y 29 de los tems de 4 alternativas? Si no se corrigiera el azar el sujeto obtendra una puntuacin de 64 puntos so- bre 1 OO. En una escala de 1 O puntos sera un 6,4. Corrigiendo el efecto del azar tendramos: X =14-- 1 - 1 =3 1 2-1 X =21-___=19 2 3-1 X =29-_32_=22 3 4-1 x total = 3 + 1 9 + 2 2 = 44 El sujeto obtendra 44 puntos sobre 100, si se utilizara una escala de 1 O pun- tos en lugar de una de 100, ese sujeto habra obtenido un 4,4. 100 1l te Ot fw tip tu: alt sar y a teg ci ble act par pre a el a si los o a abe ejer L E 4 1 PSICOMETRA 3. Me es indiferente 2. De acuerdo 1. Totalmente de acuerdo De los dos tems, el primero muestra una actitud marcadamente contraria al consumo del alcohol. Si se asigna el valor numrico tal y como se ha hecho, el 1 correspondera al extremo que representa una actitud ms favorable hacia el alcohol mientras que el 5 correspondera al extremo que representa una actitud ms desfavorable. Si esto se hace as con un tem hay que hacerlo con todos los dems. Por eso en el segundo tem cuyo enunciado denota una actitud ms po- sitiva hacia el consumo de alcohol, la asignacin de los valores numricos se ha invertido de manera que el valor numrico mximo represente una actitud des- favorable hacia el consumo de alcohol. De esta manera, cuando se corrija la prueba completa, los sujetos que mues- tren una actitud ms favorable hacia el consumo de alcohol obtendrn valores ms bajos que aquellos que muestren una actitud desfavorable. 1 0.2. En los tests formados por tems de construccin Dentro de este tipo de pruebas, las formadas por tems de respuesta corta no presentan demasiado problema, cuando se trata de que el sujeto construya la respuesta correcta con una palabra o frase corta es fcil la asignacin de la pun- tuacin a los sujetos. El problema se va complicando a medida que las respues- tas son ms abiertas y extensas puesto que es ms difcil controlar la subjetivi- dad en la correccin. La persona que las corrija ha de emitir juicios valorativos acerca de la adecuacin de las respuestas. Como ya apuntamos anteriormente, este tipo de pruebas presentan la ven- taja, sobre las pruebas objetivas, de que permiten expresarse abiertamente a los sujetos, y de esta manera se pueden valorar no slo los conocimientos del tema, sino otros aspectos importantes en algunas situaciones como: la forma de re- dactar, la creatividad, la forma de estructurar el tema, la capacidad para resumir y esquematizar, y un largo etc. Pero tienen el grave inconveniente de que la co- rreccin de las mismas, adems de muy laboriosa, es bastante subjetiva. No obs- tante hay formas de controlar y reducir esa subjetividad: Mtodo de la puntua- cin analtica y Mtodo de la puntuacin holstica. 102 PRir 10.2. Es1 dime1 luar 7 rrecci clara1 mens cada Si rea corre habr mi en nicc se ob 10.2 Er que 1 mar, la ca requ a ev. acue ( cons rizac se q1 con obte cadamente contraria al y como se ha hecho, el ms favorable hacia el una actitud e hacerlo con todos los ota una actitud ms po- alares numricos se ha esente una actitud des- a, los sujetos que mues- :ohol obtendrn valores ltorable. ruccin de respuesta corta no e el sujeto construya la la asignacin de la pun- medida que las respues- :il controlar la subjetivi- juicios valorativos uebas presentan la ven- abiertamente a los conocimientos del tema, s como: la forma de re- [ capacidad para resumir Dnveniente de que la co- stante subjetiva. No obs- tJ: Mtodo de la puntua- PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 1 0.2. 1. Mtodo de la puntuacin analtica Este mtodo requiere, en primer lugar, definir de forma inequvoca y aislar las dimensiones que se consideran importantes para la realizacin de la tarea a eva- luar y, una vez establecidas las dimensiones que hay que considerar en la co- rreccin de la prueba, es necesario establecer la forma de evaluarlas, definiendo claramente lo que se considera una respuesta adecuada o correcta en cada di- mensin y estableciendo el nmero de respuestas correctas que se necesitan, en cada una de ellas, para poder decir que la tarea ha sido correctamente realizada. Si realmente se llegan a definir claramente estos criterios, las pruebas pueden ser corregidas por personas que no sean expertas en la materia a evaluar ya que no habr dificultad en decidir si una respuesta es correcta o no. Con este procedi- miento la puntuacin final de los sujetos suele venir expresada mediante dos nicos valores: correcta/incorrecta, apto/no apto, aprobado/suspenso, etc. pero se obtiene informacin de cada una de las dimensiones. 10.2.2. Mtodo de la puntuacin holstica En este procedimiento se evala de una manera global u holstica la forma en que los sujetos han realizado la prueba, y la puntuacin asignada, que podr to- mar distintos valores dentro de los lmites establecidos de antemano, expresar la calidad global de su respuesta. A diferencia del anterior, este procedimiento requiere que la correccin de las pruebas sea hecha por expertos en la materia a evaluar previamente entrenados para tratar, en lo posible, de alcanzar un acuerdo entre ellos y eliminar la subjetividad en la correccin. Qu mtodo es ms adecuado? Todo depender del objetivo para el que se construy el test. En algunos casos se requerir una informacin ms pormeno- rizada acerca de la ejecucin de los sujetos en la prueba, por ejemplo si lo que se quiere es detectar dficits o hacer algn diagnstico; pero otras veces bastar con tener una informacin global, por ejemplo en los exmenes destinados a la obtencin de una titulacin acadmica, o de competencia profesional. 103 1 PSICOMETRA 11. EJERCICIOS DE AUTOEVALUACIN A continuacin se presentan una serie de tems. Unos estarn correctamente redactados y otros presentarn distintos errores. Despus de leerlos atentamente responda indicando el tipo de formato que tiene cada uno de ellos, si estn co- rrectamente redactados y, en caso contrario, cmo deberan haberlo estado. De- cir tambin si la variable que miden pertenece al mbito cognitivo o, por el con- trario, al mbito orctico o afectivo. 104 1. _____ es a vino como trigo es a ____ _ A. uva - avena B. agua- pan C. uva - harina D. beber - comer E. agua- avena 2. Determinar el nmero que falta (indicado con puntos suspensivos) para que resulte correcta la siguiente igualdad: (12x ........ )-6=3 A. 0,075 B. 0,0075 c. 0,00075 D. 0,75 3. Actualmente no encuentro muy difcil no perder la esperanza de no llegar a ser algo Verdadero Falso 4. Tengo opiniones polticas slidas 1. Completamente de acuerdo 2. De acuerdo 3. No se 4. En desacuerdo 5. Completamente en desacuerdo 5. A continuacin se presenta un trmino de la lengua castellana y cinco de- finiciones de las que slo una es correcta. Leer las cinco opciones de res- puesta y elegir la opcin correcta. PRINCII Lll A) B) C) D) E) 6. El 7. M 1 . 2. 3. 4. 5. 8. A la lu1 di; A. B. c. D. E. 9. Ej( D( be 1 . 2. 3. 4. 5. . estarn correctamente de leerlos atentamente 10 de ellos, si estn ca- an haberlo estado. De- cognitivo o, por el con- untos suspensivos) para [5 a esperanza de no llegar so ua castellana y cinco de- as cinco opciones de res- PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA LIPOTIMIA A) Mquina de componer que contiene todas las letras de una lnea B) Desmayo con prdida de sentido C) Son ciertas la A y la B D) Es cierta la B E) Acumulacin de grasa en la piel 6. El cuadro de las Meninas fue pintado por ______ _ 7. Me despierto nervioso por las maanas 1. Siempre 2. Casi siempre 3. A veces 4. Casi nunca 5. Nunca 8. A continuacin se presentan dos columnas. En la columna de la izquierda, la de las premisas, se incluyen los ttulos de 5 cuadros famosos. En la co- lumna de las respuestas se recogen los nombres de 5 pintores. Unir me- diante flechas el pintor con su cuadro correspondiente: A. El nacimiento de Venus 1. Velzquez B. El entierro del Conde Orgaz 2. Botticelli C. La Venus del espejo 3. El Greco D. La adoracin de los pastores 4. Goya E. La Maja desnuda 5. Rembrandt 9. Ejercicios conceptuales Despus de leer detenidamente el enunciado que se presenta, el lector de- ber responder si es verdadero o falso y justificar su respuesta. 1. La etapa de definicin de la finalidad del test es la etapa en la que se decide el tipo de formato de los tems. 2. Los tems de eleccin mltiple son tems de respuesta abierta. 3. En los tests de velocidad el tiempo de ejecucin est limitado. 4. Los tests de potencia son tpicos de pruebas de aptitudes. 5. Los tems de ensayo son tems de respuesta abierta. 105 1 PSICOMETRA 106 6. A medida que aumentan las opciones de respuesta en los tests de elec- cin mltiple, disminuye la probabilidad de acierto por azar. 7. En los listados, las distintas opciones de respuesta estn ordenadas de forma graduada. 8. Los tems de eleccin mltiple se utilizan sobre todo para medir varia- bles de tipo cognitivo. 9. Los tests de potencia, aplicados a la poblacin general , deben estar for- mados por tems muy fciles. 1 O. Si se quiere que un test sirva para detectar a los nios que tienen un me- nor nivel de conocimientos los tems debern ser fciles o muy fciles. PRI 12. 1. 2. 3. 4. 1 5. E d 6. E E e 7. S, ri e 8. S1 C< C< esta en los tests de elec- :ierto por azar. esta estn ordenadas de e todo para medir varia- general, deben estar for- nios que tienen un me- ser fciles o muy fciles. PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 12. SOLUCIONES A LOS EjERCICIOS DE AUTOEVALUACIN 1. Se trata de un tem de eleccin en el que la tarea del sujeto ser comple- tar los espacios en blanco con alguna de las opciones de respuesta que se le ofrecen. Es de tipo cloze (o de completar) y est correctamente presen- tado. La variable que mide es de tipo cognitivo y la alternativa correcta es la C. 2. Se trata tambin de un tem de eleccin, de las mismas caractersticas que el anterior, en el que la tarea del sujeto consiste en elegir de entre las al- ternativas aquella que complete la ecuacin y verifique la igualdad. La so- lucin correcta es la D. 3. Se trata de un tem muy mal redactado ya que tiene muchas negaciones. Es imposible interpretar lo que quiere decir y, por lo tanto, responder. Se trata de un tem de eleccin binaria en el que hay dos respuestas de las cuales se supone que una es verdadera. La variable que se intenta medir no pertenece al mbito cognitivo, intenta medir opiniones. 4. Es un tem cuyo formato corresponde a una escala de clasificacin en la que las respuestas estn ordenadas formando una escala graduada a lo largo del continuo de la variable que se quiere medir, en este caso las opi- niones polticas. Por lo tanto, no es una variable de tipo cognitivo. 5. Se trata de un tem de eleccin mltiple que mide conocimientos, pero est muy mal formulado ya que, a pesar de que dice que slo hay una res- puesta correcta, hay dos, la 8 y la D. Por otra parte, como ya se coment a lo largo del tema, hay que procurar que las opciones de respuesta sean lo ms independientes posible entre s y evitar que las alternativas sean del tipo: A y B. Este tipo de alternativas provocan ruido en los sujetos. 6. Es un tem de construccin, de respuesta corta, que mide conocimientos. Est bien formulado y la tarea del sujeto consistir en rellenar el espacio en blanco con el nombre del pintor. En este caso Velzquez. 7. Se trata de un tem de eleccin, de respuesta cerrada, que mide una va- riable no cognitiva y est bien redactado. La tarea del sujeto ser elegir la categora que mejor represente su estado. 8. Se trata de un tem de respuesta cerrada, de emparejamiento, que mide conocimientos. Est bien planteado y la tarea del sujeto ser elegir de la columna de la derecha el pintor que corresponda a cada una de las obras 107 1 PSICOMETRA 108 situadas en la columna de la izquierda y unir ambos elementos mediante flechas. En este caso habra que unir: (A, 2), (B, 3), (C, 1 ), (0,5) y (E,4). 9. Soluciones a los ejercicios conceptuales: 1. La afirmacin es falsa Es en la etapa de especificacin de las caractersticas del test donde se decide acerca del formato que van a tener los tems. La definicin de la finalidad del test es una etapa previa a la construccin propiamente dicha, en ella se ha de decidir acerca de la variable a medir, de la po- blacin a la que va dirigido el test y del uso que se va a dar al test. 2. La afirmacin es falsa. Los tems de eleccin mltiple son de respuesta cerrada. Junto al enun- ciado del tem se ofrecen una serie de alternativas de respuesta entre las que se deber elegir aquella que se considere la correcta o la ms co- rrecta. 3. La afirmacin es verdadera. Los tems que forman los tests de velocidad son lo suficientemente f- ciles como para que los contestaran correctamente todos los sujetos si dispusieran de tiempo suficiente. La forma de discriminar entre los su- jetos es, precisamente, limitar el tiempo para la ejecucin de la prueba. 4. La afirmacin es verdadera. Los tests de potencia estn formados por tems de distinta dificultad y tratan de medir el nivel de conocimientos o aptitudes de los sujetos. 5. La afirmacin es verdadera. En los tems de ensayo el sujeto debe elaborar su propia respuesta. 6. La afirmacin es correcta. Si todas las alternativas de respuesta son igualmente atractivas para un sujeto que desconoce la alternativa correcta, la probabilidad de acierto por azar es igual a 1/K, siendo K el nmero de alternativas. De ah se desprende que a medida que aumenta el nmero de alternativas dis- minuye la probabilidad de acertar la correcta por azar. 7. La afirmacin es falsa. Los listados, se diferencian de las escalas de clasificacin en que las opciones de respuesta no forman una escala ordinal graduada y se di- ferencian de los tems de eleccin mltiple en que no hay respuestas correctas o incorrectas. Junto al enunciado del tem se ofrece una lista 1bos elementos mediante :), (C, 1 ), (D,S) y (E,4). del test donde se ,s tems. La defini cin de onstrucci n propiamente 1ri able a medir, de la po- lue se va a dar al test. ta cerrada. Junto al enun- ivas de respuesta entre las la correcta o la ms co- ;on lo sufi cientemente f- mente todos los suj etos si entre los su- la ej ecucin de la prueba. m de di stinta difi cultad y aptitudes de los sujetos. ar su propia respuesta. almente atractivas para un la probabili dad de acierto de alternativas. De ah se mero de alternativas dis- a por azar. cl asificacin en que las ordinal graduada y se di- en que no hay respuestas tem se ofrece una lista PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA 1 de posibles respuestas entre las que deber elegir el sujeto aquella o aquellas con las que est de acuerdo. Las opciones de respuesta son independientes entre s. 8. La afirmacin es correcta. Este tipo de formato es el ms adecuado cuando se quiere obtener una medida objetiva de variables cognitivas. 9. La afirmacin es incorrecta. Dado que se trata de discriminar entre los sujetos y estos disponen de tiempo suficiente para responder, los tems deben cubrir todo el conti- nuo de dificultad, desde tems muy fciles que slo los menos capaci- tados respondan de forma incorrecta, hasta tems muy difciles que slo los ms capacitados los puedan acertar. 1 O. La afirmacin es correcta. En la pregunta anterior ya se contest, en parte, a esta pregunta. Ahora bien, si lo que nos interesa es discriminar slo en este sector de la po- blacin, no es necesario incluir elementos con diferentes nivel es de di- ficultad, todos los tems pueden ser fciles o muy fciles; entonces los respondern correctamente todos los sujetos de la muestra a excepcin de los menos capacitados. 109 1 PSICOMETRA 13. BIBLIOGRAFA COMPLEMENTARIA MARTNEZ ARIAS, M.R. (1995). Psicometra: teora de los tests psicolgicos y educativos. Madrid: Sntesis. En el captulo 2, dedicado a la construccin de un test, ofrece una panormica muy general acerca de la forma de llevar a cabo el proceso. NAVAS, M.J. (2002). Mtodos, diseos y tcnicas de investigacin psicolgica. Madrid: UNED. En el captulo 3 ofrece una revisin muy completa y clara ya que utiliza un lenguaje muy sencillo y adaptado al nivel de conocimientos de nuestros alum- nos. THORNDIKE, R.L. (1989). Psicometra aplicada. Mjico: Limusa Los captulos 2, 3 y 4 estn dedicados al tema que nos ocupa. 110