Está en la página 1de 11

Tema 2.

PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE


MEDICIN PSICOLGICA.
1.

ORIENTACIONES DIDCTICAS.

Vas de desarrollo de la psicometra:


la de los estudios de psicofsica
la de los estudios de las diferencias individuales
Tipos de escalamiento segn que el objetivo a escalar fueran:
los estmulos
los sujetos
ambos
Etapas del test:
- 1. Elaboracin de una prueba piloto, su aplicacin a una muestra de sujetos y la asignacin de puntuaciones a
los mismos.
- 2. Evaluacin de la calidad psicomtrica de cada uno de los tems que componen la prueba piloto as como del
conjunto de la misma y finalizara con la construccin definitiva del test.
- 3. Se llevara a cabo la aplicacin del test a una muestra representativa de la poblacin a la que va dirigido, se
asignaran puntuaciones a los sujetos para su evaluacin y se llevara a cabo el proceso de estandarizacin
de las puntuaciones obtenidas y el establecimiento de las normas que permitan su interpretacin. El proceso
finalizar con la elaboracin del manual del test que deber incluir toda la informacin necesaria para que
pueda ser utilizada por psiclogos especializados.
Distintas decisiones que hay que tomar en cada una de las fases y cmo hacerlo:
- a) En la fase de definicin, tomar decisiones acerca de la variable psicolgica que se va a medir, poblacin a la
que va destinado y cul va a ser la utilizacin prevista.
- b). Fase de especificacin de las caractersticas del test, tipo de formato de los tems, longitud de la prueba y
caractersticas psicomtricas mas adecuadas.
- c). Conocer qu tipo de formato es el mas adecuado en funcin de la variable psicolgica que se quiera medir
y las reglas que se deben seguir, sean de carcter general o especficas de cada formato, para que la
redaccin de los tems sea lo mas correcta posible.
- d) Una vez redactados, tomar la decisin acerca de qu personas han de hacer una revisin crtica de los
mismos para conseguir una mejor calidad.
- e). La prueba piloto implica tomar decisiones acerca de las instrucciones que se van a incluir, cul va a ser la
forma de administrar la prueba y de qu manera se van a registrar las respuestas de los sujetos.
2.

LOS TESTS, ESCALAS, CUESTIONARIOS E INVENTARIOS

Test: trmino general para referirnos a cualquier instrumento de medicin psicolgica; pero sobre
todo referido a instrumentos de medicin de variables de tipo cognitivo (aptitudes, conocimientos,
rendimiento, habilidades, etc); donde las respuestas de los sujetos son correctas o incorrectas
y la puntuacin total en el test es la suma (directa o ponderada) de todas las respuestas correctas,
dando lugar a una escala jerrquica o acumulativa. Ej. de Test de conocimientos: La capital de Espaa
es: a) Pars b) Londres c)Madrid

Escala: hace referencia a los instrumentos elaborados para medir variables no cognitivas
(preferencias, opiniones, etc; ) y se caracteriza porque los sujetos han de responder eligiendo, sobre
una escala de categoras graduada y ordenada, aquella categora que mejor represente su posicin;

no hay respuesta correctas o incorrectas, y la puntuacin total en la escala ser la suma de las
puntuaciones asignadas a las categoras elegidas por los sujetos. Ej. de Escala: 2. Debera estar
prohibido fumar en todos los restaurantes: a) Completamente de acuerdo. b) De acuerdo. c) Indiferente. d) En
desacuerdo. e) Completamente en desacuerdo

Cuestionarios: formados por tems o elementos que no estn necesariamente relacionados unos
con otros, cuyas opciones de respuesta no estn ordenadas ni graduadas, que pueden ser
puntuados e interpretados individualmente y en los que tampoco hay respuestas correctas e
incorrectas. Se utilizan para obtener una mayor informacin del sujeto y de su entorno (edad,
profesin, estudios, etc); y se utilizan cuando la investigacin es mediante encuestas. Ej. de
Cuestionario: Qu parte de la asignatura de Psicometra le resulta ms fcil de estudiar? A) Fiabilidad.
b)Validez. C)Anlisis de elementos. D)La construccin de test

Inventario: vinculado a los instrumentos elaborados para medir variables de personalidad. Las
respuestas no son correctas o incorrectas, lo nico que demuestran es la conformidad o no con los
enunciados de los tems. Ej. de inventario: 1 A menudo me siento como si los dems me ignoraran
(V
F). El problema de mucha gente es que no toma las cosas en serio
( V F)
3.
EL PROCESO DE CONSTRUCCIN DE UN TEST
El conocimiento del objetivo del test es el paso previo que va a condicionar la siguientes etapas de la
construccin.
Etapas

Decisiones a tomar acerca de

Determinar la finalidad del test


Especificar las caractersticas del test
Redaccin de los tems
Revisin crtica de los tems por un grupo
de expertos
Confeccin de la prueba piloto
Aplicacin de la prueba piloto
Correccin de la prueba piloto y asignacin
de puntuaciones a los sujetos

Qu se va a medir, a quin y para qu


Cul va a ser el contenido. Qu tipos de tems se van a incluir. Cuntos
tems. Caractersticas psicomtricas
tems de eleccin e tems de construccin
qu tems van a seleccionarse
Instrucciones de administracin. Formato de la presentacin y formato del
registro de respuestas
individual- colectiva; papel y lpiz- informatizada; correo, mediante
entrevista personal, por telfono, etc
En los tests formados por tems de eleccin, en los test formados por
tems de construccin

4.
LA FINALIDAD DEL TEST
Como paso previo para la construccin del test, es necesario tener claro su objetivo, es decir, lo que se
quiere medir, a quien se quiere medir y para qu se quiere medir.
4.1.

La variable objeto de estudio. Constructo: variable psicolgica inobservable de forma


directa; pero que se manifiestan a travs de conductas que s son observables de forma
directa, y son las que se miden. Estas conductas han de ser uniformes y constantes a lo
largo del tiempo y en diferentes situaciones. Es decir, que para construir un test, lo primero
que hay que hacer es definir el/los constructo/s que lo forman y as determinar mejor las
conductas representativas del mismo.

4.2.

Poblacin a la que va dirigido. Segn esta, variar el contenido de los tems, su


redaccin, la longitud del test y las instrucciones, etc.

4.3.

Utilizacin prevista. Es decir, para qu se va a utilizar, qu decisiones se van a tomar a


partir de las puntuaciones que obtengan los sujetos.
Usos ms frecuentes de los tests y decisiones que se suelen tomar a partir de las
puntuaciones obtenidas.
Funciones

Decisiones a tomar

SELECCIN

mbito educativo: alumnos aptos / no aptos.


mbito profesional: seleccin de aspirantes.
CLASIFICACIN/COLOCACIN En cualquier mbito

DIAGNSTICO
CERTIFICACIN
ORIENTACIN/CONSEJO
DESCRIPCIN/INFORMACIN

En cualquier mbito, para detectar problemas de aprendizaje, etc.


Para acreditar diversas cualificaciones o competencias, tanto en el
mbito profesional como acadmico.
Detectar las capacidades e intereses de las personas para,
examinando las distintas opciones, elegir aquella/s que mejor se
adecuen a su perfil.
Describir el rendimiento academico tanto a nivel individual como
colectivo. Obtener informacin acerca de la opinin pblica.

5.
ESPECIFICACIN DE LAS CARACTERSTICAS DEL TEST.
Aqu es importante la habilidad del constructor para planificar y desarrollar las especificaciones del test.
5.1.

Contenido. Comienza determinando cual es su dominio de conductas (o conjunto de


conductas a travs de las cuales se manifiesta).

Cuando el constructo no esta claramente definido, se recomienda (como seala Martnez-Arias, 1995):
a) Hacer un anlisis del contenido del constructo (hacer preguntas abiertas a los sujetos acerca
del constructo y seleccionando las respuestas de mayor frecuencia).
b) Revisar las investigaciones publicadas anteriormente.
c) Llevar a cabo un anlisis de tareas (y segn estas observaciones elaborar una lista de
conductas crticas)
d) La observacin directa por parte del constructor del test (podr identificar conductas
relacionadas con el constructo a medir).
e) Utilizar el juicio de expertos (que ya hayan trabajado en el constructo).
f) Revisar los objetivos instruccionales o de programas de intervencin.
Todo esto da una idea de la dificultad de definir un constructo y determinar su dominio de conductas, no son
procesos distintos, sino que estn fuertemente relacionados. A medida que tiene una mayor informacin
acerca del constructo que se quiere medir se ir modificando el contenido de la prueba y viceversa, las
investigaciones encaminadas a determinar el dominio de conductas del constructo aumentarn el
conocimiento del mismo y permitirn clarificar su concepcin.
Los test de rendimiento y conocimientos y, sobre todo, en los test referidos al criterio (TRC), en lugar de
hablar de un dominio de conductas se hablar de un dominio de contenidos a evaluar y la especificacin
del mismo cobrar una importancia extraordinaria.
Cuando se quiere construir un test para ser utilizado en el mbito acadmico, el camino que se suele seguir
para especificar el contenido del test es construir una tabla de doble entrada, en la que las columnas
representan las distintas reas de contenido o facetas del constructo a medir y las filas los distintos
procesos u operaciones implicados en la resolucin de las tareas planteadas.
Aunque los contenidos de las filas variarn en funcin de aquello que se quiera medir, se ha intentado hacer
una categorizacin jerrquica uniforme (American Educational Research Association) que recoge los
siguientes procesos ordenados jerrquicamente en funcin de su menos o mayor complejidad:

Conocimiento: recuerdo del material presentado


Comprensin: interpretacin o extrapolacin de un concepto de forma distinta a la
originalmente presentada.
Aplicacin: resolucin de problemas nuevos aplicando principios familiares o generalizaciones.
Anlisis: descomposicin de un problema en sus componentes elementales. Requiere del
reconocimiento de elementos mltiples y de las relaciones y/o principios de organizacin entre los
elementos.
Sntesis: combinar elementos a partir de una estructura original o resolver un problema que
requiere la combinacin secuencial de varios principios.
Evaluacin: empleo de criterios internos o externos para hacer juicios crticos.

Matriz de especificaciones del contenido para un test de psicometra:


Ejemplo de tabla de doble entrada
Procesos

reas de Contenido

Conocimiento 25 %
Comprensin 25%
Aplicacin 25%
Anlisis 25%

Medicin 20%
4
4
4
4

Fiabilidad 35%
7
7
7
7

Validez 35 %
7
7
7
7

A. de tems 10 %
2
2
2
2

Total

16

28

28

Es importante que estn representadas todas las reas de la Psicometra para que tenga validez y que en
cada una de ellas haya nmero suficiente de tems para asegurar la fiabilidad.
Cada casilla de la matriz representa la interaccin entre un rea de contenido y un proceso, esto facilita la
redaccin de tems que cubran todos los aspectos que se consideran importantes. No obstante hay otro
punto que hay que aclarar: si a todos los procesos y a todas las reas de contenido se les concede la
misma importancia; ser necesario cubrir todas las celdas de la matriz con el mismo nmero de tems. Por
el contrario si se considera que no todas las reas son igualmente importantes, ni todos los procesos, ser
necesario establecer una ponderacin para poder establecer el nmero de tems de cada casilla.
Se pueden dar dos casos: que las reas de fiabilidad y validez por ejemplo fueran mas importantes,
despus el rea de medicin y por ltimo el anlisis, quedando a 35%, 35%, 20% y 10% respectivamente, o
bien dar la misma importancia a todos los procesos, con lo cual le correspondera a c/ uno de ellos una
ponderacin del 25%.
Una vez asignadas las ponderaciones, la versin piloto debe contar como mnimo con el doble o el triple de
los tems de la versin final del test, en nuestro caso queremos que tenga 80, entonces asignamos:
fiabilidad 35% y validez 35% 28 tems c/u, rea 20% 16 tems y anlisis 10% 8 tems. De los 16 tems del
rea de medicin, un 25 % corresponde a c/u de los procesos, as habr que construir 4 tems por cada uno
de los procesos y as el resto.

Un test de aptitudes tiende a ser menos especfico en cuanto a su contenido puesto que est pensado
para medir una caracterstica ms general y persistente de la persona.
Cuando lo que se quiere construir es un test para medir constructos de naturaleza no cognitiva, las
especificaciones pueden ser bastante esquemticas y a veces el contenido de los tems se deduce
fcilmente de la misma definicin del constructo. En este tipo de tests hay veces que a partir del anlisis y
reflexin sobre las teoras existentes acerca del constructo que se quiere medir surgen los tems que se
deben incluir.
5.2.

Formato de los tems.


5.2.1. tems de eleccin. Son items de respuesta cerrada, donde el sujeto elige una o
varias alternativas de entre las propuestas.

Formatos ms comunes de los tems se eleccin:


Dos alternativas: se elige entre dos alternativas (V F; Si No; Correcto Incorrecto). Se utiliza
para medir variables de tipo cognitivo (habilidades, aptitudes y sobre todo para la construccin de test
de conocimiento y rendimiento). Ventaja: es rpido y fcil de usar. Inconveniente: los sujetos que
responden al azar tienen un 50% de posibilidad de elegir la respuesta correcta.

Eleccin Mltiple: Estos tems constan de:


a) el enunciado propiamente dicho, y
b) las alternativas u opciones de respuesta, que consisten en una lista de posibles respuestas
de las cuales una es la correcta, o la ms adecuada, y las otras son incorrectas o
distractores. Se suelen utilizar 3-5 alternativas de respuesta para disminuir la posibilidad de
elegir la alternativa correcta por azar.

Se utiliza para medir Vs cognitivas y sobre todo en tests de conocimiento y rendimiento. No se


utiliza para medir vs de personalidad, inters, etc; es decir, en el mbito orctico o afectivo.
Ventaja: son fciles de administrar, corregir y puntuar. Inconveniente: son ms difciles de
construir que los de dos alternativas (es difcil construir alternativas que sean realmente efectivas).
Muiz y Garca Mendoza (2002) muestran una clasificacin de los tems de eleccin mltiple en
funcin de la estructura que tenga el enunciado y las distintas alternativas.
El enunciado puede presentarse en forma interrogativa, enunciativa o como una frase truncada o
incompleta; lo que dar lugar a un tipo de tem. La forma ms directa y recomendable es la
interrogativa. La forma enunciativa es equivalente a la interrogativa, y se puede utilizar si el
conjunto del tem es coherente. Las frases incompletas se suelen utilizar en tests educativos.
Hay dos tipos de tems segn la forma de redactar las alternativas:
1) los que presenta una nica respuesta correcta. Se utiliza cuando no hay ambigedad
acerca de la veracidad o falsedad de la respuesta.
2) los que todas las alternativas son parcialmente correctas pero hay una que es ms
completa y la mejor respuesta. Se utiliza cuando se pretende evaluar procesos mentales
complejos.

Emparejamiento: el sujeto debe emparejar los elementos de dos columnas de acuerdo a las
instrucciones dadas en el enunciado. Se utiliza para medir vs de tipo cognitivo (sobre todo,
conocimientos).

Formato Cloze o incompleto: frase con espacio en blanco para rellenar con palabra de una
lista.

* los formatos vistos hasta ahora se utilizan para la medida de habilidades, aptitudes y conocimientos; en los que
se decide de antemano cul es la respuesta correcta. Los test elaborados con este tipo de tems se denominan
tests objetivos.

Escalas de clasificacin (rating scales): las alternativas de respuesta estn ordenadas de


forma gradual (total_ de acuerdo; de acuerdo; indiferente; etc.). Tb se las denomina escalas
valorativas (los sujetos tienen que emitir juicios de valor). No se utilizan en el mbito cognitivo.
Ventaja: los sujetos expresan su postura de una manera ms precisa. Inconveniente: el significado
de las distintas opciones de respuesta no es el mismo para todos los sujetos. Aparecen sesgos en
las respuestas (hay sujetos que tienden a elegir las respuestas extremas, o la central cuando es impar). El n
de opciones no debe ser mayor a 7 (lo ms usual son 5).
En general, las etiquetas lingsticas asignadas a las distintas categoras reflejan los aspectos:
Acuerdo; Frecuencia; Cantidad; Sentimientos; Valoracin. Entre medias de estas categoras extremas,
se asignarn distintas etiquetas lingsticas en funcin del n de alternativas.

Listados (checklists): Tb es una escala valorativa en la que los sujetos han de mostrar su
opinin. No uso para vs cognitivas. Las opciones son independientes entre s ( escalas
clasificacin); y no hay respuestas correctas o incorrectas ( tems eleccin mltiple). El n de
respuestas suele ser grande y es posible elegir varias opciones. Es un formato tpico de los
cuestionarios.

*las escalas de clasificacin y los listados se utilizan para la medida de vs de personalidad, actitudes, opiniones,
etc. Vs no cognitiva. En estas pruebas no hay respuestas correctas o incorrectas.

5.2.2.

tems de construccin. El sujeto elabora su propia respuesta; por lo que tb se


denominan de respuesta abierta. Los hay de 2 tipos:

tems de respuesta corta: el sujeto ha de elegir una nica palabra o frase sin que se le
presente en ninguna lista.

tems de respuesta extensa o de ensayo: se pide a los sujetos que desarrollen un tema.
Dando a los sujetos la oportunidad de expresarse con sus propias palabras, se podr evaluar no
slo el nivel de conocimientos de los sujetos y su forma de estructurarlos, sino sus habilidades

cognitivas de orden superior, los procesos cognitivos que ponen en marcha a la hora de solucionar
un problema.
Se utilizan para medir todo tipo de variables, tanto cognitivas como orcticas o afectivas.
Inconveniente: las respuestas son difciles de analizar y valorar pues el investigador tiene que
codificarlas en una serie de categoras antes de comenzar el anlisis, agrupar juntos a los sujetos
que han emitido respuestas similares y es muy difcil encontrar a sujetos que hayan dado la misma
respuesta. Cuando la poblacin es pequea se utilizan tests con tems de respuesta corta.
5.3.

Longitud del test.

No hay un nmero de tems adecuado en cada caso ya que son muchos los factores que hay que
tener en cuenta: a la poblacin a la que va dirigido, el tiempo del que se dispone, los objetivos del
test.
La tabla de especificacin nos puede dar una idea acerca del n de tems a incluir. Se puede partir
del n mnimo, teniendo en cuenta los factores de ponderacin asignados a c/ rea de conducta y c/
proceso a evaluar, se van calculando el n de tems del resto de las casillas. Al final se podr contar
con el n de tems total del test. En cualquier caso se recomienda que el n de tems de la prueba
piloto sea mayor que el de la versin final.
5.4.

Caractersticas psicomtricas de los tems.

Esto se refiere a:
o

su nivel de dificultad (Un tem es fcil o difcil para una determinada poblacin, en funcin de la probabilidad que
tengan de responder a l correctamente). 3 tipos de tests:

Test de velocidad: los tems deben ser fciles de resolver. La dificultad est en el tiempo limitado de

ejecucin.

Test de ejecucin mxima (Test de potencia): se utiliza para la evaluacin del rendimiento acadmico

y para la medida de las aptitudes y destrezas. Aqu los tems tienen diferentes grados de dificultad
(de muy fciles a muy difciles); y el tiempo de ejecucin no es un factor importante.
Test de ejecucin tpica: son los test de personalidad, actitudes, intereses, etc. Como no hay
respuestas correctas e incorrectas, no se puede hablar de dificultad de los tems.

su homogeneidad en relacin con los dems tems (Un tem tendr un alto grado de homogeneidad con el resto
de tems que forman el test cuando mida lo mismo que ellos). Si el constructo a medir es unidimensional, los
tems han de ser ms homogneos que si el constructo es multidimensional.

su capacidad de discriminacin (Un tem tendr poder distriminativo en la medida en que sirva para diferenciar
entre sujetos que han obtenido en el test puntuaciones extremas). Depende de la poblacin a la que va dirigida el
test.

6.
REDACCIN DE LOS TEMS.
Consideraciones para la tarea:
1) Debe existir un alto grado de congruencia entre el tem y el constructo psicolgico que se quiere medir
(validez del constructo).
2) Los constructos deben estar claramente definidos para poder valorar el grado de congruencia entre temconstructo..
3) Hay que tratar de minimizar los errores de medida cometidos al medir el constructo con cada tem.
4) El formato de los tems debe ha de ser adecuado para los objetivos del test.
5) Los tems deben reunir las caractersticas psicomtricas ms adecuadas en cada caso.
6) Los tems deben estar bien redactados.
7) Los tems deben satisfacer las consideraciones legales y tcnicas pertinentes. (Por ejemplo se deben evitar
plagios).
6.1.

Recomendaciones generales.

Evitar la ambigedad de los enunciados: (con enunciados cortos y directos).

Evitar enunciados que provoquen respuestas sesgadas (aquella que es ms probable que elijan
los sujetos independiente_ de su opinin).

Expresar una nica idea en el enunciado.


Evitar las dobles negaciones en los enunciados (hacen que los sujetos no sepan cul es la respuesta
que representa su opinin).
6.2.

Recomendaciones para tems de eleccin. Adems de las anteriores:

Dos alternativas: Verdadero-Falso: (1.- estar completa_ seguro de que el tem es verdadero o
falso. 2.- no utilizar frases que sean universalmente verdaderas o falsas. 3.- evitar poner en el
enunciado palabras que puedan inducir la respuestas correcta (como siempre, todo, nada, nunca, a
veces, en general, etc). 4.- evitar patrones de respuesta, colocando a lo largo del test, de forma
aleatoria, los tems cuyo enunciado sea correcto.

Eleccin mltiple: 1.- asegurarse de que el enunciado del tem formula el problema con claridad.
2.- Incluir la mayor parte del texto en el enunciado para evitar repeticiones innecesarias en las
opciones de respuesta. 3.- Incluir distintas opciones de respuesta al final del enunciado. 4.Asegurarse de que los distractores, son plausibles. 5.- Evitar opciones de respuesta como:
ninguna de las anteriores o todas las anteriores. 6.- Que slo haya una opcin correcta, a no ser
que se indique lo contrario claramente en las instrucciones. 7.- Tratar de que todas las alternativas
de respuesta tengan una longitud aproximada igual y con una construccin gramatical parecida.
8.- Aleatorizar la ubicacin de la alternativa correcta. 9.- Hacer que todas las alternativas le
parezcan igualmente atractivas a una persona no informada del problema al que alude el
enunciado. 10.- Asegurarse de que cada alternativa concuerda gramaticalmente con el enunciado
del tem. Si el enunciado est en singular, asegurarse de que cada alternativa est en singular.

Emparejamiento: 1.- Asegurarse de que tanto las premisas como las opciones de respuesta que
hay que emparejar son homogneas. 2.- Utilizar el formato adecuado (las premisas se deben
presentar de forma aleatoria en una columna a la izquierda y en una columna paralela, situada a la derecha, se
deben presentar las distintas alternativas de respuesta). 3.- El enunciado del tem debe reflejar
claramente la tarea que se espera del sujeto y la forma en que hay que llevar a cabo el
emparejamiento.

Formato Cloze o incompleto: necesario que en el enunciado del tem haya tantos espacios en
blanco como alternativas de respuesta; y si no es as, debe constar en las instrucciones.

Escalas de Clasificacin: 1.-Evitar expresiones coloquiales, por si alguien no las conoce. 2.Incluir en el test completo aproximadamente el mismo n de tems formulados de manera positiva y
negativa. 3.- Asignar las etiquetas lingsticas: al menos en los extremos de la escala deben
aparecer las etiquetas lingsticas para facilitar la respuesta de los sujetos. Tambin es
conveniente introducir una categora central que represente el punto medio o neutral, (No se,
Indiferente, Ni de acuerdo ni en desacuerdo) pues refleja la actitud u opinin de muchas personas.

Listados: son fciles de construir.


6.3.

Recomendaciones para tems de construccin.

tems de respuesta corta: 1.- Asegurarse de que el enunciado puede ser contestado con una
nica frase o palabra y que hay una nica respuesta correcta. 2.- Los espacios en blanco para las
respuestas han de ser de la misma longitud. 3.- Evitar dar pistas de la respuesta correcta, (por
ejemplo con el artculo de antes de la palabra etc). 4.- Indicar el grado de precisin exigido, (por ejemplo
el n de decimales). 5.- Evitar determinantes especficos como Todo o Nada y ambiguos como
Frecuentemente o Algunas veces.
tems de respuesta extensa o de ensayo : 1.- Asegrese de que el problema est bien enfocado,
con palabras que definan claramente la tarea (Compare, Contraste, etc). 2.- No permitir a los sujetos
que elijan entre varias preguntas de ensayo. 3.- Decidir de antemano cmo se van a puntuar las
preguntas de ensayo. 4.- Redactar las preguntas referidas a cuestiones controvertidas de manera
que los sujetos que deben responder sean evaluados en relacin a la evidencia que presentan no
a su posicin personal respecto al tema.
6.4.

Los sesgos de respuesta.

Este tipo de respuestas suelen aparecer en tests construidos para la medida de aspectos orcticos
y afectivos.
Principales sesgos:
1.

Aquiescencia: tendencia a responder sistemticamente que se est de acuerdo (o en


desacuerdo) con el enunciado del tem, con independencia de su contenido.
2. Deseabilidad social: responder de manera social_ aceptada.
3. Indecisin o tendencia a seleccionar la alternativa central o neutra: no se, ni acuerdo ni
desacuerdo, indiferencia.
4. Respuesta extrema o tendencia a elegir como respuesta las categoras de los extremos con
independencia del contenido del tem.
7.

REVISIN CRTICA POR UN GRUPO DE EXPERTOS.

Una vez que se han redactado los tems del test, y antes de dar forma a la prueba piloto, es conveniente
que estos tems sean revisados por un grupo de personas que no hayan intervenido en su elaboracin, para
que analicen todos aquellos aspectos que contribuyen a la calidad del tem. Una vez revisados, se puede
construir la versin preliminar del test, la prueba piloto, con aquellos que han pasado este primer control de
calidad.
8.
CONFECCIN DE LA PRUEBA PILOTO.
Dos aspectos bsicos:
8.1.

Instrucciones de administracin.

Evitar un leguaje ampuloso y amenazante.

En los test de ejecucin mxima se debe explicar que hay algunos tems que resultaran muy
difciles para todos los sujetos y que la prueba est pensada para que haya ejercicios que no
puedan resolver. Si se incluye esta observacin se reducir la ansiedad de los sujetos.

En los test de velocidad, avisar que el tiempo est limitado y muy pocos llegarn al final, Tb. hay
que explicitarlo en las instrucciones.

Las instrucciones deben proporcionar uno o ms tems de ejemplo.

Las instrucciones deben informar acerca de cmo distribuir el tiempo y que hacer cuando no se
conoce la respuesta de un tem.

Las instrucciones deben animar al sujeto a responder a todas las preguntas y favorecer as su
rendimiento, pues ste tiende a bajar considerablemente cuando se dejan muchas respuestas en
blanco.

Las instrucciones deben explicitar claramente la forma de responder en ellas.


8.2.

Formato de presentacin y de registro de las respuestas.

Una vez elaboradas las instrucciones hay que organizar y ordenar los tems seleccionados para su
posterior presentacin a los sujetos y decidir el formato de registro de respuesta. Se puede optar
por que los sujetos respondan en la misma hoja o cuadernillo o en un folio aparte ( en este caso los
test podrn ser reutilizados) y se puede contestar en una lectora ptica que facilitar su correccin.

El formato debe ser claro y perfectamente legible.


Debe solicitar al comienzo la identificacin del sujeto.
Presentar las instrucciones
Presentar los tems: para medir variables cognitivas es importante que se coloquen los tems
ordenados en funcin del nivel de dificultad, de menos a mas para evitar desmotivar al sujeto y
que deje de responder. En pruebas no cognitivas las preguntas embarazosas deben aparecer al
final de lo contrario podra el sujeto dejar de contestar.

9.

Los formatos diferentes deben aparecer agrupados para evitar provocar desconcierto.
Hay que tratar de que los tems sigan una ordenacin lgica.

APLICACIN DE LA PRUEBA PILOTO.

Una vez construida la prueba es necesario hacer un estudio piloto de la misma para su evaluacin
psicometra (ver si cumple los requisitos necesarios que permitan considerarla como un instrumento cientfico de
medicin). Esta requiere, decidir acerca de la forma de administracin y seleccionar una muestra de sujetos
que pertenezcan a la misma poblacin que aquellos para los cuales se ha diseado el tet.
Formas de administracin de la prueba:
Colectiva individual: preferible la colectiva (aunque WAIS , WISC son individuales).
Oral: las instrucciones y las respuestas se dan de forma oral.
Papel y lpiz: la presentacin y el registro de las respuestas se hace de forma impresa.
Mediante ordenador: aparecen los tems en pantalla y se responde a travs del teclado.
A travs del correo: alta tasa no responde y falta de seguridad de que el que responde es al que iba dirigido
10.

CORRECCIN DE LA PRUEBA PILOTO Y ASIGNACIN DE PUNTUACIONES A LOS SUJETOS.

Una vez que se ha aplicado la prueba piloto, la primera tarea es valorar las respuestas dadas por los sujetos
a cada uno de los tems para asignarles puntuacin. Siempre que se emite un juicio de algo es inevitable un
cierto grado de subjetividad, pero tambin es necesario tratar de eliminarla o al menos controlarla.
10.1

En los tests formados por tems de eleccin

Tambin llamados de respuesta cerrada, tiene la ventaja que el examinador no debe realizar
ninguna valoracin de las respuestas emitidas por los sujetos a cada uno de los tems, eliminndose
la posibilidad de introducir subjetividad en la puntuacin que les asigne.
10.1.1. Pruebas cognitivas:
Se conoce de antemano cual es la respuesta correcta, solo hay que comprobar si coincide.
Una vez corregida es necesario combinar las puntuaciones asignadas a cada elemento para
n

obtener la puntuacin de cada sujeto en el test total. Una forma puntuacin =

X
i 1

Xc

Un inconveniente grave es, la posibilidad de que un sujeto, desconociendo la respuesta,


elija por azar la correcta, siendo en ese caso la puntuacin final inflada de su verdadero
nivel. Para evitarlo se utiliza una frmula de correccin: penalizando errores o bonificando
las omisiones.
Respuestas incorrectas dadas al azar:
puntuacin corregida. A = n de aciertos.

X c A Aa A
E = n errores. K = n alternativas de los tems.

E
K 1

Aa aciertos obtenidos al responder al azar.

Si llamamos Ra al n de respuestas aleatorias que emite el sujeto en el total del test, se puede
establecer que el n de errores ser

k 1
E Ra 1 Ra

k
k

Ser igual al n de respuestas aleatorias por la probabilidad del error.

Es decir, el n de respuestas aleatorias por la


El n de aciertos al azar ser:

1
Aa = Ra K

probabilidad de acertar por azar.

El n de errores al azar:
Ra = E

k
k 1

Sustituyendo en la formula de los aciertos por la probabilidad de acertar:

Aa E

K 1
E

K 1 k
k 1

Cuando se bonifican las omisiones la frmula correcta sera:

X c A Aa A

O
K

Aunque este procedimiento permitira hacer comparaciones entre las puntuaciones, estaran
sobrevaloradas. No corresponderan al verdadero nivel de los sujetos, por lo tanto es ms
adecuado utilizar el primer procedimiento.
Cuando un mismo tem esta formado por tems con distinto n de alternativas, para conocer
cual es la puntuacin de cada sujeto ser necesario ir aplicando la correccin del azar por
partes; se agruparan los tems en funcin del nmero de alternativas y se calcular la
puntuacin del sujeto en cada uno de los grupos. La puntuacin final ser la suma de las
puntuaciones parciales obtenidas.
10.1.2. Pruebas no cognitivas
En estas no hay respuestas correctas ni incorrectas, los tems llevan asignado un valor n
distinto a cada alternativa de respuesta, lo que implica un escalamiento previo de los tems
en funcin del grado de atributos que manifiesten. La forma de corregir es sumando los
valores numricos asignados a las alternativas o categoras de repuesta elegidas por el
sujeto.
Cuando se utiliza un formato de escalas de categoras o clasificaciones hay que tener muy
claro cul es la direccin del continuo de la variable que se est midiendo.
10.2

En los tests formados por tems de construccin.

Cuando se trata de que el sujeto construya la respuesta correcta con una palabra o frase corta
(tems de respuesta corta) es fcil la asignacin de la puntuacin a los sujetos. El problema ser
cuando sean ms abiertas y extensas puesto que es ms difcil corregir sin subjetividad.
Este tipo de test permite expresarse de forma abierta, y as valorar no solo los conocimientos del
tema sino otros aspectos importantes en algunas situaciones, el inconveniente es la correccin de
las mismas ya que es muy laboriosa y bastante subjetiva.
Formas de controlar la subjetividad:
10.2.1. Mtodo de la puntuacin analtica: Requiere:
1. Definir de forma inequvoca y aislar las dimensiones que se consideran importantes
para la realizacin de la tarea a evaluar.
2. Establecer las formas de evaluarlas, definiendo claramente lo que se considera una
respuesta adecuada o correcta en cada dimensin y estableciendo el nmero de
respuestas correctas que se necesitan, a cada una de ellas, para poder decir que la
tarea ha sido correctamente realizada.
3. Las pruebas pueden ser corregidas por personas que no sean expertas en la materia a
evaluar, ya que no habr dificultad en decidir si la respuesta es correcta o no.

10

4. La puntuacin final viene expresada por dos nicos valore: correcta / incorrecta, apto /
no apto, pero se obtiene informacin de cada una de las dimensiones.

10.2.2. Mtodo de la puntuacin holstica.


Evala de una manera global u holstica la forma en que los sujetos han realizado la
prueba, y la puntuacin asignada, que podr tomar distintos valores dentro de los lmites
establecidos. Requiere que la correccin de las pruebas sea hecha por expertos,
entrenados para alcanzar un acuerdo entre ellos y eliminar la subjetividad.

11