Está en la página 1de 7

Por lo que respecta al formato de los ítems, la primera decisión a tomar es si el sujeto debe construir la

respuesta (respuesta abierta) o si ha de seleccionarla de entre las propuestas. Las primeras se adaptan
mejor a los procesos cognitivos complejos y en los que es primordial la actividad o producción del
sujeto, mientras que los segundos son últimamente preferidos por su mayor precisión o fiabilidad,
además de por su mayor rapidez de corrección.

1.- Tests de Ejecución máxima

El tipo de alternativa de respuesta es la forma en que se va a pedir a las personas que respondan al
test. Los tipos de alternativas de respuesta más frecuentes en tests de ejecución máxima son (para
mayor información sobre ventajas e inconvenientes de cada tipo de ítems consultar Osterlind,1989):

1.1.- Verdadero y Falso.

Tienen el inconveniente de ser respuestas excesivamente contundentes o extremas, y que de pocos


enunciados se pueden emitir sin crítica. Suele ocurrir que alumnos de nivel alto en el constructo suelen
equivocarse  al responder por encontrar pequeñas razones que irían en contra de la respuesta correcta.
Son ítems fáciles de construir, pero su respuesta está muy afectada por el azar.

p.e.: (todos estos ejemplos de tipos de ítems han sido tomados de J. Muñiz, 1994)

El coeficiente de fiabilidad puede ser mayor que 1

Verdadero Falso*

1.2.- Elección múltiple.

Suelen tener entre tres y cinco alternativas de respuesta, de entre las que el sujeto tiene que elegir cuál
es la correcta, o la más correcta si hubiera varias que pudieran ser consideradas como correctas. No
obstante, hay pruebas psicométricas que ofrecen la posibilidad de elegir varias alternativas como
correctas, e incluso de ordenarlas en cuanto al grado de corrección; pero crean algunos problemas de
calibración o de obtención de las puntuaciones en el atributo que se mide.

p.e.:

La correlación entre dos formas paralelas de un test se denomina:

-Coeficiente de validez

-Coeficiente de fiabilidad*
-Índice de fiabilidad

1.3.- Relacionar.

En ítems de conocimientos e información suelen ofrecerse dos columnas de elementos informativos y


pedir al sujeto relacione los elementos de la columna izquierda con los de la derecha. Constituyen una
forma rápida de preguntar y responder sobre una gran cantidad de contenidos, pero no es adecuado
para evaluar sobre procesos cognitivos de mayor complejidad.

p.e.: Un ítem en el que se pida al sujeto que relacione fechas y echos históricos; y en el campo de la
Psicometría podemos poner este ítem (op. cit.)

Conecte con una línea cada fórmula con su denominación:

1. Error de medida a) 


2. Error de estimación b) X-V
3. Error típico de medida c) 
4. Error típico de estimación d) Y´-Y

1.4.- Completar, sustituir o corregir.

Completar, sustituir o corregir algún o algunos elementos de una frase o serie estimular. Este tipo de
ítems evitan la influencia del azar, pero al igual que en el caso anterior son excesivamente
memorísticos.

p.e.:

Se dice que un test tiene validez de........................cuando los ítems muestrean adecuadamente el
dominio.

contenido *

1.5.- Respuesta corta.

Se pide la respuesta sin oferta de alternativas de respuesta. Con ello se evita la influencia del azar.
Pueden ser adecuados para evaluar la claridad con la que se han asimilado algunos conceptos simples.
Como todas las respuestas abiertas, éstas también pueden tener problemas de fiabilidad.
p.e.:

¿Cómo se denomina la correlación entre test y criterio?

coeficiente de validez *

1.6.- Ensayo.

Ítems que requieren respuestas más largas y con mayor tiempo que en el tipo anterior, e incluso en ellos
se suele permitir el uso de materiales complementarios.

p.e.:

Exponga sus conocimientos acerca de la validez aparente.

Para intentar objetivar la puntuación o corrección de este tipo de ítems se suele recurrir a varios jueces
o correctores a los que se les provee de listas de control de categoríasa evaluar en las respuestas; así
como de las escalas de calificación más adecuadas para cada una de las categorías de respuesta
(Rivas, 1983).

En los tres primeros tipos de ítems la actividad del sujeto consiste en seleccionar la respuesta y en los
dos últimos los sujetos tienen que generar la respuesta. En el tipo de ítem cuarto todo depende de que
se oferten elementos de entre los que elegir el correcto o no.

De forma general no se puede afirmar que un tipo de reactivo sea mejor que otros. Siempre cabe
responder:  depende de para qué, cómo y cuándo.

No obstante y a pesar de los inconvenientes apuntados anteriormente, el formato más utilizado es el de


ítems de elección múltiple.

Tanto para este tipo de ítem como para cualquier otro cabe resaltar alguno de los errores más
frecuentes para prevenir su repetición (Muñiz,1994, p. 208-209):

- Que las alternativas de respuesta no resultan igualmente plausibles...por resultar obvias o absurdas.
Las alternativas incorrectas más plausibles tienden a perjudicar a los sujetos más competentes ..al
disponer de información adicional problemática.

- Siempre que se pueda, conviene evitar los enunciados en forma negativa, pues resultan más difíciles
de procesar para los sujetos. También las frases cortas son preferibles a las de estructura demasiado
complicada. Evitar o minimizar el uso de expresiones como "raras veces", "a menudo" o "generalmente".
Asegurarse de la concordancia gramatical entre el enunciado general y las alternativas. Evitar
alternativas o enunciados jocosos.

- La longitud de las alternativas conviene que sea aproximadamente la misma... es erróneo que una vez
que se describe con detalle la correcta, se despachen rápidamente las incorrectas.

-Evitar las reiteraciones de texto innecesarias. p.e.:

"El índice de dificultad es:

a) La proporción de sujetos que aciertan el ítem *

b) La proporción de sujetos que fallan el ítem

c) La proporción de sujetos que omiten el ítem

(Dejamos al alumno para que piense cuál sería las forma de subsanar el problema de redacción en este
ejemplo.)

- Cuando se utilizan cifras (números, fechas, etc.) en las alternativas es conveniente presentarlas
ordenadas para evitar confusiones innecesarias por parte de los sujetos. p.e.:

"En una distribución normal al percentil 95 le corresponde una Z entre:

a) -0.5 y 1.0

b) 1.0 y 1.5

c) 1.5 y 2.0 *"

- Conviene evitar el uso como última alternativa de "todas las anteriores", pues conociendo que una de
las anteriores es incorrecta, ya queda descartada esta última. Por ir contra la lógica seguida en el control
de los efectos del azar (ver apartado siguiente).

En general, todas estas recomendaciones y otras muchas que se podrían hacer se resumen en el buen
uso del sentido común de cara a intentar que la puntuación en el test, y, por lo tanto, las que se
obtengan en los ítems, dependan exclusivamente o al menos en la mayor medida del constructo que se
mide y no de otros constructos ajenos, como suelen ser las habilidades lingüísticas, etc..

Para mayor información sobre tipos de reactivos el alumno puede consultar F. Rivas (1983, 1 er tomo).
2.- Tets de Ejecución típica

2.1.- En los cuestionarios de personalidad o actitudes (tests de ejecución típica) se suelen utilizar


formatos del tipo SI/NO, SI/NO/A VECES,  o escalas tipo Likert (más adelante se hablara de este tipo de
escalamiento) en las que el sujeto gradúa o pondera su respuesta en escalas de 3 a 9 posibles valores.

En estas escalas de actitudes se suelen distinguir tres tipos de alternativas de respuesta.

2.2.- Tipos de alternativas en las escalas tipo Likert:

2.2.1.- Las alternativas de acuerdo

piden a la persona que indique el grado de acuerdo con la información presentada en el enunciado del
ítem. Habitualmente, son bipolares -registran el acuerdo y el desacuerdo- y simétricas respecto a un
punto neutro. A través de las alternativas de respuesta, el sujeto indica si está "fuertemente",
"moderadamente" o "ligeramente" de acuerdo o en desacuerdo con el enunciado del ítem. Los
modificadores (p.e. muy, bastante, ...) deben ser los mismos para el acuerdo y el desacuerdo, haciendo
que las elecciones de respuesta sean simétricas.

Para alcanzar esta simetría, no es imprescindible incluir un punto neutro. Las alternativas de acuerdo
son las más populares y versátiles, utilizándose para una gran variedad de variables.

El siguiente ítem del ejemplo muestra la utilización de alternativas de acuerdo:

.Un trabajo bien hecho es una buena medida de lo que vale una persona

Muy en desacuerdo 1 2 3 4 5 Muy de acuerdo

2.2.2.- Las alternativas de evaluación

piden a la persona que haga un juicio en una dimensión de "bueno-malo" (o "adecuado-inadecuado",


"correcto-incorrecto", etc). Las alternativas suelen ir desde lo positivo (excelente) a lo negativo
(terrible ...). Pueden utilizarse para medir actitudes o hacer juicios sobre la calidad de la ejecución en
diferentes dominios.

El siguiente ítem con alternativas de evaluación pertenece a un test para medir los aspectos del trabajo
que más valoran las personas:

.Buen sueldo

Nada importante 1 2 3 4 5 Muy importante


2.2.3.- Las alternativas de frecuencia

suelen preguntar a las personas cuantas veces ocurre algo o debería ocurrir. Pueden utilizarse
alternativas numéricas o verbales (una vez por día, una vez a la semana...). Suelen extenderse desde
"nunca..." a "Siempre". Pueden utilizarse para medir variables de personalidad cuando se necesita que
la persona indique con qué frecuencia realiza determinados comportamientos (o para describir el
ambiente, indicando cuantas veces ocurre algo).

En un test para medir el tipo de atribución que hacen las personas sobre las causas del paro juvenil
podemos encontrar el siguiente ítem de frecuencia:

.El joven que está bien preparado encuentra trabajo

Siempre La mayoría de las Unas veces sí y otras Rara vez Nunca


veces no
5 4 3 2 1

Hay muchos constructos para los que cualquiera de estos tipos puede servir, para otros unas
alternativas serán más adecuadas que otras. (p.e. comportamiento de voto). La decisión sobre si utilizar
un tipo u otro de alternativa de respuesta debe justificarse en relación con el criterio expuesto en
párrafos anteriores:

¿qué tipo de alternativa contribuye más al objetivo para el que van a utilizarse las puntuaciones
aportadas por el test?

Otra decisión importante es el número de alternativas de respuesta en las pruebas de actitudes. A


priori puede pensarse que cuanto mayor sea el número de alternativas obtendremos una mayor
precisión en las respuestas. En principio, esto es cierto y por ello hay tests que utilizan hasta 100
posibles valores de respuesta. El criterio es considerar la capacidad de las personas que van a
responder al test para discriminar entre diferentes alternativas, es decir, para discriminar su nivel de
acuerdo, juicio o evaluación sobre el contenido del enunciado del ítem. Por lo mismo, de 3 a 9
alternativas pueden ser adecuadas para la mayoría de los constructos y situaciones.

En los tests de aptitudes y de rendimiento suele ser frecuente ofrecer varias alternativas de respuesta,
de las cuales suele ser sólo una la correcta. Algunos autores se han planteado cuál es el número óptimo
de alternativas de respuesta con miras a optimizar la fiabilidad y validez de la prueba. El disponer de
más alternativas de respuesta hace disminuir la probabilidad de acertar por azar, pero también hace
necesario disminuir el número de ítems (lo que afecta negativamente a la fiabilidad y validez del test).
A la vista de la literatura existente, y sin que esté plenamente demostrado en todas las circunstancias,
parece ser tres el número aconsejable de alternativas de respuesta en los tests de alternativas de
respuesta con una correcta (Lord, 1977 y 1980).

También podría gustarte