Está en la página 1de 7

Características de los Ítems

Las ciencias experimentales operan con valores numéricos que se obtienen como
resultado de efectuar medidas de variables, por ejemplo una temperatura, una
longitud o una diferencia de potencial eléctrico. Sin embargo, estas medidas nos
proporcionan valores aproximados de dichas variables ya que en el proceso
intervienen tanto las imperfecciones de los instrumentos de medida, las
limitaciones de nuestros sentidos o causas incontrolables. Puede también suceder
que, en algunas ocasiones, el mismo proceso de la medida puede tener influencia
sobre la magnitud que deseamos medir.

Admitiremos como postulado que es imposible llegar a conocer el valor exacto de


cualquier magnitud. Esto no significa que no exista dicho valor verdadero, sino que
es imposible determinarlo sin un margen de indeterminación o incertidumbre. El
objetivo de la teoría de medidas consiste precisamente en acotar dichas
incertidumbres, denominadas también errores experimentales. La importancia de
esta acotación radica en que, en muchas situaciones, obtener una conclusión o
tomar una decisión dependerá del grado de incertidumbre que se haya obtenido
en el proceso de medida. Para evitar malentendidos dejaremos establecido que el
término error, que vamos a utilizar extensamente, es sinónimo de indeterminación
y no de equivocación.

Por otra parte, muchas magnitudes no se miden, sino que se obtienen


indirectamente como resultado de operar con medidas que sí se realizan
directamente.

Para proceder a descubrir el significado del término ítem es necesario, en primer


lugar, conocer su origen etimológico. En este caso, podemos exponer que se trata
de una palabra que deriva del latín, concretamente de “ítem”, que puede traducirse
como “del mismo modo” o “también”.

El concepto de ítem tiene varios usos. El término puede hacer referencia a los
diversos elementos o unidades que forman parte de un conjunto. Asimismo,
igualmente, aditamiento e incluso añadidura son algunas de palabras que pueden
funcionar como sinónimos de ítem.

En el terreno de la psicología, los ítems son las partes que integran un test o una
prueba. De manera similar, en el ámbito de la educación, los ítems son las
distintas preguntas que se plantean en una evaluación.

Los estudiantes, en este marco, deben responder o resolver los ítems. Según las
características del examen, pueden presentarse ítems de respuesta cerrada o
ítems de respuesta abierta. Una vez que el alumno completa la evaluación, debe
entregársela al docente, quien tendrá que corregirla para calificar al educando de
acuerdo a los resultados.

A la hora de que el maestro o profesor dé forma a los ítems que van a componer
el examen o la prueba pertinente es necesario que aquel tenga en cuenta una
serie de aspectos. Así, por ejemplo, es importante que el estudiante esté
absolutamente familiarizado con el ítem, que ese no sea para nada ambiguo, que
esté redactado de tal manera que se comprenda sin problemas o incluso que lo
que es la resolución de un ítem no dependa de la resolución de otro anterior.

Supongamos que, en una evaluación de diez ítems donde cada ítem tiene un valor
de un punto, el estudiante responde correctamente la totalidad de las preguntas.
Esto le permite obtener una calificación de 10 puntos, la más alta posible.

Tipos y ejemplos de ítem

Las preguntas de una prueba de rendimiento pueden ser de diversos tipos. A


continuación se muestra una selección de preguntas clasificadas atendiendo a la
forma de la respuesta.

 Preguntas de respuesta cerrada, son las que muestran alternativas de


respuestas.
o De respuesta alternativa simple (dicotómicas), combinan diferentes
opciones de respuesta binaria (sí / no; verdadero / falso).
o De respuesta de alternativa múltiple. Presentan varias alternativas
(A, B, C, D).
o De respuesta de elección múltiple compleja, cuando se combina en
un mismo ítem varias frases o alternativas con selección de
respuesta binaria (sí / no; verdadero / falso).
 Preguntas abiertas de respuesta elaborada
o Respuesta elaborada construida.
o Respuesta elaborada corta (precisan de correctores con
pormenorizados criterios de valoración).
o Respuesta elaborada larga (precisan de correctores con
pormenorizados criterios de valoración).
Las preguntas no se presentan aisladas, sino formando grupos bajo una
presentación textual y/o gráfica común, que denominamos “estímulo”, que
presenta al alumno una situación cotidiana como las que se pueden encontrar en
la vida real. En el caso concreto de TIMSS para 4º curso de Educación Primaria,
se combinan grupos de preguntas vinculadas a estímulos, con otras que no se
refieren a un estímulo y que se configuran como preguntas sueltas, o estímulos
con una única pregunta.

Las preguntas de respuesta alternativa simple en evaluaciones externas


internacionales no se suelen utilizar solas. Se suelen combinar de una de las dos
siguientes formas:

1. Uniendo entre tres y cinco preguntas de respuesta alternativa simple en un


solo ítem para conformar una sola de respuesta de elección múltiple compleja
y evitar el efecto azar de la respuesta del alumno:

 "El Quijote" lo escribió Cervantes SI/NO


 "Soledades" lo escribió Quevedo SI/NO
 "La vida del Buscón" lo escribió Góngora SI/NO
2. Añadiendo a la pregunta de respuesta alternativa simple algo parecido a un
"Razona tu respuesta". De este modo, la pregunta se convertirá en una del
tipo elaborada corta.

Validez y confiabilidad de los ítems

La validez abarca el concepto experimental entero y establece si los


resultados obtenidos cumplen todos los requisitos del método de la
investigación científica o no. También, es indispensable, ya que, su ausencia
podría explicar un posible error en los datos y no lograr los objetivos de
investigación. Así mismo, comenta que los resultados de una prueba o son
simplemente validos o no validos sino que ocurre e grados, desde una escasa
validez hasta mucha validez. Por esto, se refiere al grado en un instrumento
realmente mide la variable que pretende medir.

La confiabilidad se refiere al nivel de exactitud y consistencia de los resultados


obtenidos al aplicar el instrumento por segunda vez en condiciones tan
parecida como sea posible. Por eso, la idea detrás de la confiabilidad es que
los resultados significativos deben ser más que un hallazgo de una sola vez e
intrínsecamente repetibles.
La confiabilidad y la validez son cualidades esenciales que deben estar
presentes en todos los instrumentos de carácter científico para la recogida de
datos. Si el instrumento reúne estos requisitos habrá cierta garantía de los
resultados obtenidos en un determinado estudio y, por lo tanto, las
conclusiones pueden ser creíbles y de mayor confianza.

Dificultad y Discriminación

Se entiende por análisis de ítems el estudio del comportamiento individual de


los ítems contestados en una prueba de corrección objetiva, por un grupo
determinado de estudiantes o examinandos. En el contexto del análisis clásico
de ítems el término se refiere a la aplicación de métodos estadísticos para
establecer las características de cada ítem. Los aspectos que
tradicionalmente se tienen en cuenta son el coeficiente de dificultad (facilita
valué), que permite establecer el número de estudiantes que han contestado
correctamente a un mismo ítem, y el índice de discriminación (discriminación
índex), que distingue los ítems, según hayan sido resueltos correctamente por
los estudiantes que han conseguido mejores resultados globales en la tarea
de la que el ítem analizado forma parte, o por los que han tenido resultados
globales poco satisfactorios en la misma tarea.

Para que una prueba tenga un nivel de dificultad determinado, los


responsables de la misma seleccionan los ítems que se prevé que tienen la
facilidad/dificultad adecuada al nivel de conocimientos medio que se supone a
los candidatos. El pilotaje deberá confirmar la previsión de los elaboradores de
la prueba, que deberán comprobar si el resultado del mismo coincide con las
previsiones realizadas para el grupo de candidatos en cuestión. El resultado
global es la dificultad media de los ítems incluidos en la prueba. Una dificultad
media del 75 % indica que hay muchos ítems en la prueba que tienen una
dificultad menor. Si los responsables de la prueba determinan dificultarla
incluirán ítems con un coeficiente de dificultad mayor y si lo que quieren es
facilitarla, por el contrario, incluirán ítems con un menor coeficiente de
dificultad.

El índice de discriminación de un ítem se obtiene ordenando a los candidatos


con relación a las puntuaciones obtenidas en la prueba que se analiza y
comparando los resultados obtenidos por los del tercio superior con los del
tercio inferior. Si en un grupo de 30 estudiantes, los 10 del tercio superior
contestan correctamente a un ítem y los 10 del tercio inferior lo hacen
incorrectamente, ese ítem tendrá el máximo índice de discriminación: 1. Es
muy difícil conseguir un ítem de este tipo y se consideran ítems con un buen
índice de discriminación a partir de +0’4, es decir los resueltos correctamente
por 10 estudiantes del grupo superior y 6 del inferior, u 8 del superior y 4 del
inferior, etc. En ocasiones la discriminación de un ítem es negativa (-0’4, por
ejemplo) lo que indica que más estudiantes del tercio inferior han contestado
bien al ítem que estudiantes del tercio superior. En estos casos, es evidente
que el ítem no funciona y debe eliminarse.

Importancia en la Práctica

Los ítems liberados pueden resultar de gran utilidad tanto a nivel profesional como
de cara a los alumnos. En el primer caso, éstos pueden ayudarme a mejorar mis
procesos de evaluación al ser utilizados como modelo para diseñar mis pruebas.
En segundo lugar, los ítems pueden ser empleados como práctica en el aula, lo
cual favorecerá al desarrollo de las competencias de los alumnos.

Por ello, el uso de estos ítems, me ayudarán a innovar en mi práctica como


alumno.

Conclusión

Los test o pruebas son los instrumentos empleados para la medición de variables
del ámbito psicológico y educativo y los resultados de estos son utilizados para la
toma de importantes decisiones que afectarán muy directamente la vida de los
examinados. Esta es la razón por la que su estudio tiene una gran relevancia en la
investigación científica. En tal sentido, este artículo recoge los hallazgos de los
estudios más importantes acerca del formato de la pregunta en pruebas de
desempeño y la influencia que tienen sobre la ejecución de la tarea, al investigar si
los distintos formatos de ítems logran medir lo mismo o, si por el contrario, tienen
un efecto diferencial sobre la conducta generadora de competencias del
examinado al momento de afrontar una prueba.

Referencias bibliográficas

Bisquerra, R. (1987). Introducción a la Estadística aplicada a la investigación


educativa. Un enfoque informático con los paquetes BMDP y SPSSX.
Barcelona: PPU.

Marañón, R. C. (2014). Psicología de las diferencias individuales. Ediciones


Pirámide.

Borja, L. (2004). Fundamentos psicométricos en la evaluación psicológica.


Revista electrónica de psicología Iztacala, 7(4), 23-43.

Fernández-Pinto, I., López-Pérez, B., & Márquez, M. (2008). Empatía:


Medidas, teorías y aplicaciones en revisión. Anales de Psicología/Annals of
Psychology, 24(2), 284-298.

También podría gustarte