Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. INTRODUCCIÓN
El análisis de los ítems tiene como objeto seleccionar aquellos que tengan mayor calidad
psicométrica con el fin de garantizar que el test definitivo sea, dentro de las posibilidades, el óptimo desde
el punto de vista de la fiabilidad y validez del mismo. Este análisis implica los siguientes elementos:
(1) La estimación de los parámetros de los ítems, que son: la dificultad, el poder discriminativo, la
fiabilidad (Índice de Discriminación Interna e Índice de Fiabilidad) y la validez (Índice de
Discriminación Externa e Índice de Validez) de cada ítem.
(2) El análisis de las alternativas incorrectas de respuesta, o distractores, cuando los ítems son de
respuesta múltiple.
(3) El análisis del posible funcionamiento diferencial de los ítems del test en distintos grupos de
sujetos.
El poder discriminativo de un ítem es una propiedad psicométrica del mismo que refleja el grado en
que el ítem es capaz de diferenciar los diferentes grados o niveles en que los sujetos poseen la característica
que dicho ítem pretende medir.
Si, como se ha visto en el punto anterior, el índice de dificultad sólo tiene sentido aplicarlo en pruebas
cognitivas, el poder discriminativo de un ítem es aplicable tanto a pruebas cognitivas (por ejemplo, grado de
razonamiento abstracto) como no cognitivas (por ejemplo, actitud hacia los estudios).
En el caso de las pruebas cognitivas, los ítems con índices de dificultad muy altos (valores p próximos
a 0) o muy bajos (valores p próximos a 1) tienen bajo poder discriminativo, mientras que los ítems con
índices de dificultad intermedia (valores p próximos a 0’50) son los que mayor poder discriminativo ofrecen.
Un indicador estadístico adecuado para evaluar el poder discriminativo de un ítem es su desviación
típica (Si). Este índice sólo es objetivamente interpretable para ítems con valores de respuesta dicotómica
(distribuciones binomiales) ya que conocemos el rango en el que opera esa Si (puede tomar valores entre
0 y 0,50). En otro tipo de formatos, dependiendo de los valores de las respuestas de los sujetos, no podemos
conocer el tope del valor Si con lo que, al utilizarlo se requiere una interpretación más cualitativa y, por lo
tanto, mucho menos objetiva.
Recordad que en ítems dicotómicos (distribuciones binomiales) los estadísticos más representativos
(Media y desviación típica) se pueden calcular de forma mucho más simple ya que la Media del ítem sería
= p y el valor de la desviación Típica (Si) corresponde a la siguiente ecuación:
Si = pq
Donde p es la proporción de unos y q la proporción de ceros (su complementario)
En estos casos, un valor adecuado de Si se establece a partir de valores de 0,40 (que son los que
corresponden a unos valores de p ó q en torno a 0,80 ó 0,20.
Estas propiedades se establecen comparando los resultados de un ítem con un criterio de interés.
Dependiendo de la naturaleza de ese criterio distinguimos entre Discriminación Interna (u homogeneidad
del ítem) y Discriminación Externa (asociada al concepto de validez del ítem)
Discriminación Interna u homogeneidad : El criterio es el propio test al que pertenece el item (se
relaciona cada ítem con la puntuación total del test en su conjunto, X)
Lo que trata de verificar este indicador es hasta qué punto el ítem “funciona bien” en consonancia con
el resto de los ítems. En otras palabras, hasta qué punto un ítem contribuye de forma efectiva al poder
discriminativo del test, es decir, a su medida total.
Discriminación Externa: El criterio es una medida ajena al propio test pero que se supone relacionada
con él (otras medidas de otros tests convergentes o un criterio externo de validación) (Y)
Lo que se trata de verificar con este indicador es hasta qué punto el ítem contribuye a medir el
constructo que se trata de medir. Para ello se disponen de medidas externas (por ejemplo de otros tests o
de otros métodos de medición) que se sabe que miden ese constructo y analizamos hasta qué punto cada
ítem del test se relaciona con esos criterios externos.
Mientras que la Discriminación Interna se puede establecer para todos los ítems de cualquier test, la
Discriminación Externa sólo se puede comprobar en aquellos casos en los que dispongamos de esas
medidas de Criterios externos (que no siempre es posible)
- Tipos de índices:
Interpretación: (para tratar estas cuestiones vamos a referirnos siempre al índice de homogeneidad
(rix) que es el más universal, pero teniendo presente que para el índice de discriminación externa (riy) la
interpretación sería idéntica).
Lógicamente cuanto mayores sean los índices de discriminación, tanto interna como externa, mejor.
En cualquier caso, para que un item sea aceptable deberá tener un índice como mínimo significativo desde
el punto de vista estadístico.
Ese valor mínimo depende del tamaño de muestra y del nivel de significación “alfa” (α) con el que
queramos trabajar (recordemos que en Ciencias Humanas en general y en Psicología en particular ese nivel
de significación suele ser α 0,05 ó 0,01):
1
rix min = z α
1− N −1
2
Donde rixmin es el valor de correlación mínimo significativo (por debajo del cual se entiende que la
correlación entre las variables es nula)
Z es el valor de la puntuación típica que corresponde a los diferentes niveles de significación; es un
valor constante que corresponde a Z = 1,96 para α 0,05 o a Z = 2,58 para α 0,01.
N es el tamaño de la muestra con la que se realizan los análisis
rix S X − S i
ri (x −i ) =
S i2 + S 2x − 2 rix S i S x
- Diferencias de proporciones entre grupos extremos (D). Sólo aplicable a items dicotómicos,
(binomiales)
Pasos:
Se categorizan por separado el Test X y el Criterio y agrupando a los sujetos en dos grupos
extremos (Grupo superior, por encima del Centil 75, y Grupo inferior, por debajo del Centil 25).
Los sujetos centrales quedan eliminados.
Cc ⋅ N
− f ai
X Cc − ó − YCc = l ri + i 100
fp
Se lleva a cabo un contraste “t” de diferencia de medias entre la media del ítem del grupo
superior y la media del ítem del grupo inferior. Si el ítem es discriminativo, esas medias deben
ser significativamente diferentes.
En el caso de ítems dicotómicos (distribuciones binomiales) se calcula Dix y Diy (en ambos casos
es D = ps- pi) Donde “ps” es la proporción de unos en el item de los sujetos que forman el grupo
superior (en el test si estamos calculando la discriminación interna, o en el criterio si estamos
calculando la discriminación externa), y “pi” es la proporción de unos en el item de los sujetos
que forman el grupo inferior (en el test si estamos calculando la discriminación interna, o en el
criterio si estamos calculando la discriminación externa).
Interpretación:
siendo σi la desviación típica del ítem i, ρix la correlación entre las puntuaciones en el ítem i y en el
test y ρiy la correlación entre las puntuaciones en el ítem y un criterio externo de validación.
Una propiedad del Indice de Fiabilidad (IFi) es que su suma coincide con la Desviación Típica del test total (Sx)
con lo que es fácil deducir que los ítems que mejor contribuyen a la capacidad de medida de un test son aquellos
que tienen mayor IF y, si os fijáis el IF está en función tanto del poder discriminativo de un ítem como de su
discriminación interna. El IF es la combinación de ambos indicadores con lo que se deduce que tan bueno puede
ser un ítem con Poder Discriminativo Alto y relativamente Baja Discriminación Interna como al revés.
Este procedimiento permite obtener un índice estadístico que nos permite valorar la posible existencia
de funcionamiento diferencial en un ítem. Los pasos a seguir son:
1º Seleccionar la variable externa de agrupamiento que se sospecha puede estar generando un
funcionamiento diferencial en los ítems del test. De los dos grupos formados, suele denominarse Grupo de
Referencia a aquél que es beneficiado por el funcionamiento diferencial (por regla general, es el grupo
socialmente mayoritario), mientras que se reserva el término Grupo Focal para referirse al grupo que se
sospecha es perjudicado por dicho funcionamiento diferencial (grupo socialmente minoritario).
2º Subdividir a los sujetos de ambos grupos en función de la puntuación obtenida en el test (nivel de
habilidad). Se suelen establecer tres subdivisiones (Nivel bajo, Medio y Alto)
3º Calcular el número de respuestas correctas e incorrectas por cada grupo y en cada nivel de
habilidad (subdivisión):
El test “A” pretende medir Aptitudes Mentales Primarias (Razonamiento Abstracto) y está
compuesto por 20 items dicotómicos cuyas propiedades psicométricas se recogen en las
siguientes tablas:
b) ¿Qué item revela una mejor discriminación interna? ¿Cuál sería su índice de discriminación si
eliminamos el efecto de la sobrevaloración que implica su presencia en la puntuación total del test?
(APARTADO TEÓRICO 2.3)
c) Compruebe que, efectivamente, la Desviación Típica del Test “A” es igual a la suma de los Índices
de Fiabilidad de sus items. (APARTADO TEÓRICO 2.4)
d) Sabiendo que el test está formado por ítems con 5 opciones de respuesta (a, b, c, d y e) de la que
sólo una es correcta, ante los datos que se recogen en la siguiente tabla ¿cuál de esos ítems presenta
un funcionamiento de los distractores más adecuado? (correlación mínima significativa = 0.15)
(APARTADO TEÓRICO 3)
e) Teniendo en cuenta que al analizar el ítem 5 hemos constatado que hay 50 varones frente a 30
mujeres que aciertan ese ítem, queremos averiguar presenta un DIF significativo en función del género
en el sentido de que perjudica a las mujeres. Para ello, categorizamos los resultados del test en tres
grupos: Bajo: Por debajo del Centil 33; Medio: Entre el centil 33 y 66; Alto: Por encima del centil 66; y
llevamos a cabo un recuento de las frecuencias de ambos grupos de sujetos en cada uno de esos
niveles de habilidad. ¿Qué podemos concluir al respecto? (APARTADO TEÓRICO 4.2)
Nivel Bajo
Grupo Correctas Incorrectas Totales
Referencia Varones 10 20
Focal Mujeres 06 09
Totales 45
Nivel Medio
Grupo Correctas Incorrectas Totales
Referencia Varones 17 13
Focal Mujeres 12 08
Totales 50
Nivel Alto
Grupo Correctas Incorrectas Totales
Referencia Varones 23 07
Focal Mujeres 12 03
Totales 45