Está en la página 1de 33

Tema 3

Psicometría

Análisis de los ítems


Índice
Esquema 3

Ideas clave 4
3.1. ¿Cómo estudiar este tema? 4
3.2. Análisis de la respuesta correcta: índice de
dificultad, discriminación y validez 5
3.3. Análisis de las opciones incorrectas 20
3.4. Corrección de los aciertos al azar 23
© Universidad Internacional de La Rioja (UNIR)

3.5. Referencias bibliográficas 26

Lo + recomendado 27

+ Información 29

Test 31
© Universidad Internacional de La Rioja (UNIR)

ANÁLISIS DE LOS ÍTEMS

Análisis de la respuesta correcta Análisis de la opciones incorrectas

Índice de dificultad PATRÓN IDEAL


• Cuantifica la dificultad de un ítem. - Se elija en mayor porcentaje la correcta.
• Puede ser corregido o sin corregir. - Se elijan los distractores menos que la correcta y en
• Toma valores en 0 y 1. igual porcentaje.
• Valores de 0,5 se maximiza la varianza. - A mayor capacidad, más elección de la correcta y
• Depende de la muestra. menos los distractores.
Índice de discriminación
• Varianza de los ítems.
Posibles respuestas
• Proporción de aciertos.
• Correlación ítem-test:
• Correlación de Pearson.
• Correlación biserial-puntual. CONOCE ACIERTA
• Correlación biserial.

ACIERTO:
Índice de validez 1/K
• Relaciona el ítem con un criterio externo. RESPUESTA
AZAR

ERROR:
1-1/K
DESCONOCE

OMISIÓN

Psicometría
Tema 3. Esquema
Esquema

3
Ideas clave

3.1. ¿Cómo estudiar este tema?

Para estudiar este tema, deberás leer con atención las ideas clave que se desarrollan a
continuación.

E
n este tema se estudian los diferentes modos de analizar los ítems de una
prueba psicométrica. Una vez que se ha construido la versión provisional de
la prueba, debemos analizar las características psicométricas de los ítems
para ver cuáles deben ser eliminados o depurados con el fin de formar la prueba
definitiva.

En primer lugar, se estudiarán tres índices para analizar la respuesta correcta a un


test de rendimiento óptimo: índice de dificultad, índice de discriminación e índice de
validez. Después, se verán los diferentes modos de estudiar las respuestas que se dan
a las alternativas incorrectas o distractores. Y finalmente, estudiaremos cómo se
pueden corregir las respuestas dadas al azar a ítems de rendimiento óptimo para
evitar que se sobreestime la puntuación.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
4
Tema 3. Ideas clave
3.2. Análisis de la respuesta correcta: índice de
dificultad, discriminación y validez

U
na vez que hemos construido los ítems de un test, basándonos en
aspectos teóricos y lógicos para que midan el constructo teórico que
reflejan, debemos ver si cada ítem de la prueba es un buen indicador del
rasgo. Para ello debemos seleccionar una muestra representativa a la que
apliquemos la prueba y nos permita depurarla.

El modo de comprobar esto es analizar la dificultad, discriminación u homogeneidad


y validez del ítem. A estos tres índices se les llama indicadores de calidad del ítem y
sirven para determinar si este formará parte definitivamente de la prueba o será
eliminado.

Índice de dificultad

Sirve para cuantificar el grado de dificultad de un ítem de rendimiento óptimo. En el


caso de que queramos calcularlo sin penalizar los errores o fallos a un ítem
dicotómico emplearemos fórmula de dificultad sin corregir:

𝐴𝑗
𝑝𝑗 =
𝑁𝑗

Donde Aj es número de aciertos a todos los ítems de la prueba y Nj es el número de


personas que ha respondido la prueba.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
5
Tema 3. Ideas clave
Cuando queramos corregir los errores, es decir, penalizar a aquellos evaluados que
responden al azar a un ítem dicotómico, debemos emplear la fórmula de dificultad
corregida en la que se asume que todas las alternativas tienen la misma probabilidad
de ser elegidas y que las personas que se equivocan no conocen la respuesta correcta:

𝐹𝑗 𝐹𝑗
𝑁 𝐴𝑗 −
𝑝𝑗𝑐 = 𝑝𝑗 −
𝑗
= 𝑘−1
𝑘−1 𝑁𝑗

Donde:
 pj es la dificultad sin corregir del ítem.
 Fj es el número fallos o errores cometidos en el ítem.
 Nj es el número de personas que ha respondido la prueba.
 k es el número alternativas de respuesta que presenta el ítem.
 Aj es número de aciertos a todos los ítems de la prueba.

Ejemplo 1

En la siguiente tabla aparecen los aciertos (1), fallos (0) y


omisiones (en blanco) a seis ítems dicotómicos de diez sujetos
evaluados en una prueba atencional. A partir de estos datos se
podría calcular el índice de dificultad sin corregir los errores y
corrigiendo los mismos.

En la columna de la derecha (X) aparece la puntuación total en


la prueba obtenida, sumando los aciertos de cada sujeto a los
seis ítems. Con estos datos podemos calcular la dificultad
corregida y sin corregir de cada ítem.

Sujetos Ítem 1 Ítem 2 Ítem 3 Ítem 4 Ítem 5 Ítem 6 X


© Universidad Internacional de La Rioja (UNIR)

1 0 0 0 1 1 1 3

2 0 1 0 1 2

3 0 0 1 0 1 2

4 0 0 0 1 1 2

Psicometría
6
Tema 3. Ideas clave
5 0 1 0 1 1 3

6 0 1 1 2

7 0 0 1 1 1 3

8 0 0 1 0 1

9 0 1 0 0 1 2

10 0 1 0 1 0 1 2

Tabla 1. Respuestas de diez sujetos a seis ítems dicotómicos.

Para calcular la dificultad sin corregir de cada ítem empleamos el siguiente


procedimiento: calculamos, por columnas, los aciertos a cada ítem (Aj), el número de
sujetos que ha respondido cada ítem (Nj) y luego aplicamos la fórmula de dificultad
sin corregir.

Por ejemplo, para el ítem 1 y 3 el resultado sería el siguiente:

𝐴1 0
𝑝1 = = =0
𝑁1 10
𝐴3 2
𝑝3 = = = 0,29
𝑁3 7

Para calcular la dificultad corregida de cada ítem empleamos el siguiente


procedimiento: calculamos para cada ítem, por columnas, el índice de dificultad sin
corregir (pj), los fallos a cada ítem (Fj), el número de sujetos que ha respondido cada
ítem (Nj) y luego aplicamos la fórmula de dificultad corregida, teniendo en cuenta el
número de alternativas de cada ítem (k). Por ejemplo, para el ítem 1 y 3 el resultado
sería el siguiente:
© Universidad Internacional de La Rioja (UNIR)

𝐹1 10
𝑁
𝑝1𝑐 = 𝑝1 − 1
= 0 − 10 = 0 − 1 = −1 = 0
𝑘−1 2−1
𝐹3 5
𝑁
𝑐
𝑝3 = 𝑝3 − 3
= 0,29 − 7 = 0,29 − 0,71 = −0,42 = 0
𝑘−1 2−1

Psicometría
7
Tema 3. Ideas clave
En esta segunda tabla se pueden ver los índices para el resto de ítems. Nótese que
cuando no hay fallos, como el caso del ítem 6, el resultado con ambas fórmulas es
igual. Y cuando los errores restan, si el resultado es negativo, se pone el valor de 0,
ya que la dificultad no puede ser negativa.

Sujetos Ítem 1 Ítem 2 Ítem 3 Ítem 4 Ítem 5 Ítem 6 X

1 0 0 0 1 1 1 3

2 0 1 0 1 2

3 0 0 1 0 1 2

4 0 0 0 1 1 2

5 0 1 0 1 1 3

6 0 1 1 2

7 0 0 1 1 1 3

8 0 0 1 0 1

9 0 1 0 0 1 2

10 0 1 0 0 1 2

Aj 0 5 2 3 3 9

Nj 10 10 7 4 7 9

pj 0 0,5 0,29 0,75 0,43 1

Fj 10 5 5 1 4 0

pcj 0 0 0 0,50 0 1

Tabla 2. Cálculo de dificultad sin corregir y corregida.


© Universidad Internacional de La Rioja (UNIR)

Psicometría
8
Tema 3. Ideas clave
Las características que tiene el índice de dificultad para ítems dicotómicos son las
siguientes (Abad, Olea, Ponsoda y García, 2011):

 Toma valores entre 0 (cuando se fallan todos los ítems) y 1 (cuando se aciertan
todos). Cuanto más se aproxime a 0, más difícil será el ítem y cuanto más se
acerque a 1, más fácil. Por lo que un ítem con una dificultad media tendrá un valor
de 0,5.

 Su valor depende de las características de la muestra: una muestra con un nivel


de rasgo muy alto tenderá a acertar muchos ítems y una muestra con un nivel de
rasgo muy bajo tenderá a fallar casi todos los ítems.

 Se relaciona con la varianza del ítem. Si la dificultad es 0 o 1, la varianza de un ítem


dicotómico será 0, ya que no habrá variabilidad. Y la variabilidad máxima de un
ítem dicotómico se alcanzará con una dificultad media (0,5). La varianza se calcula
multiplicando la dificultad (pj) y el complementario (qj = 1 – pj), es decir:

𝜎 2 (𝑗) = 𝑝𝑗 × 𝑞𝑗

Por lo tanto, para una dificultad media la varianza será máxima y para otros valores
será menor. Por ejemplo, para tres ítems dicotómicos con los siguientes valores
de dificultad: p1 = 0,50; p2 = 0,25; y p3 = 0,10, se obtendrían los siguientes valores
de varianza:
• 𝜎 2 (1) = 𝑝1 × 𝑞1 = 0,50 × 0,50 = 0,2500
• 𝜎 2 (2) = 𝑝2 × 𝑞2 = 0,25 × 0,75 = 0,1875
• 𝜎 2 (3) = 𝑝3 × 𝑞3 = 0,10 × 0,90 = 0,900
© Universidad Internacional de La Rioja (UNIR)

 Se aconsejan emplear ítems con dificultad media, ya que presentan una mayor
varianza.

Psicometría
9
Tema 3. Ideas clave
 Se deben estudiar detenidamente aquellos ítems que tengan una dificultad
inferior a 0,20 y superior a 0,90, ya que serían demasiado difíciles o fáciles
respectivamente.

Cálculo con R Commander

Podemos calcular los índices de dificultad sin corregir (pi) y varianza (σ2) de la tabla 1
del siguiente modo:

 Generamos la siguiente la base de datos en Excel de la tabla 1 y la cargamos con R


Commander como ya vimos en un tema anterior.
 Seguimos los pasos que se indican en las figuras 1, 2, 3 y 4.

La salida de resultados ofrece la media (mean) de cada ítem, que sería la dificultad
sin corregir del ítem, y la desviación típica, que elevándola al cuadrado reflejaría la
varianza de cada ítem. Por ejemplo, para el ítem 2 la desviación típica (sd) es de 0,53
que al elevarla al cuadrado toma un valor de 0,28 que es la varianza del ítem.

En el caso de ítems no dicotómicos, con valores que van más allá de 0 y 1, el modo
de calcular la dificultad es mediante la media del ítem, de tal modo que, a mayor
media, menor dificultad y a menor media, mayor facilidad de acertar el ítem.
© Universidad Internacional de La Rioja (UNIR)

Figura 1. Cálculo de dificultad y varianza con R Commander. Paso 1.


Fuente: http://cran.r-project.org

Psicometría
10
Tema 3. Ideas clave
Figura 2. Cálculo de dificultad y varianza con R Commander. Paso 2: seleccionamos todos los ítems.
Fuente: http://cran.r-project.org

Figura 3. Cálculo de dificultad y varianza con R Commander.


Paso 3: marcamos la media y desviación típica. Fuente: http://cran.r-project.org
© Universidad Internacional de La Rioja (UNIR)

Figura 4. Cálculo de dificultad y varianza con R Commander. Salida. Fuente: http://cran.r-project.org

Psicometría
11
Tema 3. Ideas clave
Índice de discriminación u homogeneidad

Indica la discriminación de un ítem entre las personas que tienen valores altos y bajos
en un constructo de interés. Por ejemplo, las personas con un nivel de atención alto
deberán tener características diferentes de las que tienen un nivel atencional bajo.

Hay varios índices de discriminación:

Varianza de los ítems

Es un índice de en el que a mayor varianza, mayor será la discriminación entre las


personas que puntúan alto y bajo en el rasgo.

Proporción de aciertos

Se usa en el caso de ítems dicotómicos y consiste en calcular la proporción de aciertos


del grupos superior e inferior y restarlas (ver fórmula de proporción). El grupo
superior es aquel que acierta el ítem en un 67 % o más, y el grupo inferior, el que
acierta el ítem como mucho un 33 %. Si bien se han planteado otros porcentajes como
25 % y 75 % para diferenciar entre el grupo inferior y superior respectivamente.

Dj = ps - pi

Donde:
 ps es la proporción de sujetos que acierta el ítem del grupo superior.
 pi es la proporción de sujetos de acierta el ítem del grupo inferior.
 Dj: toma valores entre [-1, +1] de tal manera que:
© Universidad Internacional de La Rioja (UNIR)

• Dj > 0: discriminación a favor del grupo superior.


• Dj < 0: discriminación invertida a favor del grupo inferior.
• Dj ≥ 0,40: discriminación satisfactoria.
• 0,30 ≤ Dj ≤ 0,39: discriminación aceptable.
• 0,20 ≤ Dj ≤ 0,29: discriminación pobre, deberíamos revisar el ítem.

Psicometría
12
Tema 3. Ideas clave
• Dj ≤ 0,19: discriminación muy pobre, deberíamos eliminar el ítem.

Correlación ítem-test

Consiste en calcular la correlación de un ítem con el total de la prueba, generalmente


obtenida con la suma de los diferentes ítems. Hay tres procedimientos en función del
tipo de ítem y test que tengamos:

 Correlación de Pearson (𝑟𝑥𝑦 ): cuando tanto el ítem como el test son cuantitativos.

𝜎𝑥𝑦
𝑟𝑥𝑦 =
𝜎𝑥 𝜎𝑦

Donde:
• 𝜎𝑥𝑦 es la covarianza entre el ítem (Y) y el test (X).

• 𝜎𝑥 es la desviación típica del test.


• 𝜎𝑦 es la desviación típica del ítem.

 Correlación biserial-puntual (rbp): cuando el ítem es dicotómico y el test


cuantitativo.

𝑥̅𝐴 − 𝑥̅ 𝑝 𝑥̅𝐴 − 𝑥̅𝐸


𝑟𝑏𝑝 = √ = √𝑝𝑞
𝑆𝑥 𝑞 𝑆𝑥

Donde:
• 𝑥̅ E es la covarianza entre el ítem (Y) y el test (X).
• 𝑥̅ A es la desviación típica del test.
• 𝑥̅ y Sx es la desviación típica del ítem.
© Universidad Internacional de La Rioja (UNIR)

 Correlación biserial (rb): cuando el ítem es dicotomizado artificialmente y el test


cuantitativo. Un ítem dicotomizado es aquel que inicialmente es cuantitativo (por
ejemplo, toma valores de 0 a 10) y se convierte en dicotómico (0 y 1) estableciendo

Psicometría
13
Tema 3. Ideas clave
un punto de corte: las puntuaciones de 0 a 4 se convierten en 0 y las de 5 a 10 en
1.

𝑥̅𝐴 − 𝑥̅ 𝑝 𝑥̅𝐴 − 𝑥̅𝐸 𝑝𝑞


𝑟𝑏 = ∗ = ∗
𝑆𝑥 𝑦 𝑆𝑥 𝑦

Donde 𝑦 es la ordenada de la distribución normal que deja por debajo la 𝑝.

Si comparamos la correlación biseral-puntual con la biserial podemos extraer las


siguientes conclusiones (Abad et al., 2011):
 Los dos tipos de correlaciones toman valores entre -1 y 1, al igual que la
correlación de Pearson.
 La rb puede tomar valores mayores de 1 e inferiores a -1 en el caso de que la
distribución del ítem sea muy asimétrica, lo que reflejaría que se trata de un mal
ítem.
 Se habla de una discriminación positiva cuando los valores son próximos a 1 y
significa que el grupo de mayor nivel de rasgo tiende a acertar el ítem.
 Se habla de una discriminación negativa cuando los valores son próximos a -1 y
quiere decir que el grupo de menor nivel de rasgo tiende a acertar el ítem, lo que
reflejaría que se trata de un ítem que se debe eliminar o bien reformularlo.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
14
Tema 3. Ideas clave
Ejemplo 2

En la siguiente tabla aparecen los aciertos a tres tipos de ítems:


cuantitativo (1), dicotómico (2) y dicotomizado (3). En la
columna de la derecha (X) aparece la puntuación total en la
prueba obtenida sumando los aciertos de cada sujeto a los tres
ítems. Con estos datos podemos calcular la discriminación de los
tres ítems con el procedimiento de correlación ítem-test.

Ítem 1 Ítem 2 Ítem 3


Sujetos (cuantitativo) (dicotómico) (dicotomizado) X

1 2 1 1 4

2 3 1 0 4

3 5 0 1 6

4 0 1 0 1

5 4 0 0 4

Tabla 3. Respuestas de cinco sujetos a tres ítems de diferente formato.

En el caso del ítem 1, al tratarse de cuantitativo debemos calcular la correlación de


Pearson, para ello tendremos que obtener la desviación típica del ítem y la prueba
(X) y la covarianza entre ambos y después aplicar su fórmula:

𝜎𝑥𝑦 3,2
𝑟𝑥𝑦 = = ∗ 1,79 = 0,93
𝜎𝑥 𝜎𝑦 1,92
© Universidad Internacional de La Rioja (UNIR)

Psicometría
15
Tema 3. Ideas clave
Cálculo con R Commander

Para calcular la correlación de Pearson de dos variables cuantitativas (ítem 1 y X)


podemos seguir los pasos que se indican en las figuras 5, 6 y 7. Naturalmente, antes
debemos crear la base de datos en Excel de estas dos variables y cargarlas con R
Commander.

La salida ofrece la correlación del ítem 1 y X en forma de matriz en la que en la


diagonal principal aparece la correlación entre cada variable consigo misma por eso
toma un valor de 1.

Figura 5. Cálculo de correlación de Pearson con R Commander. Paso 1.


Fuente: http://cran.r-project.org
© Universidad Internacional de La Rioja (UNIR)

Figura 6. Cálculo de correlación de Pearson con R commander. Paso 2.


Fuente: http://cran.r-project.org

Psicometría
16
Tema 3. Ideas clave
Figura 7. Cálculo de correlación de Pearson con R commander. Salida.
Fuente: http://cran.r-project.org

Para el ítem 2 tendremos que calcular la correlación biserial-puntual ya que el ítem


es dicotómico. En primer lugar, debemos calcular la desviación típica del ítem;
después, la proporción de aciertos (𝑝) y errores (𝑞) y después la media de los aciertos
o errores en el test para este ítem. En el caso de la media de los aciertos, como se
puede ver en la siguiente tabla, aciertan el ítem los sujetos 1, 2 y 3, por lo que la
media en la prueba será 3 (en azul); la media de los errores en la prueba de los que
fallan, sujetos 3 y 5, es 5 (en negro):

Ítem 2
Sujetos (dicotómico) X

1 1 4

2 1 4

3 0 6

4 1 1

5 0 4

Media aciertos (4 + 4 + 1)/3 = 3

Media errores (6 + 4)/2 = 5

Tabla 4. Cálculo de las respuestas al ítem dicotómico.


© Universidad Internacional de La Rioja (UNIR)

Psicometría
17
Tema 3. Ideas clave
Aplicando la fórmula de correlación biserial-puntual obtenemos un índice de
discriminación negativo, lo que reflejaría que es un ítem que discrimina al revés de lo
esperado por lo que debería ser eliminado:

𝑥̅𝐴 − 𝑥̅𝐸 3 −5
𝑟𝑏𝑝 = √𝑝𝑞 = √0,6 × 0,4 = −0,55
𝑆𝑥 1,79

Finalmente, para el ítem 3, al haber sido dicotomizado, debemos calcular la


correlación biserial aplicando su fórmula correspondiente. Los cálculos son similares
a la correlación biserial-puntual salvo por la 𝑦, que la debemos obtener de una tabla
normal que tenga la ordenada. En concreto para la 𝑝 de este ítem (0,4) la ordenada
𝑦 toma un valor de 0,3867. Según estos valores, la correlación biserial presentaría un
valor positivo, lo que reflejaría que discrimina a favor del grupo que puntúa más en
el rasgo evaluado:

𝑥̅𝐴 − 𝑥̅𝐸 𝑝𝑞 5 − 3 0,4 × 0,6


𝑟𝑏𝑝 = ∗ = ∗ = 0,69
𝑆𝑥 𝑦 1,79 0,3867

Criterio externo

Aunque los índices de discriminación se han presentado como correlaciones entre


ítems y el test, también se pueden calcular correlacionando el ítem con un criterio
externo (otra prueba relacionada con el test).

En estos casos, en función de si el ítem y el criterio son o no cuantitativos, se pueden


emplear varios tipos de índices (Martínez, Hernández y Hernández, 2006; Martínez
Arias, 1996):
© Universidad Internacional de La Rioja (UNIR)

 Correlación de Pearson: cuando el ítem y el criterio son cuantitativos.


 Correlación biserial-puntual: cuando el ítem es dicotómico y el criterio
cuantitativo.
 Correlación biserial: cuando el ítem es dicotomizado y el criterio cuantitativo.

Psicometría
18
Tema 3. Ideas clave
 Coeficiente Ø: cuando tanto el ítem como el criterio son dicotómicos.
 Correlación tetracórica: cuando el ítem y el criterio son dicotómizados y con
distribución normal bivariante.

Índice de validez

Es un índice que se obtiene correlacionando un ítem con un criterio externo, una


medida diferente al test al cual pertenece el ítem.

El criterio es aquella medida que se trata de predecir a partir del ítem.

Por ejemplo, si tenemos un test de inteligencia y una medida de rendimiento


académico (criterio), la correlación entre cualquier ítem de la prueba de inteligencia
y el rendimiento académico reflejaría el índice de validez de esos ítems. El modo de
interpretar este índice sería:

 Los ítems con un índice de validez bajo tendrán baja correlación con el criterio y
se deberían eliminar de la prueba, ya que no contribuyen a predecir el criterio y
por lo tanto tenderían a bajar la validez del rasgo psicológico.
 Los ítems con un índice de validez alto presentarían una alta correlación con el
criterio y un índice de discriminación bajo, por lo que contribuirían a incrementar
la validez de la prueba.

El índice de validez se calcula mediante la correlación de Pearson entre el ítem y el


criterio en aquellos casos en los que ambos son cuantitativos. Para otras opciones se
pueden usar los mismos estadísticos que se han explicado para los cálculos de los
índices de discriminación.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
19
Tema 3. Ideas clave
3.3. Análisis de las opciones incorrectas

E
l análisis de las diferentes opciones de respuesta en tu test de rendimiento
óptimo permite ver qué patrones han seguidos los evaluados a la hora de
responder y si estos patrones son adecuados. Este análisis se suele realizar
principalmente en aquellos ítems de elección múltiple, es decir, con más de dos
opciones de respuesta.

El patrón ideal en una prueba de rendimiento óptimo con varias opciones de


respuesta y solo una correcta, si el ítem está bien planteado, es que:

 La alternativa correcta sea la más escogida.


 Los distractores (respuestas incorrectas) se elijan menos que la correcta, pero en
igual proporción.

Ítem Opción correcta Respuestas

A B C D

1 B 20 40 20 20

2 C 30 35 20 35

3 A 25 25 25 25

4 D 5 30 5 60

5 B 10 40 40 10

Tabla 5. Porcentaje de respuestas a cada alternativa de cinco ítems.

En esta tabla aparecen ejemplos de diferentes patrones de respuesta:


© Universidad Internacional de La Rioja (UNIR)

 El ítem 1 presenta un patrón ideal, ya que la alternativa correcta (B) es la más


elegida (40 %) y el resto de alternativas se eligen menos que la correcta y en igual
proporción (20 %).

Psicometría
20
Tema 3. Ideas clave
 El ítem 2 es un ítem que debería ser eliminado, ya que la alternativa correcta (C)
es la menos elegida (20 %).
 El ítem 3 es un ítem que debería reformularse, ya que se eligen por igual las cuatro
alternativas.
 El ítem 4 también debería reformularse porque, aunque la alternativa correcta (D)
se elige más que los distractores, hay dos distractores que se eligen muy poco (A
y C).
 Y el ítem 5 se debe reformular también al elegirse la alternativa correcta (B) en
igual proporción que un distractor (C).

Siguiendo a Abad et al. (2011), el estudio de las respuestas a las diferentes opciones
de respuesta nos debería llevar a tomar las siguientes decisiones:
 Eliminar o reformular los distractores que apenas son elegidos.
 No debería preocuparnos que los distractores sean elegidos en igual proporción
por los evaluados.
 Que un ítem sea fallado por la mayoría de los evaluados no implica que esté mal
formulado, aunque deben ser analizados para detectar a qué se puede deber. Por
ejemplo, un ítem difícil presentado a un grupo con un nivel de rasgo bajo es muy
probable que se falle en una alta proporción.
 Si un distractor es muy elegido en comparación con el resto de alternativas,
deberíamos reformular ese distractor o bien plantearnos si quizá sea la opción
correcta.

También podemos analizar las alternativas de respuesta empleando una


representación gráfica. Para ello debemos dividir las respuestas a cada alternativa del
ítem en función del nivel de rasgo de los participantes: bajo, medio y alto. El patrón
ideal sería el siguiente:
© Universidad Internacional de La Rioja (UNIR)

 A mayor nivel de rasgo, más se debería elegir la opción correcta y menos los
distractores.
 Los distractores se deberían elegir siempre menos que la opción correcta.

Psicometría
21
Tema 3. Ideas clave
 Los distractores se deberían elegir en una proporción similar en todos los niveles
de rasgo.

En los siguientes gráficos se puede ver como:

 El ítem 2 presenta un patrón ideal.


 El ítem 1 debería reformularse porque en el grupo 1 de evaluados hay un distractor
(3) que se elige más que la correcta (1).
 El ítem 3 debería eliminarse porque hay distractor (2) que se elige en todos los
niveles de rasgo más que la alternativa correcta (3).

C O R R E C TA 1 C O R R E C TA 2

C O R R E C TA 3

Figura 8. Representación gráfica de las respuestas de tres niveles de capacidad a ítems de tres alternativas
© Universidad Internacional de La Rioja (UNIR)

Psicometría
22
Tema 3. Ideas clave
3.4. Corrección de los aciertos al azar

S
upongamos que tenemos un test con opciones múltiples de respuesta en la
que solo una respuesta es correcta, podría sobreestimarse la puntuación
directa de una persona, si alguno de sus aciertos se debe al efecto del azar,
es decir, elegir la alternativa correcta no porque la conozca, sino de forma azarosa.

A la hora de responder un ítem de elección múltiple y con una sola respuesta correcta
hay varias posibilidades:

 Conocer la respuesta y acertar. Es lo ideal.


 Desconocer la respuesta y no responder. También es lo ideal.
 Desconocer la respuesta y responder al azar y fallar. Si se falla no sucede nada,
porque la puntuación no se sobreestima.
 Desconocer la respuesta y responder al azar y acertar. Esto supone un problema
porque se sobreestimará la respuesta de esa persona.

CONOCE ACIERTA

RESPUESTA ACIERTO:
1/K
AZAR

DESCONOCE
ERROR:
1-1/K
OMISIÓN
© Universidad Internacional de La Rioja (UNIR)

Figura 9. Opciones de respuesta a un ítem de elección múltiple con una alternativa correcta.

Por esta razón, en los ítems de rendimiento óptimo con varias alternativas de
respuesta debemos corregir esta posibilidad penalizando los errores.

Psicometría
23
Tema 3. Ideas clave
En concreto la probabilidad de acertar un ítem al azar sin conocer la respuesta es
igual a 1/𝑘, donde 𝑘 es el número de alternativas del ítem. Evidentemente, a mayor
número de alternativas, más complicado será acertar al azar un ítem. De manera
complementaria, la probabilidad de equivocarse al responder un ítem al azar sin
conocer la respuesta es 1- 1/𝑘. Esta probabilidad siempre es mayor que la
probabilidad de acertar al azar, salvo en el caso de ítems de dos alternativas de
respuesta.

La fórmula de corrección al azar es la siguiente:

𝐸
𝑥𝑐 = 𝐴 −
𝑘−1

Donde:
 𝐴 son los aciertos al test.
 𝐸 son los errores al test.
 𝑘 es el número de alternativas de la prueba.

La fórmula de corrección del azar se aplica bajo los siguientes supuestos:

 La persona que se equivoca al responder un ítem lo hace porque responde al azar.


 Si se responde al azar, la corrección quita al evaluado, como media, lo que gana al
responder al azar.
 Si no se responde al azar porque se descarta alguna alternativa incorrecta, la
corrección quita menos de lo que se gana al responder al azar.

El problema que tiene la fórmula de corrección al azar es que no contempla la


© Universidad Internacional de La Rioja (UNIR)

posibilidad de que una persona, al equivocarse al responder un ítem por elegir un


distractor, se deba a porque está convencido de que la opción correcta es ese
distractor.

Psicometría
24
Tema 3. Ideas clave
La fórmula beneficia a quienes responden solo los ítems que verdaderamente
conocen y no se arriesgan al responder.

En contraposición a la fórmula corregida está la fórmula sin corregir, que equivaldría


directamente a los aciertos en la prueba (A) y que por lo tanto no penalizaría los
errores. En la siguiente tabla se pueden ver las diferencias que hay a la hora de aplicar
ambas fórmulas a un test de diez ítems.

Puntuación
Sujetos Aciertos Errores Omisiones
corregida

1 7 2 1 6,33

2 5 5 0 3,75

3 2 6 2 0,50

4 5 0 5 5,00

5 6 0 4 6,00

Tabla 6. Cálculo de la puntuación corregida y sin corregir al azar de un test con cuatro alternativas.

El sujeto 1 tendría una puntuación sin corregir de 7 y corregida de:

𝐸 2
𝑥𝑐 = 𝐴 − =7− = 6,3
𝑘−1 4−1

El sujeto 2 tendría una puntuación sin corregir de 5 y corregida de:

𝐸 5
𝑥𝑐 = 𝐴 − =5− = 3,7
𝑘−1 4−1
© Universidad Internacional de La Rioja (UNIR)

El sujeto 3 tendría una puntuación sin corregir de 2 y corregida de:

𝐸 6
𝑥𝑐 = 𝐴 − =2− = 0,5
𝑘−1 4−1

Psicometría
25
Tema 3. Ideas clave
El sujeto 4 y 5 tendrían la misma puntuación sin corregir y corregida, ya que no tienen
errores.

Si comparamos el sujeto 2 y 4, podemos ver como al sujeto 2 lo han penalizado


mucho los errores teniendo la misma puntuación sin corregir en ambos casos. Es
decir, si no corrigiéramos la puntuación en este caso, los dos sujetos obtendrían la
misma puntuación en el test, a pesar de que uno se equivocó en cinco ítems.

Evidentemente, en el caso de que el número de alternativas del test fuera menor, los
errores penalizarían más y sería mucho más arriesgado contestar al azar.

3.5. Referencias bibliográficas

Abad, F. J., Olea, J., Ponsoda, V. y García, C. (2011). Medición en ciencias sociales y de
la salud. Madrid: Síntesis.

Martínez, R. (1996). Psicometría: teoría de los tests psicológicos y educación. Madrid:


Síntesis.

Martínez, R., Hernández, M. H. y Hernández, M. V. (2006). Psicometría. Madrid:


Alianza Editorial.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
26
Tema 3. Ideas clave
Lo + recomendado

Lecciones magistrales

Análisis de los ítems

En esta lección magistral se explican los diferentes tipos de análisis que se deben
hacer para depurar una prueba eliminando o reformulando aquellos ítems que no
miden adecuadamente el rasgo que se trata de medir. Los índices son: dificultad,
discriminación y validez. Además, se explica cómo se analizan las diferentes opciones
de respuesta y cómo corregir las respuestas al azar.

Accede a la lección magistral a través del aula virtual

No dejes de leer

Evaluación de test editados en España


© Universidad Internacional de La Rioja (UNIR)

Múñiz, J., Fernández-Hermida, J. R., Fonseca-Pedrero, E., Campillo-Álvarez, Á. y Peña-


Suárez, E. (2011). Evaluación de test editados en España. Papeles del psicólogo, 32(2),
113-128.

Psicometría
27
Tema 3. Lo + recomendado
En este documento se presentan las primeras evaluaciones de test editados en
Españas llevadas a cabo con un modelo de evaluación desarrollado por la Comisión
Europea de Test y adaptado al contexto español.

Accede al documento a través del aula virtual o desde la siguiente dirección web:
http://www.papelesdelpsicologo.es/pdf/1947.pdf

No dejes de ver

Análisis de ítems: índice de discriminación

Este vídeo contiene una breve presentación sobre un ejercicio práctico del análisis de
ítems mediante índices de discriminación.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=fhrnEDJp2V0
© Universidad Internacional de La Rioja (UNIR)

Psicometría
28
Tema 3. Lo + recomendado
+ Información

A fondo

50 años de los inventarios de depresión de Beck

Sanz, J. (2013). 50 años de los inventarios de depresión de Beck: consejos para la


utilización de la adaptación española del BDI-II en la práctica clínica. Papeles del
psicólogo, 34(3), 161-168.

Este artículo describe las diferentes adaptaciones que se han realizado del inventario
de depresión de Beck en España, indicando sus propiedades psicométricas más
relevantes.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.papelesdelpsicologo.es/pdf/2275.pdf

Webgrafía

Análisis de los ítems. Orientaciones

En Psikipedia se podrá acceder a contenido complementario de análisis de ítems.


© Universidad Internacional de La Rioja (UNIR)

Accede a la página web a través del aula virtual o desde la siguiente dirección web:
https://psikipedia.com/libro/psicometria/2754-analisis-de-los-items

Psicometría
29
Tema 3. + Información
Bibliografía

Abad, F. J., Olea, J., Ponsoda, V. y García, C. (2011). Construcción de tests y análisis
de ítems. En Medición en ciencias sociales y de la salud (pp. 38-69). Madrid: Síntesis.

Martínez, R., Hernández, M. H. y Hernández, M. V. (2006). Teoría clásica de los test


(TCT) II: puntuaciones, análisis de elementos, consideraciones finales. En Psicometría
(pp. 79-78). Madrid: Alianza Editorial.

Martínez Arias, R. (1996). Análisis convencional de los elementos o ítems del test. En
Psicometría: teoría de los tests psicológicos y educación (pp. 541-575). Madrid:
Síntesis.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
30
Tema 3. + Información
Test
1. Según los valores que puede tomar el índice de dificultad:
A. Valores cercanos a 1 son lo ideal para ítems difíciles.
B. Se recomiendan valores cercanos a 0 para los ítems.
C. Un ítem NO puede tener una dificultad negativa.

2. Un ítem dicotómico que presenta una varianza máxima tendrá una dificulta de:
A. 0,5.
B. 1.
C. 0.

3. Según la siguiente tabla, ¿cuál es el ítem más fácil?

Sujetos Ítem 1 Ítem 2 Ítem 3 Ítem 4 Ítem 5 Ítem 6

1 1 1 0 1

2 1 1 1 1 1 0

3 0 1 0 0 0 0

4 1 1 0 0

5 1 1 0 1 0 0

6 0 1 1 0 0 0

A. Ítem 3.
B. Ítem 1.
© Universidad Internacional de La Rioja (UNIR)

C. Ítem 2.

Psicometría
31
Tema 3. Test
4. Según la tabla de la pregunta 3. ¿cuál es el ítem que más discriminación presenta?
A. Ítem 4.
B. Ítem 2.
C. Ítem 5.

5. Según la tabla de la pregunta 3. ¿cuál es el ítem presenta una dificultad media?


A. Ítem 2.
B. Ítem 4.
C. Ítem 5.

6. Según la tabla de la pregunta 3. ¿cuál sería la dificultad del ítem 5?


A. 0,75.
B. 0,17.
C. 0,25.

7. ¿Qué se tiene que cumplir para que una persona obtenga en un test de
rendimiento óptimo la misma puntuación corrigiendo los aciertos al azar y no
corrigiéndolos?
A. Que acierte la mitad y falle la otra mitad.
B. Que no cometa errores.
C. Que no deje preguntas en blanco.

8. Indica qué problema presenta el hecho de no corregir las respuestas al azar en los
test de rendimiento óptimo:
A. La puntuación del test se puede sobreestimar.
B. La puntuación del test sería demasiado baja.
C. La puntuación del test se puede infraestimar.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
32
Tema 3. Test
9. ¿Cuál es el patrón de resultados ideal que se debe dar en un ítem de rendimiento
óptimo con múltiples alternativas de respuesta?
A. Responder por igual a los distractores y a la correcta.
B. Responder más a la correcta y por igual a los distractores.
C. Responder por igual a los distractores y en mayor proporción que a la
correcta.

10. Dado un ítem cuantitativo que ha sido convertido en dicotómico de manera


artificial y un test cuantitativo, ¿qué índice sería el más adecuado para calcular la
discriminación del ítem?
A. Correlación de Pearson.
B. Correlación biserial-puntual.
C. Correlación biserial.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
33
Tema 3. Test

También podría gustarte