Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ndice
1. El contexto: las pruebas objetivas............................................................................. 2
2. Utilidad del anlisis de tems .................................................................................... 3
3. Anlisis estadsticos convencionales ........................................................................ 3
3.1. Anlisis referidos a toda la prueba ..................................................................... 4
3.1.1. El coeficiente de fiabilidad....................................................................... 4
3.1.2. El error tpico de las puntuaciones individuales ............................................ 5
3.2. Anlisis de cada alternativa en cada pregunta.................................................... 5
3.2.1. La correlacin tem-total.......................................................................... 5
3.2.2. La correlacin de cada alternativa con el total ....................................... 6
4. Anlisis de las diversas alternativas: tabulacin de las respuestas ............................ 6
5. Anlisis de cada tem: ndices de dificultad y discriminacin................................... 8
5.1. ndice de dificultad ............................................................................................. 9
5.2. ndices de discriminacin ................................................................................... 9
5.2.1. ndice de discriminacin 1 ....................................................................... 9
5.2.2. ndice de discriminacin 2 ....................................................................... 11
1 Ms informacin sobre el coeficiente de fiabilidad y el error tpico en Morales, Pedro La fiabilidad de los tests y
escalas. Madrid: Universidad Pontificia Comillas http://www.upco.es/personal/peter/estadisticabasica/Fiabilidad.pdf;
tambin publicado en el captulo 6 de Morales (2008). En este documento el apartado 11 est dedicado a las pruebas
escolares. Otros temas relacionados con las pruebas objetivas, como la adivinacin y diversas alternativas para corregir
estas pruebas, los tratamos en Morales, Pedro, Las pruebas objetivas: normas, modalidades y cuestiones discutidas
http://www.upcomillas.es/personal/peter/otrosdocumentos/PruebasObjetivas.pdf (ltima revisin, 17, Diciembre, 2006).
3 Un ejemplo comentado puede verse en la seccin IV de Case y Swanson (2006) (un excelente manual sobre pruebas
objetivas en medicina).
4 Pueden verse numerosos documentos sobre estos anlisis (poniendo item analysis en search) en The University of
Washington's Office of Educational Assessment, http://www.washington.edu/oea/
5 Estos anlisis referidos a escalas de actitudes (y tests en general) estn tratados en Morales (2011) y Morales, Urosa y
Blanco (2003).
Smbolos utilizados
N = nmero de sujetos en uno de los dos grupos AS = nmero de acertantes en el grupo superior
(los dos grupos tienen idntico nmero de (con puntuacin total ms alta)
sujetos) AI = nmero de acertantes en el grupo inferior
N + N = nmero total de sujetos analizados (con puntuacin total ms baja)
Tabla 2
5.1. ndice de dificultad
N-N
Si todos responden correctamente (pregunta muy fcil): Dc1 = =0
N
0-0
Si todos se equivocan (pregunta muy difcil): Dc1 = =0
N
Es decir, las preguntas muy fciles o muy difciles no discriminan, no establecen
diferencias; nos dicen que todos saben o no saben una pregunta, pero no quin sabe ms y
quin sabe menos. Estas preguntas no contribuyen a la fiabilidad, pero eso no quiere decir
necesariamente que sean malas preguntas (son malas para discriminar).
Si todos y solos los del grupo superior aciertan la pregunta: N-0
Dc1 = =1
N
Si acertaran solamente los del grupo inferior: 0N
Dc1 = = -1
N
Por lo tanto 1 y -1 son los valores mximos de este ndice. Las preguntas con
discriminacin negativa favorecen al grupo inferior y en principio deberan ser revisadas
(posibilidades: preguntas mal formuladas, ambiguas, error en la clave de correccin, etc.)
d) Las preguntas que discriminan mucho (diferencian bien a los que saben ms de los
que saben menos) no son muy difciles; tienden a ser de dificultad media (responde bien la
mitad de los sujetos analizados). En este caso (discriminacin mxima porque aciertan slo y
todos los del grupo superior) tendramos que el ndice de dificultad sera:
N0
Df = = .50
N+N
e) Una limitacin de este ndice est en que el valor mximo de 1 slo se alcanza
cuando aciertan todos los del grupo superior y se equivocan todos los del grupo inferior.
Puede haber preguntas que discriminan bien pero que son difciles (y fallan algunos del
grupo superior) o son fciles (y las aciertan algunos el grupo inferior). Por estas razones
algunos prefieren el otro ndice de discriminacin que expondremos a continuacin (Dc2),
aunque se pueden programar y utilizar los dos.
Valores mximos del ndice de discriminacin
Puede tener su inters conocer el valor mximo que puede alcanzar este ndice de
discriminacin. El valor mximo que puede tener de hecho este ndice depende de la
dificultad de la pregunta (frmulas en la tabla 3).
9+3
Si AS = 9 y AI = 3 tendremos que Df = = .60 (60% de aciertos)
10 + 10
93
Dc1 = = .60
10
El valor mximo de discriminacin, manteniendo los 12 aciertos, es el que hubiramos
obtenido si AS = 10 (todos los del grupo superior aciertan) y AI = 2 (los dos aciertos restantes
se los dejamos al grupo inferior). En este caso el ndice de discriminacin hubiera sido
10 2
Dc1 = = .80 [ 2 (1- .60) = .80]
10
El ndice mximo de discriminacin cuando han acertado menos de la mitad, es el que
hubiramos obtenido si todos los acertantes pertenecieran al grupo superior. En el mismo caso
anterior (una clase de 40 y N = 10), obtenemos estos resultados:
4+2
Si AS = 4 y AI = 2 tendremos que Df = = .30 (30% de aciertos)
10 + 10
42
Dc1 = = .20
10
El ndice mximo de discriminacin en este caso (han acertado menos de la mitad) es el
que hubiramos obtenido si todos los aciertos estuvieran en el grupo superior (AS = 6) y
todos los del grupo inferior se hubieran equivocado; el ndice de discriminacin hubiera sido:
60
Dc1 = = .60 [ 2 (.30) = .60]
10
Cuando el ndice de dificultad es .50 (acierta el 50%) las dos frmulas anteriores llevan
al mismo resultado, y el ndice mximo de dificultad es siempre 1.
No es fcil en la prctica establecer una magnitud ptima del ndice de discriminacin;
una buena orientacin es interpretar estos ndices en trminos relativos y examinar cules son
ms y menos discriminantes en una situacin dada.
5.2.2. ndice de discriminacin 2
Este ndice es menos utilizado; cuando se habla de ndice de discriminacin sin ms
especificaciones hay que entender que se trata del ndice anterior; sin embargo este segundo
ndice de discriminacin es tambin informativo.
muy fcil como si es muy difcil; de hecho se utiliza menos que el anterior pero tambin
aporta una buena informacin.
Vamos a verlo con dos ejemplos:
1 Suponemos una pregunta muy fcil; con N = 10 en cada grupo (superior e inferior, en
una clase de 40 alumnos), la aciertan los 10 del grupo superior y 9 del grupo inferior; los dos
ndices de discriminacin seran estos:
El nmero de tems del denominador es la diferencia mxima posible (la que habra
entre un sujeto que hubiera respondido bien a todos los tems y el que no hubiera respondido
a ninguno). Por lo tanto este ndice equivale a la diferencia mxima obtenida dividida por la