Actividades (Tema Nº 5)

Psicometría (Tema 5) Actividades y problemas resueltos (Tutor)
TEMA 5: La fiabilidad en los tests referidos a criterio (Preguntas de exámenes)
1.- Los tests referidos a criterio: A) combinan las puntuaciones del tests y del criterio; B) necesitan la utilización
de un grupo normativo; C) no requieren la utilización de un grupo normativo.
2.- Los tests referidos a criterio: A) son útiles para calcular los percentiles de los sujetos en la variable medida;
B) se utilizan para establecer estándares de rendimiento en dominios de interés; C) utilizan los mismos
métodos que los tests normativos para estimar la fiabilidad.
3.- Se han aplicado dos tests paralelos a una muestra de 75 sujetos. Sabemos que 40 de ellos han obtenido una
nota superior a la de corte en el primer test y 30 ha superado el segundo. Además, 30 sujetos han superado los
dos tests. La proporción pc de sujetos clasificados consistentemente es: A) 0,4; B) 0,6; C) 0,87
4.- Con los datos del problema anterior, el coeficiente Kappa de Cohen es igual a: A) 0,6; B) 0,22; C) 0,74
5.- El índice P* de Croker y Algina (1986) considera que la probabilidad mínima de una decisión consistente es:
A) 0,25; B) 0,50; C) 0,74
6.- Se presentaron 500 sujetos a unas pruebas de aptitud para colegiado arbitral, de los que sólo fueron
admitidos los 5 mejores. En la muestra total, el test se distribuye según una distribución normal con media 5 y
desviación típica 3. La puntuación directa mínima en el test para se seleccionado es: A) 10; B) 11; C) 12.
7.- Dos test que miden el mismo trastorno de personalidad han clasificado a los sujetos de la siguiente forma (0
significa no trastorno y 1 trastorno) (NC 95%)
Test B
1 0
Test A 0 3 12
1 9 1
A) El coeficiente Kappa de Cohen es estadísticamente significativo; B) el intervalo de confianza para dicho
coeficiente es 0,53 - 1; C) la frecuencia esperada por azar es 10,40
8.- Se está realizando una selección para cubrir una serie de vacantes de traductores. Hay 20 aspirantes a los
que se les pasa una prueba escrita de inglés. A continuación se les hace un examen práctico que consiste en una
traducción oral simultánea en un Congreso. Para ser admitido en la prueba práctica es necesario que los
aspirantes obtuvieran al menos un 8 en la escrita. De los 20 aspirantes, 6 superaron ambas pruebas, 2
superaron e punto de corte en la prueba escrita de inglés, pero fallaron en la traducción; 4 no llegaron al punto
de corte en la prueba escrita pero superaron la traducción simultánea y 8 fueron rechazados en ambas
pruebas.
La proporción de clasificaciones correctas es de: A) 0,70; B) 0,30; C) 0,75
9.- El coeficiente Kappa: A) puede ser mayor que la unidad; B) es un estimador de la consistencia en las
clasificaciones; C) representa las clasificaciones realizadas al azar.
10.- Se ha aplicado un test para seleccionar una serie de vendedores y se ha acordado que para ser considerado
APTO, la proporción de aciertos sea 0,75. La longitud del test si se está dispuesto a admitir un error máximo de
0,05 será: A) 57; B) 185; C) 75
11.- Los tests referidos a criterio: A) permiten conocer el nivel de los sujetos en relación a una muestra
representativa de la población; B) se utilizan, fundamentalmente, para evaluar las diferencias individuales en
relación a un rasgo; C) tienen como objetivo evaluar el nivel de los sujetos en relación a un dominio.
12.- En los tests referidos a criterio: A) es necesario contar con un grupo normativo; B) la selección de los
ítems depende de los objetivos del test y de la finalidad del mismo; C) es necesario utilizar más ítems que
en los tests referidos a normas.
13.- El coeficiente Kappa de Cohen puede ser utilizado como un indicador de: A) la consistencia interna del test;
B) la estabilidad de las puntuaciones; C) consistencia de la clasificación de los sujetos.
14.- La media de las puntuaciones de un test es de 6,5 y la desviación típica es 1,25. Si el coeficiente KR 21 = 0,90 y
el punto de corte se establece en 8, una estimación de la proporción, p c, de sujetos consistentemente clasificados
es: A) 0,5; B) 0,9; C) 0,31
15.- Con datos del problema anterior, una estimación del coeficiente Kappa de Cohen es: A) 0,5; B) 0,79; C) 0,7
1 2 3 4 5 6 7 8 9 10 11 12 13
C B C C B C A A B C C B C
14 15
1 de 10
B C
DESARROLLO (PREGUNTA Nº 3)
Se han aplicado dos tests paralelos a una muestra de 75 sujetos. Sabemos que 40 de ellos han obtenido
una nota superior a la de corte en el primer test y 30 ha superado el segundo. Además, 30 sujetos han
superado los dos tests. La proporción pc de sujetos clasificados consistentemente es:
Test A
Test B
Nota > corte Nota < corte ∑
Nota > corte 30 a 0b 30
Nota < corte 10 c 35 d 45
∑ 40 35 75
Coeficiente pc de Hambleton y Novick  La proporción de sujetos consistentemente clasificados en

ambos test se expresa:
n
n11 n 22 n
pc   pi    ......  mm  Pc = (30/75) +(35/75) =0,4 + 0,47= 0,87
i 1 N N N
pi = proporción de sujetos clasificados en ambas formas // N = número de sujetos
n11 , n22 ,.......nmm = número de sujetos en los que ambos tests coinciden al clasificarlos (a y d)
Con los datos del problema anterior, el coeficiente Kappa de Cohen es igual a:
El valor de Pa (proporción de clasificaciones consistentes que se espera por azar p a ), viene dado en
función de las frecuencias marginales de la tabla
m N jN j
pa    Pa = (30 · 40/752)+(45 · 35/752)= 0,213+0,28 = 0,493
j 1 N2
pc  p a
k   k = (0,87 -0,493) / (1 – 0,493) = 0,377 / 0,507 = 0,74 (Kappa de Cohen)
1  pa
El índice P* de Croker y Algina considera que la probabilidad mínima de una decisión consistente es:
Respuesta  El índice p* es una alternativa al coeficiente Kappa. Se basa en que la probabilidad
mínima de una decisión consistente es 0,50. Tiene lugar si las puntuaciones del test son
estadísticamente independientes y el punto de corte está en la mediana de la distribución conjunta de
las puntuaciones obtenidas en las dos aplicaciones.
Se presentaron 500 sujetos a unas pruebas de aptitud para colegiado arbitral, de los que sólo fueron
admitidos los 5 mejores. En la muestra total, el test se distribuye según una distribución normal con
media 5 y desviación típica 3. La puntuación directa mínima en el test para ser seleccionado es:
(X  X )
Zx   ZX = (X – 5) / 3  Sabemos que 5/500 = 0,01(proporción que se corresponde con la Z
Sx
que deja por encima el 0,01 y por debajo 0,99 (Z = 2,33)  Sustituimos en la fórmula para tipificar y
despejamos X (puntuación directa para ser seleccionado)  2,33 = (X – 5) / 3  X = 12
2 de 10
Dos test que miden un mismo trastorno de personalidad han clasificado a los sujetos de la siguiente
forma (0 significa no trastorno y 1 trastorno) (NC 95%)
TEST B
1 0 ∑
0 3 12 15
TEST A 1 9 1 10
∑ 1 2 13
25
El coeficiente kappa de Cohen es estadísticamente significativo  0,68
Fc  Fa 21  12,4 15  12 10  13
k = = 0,68 // N  25 // Fc  12  9  21 // Fa    12,4
N  Fa 25  12,4 25 25
Fa 12,4
Se  =  0,2 (Error típico de medida) // Z x  1,96
N ( N  Fa ) 25(25  12,4)
k  Z x  S e = 0,68  1,96  0,2  1,072 y 0,288 (Intervalo confidencial)
Nota: Después de averiguar el coeficiente Kappa, se procede a establecer el intervalo de confianza
(Kappa es significativo porque el cero no se incluye en el intervalo de confianza)
Se está realizando una selección para cubrir una serie de vacantes de traductores. Hay 20 aspirantes a
los que se les pasa una prueba escrita de inglés. A continuación se les hace un examen práctico que
consiste en una traducción oral simultánea en un Congreso. Para ser admitido en la prueba práctica es
necesario que los aspirantes obtuvieran al menos un 8 en la escrita. De los 20 aspirantes, 6 superaron
ambas pruebas, 2 superaron e punto de corte en la prueba escrita de inglés, pero fallaron en la
traducción; 4 no llegaron al punto de corte en la prueba escrita pero superaron la traducción
simultánea y 8 fueron rechazados en ambas pruebas.
Pasamos los datos a la tabla 
Prueba de Inglés
PRÁCTICO
NO APTO APTO ∑
APTO 4 a 6 b 10
NO APTO 8 c 2 d 10
∑ 12 8 20
La proporción de clasificaciones correctas a partir de la prueba escrita de inglés es:

FC 8  6
Fc = nº de casos en las que hay coincidencia predictor y criterio  P.c    0,70
n 20
La razón de eficacia de la prueba es (Proporción de sujetos seleccionados en el test con buen
b 6
rendimiento en el criterio): R.E   = 0,75
bd 26

Se ha aplicado un test para seleccionar una serie de vendedores y se ha acordado que para ser
considerado APTO, la proporción de aciertos sea 0,75. La longitud del test si se está dispuesto a admitir
un error máximo de 0,05 será:
Respuesta  Modelo de MIllman (Modelo binomial). Considera la proporción esperada de ítems que un
sujeto puede contestar correctamente para ser considerado apto y el error máximo a tolerar. La
ecuación para averiguar la longitud del test supuesta una proporción de aciertos es:
pc (1 - pc )
n= 2
 n = (0,75 · 0,25) / 0,052 = 75
e
3 de 10

La media de las puntuaciones de un test es de 6,5 y la desviación típica es 1,25. Si el coeficiente KR 21 =
0,90 y el punto de corte se establece en 8, una estimación de la proporción, p c, de sujetos
consistentemente clasificados es:
Siguiendo el método de Huynh, Calculamos la puntuación típica Z x que corresponde al valor del punto
de corte, con una corrección de 0,5, y acudimos a las tablas de curva normal para buscar el valor P que
deja por debajo la Z obtenida
(C  0,5  X )
Zx   ZX = (8 - 0,5 – 6,5) / 1,25  ZX = 0,8 (0,7881)
Sx
A partir de las tablas de Gupta (con Z = 0,8 y KR21 = 0,90) se obtiene la probabilidad PZZ (0,7363) de que
dos variables distribuidas normalmente con una correlación KR21 sean menor que Z.
Por último, se calculan el valor p c
p c  1  2( p zz  p z )  p c = 1 + 2 (0,7363 – 0,7881) = 0,896 (0,9)

Con los datos del problema anterior, una estimación del coeficiente Kappa de Cohen es:
p zz  p z2
k  k = (0,7363 – 0,78812) / (0,7881 – 0,78812) = 0,1152 / 0,167 = 0,69 (0,7)
p z  p z2
4 de 10
PROBLEMAS RESUELTOS
Modelo de MIllman  Popham  Un test referido a criterio se utiliza para

Ecuación para averiguar la longitud del evaluar el status absoluto del sujeto con respecto a algún
test supuesta una proporción de aciertos. dominio de conductas bien definido.
1.- MODELO MILLMAN

Para un determinado test de fluidez verbal, se ha establecido la proporción de aciertos para ser
considerado apto en 0,75. Se desea saber cuál es la longitud del test si se está dispuesto a admitir un
error máximo de 0,10 y 0,05.
Datos del problema  Punto de corte = 75% de aciertos // e = 0,10 y 0,05

pc (1 - pc )
n= 2
 n0,10 = 0,75 (1- 0,75) / 0,102 = 18,75 (≈ 19) // n0,05 = 0,75 (1- 0,75) / 0,052 = 75
e
Nota: Se trata de reducir el número de errores sin aumentar la longitud del test. El modelo de
Millman se utiliza para averiguar la longitud del test supuesta una proporción de aciertos (pág.
37 del formulario)
Fiabilidad de los test referidos al criterio (TRC)

Un test se considera fiable, si tras su aplicación a los mismos sujetos en distintas ocasiones, o la
aplicación de dos formas paralelas, siempre se clasifica a los sujetos en la misma categoría.
Métodos para calcular la fiabilidad de los test referidos al criterio (TRC)

Los distintos métodos para el cálculo de la fiabilidad de los TRC se utilizan para establecer un punto de
corte que nos permite clasificar al sujeto en dos categorías: la de los sujetos que dominan el criterio
evaluado y la de aquellos que no lo dominan.
Índices de acuerdo que requieren dos Índices de acuerdo que requieren una sola
aplicaciones del test  aplicación del test 
Coeficiente de Hambleton y Novick Método de Huynh
Coeficiente Kappa de Cohen Método de Subkoviak
Índice de Crocker y Algina Coeficiente de Livingston
1.- FIABILIDAD (TRC)  COEFICIENTE KAPPA DE COHEN (DOS APLICACIONES)

Dos psicólogos expertos en comunicación no-verbal han codificado registros audiovisuales del
presentador del telediario de una cadena de televisión en relación a su actitud ante noticias sobre
violencia doméstica. Cada psicólogo ha clasificado cada una de las 50 conductas seleccionadas en dos
categorías (1 y 2). En la siguiente tabla se muestran los resultados de las clasificaciones realizadas por
ambos:
Psicólogo B
1 2 ∑
1 20 7 27
Psicólogo 2 5 18 23
A ∑ 25 25 50
Pc  Pa 0,76  0,5
Averiguar el índice Kappa de Cohen  k  = = 0,52
1  Pa 1  0,5
27  25 23  25
N  50 // Pc  (20 / 50)  (18 / 50)  0,76 // Pa    0,5
2500 2500
Nota: Índices de acuerdo que requieren dos aplicaciones del test (página 38 del formulario)
5 de 10
2.- FIABILIDAD (TRC)  ÍNDICES DE ACUERDO QUE REQUIEREN (DOS APLICACIONES)

A una muestra de niños que cursan 1º de la ESO se les ha administrado dos test paralelos de historia
compuestos de 40 ítems. Para que un alumno sea clasificado dentro del grupo de maestría debe
contestar correctamente un mínimo de 30 ítems. Las puntuaciones obtenidas por los alumnos aparecen
resumidas en la tabla adjunta. Utilizando el método propuesto por Hambleton y Novick, calcular la
fiabilidad del test.
TEST B
Maestría No Maestría Total (Nj)
TEST A
Maestría 2 2 4
No maestría 4 7 11
Total (Nj) 6 9 N = 15
n
n11 n 22 n
pc   pi    ......  mm  Pc = (2/15)+(7/15) = 0,60
i 1 N N N
m NjN j
pa   2
 Pa = (4·6)/152+ (11·9)/152 = 0,55
j 1 N
Nota: El coeficiente de Hambleton y Novick alude a la proporción de sujetos consistentemente
clasificados en ambos test (PC = 0,60); en nuestro caso 2 y 7 (diagonal). Ante los resultados, se
puede decir que la utilización de los test no supone una mejora importante en la fiabilidad, con
respecto a las realizadas por mero azar (Pa = 0,55). Páginas 37 y 38 del formulario.
2.1.- Si aplicamos el coeficiente Kappa de Cohen 

Pc  Pa 0,60  0,55
k = = 0,11 La fiabilidad del test es muy baja
1  Pa 1  0,55
Nota: El coeficiente Kappa nos proporciona una medida de consistencia de clasificación de los
sujetos, independientemente del posible valor esperado por azar (oscila entre 0 y 1). Página 38
del formulario.
2.2.- Si aplicamos el Índice de Crocker y Algina 

pc  0,50
Como Pc = 0,60  P* =  2 pc  1  (2 · 0,6) - 1 = 0,2
1  0,50
Nota: El Índice de Crocker y Algina se basa en que la probabilidad mínima de una decisión
consistente es 0,50 (el índice oscila entre 0 y 1). Página 39 del formulario.
3.- FIABILIDAD (TRC)  COEFICIENTE KAPPA DE COHEN (DOS APLICACIONES)

Dos psicólogos forenses han evaluado a 100 presos con el objetivo de concederles la libertad condicional.
En general, es más probable que los psicópatas cometan delitos violentos que los sujetos maniaco-
depresivos o normales. Por tanto cada psicólogo ha puntuado a cada uno de los 100 presos en una escala
de 1 a 3 (1 = psicópata; 2 = maniaco-depresivo y 3 = normal). En la siguiente tabla se muestran los
resultados:
Psicólogo forense A
1 2 3 ∑
1 44 5 1 50
Psicólogo 2 7 20 3 30
forense B 3 9 5 6 20
∑ 60 30 10 10
0
Pc = (44/100)+(20/100)+(6 /100) = 0,7 // Pa = (50·60/10000)+(30·30/10000)+(20·10/10000) = 0,41

Pc  Pa 0,7  0,41 Fa 41
k = = 0,49 // S e  =  0,08
1  Pa 1  0,41 N ( N  Fa ) 100(100  41)
k  Z x  S e  0,49  1,96  0,08  0,49 ± 0,16 = 0,33 ≤ k ≤ 0,65
Nota: El coeficiente Kappa de Cohen es significativamente distinto de cero (cero no se incluye en
el intervalo de confianza). Página 38 del formulario.
6 de 10
4.- FIABILIDAD (TRC)  ÍNDICES DE ACUERDO QUE REQUIEREN UNA SOLA APLICACIÓN
En la matriz adjunta se presentan las puntuaciones obtenidas por cinco sujetos en un test de fluidez
verbal compuesto por ocho ítems. Suponiendo que un sujeto debe responder un mínimo de seis ítems
para estar clasificado dentro del grupo de maestría, calcular la fiabilidad de dicho test:
SUJETOS
ÍTEMS 1 2 3 4 5 6 7 8 ∑
1 1 1 1 1 1 1 1 1 8
2 1 0 1 1 0 1 1 1 6
3 0 0 0 0 0 1 1 0 2
4 0 1 0 1 1 0 0 0 3
5 1 1 1 0 1 0 0 1 5
Datos problema  N = 5 // n = 8 // Punto de corte = 6 // Método de Huynh (pág. 39 del formulario)
Media y Varianza  Media de X = (8+2+6+3+5) / 5 = 4,80 // S2X = (82+22+62+32+52) / 5 – (4,802) = 4,56

 X2   4,80 2 
X  4,80 
n   
n   8 1  8 

KR21 =  1  = 0,66
n 1  S x2  8  1  4,56 
   
(C  0.5  X ) (6  0,5  4,80)
Zx    0,33  ZX = 0,33  pz= 0,629 (≈ 0,63)
Sx 2,14
A partir de las tablas nº 11 de Gupta en la página 115 del formulario (con Z = 0,30 y KR21 = 0,70) se
obtiene la probabilidad PZZ (0,497) de que dos variables distribuidas normalmente con una correlación
KR21 sean menor que Z. Por último, se calculan el valor p c
p c  1  2( p zz  p z )  p c = 1 + 2 (0,497 – 0,63) = 0,73
p zz  p z2 0,497  0,629 2
Aplicamos el coeficiente Kappa  k    0,101 / 0,2334 = 0,43
p z  p z2 0,629  0,629 2
Nota: el Método de Huynh únicamente precisa un test y una aplicación. Se utiliza para estimar la
consistencia de clasificación. Método para pronosticar las puntuaciones de en un test “B”
conocidas las puntuaciones de una muestra de sujetos en una aplicación (test “A”)
En la tabla adjunta se recogen datos referidos a las puntuaciones y frecuencias obtenidas por 25 sujetos
en un test de razonamiento compuesto por 10 ítems. Para que un sujeto se clasifique dentro del grupo de
maestría, debe responder un mínimo de 8 ítems. Calcular, empleando el método de Subkoviak, la
consistencia de clasificación una vez eliminada la proporción de clasificación debida al azar. (KR 20 =
0,56)
X fx px Px 1-2(Px-P2x) fx [1-2(Px-P2x)] fx · Px
9 1 0,724 0,4486 0,5052 0,5052 0,4486
8 2 0,668 0,3023 0,5782 1,1564 0,6045
7 3 0,612 0,1874 0,6954 2,0862 0,5623
… … … … … … …
25 21,3001 2,3929
Paso 1  Obtener pX (Probabilidad de que una determinada persona con una puntuación x responda
correctamente a cada ítem) y Px (Probabilidad de que una determinada persona responda
correctamente 8 ó más ítems y sea clasificado dentro del grupo de maestría)
X  X 
  Donde  p X  Pr ob( X  K )    p x q n  x
n
pX     (1   ) 
n  n   x
7 de 10
Ejemplo  Para el ítem nº 9  pX = 0,56 (9/10) + (1-0,56) (5/10)  0,724

Para el ítem nº 8  pX = 0,56 (8/10) + (1-0,56) (5/10)  0,668
Para el ítem nº 7  pX = 0,56 (7/10) + (1-0,56) (5/10)  0,612
n
x n x  10 
Px = p X  Pr ob( X  K )    p q  p X  Pr ob( x  8)   0,724 ·0,276  0,2585
8 2
 x 8
n
x n x  10 
9 1
 x 9
n
x n x  10 
10 0
 x  10 
Px = (0,2585+0,1506+0,0395) = 0,4486
Paso 2  Obtener 1-2(Px-P2x) Probabilidad de clasificación consistente para cada sujeto

(clasificado en el grupo de maestría o no maestría en ambos test.
Ejemplo  Para el ítem nº 9  1-2(Px-P2x) 1-2(0,4486 – 0,44862) 0,5052
Para el ítem nº 8  1-2(Px-P2x) 1-2(0,3023 – 0,30232) 0,5782
Para el ítem nº 7  1-2(Px-P2x) 1-2(0,1874 – 0,18742) 0,6954
Paso 3  Completamos la tabla y obtenemos los coeficientes PC / Pa / K

f x [1  2( Px  P 2 x )] 21,3001
PC   PC   0,852
fx 25
  f x · p x  f x · p x  2   2,3929  2,3929  2 
Pa  1  2     Pa  1  2      0,827
 N  N    25  25  
P  Pa 0,852  0,827
K C K = 0,14 (Bajo valor de Kappa  Baja fiabilidad)
1  Pa 1  0,827
Nota: Método de Subkoviak (pág. 40 del formulario)
En la tabla adjunta se presentan las puntuaciones y frecuencias obtenidas por 25 sujetos en un test de
razonamiento compuesto por 25 ítems. Para que un sujeto sea clasificado dentro del grupo de maestría,
debe responder un mínimo de 15 ítems. Calcular, empleando el método de Livingston, el coeficiente de
fiabilidad (α = 0,80)
X 22, 20, 18, 16, 14, 10, 8
fX 4, 4, 2, 3, 4, 5, 3
Datos problema 
α = 0,80 // N = 25 (sujetos) // n = 25 (ítems) // Media = 15,28 // S2X = 23,64 // Punto de corte = 15
S x2  ( X  C ) 2 0,80·23,64  (15,28  15) 2

K 2
xv  2   0,80
S x  ( X  C)2 23,64  (15,28  15) 2
Nota: el Método de Livingston únicamente precisa un test y una aplicación. Considera los errores
cometidos al clasificar a un sujeto en el grupo que no le corresponde  estima más importantes
los errores de clasificación de los sujetos más distanciados del punto de corte de aquellos que
están más cerca del punto de corte (pág. 40 del formulario)
8 de 10
Métodos para estimar el punto de corte (TRC)

Se suelen considerar dos tipos de puntos de corte (Muñiz, 1998): Puntos de corte relativos (se
establecen en función del grupo de sujetos evaluados) y Puntos de corte absolutos (se establecen en
función del constructo o materia objeto de estudio)
Métodos valorativos (evaluación de un grupo de Los métodos combinados (juicios de expertos
expertos sobre los ítems de un test)  Centrados sobre la competencia de los sujetos en la materia
en el test. que se evalúa)  Centrados en las personas.
Nedelsky, Angoff, Ebel y Jaeger Grupo límite (Zieky y Livingstone)
Grupos de contraste
Los métodos de compromiso (se basan en los conocimientos mínimos del sujeto para superar el
criterio, también incorpora la posición del sujeto con relación a su grupo) 
Método de Beuk y Método de Hofstee
1.- FIABILIDAD (TRC)  PUNTO DE CORTE

Hemos aplicado un test de aptitud numérica a un grupo de estudiantes de 1º de bachillerato. El test está
compuesto por ítems de elección múltiple con cuatro posibles alternativas. En la tabla se recogen las
alternativas erróneas que 4 jueces creen que serían descartadas por un alumno con los conocimientos
mínimos exigidos para superar el test.
ÍTEMS JUEZ 1 JUEZ 2 JUEZ 3 JUEZ 4
1 bcd cd bc bcd
2 cd bd bcd cb
3 ab abd abd bd
4 acd ac cd acd
Calcular el valor esperado en el test para cada juez y el punto de corte (sin corregir y corrigiendo el
efecto del azar) utilizando el método de Nedelsky:
A.- Calculamos la puntuación esperada por un sujeto en cada uno de los ítems del test (se averigua
dividiendo la unidad entre el nº de alternativas del ítem que el sujeto no ha rechazado)
ÍTEMS JUEZ 1 JUEZ 2 JUEZ 3 JUEZ 4
1 1/1 ½ ½ 1/1
2 ½ ½ 1/1 ½
3 ½ 1/1 1/1 ½
4 1/1 ½ ½ 1/1
∑ 3 2,5 3 3
Punto de corte del test  Promedio de los valores esperados para cada juez
(3 + 2,5 + 3 + 3) / 4 = 2,87  el punto de corte se fija en 2,87
Corregidos efectos del azar  PCCORREGIDO = A – [(N – A) / (n – 1)]  2,87 – (4 - 2,87) / (4 – 1) = 2,49
Nota: El método Nedelsky fija el punto de corte en test de competencia mínima. Se suele utilizar
en el ámbito académico con test de ítems de elección múltiple (los jueces analizan las distintas
alternativas para determinar cuáles considerarán erróneas los sujetos competentes)
2.- FIABILIDAD (TRC)  PUNTO DE CORTE

En la tabla siguiente aparecen las probabilidades, asignadas por tres jueces, de que los cinco ítems de un
test de Aritmética utilizado en un proceso de selección, sean superados por un grupo de sujetos. Calcular:
ÍTEMS JUEZ 1 JUEZ 2 JUEZ 3

1 0,80 0,70 0,90
2 0,70 0,60 0,70
3 0,60 0,40 0,60
4 0,50 0,30 0,50
5 0,50 0,20 0,30
∑ 3,10 2,20 3,00
2.1.- Los puntos de corte de cada juez mediante el método de Angoff:

Los puntos de corte se calculan sumando las probabilidades, asignadas por cada uno de los jueces,
considerando los sujetos que superarán cada ítem. Al sumar las probabilidades obtenemos:
9 de 10
Puntos de corte  Juez 1 (3,10) // Juez 2 (2,20) // Juez 3 (3)
2.2.- El punto de corte del test, a partir de la información de los tres jueces.
El punto de corte es igual al promedio de los puntos de corte asignados por cada uno de los jueces.
PCorte = (3,10 + 2,20 + 3) / 3 = 2,77
2.3.- ¿Qué juez considera el test más fácil y más difícil?:

El primer juez es el que considera el test más fácil ya que es el que define un punto de corte más alto
(3,10). El segundo juez es el que considera el test más difícil ya que es el que define un punto de corte
más bajo (2,20)
Nota: el Método de Angoff es una variante del método Nedelsky con la diferencia de que es
aplicable a toda clase de ítems (no sólo a los de elección múltiple)
10 de 10

Actividades (Tema Nº 5)

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Actividades (Tema Nº 5)

Cargado por

Copyright:

Formatos disponibles

Psicometría (Tema 5) Actividades y problemas resueltos (Tutor)

TEMA 5: La fiabilidad en los tests referidos a criterio (Preguntas de exámenes)

Coeficiente pc de Hambleton y Novick  La proporción de sujetos consistentemente clasificados en

La proporción de clasificaciones correctas a partir de la prueba escrita de inglés es:

DESARROLLO (PREGUNTA Nº 10)

DESARROLLO (PREGUNTA Nº 14)

DESARROLLO (PREGUNTA Nº 15)

Modelo de MIllman  Popham  Un test referido a criterio se utiliza para

1.- MODELO MILLMAN

Datos del problema  Punto de corte = 75% de aciertos // e = 0,10 y 0,05

Fiabilidad de los test referidos al criterio (TRC)

Métodos para calcular la fiabilidad de los test referidos al criterio (TRC)

1.- FIABILIDAD (TRC)  COEFICIENTE KAPPA DE COHEN (DOS APLICACIONES)

2.- FIABILIDAD (TRC)  ÍNDICES DE ACUERDO QUE REQUIEREN (DOS APLICACIONES)

2.1.- Si aplicamos el coeficiente Kappa de Cohen 

2.2.- Si aplicamos el Índice de Crocker y Algina 

3.- FIABILIDAD (TRC)  COEFICIENTE KAPPA DE COHEN (DOS APLICACIONES)

Pc = (44/100)+(20/100)+(6 /100) = 0,7 // Pa = (50·60/10000)+(30·30/10000)+(20·10/10000) = 0,41

Datos problema  N = 5 // n = 8 // Punto de corte = 6 // Método de Huynh (pág. 39 del formulario)

Media y Varianza  Media de X = (8+2+6+3+5) / 5 = 4,80 // S2X = (82+22+62+32+52) / 5 – (4,802) = 4,56

Ejemplo  Para el ítem nº 9  pX = 0,56 (9/10) + (1-0,56) (5/10)  0,724

Paso 2  Obtener 1-2(Px-P2x) Probabilidad de clasificación consistente para cada sujeto

Paso 3  Completamos la tabla y obtenemos los coeficientes PC / Pa / K

S x2  ( X  C ) 2 0,80·23,64  (15,28  15) 2

Métodos para estimar el punto de corte (TRC)

1.- FIABILIDAD (TRC)  PUNTO DE CORTE

2.- FIABILIDAD (TRC)  PUNTO DE CORTE

ÍTEMS JUEZ 1 JUEZ 2 JUEZ 3

2.1.- Los puntos de corte de cada juez mediante el método de Angoff:

Puntos de corte  Juez 1 (3,10) // Juez 2 (2,20) // Juez 3 (3)

PCorte = (3,10 + 2,20 + 3) / 3 = 2,77

2.3.- ¿Qué juez considera el test más fácil y más difícil?:

También podría gustarte