184952tema 12

01/07/2019
Psicometría
LATERALIDAD Y RENDIMIENTO
ESCOLAR
TEMA 12
Introducción a la TRI
Índice
12.1. ¿Cómo estudiar este tema?

12.2. Limitaciones de la TCT
12.3. Modelos de la TRI para ítems dicotómicos.
12.4. Supuestos de la TRI.
12.5. Estimación de parámetros.
12.6. Bondad de ajuste.
12.7. Precisión en la TRI.
12.8. Curva Característica del Test.
12.9. Aplicaciones TRI.
12.10. Balance TRI.
2
1
01/07/2019

Apuntes de clase: Obligatorio
Tema 12. Introducción a la TRI.
Incluye el artículo:
Navas, M. J. (1994). Teoría clásica de los test versus teoría de
respuesta al ítem. Psicológica: revista de metodología y
psicología experimental, 15(2), 175-208.
----------------------------------------------------------------
Manual de la asignatura: Opcional

Tema 4. Introducción a la Teoría de Respuesta al Ítem.
En F. J. Abad et al. (2011), Medición (pp. 123-160). Madrid: Síntesis.
3

Manual de la asignatura: Opcional
Tema 5. Teoría de la Respuesta al Ítem (TRI) I: conceptos
básicos y modelos para ítems dicotómicos.
Tema 6. Teoría de la Respuesta al Ítem (TRI) II: estimación de
los parámetros, información y otros conceptos.
En R. Martínez Arias et al. (2006), Psicometría (pp. 123-192). Madrid:
Alianza Editorial.
2
01/07/2019
12.2. Limitaciones de la TCT

Varianza de los parámetros:
-TCT hay varianza de los parámetros.
-La puntuación V depende de los ítems aplicados.
-Distintos tests pueden dar lugar a una misma puntuación V.
-Las propiedades psicométricas dependen de la distribución del rasgo en la muestra.
-TRI hay invarianza de los parámetros.
-Los parámetros del verdadero nivel de rasgo son invariantes, no dependen de los
ítems aplicados ni de la muestra.
La precisión del test:
-TCT la precisión del test es la misma para cualquier nivel de rasgo.
-La precisión es la misma para todos los sujetos.
-La precisión depende de la dificultad y discriminación del test.
-TRI la precisión del test no es la misma para cualquier nivel de rasgo.
-La precisión se puede obtener para una persona según su nivel de rasgo y los ítems
aplicados.
Bondad de ajuste:
-TCT no hay indicadores de bondad de ajuste del modelo a los datos.
-TRI hay indicadores de bondad de ajuste del modelo a los datos.
5
12.3. Modelos de la TRI para ítems dicotómicos

Curva Característica del Ítem: Probabilidad de acertar un
ítem de las personas que lo responden según el nivel de rasgo.
-La escala del rasgo (θ) en típicas toma valores principalmente -3 y 3.
-A mayor puntuación en el test, mayor es la proporción de aciertos al ítem.
-Dificultad media: rasgo de 0, la probabilidad de acertar el ítem es 0,5.
-Dificultad baja: rasgo de 2, probabilidad de acertar 0,85.
-Dificultad alta: rasgo de -2, probabilidad de acertar 0,11.
P(θ)
3
01/07/2019

Curva Característica del Ítem: Probabilidad de acertar un
ítem de las personas que lo responden según el nivel de rasgo.
-Se pueden ajustar varios tipos de modelos a la CCI:
-Lineal: P = 0,492 + 0,177*θ
-Logístico: 1
P 1,1θ  0,05
1 e
P(θ)
θ θ

Modelo logístico de un parámetro: asume que los ítems
varían sólo en un parámetro de dificultad (b).
Modelo de Rasch
Pj θ  
1
Da(θ b j )
1 e
Pj(θ): Probabilidad de acertar el ítem j si el nivel de rasgo es θ.
θ: Nivel de rasgo de la persona.
En puntuaciones típicas toma valores generalmente entre -3 y 3.
bj: parámetro de dificultad del ítem j. A mayor b, menor será Pj(θ).
a: parámetro de discriminación. Es igual para todos los ítems.
Indica la inclinación (pendiente) de la CCI cuando θ = bj.
En típicas toma valores entre 0,3 y 2,5.
e: 2,718.
D: para el modelo con métrica normal vale 1,702 8
para el modelo con métrica logística vale 1
4
01/07/2019

Modelo logístico de un parámetro:
Interpretación de b:
-Dificultad del ítem.
-A mayor b, menor será la probabilidad de acertar el ítem [Pj(θ)].
-Es el valor del nivel de rasgo (θ) cuando Pj(θ) = 0,5.
b1 = -0,95, ya que Pj(-0,95) = 0,5

P(θ)
b2 = 0,6, ya que Pj(0,6) = 0,5
Pj θ  
1
Da(θ b j )
1 e

Modelo logístico de un parámetro:
Objetividad específica:
-El ordenamiento de los ítems según su dificultad será siempre el
mismo, independientemente de la muestra evaluada.
-El ordenamiento de los evaluados según su nivel de rasgo será
siempre el mismo, independientemente de los ítems aplicados.
P(θ)
Pj θ  
1
Da(θ b j )
1 e
10
5
01/07/2019

Modelo logístico de dos parámetros: asume que los ítems
varían en dificultad (b) y discriminación (a).
Pj θ  
1
Da j (θ b j )
1 e
a: parámetro de discriminación. No es igual para todos los ítems.
La pendiente para θ = bj es 0,25Daj.
Discriminación alta: valores mayores de 1.
e: 2,718.
11
D: para el modelo con métrica normal vale 1,702
para el modelo con métrica logística vale 1

Interpretación de a:
-Discriminación del ítem. A mayor valor, mayor discriminación.
-Pendiente del ítem. A mayor pendiente, más discriminación.
a1 = 0,4. Menor
Pj θ  
pendiente
1
P(θ) 1 e
a2 = 2,4. Mayor pendiente.
12
6
01/07/2019

Interpretación de a:
-Discriminación del ítem. A mayor valor, mayor discriminación.
-Pendiente del ítem. A mayor pendiente, más discriminación.
Pj θ  
1
P(θ) 1 e
a2 = 2,4. Mayor pendiente.
-Discrimina muy bien entre los que tienen un
nivel de rasgo > 0,75 y < 0,75.
-Los sujetos con un θ > 0,75 aciertan con
alta probabilidad el ítem.
-Los sujetos con un θ < 0,75 fallan con alta
probabilidad el ítem. 13

Modelo logístico de tres parámetros: asume que los ítems
varían en dificultad (b), discriminación (a) y azar (c).
Pj θ   c j  (1 c j )
1
1 e
Indica el nivel de θ para el que la Pj(θ) = 0,5(1 + c).
a: parámetro de discriminación.
c: parámetro de pseudoazar.
Indica la probabilidad de acertar para personas con niveles θ bajo.
Ítem sin omisiones, toma un valor inverso al nº de opciones.
14
Ítem con omisiones, a más omisiones menor será c.
Toma valores entre 0 y 1.
7
01/07/2019

Modelo logístico de tres parámetros: asume que los ítems
varían en dificultad (b), discriminación (a) y azar (c).
Interpretación de c:
-Probabilidad de acertar al azar para niveles θ muy bajos.
-A menor valor, más difícil es acertar al azar.
c2 = 0,2. Más probable acertar al azar.
P(θ)
c1 = 0,1. Menos probable acertar al azar.
Pj θ   c j  (1 c j )
1
1 e
15

Comparación de los tres modelos:
-El modelo de 3 parámetros es el más completo.
-Los modelos de 1 y 2 parámetros ajustan peor a ítems de
opción múltiple.
-El modelo de 1 parámetro ajusta muy mal a los datos.
-El modelo de 3 parámetros requiere procedimientos más
complejos de estimación y muestras más grandes.
16
8
01/07/2019
12.4. Supuestos de la TRI

Unidimensionalidad: el rendimiento a los ítems que forman
un test depende del nivel de la persona en un solo rasgo.
-Implica que no hay covarianza entre ítems para diferentes muestras
con el mismo nivel de rasgo.
-Si seleccionamos una muestra con el mismo nivel de rasgo, la
correlación entre dos ítems sería cero.
-Se comprueba mediante Análisis Factorial. Debe obtenerse un factor
que explique un 25% la varianza total.
Se denomina independencia local débil.
17
12.4. Supuestos de la TRI

Independencia local fuerte: las respuestas de una persona
a un ítem no depende de las respuestas a otro ítem.
-Las respuestas a un ítem dependen sólo del nivel de rasgo.
-Las respuestas a un ítem no dependen del orden de presentación de
los ítems.
-La probabilidad de acertar un ítem es independiente de la de acertar
otro.
-Si se da independencia local, se cumple que no hay correlación entre
ítems para un mismo nivel de rasgo (unidimensionalidad).
-Si hay dependencia local positiva, la correlación entre ítems de un
mismo nivel de rasgo es positiva.
-Implica que los ítems miden una misma dimensión pero distinta del rasgo
de interés.
-Si hay dependencia local negativa, la correlación entre ítems de un
mismo nivel de rasgo es negativa.
-Implica que los ítems miden dimensiones diferentes y distintas del rasgo
de interés. 18
9
01/07/2019
12.5. Estimación de parámetros

Procedimiento:
-Seleccionar un modelo de TRI.
-Aplicar el test a una muestra amplia.
-Con las respuestas al test estimar los parámetros de cada ítem y el nivel de
rasgo de cada evaluado.
Estimación
Estadísticos Parámetros
Muestra Población
Estimación Máxima Verosimilitud (ML): permite encontrar

los valores de los parámetros que hacen más probable la
matriz empírica de respuestas.
Fases:
-Estimación del nivel de rasgo (θ). 19
-Calibración de los ítems.

Estimación del nivel de θ con ML:
-Dados dos ítems con parámetros de dificultad de b1 = -0,7 y b2 = 1.
-Supongamos que una persona acierta el primero y falla el segundo.
-La CCI para cada nivel de θ sería el siguiente:
Acertar ítem 1 Fallar ítem 2
-El rasgo estimado para esta persona sería aquel que hace más probable
acertar el ítem 1 y fallar el 2. 20
10
01/07/2019

-Función de verosimilitud: probabilidad de un patrón de respuestas de un
evaluado dado un nivel de rasgo (θ), conocidos los parámetros a, b y c de los
ítems. J
Li  θ    Pj  θ  Q j  θ 
xij 1 xij
j1
-En el ejemplo anterior: acertar el ítem 1 y fallar el ítem 2 sería la siguiente:
Li θ   P1 θ Q 2 θ 
21

-Método de máxima verosimilitud: permite estimar el nivel de rasgo que
hace máxima la función de verosimilitud [Li(θ)]
-En el ejemplo anterior: acertar el ítem 1 y fallar el ítem 2, los diferentes

valores de la función de ML serían:
-El nivel de rasgo que hace máxima la función sería 0,15
Li θ   0,15
22
11
01/07/2019

Calibración de ítems:
-Dado que los parámetros de los evaluados y los de los ítems son
desconocidos es necesario estimarlos.
-Se estiman los parámetros a, b y c de los ítems que maximizan la
probabilidad de las respuestas observadas en cada nivel de rasgo.
-Se emplean programas informáticos.
23
12.6. Bondad de ajuste

Concepto:
-La TRI sólo se puede aplicar si los datos se ajustan a un modelo.
-Procedimiento general:
-Estudiar el ajuste para cada ítem entre la probabilidad teórica y empírica de
escoger cada opción de respuesta según un nivel de rasgo.
-Comparar la CCI teórica con la CCI empírica.
-Procedimientos:
-Estadístico G2
-Estadístico Chi2
-Inspección visual de la CCI
24
12
01/07/2019

-Estadístico G2:
-Se agrupan a las personas en Q intervalos según el nivel de rasgo estimado.
-Se compara la probabilidad observada en cada intervalo con la esperada
teóricamente del modelo de TRI según la CCI.
-Hipótesis:
-H0: El modelo de TRI ajusta a los datos.
-H1: El modelo de TRI no ajusta a los datos.
-Estadístico de contraste:
Q Oq 1  Oq 
G 2
 2 NOqLn  (1 Oq )Ln 

Total

q1  E q 1 E 
q 
-Si se rechaza la hipótesis nula: el modelo no ajustaría a los datos empíricos.

-Problema: con muestras grandes es fácil rechazar la hipótesis nula.
25

-Estadístico Chi2: (Orlando y Thissen, 2000)
-No hace falta agrupar a los evaluados en intervalos.
-Se compara la probabilidad de acertar observada con la probabilidad de
acertar teórica según el modelo de la TRI.
-Hipótesis:
-H0: El modelo de TRI ajusta a los datos.
-H1: El modelo de TRI no ajusta a los datos.
-Estadístico de contraste:
J-1
 (OX  E X )2 [(1 OX )  (1 E X )]2 
χ 2
 I   
1 EX
Orlando
X 1  E X 
-Si se rechaza la hipótesis nula: el modelo no ajustaría a los datos empíricos.
-Problema: con muestras grandes es fácil rechazar la hipótesis nula.
26
13
01/07/2019

-Inspección visual la CCI:
-Se inspecciona si la CCI observada se ajusta a la CCI esperada.
-Es un procedimiento complementario a los de contraste de hipótesis.
-Puede que se rechace la hipótesis estadística por un N alto, pero
visualmente las dos CCI sean iguales.
-Ver Ejemplo 4.6. 27
12.7. Precisión en la TRI

Función de información del test:
-Equivale a la fiabilidad de la TCT:
-El coeficiente de fiabilidad es un escalar (número).
-La función de información es una función que varía según el nivel de rasgo.
-El coeficiente de fiabilidad toma valores entre 0 y 1.
-La función de información toma cualquier valor mayor o igual a 0.
-Se calcula sumando las funciones de información de los ítems:
J
Iθ    I j θ 
j 1
-Depende:
- Nº de ítems: a mayor longitud mayor información.
- Parámetros a y c: a mayor discriminación (a) y menor adivinación (c) mayor
información.
- Proximidad entre θ y dificultad (b): a menor distancia mayor información.
- Proximidad entre Pi(θ) y c: a menor distancia menor información.
28
14
01/07/2019

Funciones de información para ítems:
-Modelo 1 y 2 parámetros: Iθ   D2 a 2Pj θ Q j θ 
Pj* θ 
-Modelo 3 parámetros:
Iθ   D a P θ Q θ (1 c j )
2 2 * *
Pj θ 
j j
Error típico de estimación del rasgo:

-Equivale al ET de medida de la TCT:
Se θ  
1
I j θ 
29

Información máxima:
Al ser la función de información la suma de la información de los ítems
podemos determinar el ítem que más informa.
-Nivel de rasgo para el que un ítem es más informativo:
-Se da cuando el nivel de rasgo es igual al parámetro de dificultad: θ = bj.
Ln(0,5  0,5 1  8c j )
θ máx  b j 
Da j
-Información máxima Modelo 3 parámetros:
1 20c j  8c 2j  (1 8c j )3/2

θmáx  0,25D a 2 2
j
2(1- c j )2
máx  0,25D a j
-Información máxima Modelo 2 parámetros: θ 2 2
30
15
01/07/2019

Coeficiente de fiabilidad marginal:
Se puede calcular a partir de la función de información del test:
σ 2θ
r θθ 
TRI
   
Q
σ   Se θq g θq
2 2
θ
q
31
12.8. Curva Característica del Test

Definición: Representación de la relación entre el nivel de
rasgo y el rendimiento esperado en el test.
Valor esperado en el test: suma de las probabilidades de

acertar los ítems para un nivel de rasgo.
32
16
01/07/2019
12.9. Aplicaciones TRI
•Estimación del error que comete cada persona en un ítem.

•Seleccionar los ítems más precisos para cada nivel de rasgo.
•Indicadores psicométricos complementarios a la TCT.
•Estudiar los parámetros de los ítems en diferentes grupos.
•Muy útil en evaluación a gran escala (muchos participantes).
•Validaciones transculturales de tests.
33
12.10. Balance TRI

Ventajas:
-Invarianza de los parámetros de los evaluados:
-Permite calcular más operativamente el nivel de rasgo de la persona.
-No se necesita conocer la puntuación V.
-El nivel de rasgo de un evaluado puede estimarse a partir de los parámetros de los
ítems.
-Invarianza de parámetros de los ítems:
-Los parámetros de los ítems no dependen de la muestra.
-Se pueden estudiar las propiedades psicométricas de un ítem en diferentes grupos.
-No se asume homocedasticidad del error:
-La precisión del test depende sólo del nivel de rasgo y de los ítems aplicados.
-Hay indicadores de bondad de ajuste de los datos al modelo teórico:
-Se pueden comparar varios modelos alternativos.
34
17
01/07/2019
12.10. Balance TRI

Desventajas:
-Requiere un gran número de evaluados para estimar los parámetros.
-Los supuestos son muy restrictivos:
-El supuesto de unidimensionalidad e independencia local no se cumplen en muchos
casos.
-El modelo de un parámetro se ajusta poco a los datos.
-Los procedimientos de bondad de ajuste no son del todo satisfactorios:
-Se desconoce la distribución de los índices de ajuste.
-Los índices dependen de la longitud del test o la calidad de las estimaciones.
-Se desconoce qué fuentes de error afectan a las puntuaciones de los tests:
-Se ignoran las fuentes de error no relacionadas con el contenido de los ítems.
-No se reconocen diferentes fuentes de errror.
-Poca atención a la validez de los tests.
35
18

184952tema 12

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

184952tema 12

Cargado por

Copyright:

Formatos disponibles

01/07/2019

12.1. ¿Cómo estudiar este tema?

12.1. ¿Cómo estudiar este tema?

Manual de la asignatura: Opcional

12.1. ¿Cómo estudiar este tema?

12.2. Limitaciones de la TCT

12.3. Modelos de la TRI para ítems dicotómicos

12.3. Modelos de la TRI para ítems dicotómicos

12.3. Modelos de la TRI para ítems dicotómicos

12.3. Modelos de la TRI para ítems dicotómicos

b1 = -0,95, ya que Pj(-0,95) = 0,5

12.3. Modelos de la TRI para ítems dicotómicos

12.3. Modelos de la TRI para ítems dicotómicos

12.3. Modelos de la TRI para ítems dicotómicos

12.3. Modelos de la TRI para ítems dicotómicos

12.3. Modelos de la TRI para ítems dicotómicos

12.3. Modelos de la TRI para ítems dicotómicos

c2 = 0,2. Más probable acertar al azar.

12.3. Modelos de la TRI para ítems dicotómicos

12.4. Supuestos de la TRI

Se denomina independencia local débil.

12.4. Supuestos de la TRI

12.5. Estimación de parámetros

Estimación Máxima Verosimilitud (ML): permite encontrar

12.5. Estimación de parámetros

12.5. Estimación de parámetros

-En el ejemplo anterior: acertar el ítem 1 y fallar el ítem 2 sería la siguiente:

12.5. Estimación de parámetros

-En el ejemplo anterior: acertar el ítem 1 y fallar el ítem 2, los diferentes

-El nivel de rasgo que hace máxima la función sería 0,15

12.5. Estimación de parámetros

12.6. Bondad de ajuste

12.6. Bondad de ajuste

-Si se rechaza la hipótesis nula: el modelo no ajustaría a los datos empíricos.

12.6. Bondad de ajuste

12.6. Bondad de ajuste

-Ver Ejemplo 4.6. 27

12.7. Precisión en la TRI

12.7. Precisión en la TRI

Error típico de estimación del rasgo:

12.7. Precisión en la TRI

1 20c j  8c 2j  (1 8c j )3/2

12.7. Precisión en la TRI

12.8. Curva Característica del Test

Valor esperado en el test: suma de las probabilidades de

12.9. Aplicaciones TRI

•Estimación del error que comete cada persona en un ítem.

12.10. Balance TRI

12.10. Balance TRI

También podría gustarte