Está en la página 1de 6

Tema 3.

Teoría de respuesta a los ítems


1. Conceptualización de la TRI
2. Limitaciones de la TCT
3. TCT vs TRI: dos modelos frente a frente
4. Supuestos básicos de la TRI
5. Profundizando en la TRI
6. Curva característica del ítem
7. Pasos básicos del análisis

1. conceptualización de la TRI
la TCT (teoría clásica de los test) es el modelo predominante para la construcción de test psicológicos. Sin
embargo, la TRI surgió para superar las limitaciones de la TCT. Sobre todo, centraba su interés en obtener
instrumentos de medida cuyas propiedades no dependieran de la muestra en la que se aplicaran.

La TRI supone una aproximación más fina en el estudio de las propiedades psicométrica de un test, ya que
modela de forma más realista las respuestas de las personas, toma los ítems como unidad de análisis y
permite describir algunas propiedades psicométrica del instrumento mediante indicadores invariantes,
que no dependen de la muestra en la que se aplique (siempre que se cumplan una serie de supuestos)

Así de acuerdo a la teoría del test, trata de crear un modelo que


represente las respuestas a los ítems de un test. Sustenta que la
medición de lo psicológico lo hagamos a través de indicadores
conductuales, indicadores empíricos del constructo. Como los
constructos no se observan directamente, es necesario realizar una
estimación.

Las respuestas son transformadas en indicadores numéricos (puntuación asignada). De esta manera, la
teoría de los test nos ayuda a resumir y representar esa información para extraer conclusiones sobre el
constructo. De esta manera el modelo matemático relaciona la actuación observable con la característica
no observable.

2. Limitaciones de la TCT
• Existe una falta de división entre las características de la muestra y las características del test.
Existe una ausencia de invarianza de los parámetros puesto que en la TCT, la puntuación
verdadera depende de los ítems administrados (distintos test darán lugar a distinta puntuación
verdadera para la misma persona). De la misma manera que, las propiedades psicométricas de
los ítems dependen de la muestra. Frente a la TCT, una de las propiedades de la TRI es que los
parámetros estimados son invariantes (si se cumplen los supuestos del modelo), por lo que el
verdadero nivel de rasgo no depende de los ítems aplicados.

Ej en el marco de la TCT: un test que mide el CI diseñado en EEUU y realizado por la población americana.
A partir de los resultados se calcula su índice de dificultad ¿qué pasaría si esta msima prueba la apsamos
en otro país como España? Ese índice de dificultad va a variar y puede que no porque tengan menor o
mayor CI. Por ejemplo, si uno de los ítems este puesto en pulgadas en vez de centímetros o metros, lo
sujetos no sabían resolverlo debido al sistema de medida o por una mala traducción.

Dos muestras no pueden ser comparadas ¿estudios internacionales? ¿adaptaciones? ¿las diferencias se
deben a diferencias reales o a problemas de traducción o a diferencias en la dificultad de los ítems? ¿los
valores varían en función de la muestra?

• Supuesto que establece que el error de medida se distribuye equivalentemente. Es difícil de


conseguir que los errores lleguen a 0.

¿Y si afectan otras variables? ¿y si no tenemos formas paralelas?

3. TCT VS TRI: Dos modelos frente a frente


TCT TRI
Énfasis en el test Énfasis en el ítem
Relación lineal Relación no lineal
Basado en la puntuación verdadera Basado en rasgos latentes
Tiene por objetivo estimar la puntuación Tiene por objetivo estimar la habilidad en un rasgo
verdadera en un test latente
Ej: estimamos la puntuación probable en un test Ej: estimamos el nivel del rasgo latente
de matemáticas. Es decir, nos dice cuánto nos “conocimiento de matemáticas” asumiendo que
merecemos en ese test. ese nivel influye en las respuestas a los ítems. Aquí
se mide el constructo del conocimiento en
matemáticas.
Puntuación desde 0 hasta el máximo Rasgo latente desde -∞ a ∞
Limitado a puntuaciones de un solo tes. Posibilidades para relacionar dos test (siempre
Ej: la TCT diría que nuestra puntuación de que midan el mismo rasgo latente).
autoestima es este test es (X). La TRI diría que la puntuación del rasgo es (X)
Menos posibilidad de generalización (está anclado Proporciona interpretaciones de las puntuaciones
a un test determinado) del test.
Ejemplo de variable latente

Variables cognitivas Variables no cognitivas


Variable latente Rendimiento en matemáticas Calidad de vida
Variables observables Resolución de una ecuación Índice económico
matemática

Relación lineal/no lineal

TCT TRI

V P (a)

(Rasgo)
X 𝜃
A pesar de lo que parece la TCT y la TRI son complementarias aunque la TRI surgiera como una reacción a
los problemas y limitaciones que presentaba la TCT. La TRI se implanta finalmente en los 80 con el objetivo
de conseguir medidas invariantes con respecto a los sujetos evaluados y los instrumentos utilizados.
Enuncia supuestos fundamentales que se refieren a la naturaleza del rasgo y a las relaciones que se
esperan entre las respuestas a los ítems. De esta forma, la TRI es una aproximación que toma los ítems
como unidades de análisis y describe las propiedades psicométrica mediante indicadores invariantes que
no dependen de la muestra a la que se aplique.

Es porque los procedimientos para la aplicación de la TRI son más costosos y exigentes con el
cumplimiento de los supuestos, lo que ha provocado que su desarrollo sea más lento.

La TRI es una herramienta indispensable en el contexto de los estudios transculturales y los test
adaptativos informatizados. Son test que se adaptan a las personas a la hora de evaluar de la misma forma
que la dificultad del rasgo va asociada a la dificultad de los ítems que ha sacado el programa.

4. Supuestos de la TRI
• Unidimensionalidad del rasgo latente. El rasgo existe universalmente en un rango específico, no
depende de la muestra evaluada. Significa que medimos con el test sólo una cosa.
Asimismo, hay que tener una buena definición del dominio dominante, del constructuo.
• Independencia local: la probabilidad de acierto de un ítem es independiente de la probabilidad
de acierto a cualquier otro ítem.
• Los test no deberían ser implementados en condiciones de velocidad porque sólo debemos
medir la habilidad del sujeto. El tiempo no puede ser un elemento importante en la TRI porque
si le metemos tiempo, estamos metiendo más cosas a la hora de medir el constructo.

5. Profundizando en la TRI
la probabilidad de acertar un ítem va a depender del nivel que tenga el sujeto en el rasgo latente (U= 1 es
cuando aciertas un ítem y u=0 cuando no aciertas) y por los parámetros de los ítems como el índice de
dificultad.

Más probabilidad de responder correctamente a preguntas más fáciles.

6. Curva característica del ítem


La CCI nos indica la probabilidad que tienen de acertar un ítem las personas que lo responden. Esta
probabilidad depende del nivel de la persona en la variable medida y de las características del ítem
concreto.

Los diferentes ítems tienen zonas críticas que tienen que ver con la probabilidad de acierto. Ítems en los
que la mayoría cae (curva cerca del suelo).

Una persona con un nivel de rasgo


latente igual a 0, tendrá 0.5 de
probabilidad de acertar el ítem (50%)
à el 0 representa el valor promedio.

Cada uno de los ítems tiene una curva característica que te dice cómo funciona, como discrimina, que
probabilidad de acierto hay. Que es la representación visual de la función logarítmica/logística.
A nivel de rasgo 0, el ítem más fácil es
el 9. Y, al nivel de 4 el 2 y el 9
coinciden.

7. Pasos básicos del análisis


1) Formulación del modelo que relaciona el constructo con los indicadores empíricos.
2) Estimación de los parámetros de habilidad (𝜃) y dificultad (b) de los ítems.
3) Evaluamos la bondad del ajuste, que tal funciona el test.

Dentro de los modelos logísticos de la TRI tenemos tres tipos. Cada modelo indica el número de
parámetros que vamos a calcular para cada ítem.

La selección del modelo dependerá de las características de los ítems y de los recursos que disponemos
(el 3P es más costoso que el 2p y este es más costoso que el 1P).

1P – dificultad

En este modelo el único parámetro que se calcula para cada uno de los ítems es el índice de dificultad. El
resto de parámetros se suponene que son iguales para todos los ítems. Por tanto, solo variará de un ítem
a otro la dificultad.

En la CCI buscamos en el eje de ordenadas Y el 0.5 (probabilidad de


acertar el ítem). A partir de ahí trazamos una línea horizontal hasta que
corte la curva característica del ítem. En este punto miramos el nivel de
rasgo que correspondería y aproximadamente este sería el índice de
dificultad.

En esta gráfica el ítem 1 tiene un índice de dificultad de b1 = -1 y el ítem


2 de b2 = 0.5. cuanto mayor es b, mayor es la dificultad del ítem y por
tanto, menos probabilidad de acertar.

2P – dificultad y discriminación

A mayor pendiente, mayor índice de discriminación. Al ser la


pendiente más acusada significa que, el test ha detectado
rápidamente el nivel del rasgo de manera que adapta los ítems y
acierta. Pasa rápidamente de lo que no sabe a lo que sabe.
3P – dificultad, discriminación y adivinación

Nos dice con niveles bajos del constructo la probabilidad de acierto. Por ejemplo, la probabilidad de
acierto en un examen de 3 opciones es de un 33 % sin conocimiento.

El punto en el que el eje de ordenadas Y corta la CCI, sería el índice de


adivinación.

En esta gráfica, las personas con el nivel más bajo de conocimiento (-4)
tienen una probabilidad del 20% de acertar el ítem 2 à índice de
adivinación c2 = 0.2 mientras que en el ítem 1, el índice de adivinación
es de 0.

La bondad del ajuste es el nivel de correspondencia entre lo que estima el modelo teórico y lo que nos
dan los datos de los sujetos (niel de coincidencia entre la teoría y los resultados tras su aplicación) à ¿ en
qué medida el modelo representa la realidad que queremos explicar?

Para que tenga buen ajuste


debe seguir el curso de los
puntos.

Estas gráficas representan el ajuste del modelo. Comparación entre la curva teórica (línea azul) y la
empírica (los puntos representan las respuestas de los sujetos en función al nivel del rasgo).

Proceso de calibración

El test se va calibrando a sí mismo. Empiezo preguntando cuestiones con un nivel intermedio de dificultad,
si aciertas, sigo subiendo la dificultad aunque posibilitan que haya fallos aleatorios.

También podría gustarte