Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Por su parte, el tem 1 tiene muy poca pendiente cuando = Este modelo aade a los dos parmetros "a" y "b" un tercero,
0.75. En consecuencia, aunque la mayora de las personas con > "c", que representa la probabilidad de acertar el tem al azar.
Exactamente "c" es el valor de P(Z) para valores extremadamente
0.75 lo acertarn, muchas lo fallarn (pues la probabilidad de
acierto es claramente inferior a uno). Igualmente, aunque la bajos de .
mayora de las personas con < 0.75 fallarn el tem, muchas lo La expresin matemtica es la siguiente:
acertarn, pues la probabilidad de acierto es claramente superior
(1 - c) eDa( -b)
a cero. En el tem 1 la probabilidad crece muy suavemente a P( ) = c +
medida que aumenta por lo que no es buen discriminador entre 1 + eDa( -b)
las personas con > 0.75 y las que tienen < 0.75.
En la grfica 4 podemos ver la CC de varios tems con
distinto parmetro "c".
GRFICA 3
GRFICA 4
9 10
3 Supuestos de la TRI Por ejemplo, un test consta de dos tems y la probabilidad
de que Juan acierte el primero es P1 = 0.4 y la de que acierte el
3.1 - Unidimensionalidad segundo P2 = 0.8. El principio de independencia local establece
que la probabilidad de que acierte los dos viene dada por:
Tal y como hemos visto en el apartado anterior, en todos los (P1)(P2) = (0.4)(0.8) = 0.32.
modelos de CCIs, la probabilidad de acertar un tem depende
nicamente de sus parmetros y de . En un tem que mida el nivel La probabilidad de acertar el primero y fallar el segundo
de vocabulario de ingls, la probabilidad de acertarlo depende de sera (como Q2 = 1 - P2 = 1 - 0.8 = 0.2):
los valores "a", "b" y "c" del tem y del nivel de vocabulario
ingls de la persona (su ). La CCI excluye que el rendimiento en (P1)(Q2) = (0.4)(0.2) = 0.08.
el tem dependa de los niveles de la persona en otros rasgos ms
o menos relacionados con el de vocabulario de ingls (como el La de que falle el primero y acierte el segundo ser
nivel de ingls hablado, el nivel de gramtica inglesa, ....). De
tener en consideracin otros rasgos, en la frmula apareceran (Q1)(P2) = (0.6)(0.8) = 0.48.
los elementos 2, 3, etc.. , es decir, los niveles de la persona
La de que falle ambos tems ser
en esos otros rasgos. En otras palabras, el rendimiento en un
tem depende del nivel de la persona en un slo rasgo o (Q1)(Q2) = (0.6)(0.2) = 0.12.
dimensin.
Supongamos que 100 personas con idntico nivel de rasgo que
Un test consta de un conjunto de tems. La TRI supone adems Juan contestan al test. Espereramos aproximadamente los
que todos los tems que forman el test han de medir un mismo y siguientes resultados (1, acierto; 0, error):
nico rasgo. El supuesto de unidimensionalidad exige que todos y
cada uno de los tems del test midan una nica dimensin. item 1 item 2 nmero de personas
1 1 32
Este supuesto nunca se cumple totalmente porque el 1 0 8
rendimiento en un test est influido por variables cognitivas y 0 1 48
de personalidad, como la motivacin, ansiedad, etc. Por lo que, 0 0 12
en la prctica, es una cuestin de grado, y no puede afirmarse ------
categricamente si un conjunto de tems son o no 100
unidimensionales. Hay, no obstante, varios mtodos para comprobar
la unidimensionalidad. El propuesto por Reckase (1979) se basa en Si correlacionamos las cien respuestas al primer item con
el anlisis factorial y consiste en estudiar la varianza las cien respuestas al segundo, la correlacin de Pearson es
explicada por el primer factor extrado de la matriz de cero. Lo visto sugiere un procedimiento para contrastar si el
correlaciones entre tems. En la prctica, cuando el primer supuesto de independencia local se cumple. Consiste en obtener la
factor explica ms de un 25% de la varianza total, tras haber matriz de correlaciones entre los tems, pero no en la muestra
eliminado los tems con saturaciones inferiores a 0.10, se completa, sino en submuestras que sean lo ms homogneas posible
considera que se cumple el supuesto de unidimensionalidad. en cuanto al nivel de habilidad de sus miembros. En tales
submuestras tiene que ocurrir que ningn tem correlacione con
3.2 - Independencia local ningn otro, si se cumple el supuesto. (Hambleton y otros, 1991,
pag. 56).
Existe independencia local entre los tems de un test si la
respuesta que una persona da a uno de ellos no depende de las
respuestas que da a los otros.
La independencia local se deriva de la unidimensionalidad
porque, simplemente, significa que la respuesta a un tem slo
depende de sus parmetros y de , y no est influida por el orden
de presentacin de los tems, las respuestas que ya se hayan
dado, etc..
Matemticamente puede expresarse diciendo que la
probabilidad de que un sujeto acierte "n" tems es igual al
producto de las probabilidades de que acierte cada uno de ellos
por separado.
11 12
4 Estimacin de los parmetros
GRFICA 5
Una vez seleccionado un modelo de TRI es necesario aplicar
el test a una muestra amplia y estimar los parmetros de cada
tem y la de cada sujeto, a partir de la matriz de respuestas
obtenidas. Si tenemos, por ejemplo, diez tems que miden un mismo
rasgo, los podramos aplicar a una muestra de 300 personas. La
matriz de datos tendr 300 filas, siendo cada fila la secuencia
de unos (aciertos) y ceros (errores) de cada persona de la
muestra. Si queremos aplicar el modelo logstico de tres
parmetros, tendremos que estimar los 30 parmetros de los tems
(es decir, "a", "b" y "c" de cada tem) y 300 parmetros de las
personas (los 300 valores de "", uno por persona). La estimacin
de los parmetros es el paso que nos permite llegar de las
respuestas conocidas de las personas a los tems (la matriz
anterior), a los valores desconocidos de los parmetros de los
tems y de los niveles de rasgo.
En TRI, el procedimiento de estimacin sigue una lgica Como el sujeto ha fallado el segundo tem, a partir de su
similar. Se obtienen las estimaciones de los parmetros y de los CCI podemos calcular la probabilidad de que esto ocurra para cada
niveles de con los que la matriz de datos encontrada tiene la uno de los valores de . En concreto, como la probabilidad de
mxima compatibilidad. fallar (Q) se puede obtener a partir de la probabilidad de
acertar (Q = 1-P), podremos representar la probabilidad de error
Supongamos, por ejemplo, que tenemos un test compuesto por en el segundo tem como se muestra en la siguiente grfica.
tan slo dos tems, y se lo aplicamos a un sujeto. Supongamos Ntese que la siguiente grfica no es la CCI del tem 2, pues
tambin que acierta el primero y falla el segundo. A partir de para cada valor de se ha representado la probabilidad de error
estas respuestas, la estimacin mximo-verosmil de su se puede y no la de acierto, como exige la CCI.
explicar de forma grfica como lo hacemos a continuacin (en este
ejemplo, para simplificar la explicacin, suponemos que los
parmetros de los tems son conocidos).
Como el sujeto ha acertado el primer tem, podemos calcular,
mediante su CCI (recurdese que los parmetros del tem son
conocidos), la probabilidad de que esto ocurra para cada nivel de
. Grficamente:
13 14
GRFICA 7
GRFICA 6
Como de hecho ha respondido a dos tems, el valor estimado En general, una persona responder a un nmero de tems
de para este sujeto sera aquel que haga ms probable el mayor de dos y producir una particular secuencia de unos y
resultado obtenido (acertar el primer tem y fallar el segundo). ceros. La probabilidad de obtener tal secuencia de aciertos y
Segn el supuesto de independencia local, ambos sucesos son errores se puede escribir como:
independientes y, por lo tanto, la probabilidad de que ocurran
ambos conjuntamente es igual al producto de las probabilidades de L = P R Q1- R
acertar el primero (P1) por la de fallar el segundo (Q2). Si
representamos grficamente la funcin L = (P1)(Q2) para cada Donde:
valor de , correspondiente al ejemplo que venimos comentando,
obtendramos una curva parecida a la siguiente: R: Resultado en cada tem (1, acierto; 0, fallo)
P: Probabilidad de acierto en cada tem
Q: Probabilidad de error en cada tem (Q= 1-P).
Cuando se trata de estimar en una situacin real el nivel de La varianza de las puntuaciones estimadas, Var(), se
rasgo, no se hace una bsqueda restringida a unos cuantos obtiene mediante la expresin siguiente:
valores, se necesita hallar el valor de que maximiza L de entre
los posibles valores, no slo de entre unos pocos. 1
Var( ) = S e2 =
(P )2
En el caso de la TRI no existen frmulas que permitan
obtener las estimaciones de manera directa. En el ejemplo de las PQ
monedas se sabe que el estimador mximo-verosmil de la
proporcin poblacional es la proporcin muestral. En la TRI, al Donde P' es la derivada de P. La varianza anterior nos dice
no existir tales frmulas, las estimaciones se obtienen por cmo es de importante la variacin entre los valores de
mtodos numricos, mediante programas de ordenador. En el caso estimados y el valor verdadero de . Cuanto menor sea esta
ms general se establece una funcin L que depende de los varianza, indicar que ms nos podemos fiar del test; pues
parmetros de los tems y de los niveles de rasgo. Los programas sabemos que son pocas las diferencias entre los valores estimados
de ordenador contienen algoritmos que encuentran el conjunto de y el verdadero.
estimaciones para el que la funcin L alcanza el valor mximo.
Los parametros de los items y los niveles de rasgo de las
personas sern los valores dados por el programa de ordenador Por su parte, el error tpico de estimacin de es la
para una matriz de respuestas particular. desviacin tpica de las puntuaciones estimadas, es decir,
17 18
2
Se = Se
GRFICA 8
El error tpico de estimacin permite obtener el intervalo
confidencial en el que, con probabilidad predeterminada, se ha de
encontrar el nivel de habilidad de la persona. En concreto, si a
la "" estimada de una persona le sumamos y restamos (1.96)Se,
obtenemos los extremos del intervalo en el que, con probabilidad
0.95, se encontrar su verdadero nivel de rasgo.
Por lo tanto,
(P )2
I( ) =
PQ
grficamente la FI de los tems y ver a que nivel de b) Estimacin del nivel de rasgo de la persona.
proporcionan ms informacin. c) Bsqueda del tem del banco ms informativo para el nivel
de estimado en el paso precedente.
d) Aplicacin del tem elegido.
GRFICA 9 e) Estimacin del nivel de rasgo correspondiente a la
secuencia de respuestas dada a los tems presentados.
f) De nuevo paso "c", y as sucesivamente hasta que se haya
conseguido un error tpico de estimacin menor que un tope
preestablecido o se haya administrado un predeterminado nmero de
tems.
7 Bibliografa
Esto nos permite elegir los tems ms adecuados en cada Amn J. (1984). Estadstica para psiclogos. Probabilidad.
momento en funcin de nuestras necesidades. Por ejemplo, si Estadstica Inferencial. Volumen 2. 3 edicin. Pirmide. Madrid.
queremos llevar a cabo una seleccin de personal en la que slo
vamos a elegir unos pocos sujetos muy competentes, a partir de un Hambleton R.K. y Swaminathan H. (1985). Item Response
banco de tems previamente calibrado, podramos elegir aquellos Theory: Principles and applications. Kluwer. Boston.
tems que proporcionan ms informacin para niveles altos de .
Esto nos permite reducir enormemente el nmero de tems de un Hambleton R.K, Swaminathan H. y H.J. Rogers (1991).
test sin perder precisin al estimar . Fundamentals of Item Response Theory. MMSS volumen 2. Sage.
Londres.
Un TAI difiere muchsimo de un test de lpiz y papel. Una Reckase M.D. (1979). Unifactor latent trait models applied
primera diferencia es que es administrado por un ordenador y una to multi-factor tests: Results and implications. Journal of
segunda es que cada persona es evaluada con items distintos. Sin Educational Statistics, 4, 207-230.
embargo, lo fundamental de los TAIs es que los tems son elegidos
con el criterio de estimar el nivel de habilidad de la persona Renom J. (1993). Tests adaptativos computerizados.
con la mxima precisin y menor nmero de tems. Ms en concreto, Fundamentos y aplicaciones. PPU. Barcelona.
un TAI procede como se expone a continuacin:
a) Presentacin del primer tem. 8 Problemas y cuestiones
21 22