Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ren Castro
Psicometra 1
UBA
Psicologa
Pgina 1
Psicometra 1
UBA
El objetivo central era encontrar un modelo estadstico que fundamentase adecuadamente las puntuaciones de los tests
y permitiera la estimacin de los errores de medida asociados a todo proceso de medicin realizado en el campo
psicolgico o educativo para inferir (estimar) el nivel real de los sujetos en el rasgo que mide el test. Estos errores son
aleatorios y pueden venir de distintas fuentes. Mientras menor sea el error cometido, mayores sean las
puntuaciones/medidas verdaderas (V), mayor ser la confiabilidad del test empleado.
El modelo lineal de Spearman, es un modelo aditivo en el que la puntuacin observada (variable dependiente) de un
sujeto en un test (X) es el resultado de la suma de dos componentes: su puntuacin verdadera (variable independiente) en
el test (V) y el error (e) (variable interviniente, interfiriente o extraa).
X=V+e
Donde:
X= Puntuacin observada (variable dependiente) de un sujeto en un test
V= Puntuacin verdadera (variable independiente) de esa persona en el test
E=error que puede ser debido a muchas causas que se nos escapan y que no controlamos (variable interfiriente)
A partir de este modelo y unas asunciones mnimas, la TCT desarrollar todo un conjunto de deducciones encaminadas
a estimar la cuanta del error que afecta a las puntuaciones de los tests.
Supuestos:
1. El primer supuesto es definir la puntuacin (V) como la esperanza matemtica de la puntuacin emprica (X), que
formalmente se escribe as:
V = E(X)
Lo que esto significa conceptualmente es que se define la puntuacin verdadera (V) de una persona en un test como
aquella puntuacin que obtendra como media si se le aplicara infinitas veces el test. Se trata de una definicin terica,
Psicologa
Pgina 2
Psicometra 1
UBA
nadie va a pasar infinitas veces un test a nadie, por razones obvias, pero parece plausible pensar que si esto se hiciese,
la puntuacin media que esa persona sacase en el test sera su verdadera puntuacin.
2. En el segundo supuesto, Spearman asume que la correlacin existente entre las puntuaciones verdaderas de "n" sujetos
en un test y los errores de medida es igual a cero, o lo que es igual, que no existe relacin entre la cuanta de las
puntuaciones verdaderas de las personas y el tamao de los errores que afectan a esas puntuaciones. En otras palabras,
que el valor de la puntuacin verdadera de una persona no tiene nada que ver con el error que afecta esa puntuacin, es
decir, puede haber puntuaciones verdaderas altas con errores bajos, o altos, no hay conexin entre el tamao de la
puntuacin verdadera y el tamao de los errores. De nuevo se trata de un supuesto en principio razonable, que
formalmente puede expresarse as:
r(v,e) = 0
3. El tercer supuesto establece que los errores de medida de las personas en un test no estn relacionados con los errores
de medida de las personas en otro test distinto. Dicho de otro modo, la correlacin entre los errores de medida (re1e2)
que afectan a las puntuaciones de los sujetos en dos test diferentes es igual a cero. Es decir, no hay ninguna razn para
pensar que los errores cometidos en una ocasin vayan a covariar sistemticamente con los cometidos en otra ocasin.
Formalmente se escribe as:
r(e1,e2) = 0 o tambin r(ej, ek) = 0.
Partiendo de esos tres supuestos del modelo, se establecen las siguientes deducciones:
a) El error de medida (e) es la diferencia entre la puntuacin emprica (X) y la verdadera (V).
e = X-V
b) La esperanza matemtica de los errores de medida es cero, luego son errores insesgados.
E(e) = 0
c) Las puntuaciones verdaderas no covaran con los errores.
Cov(V,e) = 0
d) La covarianza entre las puntuaciones empricas y las verdaderas es igual a la varianza de las verdaderas:
cov(X,V) = S2(V)
e) La covarianza entre las puntuaciones empricas de dos test es igual a la covarianza entre las verdaderas:
cov(Xj,Xk) = cov(Vj,Vk)
f) La varianza de las puntuaciones empricas es igual a la varianza de las verdaderas ms los errores:
S2(X) = S2(V) + S2(e)
g) La correlacin entre las puntuaciones empricas y los errores es igual al cociente entre la desviacin tpica de los
errores y la de las empricas.
rxe = Se/S
Estas asunciones parecen razonables y sensatas, pero no se pueden comprobar empricamente de forma directa, sern
las deducciones que luego se hagan a partir de ellas las que permitan confirmarlas o falsearlas. Tras cien aos de
formuladas y con muchos resultados empricos detrs, bien podemos decir hoy que las ideas de Spearman han sido de
gran utilidad para la psicologa.
Adems del modelo y de estos tres supuestos, se formula una definicin de lo que son Tests Paralelos, entendiendo por
ello aquellos tests que miden lo mismo exactamente pero con distintos tems. Las puntuaciones verdaderas de las personas
en los tests paralelos seran las mismas, y tambin seran iguales las varianzas de los errores de medida.
Psicologa
Pgina 3
Psicometra 1
UBA
El modelo lineal, junto con los tres supuestos enunciados, y la definicin de tests paralelos propuesta, constituyen el
conjunto central de la Teora Clsica de los Tests.
Tradicionalmente, los mtodos basados en la llamada Teora Clsica de los Tests han sido utilizados para el anlisis de
calidad tcnica de instrumentos de medicin psicomtricos. Uno de los resultados ms importantes que se deriva a partir
de los postulados de la Teora Clsica es el conocido coeficiente de confiabilidad de Cronbach, medida que se usa para
juzgar la confiabilidad de un instrumento desde el punto de vista de su consistencia interna.
En algunos pases de Latinoamrica, la Teora Clsica de los Tests se ha aplicado rutinariamente para el anlisis y la
construccin del banco de tems de las pruebas de aptitud acadmica de las principales universidades estatales, como las
Universidades de Costa Rica y el Instituto Tecnolgico en Costa Rica. Ms recientemente, tambin se ha incorporado a
las pruebas sumativas que deben presentarse al termino de la educacin secundaria (llamadas pruebas de bachillerato).
Limitaciones del enfoque clsico.
Veamos la primera: dentro del marco clsico, las mediciones no resultan invariantes respecto al instrumento utilizado.
Esto significa que si un psiclogo evala la inteligencia de tres personas distintas con un test diferente para cada persona,
los resultados no son comparables, no podemos decir en sentido estricto qu persona es ms inteligente.
Esto es as porque los resultados de los tres tests no estn en la misma escala, cada test tiene la suya propia, por lo que
no es conveniente comparar la inteligencia de personas que han sido evaluadas con distintos tests de inteligencia. Para
hacerlo se transforman las puntuaciones directas de los tests en otras baremadas, por ejemplo en percentiles, con lo que se
considera que se pueden ya comparar, y de hecho as se hace. Este proceder clsico asume que los grupos normativos en
los que se elaboraron los baremos de los distintos tests son equiparables, lo cual es difcil de garantizar en la prctica.
No hay duda que lo ms deseable cientficamente sera que los resultados obtenidos al utilizar distintos instrumentos
estuviesen en la misma escala. Eso es precisamente lo que va a conseguir el enfoque de la TRI. Este nuevo enfoque de la
TRI va a suponer un gran avance para la medicin psicolgica, propiciando un gran desarrollo de nuevos conceptos y
herramientas psicomtricas.
La segunda gran cuestin no bien resuelta dentro del marco clsico era la ausencia de invarianza de las propiedades de
los tests respecto de las personas utilizadas para estimarlas. En otras palabras, propiedades psicomtricas importantes de
los tests, tales como la dificultad de los tems, o la fiabilidad del test, estaban en funcin del tipo de personas utilizadas
para calcularlas, lo cual resulta inadmisible desde el punto de vista de una medicin rigurosa. Por ejemplo, la dificultad de
los tems, o los coeficientes de fiabilidad dependen en gran medida del tipo de muestra utilizada para calcularlos. Este
problema tambin encontrar una solucin adecuada dentro del marco de la TRI.
Teora de la Respuesta al Item (TRI/TRL)
Dentro del campo de la Teora de los Tests Psicomtricos han aparecido distintas denominaciones que en la actualidad
toman el nombre de "Teora de la Respuesta al Item (TRI)" (Teora del Rasgo Latente (TRL) o Teora de Respuesta
al Reactivo (TRR)) cuyo principal autor fue Frederic M. Lord (12/1112 -05/02/2000), psicometrista del Servicio de
Pruebas Educacionales quin aport dos libros importantes: Statistical Theories of Mental Test Scores o Teoras
Estadsticas de las Puntuaciones Mentales (con Melvin R. Novick y dos captulos por Allen Birnbaum, 1968) y
Applications of Item Response Theory to Practical Testing Problem (1980) o Aplicaciones de la Teora de la Respuesta al
Item a los problemas prcticos de la prueba. Adems, G. Rasch aport el desarrollo del primer modelo logstico
probabilstico basado en el ndice de dificultad de la TRI/TRL. En este caso, puede observarse que tem, reactivo,
pregunta o afirmacin tienen significados similares.
Esta denominacin presenta unas diferencias respecto al modelo clsico:
1) la relacin entre el valor esperado de las puntuaciones del sujeto y el rasgo (caracterstica responsable de los
valores), no suele ser de tipo lineal, la TRI postula que esta relacin es de tipo probabilstica, no lineal (curva) y
abstracta.
Psicologa
Pgina 4
Psicometra 1
UBA
2) pretende hacer predicciones individuales sin necesidad de hacer referencia a las caractersticas del grupo normativo.
Vemos, pues, que esta Teora de la Respuesta al Item proporciona la posibilidad de describir de forma separada tanto a
los items como a los individuos; adems considera que la respuesta que da el sujeto depende del nivel de habilidad que
tenga en el rango considerado.
El origen de estos modelos se deben a Lazarsfeld, 1950, el cual introdujo el trmino "rasgo latente. Desde aqu se
considera que cada individuo tiene un parmetro individual el cual es el responsable de las caractersticas del sujeto,
denominadas tambin "rasgo".
Este rasgo no es medible directamente, solo indirectamente, de ah que el parmetro individual reciba el nombre de
variable latente.
A la hora de aplicar los tests se pueden obtener dos cosas distintas, la puntuacin verdadera y la escala de aptitud; esto
se consigue si pasamos dos tests acerca de la misma aptitud a un mismo grupo.
En la Teora del Rasgo Latente o Teora de la Respuesta al Item, la puntuacin verdadera es aquel valor que se espera
de la puntuacin observada. Segn Lord, la puntuacin verdadera y la aptitud son la misma cosa pero expresadas en
diferentes escalas de medicin.
La Teora de la Respuesta al Item (TRI) o Teora del Rasgo Latente (TRL) asume que entre la respuesta que una
persona ofrece a una pregunta o prueba, y el rasgo o habilidad (puede entenderse tambin como la competencia, actitud,
actitud, etc.) de la persona, existe una relacin no lineal (curva), que se puede expresar en trminos probabilsticos.
El conjunto de clculos que se aplican para ello determina los distintos modelos y resultados de la TRI.
En cuanto al clculo estadstico, la TRI utiliza un modelo matemtico logstico para describir la relacin entre el nivel
de habilidad del examinado y la probabilidad que ste d una respuesta correcta a un tem del test. Algunas aplicaciones
de la TRI han consistido en la creacin de bancos de tems y los diseos de tests a la medida del sujeto o test adaptativos
computadorizados (TAC). Los test de medida consisten en la seleccin de informatizada de los tems que puedan medir
mejor la habilidad de un individuo. Otros conceptos fundamentales en la TRI son la Funcin de Informacin y el Error
Estndar de Medicin.
La Teora de la Respuesta al tem (TRI) tiene algunas ventajas sobre la TCT, ya que permite obtener ms informacin
sobre los tems de la prueba y sobre la variable psicolgica, el constructo o variable latente que interesa medir en los
examinados. Adems, con la TRI se pueden generar pruebas adaptadas al nivel de los individuos. Tambin se logran
indicadores de las propiedades psicomtricas del instrumento, y de los tems que lo componen, segn los diferentes
valores del constructo de inters. Permite establecer comparaciones entre escala de distintos test que evalan un mismo
constructo, mediante transformaciones lineales o escalares. Estas caractersticas de la TRI le dan ventajas esenciales en
relacin con la Teora Clsica.
Modelos de la TRI/TRL.
Los modelos de la TRI centran su inters en las preguntas.
En la TRI se suelen distinguir tres modelos distintos (teora triparamtrica) en funcin del nmero de parmetros que
estiman:
a) Modelo de un parmetro, tambin llamado modelo de Rash (1PL). Se estima la dificultad del item (b).
b) Modelo de dos parmetros (modelo de Lord y Novick) se estima la dificultad (b) y la discriminacin del item (a)
(2PL).
c) Modelo de tres parmetros, o modelo de Birnbaum (3PL). Este modelo se incluye en la TRI, aunque en esencia puede
considerarse como un enfoque alternativo de la TRI. El modelo de Birnbaum estima la dificultad (b), la discriminacin
(a) y el pseudoazar o adivinacin (c).
Parmetros del tem
Como se ha indicado, los parmetros son tres: dificultad (b), discriminacin (a) y pseudo-azar (c).
El ndice de dificultad se suele indicar con la letra b y se define como:
Psicologa
Pgina 5
Psicometra 1
UBA
es la proporcin de sujetos examinados que responden correctamente a ese tem, sirve para identificar y establecer
cuantitativamente el nivel o grado de dificultad de un tem o pregunta.
el punto de la escala de habilidad donde la probabilidad de responder correctamente el tem es igual a 0,5. Es decir,
que coincide con el grado de habilidad donde la curva seala una proporcin de 50% o una probabilidad de 0,5.
Dicho de otra forma, con ese nivel de habilidad, la persona tienen una proporcin del 50% o una probabilidad del 0,50
de contestar correctamente al tem.
El ndice de discriminacin se suele indicar con la letra a y se define como:
Un tem tiene elevado poder discriminativo si contribuye a la distincin, separacin y diferenciacin, de los sujetos
que puntan alto en el test de los que puntan bajo en el mismo. Es decir, si contribuye a diferenciar individuos que
exhiben el constructo o rasgo de aquellos que no lo exhiben.
hasta que punto la pregunta puede discriminar entre sujetos que tienen un nivel alto de habilidad de aquellos que
tienen un nivel bajo. El ndice de discriminacin se suele representar con la letra a. Esta propiedad se refleja en la
pendiente de la curva, as, una mayor pendiente de la curva CCI del tem indicar una mayor separacin o
discriminacin segn su habilidad y viceversa.
El coeficiente de azar, pseudoazar o adivinacin, se representa con la letra c y se define como:
la probabilidad de contestar correctamente un tem sin tener el nivel de habilidad exigido o la probabilidad que hay de
acertar el tem al azar. Este parmetro trata de representar el efecto del azar.
la probabilidad en los tems de opcin mltiple de que un sujeto de poca habilidad/aptitud conteste un tem
relativamente difcil de manera correcta, lo que hace suponer que lo hizo por azar, es decir adivinando. En este caso
el menor/inferior valor de la curva asinttica representa el mayor valor de probabilidad de responder correctamente en
la seccin negativa o baja de los datos normalizados o tipificados (de 0 a -4, -5, o valores inferiores) que representa
los sujetos de escasa habilidad en el constructo evaluado.
ndice de discriminacin(a)
Tambin se estudia el Parmetro (tita), es la habilidad o nivel de habilidad del sujeto en el rasgo latente/variable
estudiada:
b. Curva caracterstica del tem (CCI): es un elemento fundamental de la TRI porque, por un lado, ofrece una
representacin grfica de las caractersticas del tem, y por otra muestra la relacin entre la habilidad y la respuesta
al tem, en trminos probabilsticos (ver ecuaciones sobre los 3 modelos en la pgina siguiente y las guas sobre
conceptos y problemas de CCI en pdf y Excel).
c. Puntuacin verdadera en el test: se identifica con la suma de las probabilidades estimadas con relacin al nivel de
habilidad para el total de tems del test.
d. Curva caracterstica del test: permite ver de manera grfica, la relacin entre la puntuacin verdadera y
habilidades. La Curva Caracterstica del Test (CCT) muestra la relacin existente entre la puntuacin total en un
test (no solamente en un tem como sucede con la CCI) y el nivel de habilidad de una persona.
Psicologa
Pgina 6
Psicometra 1
UBA
Lineal
Dbiles (fciles de cumplir por los
datos)
No
No
No lineal (curva)
Fuertes (difciles de cumplir por los
datos)
Si
Si
Entre - y +
tem
Curva Caracterstica del tem
Parmetros a, b, c
Funcin de Informacin (vara segn
el nivel de aptitud)
Se recomiendan ms de 500 sujetos,
aunque depende del modelo
Psicologa
Psicometra 1
UBA
para cada calificacin, el nmero de sujetos que acertaron o respondieron correctamente el tem
la proporcin de sujetos/personas en cada nivel de puntuacin/calificacin/nota total del test que
contest correctamente al reactivo.
Calificacin en el
test
-1,55
-0,96
-0,56
0,03
0,62
1,01
1,41
60
75
85
100
115
125
135
99,2857
25,4149
Reactivo/tem 7
# sujetos con esa
calificacin
132
204
276
171
317
357
401
# sujetos que
acertaron el item
2
17
49
86
289
354
398
Proporcin de acertar
(P)
0,02
0,08
0,18
0,50
0,91
0,99
0,99
1,00
0,99
0,99
0,91
0,80
P(O)
0,60
0,50
0,40
0,20
0,18
0,08
0,00
55
0,02
65
75
85
95
105
115
125
135
Calificacin (CI)
Grfica de la regresin tem-test para el reactivo/tem 4 con base a escala decimal (calificacin CI).
Podemos ver que a mayor CI de la persona, mayor es la probabilidad de acertar el tem. A un CI de 100 le
corresponde una probabilidad de acertar de 0,5, y a un CI de 120 le corresponde una probabilidad de 0,99.
El nivel de habilidad del sujeto () (en este caso, CI) puede definirse en cualquier escala, en la grfica
anterior se emple la escala del cociente intelectual, (CI) aunque en la prctica suele emplearse una escala
normalizada/tipificada, con media cero, varianza 1 y un rango de valores de 3 a -3 (ver tabla y grfica anexa).
Psicologa
Pgina 8
Psicometra 1
UBA
(NHS)
Equiv. en CI (aprox.)
CI
-3
60
50-69
-2
75
70-79
-1
0
1
2
3
85
100
115
125
135
80-89
90-109
110-119
120-129
130 o ms
(NHS) como
puntos Z o
valores
tipificados (Z)
Clasificacin
deficiente mental
superficial
limtrofe (borderline o
fronterizo )
subnormal
normal
normal brillante
superior
muy superior
0,99
0,99
0,91
0,80
P(O)
0,60
0,50
0,40
0,180,20
0,08
0,02
-4
-3
0,00
-2
-1
Psicologa
Psicometra 1
UBA
Calificacin
en el test
# sujetos
con esa
calificacin
1,59
1,30
1,01
0,72
0,43
0,14
-0,14
-0,43
-0,72
-1,01
-1,30
-1,59
12
11
10
9
8
7
6
5
4
3
2
1
6,5
3,45205
415
350
330
293
285
260
210
200
167
79
46
32
# sujetos
que
acertaron el
item
415
287
287
205
139
60
21
12
5
0
0
0
Reactivo/tem 13
Proporcin
de acertar
(P)
# sujetos
con esa
calificacin
1
0,82
0,87
0,7
0,49
0,23
0,1
0,06
0,03
0
0
0
415
350
330
293
285
260
210
200
167
79
46
32
# sujetos
que
acertaron el
item
394
217
287
205
139
60
0
0
5
0
0
0
Proporcin
de acertar
(P)
0,95
0,62
0,53
0,16
0,05
0
0
0
0
0
0
0
1
0,9
0,8
Reactivo 7
0,7
0,6
Reactivo 13
0,5
Polinmica (Reactivo 7)
0,4
0,3
Reactivo 13
y = -0,0002x4 + 0,0059x3 - 0,0534x2 + 0,1601x - 0,1282
R = 0,9797
0,2
0,1
0
-0,1
10
12
14
Puntuacin total
Grfica de la regresin tem-test para los reactivos/tem 7 y 13 con base a escala decimal (nota total).
Esta grfica de la regresin tem-test tambin se puede representar empleando la escala de puntuaciones Z
para el eje X, como se presenta a continuacin:
Psicologa
Pgina 10
Psicometra 1
UBA
1,1
Reactivo 7 1
y = -0,0595x4 - 0,0722x3 + 0,2579x2
0,9+ 0,4817x + 0,2065
R = 0,9832
0,8
Reactivo 7
0,7
0,6
Reactivo 13
0,5
Polinmica (Reactivo 7)
0,4
0,3
0,2
0,1
Reactivo 13
y = -0,0226x4 + 0,0714x3 + 0,2474x2 + 0,1223x - 0,0147
R = 0,9797
0
-2
-1,5
-1
-0,5
-0,1 0
0,5
1,5
Psicologa
Pgina 11
Psicometra 1
UBA
-z
En este tipo de funcin logstica, mientras Z toma valores hacia el ms infinito (+1, +2, +3, +4, +), e
genera valores hacia 0 y P(y) produce valores hacia 1 pero sin exceder este valor. En el caso contrario, mientras
-z
Z toma valores hacia el menos infinito (-1, -2, -3, -4, -), e genera valores hacia infinito y P(y) produce
valores hacia 0 pero sin exceder este valor, la cual genera grficas como la siguiente:
Asntota y=1
1,00
0,80
0,60
0,40
0,20
Asntota y=0,1
0,00
-3
-2
-1
Pgina 12
Psicometra 1
UBA
Ecuacin equivalente
Su funcin logstica (figura anterior) es muy similar a la funcin de una curva sigmoide o curva normal
acumulada. La curva caracterstica del tem (CCI) para el modelo de Rasch est dada por la ecuacin siguiente:
en donde:
El nivel de habilidad del sujeto () puede definirse en cualquier escala, en este caso se ha utilizado una
escala tpica, con media 0, varianza 1 y un rango de valores de -4 a +4.
La funcin forma una curva en forma de S inclinada con valores de 0 a 1 en la ordenada (eje Y, expresa
probabilidad) y valores correspondientes a la aptitud o habilidad en la abscisa (eje X, expresa los niveles de
habilidad del sujeto o respondiente, presentados en este caso como valores Z tipificados como -4, -3, -2, 1, 0, 1, 2, 3, 4).
El parmetro b de dificultad es el punto en la escala de aptitud cuya probabilidad de respuesta correcta es
0,5 o dicho de otra forma, es aquel valor de para el cual P()=0,5. Dicho de otra manera, la dificultad del
reactivo define un punto en la escala de habilidad justo en que la probabilidad de xito P() es igual a la
probabilidad de fracaso 1 P(), esto es, un sujeto con un nivel de habilidad igual a la dificultad del reactivo i
(bi), tendr una probabilidad de 0.5 de contestar correctamente este reactivo y, por lo tanto, una probabilidad de
0.5 de responderlo de manera incorrecta.
El parmetro b de dificultad indica la posicin del tem en la escala de aptitud. Cuando ms grande es el
valor de b, mayor es la dificultad para responder correctamente el tem y tambin mayor la aptitud requerida
para que el examinado tenga una P() = 0,5 de resolver correctamente el tem.
Psicologa
Pgina 13
Psicometra 1
UBA
Ntese que las curvas difieren slo en su localizacin a lo largo de la escala de habilidad y que la lnea de las
curvas nunca se cruza entre s. Por esto puede observarse en la grfica anterior que las curvas de los distintos
tems se corren o desplazan hacia la derecha a medida que incrementa el nivel o ndice de dificultad, y se
mueven hacia la izquierda a medida que disminuye este mismo ndice.
Como se mencion anteriormente, la habilidad o aptitud suele transformarse en una escala tipificada Z de
modo que la = 0 y la s = 1 y los valores de b suelen ir de -2 a + 2.
Los tem con b = -2 son muy fciles, los tem con b = +2 muy difciles. En la figura anterior se han
representado 4 CCI de 4 items diferentes, por lo que el grfico representa estos 4 tems, tales que para el tem 1,
b=1; para el item 2, b = 2; para el tem 3, b= -1 y para el item 4, b = 0.
0,9677
0,9939
0,9677
0,9989
0,9939
0,9677
0,8455
0,8455
0,8455
0,8455
0,5000
0,5000
0,5000
0,1545
0,1545
0,9998
0,9989
0,9939
0,9677
0,90
0,80
0,70
0,60
0,50
0,5000
P(0)
Prob.Resp.Corr.b=2(difcil)
0,40
0,30
0,20
0,1545
0,1545
0,10
0,0323
0,0061
0,0011
0,0002
0,0061
0,0011
0,0002
0,0000
-5
-4
-3
0,0323
0,0061
0,0011
-2
0,0323
0,0061
0,00
-1
0,0323
Pgina 14
Psicometra 1
UBA
En este caso, como se dijo anteriormente, mientras toma valores bajos o hacia el menos infinito (-1, -2, -3,
-4, -), el trmino e-D*(-b) genera valores altos (164,0219) o hacia ms infinito y P() produce valores bajos (en
este caso P()=0,0061) o hacia 0 pero sin exceder este valor.
Este bajo valor de la probabilidad de responder correctamente al tem por parte del sujeto es fcil de
entender, ya que una persona de muy baja habilidad en la variable estudiada (=-4) se enfrenta a una pregunta
fcil (b=-1). Si la habilidad estudiada o medida es inteligencia, para este tipo de persona, de escasos recursos
intelectuales, toda pregunta ser difcil y tiene una alta probabilidad de contestarla mal y una baja probabilidad
de contestarla correctamente (en este caso P()=0,0061).
El caso contrario tambin es cierto. Si deseamos estimar la probabilidad de contestar correctamente (P()) un
tem/pregunta muy difcil (b=2) por parte de una persona nivel genio (=4), procedemos de la siguiente manera:
(para D = 1,7, = 4 y b= 2).
En este caso, como se dijo anteriormente, mientras toma valores altos o hacia el mas infinito (+1, +2, +3,
+4, +), el trmino e-D*(-b) genera valores bajos (0,0333) y P() produce valores altos (en este caso
P()=0,9677) o hacia 1 pero sin exceder este valor.
Como ya dijimos, este alto valor de la probabilidad de responder correctamente al tem (P()) por parte del
sujeto es fcil de entender, ya que si una persona de muy elevada habilidad en la variable estudiada (=+4) se
enfrenta a una pregunta muy difcil (b=+2) le resulta fcil responderla o superarla exitosamente. Como un
ejemplo, si la habilidad estudiada o medida es inteligencia, para este tipo de persona, de muy altos recursos
intelectuales (tipo Einstein o Stephen Hawking), toda pregunta ser fcil y tiene una alta probabilidad de
contestarla bien (en este caso P()=0,9677) y una baja probabilidad de contestarla incorrectamente.
Para realizar estos clculos en su calculadora CASIO, puede introducir la siguiente frmula:
a) (1/(1+e^(-1.7*(-4-(-1))))) cuyo resultado ser 0,0061 y
b) (1/(1+e^(-1.7*(4-(2))))) cuyo resultado ser 0,9677.
En las calculadoras CASIO tipo ES puede introducir la frmula directamente y le dar el resultado, aunque
debe introducir los datos con cuidado, pues en algunos casos es fcil equivocarse introduciendo el orden de los
Psicologa
Pgina 15
Psicometra 1
UBA
Ejemplo 2:
(NHS)
como
puntos Z o
valores
tipificados
(Z)
(NHS)
como
puntos Z o
valores
tipificados
(Z)
(NHS)
como
puntos Z o
valores
tipificados
(Z)
(NHS)
como
Psicologa
4
3
2
1
0
-1
-2
-3
-4
4
3
2
1
0
-1
-2
-3
-4
4
3
2
1
0
-1
-2
-3
-4
4
3
b=
b=
b=
b=
-1
-1
-1
-1
-1
-1
-1
-1
-1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
2
2
D(cte)=
D(cte)=
D(cte)=
D(cte)=
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
1,7
P()(4/-1/1,7)=
P()(3/-1/1,7)=
P()(2/-1/1,7)=
P()(1/-1/1,7)=
P()(0/-1/1,7)=
P()(-1/-1/1,7)=
P()(-2/-1/1,7)=
P()(-3/-1/1,7)=
P()(-4/-1/1,7)=
P()(4/0/1,7)=
P()(3/0/1,7)=
P()(2/0/1,7)=
P()(1/0/1,7)=
P()(0/0/1,7)=
P()(0/0/1,7)=
P()(-2/0/1,7)=
P()(-3/0/1,7)=
P()(-4/0/1,7)=
P()(4/1/1,7)=
P()(3/1/1,7)=
P()(2/1/1,7)=
P()(1/1/1,7)=
P()(0/1/1,7)=
P()(-1/1/1,7)=
P()(-2/1/1,7)=
P()(-3/1/1,7)=
P()(-4/1/1,7)=
P()(4/2/1,7)=
P()(3/2/1,7)=
0,9998
0,9989
0,9939
0,9677
0,8455
0,5000
0,1545
0,0323
0,0061
0,9989
0,9939
0,9677
0,8455
0,5000
0,1545
0,0323
0,0061
0,0011
0,9939
0,9677
0,8455
0,5000
0,1545
0,0323
0,0061
0,0011
0,0002
0,9677
0,8455
Pgina 16
Psicometra 1
2
1
0
-1
-2
-3
-4
2
2
2
2
2
2
2
1,7
1,7
1,7
1,7
1,7
1,7
1,7
UBA
P()(2/2/1,7)=
P()(1/2/1,7)=
P()(0/2/1,7)=
P()(-1/2/1,7)=
P()(-2/2/1,7)=
P()(-3/2/1,7)=
P()(-4/2/1,7)=
0,5000
0,1545
0,0323
0,0061
0,0011
0,0002
0,0000
Para ver aplicaciones y problemas de este 1er modelo logstico, leer y consultar las guas en formato pdf y Excel
enviadas a su correo.
Ecuacin equivalente
Aqu b es, igualmente que en el modelo anterior, el parmetro de posicin o dificultad. El factor D = 1,7 es
un valor arbitrario introducido para que la funcin logstica sea ajustada a la ojiva normal con una exactitud de
0,01. Adems hay un segundo parmetro a que es el de discriminacin que es la pendiente de la CCI en el punto
b. Los tems con pendiente mayor son ms tiles para separar a los examinados en distintos niveles de aptitud,
que los tems de menor pendiente. El modelo de dos parmetros es pues, una generalizacin del modelo de un
parmetro.
En este segundo parmetro, se estudia el ndice de discriminacin del tem, el cual se suele indicar con la
letra a y se define como la capacidad de diferenciar, distinguir, separar y discriminar a los sujetos que puntan
alto en el test de los que puntan bajo en el mismo. Es decir, si contribuye a diferenciar individuos que exhiben
el constructo o rasgo de aquellos que no lo exhiben, o si el tem discrimina aquellos sujetos que tienen un nivel
alto de habilidad de aquellos que tienen un nivel bajo. Esta propiedad se refleja en la pendiente de la curva, as,
una mayor pendiente de la curva CCI del tem para este segundo parmetro indicar una mayor separacin o
discriminacin segn su habilidad y viceversa.
El modelo logstico de dos parmetros es ms conocido como modelo de Lord. La probabilidad de acertar un
tem depende tanto del nivel de dificultad como del ndice de discriminacin de dicho tem y del nivel del sujeto
en la variable medida (habilidad del sujeto en la caracterstica estudiada, como inteligencia, capacidad motora,
etc.).
La curva caracterstica del tem (CCI) para el modelo de Lord est dada por la ecuacin siguiente:
Psicologa
Pgina 17
Psicometra 1
UBA
en donde:
El nivel de habilidad del sujeto () puede definirse en cualquier escala, en este caso se ha utilizado una
escala tpica, con media 0, varianza 1 y un rango de valores de -4 a +4.
La funcin forma una curva en forma de S inclinada con valores de 0 a 1 en la ordenada (eje Y, expresa
probabilidad) y valores correspondientes a la aptitud o habilidad en la abscisa (eje X, expresa los niveles de
habilidad del sujeto o respondiente, presentados en este caso como valores Z tipificados como -4, -3, -2, 1, 0, 1, 2, 3, 4).
0,80
0,7815
0,99986
0,60
0,40
0,9514
0,2184
0,20
-2
0,0485
0,02135 0,00
1,330E-04
0,00170
3,466E-07
0,00013
9,033E-10
-3
1,000E+00
0,99830
9,999E-01
9,998E-01
9,986E-01
9,915E-01
0,97865
9,514E-01
9,153E-01
-1
Pgina 18
Psicometra 1
UBA
Repetimos esta operacin para los distintos puntos de y podramos dibujar la curva caracterstica del tem
55 (CCI) con los valores correspondientes a P() +3 = 0,9978, P() + 2 = 0,9552, P() + 1 = 0,500, P() 0 =
0,04479, P() -1 = 0,002194, P() -2 = 1,031x10-4, P() -3 = 4,833x10-6.
Algunas observaciones que pueden obtenerse de la grfica anterior son:
1- Al aumentar el nivel de habilidad del sujeto, aumenta su probabilidad de responder correctamente.
2- Al aumentar el nivel de discriminacin de los tems (lnea: azul, menos discriminante/rojo, ms
discriminante), disminuye la probabilidad de responder correctamente para los sujetos de baja habilidad pero
aumenta para los de alta habilidad o constructo a medir.
3- Para sujetos muy inteligentes (> de 2), o muy deficientes (< de -1,5), no influye el nivel de discriminacin
de la pregunta, los primeros (muy inteligentes) respondern bien una pregunta discriminante o n, mientras
que los muy deficientes respondern incorrectamente una pregunta discriminante o n.
4- Los sujetos de baja habilidad en el constructo medido (-1 a 0 NHS) tienen ms probabilidad de responder
correctamente una pregunta de baja discriminacin que una ms discriminante, mientras que los elevada
Psicologa
Pgina 19
Psicometra 1
UBA
habilidad tienen ms probabilidad de responder correctamente una pregunta de alta discriminacin que una
de bajo poder discriminante (paradoja de Lord). Dicho de otra forma, un reactivo supuestamente
discriminante (lnea roja) es ms efectivo en dificultad para aquellas personas de habilidad alta y ms fcil
para personas de habilidad baja.
5- Al incrementar la pendiente de la lnea curva, incrementa el nivel discriminante del tem que representa.
6- El punto en el cual se encuentran las tres (3) curvas representa a (b=0,5) el nivel de dificultad de estas tres
grficas.
La paradoja de Lord puede observarse mejor si incrementamos ligeramente la separacin entre los distintos
valores de a, como se muestra en la siguiente grfica:
1,00
P(O)1 a=0,5 Item 21
(menor pendiente menos
discriminante)
0,80
0,79576
0,99999996
0,98594
0,89331
0,78160
0,70057
0,66374
0,7815
0,60
0,99986
0,50000
P(O)2 a=1 Item 32
(pendiente intermedia,
media discriminacin)
0,41581
0,2184
0,40
0,29943
0,21840 0,20
0,10669
0,04857
0,00260
4,611E-11
-3
0,9999
0,99996283
0,9994
0,9957
0,9677
0,9382
0,92757
0,91529
0,86646
0,07243
0,01406
4,140E-08
-2
0,9514
0,0485
3,717E-050,00
-1
Para calcular P() se procede como a continuacin, para D = 1,7, = -4 (bajo nivel de habilidad), b= -1
(preguntas fciles), a = 1,5 (escasamente discriminante):
En este caso, como se dijo anteriormente, mientras toma valores bajos o hacia el menos infinito (-1, -2, -3,
-4, -), el trmino e-D*a*(-b) genera valores altos (2100,6456) o hacia ms infinito y P() produce valores bajos
Psicologa
Pgina 20
Psicometra 1
UBA
(en este caso P()=0,0004758) o hacia 0 pero sin exceder este valor.
Este bajo valor de la probabilidad de responder correctamente al tem por parte del sujeto es fcil de
entender, ya que una persona de muy baja habilidad en la variable estudiada (=-4) se enfrenta a una pregunta
fcil (b=-1) y escasamente discriminante (a = 1,5). Si la habilidad estudiada o medida es inteligencia, para este
tipo de persona, de escasos recursos intelectuales, toda pregunta ser difcil y tiene una alta probabilidad de
contestarla mal y una baja probabilidad de contestarla correctamente (en este caso P()=0,00047).
El caso contrario tambin es cierto. Si deseamos estimar la probabilidad de contestar correctamente (P()) un
tem/pregunta muy difcil (b=2) y escasamente discriminante (a = 1,5) por parte de una persona nivel genio
(=4), procedemos de la siguiente manera: (para D = 1,7, = 4, b= 2 y a = 1,5).
En este caso, como se dijo anteriormente, mientras toma valores altos o hacia el mas infinito (+1, +2, +3,
+4, +), el trmino e-D*a*(-b) genera valores bajos (0,0061) y P() produce valores altos (en este caso
P()=0,9939) o hacia 1 pero sin exceder este valor.
Como ya dijimos, este alto valor de la probabilidad de responder correctamente al tem (P()) por parte del
sujeto es fcil de entender, ya que si una persona de muy elevada habilidad en la variable estudiada (=+4) se
enfrenta a una pregunta muy difcil (b=+2) y escasamente discriminante (a = 1,5) le resulta fcil responderla o
superarla exitosamente. Como un ejemplo, si la habilidad estudiada o medida es inteligencia, para este tipo de
persona, de muy altos recursos intelectuales (tipo Einstein o Stephen Hawking), toda pregunta ser fcil y tiene
una alta probabilidad de contestarla bien (en este caso P()=0,9939) y una baja probabilidad de contestarla
incorrectamente.
Para realizar estos clculos en su calculadora CASIO, puede introducir la siguiente frmula:
a) (1/(1+e^(-1.7*1.5*(-4-(-1))))) cuyo resultado ser 0,00047 y
b) (1/(1+e^(-1.7*1.5*(4-(2))))) cuyo resultado ser 0,9939.
En las calculadoras CASIO tipo ES puede introducir la frmula directamente y le dar el resultado, aunque
debe introducir los datos con cuidado, pues en algunos casos es fcil equivocarse introduciendo el orden de los
elementos de la ecuacin:
Ejemplo 1:
Ejemplo 2:
En el programa EXCEL, usted puede usar la siguiente ecuacin: =(1/(1+EXP((-1*$B$118*$B$116)*(B136$B$117)))) siendo $B$118 la constante D (D=1.7), $B$116 el parmetro a, B136 el factor y $B$117 el
Psicologa
Pgina 21
Psicometra 1
UBA
parmetro b.
TEORA DE RESPUESTA AL TEM. PROBABILIDAD DE RESPONDER CORRECTAMENTE AL ITEM
(P()) SEGN MODELO LOGISTICO (modelo de Birnbaum). 3er PARMETRO (c coeficiente de azar,
pseudoazar o adivinacin, b ndice de dificultad y a ndice de discriminacin).
Este modelo de tres parmetros es el ms general y el ms realista desde el punto de vista emprico de los
tres, en realidad los otros dos son casos particulares, as cuando el parmetro c (pseudoazar) es cero la ecuacin
de este modelo se transforma en el modelo de dos parmetros o de Lord, y cuando adems el parmetro a
(discriminacin) es igual para todos los tems (caso tpico, a=1), se convierte en el modelo de Rasch. Vase a
continuacin las frmulas equivalentes del modelo logstico de tres parmetros, donde P() es la probabilidad
de acertar el tem, es la puntuacin en la variable medida, a, b y c son los tres parmetros descritos, e es la
base de los logaritmos neperianos (2,72) y D es una constante que vale 1,7.
Ecuacin o frmula:
Ecuacin equivalente
Donde:
Pi()= es la probabilidad de que un examinado
elegido al azar con aptitud conteste
correctamente el tem i.
= nivel de habilidad del sujeto o valor del
constructo o variable latente que se desea estimar
en cada examinado.
a = ndice de discriminacin del tem i.
b = parmetro o ndice de la dificultad del tem i
c = coeficiente de azar, pseudoazar o adivinacin
D = constante de la ecuacin (D=1,7).
El nivel de habilidad del sujeto () puede definirse en cualquier escala, en este caso se ha utilizado una
escala tpica, con media 0, varianza 1 y un rango de valores de -4 a +4.
En este caso, la funcin forma una curva en forma de S inclinada y alargada (dependiendo del valor de
c) con valores de 0 a 1 en la ordenada (eje Y, expresa probabilidad) y valores correspondientes a la aptitud o
habilidad en la abscisa (eje X, expresa los niveles de habilidad del sujeto o respondiente, presentados en este
caso como valores Z tipificados como -4, -3, -2, -1, 0, 1, 2, 3, 4).
Ya que el coeficiente de azar, pseudoazar o adivinacin c representa la probabilidad de acertar un tem
cuando el examinado contesta al azar o dicho de otro modo, la probabilidad de contestar correctamente un tem
por azar sin tener el nivel de habilidad exigido, mientras mayor sea el nmero de veces que el sujeto usa el azar
para responder correctamente el tem estudiado, mayor ser el nivel o altura de la seccin inicial de la curva,
ya que los respondientes que carecen del constructo o rasgo requerido sern los que empleen esta estrategia a
fin de contesta correctamente el tem evaluado, mientras que los que posean la habilidad requerida no usarn
este mtodo aleatorio para responder adecuadamente el reactivo estudiado.
Es interesante el observar que mientras menor es el uso del azar por parte del sujeto, las curvas obtenidas se
parecen mucho a las representadas por el segundo parmetro a. Esto confirma el hecho de que si el ndice c
tuviese un valor de 0, la ecuacin completa se transformara en la ecuacin del primer parmetro b, y, basados
en esto, observar el efecto que tiene sobre la pendiente de las distintas grficas los diferentes valores del
segundo parmetro a y el parmetro b.
Psicologa
Pgina 22
Psicometra 1
UBA
3, 0,9985
2, 0,9808
0,90
1, 0,8034
0,80
0,70
0,60
0,50
0,40
0,30
0, 0,2966
0,20
-1, 0,1192
0,10
-2, 0,1015
-3, 0,1001
0,00
-3
-2
-1
Pgina 23
Psicometra 1
UBA
En este caso, como se dijo anteriormente, mientras toma valores bajos o hacia el menos infinito (-1, -2, -3,
-4, -), el trmino e-D*a*(-b) genera valores altos (2100,6456) o hacia ms infinito y P() produce valores
medianos (en este caso P()=0,40028) o cercanos a 0 pero sin exceder este valor.
Este mediano valor de la probabilidad de responder correctamente al tem por parte del sujeto es fcil de
entender, ya que una persona de muy baja habilidad en la variable estudiada (=-4) se enfrenta a una pregunta
fcil (b=-1), escasamente discriminante (a = 1,5) y que emplea frecuentemente el azar tiene una mediana
probabilidad de responder correctamente el tem. Si la habilidad estudiada o medida es inteligencia, para este
tipo de persona, de escasos recursos intelectuales, toda pregunta ser difcil y tiene una alta probabilidad de
contestarla mal, por lo que recurre al azar para incrementarla (en este caso P()=0,400285).
El caso contrario tambin es cierto. Si deseamos estimar la probabilidad de contestar correctamente (P()) un
tem/pregunta muy difcil (b=2), escasamente discriminante (a = 1,5) por parte de una persona nivel genio (=4)
que casi no usa el azar (c=0), procedemos de la siguiente manera: (para D = 1,7, = 4, b= 2, a = 1,5 y c = 0).
En este caso, como se dijo anteriormente, mientras toma valores altos o hacia el mas infinito (+1, +2, +3,
+4, +), el trmino e-D*a*(-b) genera valores bajos (0,0061) y P() produce valores altos (en este caso
P()=0,9939) o hacia 1 pero sin exceder este valor.
Como ya dijimos, este alto valor de la probabilidad de responder correctamente al tem (P()) por parte del
sujeto es fcil de entender, ya que si una persona de muy elevada habilidad en la variable estudiada (=+4) se
enfrenta a una pregunta muy difcil (b=+2) y escasamente discriminante (a = 1,5) le resulta fcil responderla o
superarla exitosamente sin emplear el azar. Como un ejemplo, si la habilidad estudiada o medida es inteligencia,
para este tipo de persona, de muy altos recursos intelectuales (tipo Einstein o Stephen Hawking), toda pregunta
Psicologa
Pgina 24
Psicometra 1
UBA
ser fcil y tiene una alta probabilidad de contestarla bien sin necesidad de ponerse a adivinar nada (en este caso
P()=0,9939) y una muy baja probabilidad de contestarla incorrectamente.
Debe recalcarse la idea de que cuando se asume que el parmetro de azar, c, (modelo de 3 parmetros o de
Birnbaum) es igual a cero se obtiene el modelo de dos parmetros, (modelo de 2 parmetros o de Lord y
Novick)en el que las CCI difieren en trminos de su dificultad y de su discriminacin (parmetros b y a
respectivamente). Si adems de asumir c = 0 se supone tambin que el parmetro de discriminacin, a, es
constante para todos los tems, se obtiene el modelo de un parmetro o modelo de Rasch, en el que las CCI se
diferencian nicamente en trminos de sus niveles de dificultad (parmetro b).
Es importante en este punto tambin mencionar que en los modelos de dos y tres parmetros pueden existir
diferentes estimaciones de , el constructo, para individuos con la misma puntuacin emprica en la prueba. Por
ejemplo, dos personas pueden lograr el mismo nmero de respuestas correctas en la prueba, pero an as
obtener estimaciones muy diferentes para su nivel en el constructo , probado que hayan tenido un patrn
diferencial de respuesta, es decir, que no hayan respondido correctamente los mismos tems. Esto sucede as
porque el procedimiento para estimar en los modelos de dos y tres parmetros le da mayor ponderacin a
aquellos tems que tienen mayor discriminacin. Por tanto, dado el mismo nmero de respuestas correctas,
examinados que han respondido correctamente tems de mayor poder discriminatorio obtendrn estimaciones de
superiores a las estimaciones obtenidas para examinados que contestaron correctamente tems de menor
calidad tcnica. La Teora Clsica de los Tests no disfruta de esta propiedad y en ella no es posible diferenciar
las puntuaciones de individuos que hayan obtenido el mismo nmero de respuestas correctas en el instrumento.
Para realizar estos clculos en su calculadora CASIO, puede introducir la siguiente frmula:
a) 0,4+(1-0,4)*(1/(1+e^(-1.7*1.5*(-4-(-1))))) cuyo resultado ser 0,400285 y
b) 0+(1-0)*(1/(1+e^(-1.7*1.5*(4-(2))))) cuyo resultado ser 0,9939.
En el programa EXCEL, usted puede usar la siguiente ecuacin: =$B$120+(1-$B$120)*(1/(1+EXP((1*$B$118*$B$116)*(B136-$B$117)))) siendo =$B$120 el parmetro c, $B$118 la constante D (D=1.7),
$B$116 el parmetro a, B136 el factor y -$B$117 el parmetro b.
Para ver aplicaciones y problemas de estos 3 modelos logsticos, leer guas en formato pdf y Excel enviadas
a su correo.
Leer:
Eiliana Montero (2000). La teora de respuesta a los items: una moderna alternativa para el anlisis
psicomtrico de instrumentos de medicin. Revista de matemtica: teora y aplicaciones 2000 7(1-2): 217-228.
CIMPA-UCR-CCS.
Psicologa
Pgina 25