Está en la página 1de 25

Prof.

René Castro Psicometría 1 UBA

Unidad III. TEORÍA DE LOS TEST.
Contenido: Orígenes y desarrollo de la Teoría Clásica De Tests (TCT), Teoría de la Respuesta al Ítem
(TRI/TRL). Modelos de la TRI/TRL. Curva característica del ítem (CCI).
Introducción
¿Por qué y para qué tienen los psicólogos en su carrera la asignatura de Psicometría dedicada fundamentalmente a
exponer las teorías en las que se basan los test psicológicos?. La razón es bien sencilla, los tests son instrumentos de
medida sofisticados mediante los cuales los psicólogos llevan a cabo inferencias y toman decisiones sobre aspectos
importantes de las personas. Por tanto hay que asegurarse de que esas inferencias son adecuadas y pertinentes, de lo
contrario se puede perjudicar notablemente a las personas que acuden a los psicólogos por la razón que sea. Las teorías
estadísticas de los tests van a permitir la estimación de las propiedades psicométricas de los tests para de ese modo
garantizar que las decisiones tomadas a partir de ellos son las adecuadas. Sin esas teorías no podríamos estimar la
fiabilidad y la validez de los tests, lo cual es imprescindible para poder usar los tests de forma rigurosa y científica.
Hay dos grandes enfoques o teorías a la hora de construir y analizar los tests, son la Teoría Clásica de los Tests (TCT)
y el enfoque de la Teoría de Respuesta a los Ítems (TRI) o la Teoría del rasgo Latente (TRL). No se trata aquí de llevar a
cabo exposiciones detalladas de estas teorías, sino de subrayar los aspectos claves, para que así los usuarios de los tests
tengan una idea más cabal y comprendan en profundidad el alcance de las propiedades psicométricas de los tests que están
utilizando.
TEORÍA CLÁSICA DE TESTS (TCT)
El enfoque clásico (TCT) es el predominante en la construcción y análisis de los tests, así, por ejemplo, los diez tests
más utilizados por los psicólogos (16PF, WISC, WAIS, MMPI, Beck, STAI, Rorschach, Raven, Bender e ISRA) han sido
desarrollados bajo la óptica clásica. Sólo este dato ya deja bien patente la necesidad de que los profesionales entiendan
perfectamente la lógica clásica, sus posibilidades y sus limitaciones.
El psicólogo, como cualquier otro profesional de otro campo, tiene que asegurarse de que el instrumento que utiliza
mide con precisión, con poco error.
Todos esos instrumentos han de estar homologados, estandarizado o tipificados, y requieren algún indicador del grado
de precisión con el que miden, máxime los tests, ya que apoyados en ellos se toman decisiones muy importantes para las
vidas de las personas. Cuando un psicólogo aplica un test a una persona, o a varias, lo que obtiene son las puntuaciones
empíricas que esa persona o personas obtienen en el test, pero eso nada nos dice sobre el grado de precisión de esas
puntuaciones, no sabemos si esas puntuaciones empíricas obtenidas se corresponden o no con las puntuaciones que
verdaderamente le corresponden a esa persona en la prueba. Bien podría ocurrir que las puntuaciones estuviesen, por
ejemplo, algo rebajadas debido a que ese día la persona no está en sus mejores condiciones, o porque las condiciones
físicas en las que se desarrolló la aplicación de la prueba no eran las más adecuadas, o porque las relaciones establecidas
entre los aplicadores de las pruebas y las personas evaluadas dejaron mucho que desear. Los psicólogos, estamos
obligados a garantizar que las puntuaciones de nuestros tests sean precisas, tengan poco error, el problema es que esto no
se sabe escrutando directamente las puntuaciones que obtienen las personas en los tests, esas puntuaciones vistas así de
frente no nos dicen nada acerca de su grado de precisión. Como no lo podemos hacer así de frente, es por lo que tenemos
que dar algunos rodeos, es decir, es por lo que tenemos que plantear algunos modelos que subyacen a las puntuaciones a
fin de ser capaces de estimar el grado de precisión de éstas. El error está mezclado con la verdadera puntuación, y para
separarlos necesitamos llevar a cabo algunos procesos y ahí es donde entran las teorías o modelos estadísticos. Modelos
para esto ha habido muchos, pero uno de los que se ha mostrado más eficaz y parsimonioso es el modelo lineal clásico
propuesto originalmente por Spearman. Se caracteriza porque su énfasis está orientado por la cantidad de respuestas
correctas. Es la principal información que se obtiene de la TCT.

Psicología Página 1

Prof. René Castro Psicometría 1 UBA

Modelo Lineal Clásico
Spearman propone un modelo muy simple, de sentido común, para las puntuaciones de las personas en los tests, y que
ha dado en llamarse modelo lineal clásico. Consiste en asumir que la puntuación que una persona obtiene en un test, que
denominamos su puntuación empírica, y que suele designarse con la letra X, está formada por dos componentes, por un
lado la puntuación verdadera de esa persona en ese test (V), sea la que sea, y por otro un error (e), que puede ser debido a
muchas causas que se nos escapan y que no controlamos. Lo dicho puede expresarse formalmente así: X = V + e. Este
tipo de modelo define relaciones lineales entre las variables en estudio, hecho que lo diferencia respecto a la Teoría de la
Respuesta al Item, que define una relación curva entre las variables en estudio.
ORÍGENES Y DESARROLLO DE LA TEORÍA CLÁSICA DE TESTS (TCT)
Como consecuencia del auge, uso y aplicación logrados u obtenidos por los tests psicológicos, surge la necesidad de
desarrollar un marco teórico que sirva de fundamento a las puntuaciones obtenidas por los sujetos cuando a estos se les
aplican estas pruebas, posibiliten la validación de las interpretaciones e inferencias realizadas a partir de ella, y permita la
estimación de los errores de medida inherentes a todo proceso de medición a través del desarrollo de una serie de
modelos.
Así, se desarrolló un marco teórico general, la Teoría de los Tests, que va a permitir establecer una relación funcional
entre las variables observables a partir de las puntuaciones empíricas obtenidas por los sujetos en los tests o en los ítems
que los componen y las variables inobservables definidas como los constructos.
La Teoría Clásica de los Test (TCT) se desarrolló, fundamentalmente, a partir de las aportaciones de Francis Galton,
Pearson y Spearman que giran en torno a tres conceptos básicos:
 las puntuaciones/medidas empíricas u observadas (X)
 las puntuaciones/medidas verdaderas (V)
 y las puntuaciones debidas al error (e)
El objetivo central era encontrar un modelo estadístico que fundamentase adecuadamente las puntuaciones de los tests
y permitiera la estimación de los errores de medida asociados a todo proceso de medición realizado en el campo
psicológico o educativo para inferir (estimar) el nivel real de los sujetos en el rasgo que mide el test. Estos errores son
aleatorios y pueden venir de distintas fuentes. Mientras menor sea el error cometido, mayores sean las
puntuaciones/medidas verdaderas (V), mayor será la confiabilidad del test empleado.
El modelo lineal de Spearman, es un modelo aditivo en el que la puntuación observada (variable dependiente) de un
sujeto en un test (X) es el resultado de la suma de dos componentes: su puntuación verdadera (variable independiente) en
el test (V) y el error (e) (variable interviniente, interfiriente o extraña).
X=V+e
Donde:
X= Puntuación observada (variable dependiente) de un sujeto en un test
V= Puntuación verdadera (variable independiente) de esa persona en el test
E=error que puede ser debido a muchas causas que se nos escapan y que no controlamos (variable interfiriente)
A partir de este modelo y unas asunciones mínimas, la TCT desarrollará todo un conjunto de deducciones encaminadas
a estimar la cuantía del error que afecta a las puntuaciones de los tests.
Supuestos:
1. El primer supuesto es definir la puntuación (V) como la esperanza matemática de la puntuación empírica (X), que
formalmente se escribe así:
V = E(X)
Lo que esto significa conceptualmente es que se define la puntuación verdadera (V) de una persona en un test como
aquella puntuación que obtendría como media si se le aplicara infinitas veces el test. Se trata de una definición teórica,

Psicología Página 2

serán las deducciones que luego se hagan a partir de ellas las que permitan confirmarlas o falsearlas. Dicho de otro modo. es decir. E(e) = 0 c) Las puntuaciones verdaderas no covarían con los errores. De nuevo se trata de un supuesto en principio razonable.e2) = 0 o también r(ej. que el valor de la puntuación verdadera de una persona no tiene nada que ver con el error que afecta esa puntuación. Formalmente se escribe así: r(e1. que no existe relación entre la cuantía de las puntuaciones verdaderas de las personas y el tamaño de los errores que afectan a esas puntuaciones. pero no se pueden comprobar empíricamente de forma directa. la puntuación media que esa persona sacase en el test sería su verdadera puntuación. ek) = 0. no hay ninguna razón para pensar que los errores cometidos en una ocasión vayan a covariar sistemáticamente con los cometidos en otra ocasión. o lo que es igual. bien podemos decir hoy que las ideas de Spearman han sido de gran utilidad para la psicología. que formalmente puede expresarse así: r(v. Psicología Página 3 . pero parece plausible pensar que si esto se hiciese. En el segundo supuesto. entendiendo por ello aquellos tests que miden lo mismo exactamente pero con distintos ítems. Partiendo de esos tres supuestos del modelo.Vk) f) La varianza de las puntuaciones empíricas es igual a la varianza de las verdaderas más los errores: S2(X) = S2(V) + S2(e) g) La correlación entre las puntuaciones empíricas y los errores es igual al cociente entre la desviación típica de los errores y la de las empíricas. rxe = Se/S Estas asunciones parecen razonables y sensatas. no hay conexión entre el tamaño de la puntuación verdadera y el tamaño de los errores. se establecen las siguientes deducciones: a) El error de medida (e) es la diferencia entre la puntuación empírica (X) y la verdadera (V). Tras cien años de formuladas y con muchos resultados empíricos detrás. Cov(V. René Castro Psicometría 1 UBA nadie va a pasar infinitas veces un test a nadie. se formula una definición de lo que son Tests Paralelos. puede haber puntuaciones verdaderas altas con errores bajos. Es decir.e) = 0 3. y también serían iguales las varianzas de los errores de medida. En otras palabras. por razones obvias.Xk) = cov(Vj.V) = S2(V) e) La covarianza entre las puntuaciones empíricas de dos test es igual a la covarianza entre las verdaderas: cov(Xj. Además del modelo y de estos tres supuestos. 2.Prof. luego son errores insesgados. e = X-V b) La esperanza matemática de los errores de medida es cero. la correlación entre los errores de medida (re1e2) que afectan a las puntuaciones de los sujetos en dos test diferentes es igual a cero. Spearman asume que la correlación existente entre las puntuaciones verdaderas de "n" sujetos en un test y los errores de medida es igual a cero. Las puntuaciones verdaderas de las personas en los tests paralelos serían las mismas.e) = 0 d) La covarianza entre las puntuaciones empíricas y las verdaderas es igual a la varianza de las verdaderas: cov(X. El tercer supuesto establece que los errores de medida de las personas en un test no están relacionados con los errores de medida de las personas en otro test distinto. o altos.

Teoría de la Respuesta al Item (TRI/TRL) Dentro del campo de la Teoría de los Tests Psicométricos han aparecido distintas denominaciones que en la actualidad toman el nombre de "Teoría de la Respuesta al Item (TRI)" (Teoría del Rasgo Latente (TRL) o Teoría de Respuesta al Reactivo (TRR)) cuyo principal autor fue Frederic M. Este nuevo enfoque de la TRI va a suponer un gran avance para la medición psicológica. No hay duda que lo más deseable científicamente sería que los resultados obtenidos al utilizar distintos instrumentos estuviesen en la misma escala. pregunta o afirmación tienen significados similares. La segunda gran cuestión no bien resuelta dentro del marco clásico era la ausencia de invarianza de las propiedades de los tests respecto de las personas utilizadas para estimarlas. no podemos decir en sentido estricto qué persona es más inteligente. como las Universidades de Costa Rica y el Instituto Tecnológico en Costa Rica. propiedades psicométricas importantes de los tests. puede observarse que ítem. Además. constituyen el conjunto central de la Teoría Clásica de los Tests. lo cual resulta inadmisible desde el punto de vista de una medición rigurosa. Esto significa que si un psicólogo evalúa la inteligencia de tres personas distintas con un test diferente para cada persona. o los coeficientes de fiabilidad dependen en gran medida del tipo de muestra utilizada para calcularlos. Para hacerlo se transforman las puntuaciones directas de los tests en otras baremadas. los métodos basados en la llamada Teoría Clásica de los Tests han sido utilizados para el análisis de calidad técnica de instrumentos de medición psicométricos. y la definición de tests paralelos propuesta. por ejemplo en percentiles. propiciando un gran desarrollo de nuevos conceptos y herramientas psicométricas. reactivo. con lo que se considera que se pueden ya comparar. por lo que no es conveniente comparar la inteligencia de personas que han sido evaluadas con distintos tests de inteligencia. Este problema también encontrará una solución adecuada dentro del marco de la TRI. psicometrista del Servicio de Pruebas Educacionales quién aportó dos libros importantes: Statistical Theories of Mental Test Scores o Teorías Estadísticas de las Puntuaciones Mentales (con Melvin R. tales como la dificultad de los ítems. Por ejemplo. Esta denominación presenta unas diferencias respecto al modelo clásico: 1) la relación entre el valor esperado de las puntuaciones del sujeto y el rasgo (característica responsable de los valores). y de hecho así se hace.Prof. junto con los tres supuestos enunciados. la dificultad de los ítems. o la fiabilidad del test. Tradicionalmente. Psicología Página 4 . Uno de los resultados más importantes que se deriva a partir de los postulados de la Teoría Clásica es el conocido coeficiente de confiabilidad α de Cronbach. también se ha incorporado a las pruebas sumativas que deben presentarse al termino de la educación secundaria (llamadas pruebas de bachillerato). la Teoría Clásica de los Tests se ha aplicado rutinariamente para el análisis y la construcción del banco de ítems de las pruebas de aptitud académica de las principales universidades estatales. En otras palabras. Novick y dos capítulos por Allen Birnbaum. Más recientemente. Eso es precisamente lo que va a conseguir el enfoque de la TRI. Esto es así porque los resultados de los tres tests no están en la misma escala. las mediciones no resultan invariantes respecto al instrumento utilizado. la TRI postula que esta relación es de tipo probabilística. Rasch aportó el desarrollo del primer modelo logístico probabilístico basado en el índice de dificultad de la TRI/TRL. G. Lord (12/1112 -05/02/2000). Este proceder clásico asume que los grupos normativos en los que se elaboraron los baremos de los distintos tests son equiparables. estaban en función del tipo de personas utilizadas para calcularlas. cada test tiene la suya propia. Limitaciones del enfoque clásico. 1968) y Applications of Item Response Theory to Practical Testing Problem (1980) o Aplicaciones de la Teoría de la Respuesta al Item a los problemas prácticos de la prueba. los resultados no son comparables. En algunos países de Latinoamérica. René Castro Psicometría 1 UBA El modelo lineal. no suele ser de tipo lineal. no lineal (curva) y abstracta. En este caso. medida que se usa para juzgar la confiabilidad de un instrumento desde el punto de vista de su consistencia interna. Veamos la primera: dentro del marco clásico. lo cual es difícil de garantizar en la práctica.

los parámetros son tres: dificultad (b). existe una relación no lineal (curva). En cuanto al cálculo estadístico. b) Modelo de dos parámetros (modelo de Lord y Novick) se estima la dificultad (b) y la discriminación del item (a) (2PL). Los test de medida consisten en la selección de informatizada de los ítems que puedan medir mejor la habilidad de un individuo. Parámetros del ítem Como se ha indicado.) de la persona. el constructo o variable latente que interesa medir en los examinados. mediante transformaciones lineales o escalares. Se estima la dificultad del item (b). La Teoría de la Respuesta al Ítem (TRI) tiene algunas ventajas sobre la TCT. que se puede expresar en términos probabilísticos. Permite establecer comparaciones entre escala de distintos test que evalúan un mismo constructo. En la Teoría del Rasgo Latente o Teoría de la Respuesta al Item. También se logran indicadores de las propiedades psicométricas del instrumento. ya que permite obtener más información sobre los ítems de la prueba y sobre la variable psicológica. y el rasgo o habilidad (puede entenderse también como la competencia. esto se consigue si pasamos dos tests acerca de la misma aptitud a un mismo grupo. con la TRI se pueden generar pruebas adaptadas al nivel de los individuos. la puntuación verdadera es aquel valor que se espera de la puntuación observada. A la hora de aplicar los tests se pueden obtener dos cosas distintas. actitud. René Castro Psicometría 1 UBA 2) pretende hacer predicciones individuales sin necesidad de hacer referencia a las características del grupo normativo.Prof. que esta Teoría de la Respuesta al Item proporciona la posibilidad de describir de forma separada tanto a los items como a los individuos. En la TRI se suelen distinguir tres modelos distintos (teoría triparamétrica) en función del número de parámetros que estiman: a) Modelo de un parámetro. discriminación (a) y pseudo-azar (c). solo indirectamente. actitud. aunque en esencia puede considerarse como un enfoque alternativo de la TRI. Este modelo se incluye en la TRI. y de los ítems que lo componen. Vemos. Algunas aplicaciones de la TRI han consistido en la creación de bancos de ítems y los diseños de tests a la medida del sujeto o test adaptativos computadorizados (TAC). además considera que la respuesta que da el sujeto depende del nivel de habilidad que tenga en el rango considerado. Modelos de la TRI/TRL. Según Lord. El modelo de Birnbaum estima la dificultad (b). Otros conceptos fundamentales en la TRI son la Función de Información y el Error Estándar de Medición. la puntuación verdadera y la escala de aptitud. también llamado modelo de Rash (1PL). El origen de estos modelos se deben a Lazarsfeld. etc. pues. la discriminación (a) y el pseudoazar o adivinación (c). Este rasgo no es medible directamente. o modelo de Birnbaum (3PL). c) Modelo de tres parámetros. El conjunto de cálculos que se aplican para ello determina los distintos modelos y resultados de la TRI. Desde aquí se considera que cada individuo tiene un parámetro individual el cual es el responsable de las características del sujeto. Estas características de la TRI le dan ventajas esenciales en relación con la Teoría Clásica. de ahí que el parámetro individual reciba el nombre de variable latente. denominadas también "rasgo". el cual introdujo el término "rasgo latente”. según los diferentes valores del constructo de interés. 1950. la puntuación verdadera y la aptitud son la misma cosa pero expresadas en diferentes escalas de medición. la TRI utiliza un modelo matemático logístico para describir la relación entre el nivel de habilidad del examinado y la probabilidad que éste dé una respuesta correcta a un ítem del test. La Teoría de la Respuesta al Item (TRI) o Teoría del Rasgo Latente (TRL) asume que entre la respuesta que una persona ofrece a una pregunta o prueba. El índice de dificultad se suele indicar con la letra “b” y se define como: Psicología Página 5 . Además. Los modelos de la TRI centran su interés en las preguntas.

Parámetros específicos de los ítems:  Índice de dificultad (b)  Probabilidad de acierto al azar (c)  Índice de discriminación(a)  Error por descuido. en términos probabilísticos (ver ecuaciones sobre los 3 modelos en la página siguiente y las guías sobre conceptos y problemas de CCI en pdf y Excel). Puntuación verdadera en el test: se identifica con la suma de las probabilidades estimadas con relación al nivel de habilidad para el total de ítems del test. Psicología Página 6 .50 de contestar correctamente al ítem.5. es decir adivinando. El índice de discriminación se suele indicar con la letra “a” y se define como:  Un ítem tiene elevado poder discriminativo si contribuye a la distinción. René Castro Psicometría 1 UBA  es la proporción de sujetos examinados que responden correctamente a ese ítem. así.  la probabilidad en los ítems de opción múltiple de que un sujeto de poca habilidad/aptitud conteste un ítem relativamente difícil de manera correcta. una mayor pendiente de la curva CCI del ítem indicará una mayor separación o discriminación según su habilidad y viceversa.  el punto de la escala de habilidad donde la probabilidad de responder correctamente el ítem es igual a 0.Prof.  hasta que punto la pregunta puede discriminar entre sujetos que tienen un nivel alto de habilidad de aquellos que tienen un nivel bajo. La TRI genera una serie de resultados de especial interés: a. pseudoazar o adivinación. separación y diferenciación. Dicho de otra forma. o valores inferiores) que representa los sujetos de escasa habilidad en el constructo evaluado. lo que hace suponer que lo hizo por azar. El coeficiente de azar. El índice de discriminación se suele representar con la letra “a”. y por otra muestra la relación entre la habilidad y la respuesta al ítem. por un lado.5. ofrece una representación gráfica de las características del ítem. La Curva Característica del Test (CCT) muestra la relación existente entre la puntuación total en un test (no solamente en un ítem como sucede con la CCI) y el nivel de habilidad de una persona. Curva característica del ítem (CCI): es un elemento fundamental de la TRI porque. la persona tienen una proporción del 50% o una probabilidad del 0. la relación entre la puntuación verdadera y habilidades. si contribuye a diferenciar individuos que exhiben el constructo o rasgo de aquellos que no lo exhiben. En este caso el menor/inferior valor de la curva asintótica representa el mayor valor de probabilidad de responder correctamente en la sección negativa o baja de los datos normalizados o tipificados (de 0 a -4. Este parámetro trata de representar el efecto del azar. sirve para identificar y establecer cuantitativamente el nivel o grado de dificultad de un ítem o pregunta. c. con ese nivel de habilidad. Es decir. es la habilidad o nivel de habilidad del sujeto en el rasgo latente/variable estudiada: b. También se estudia el Parámetro θ (tita). -5. Esta propiedad se refleja en la pendiente de la curva. de los sujetos que puntúan alto en el test de los que puntúan bajo en el mismo. se representa con la letra “c” y se define como:  la probabilidad de contestar correctamente un ítem sin tener el nivel de habilidad exigido o la probabilidad que hay de acertar el ítem al azar. que coincide con el grado de habilidad donde la curva “señala” una proporción de 50% o una probabilidad de 0. Es decir. Curva característica del test: permite ver de manera gráfica. d.

hacemos lo mismo con los que obtuvieron 75.85. Aspectos Teoría Clásica (TCT) Teoría de Respuesta a los Items (TRI) Modelo Lineal No lineal (curva) Asunciones Débiles (fáciles de cumplir por los Fuertes (difíciles de cumplir por los datos) datos) Invarianza de las mediciones No Si Invarianza de las propiedades del No Si test Escala de las puntuaciones Entre 0 y la puntuación máxima del Entre -∞ y +∞ test Énfasis Test Ítem Relación Ítem-Test Sin especificar Curva Característica del Ítem Descripción de los ítems Índices de Dificultad y de Parámetros a. La siguiente tabla y gráfica muestra la proporción de acertar el ítem dentro de cada grupo de personas.28) y de la desviación estándar (σ = 25. COMPARACIÓN DE LA TEORÍA CLÁSICA CON LA TRI En la siguiente tabla. σ  el número de sujetos que obtuvieron cada una de esas calificaciones Psicología Página 7 . Tanto la dificultad (b). René Castro Psicometría 1 UBA e.02. la capacidad discriminatoria (a) como el pseudoazar (c) se pueden representarse simultáneamente. que se puede expresar en términos probabilísticos. Nivel de información: es un indicador de la precisión de la estimación.41) de esas calificaciones mediante la fórmula Z = (Xi . se sintetizan las principales diferencias y similitudes entre el enfoque clásico o Teoría Clásica de los Test TCT) y la Teoría de la Respuesta al Ítem (TRI). se entonces calcula la proporción 2/132. y el rasgo o habilidad (puede entenderse también como la competencia. actitud. En la siguiente tabla se presentan:  las calificaciones posibles u obtenidas en el test (de 60 a 135.) de la persona. c Discriminación Errores de medida Error típico de medida común para Función de Información (varía según toda la muestra el nivel de aptitud) Tamaño Muestral Puede funcionar bien con muestras Se recomiendan más de 500 sujetos. la puntuación o calificación obtenida en el test y en el eje y. la proporción de respuestas correctas obtenidas por los sujetos/participantes/respondientes para cada ítem/reactivo. en forma gráfica. en el eje x. 100.Prof. 125 y 135. tomada de Muñiz (1997a). que es 0. actitud. El rendimiento de un ítem concreto sería: 132 personas obtuvieron 60 en el test. etc. La Teoría de la Respuesta al Item (TRI) o Teoría del Rasgo Latente (TRL) asume que entre la respuesta que una persona ofrece a una pregunta o prueba. entre 200 y 500 sujetos aunque depende del modelo aproximadamente TEORÍA DE LA RESPUESTA AL ÍTEM/REACTIVO (TRI/R). denominadas Xi)  su correspondiente puntuación Z obtenida de la media ( = 99. y que se representa mediante un diagrama de regresión ítem – test. en este tipo de diagrama. En un primer ejemplo tomaremos un test de inteligencia aplicado a muchas personas. el cual presenta. existe una relación no lineal (curva). de estas solo 2 lo contestaron bien. 115. La mayor puntuación fue 135 y la menor 60. b.

5.99 0.08 -0.91 1.50 0. (CI) aunque en la práctica suele emplearse una escala normalizada/tipificada.02 55 65 75 85 95 105 115 125 135 Calificación (CI) Gráfica de la regresión ítem-test para el reactivo/ítem 4 con base a escala decimal (calificación CI).4149 Regresión ítem-test: proporción de acertar el ítem dentro de cada grupo de personas.60 0. René Castro Psicometría 1 UBA  para cada calificación.99 1. Podemos ver que a mayor CI de la persona.02 -0.18 0. y a un CI de 120 le corresponde una probabilidad de 0.55 60 132 2 0.00 0.03 100 171 86 0.08 0. A un CI de 100 le corresponde una probabilidad de acertar de 0.20 0. el número de sujetos que acertaron o respondieron correctamente el ítem  la proporción de sujetos/personas en cada nivel de puntuación/calificación/nota total del test que contestó correctamente al reactivo.01 125 357 354 0.20 1.99.Prof. El nivel de habilidad del sujeto (θ) puede definirse en cualquier escala.40 0. mayor es la probabilidad de acertar el ítem. 1.18 0. con media cero.56 85 276 49 0.2857 σ 25.91 Proporción de acertar (P) 0.41 135 401 398 0.00 0.80 P(O) 0.62 115 317 289 0. Tabla con datos de la regresión ítem-test para el reactivo/ítem 4. en la gráfica anterior se empleó la escala del cociente intelectual.99 99.99 0.50 0. Reactivo/ítem 7 Calificación en el Puntuación Z # sujetos con esa # sujetos que Proporción de acertar test calificación acertaron el item (P) -1.96 75 204 17 0. varianza 1 y un rango de valores de 3 a -3. Psicología Página 8 .

en CI (aprox.Prof. René Castro Psicometría 1 UBA θ (NHS) Equiv. consideremos un test o prueba hipotética de 12 ítems/reactivos que requieren respuestas cortas del tipo de respuesta abierta o libre.40 0.20 0.20 1.4520) de esas calificaciones mediante la fórmula Z = (Xi . el número de sujetos que acertaron o respondieron correctamente los ítems en estudio (7 y 13)  la proporción de sujetos/personas en cada nivel de puntuación/calificación/nota total del test que contestó correctamente a cada uno de los dos reactivos (7 y 13).60 0.02 0.91 Proporción de acertar (P) 0. En la siguiente tabla se presentan:  las calificaciones posibles en el test (de 12 a 1)  su correspondiente puntuación Z obtenida de la media ( = 6.180.50 0.99 0. Psicología Página 9 .5) y de la desviación estándar (σ = 3.00 0. Como segundo ejemplo.80 P(O) 0. σ  el número de sujetos que obtuvieron cada una de esas calificaciones  para cada calificación.00 -4 -3 -2 -1 0 1 2 3 4 Calificación normalizada o tipificada del CI Gráfica de la regresión ítem-test para el reactivo/ítem 4 con base en la escala Z (CI).99 0. como las pruebas de vocabulario de las escalas de inteligencia de aplicación individual. 1.) CI Clasificación deficiente mental -3 60 50-69 superficial limítrofe (borderline o θ (NHS) como -2 75 70-79 fronterizo ) puntos Z o -1 85 80-89 subnormal valores 0 100 90-109 normal tipificados (Z) 1 115 110-119 normal brillante 2 125 120-129 superior 3 135 130 o más muy superior Proporción de acertar el ítem dentro de cada grupo de personas.08 0.

5 0.30 11 350 287 0.01 10 330 287 0.0534x2 + 0.49 285 139 0. René Castro Psicometría 1 UBA Tabla con datos de la regresión ítem-test para los reactivos/ítem 7 y 13.9 Proporcuón de respuestas correctas R² = 0.0059x3 .0091x3 .87 330 287 0.53 0.4 Polinómica (Reactivo 7) 0.1 1 Reactivo 7 y = -0.9832 0.95 1.8 Reactivo 7 0.0004x4 + 0.7 293 205 0.1282 R² = 0.1 0 0 2 4 6 8 10 12 14 -0. Esta gráfica de la regresión ítem-test también se puede representar empleando la escala de puntuaciones Z para el eje X.1601x .01 3 79 0 0 79 0 0 -1.06 200 0 0 -0.82 350 217 0.0517 0. como se presenta a continuación: Psicología Página 10 .0.1 Puntuación total Gráfica de la regresión ítem-test para los reactivos/ítem 7 y 13 con base a escala decimal (nota total).05 0.72 4 167 5 0. Reactivo/ítem 7 Reactivo/ítem 13 Puntuación Calificación # sujetos # sujetos # sujetos Proporción # sujetos Proporción Z en el test que que con esa de acertar con esa de acertar acertaron el acertaron el calificación (P) calificación (P) item item 1.0957x .3 Reactivo 13 Polinómica (Reactivo 13) 0.0.45205 Regresión item-test: proporción de acertar P(θ) Reactivos 7 y 13 1.0503x2 + 0.0.1 210 0 0 -0.5 σ 3.59 1 32 0 0 32 0 0 6.62 1.2 y = -0.14 6 210 21 0.7 0.16 0.03 167 5 0 -1.0002x4 + 0.9797 0.43 8 285 139 0.30 2 46 0 0 46 0 0 -1.Prof.23 260 60 0 -0.59 12 415 415 1 415 394 0.0.72 9 293 205 0.6 Reactivo 13 0.43 5 200 12 0.14 7 260 60 0.

en escala Z es aproximadamente 0. disminuye la probabilidad del sujeto para responder correctamente y aumenta la probabilidad de responder incorrectamente.5) en el eje horizontal. René Castro Psicometría 1 UBA Regresión ítem-test: proporción de acertar P(θ) Reactivos 7 y 13 1. se demuestra así que las personas con una calificación aproximada de 8 (en escala decimal.0) en el caso del reactivo 13.5) de aprobar el reactivo 7. al aumentar la dificultad del ítem. En estas gráficas puede observarse que el grado de dificultad de cada reactivo puede definirse como su umbral del 50% o proporción de respuestas correctas 0. sobre el que se localizan las puntuaciones totales correspondientes.5) tienen una oportunidad de 50-50 (50% o 0. más difícil). Esto se ha usado en las figuras anteriores al trazar líneas perpendiculares desde los puntos en los que las curvas de ambos reactivos cruzan la línea del 50% (o 0.0714x3 + 0. esto implicaría que el reactivo 7 es “más fácil” de responder bien que el reactivo 13.5 1 1.2 Reactivo 13 y = -0.1 Proporción de respuestas correctas P(θ) Reactivo 7 1 y = -0.3 Polinómica (Reactivo 13) 0.7 0.1223x . La pendiente de la curva indica la capacidad discriminativa de cada reactivo. Puede observarse en la gráfica que al aumentar la dificultad de los ítems.6 Reactivo 13 0.5.2065 R² = 0.0595x4 .1 R² = 0.1 0 0. Para decirlo de otra forma. el respondiente necesita una mayor habilidad o destreza para poder responder correctamente el 50% de las veces que conteste el ítem.5 2 Puntuación total (escala Z) Gráfica de la regresión ítem-test para los reactivos/ítem 7 y 13 con base en la escala Z (nota total). entre mayor sea la pendiente o grado de “inclinación positiva.5 Polinómica (Reactivo 7) 0.2474x2 + 0. mayor será la relación entre la ejecución o desempeño correcto con la puntuación total y mayor el índice discriminativo. al igual que las personas con una calificación aproximada de 10 (en escala decimal. línea rojo.2579x2 0. Psicología Página 11 . en escala Z es aproximadamente 1. Pudiera decirse que al aumentar el nivel de dificultad de los items (línea: azul más fácil.Prof.4817x + 0.4 0.9797 0 -2 -1.0226x4 + 0. ya sea en escala decimal o escala Z. mientras que al disminuir el nivel de dificultad de la pregunta.9832 0.0722x3 + 0.5 -0. las curvas tienden a desplazarse hacia la derecha. la curva tiende a moverse hacia la izquierda de la gráfica.9+ 0.0.0.5 -1 -0. alza o levantamiento” de la curva.0147 0. También puede observarse que los trazados de las pendientes centrales de las gráficas son similares entre sí. por lo que la capacidad discriminativa es aproximadamente similar en las 2 gráficas.8 Reactivo 7 0.

e genera valores hacia 0 y P(y) produce valores hacia 1 pero sin exceder este valor.1 y y=1) 1.Prof. la cual genera gráficas como la siguiente: Curva del Modelo Logístico (asíntotas y=0. +∞). -4. mientras Z toma valores hacia el más infinito (+1. En el caso contrario.80 0. -2. 1. mientras -z Z toma valores hacia el menos infinito (-1.20 Asíntota y=1 P(y) Prob. +2. las dos asíntotas serían y = 1 y y = 0. el cálculo de la probabilidad de acertar al ítem o dar una respuesta acertada/correcta se calcula principalmente empleando funciones logísticas.60 0.20 Asíntota y=0.40 0. -3. -∞). Correcta. Psicología Página 12 . +3. o sea. +4. En la TRI. e genera valores hacia infinito y P(y) produce valores hacia 0 pero sin exceder este valor. Resp.00 0.00 -3 -2 -1 0 1 2 3 Valores tipificados (Z) En este caso.1. según la siguiente ecuación general: -z En este tipo de función logística. aquellas funciones que generan curvas sigmoideas con crecimiento entre dos asíntotas horizontales (ver gráfica anexa). René Castro Psicometría 1 UBA PROBABILIDAD DE ACERTAR AL ÍTEM / REACTIVO O DAR UNA RESPUESTA ACERTADA/CORRECTA SEGÚN MODELO LOGISTICO.1 0.

con media 0. La función forma una curva en forma de S inclinada con valores de 0 a 1 en la ordenada (eje Y. Psicología Página 13 .5 o dicho de otra forma. como inteligencia. La distribución logística se define como una función tal que: Su función logística (figura anterior) es muy similar a la función de una curva sigmoide o curva normal acumulada. Ecuación o fórmula: Ecuación equivalente Para este primer parámetro. una probabilidad de 0. la dificultad del reactivo define un punto en la escala de habilidad justo en que la probabilidad de éxito P(θ) es igual a la probabilidad de fracaso 1 – P(θ). presentados en este caso como valores Z tipificados como -4σ. 1960). tendrá una probabilidad de 0. expresa los niveles de habilidad del sujeto o respondiente.5 de resolver correctamente el ítem.5. por lo tanto. El modelo logístico de un parámetro es más conocido como modelo de Rasch (1963). en este caso se ha utilizado una escala típica. El parámetro b de dificultad es el punto en la escala de aptitud θ cuya probabilidad de respuesta correcta es 0. expresa probabilidad) y valores correspondientes a la aptitud o habilidad θ en la abscisa (eje X. esto es. La probabilidad de acertar un ítem depende solamente del nivel de dificultad de dicho ítem y del nivel del sujeto en la variable medida (habilidad del sujeto en la característica estudiada. un sujeto con un nivel de habilidad θ igual a la dificultad del reactivo i (bi). capacidad motora.718 El nivel de habilidad del sujeto (θ) puede definirse en cualquier escala. etc. se estudia el índice de dificultad del ítem. mayor es la dificultad para responder correctamente el ítem y también mayor la aptitud requerida para que el examinado tenga una P(θ) = 0. -2σ.5 de responderlo de manera incorrecta. 4σ). 3σ. Cuando más grande es el valor de b. correctamente el ítem i. 2σ. -3σ. varianza 1 y un rango de valores de -4 a +4. e = base de los logaritmos neperianos o naturales= θ = nivel de habilidad del sujeto.). - 1σ. René Castro Psicometría 1 UBA TEORÍA DE RESPUESTA AL ÍTEM. La curva característica del ítem (CCI) para el modelo de Rasch está dada por la ecuación siguiente: en donde: Pi(θ)= es la probabilidad de que un examinado b = parámetro o índice de la dificultad del ítem i elegido al azar con aptitud θ conteste D = constante de la ecuación (D=1.Prof. El parámetro b de dificultad indica la posición del ítem en la escala de aptitud. PROBABILIDAD DE RESPONDER CORRECTAMENTE AL ITEM (P(θ)) SEGÚN MODELO LOGISTICO (modelo de Rasch.5 de contestar correctamente este reactivo y.7). es aquel valor de θ para el cual P(θ)=0. Dicho de otra manera. 2. 0σ. 1er PARÁMETRO (b índice de dificultad). Este es el modelo más simple de todos. 1σ.

0011 0.80 P(O) Prob. b=-1 0. no influye el nivel de dificultad de la pregunta.9989 0. tales que para el ítem 1.Corr. b=0 0. Psicología Página 14 .1545 0.70 (medio) 0.Al aumentar el nivel de dificultad de los items (línea: rojo. disminuye la probabilidad del sujeto para responder correctamente y aumenta la probabilidad de responder incorrectamente. la habilidad o aptitud θ suele transformarse en una escala tipificada Z de modo que la = 0 y la s = 1 y los valores de b suelen ir de -2 a + 2. las curvas tienden a desplazarse hacia la derecha.5000 0.9677 P(O) Prob. Corr.Resp.40 Prob.9677 0. 1er parámetro b 1.9677 0. mientras que al disminuir el nivel de dificultad de la pregunta. mientras que los muy deficientes tienen una baja probabilidad de responder correctamente una pregunta fácil.Al aumentar el nivel de habilidad del sujeto.9998 0.1545 0.0002 0. para el item 2. morado. los primeros (muy inteligentes) tienen una alta probabilidad de responder bien una pregunta fácil.20 0. los ítem con b = +2 muy difíciles. la pendiente central y la inclinación final son iguales entre todas las 4 gráficas.10 0. media o difícil.5000 P(0) 0. Curva Característica del Item (CCI).5000 0.0323 0. la curva inicial. Los ítem con b = -2 son muy fáciles.8455 0.0323 0. b = 0.0011 0.5000 0.0061 0.0000 0. por lo que el gráfico representa estos 4 ítems.Corr.00 0.b=2(difícil) 0. fácil/azul. En la figura anterior se han representado 4 CCI de 4 items diferentes.Prof. b= -1 y para el item 4.90 (fácil) 0.8455 0. Resp. También puede observarse que el trazado de las gráficas es igual entre sí.0002 0. medio/verde. aumenta su probabilidad de responder correctamente. Corrcta. medio difícil. b=1. Por esto puede observarse en la gráfica anterior que las curvas de los distintos ítems se corren o desplazan hacia la derecha a medida que incrementa el nivel o índice de dificultad.0061 0. difícil). Resp.60 P(O) Prob.30 0.Para sujetos muy inteligentes (o muy deficientes). y se mueven hacia la izquierda a medida que disminuye este mismo índice.9939 0.0011 0.0061 0.Corr.1545 0.0323 0.50 0. media o difícil. b = 2.1545 0. b=1 (medio difícil) 0.0061 0. para el ítem 3.9939 0.0323 0. Como se mencionó anteriormente.8455 0. René Castro Psicometría 1 UBA Nótese que las curvas difieren sólo en su localización a lo largo de la escala de habilidad y que la línea de las curvas nunca se cruza entre sí. 2.00 -5 -4 -3 -2 -1 0 1 2 3 4 5 Nivel Habilidad del sujeto (θ NHS) tipificado (Z) Algunas observaciones que pueden obtenerse de esta gráfica son: 1.Resp. P(O) Prob.8455 0.9939 0.Resp.9989 0. 3. la curva tiende a moverse hacia la izquierda de la gráfica.9677 0. Puede observarse en la gráfica que al aumentar la dificultad de los ítems.

este alto valor de la probabilidad de responder correctamente al ítem (P(θ)) por parte del sujeto es fácil de entender. mientras θ toma valores bajos o hacia el menos infinito (-1. para D = 1.9677.0333) y P(θ) produce valores altos (en este caso P(θ)=0. -∞).0061 y b) (1/(1+e^(-1. Si deseamos estimar la probabilidad de contestar correctamente (P(θ)) un ítem/pregunta muy difícil (b=2) por parte de una persona nivel genio (θ=4).7*(-4-(-1))))) cuyo resultado será 0. de muy altos recursos intelectuales (tipo Einstein o Stephen Hawking). el término e-D*(θ-b) genera valores altos (164. el término e-D*(θ-b) genera valores bajos (0.9677) y una baja probabilidad de contestarla incorrectamente. René Castro Psicometría 1 UBA Para calcular P(θ) se procede como a continuación. -4. ya que si una persona de muy elevada habilidad en la variable estudiada (θ=+4) se enfrenta a una pregunta muy difícil (b=+2) le resulta fácil responderla o superarla exitosamente. Si la habilidad estudiada o medida es inteligencia. aunque debe introducir los datos con cuidado.0219) o hacia más infinito y P(θ) produce valores bajos (en este caso P(θ)=0. En las calculadoras CASIO tipo ES puede introducir la fórmula directamente y le dará el resultado. procedemos de la siguiente manera: (para D = 1.9677) o hacia 1 pero sin exceder este valor. toda pregunta será fácil y tiene una alta probabilidad de contestarla bien (en este caso P(θ)=0.7. puede introducir la siguiente fórmula: a) (1/(1+e^(-1. +4.0061). En este caso. θ = 4 y b= 2). El caso contrario también es cierto. como se dijo anteriormente. -2. θ = -4 y b= -1: En este caso. -3. Como ya dijimos. Como un ejemplo. Este bajo valor de la probabilidad de responder correctamente al ítem por parte del sujeto es fácil de entender.0061) o hacia 0 pero sin exceder este valor. +2. pues en algunos casos es fácil equivocarse introduciendo el orden de los Psicología Página 15 . Para realizar estos cálculos en su calculadora CASIO.7. para este tipo de persona. como se dijo anteriormente. si la habilidad estudiada o medida es inteligencia. +3. ya que una persona de muy baja habilidad en la variable estudiada (θ=-4) se enfrenta a una pregunta fácil (b=-1). mientras θ toma valores altos o hacia el mas infinito (+1. +∞). de escasos recursos intelectuales. para este tipo de persona.7*(4-(2))))) cuyo resultado será 0. toda pregunta será difícil y tiene una alta probabilidad de contestarla mal y una baja probabilidad de contestarla correctamente (en este caso P(θ)=0.Prof.

9989 θ (NHS) 2 -1 1.7 P(θ)(-1/1/1.7 P(θ)(-2/1/1.0323 -3 0 1.7 P(θ)(4/1/1.7)= 0.0323 -4 -1 1.7)= 0.7 P(θ)(3/2/1.7)= 0.7 P(θ)(4/2/1.7)= 0.Prof.1545 (Z) -2 0 1.7)= 0.7)= 0.7 P(θ)(4/-1/1.7)= 0.7 P(θ)(-3/0/1.8455 como 1 1 1.7 P(θ)(0/1/1.7)= 0.7)= 0.7 P(θ)(-3/-1/1.5000 valores tipificados -1 0 1.7 P(θ)(-2/0/1.0011 -4 1 1.0002 θ (NHS) 4 2 1. B143 el factor θ y D143 el parámetro b.7)= 0. usted puede usar la siguiente ecuación: =(1/(1+EXP((-1*F143)*(B143-D143)))) siendo F143 la constante D (D=1.7 P(θ)(0/0/1.7 P(θ)(1/0/1.7 P(θ)(1/1/1.7)= 0.9939 θ (NHS) 2 0 1.7)= 0.7)= 0.0061 -4 0 1.7 P(θ)(-4/1/1.7 P(θ)(3/-1/1.9989 3 0 1.7)= 0.7)= 0.9677 puntos Z o 0 b= -1 D(cte)= 1.9677 b= D(cte)= como 3 2 1.7)= 0.7)= 0.7 P(θ)(-2/-1/1.0011 4 1 1.7 P(θ)(-4/-1/1.1545 valores tipificados -1 1 1.7)= 0.7)= 0.7 P(θ)(2/-1/1.0323 (Z) -2 1 1.9998 3 -1 1.7)= 0.5000 (Z) -2 -1 1.7)= 0.7)= 0.7 P(θ)(4/0/1.7 P(θ)(2/1/1. René Castro Psicometría 1 UBA elementos de la ecuación y por tanto obtener un valor incorrecto de probabilidad: Ejemplo 1: Ejemplo 2: En el programa EXCEL.8455 Psicología Página 16 .7)= 0.7 P(θ)(-3/1/1.7)= 0.7)= 0.9677 como 1 0 1.7 P(θ)(2/0/1.9677 θ (NHS) 2 1 1.7)= 0.7).0061 4 0 1.7 P(θ)(1/-1/1.7)= 0.9939 3 1 1.7 P(θ)(-1/-1/1.7 P(θ)(0/0/1.8455 puntos Z o 0 b= 0 D(cte)= 1.7)= 0.1545 -3 -1 1. Los datos con los cuales se realizó la curva anterior fueron los siguientes: 4 -1 1.8455 valores tipificados -1 -1 1.7 P(θ)(3/1/1.9939 como 1 -1 1.0061 -3 1 1.7 P(θ)(-4/0/1.7)= 0.7 P(θ)(0/-1/1.5000 puntos Z o 0 b= 1 D(cte)= 1.7 P(θ)(3/0/1.

7)= 0.7 P(θ)(-3/2/1.0061 -2 2 1. En se sustituyó el modelo de dos parámetros de la ojiva normal por una función logística que tiene la ventaja de ser más conveniente para manejar. como inteligencia. TEORÍA DE RESPUESTA AL ÍTEM.7 P(θ)(1/2/1. igualmente que en el modelo anterior. pero lo hizo basándose en una distribución normal.Prof. separar y discriminar a los sujetos que puntúan alto en el test de los que puntúan bajo en el mismo.). PROBABILIDAD DE RESPONDER CORRECTAMENTE AL ITEM (P(θ)) SEGÚN MODELO LOGISTICO (modelo de Lord). leer y consultar las guías en formato pdf y Excel enviadas a su correo. La curva característica del ítem (CCI) para el modelo de Lord está dada por la ecuación siguiente: Psicología Página 17 .1545 tipificados 0 2 1. distinguir.7 P(θ)(-1/2/1.0323 (Z) -1 2 1. una generalización del modelo de un parámetro. una mayor pendiente de la curva CCI del ítem para este segundo parámetro indicará una mayor separación o discriminación según su habilidad y viceversa. capacidad motora.7)= 0. Este modelo modificado está dado por la siguiente ecuación: Ecuación o fórmula: Ecuación equivalente Aquí b es.0002 -4 2 1. o si el ítem discrimina aquellos sujetos que tienen un nivel alto de habilidad de aquellos que tienen un nivel bajo. En este segundo parámetro. que los ítems de menor pendiente.1980) fue el primero en elaborarlo. si contribuye a diferenciar individuos que exhiben el constructo o rasgo de aquellos que no lo exhiben. Es decir. el parámetro de posición o dificultad. Esta propiedad se refleja en la pendiente de la curva.7)= 0.01. La probabilidad de acertar un ítem depende tanto del nivel de dificultad como del índice de discriminación de dicho ítem y del nivel del sujeto en la variable medida (habilidad del sujeto en la característica estudiada.7 P(θ)(2/2/1.5000 valores 1 2 1. René Castro Psicometría 1 UBA puntos Z o 2 2 1.7)= 0.7)= 0. etc. Actualmente este modelo es poco usado por su complicación matemática. El modelo logístico de dos parámetros es más conocido como modelo de Lord. 2do PARÁMETRO (b índice de dificultad y a índice de discriminación). Lord (1968. Además hay un segundo parámetro a que es el de discriminación que es la pendiente de la CCI en el punto b. Los ítems con pendiente mayor son más útiles para separar a los examinados en distintos niveles de aptitud.7)= 0.0011 -3 2 1.7)= 0. el cual se suele indicar con la letra “a” y se define como la capacidad de diferenciar.0000 Para ver aplicaciones y problemas de este 1er modelo logístico. El factor D = 1. El modelo de dos parámetros es pues. así.7 P(θ)(0/2/1.7 P(θ)(-2/2/1.7 es un valor arbitrario introducido para que la función logística sea ajustada a la ojiva normal con una exactitud de 0. se estudia el índice de discriminación del ítem.7 P(θ)(-4/2/1. El modelo de la ojiva normal supone integración mientras que el modelo logístico no.

en este caso se ha utilizado una escala típica.2184 0.718 El nivel de habilidad del sujeto (θ) puede definirse en cualquier escala. pendiente menos discriminante) 0. 2σ. 2.99986 0.99830 0.60 P(O)2 a=2.7815 P(O)3 a=3. -2σ. René Castro Psicometría 1 UBA en donde: Pi(θ)= es la probabilidad de que un examinado elegido b = parámetro o índice de la dificultad del ítem i al azar con aptitud θ conteste correctamente el ítem i. Curva Característica del Item (CCI) 2do parámetro a 1. D = constante de la ecuación (D=1.40 0.00170 0. -3σ.000E+00 0. 0σ. media discriminación) 0.915E-01 9.5 Item 32 (pendiente intermedia.153E-01 P(O) Prob.00 9.998E-01 9.5 Item 43 (mayor pendiente más discriminante) 0. Psicología Página 18 . expresa los niveles de habilidad del sujeto o respondiente. Resp. presentados en este caso como valores Z tipificados como -4σ. varianza 1 y un rango de valores de -4 a +4. el ítem es menos discriminativo (curva azul) y separa en menor grado a los sujetos que poseen la habilidad de los que no la tienen.97865 9.00 0.00013 9.80 0. con media 0. 1σ. - 1σ. (curva roja) el ítem es más discriminativo y separa en mayor grado a los sujetos que poseen la habilidad de los que no la tienen. A mayor pendiente o menor grado de inclinación de la curva. 4σ).514E-01 P(O)1 a=1. e = base de los logaritmos neperianos o naturales= a = índice de discriminación del ítem i. 3σ.Prof.02135 0.7).999E-01 9.033E-10 3. La función forma una curva en forma de S inclinada con valores de 0 a 1 en la ordenada (eje Y. θ = nivel de habilidad del sujeto.466E-07 1.330E-04 -3 -2 -1 0 1 2 3 Nivel Habilidad del sujeto (NHS) tipificado (Z) A mayor grado de inclinación o menor pendiente de la curva.0485 0.986E-01 1.20 0. Corrcta.5 Item 21 (menor 9.9514 0. expresa probabilidad) y valores correspondientes a la aptitud o habilidad θ en la abscisa (eje X.

5σ). René Castro Psicometría 1 UBA El parámetro “a” de discriminación separa/desglosa/distingue/diferencia a los sujetos que tienen un nivel alto de habilidad en el constructo o rasgo medido en el ítem de aquellos que tienen un nivel bajo de habilidad en el constructo evaluado y se refleja o representa en el grado o nivel de la pendiente de la curva. -1 0.Los sujetos de baja habilidad en el constructo medido (-1 a 0 NHS) tienen más probabilidad de responder correctamente una pregunta de baja discriminación que una más discriminante.9978.833x10-6.Prof. y. tenemos: Repetimos esta operación para los distintos puntos de θ y podríamos dibujar la curva característica del ítem 55 (CCI) con los valores correspondientes a P(θ) +3 = 0. mientras que los muy deficientes responderán incorrectamente una pregunta discriminante o nó. más discriminante). a=1. 3.8. tales que para el ítem 21. Esto confirma el hecho de que si el índice b tuviese un valor de 1.5. Como se mencionó anteriormente.5 son muy discriminantes. a = 1. la ecuación completa se transformaría en la ecuación del primer parámetro b. por lo que el gráfico representa estos 3 ítems. Los ítem con a = 1. no influye el nivel de discriminación de la pregunta. así. P(θ) + 2 = 0. A fin de ejercitarnos en el cálculo de la CCI empleando lo ecuación equivalente. a = 2.04479.5.Para sujetos muy inteligentes (> de 2σ). P(θ) + 1 = 0. b = 1 ¿Cuál es la probabilidad del ítem en los valores de θ = -3. En la figura anterior se han representado 3 CCI de 3 ítems diferentes. 2.5. supongamos que tenemos un ítem (55) para el que hemos obtenido los parámetros a y b y queremos saber la probabilidad en distintos puntos para trazar la curva CCI. menos discriminante/rojo. 4.500.Al aumentar el nivel de discriminación de los ítems (línea: azul. los ítem con a = 3. para el ítem 43. la habilidad o aptitud θ suele transformarse en una escala tipificada Z de modo que la = 0 y la s = 1 y los valores de b suelen ir de 1 a 4. P(θ) -3 = 4. los primeros (muy inteligentes) responderán bien una pregunta discriminante o nó.031x10-4. 3. para el ítem 32. .002194.5 en este caso). una mayor pendiente de la curva CCI del ítem indicará una mayor separación o discriminación según su habilidad y viceversa. Algunas observaciones que pueden obtenerse de la gráfica anterior son: 1. observar el efecto que tiene sobre la pendiente de las distintas gráficas los diferentes valores del segundo parámetro “a”. P(θ) 0 = 0. basados en esto. 1. P(θ) -1 = 0.? Aplicando nuestros valores a la ecuación anterior. b) una mayor separación de las personas o sujetos que son capaces de responder acertadamente por poseer el constructo evaluado de los que no lo poseen ni manifiestan. a= 3. El proceso en este caso sería el siguiente: Item 55: D = 1. o muy deficientes (< de -1. vale decir para θ = 3.5 son poco discriminantes. hecho que se traduce en a) un mayor incremento y demanda de habilidades en el constructo evaluado por parte del sujeto para responder correctamente al ítem y por ende. mientras que los elevada Psicología Página 19 . aumenta su probabilidad de responder correctamente. disminuye la probabilidad de responder correctamente para los sujetos de baja habilidad pero aumenta para los de alta habilidad o constructo a medir. (b = 0.2. 2. P(θ) -2 = 1. Debido a esto puede observarse en la gráfica anterior que las curvas de los distintos ítems con diferentes índices de discriminación presentan disímiles pendientes o inclinaciones en la sección central de sus curvas. Es interesante el observar que todas las curvas convergen en un punto central que representa el valor b o índice de dificultad.9552.Al aumentar el nivel de habilidad del sujeto.7.

El punto en el cual se encuentran las tres (3) curvas representa a (b=0.41581 0.60 0.04857 0. -3.80 0. -2.717E-050.611E-11 0.00 -3 -2 -1 0 1 2 3 Nivel Habilidad del sujeto (NHS) tipificado (Z) Para calcular P(θ) se procede como a continuación.86646 (menor pendiente menos discriminante) 0.99986 0.9994 0. -∞).9957 0. 5.91529 0.21840 0.40 0.9382 0.66374 pendiente más 0. b= -1 (preguntas fáciles).140E-08 3. Resp. Correcta. un reactivo supuestamente discriminante (línea roja) es más efectivo en dificultad para aquellas personas de habilidad alta y más fácil para personas de habilidad baja.10669 0. media discriminación) 0.50000 P(O)2 a=1 Item 32 0.9514 0.20 0.89331 0.00 0.70057 P(O)3 a=4 Item 43 (mayor 0. el término e-D*a*(θ-b) genera valores altos (2100.Prof.9677 P(O) Prob. para D = 1. θ = -4 (bajo nivel de habilidad).5 (escasamente discriminante): En este caso.0485 0.79576 0. mientras θ toma valores bajos o hacia el menos infinito (-1. incrementa el nivel discriminante del ítem que representa.5) el nivel de dificultad de estas tres gráficas.01406 4.00260 4.29943 0.99999996 0. La paradoja de Lord puede observarse mejor si incrementamos ligeramente la separación entre los distintos valores de a.9999 0. Dicho de otra forma. 0. 6.07243 0. a = 1.99996283 0.7815 discriminante) 0.5 Item 21 0. como se muestra en la siguiente gráfica: Curva Característica del Item (CCI) 1.98594 0.92757 P(O)1 a=0.78160 0.6456) o hacia más infinito y P(θ) produce valores bajos Psicología Página 20 .Al incrementar la pendiente de la línea curva. como se dijo anteriormente. -4.7. René Castro Psicometría 1 UBA habilidad tienen más probabilidad de responder correctamente una pregunta de alta discriminación que una de bajo poder discriminante (paradoja de Lord).2184 (pendiente intermedia.

ya que si una persona de muy elevada habilidad en la variable estudiada (θ=+4) se enfrenta a una pregunta muy difícil (b=+2) y escasamente discriminante (a = 1.0061) y P(θ) produce valores altos (en este caso P(θ)=0. René Castro Psicometría 1 UBA (en este caso P(θ)=0. +∞).00047). como se dijo anteriormente.9939) o hacia 1 pero sin exceder este valor.5*(4-(2))))) cuyo resultado será 0.7.5). Este bajo valor de la probabilidad de responder correctamente al ítem por parte del sujeto es fácil de entender. Como ya dijimos. B136 el factor θ y $B$117 el Psicología Página 21 . pues en algunos casos es fácil equivocarse introduciendo el orden de los elementos de la ecuación: Ejemplo 1: Ejemplo 2: En el programa EXCEL. $B$116 el parámetro a. toda pregunta será fácil y tiene una alta probabilidad de contestarla bien (en este caso P(θ)=0.5) le resulta fácil responderla o superarla exitosamente.7*1. si la habilidad estudiada o medida es inteligencia. En este caso. ya que una persona de muy baja habilidad en la variable estudiada (θ=-4) se enfrenta a una pregunta fácil (b=-1) y escasamente discriminante (a = 1. de escasos recursos intelectuales. procedemos de la siguiente manera: (para D = 1. +2. En las calculadoras CASIO tipo ES puede introducir la fórmula directamente y le dará el resultado. aunque debe introducir los datos con cuidado. este alto valor de la probabilidad de responder correctamente al ítem (P(θ)) por parte del sujeto es fácil de entender.0004758) o hacia 0 pero sin exceder este valor.5).9939. el término e-D*a*(θ-b) genera valores bajos (0.7).Prof.9939) y una baja probabilidad de contestarla incorrectamente. Si la habilidad estudiada o medida es inteligencia.00047 y b) (1/(1+e^(-1. +4. +3. Como un ejemplo.5) por parte de una persona nivel genio (θ=4). El caso contrario también es cierto. toda pregunta será difícil y tiene una alta probabilidad de contestarla mal y una baja probabilidad de contestarla correctamente (en este caso P(θ)=0.7*1. b= 2 y a = 1. mientras θ toma valores altos o hacia el mas infinito (+1. para este tipo de persona. θ = 4.5*(-4-(-1))))) cuyo resultado será 0. para este tipo de persona. Si deseamos estimar la probabilidad de contestar correctamente (P(θ)) un ítem/pregunta muy difícil (b=2) y escasamente discriminante (a = 1. usted puede usar la siguiente ecuación: =(1/(1+EXP((-1*$B$118*$B$116)*(B136- $B$117)))) siendo $B$118 la constante D (D=1. de muy altos recursos intelectuales (tipo Einstein o Stephen Hawking). Para realizar estos cálculos en su calculadora CASIO. puede introducir la siguiente fórmula: a) (1/(1+e^(-1.

y. correctamente el ítem i. a. elegido al azar con aptitud θ conteste a = índice de discriminación del ítem i. Psicología Página 22 . varianza 1 y un rango de valores de -4 a +4. René Castro Psicometría 1 UBA parámetro b. Este modelo de tres parámetros es el más general y el más realista desde el punto de vista empírico de los tres. la función forma una curva en forma de “S” inclinada y alargada (dependiendo del valor de “c”) con valores de 0 a 1 en la ordenada (eje Y. -3σ. e es la base de los logaritmos neperianos (2. 0σ. pseudoazar o adivinación “c” representa la probabilidad de acertar un ítem cuando el examinado contesta al azar o dicho de otro modo.7. expresa probabilidad) y valores correspondientes a la aptitud o habilidad θ en la abscisa (eje X. observar el efecto que tiene sobre la pendiente de las distintas gráficas los diferentes valores del segundo parámetro “a” y el parámetro “b”. b índice de dificultad y a índice de discriminación). en este caso se ha utilizado una escala típica. 3er PARÁMETRO (c coeficiente de azar. Es interesante el observar que mientras menor es el uso del azar por parte del sujeto. Véase a continuación las fórmulas equivalentes del modelo logístico de tres parámetros. Esto confirma el hecho de que si el índice c tuviese un valor de 0. θ es la puntuación en la variable medida. donde P(θ) es la probabilidad de acertar el ítem. Ya que el coeficiente de azar. pseudoazar o adivinación constructo o variable latente que se desea estimar D = constante de la ecuación (D=1. a=1). y cuando además el parámetro a (discriminación) es igual para todos los ítems (caso típico. El nivel de habilidad del sujeto (θ) puede definirse en cualquier escala. la ecuación completa se transformaría en la ecuación del primer parámetro b. 4σ).Prof. la probabilidad de contestar correctamente un ítem por azar sin tener el nivel de habilidad exigido. -1σ. las curvas obtenidas se parecen mucho a las representadas por el segundo parámetro “a”. expresa los niveles de habilidad del sujeto o respondiente. mientras que los que posean la habilidad requerida no usarán este método aleatorio para responder adecuadamente el reactivo estudiado. TEORÍA DE RESPUESTA AL ÍTEM. 2σ. En este caso. mayor será el nivel o “altura” de la sección inicial de la curva. Ecuación o fórmula: Ecuación equivalente Donde: Pi(θ)= es la probabilidad de que un examinado en cada examinado. basados en esto. en realidad los otros dos son casos particulares. así cuando el parámetro c (pseudoazar) es cero la ecuación de este modelo se transforma en el modelo de dos parámetros o de Lord. -2σ. PROBABILIDAD DE RESPONDER CORRECTAMENTE AL ITEM (P(θ)) SEGÚN MODELO LOGISTICO (modelo de Birnbaum). mientras mayor sea el número de veces que el sujeto usa el azar para responder correctamente el ítem estudiado. se convierte en el modelo de Rasch. con media 0. 3σ. ya que los respondientes que carecen del constructo o rasgo requerido serán los que empleen esta estrategia a fin de contesta correctamente el ítem evaluado. b y c son los tres parámetros descritos. pseudoazar o adivinación. 1σ.7). presentados en este caso como valores Z tipificados como -4σ. b = parámetro o índice de la dificultad del ítem i θ = nivel de habilidad del sujeto o valor del c = coeficiente de azar.72) y D es una constante que vale 1.

a = 1.5 c=0.1001 -2.20 P(0) a=1. prácticamente no influye o varía la probabilidad de responder adecuadamente el ítem. aumenta su probabilidad de responder correctamente. Para calcular P(θ) se procede como a continuación.50 P(0) a=1. 0.90 0.5 c=0. los ítems con b = 0.30 0.8034 P(O) Prob.Al aumentar el nivel de habilidad del sujeto.60 0.5σ). θ = -4 (bajo nivel de habilidad). 0.00 3. Los ítem con c = 0 representa a sujetos que emplean poco el azar para responder acertadamente.5.Al aumentar el uso del azar para responde adecuadamente el ítems (línea: azul. 0.25. mayor uso azar). En la figura anterior se han representado 3 CCI de 3 ítems diferentes. por lo que el gráfico representa estos 3 ítems. tales que para el ítem azul.5 b=0. incrementa la probabilidad de responder correctamente para los sujetos de baja habilidad y varía poco o nada la probabilidad de los que poseen una alta habilidad o constructo a medir.1192 0.1. c = 0.5 b=0. menor uso azar/rojo.7.4 -3.5 (escasamente discriminante) y c = 0. c= 0. 0. en cambio.9808 0.5 b=0. 0.4 (elevado uso del azar): Psicología Página 23 . 0. en los muy deficientes (< de -0. la habilidad o aptitud θ suele transformarse en una escala tipificada Z de modo que la = 0 y la s = 1 y los valores de c suelen ir de 0 a 0. 2.1 0.Prof. Resp. y para el ítem verde. 0. 3. mediano uso del azar/ línea: verde.00 -3 -2 -1 0 1 2 3 Nivel Habilidad del sujeto (NHS) tipificado (Z) Como se mencionó anteriormente.9985 2. Corrcta.10 0.Para sujetos muy inteligentes (> de 2σ). para D = 1. b= -1 (preguntas fáciles). René Castro Psicometría 1 UBA Curva Característica del Item (3er parámetro c) 1.2966 0.70 0.40 P(0) a=1.80 1. Algunas observaciones que pueden obtenerse de esta gráfica son: 1. para el ítem rojo.5 c=0. 0. ya que los primeros (muy inteligentes) responderán bien una pregunta por sus propias condiciones.1015 -1.25 0.5 representan sujetos que emplean frecuentemente el azar para responder adecuadamente. influye notablemente el nivel de respuesta correcta de la pregunta. c=0.4.

-3. a = 1. toda pregunta Psicología Página 24 .40028) o cercanos a 0 pero sin exceder este valor.0061) y P(θ) produce valores altos (en este caso P(θ)=0. si la habilidad estudiada o medida es inteligencia. el término e-D*a*(θ-b) genera valores altos (2100. +2. ya que una persona de muy baja habilidad en la variable estudiada (θ=-4) se enfrenta a una pregunta fácil (b=-1). -2. +4. de escasos recursos intelectuales. +∞). El caso contrario también es cierto. mientras θ toma valores altos o hacia el mas infinito (+1. de muy altos recursos intelectuales (tipo Einstein o Stephen Hawking). por lo que recurre al azar para incrementarla (en este caso P(θ)=0. este alto valor de la probabilidad de responder correctamente al ítem (P(θ)) por parte del sujeto es fácil de entender. Como ya dijimos. Como un ejemplo. para este tipo de persona. θ = 4.9939) o hacia 1 pero sin exceder este valor. para este tipo de persona. Este mediano valor de la probabilidad de responder correctamente al ítem por parte del sujeto es fácil de entender.400285). -4. Si deseamos estimar la probabilidad de contestar correctamente (P(θ)) un ítem/pregunta muy difícil (b=2).7. Si la habilidad estudiada o medida es inteligencia. como se dijo anteriormente.6456) o hacia más infinito y P(θ) produce valores medianos (en este caso P(θ)=0. ya que si una persona de muy elevada habilidad en la variable estudiada (θ=+4) se enfrenta a una pregunta muy difícil (b=+2) y escasamente discriminante (a = 1. procedemos de la siguiente manera: (para D = 1. como se dijo anteriormente.5) y que emplea frecuentemente el azar tiene una mediana probabilidad de responder correctamente el ítem. escasamente discriminante (a = 1. En este caso.5 y c = 0).5) por parte de una persona nivel genio (θ=4) que casi no usa el azar (c=0). +3.5) le resulta fácil responderla o superarla exitosamente sin emplear el azar. b= 2. -∞). el término e-D*a*(θ-b) genera valores bajos (0. toda pregunta será difícil y tiene una alta probabilidad de contestarla mal. escasamente discriminante (a = 1. mientras θ toma valores bajos o hacia el menos infinito (-1. René Castro Psicometría 1 UBA En este caso.Prof.

(modelo de 3 parámetros o de Birnbaum) es igual a cero se obtiene el modelo de dos parámetros. es constante para todos los ítems. probado que hayan tenido un patrón diferencial de respuesta. La Teoría Clásica de los Tests no disfruta de esta propiedad y en ella no es posible diferenciar las puntuaciones de individuos que hayan obtenido el mismo número de respuestas correctas en el instrumento. Leer: Eiliana Montero (2000). pero aún así obtener estimaciones muy diferentes para su nivel en el constructo θ.4)*(1/(1+e^(-1. Por ejemplo. Para ver aplicaciones y problemas de estos 3 modelos logísticos. es decir. puede introducir la siguiente fórmula: a) 0.9939. Si además de asumir c = 0 se supone también que el parámetro de discriminación.400285 y b) 0+(1-0)*(1/(1+e^(-1. c.4+(1-0.5*(-4-(-1))))) cuyo resultado será 0. para individuos con la misma puntuación empírica en la prueba. Es importante en este punto también mencionar que en los modelos de dos y tres parámetros pueden existir diferentes estimaciones de θ. Debe recalcarse la idea de que cuando se asume que el parámetro de azar. usted puede usar la siguiente ecuación: =$B$120+(1-$B$120)*(1/(1+EXP((- 1*$B$118*$B$116)*(B136-$B$117)))) siendo =$B$120 el parámetro c.Prof. examinados que han respondido correctamente ítems de mayor poder discriminatorio obtendrán estimaciones de θ superiores a las estimaciones obtenidas para examinados que contestaron correctamente ítems de menor calidad técnica.5*(4-(2))))) cuyo resultado será 0.7*1. Esto sucede así porque el procedimiento para estimar θ en los modelos de dos y tres parámetros le da mayor ponderación a aquellos ítems que tienen mayor discriminación.9939) y una muy baja probabilidad de contestarla incorrectamente. $B$118 la constante D (D=1. en el que las CCI se diferencian ´únicamente en términos de sus niveles de dificultad (parámetro b). leer guías en formato pdf y Excel enviadas a su correo. CIMPA-UCR-CCS. se obtiene el modelo de un parámetro o modelo de Rasch. Psicología Página 25 . dos personas pueden lograr el mismo número de respuestas correctas en la prueba. el constructo. Por tanto. B136 el factor θ y -$B$117 el parámetro b. Para realizar estos cálculos en su calculadora CASIO. (modelo de 2 parámetros o de Lord y Novick)en el que las CCI difieren en términos de su dificultad y de su discriminación (parámetros b y a respectivamente). René Castro Psicometría 1 UBA será fácil y tiene una alta probabilidad de contestarla bien sin necesidad de ponerse a adivinar nada (en este caso P(θ)=0. que no hayan respondido correctamente los mismos ítems. En el programa EXCEL.7*1. a. Revista de matemática: teoría y aplicaciones 2000 7(1-2): 217-228. dado el mismo número de respuestas correctas. $B$116 el parámetro a.7). La teoría de respuesta a los items: una moderna alternativa para el análisis psicométrico de instrumentos de medición.