Está en la página 1de 8

Características de la teoría clásica de los tests y Teoría de respuesta a los

ítems

Los tests son procedimientos de recolección de información sobre un individuo o


grupo utilizados habitualmente en Evaluación Psicológica. La construcción de los
mismos se basa en modelos psicométricos que permiten evaluar la calidad de la
medida y dar garantías de la misma. En el campo de la Psicometría, la Teoría de
los Tests constituye el marco de referencia teórico y metodológico que reúne los
modelos que subyacen a la elaboración y uso de tests (Muñiz, 1997). Los modelos
que componen la Teoría de los Tests formalizan las interrelaciones de tres
componentes que intervienen en la medición mediante tests:
 La puntuación observada tras la administración del test (el puntaje total en
un test o la respuesta de un individuo a un ítem),
 Un valor inobservable del dominio o rasgo psicológico que se pretende
medir
 El error de medida que conlleva todo proceso de medición.
Existen dos enfoques principales de la psicometría: la teoría clásica de los tests
(TCT) y la teoría de respuesta al ítem (TRI). El primero, que se conoce también
como modelo de la puntuación verdadera o teoría del error de medición, se
cimentó en las ideas originales de Charles Spearman, cuyas elaboraciones
matemáticas publicadas al inicio del siglo XX implicaban la diferenciación de los
conceptos puntuación verdadera y puntuación observada como resultado de la
aplicación de una prueba.1,2 La TRI, por otro lado, cuyos fundamentos se
elaboraron en la segunda mitad del siglo pasado a partir de las contribuciones
seminales de Louis Guttman, Frederic Lord y George Rasch, aproxima el análisis
de las respuestas en una prueba de forma radicalmente diferente, enfocándose en
los componentes constituyentes de la misma (es decir, los ítems) en vez del
resultado global de la medición.
A continuación, hare referencia de las características principales de cada método y
si aplicación correspondiente para finalmente indicar las diferencias que existen
entre ellas.

Teoría de Respuesta al Ítem


La denominación TRI agrupa líneas de investigación psicométricas independientes
iniciadas por Rasch (1960) y Birnbaum (1968). El factor común de estos
desarrollos es que establecen una relación entre el comportamiento de un sujeto
frente a un ítem y el rasgo responsable de esta conducta (rasgo latente). Para ello,
recurren a funciones matemáticas que describen la probabilidad de dar una
determinada respuesta al ítem para cada nivel del rasgo medido por este. El
objetivo sustancial de la TRI es la construcción de instrumentos de medición con
propiedades invariantes entre poblaciones. Si dos individuos presentan idéntico
nivel de rasgo medido ambos tendrán igual probabilidad de dar la misma
respuesta, independientemente de la población de pertenencia. Esto conlleva un
gran beneficio respecto de la TCT en tanto que es posible evitar el uso de un
grupo normativo. Mientras que en la TCT se modeliza sobre el puntaje verdadero
en una prueba particular, en la TRI se toma al ítem como unidad de análisis y se
modeliza directamente sobre el rasgo latente. El nivel de rasgo latente que
presenta un individuo es fruto de una estimación a partir del patrón de respuestas
manifestado en un conjunto de ítems. Si se varía el conjunto de ítems utilizado se
mantiene la puntuación estimada aunque eventualmente hayan cambiado las
propiedades psicométricas de los reactivos. Por lo tanto, la TRI permite
mediciones invariantes más allá de los ítems que componen el instrumento.
La TRI es una amplia familia de modelos psicométricos que comparten los
siguientes supuestos básicos:
1. Subyacente a la prueba existen uno o más constructos o rasgos latentes
(ciertas habilidades, actitudes, competencias, etc.) que intervienen cuando las
personas responden a los ítems.
2. tanto las personas como los ítems tienen características relevantes (para los
constructos mencionados) que se pueden resumir en uno o más parámetros
(parámetros en la TRI son números que caracterizan un ítem o una persona).
3. las características de los ítems se definen independientemente de (es decir,
existen sin referencia a) las personas, y viceversa, las características de las
personas son independientes de los ítems.
4. es posible hacer una afirmación sobre la conducta de una persona específica
en un ítem específico (por ejemplo, sobre la probabilidad de que lo acierte) tras la
aplicación de una regla (generalmente, una función o una ecuación) que combina
los parámetros de la persona y del ítem.

Existen muchos modelos de la TRI nos limitaremos a los aspectos fundamentales


de los que más se han difundido que son los logísticos.
1. Modelo logístico de un parámetro: más conocido como modelo de Rasch
(1963. Aunque el modelo exacto de Rasch es algo diferente al que
presentamos, pues es más complicado matemáticamente, este modelo
logístico aquí propuesto es equivalente al original.

2. Modelo de dos parámetros: Lord (1968,1980) fue el primero en elaborarlo,


pero lo hizo basándose en una distribución normal. Actualmente este modelo
es poco usado por su complicación matemática. En se sustituyó el modelo de
dos parámetros de la ojiva normal por una función logística que tiene la ventaja
de ser más conveniente para manejar. El modelo de la ojiva normal supone
integración mientras que el modelo logístico no.

3. Modelo de tres parámetros: El parámetro nuevo acá es c que se llama


parámetro del seudo azar porque representa la probabilidad en los ítem de
opción múltiple de que un sujeto de poca aptitud conteste un ítem
relativamente difícil de manera correcta, lo que hace suponer que lo hizo por
azar, es decir adivinando. En este caso la curva es asíntótica en este caso.
Todos estos modelos sirven para aquellos tests en los que se puede considerar
una respuesta correcta como 1 y la incorrecta como 0. Además de estos modelos
existen otros modelos promisorios como el de las respuestas graduadas de
Sameijim (1973) y el de Bock (1972) para escalas nominales.
La teoría de la respuesta al ítem se complica mucho para la estimación de los
parámetros de los modelos. El proceso de estimación de los parámetros se
denomina calibración. Es evidente que todos los procedimientos se hacen
inmanejables sin la ayuda de los programas de computación. Actualmente existen
varios programas tales como LOGIST y BICAL, entre otros. Por último es
necesario puntualizar que para la emplear modelos TRI se requieren muestras
grandes de sujetos ( n>300) que hacen posible el ajuste a cualquier modelo de
uno, dos o tres parámetros. Para muestras más pequeñas el mejor modelo es el
de Rasch y por esto ha sido el más popularizado.
Una de las ventajas que más se ha señalado en la construcción de los tests de
acuerdo a los modelos de la TRI es que se pueden elaborar tests individualizados
es decir “ a la medida” de los sujetos que permiten inferir en cada uno de los
examinados un verdadero valor del rasgo de la manera más precisa.

Teoría clásica de los test

La teoría clásica de los test (TCT) aparece por primera vez en el siglo XX a
partir del trabajo de Spearman. Puede, de alguna manera, considerarse como el
inicio de la psicometría. La palabra test es una palabra inglesa aceptada por la
Real Academia Española (RAE) y hace referencia a las pruebas destinadas a
evaluar conocimientos, aptitudes o funciones.
Este enfoque tiende a ser el más utilizado en el análisis y construcción de los
test. Las respuestas dadas por una persona en un test son comparadas a
través de métodos estadísticos o cualitativos con las respuestas de otros
individuos que complementaron el mismo test. Ello permite realizar una
clasificación.
Así, cuando un psicólogo aplica un test a una o varias personas, lo que obtiene
son las puntuaciones empíricas que esa persona o personas obtienen en el test.
Sin embargo, ello no nos informa sobre el grado de precisión de esas
puntuaciones: No sabemos si esas puntuaciones empíricas se corresponden o
no con las puntuaciones que verdaderamente le corresponden a esa persona en la
prueba.
Este enfoque tiende a ser el más utilizado en el análisis y construcción de los
test. Las respuestas dadas por una persona en un test son comparadas a
través de métodos estadísticos o cualitativos con las respuestas de otros
individuos que complementaron el mismo test. Ello permite realizar una
clasificación.
Sin embargo, realizar esta clasificación no es tan sencillo. El psicólogo, como
cualquier otro profesional, tiene que asegurarse de que el instrumento que utiliza
mide con precisión, con poco error.
Así, cuando un psicólogo aplica un test a una o varias personas, lo que obtiene
son las puntuaciones empíricas que esa persona o personas obtienen en el test.
Sin embargo, ello no nos informa sobre el grado de precisión de esas
puntuaciones: No sabemos si esas puntuaciones empíricas se corresponden o
no con las puntuaciones que verdaderamente le corresponden a esa persona en la
prueba.
Los tres supuestos del modelo clásico
 La puntuación verdadera (V) es la esperanza matemática de la
puntuación empírica. Se escribiría así: V = E(X).
o Así, se define la puntuación verdadera de una persona en un test
como aquella puntuación que obtendría como media si se le pasase
infinitas veces el mismo test.
 No existe relación entre la cuantía de puntuaciones verdaderas y el
tamaño de los errores que afectan a estas puntuaciones. Puede
expresarse: r(v, e) = 0
o El valor de la puntuación verdadera es independiente del error de
medición.
 Los errores de medida en un test concreto no están relacionados con
los errores de medida en otro test diferente. Esto se expresa: r(ej, ek)=0
o Los errores cometidos en una ocasión no covarían con los cometidos
en otra ocasión.

El principal problema de la TCT es la invarianza de la medida, como apuntaba


Thurstone (1928): "(...) las mediciones de un instrumento de medida deben ser
independientes del objetos medidos", este inconveniente se refleja en dos
problemas concretos (Bejar, 1983; Hamblenton y Swaminathan, 1985 y Muñiz,
1997):

1. la medición de las variables psicológicas no es independiente del


instrumento que se utiliza para medirla;

2. las propiedades de los instrumentos no son independientes de los sujetos a


los que se aplican.

La Teoría de Respuesta al Ítem es uno de los campos con mayor proyección


dentro del ámbito de la medida psicológica y de la educación. Lord (1980) señala
que la Teoría de Respuesta al Ítem (TRI) no contradice las asunciones
fundamentales de la Teoría Clásica de los Test (TCT) sino que hace asunciones
adicionales que permitirán responder a las cuestiones que la TCT no podía.

Aunque la TRI se muestra como un método capaz de enfrentarse a estas


deficiencias o problemas planteados en la TCT, la facilidad conceptual y sencillez
del cálculo hacen que hoy día siga siendo más atractivo y frecuente el uso de la
TCT (Hamblenton y Jones, 1993).

La TCT y la TRI son modelos que teóricamente se solapan para entender el


funcionamiento del test más que competir entre ellos (Huling, Drasgow y Parsons,
1983b). La TRI hace suposiciones más fuertes que la TCT, en particular la
suposición de la independencia local y la suposición de relaciones logísticas entre
las contestaciones de los ítems y los rasgos subyacentes.

Los modelos de la TRI tienen ventajas significativas sobre los modelos de la TCT,
particularmente cuando estos tienen en cuenta la inclinación del test, haciendo
diferencias en cuanto al género o la raza (Hambleton, 1989; Lord, 1980). Los
conceptos claves de la TCT incluyen dificultad del ítem (proporción de
participantes con una puntuación positiva o acertada) discriminación del ítem (la
correlación del ítem con el resto del test), fiabilidad alpha, y los cortes óptimos son
todos dependientes de las características de la muestra.

La teoría de respuesta a los ítems (TRI) nace como complemento de la


teoría de los test clásica. Dicho de otra manera, la TCT y la TRI podrían evaluar
un mismo test, al igual que establecer una puntuación o una relevancia para cada
uno de los ítems, lo que a su vez nos podrían dar un resultado distinto para cada
persona. Por otro lado, señalar que la TRI nos daría un instrumento mucho mejor
calibrado, el problema es que este paradigma lleva asociado un coste mucho
mayor y la participación de profesionales especializados.
La TRI tiene varios supuestos, pero quizás el más importante nos dice que
cualquier instrumento de medición debería estar en consonancia con una idea:
existe una relación funcional entre los valores de la variable que miden los
ítems y la probabilidad de acertar estos. Esta función se denomina Curva
característica del ítem (CCI). ¿Qué suponemos entonces?
Pues algo que desde fuera puede parecer muy lógico y que la TCT no evalúa.
Por ejemplo, los ítems más difíciles serían aquellos que solo contestan las
personas más inteligentes. Por otro lado, un ítem que contestan todas las
personas bien no nos valdría porque no tendría ningún poder para discriminar.
Dicho de otra manera, no daría ningún tipo de información. 
Así es como se relacionan ambas teorías de los test. Aunque siendo casi
coetáneas, parece claro que la TRI nace como respuesta a las limitaciones o
problemas que puede desarrollar la TCT. Sin embargo, parece claro que la
investigación aún tiene mucho camino en este campo de la psicometría.

    

También podría gustarte