Está en la página 1de 11

Teora Clsica de los Tests Introduccin La fiabilidad es la posibilidad de repetir el test a la misma persona obteniendo idnticas puntuaciones.

Lo que hace poco fiable un test es el error de medida. Hay dos tipos de errores en las medidas: A) Errores sistemticos: son errores controlables que afectan a las puntuaciones de una forma sistemtica (consistente). Ejemplos: una bscula que pesa medio kilo de ms; un test corregido para todas las personas asignando los valores 1-5 en lugar de 0-4 en los tems. B) Errores aleatorios: son errores que no se pueden controlar ni predecir. Ejemplo: Estimacin del nmero de glbulos rojos en sangre de una persona a travs de diferentes muestras de sangre. La inestabilidad o falta de fiabilidad de las puntuaciones que estudia la Psicometra est ligada fundamentalmente a los errores aleatorios. Los errores sistemticos, en la medida de lo posible, se intentarn controlar o corregir. Bajo la denominacin genrica de fiabilidad se recoge todo un conjunto de mtodos y tcnicas para estimar el grado de precisin con el que se miden las variables. El problema de determinar la fiabilidad de las mediciones no es exclusivo de la Psicologa, sino que es un asunto con el que previamente han tenido que lidiar otras ramas de la ciencia. As, por ejemplo, la Astronoma tambin se interes de antao en el anlisis de la calibracin de sus instrumentos de observacin. Como seala Martnez-Arias (1995), los fundamentos de la teora de los errores de medida se remontan al siglo XVIII con autores como Laplace, Gauss y Legendre. Sin embargo, su aplicacin en Psicologa no llegar hasta principios del siglo XX, con Pearson (1902) que describi una teora de los errores de medida basada en el ser humano como instrumento de medida.

II) Modelo Clsico de los Tests La presentacin de los fundamentos del Modelo Lineal Clsico se atribuye a Spearman (1904, 1907, 1913), influido por los trabajos de Galton y Pearson. El modelo lineal representa la puntuacin emprica u observada de un sujeto en un test ( X i ) mediante dos componentes aditivos: la puntuacin verdadera del sujeto ( Vi ) y el error de medida ( ei ):
X i = Vi + ei

X i : Puntuacin observada (o emprica) del sujeto i-simo. Es una variable aleatoria ya

que la puntuacin observada vara de una medicin a otra (si hay errores de medida).
Vi : Puntuacin verdadera del sujeto i-simo. En cada sujeto, es una constante. Cada

sujeto tiene un nico valor verdadero en esa variable latente, cuyos valores son inobservables.
ei : Error de medida. Es una variable aleatoria, cuyos valores son inobservables.

III) Supuestos En este modelo clsico, se asumen una serie de supuestos sobre la distribucin de los errores de medida y su independencia de las puntuaciones verdaderas. En concreto, los supuestos del modelo se resumen en los siguientes (Martnez, Hernndez y Hernndez, 2006, pp. 38-39 ): A) El valor esperado de los errores de medida es igual a cero:
E (ei ) = 0

El valor esperado de la variable aleatoria error de medida es igual a cero, para una poblacin de personas medidas con el mismo test o para una repeticin infinita de medidas realizadas sobre la misma persona. B) Los errores de medida son independientes de la puntuacin verdadera :
cov( e, V ) = 0

En una poblacin de personas medidas con el mismo test, los sujetos con mayor puntuacin verdadera en el atributo no estn medidos con mayor (ni menor) error que los sujetos con una menor puntuacin verdadera. C) Los errores de medida de un test son independientes de las puntuaciones verdaderas de otro test:
cov( e1 , V2 ) = 0

D) Los errores de medida de dos tests distintos no estn relacionados:


cov( e1 , e2 ) = 0

Deducciones de los supuestos A partir de los supuestos anteriores, se pueden establecer una serie de deducciones, entre las que cabe destacar las siguientes: A) El valor esperado de las puntuaciones observadas es la puntuacin verdadera:
E ( X i ) = Vi

Demostracin:
E ( X i ) = E (Vi + ei ) = E (Vi ) + E (ei ) = Vi

B) La varianza de las puntuaciones observadas es igual a la varianza de las puntuaciones verdaderas ms la varianza de los errores de medida:
2 2 2 x = v +e

Demostracin:
var( X ) = var( V + e) = var( V ) + var( e) + 2 cov( V , e)

Uno de los supuestos de la TCT es que cov( V , e) = 0 . Por tanto,


var( X ) = var( V ) + var( e)

C) La correlacin al cuadrado entre las puntuaciones observadas y verdaderas (


2 xv ) es igual al cociente de la varianza de las puntuaciones verdaderas a la

varianza de las puntuaciones observadas:

2 xv =

v2 2 x

Demostracin:
xv =
cov( X , V )

x v

cov( V + e, V )

x v

cov( V , V ) + cov( e, V )

x v

Como la covarianza de una variable consigo misma es la varianza,


cov( V , V ) =

(VV ) V V
N

V 2
N

2 = V

y, adems, la cov( e, V ) = 0 (supuesto del modelo), entonces


xv =
2 v = v x v x

Elevando ambas partes de la ecuacin al cuadrado, resulta


2 xv

v2 = 2 x

La TCT puede considerarse como un modelo de regresin lineal de las puntuaciones observadas sobre las verdaderas. Desde este modelo, el problema de la fiabilidad se entiende como grado de relacin entre las puntuaciones observadas ( X ) y verdaderas ( V ): xv . Lgicamente, lo ms deseable para que la medicin est exenta de errores aleatorios es que xv = 1 . En tal caso, la relacin lineal entre las puntuaciones observadas y las verdaderas ser mxima. No obstante, lo ms frecuente ser encontrarnos con correlaciones intermedias en situaciones en las que al aumentar las puntuaciones verdaderas de los sujetos, tambin aumenten las observadas (con ms o menos error aleatorio).

La correlacin entre puntuaciones observadas y verdaderas, xv (denominada ndice de fiabilidad), es una medida de la fiabilidad del test. Sin embargo, tratndose de un modelo de regresin lineal, es ms frecuente utilizar la correlacin al cuadrado o
2 coeficiente de determinacin, xv que (como ha quedado demostrado) indica la

proporcin de varianza de las puntuaciones observadas (X) explicada por su relacin lineal con las puntuaciones verdaderas (V):

2 xv =

v2 2 x

Spearman (1904) denomin a esta razn coeficiente de fiabilidad. As pues, si la correlacin entre puntuaciones observadas y verdaderas (ndice de fiabilidad) fuera,
2 xv = 0,90 , entonces el coeficiente de fiabilidad sera xv = 0,81 lo que significa que

el 81% de la varianza de las puntuaciones observadas se atribuye a las verdaderas diferencias entre los sujetos; y que, por tanto, el 19% de la varianza observada se atribuye al error de medida. Tests paralelos o equivalentes El coeficiente de fiabilidad es una buena medida de la fiabilidad del test. Sin embargo, tal como est formulado hasta ahora, no se puede estimar en la prctica, ya que lo nico que podemos observar directamente en los sujetos son sus puntuaciones observadas (no las verdaderas, ni los errores de medida). Por este motivo, la TCT necesita introducir la definicin de tests paralelos ( X y X ) como aquellos que, con tems similares, miden lo mismo y de la misma forma (con el mismo error). Es decir, satisfacen las siguientes condiciones: 1) Igualdad de sus puntuaciones verdaderas (ya que miden lo mismo)
X =V +e

X = V + e
2) Igualdad de varianzas de los errores (ya que miden de la misma forma)

2 e = e2

Si dos tests satisfacen estas condiciones inobservables, entonces necesariamente satisfacen estas condiciones observables: 1) Sus puntuaciones observadas tendrn medias iguales:
E ( X ) = E ( X )

Demostracin:
E ( X ) = E ( X ) E (V + e) = E (V + e) E (V ) + E (e) = E (V ) + E (e)

Por los supuestos de la TCT, el valor esperado de los errores es cero, por lo que se llega a la igualdad:
E (V ) = E (V )

2) Sus puntuaciones observadas tendrn varianzas iguales:


2 2 x = x

Demostracin:
2 2 x = x

Por la segunda deduccin de los supuestos,


v2 + e2 = v2 + e2

Por la condicin inobservable de paralelismo: e2 = e2 Por tanto, se llega a la igualdad:


2 2 v + e2 = v2 + e

Medidas de la fiabilidad del test

A) Coeficiente de Fiabilidad: Una vez definido el concepto de tests paralelos, y bajo los supuestos de la TCT, se puede demostrar que la correlacin entre las puntuaciones obtenidas por una poblacin de sujetos en dos formas paralelas de un test ( xx ' ) es igual al coeficiente de fiabilidad:

xx' =

v2 2 x

Demostracin basada en los supuestos de la TCT y en la definicin de tests paralelos,

xx ' =

cov( X , X ) cov(V + e,V + e) = x x x x

cov( V , V ) + cov( V , e) + cov( e, V ) + cov( e, e)

x x

La covarianza de una variable consigo misma es su varianza: cov( V , V ) = var( V ) Los errores son independientes de las puntuaciones verdaderas: cov( V , e ) = 0
cov( e, V ) = 0

Y los errores de dos tests distintos son independientes: cov( e, e) = 0 Por la definicin de tests paralelos, sus puntuaciones observadas tienen la misma varianza, y, por tanto, la misma desviacin tpica: x = x As pues, la ecuacin anterior es igual a:
=
2 v 2 x

Con lo que queda demostrada la siguiente igualdad:

xx' =

v2 2 x

Al ser una proporcin, los valores del coeficiente de fiabilidad se distribuyen entre cero y uno:
0 xx ' 1

Uno menos el coeficiente de fiabilidad expresa la proporcin de varianza de las puntuaciones observadas que se atribuye a los errores (aleatorios) de medida.
1 xx '

e2 = 2 x

Demostracin: Ya vimos cmo la varianza de las puntuaciones observadas se puede descomponer en dos componentes aditivos:
2 2 2 x = v +e

Dividiendo ambos trminos de la ecuacin entre la varianza de X:


2 x 2 x

v2 + e2
2 x

1= 1

2 v e2 + 2 2 x x

Por tanto, O, lo que es lo mismo,

v2 e2 = 2 2 x x

1 xx ' =

e2 2 x

As pues, si el coeficiente de fiabilidad es igual a 0,80 esto significa que el 80% de la varianza de las puntuaciones observadas se puede atribuir a la varianza de las puntuaciones verdaderas (es decir, a las verdaderas diferencias entre unas personas y otras en el atributo que mide el test); y que el 20% restante se puede atribuir a la varianza error. B) Error Tpico de Medida: e

Como ya se trat anteriormente, el principio bsico de la TCT afirma que la puntuacin observada ( X i ) es igual a la puntuacin verdadera ( Vi ) ms el error aleatorio de medida ( ei ):
X i = Vi + ei

Por tanto, el error de medida se define como la diferencia entre la puntuacin observada y la verdadera:
ei = X i Vi

El Error Tpico de Medida (ETM) es la desviacin tpica de los errores de medida ( e ). El ETM es una forma alternativa de expresar la fiabilidad (o ms bien la falta de fiabilidad) en trminos absolutos (no proporcionales):
e 0

El Error Tpico de Medida se puede estimar a travs de esta ecuacin:


e = x 1 xx '

Demostracin: Como se demostr anteriormente,


1 xx ' =
1 xx ' =

e2 2 x

e x

Por tanto,
x 1 xx = e

VII)

Intervalo de confianza de las puntuaciones observadas

alrededor de una puntuacin verdadera En este procedimiento, se asume que los errores de medida ( ei ), en torno a una determinada puntuacin verdadera ( Vi ), se distribuyen segn la curva normal, con
2 media cero, y varianza ( e ) constante a lo largo de las puntuaciones verdaderas:

2 f (ei | Vi ) N (0, e )

Dado que X i = Vi + ei , con V constante, es inmediato que


2 f ( X i | Vi ) N (Vi , e )

Bajo dichos supuestos, se puede establecer un intervalo de confianza de las puntuaciones observadas en torno a una puntuacin verdadera, a travs de la siguiente ecuacin:
X i = Vi Z c e

donde,
Xi : Zc :

Puntuacin observada dada una determinada puntuacin verdadera ( Vi ) Valor crtico de la distribucin normal para un determinado nivel de confianza Error Tpico de Medida Nivel de Confianza (1- )100 95% 99% 0,05 0,01 1- /2 0,975 0,995 Zc 1,96 2,58

e :

Ntese que cuanto mayor sea el error tpico de medida ( e ) de un test, ms amplio ser el intervalo de confianza de las puntuaciones observadas alrededor de la puntuacin verdadera. Por tanto, el ETM es un indicador de la imprecisin del test. Este procedimiento se basa en el supuesto de igualdad de las varianzas error a lo largo de las puntuaciones verdaderas, denominado supuesto de la homocedasticidad. Si este

10

supuesto no se cumple, lo cual es frecuente en la prctica, no resulta muy adecuado utilizar el mismo Error Tpico de Medida ( e ) para todos los sujetos. Desde la misma Teora Clsica de los Tests, se han propuesto soluciones en las que se calcula el ETM en distintos niveles de las puntuaciones en el test, o incluso el ETM especfico de la persona. Ejemplo, (adaptado de Muiz, 1998. pg. 39). Se aplic un Test de Rapidez Perceptiva a una muestra representativa de 1000 sujetos, obtenindose una media de 70 puntos, una desviacin tpica de 10 y un coeficiente de fiabilidad de 0,64. Al nivel de confianza del 99%, entre qu valores estarn comprendidas las puntuaciones observadas de los sujetos con una puntuacin verdadera de 80 puntos?
e = x 1 xx ' = 10 1 0,64 = 6

X i = Vi Z c e = 80 (2,58 )( 6) = 80 15 ,48

Por tanto, con una probabilidad de 0,99, se estima que las puntuaciones observadas de los sujetos con una puntuacin verdadera de 80 puntos se encuentran dentro del intervalo de confianza delimitado por los valores 64,52 y 95,48:
P (64 ,52 X i 95 ,48 ) = 0,99

Lectura recomendada: Martnez Arias, M. R., Hernndez, M. J., y Hernndez, M. V. (2006). Psicometra. Madrid: Alianza Editorial. Captulo 2. Teora Clsica de los Tests (TCT) I: el modelo y la fiabilidad de las puntuaciones (pp. 37-68).

11

También podría gustarte