Está en la página 1de 15

Tema 4 Fiabilidad de las Puntaciones.

Orientación.
Introducimos la definición, dentro de la Teoría Clásica de los Tests, del coeficiente
de fiabilidad, haciendo mención de los distintos factores que pueden influir en su
cuantía como pueden ser la longitud del test y las características de la muestra a la que
se aplica, y explicando la necesidad de establecer procedimientos empíricos que nos
permitan estimarlo: el método de fas formas paralelas, el método test-retest y los
métodos basados en fa consistencia interna del test; indicando cómo se deben
interpretar los coeficientes obtenidos. A continuación, se presentan tres
procedimientos que permitirán estimar el nivel real del sujeto en el rasgo o
característica que mide el test (su puntuación verdadera).
Al estudiar el tema se recomienda que los alumnos hagan hincapié en los siguientes
puntos básicos:
 Conocer los supuestos básicos del modelo lineal de Spearman, así como las
deducciones que se puedan hacer a partir de esos supuestos.
 Tener muy claros los conceptos de error de medida y fiabilidad.
 Saber diferenciar los distintos tipos de error de medida.
 Conocer la influencia que pueden tener en el coeficiente de fiabilidad factores
como la longitud del test y la variabilidad de la muestra de sujetos a los que se
aplica.
 Conocer los procedimientos empíricos para estimar el coeficiente de fiabilidad.
 Diferenciar entre la fiabilidad como estabilidad temporal de las puntuaciones
obtenidas en el test y como consistencia interna de los ítems del test.
 Diferenciar entre los distintos procedimientos para estimar la puntuación
verdadera de un sujeto en un test.

2. El PROBLEMA DEL ERROR DE MEDIDA


La medición en Psicología no está exenta de este requisito y debemos contar con
instrumentos que sean fiables y, por consiguiente, libres en la medida de lo posible, de
errores de medida. El concepto de error de medida es un concepto básico en
Psicometría.
Se define el error de medida como la diferencia entre la puntuación empírica obtenida
por un sujeto en un test y su puntuación verdadera, entendiendo por test cualquier
instrumento de medición psicológica.
Si aplicamos repetidas veces un mismo test a un sujeto, lo más probable es que
obtengamos puntuaciones distintas en las diferentes aplicaciones y, en segundo lugar,
que cuando un sujeto obtiene una puntuación en un test, dicha puntuación estará
afectada por errores de medida. Este hecho nos lleva a plantearnos la siguiente
pregunta: ¿cómo podemos saber cuál es el valor real del sujeto en la característica que
estamos estudiando? Para ello, hay que acudir a alguna de las teorías que se han ido
desarrollando y que nos van a proporcionar los medios para hacer estimaciones acerca
de la cuantía de error que afecta a las puntuaciones empíricas y acerca del verdadero
nivel del sujeto (o sujetos) en la característica que se está midiendo.
3. EL MODELO LINEAL DE SPEARMAN.
El modelo lineal de Spearman establece que la puntuación empírica obtenida por un
sujeto en un test (X) puede considerarse como una combinación lineal de dos
componentes: por una parte, la puntuación verdadera (V) de ese sujeto en el rasgo
que mide el test, y por otra, el error de medida (E) que la afecta. Así pues, podemos
establecer la ecuación del modelo en los siguientes términos: X=V+E
Primer supuesto. La puntuación verdadera (V) es la esperanza matemática de la
puntuación empírica (X). Esto quiere decir que, si a un sujeto se le pasara un número
infinito de veces un mismo test, y suponiendo que las aplicaciones fueran
independientes entre sí de manera que la puntuación obtenida por dicho sujeto en
una de las aplicaciones no estuviera influyendo en la obtenida en las demás, la media
de todas las puntuaciones observadas (X) sería la puntuación verdadera del sujeto.
V=E(X)
Segundo supuesto. La correlación existente entre las puntuaciones verdaderas de «n»
sujetos en un test y los errores de medida es igual a cero. Es decir, no existe relación
entre los errores de medida y las puntuaciones verdaderas. Rve=0
Tercer supuesto. La correlación entre los errores de medida (re1e2) que afectan a las
puntuaciones de los sujetos en dos tests diferentes (X1 y X2) es igual a cero. Si «e1»
representa los errores de medida de las puntuaciones de «n» sujetos en el test 1 y
«e2» representa los errores de medida de las puntuaciones de los mismos sujetos en el
test 2 el supuesto implica que no existe ninguna razón para presuponer que los errores
de medida cometidos en un test vayan a influir, positiva o negativamente,
en el otro test, siempre y cuando los tests se apliquen correctamente.
Re1e2=0
a) El error de medida se define como la diferencia entre la puntuación empírica
obtenida por un sujeto y su puntuación verdadera. E=X-V
b) La esperanza matemática de los errores de medida es cero. E(e)=0
c) La media de las puntuaciones empíricas es igual a la media de las puntuaciones
verdaderas. Xmedia=Vmedia
d) La covarianza entre las puntuaciones verdaderas y los errores es igual a cero.
Cov (V,E)=0
e) La varianza de las puntuaciones empíricas es igual a la suma de la varianza de las
puntuaciones verdaderas más la varianza de los errores. Sx2=Sv2+Se2
f) La covarianza entre las puntuaciones empíricas y las verdaderas es igual a la varianza
de las puntuaciones verdaderas.
g) La correlación entre las puntuaciones empíricas y los errores es igual al cociente
entre la desviación típica de los errores y la desviación típica de las puntuaciones
empíricas.
h) La covarianza entre las puntuaciones empíricas de dos tests es igual a la covarianza
entre las puntuaciones verdaderas.

De donde se deduce que la covarianza entre las puntuaciones empíricas obtenidas por
una muestra de sujetos en las dos aplicaciones de un test es igual a la varianza de las
puntuaciones verdaderas, dado que al ser el mismo test el que se aplica en dos
ocasiones distintas la puntuación verdadera es la misma y la covarianza de una
variable consigo misma es igual a la varianza.
4. TESTS PARALELOS. CONDICIONES DE PARALELISMO.
Si a una misma muestra de sujetos se le aplican dos tests, X y X', podemos considerar
que son paralelos si, además de cumplirse los supuestos anteriores, se cumplen las dos
condiciones siguientes:
1. Las puntuaciones verdaderas de los sujetos son iguales en ambos tests.
Según el modelo lineal podemos establecer:
X=V+E
X' = V + E'
2. La varianza de los errores de medida es la misma en ambos tests:
Se2=Se´2
De las condiciones de paralelismo enunciadas podemos sacar una serie de deducciones
importantes dentro del modelo clásico.

5. INTERPRETACIÓN TEÓRICA DEL COEFlClENTE DE FIABILIDAD.


Definimos el coeficiente de fiabilidad de un test, como:
. . . la correlación entre las puntuaciones empíricas obtenidas por una muestra de
sujetos en dos formas paralelas del test.
Se puede expresar también como el cociente entre la varianza de las puntuaciones
verdaderas y la varianza de las puntuaciones empíricas.

y se pude interpretar, por lo tanto, como la proporción de la varianza de las


puntuaciones empíricas de los sujetos que se debe a la varianza de las puntuaciones
verdaderas, o lo que es lo mismo, la proporción de varianza verdadera que hay en la
varianza empírica. A medida que dicha proporción aumenta, disminuye el error de
medida. Si rxx'=1, el error de medida es cero lo que implica una fiabilidad perfecta del
test. Sin embargo, a medida que la proporción disminuye se produce un incremento en
el error de medida. En el caso de que rxx'=O, la varianza de los errores de medida sería
igual a la varianza de las puntuaciones empíricas. r=coeficiente de fiabilidad.

EJEMPLO:
Calcular el coeficiente de fiabilidad de un test de razonamiento abstracto, sabiendo
que la varianza verdadera de dicho test es el 80% de su varianza empírica.
rxx´=Sv2/Sx2=0,80·Sx2/Sx2=0,80
es decir, el 80% de la varianza de las puntuaciones empíricas es verdadera medida del
rasgo.

6. TIPOS DE ERRORES DE MEDIDA.


- Error de medida.
Como ya se ha dicho, el error de medida es la diferencia entre la puntuación empírica
de un sujeto y su puntuación verdadera.
E=X-V
A la desviación típica de los errores de medida se le denomina error típico de medida y
se expresa como:
Cuando se calcula el error de medida obtenemos una medida individual del error que
se comete; es decir, una medida individual de la precisión del test. Esta medida nos
indica la diferencia que existe entre la puntuación que un sujeto ha obtenido en un
test y el nivel real de dicho sujeto en la variable que medimos con dicho test; es decir,
su puntuación verdadera. Cuando calculamos el error típico de medida estamos
llevando a cabo una medida grupal del error puesto que se calcula para todos los
sujetos de la muestra.

7. FACTORES QUE AFECTAN A LA FIABILIDAD.


7.1. Longitud del test.
Uno de los factores que influyen en la fiabilidad de un test es su longitud, es decir, el
número de ítems que lo componen. Cuantos más ítems representativos del rasgo a
medir se utilicen mayor será la información que obtengamos acerca del atributo que
estemos estudiando. Cabe pensar que también será menor el error que cometamos al
tratar de estimar la puntuación verdadera de un sujeto y, por lo tanto, la fiabilidad del
test tenderá a incrementarse. Una forma de poder aumentar la fiabilidad del test es
aumentar su longitud. A veces, si un test es demasiado largo puede ser interesante
averiguar cuál sería su fiabilidad si se le disminuyera el número de ítems. Si esta
disminución de la fiabilidad no es muy elevada puede ser más aconsejable utilizar el
test más corto.
La relación existente entre la fiabilidad de un test y su longitud, siempre y cuando los
ítems a añadir sean paralelos a los que ya tenía el test original, se puede evaluar
mediante la ecuación de Spearman-Brown.

Donde:
Rxx=coeficiente de fiabilidad del test alargado o acortado.
rxx=coeficiente de fiabilidad del test inicial.
n=número de veces que se ha alargado o acortado el test.
n=EF/EI siendo EF el número de elementos finales del test y EI el número de elementos
iniciales del test.

EJEMPLO:
Supongamos, que se aplica un test de percepción visual compuesto por 50 ítems a una
muestra de sujetos y se obtiene un coeficiente de fiabilidad de 0,60. Veamos lo que
sucede al incrementar n veces la longitud del test:
Para n=2 2·0,60/1+0,60=0,75
Para n=3 1,80/11+1,20=0,82 Diferencia 0.07
Para n=4 4·0,60/1+1,80=0,86 Diferencia 0,04
Para n=5 5·0,60/1+2,40=0,88 Diferencia 0,02
Como se puede apreciar en el gráfico 4.1, a medida que aumenta el número de ítems
paralelos aumenta el coeficiente de fiabilidad del test, aunque no de una manera
proporcional. Se puede observar que a partir de un determinado valor de n no se
producen incrementos significativos en la fiabilidad del test. Como consecuencia de
esto nos podemos preguntar: ¿cuánto habría que alargar o acortar un test para
obtener un determinado coeficiente de fiabilidad? y, en segundo lugar, ¿hasta qué
punto es razonable dicho aumento?
Supongamos que con los datos del ejemplo anterior queremos aumentar la fiabilidad
del test hasta obtener un valor de r=0,93. Aplicando la expresión anterior tenemos:

Para conseguir ese coeficiente de fiabilidad sería necesario hacer, aproximadamente, 9


veces más largo el test original de 50 ítems. Es decir, el nuevo test tendría una longitud
de: 9·50=450 ítems.

lo que implicaría añadir 400 ítems al test original. Obviamente, añadir al test 400 ítems
no parece una solución razonable al problema y debemos plantearnos otras
alternativas como, por ejemplo, revisar el objetivo para el que se construye el test,
mejorar los ítems y analizar cuál es el valor de precisión aceptable para dicho objetivo
(si se hubiera tomado el valor exacto de 8,85 habría que haber añadido 392,5 ítems es
decir 393, lo cual tampoco sería una solución razonable).
En ocasiones puede que estemos interesados en saber si es posible reducir el número
de ítems de un test y que el nuevo coeficiente de fiabilidad sea lo suficientemente
aceptable como para no perder demasiada información respecto al atributo objeto de
estudio. Esta situación se da cuando consideramos el número de ítems excesivo.
Supongamos, por ejemplo, un test compuesto de 100 ítems y un coeficiente de
fiabilidad de 0,85 (rxx)· Supongamos que para nuestros objetivos un coeficiente
de fiabilidad de 0,75 (Rxx) es admisible. La pregunta que nos formularíamos sería
cuántos elementos debemos eliminar del test original para obtener ese coeficiente de
fiabilidad. En este caso:

EF=n·EI=0,52X100=52
luego tendríamos que eliminar 1 00 - 52 = 48 ítems.

7 .2. Variabilidad de la muestra.


La fiabilidad de un test también depende de las características de la muestra a la que
se aplica. Un test puede presentar tantos coeficientes de fiabilidad como muestras
distintas en las que se calcule. El coeficiente de fiabilidad puede variar en función de la
mayor o menor homogeneidad del grupo, siendo menor cuanto más homogéneo sea;
es decir, cuanto más pequeña sea la desviación típica de las puntuaciones empíricas
obtenidas por los sujetos en el test. Recordemos que hemos definido el coeficiente de
fiabilidad como la correlación entre dos formas paralelas de un test y la correlación
viene afectada por la variabilidad del grupo. Por lo tanto, es importante saber hasta
qué punto la fiabilidad de un test se ve afectada por dicha variabilidad.

8. LA FIABILIDAD COMO EQUIVALENCIA Y COMO ESTABILIDAD DE LAS MEDIDAS.


Un test debe cumplir dos requisitos básicos. En primer lugar, debe medir el rasgo que
realmente pretende medir (es decir, ser válido) y, en segundo lugar, las puntuaciones
empíricas obtenidas al aplicar el test deben ser estables y precisas. La precisión hace
referencia, a la necesidad de que, las puntuaciones obtenidas estén libres de errores.
La estabilidad se refiere a que cuando se evalúa un rasgo con el mismo test en distintas
ocasiones y bajo condiciones lo más parecidas posibles, siempre y cuando el rasgo
estudiado no haya cambiado, se deberán obtener unos resultados similares. Este
segundo requisito, referido a la reproductividad de unos resultados en condiciones
similares, es lo que definimos como la fiabilidad del test, entendida como estabilidad
de las medidas. En definitiva, lo que pretendemos es poder establecer el grado de
acuerdo entre las puntuaciones obtenidas por los sujetos en distintas aplicaciones.
En este apartado, nos centraremos en dos métodos basados en la estabilidad de las
medidas para el cálculo del coeficiente de fiabilidad, métodos que constituyen una
aplicación directa de la definición de correlación entre formas paralelas:
 Método de las formas paralelas
 Método test-retest

8.1. Método die las formas paralelas.


La forma de proceder, según este método, sería: primero, construir dos formas
paralelas de un test X y X´, en segundo lugar, aplicar las dos formas del test a una
muestra de sujetos lo suficientemente amplia como para que sea representativa de la
población a la que va dirigido el test y, en tercer lugar, calcular el coeficiente de
correlación de Pearson entre las puntuaciones de los sujetos en ambas formas.

donde: X1 y X2 corresponden a las puntuaciones obtenidas por los sujetos en cada una
de las formas aplicadas. El coeficiente de fiabilidad así obtenido recibe también él
nombre de coeficiente de equivalencia, haciendo, referencia al grado en que ambas
formas son equivalentes. El método de las formas paralelas presenta la ventaja de que,
si ambas formas son aplicadas en el mismo momento se tiene un mayor control de las
condiciones en que los sujetos realizan las pruebas. Este método presenta el
inconveniente de la dificultad que supone la construcción de dos formas que sean
paralelas.

8.2. Método test-retest.


Con este método se aplica el mismo test en dos ocasiones diferentes a una misma
muestra de sujetos. Calculamos el coeficiente de fiabilidad mediante la correlación
entre las puntuaciones obtenidas por los sujetos en ambas aplicaciones.

donde: X1 y X2 corresponden, en este caso, a las puntuaciones obtenidas por los sujetos
en cada una de las aplicaciones del mismo test.
Como se puede apreciar, el cálculo es idéntico al método de las formas paralelas
siendo la única diferencia que en lugar de aplicar dos formas se emplea la misma en
dos momentos distintos.
Este método presenta la ventaja de que no se requieren dos o más formas distintas del
mismo test. Con el método test-retest, es el mismo test el que aplicaremos en distintas
ocasiones. En el caso de que se pretendan medir rasgos que pueden cambiar en el
tiempo hay que extremar las precauciones si tenemos la pretensión de emplear este
método ya que se pueden encontrar diferencias en las puntuaciones obtenidas en las
dos aplicaciones y no significar falta de estabilidad sino que si realmente los sujetos
han variado en el rasgo que se está midiendo, las diferencias pongan de manifiesto ese
cambio.

1. El índice de fiabilidad de un ítem viene definido por el producto de su desviación


típica y la correlación entre las puntuaciones obtenidas en el ítem y en el test.
:-) A Verdadero
B Falso
2. El índice de precisión es un valor inferior al del coeficiente de fiabilidad.
:-) A Falso
B Verdadero
3. El coeficiente de fiabilidad de un test guarda una relación directamente
proporcional con la variabilidad de la muestra de sujetos en la que es aplicado.
A Falso
:-) B Verdadero
4. La proporción de varianza verdadera que hay en la varianza empírica de un test
viene dada por el coeficiente de fiabilidad.
A Falso
:-) B Verdadero
5. La desviación típica de las puntuaciones empíricas es igual a la suma de la
desviación típica de las puntuaciones verdaderas y la de los errores.
X A Verdadero
:-) B Falso
6. La varianza error de un test es igual al cuadrado de su error típico de medida
:-) A Verdadero
B Falso
7. El coeficiente de fiabilidad es el coeficiente de correlación entre las puntuaciones
verdaderas y las puntuaciones empíricas.
:-) A Falso
X B Verdadero
8. Cuando las puntuaciones obtenidas por una muestra de sujetos en un test se
interpretan en relación con las obtenidas por su grupo de referencia, decimos que es
una interpretación referida a la norma.
X A Falso
:-) B Verdadero
9. El índice de fiabilidad expresa la correlación entre las puntuaciones verdaderas y las
empíricas
A Falso
:-) B Verdadero
10. La diferencia entre la puntuación verdadera y la empírica se debe al error de
medida
A Falso
:-) B Verdadero
9.1.1. Spearman-Brown
La ecuación de Spearman-Brown, constituye una de las formas más utilizadas para
estimar la fiabilidad de un test por el método de las dos mitades. Está basada en la
relación existente entre la longitud de un test y el coeficiente de fiabilidad.
En primer lugar, aplicamos el test a una muestra de sujetos. Una vez aplicado el test,
dividimos éste en dos mitades que han de ser paralelas. Por lo tanto, para ver si la
aplicación de este método es la correcta, habría que comprobar los supuestos de
paralelismo. A continuación, calculamos la correlación entre las puntuaciones
obtenidas por los sujetos en ambas partes. La correlación calculada correspondería al
coeficiente de fiabilidad de cada una de las mitades del test, pero como lo que
queremos es calcular la fiabilidad del test completo, para ello aplicamos la ecuación de
Spearman-Brown para el caso de longitud doble:
Rxx = coeficiente de fiabilidad del test.
rxx = coeficiente de fiabilidad de cada una de las mitades.

EJEMPLO:
Hemos aplicado un test de aptitud numérica compuesto de 20 ítems a una muestra de
6 sujetos. Los resultados que se presentan a continuación corresponden a las
puntuaciones que dichos sujetos obtuvieron en los ítems pares (X1) e impares (X2).
Calcular el coeficiente de fiabilidad suponiendo que las dos mitades del test sean
paralelas.

Rx1x2=6·241-42·34/raíz de 6·302-422·6·202-342=1446-1428/raíz de 48·56=0,35

El coeficiente de fiabilidad de cada una de las mitades es 0,35 pero el del test total es
0,52. Se trata de un coeficiente medio ya que el valor máximo es la unidad. Hemos
asumido que las dos mitades son paralelas dado que se trata de un ejemplo, no
obstante, para aplicar este procedimiento de forma estricta habría que haber hecho
previamente la comprobación analizando, por ejemplo, la igualdad de las medias de
ambas mitades y la igualdad de los errores típicos de medida.
9.1.2. Rulon.
La fórmula de Rulon (1939) para la estimación de la fiabilidad de un test según el
método de dos mitades se utiliza cuando, aún no siendo las dos mitades definidas
estrictamente paralelas, podemos considerarlas -r-equivalentes (tau-equivalentes) o
esencialmente -r-equivalentes. Lord y Novick (1968) definen los tests -r-equivalentes
como aquellos en los que las puntuaciones verdaderas de los sujetos de una muestra
son iguales en ambas formas, pero las varianzas de error no tienen porqué ser iguales,
y definen los tests esencialmente (-r) tau-equivalentes como aquellos en los que la
puntuación verdadera de cada sujeto en uno de los tests es igual a la del otro más una
constante. Tanto en una situación como en otra se asume el cumplimiento del
supuesto de igualdad de las varianzas verdaderas de ambas mitades. Calculados los
valores de las puntuaciones en los ítems pares e impares, se calcula la diferencia entre
ellas y, a continuación, su varianza (varianza de la diferencia entre las puntuaciones).

donde:
d= diferencias entre las puntuaciones de los elementos pares e impares de cada uno
de los sujetos.
Sd2 = Sp-i2= varianza de la diferencia entre las puntuaciones pares e impares.
Sx2= varianza de las puntuaciones empíricas de los sujetos.
EJEMPLO:
Hemos aplicado un test de fluidez verbal compuesto de 6 ítems a 6 sujetos. A
continuación, se presentan las puntuaciones empíricas obtenidas por los sujetos en el
test total, así como las obtenidas en los elementos pares e impares. Calcular el
coeficiente de fiabilidad del test.

Se ha obtenido un coeficiente de fiabilidad medio 0,61.


Media de la muestra X de 3,5 y Desviación típica de 2,92
Media de las diferencias pares/impares=d es de 0,17 y su Desviación típica de 1,14
r=1-1,14/2,92=0,61
9.1.3. Guttman-Flanagan.
Flanagan (1 937) y Guttman (1945), de forma independiente llegaron a una fórmula
equivalente a la de Rulon y que presenta una mayor sencillez de aplicación. La fórmula
de Guttman-Flanagan viene determinada por la siguiente expresión:

donde:
Sp2 y Si2= varianzas de las puntuaciones en los ítems pares e impares.
Sx2= varianza empírica del test total.
Tanto la ecuación de Rulon como la ecuación de Guttman-Flanagan proporcionan el
mismo valor de la fiabilidad por ser expresiones equivalentes.
EJEMPLO:
Con los datos del ejercicio anterior, calcular el coeficiente de fiabilidad utilizando la
fórmula de Guttman-Flanagan.

Sp2=32+12+32+12+12+22/6-(1,83)2=4,16-3,35=0,81
Si2=12+02+32+12+22+32/6-(1,67)2=4-2,79=1,21
Rxx=2(1-0,81+1,21/2,92) =0,61
como se puede ver el resultado es igual que el obtenido por la fórmula de Rulon.

9.2. Métodos basados en la covariación entre los ítems.


Al hablar de la fiabilidad como consistencia interna hemos hecho alusión a dos formas
de abordar el tema. Una forma es la basada en la división del test en dos mitades. La
segunda forma requiere un análisis de la varianza y covarianza de las respuestas de los
sujetos a los ítems. De esta forma, el coeficiente obtenido proporciona una estimación
de la consistencia interna de los ítems del test. En el presente apartado haremos
referencia a algunos de los métodos más frecuentes para estimar la fiabilidad de un
test bajo estas condiciones como son el coeficiente alpha de Cronbach (1951), ó el
coeficiente KR20 y coeficiente KR21 de Kuder-Richardson (1 937). Tanto KR20 como
KR21 pueden ser considerados como casos particulares del coeficiente «alpha» de
Cronbach en el caso de que los ítems que forman el test sean dicotómicos.

9.2. 1. Coeficiente alfa de Cronbach.


El coeficiente de Cronbach (1951) constituye un indicador de la consistencia interna
del test. Este coeficiente expresa la fiabilidad del test en función del número de ítems y
de la proporción de la varianza total del test debida a la covariación entre los ítems.
Cuanto más covaríen los ítems entre sí mayor será la fiabilidad del test.
La ecuación general del coeficiente «alfa» viene expresada como:
donde:
n = número de elementos del test.
∑Sj2 = suma de las varianzas de los elementos del test.
∑∑cov (jk) = suma de las covarianzas de los ítems.
Sx2 =varianza de las puntuaciones en el test.
r1 = cociente entre la covarianza media de los ítems y su varianza media.

EJEMPLO 1:
Hemos aplicado un test de percepción visual a una muestra de seis sujetos. En la tabla
adjunta se presentan las puntuaciones que los sujetos obtuvieron en cada uno de los
cinco ítems que forman el test. Se desea saber valor del coeficiente fiabilidad del test.

Media X 17+15+14+7+6+3/6=10,33

Ejemplo 2
Siendo la covarianza medía entre todos los elementos de un test igual a 0,25, averiguar
el coeficiente de fiabilidad del test sabiendo que está compuesto por 10 ítems y que la
varianza empírica es igual a 40 puntos. Para resolver el problema hay que partir de que
la varianza de una variable compuesta, suma de otras variables, es igual a la suma de
las varianzas de todas las variables más la de las covarianzas, o bien a la suma de las
varianzas más los n(n-1 ) términos de covarianza media:
9.2.1.7. Estimador insesgado de α.

donde:
= estimador insesgado.
= valor de alpha de Cronbach.
N = número de sujetos de la muestra.
A medida que aumenta el número de sujetos de la muestra, el valor del å encontrado y
el valor del estimador insesgado se aproximan, siendo iguales cuando N--œ. En la
práctica, a partir de 100 sujetos, se pueden considerar insignificantes las diferencias
encontradas. Es decir:

Supongamos que en una muestra de 150 sujetos se les ha aplicado un test y se ha


obtenido un valor de å= 0,75.

Como se puede apreciar, a partir de 1 00 sujetos la diferencia encontrada entre ambos


estimadores es insignificante. Si por el contrario tuviéramos una muestra de 20
sujetos, las diferencias serían mayores.

1.2.1.2. Inferencias sobre alfa.


Alfa proporciona una estimación del coeficiente de fiabilidad de un test a partir de la
muestra en que se ha aplicado, pero a veces interesa plantearse si:
1. ¿Puede tomar alfa un valor concreto en la población a partir del valor muestral
obtenido?
Kristof (1963) y Feldt (1965), proponen el siguiente estadístico basado en la
distribución F

F se distribuye con (N-1) y (n-1)(N-1) grados de libertad.


α = valor de alpha propuesto por hipótesis para la población.
= valor de alpha obtenido en la muestra.
N= número de sujetos
n= número de ítems
Tras aplicar un test de percepción espacial de 35 ítems a una muestra de 60
estudiantes, se obtuvo un α de 0,83. ¿Es este coeficiente estadísticamente
significativo? (nivel de confianza: 95%).
H0: α=0

5,88 > 1,47 -Se rechaza la hipótesis nula. El coeficiente alfa es estadísticamente
significativo
2. ¿Existe una diferencia significativa entre el valor de alfa de dos muestras
independientes?
Feldt (1969), propone el estadístico de contraste W basado en la distribución F con
(N1-1; y N2 –1; grados de libertad) que permite probar la H0: α1= α2

W = Se distribuye según F con (N1-1) Y (N2-1) grados de libertad.


1y 2= Valores del coeficiente alpha en cada una de las muestras.
N1 y N2 = número de sujetos de cada muestra.
Hemos aplicado un test de razonamiento a una muestra de 121 participantes,
obteniendo un valor de alfa igual a 0,55. Se aplicó el mismo test a otra muestra de 61
participantes obteniéndose un valor de alfa igual a 0,62.
¿Existen diferencias estadísticamente significativas entre los valores de ambos
coeficientes? (N.C. = 95%).
H0: α1= α2
H1: α1≠ α2
W= 1-0,55/1-0,62= 1,18
F0,975 (120,60) = 1,58
F0,025 (120,60) = 0,65
Podemos afirmar, al N.C. 95%, que la diferencia entre ambos coeficientes no es
estadísticamente significativa puesto que el valor W= 1,18 se encuentra entre los
valores encontrados. W=1,18 > 0,65 F0,025 (120,60) y < 1,58 F0,975 (120,60).

3. ¿Es significativa la diferencia entre dos valores de alfa para una misma muestra?
Feldt (1 980, 1987) propuso el empleo del estadístico de contraste «t» para dos va
lores de alfa obtenidos a partir de una misma muestra de sujetos. Feldt recomienda el
empleo de este estadístico cuando N·n < 1.000, siendo N igual al número de sujetos y n
el número de ítems. El estadístico se expresa como:

donde:
t =se distribuye según una distribución t de Student con (N - 2) grados de libertad.
1y 2 = valores del coeficiente alfa en los dos tests.
N = número de sujetos en la muestra.
r2x1x2 = correlación al cuadrado entre las puntuaciones de los sujetos en los dos tests.
EJEMPLO:
Aplicamos dos tests de percepción visual a una muestra de 125 sujetos. La correlación
entre las puntuaciones de ambos tests es igual a 0,70. Los valores del coeficiente alfa
fueron, respectivamente: 0,75 y 0,84. Queremos saber si la diferencia existente entre
ambos valores es estadísticamente significativa o no (N.C. 95%).
H0: α1= α2
H1: α1≠ α2

t(n-2) = t123 = 1,96; t de 0,975/∞


Se rechaza la hipótesis nula y podemos establecer que la diferencia entre los
coeficientes es estadísticamente significativa.
9.3. Coeficientes basados en el análisis factorial de los ítems theta y Omega Ω
Los coeficientes Theta de Carmines (Carmines y Zeller, 1979) y Omega Ω de Heise y
Bohrnstedt (1970) constituyen dos indicadores de la consistencia interna de los ítems
de un test y una aproximación al coeficiente alpha. Se trata de dos coeficientes
basados en el análisis factorial de los ítems.
El coeficiente se puede expresar mediante la siguiente fórmula:

donde:
n = número de ítems del test.
Lambda 1= primer autovalor de la matriz factorial; es decir, la varianza explicada por el
primer factor antes de la rotación.
El coeficiente es además un indicador de la unidimensionalidad de los ítems. Cuanto
mayor sea la varianza que explica el primer factor mayor será el valor de theta y, por
consiguiente, la intercorrelación entre los ítems, lo que implica que éstos se
distribuyan en torno a una sola dimensión.
El coeficiente Ω se puede expresar mediante la siguiente fórmula:

= Suma de las varianzas de los ítems.


2
h = comunalidad estimada del ítem j.
j
∑∑Cov (Xj Xh) = suma de las covarianzas entre los ítems j y h
Otra forma más sencilla de expresar el coeficiente Ω es en función de las correlaciones
entre los ítems:

EJEMPLO:
En la siguiente tabla aparecen valores de la varianza explicada por los cinco factores
obtenidos tras someter a análisis factorial a 5 variables. La suma de las comunalidades
es igual a 4.95 y la suma de las correlaciones entre los ítems es igual a 5.1. Calcular el
valor de los coeficientes Omega Ω y Theta .

Omega Ω= ,996 Theta = 0,869


Ejemplo:
Supongamos un test compuesto por 6 ítems, y al que responden 6 sujetos.

Calcular el coeficiente de fiabilidad utilizando


KR20 y KR21.

1. Primero habría que calcular la varianza


de los ítems, que al ser dicotómicos es p*q.

KR20= 0,82 KR21= 0,80


Como los ítems no presentan misma dificultad, el valor obtenido con KR21 es más bajo
que el obtenido con KR20.

También podría gustarte