Está en la página 1de 4

Métodos para estimar la confiabilidad:

Test-retest

El método Test- retest trata de comprobar la confiabilidad de una prueba utilizando el mismo
instrumento en dos momentos diferentes, aislados en el tiempo, por lo que al resultado obtenido
se le denominará como confiabilidad test – retest. La confiabilidad test – retest estima la
confiabilidad conseguida al correlacionar pares de puntuaciones obtenidas de las mismas personas
en dos aplicaciones distintas del mismo instrumento. Este método es recomendable usarlo,
cuando se está hablando de pruebas que pretenden medir aspectos aparentemente estables a lo
largo del tiempo, ya que si se midieran aspectos que suelen cambiar constantemente en una
persona, en la segunda aplicación se obtendrían resultados distintos y se llegaría a pensar que la
prueba no es confiable. Hay que tomar en cuenta que en este método, su principal fuente de
varianza puede ser el simple paso del tiempo, ya que se estima que entre más pase el tiempo, el
coeficiente de confiabilidad tenderá a ser menor, de hecho cuando el intervalo de tiempo entre la
aplicación de la prueba es mayor a seis meses, se le llega a llamar coeficiente de estabilidad.
Cuando las pruebas se administran en tiempos donde suceden cambios grandes en el desarrollo
de las variables que se pretenden medir con la prueba, el evaluador deberá no solo tomar en
cuenta la significación del coeficiente de confiabilidad, sino también los posibles factores que
podrían estar interviniendo en la aplicación y que por lo tanto alteran los resultados. Por todo lo
anterior, la estimación de la confiabilidad test-retest resulta ser más conveniente para medir la
confiabilidad de exámenes que ocupan como resultado el tiempo de reacción o juicios
perceptivos.

Formas paralelas y formas alternas

Como sabemos, las pruebas pueden tener formas distintas, para evaluar el grado de correlación se
puede optar por un coeficiente de confiabilidad de formas alternas o equivalentes, el cual recibe el
nombre de coeficiente de equivalencia, aunque antes que nada, hay que saber distinguir entre las
formas paralelas y las alternas. Se le conoce como formas paralelas cuando para cada forma de la
prueba sus medias y las varianzas de las puntuaciones de la prueba son iguales, por consiguiente
las medias de las puntuaciones que se obtienen en las formas paralelas, se correlacionarán igual
con las puntuaciones verdaderas, es decir, se correlación de igual manera con otras medias,
aunque el desarrollo de ellas puede consumir tiempo y ser costoso, aun así el usuario de la prueba
puede tener ventajas sobre todo en pruebas que miden rasgos relativamente estables. Por otro
lado, las formas alternas son aquellas versiones distintas que se construyeron con el propósito de
que fueran paralelas en cuanto al nivel de contenido y dificultad. Para obtener su confiabilidad en
ambos casos, se concuerda un poco con el método test- retest en dos aspectos, el primero es que
se requieren dos aplicaciones de la prueba y el segundo, es el hecho de que las puntuaciones
pueden ser afectadas por factores como la motivación, eventos que interfieren en lo personal,
inclusive el muestreo de reactivos. Se puede llegar a valorar la confiabilidad de una prueba sin
necesidad de elaborar una prueba alterna o tener que administrarla una segunda ocasión, dicha
forma es la estimación de la confiabilidad de la consistencia interna, en resumen es la estimación
de la consistencia entre los reactivos de la prueba.

De esta forma se desprende la estimación de confiabilidad de dividir en mitades, siendo una


especie de mini formas paralelas, donde se busca estimar la confiabilidad a través de correlacionar
dos pares de puntuaciones obtenidas de mitades equivalentes de una única prueba que solo se
aplicó una vez, esta manera implica particularmente tres pasos: 1) Dividir la prueba en mitades
equivalentes. 2) Calcular la r de Pearson entre las puntuaciones en las dos partes de la prueba. 3)
Ajustar la confiabilidad de una de las mitades de la prueba usando la fórmula de Spearman –
Brown.

Fórmula de Spearman-Brown

La fórmula de Spearman – Brown sirve para estimar la confiabilidad de la consistencia interna de


una prueba, a partir de la correlación de las dos mitades de la prueba, para calcularla se adopta
una fórmula general, para valorar la confiabilidad de una prueba que se alarga o se acorta en
alguna cantidad de reactivos.

rSB = nrxy / 1 + (n – 1) rxy

Donde:

rSB = Confiabilidad ajustada por la fórmula de Spearman – Brown.

rxy = r de Pearson en la prueba con la longitud original.

n = Número de reactivos en la versión revisada, dividida entre el número de reactivos en la versión


original.

Por otro lado, si se desea evaluar la confiabilidad de la prueba completa, se recurre a la fórmula:

rSB = 2rhh / 1 + rhh

Donde rhh es igual a la r de Pearson de las puntuaciones en las dos mitades de la prueba. La
confiabilidad ira en aumento conforme incrementa el largo de la prueba, por lo que al estimar la
confiabilidad basándonos en la prueba completa evidentemente será mayor, a comparación de
que si nos basáramos únicamente en la mitad. Además, la fórmula de Spearman – Brown es
funcional para los creadores y usuarios de las pruebas para valorar el efecto que tiene el acortar la
prueba, pues en ocasiones se requiere que se reduzca la prueba para que se aplique en una menor
cantidad de tiempo, también se puede ocupar la fórmula para decidir el número de reactivos
adecuados para conseguir el nivel deseado de confiabilidad, en estos casos, el añadir reactivos
podría aumentar la confiabilidad, siempre y cuando los nuevos reactivos tengan la misma
dificultad y contenido para que esta prueba alargada mida exactamente lo mismo que la original,
pero si la confiabilidad de la prueba original es baja, es poco probable que esta aumente al agregar
más reactivos. Este método no es recomendable al momento de estar evaluando la confiabilidad
de pruebas heterogéneas y pruebas de velocidad.

Fórmulas de Kuder- Richardson

Frederic Kuder y M.W. Richardson no se sentían satisfechos por los métodos existentes en aquella
época, como por ejemplo el método de dividir en mitades para estimar la confiabilidad, por lo que
decidieron actuar y comenzaron a idear sus propios métodos para estimar su confiabilidad,
planteando diversas fórmulas, pero una de las más conocidas en las que colaboraron es la fórmula
20 Kuder – Richardson o simplificada como KR-20, la cual solo se usa en pruebas con reactivos
dicotómicos, sobre todo en aquellos cuya calificación solo es correcta o incorrecta. La fórmula es:
r_█(KR20 @ )=(k/(k-1))(1-pq/ϑ^2 )

Donde:

r_█(KR20 @ )= Coeficiente de confiabilidad de la fórmula 20 de Kuder – Richardson.

k = Número de reactivos de la prueba.

ϑ^2= Varianza del total de las puntuaciones de la prueba.

p= Proporción de evaluados que aprobaron la prueba.

q = Proporción de evaluados que reprobaron la prueba.

pq = Suma de los productos pq de todos los reactivos.

Algo peculiar que podemos observar con esta fórmula es que cuando los reactivos de la prueba
son muy homogéneos, nos encontraremos con que la KR – 20 y la estimación de confiabilidad de
dividir en mitades serán parecidos, mientras que si contamos con reactivos que son de carácter
heterogéneo, la KR – 20 brindará una estimación de confiabilidad inferior, a comparación de la
estimación de confiabilidad de dividir en mitades. Otra fórmula desarrollada por Kunder –
Richardson es la KR- 21, que es ocupada cuando se considera que todos los reactivos poseen
aproximadamente el mismo nivel de dificultad. Respecto a las fórmulas de Kuder – Richardson, en
los últimos años se han propuesto modificaciones para estas, aunque solamente hay una variante
para la KR – 20, debido a que la fórmula 20 ha sido la más aceptada y más usada en estadística hoy
en día, dicha variante se denomina coeficiente alfa.

Coeficiente alfa de Cronbach

Conocido comúnmente como coeficiente alfa, se considera la media de todas las correlaciones
posibles al dividir en mitades, es recomendable para utilizarse en reactivos no dicotómicos. Para
su cálculo se ocupa la siguiente fórmula:

r_α=(k/(k-1))(1- (ϑ_i^2)/ϑ^2 )

Donde:

r_α= Coeficiente alfa

k = Número de reactivos

ϑ_i^2= Varianza de un reactivo

ϑ_i^2= Suma de la varianza de cada reactivo

ϑ^2= Varianza del total de las puntuaciones de la prueba

Este coeficiente es el más utilizado si se desea saber la estimación de la confiabilidad de la


consistencia interna, de igual forma, es ocupado en muchas ocasiones como medida de
confiabilidad porque para obtenerlo únicamente basta una sola aplicación de la prueba, este
posee un valor de variación de 0 a 1, debido a que este es calculado para apoyar a conocer qué tan
similares son los grupos de reactivos, y en este caso para la medición de similitud su escala va
desde 0 que simboliza el que no hay en lo absoluto alguna similitud, hasta 1 que representa una
similitud perfecta, es decir, que son exactamente idénticos; si nos damos cuenta, su rango de
valores se ubica en el área positiva, sin embargo aunque en teoría no existe la posibilidad de que
haya un coeficiente de alfa negativo, en ocasiones se llegan a concebir, por lo que es
recomendable que en estas situaciones se opte por colocarlo como 0. Al utilizarlo es importante
tener presente que nos proporciona un índice característico de un conjunto propio de
puntuaciones de la prueba, más no se está tratando de la prueba misma como tal.

También podría gustarte