Está en la página 1de 26

Concepto de fiabilidad

Mg. Eloy Oliva Vásquez

PSI194 Psicometría 19
Concepto de fiabilidad
La fiabilidad se define como la consistencia o estabilidad de las
puntuaciones de un test, cuando el proceso de medición se repite en
las mismas condiciones. Está estrechamente relacionado con la
precisión de las puntuaciones.
La fiabilidad se puede estimar de diversas maneras, cada una con una
definición distinta sobre el error de medida. En términos generales, se
puede decir que la fiabilidad de un test puede venir de dos vías, la
estabilidad temporal y la consistencia interna.
Test-retest
Surge directamente de la Teoría clásica de los test. Si tenemos las
puntuaciones de un grupo de personas en un test y, luego de cierto
tiempo, volvemos a medir a las mismas personas con el mismo test,
cabría esperar una alta correlación entre ambas medidas.
Esta correlación se conoce como coeficiente de fiabilidad test-retest.
Valores cercanos a 1 indican mayor estabilidad temporal. No se
recomienda su uso en constructos muy volátiles (ej. Ansiedad)
Procedimiento en SPSS
1. Carga la base de datos “fiabilidad.sav”
2. Sigue la ruta
Analizar -> Escala -> Análisis de la fiabilidad
3. Ingresa las variables “forma1” y “retest” en la caja Elementos
4. En Estadísticos, marca la casilla Coeficiente de correlación intraclase. Seleccionar
el modelo Mixto de dos factores. Seleccionar el tipo Acuerdo absoluto
5. Continuar y Aceptar
Resultados

Observamos la fila Medidas promedio. El valor se interpreta de la misma forma que


una correlación, valores cercanos a 1 indican una asociación más fuerte. En este caso,
el índice de confiabilidad test re-test fue de .782 lo que se considera aceptable.
Reporte
La fiabilidad test retest fue evaluada mediante correlación intraclase
utilizando un modelo de factores mixtos y acuerdo absoluto. El
coeficiente de correlación intraclase fue de .782 IC 95% [.300, .933], lo
que sugiere una adecuada estabilidad temporal de la medida.
Formas paralelas
Si dos o más test miden lo mismo, entonces cabría esperar que ambas medidas
muestren una alta correlación.
La correlación entre ambos test se conoce como coeficiente de confiabilidad o
coeficiente de equivalencia. Este valor se interpreta como la proporción de
varianza de los puntajes empíricos, que se puede atribuir a la variabilidad de los
evaluados en la puntuación verdadera.
Si obtenemos un r de Pearson igual a .807, significa que el 80.7% de la varianza de
los puntajes observados es debida a la variabilidad en el verdadero nivel del rasgo.
El método paralelo estricto asume que ambas formas tienen varianzas y medias
iguales. Las varianzas de los errores también se asumen iguales.
Procedimiento en SPSS
1. Carga la base de datos “fiabilidad.sav”
2. Sigue la ruta:
Analizar -> Escala -> Análisis de fiabilidad
3. Agrega las variables “forma1” y “forma2” en la caja Variables.
4. En Modelo selecciona Paralelo
Resultados
La fiabilidad de la escala fue de .821 lo que
se considera aceptable.

La prueba de bondad de ajuste nos indica si el


modelo con varianzas iguales se satisface. El
método estrictamente paralelo también prueba si
las medias son iguales.
Si se rechaza la hipótesis nula, significa que
ambas formas son distintas, es decir, no son
equivalentes.
Método de bipartición
También conocido como método de las dos mitades o método
Spearman-Brown. Consiste en dividir el test en dos partes, siguiendo
un criterio determinado (ej. ítems pares vs impares). Si ambas partes
son paralelas, su correlación corresponderá al coeficiente de fiabilidad
de las puntuaciones de la mitad del test.
El resultado obtenido mediante la fórmula Spearman-Brown es mayor
que la correlación entre ambas partes. Este indicador se interpreta
como el porcentaje de la varianza explicada por las variaciones en el
nivel de rasgo real.
Es necesario cuidar que ambas partes sean realmente equivalentes.
Procedimiento en SPSS
1. Carga la base de datos “beck.sav”
2. Sigue la ruta:
Analizar -> Escala -> Análisis de la fiabilidad
3. Agrega los ítems V1 a V10 en la caja Elementos
4. En la pestaña Modelo, selecciona Dos mitades
5. Aceptar
Resultados
Dependiendo del número de ítems
interpretamos la fila Longitud igual o Longitud
desigual. En este caso, ambas partes tiene la
misma cantidad de ítems, por lo que
interpretamos la fila Longitud igual.
La interpretación del valor es igual a un
coeficiente de correlación. Por tanto, mientras
mas cercano a 1, menos varianza se puede
atribuir al error de medida.
En el ejercicio, el valor de la correlación fue de
.961 lo que se considera una fiabilidad óptima.
Alfa de Cronbach
Es una extensión del método de bipartición. Consiste en calcular la
fiabilidad del test a partir de las correlaciones de todas las posibles
combinaciones de ítems.
Supuestos: tau-equivalencia, variables continuas, errores no
correlacionados y unidimensionalidad del constructo.
El alfa de Cronbach se puede interpretar como una estimación inferior
del coeficiente de consistencia interna (siempre que se cumplan los
supuestos!)

(Trizano-Hermosilla & Alvarado, 2016)


Alfa de Cronbach: Supuestos
Tau-equivalencia, Cada ítem contribuye de la misma forma al puntaje
total, lo que comúnmente no es satisfecho. Incumplimientos a este
supuesto puede llevar a subestimar sustantivamente la consistencia
interna.
Ítems continuos, El coeficiente alfa de Cronbach utiliza las covarianzas
para estimar la confiabilidad, lo que implica que los ítems deben ser
continuos. La confiabilidad puede verse subestimada si se utilizan ítems
ordinales de menos de 5 puntos.

PSI194 Psicometría 32
Alfa de Cronbach: Supuestos
Errores no correlacionados. El que los errores correlacionen indica que
existe una fuente distinta del constructo medido que causa cierta
variación en los ítems (ej. Fraseo de los ítems). Si los errores están
correlacionados la fiabilidad estimada puede verse afectada.
Unidimensionalidad. El instrumento debe medir un solo constructo, es
decir, los ítems deben tributar a un mismo factor subyacente. La
consistencia interna es necesaria para determinar unidimensionalidad,
pero no suficiente. Se debe revisar la estructura factorial de los ítems
para establecer si se configura un solo factor o no.

PSI194 Psicometría 33
Procedimiento en SPSS
1. Carga la base de datos “beck.sav”
2. Sigue la ruta:
Analizar -> Escala -> Análisis de la fiabilidad
3. Agrega los ítems V1 a V10 en la caja Elementos
4. En Estadísticos, selecciona en el cuadro “Descriptivos para” las
casillas Elemento y Escala si se elimina el elemento.
5. En la pestaña Modelo, selecciona Alfa
6. Aceptar
Reporte
Es estimó la confiabilidad de la escala de depresión de Beck mediante
el coeficiente alfa de Cronbach. Los resultados sugieren una óptima
consistencia interna (𝛼 = .962).

PSI194 Psicometría 35
Resultados El alfa de Cronbach fue de .962,
lo que se considera un índice
de fiabilidad óptimo.

La columna “Alfa de Cronbach si el elemento se


ha suprimido”, nos indica la fiabilidad que
obtenemos si omitimos un ítem en concreto.
Esto nos permite identificar ítems problemáticos
que miden con mucho error y, por tanto,
atenúan la fiabilidad. En este caso, todos los
ítems aportan a la escala, por lo que no es
necesario eliminar ninguno.
Indicadores alternativos de la fiabilidad
De los índices de fiabilidad vistos, el alfa de Cronbach es el más
empleado, incluso cuando no es debido. En muchas ocasiones los
supuestos del alfa de Cronbach no son satisfechos (menos de 5
opciones de respuesta, multidimensionalidad del constructo, cargas
factoriales dispares, errores correlacionados), lo que produce una
estimación sesgada de la fiabilidad.
Desde hace varios años se ha propuesto calcular la fiabilidad a partir
del análisis factorial, mediante el coeficiente Omega. Otros coeficientes
alternativos son Theta, alfa ordinal, GLB
Fiabilidad esperada
La fiabilidad esperada dependerá del uso que se le dé al test. Si el
instrumento fue construido para tomar decisiones sobre las personas (ej.
Selección de personal, admisión a una universidad, incorporación a un
programa de ayuda especializada…) la fiabilidad debe ser superior a 0.90.
Si el instrumento se elaboró para identificar diferencias personales y para la
investigación, valores de fiabilidad superiores a 0.75 son aceptables.
Una dificultad del coeficiente de fiabilidad es su interpretación para casos
individuales. En estas situaciones, es necesario el grado de precisión de una
puntuación, se debe revisar el error típico de medida (ETM).

PSI194 Psicometría 38
El problema de SPSS
SPSS es el programa estadístico más utilizado por investigadores en psicología y en
otras disciplinas de las ciencias sociales. Sin embargo, carece de métodos actuales
de análisis de datos. Algunas de sus limitaciones son:
✓ No entrega intervalos de confianza para el alfa de Cronbach.
✓ Carece de los métodos de estimación de fiabilidad actuales, como Omega,
Alfa ordinal, GLB y otros.
✓ Carece de matrices de correlaciones policóricas o tetracoricas.
✓ En contexto de análisis factorial, no entrega indicadores de ajuste y tiene
muy pocos métodos de rotación y estimación.
Actualmente existen otros programas más versátiles y gratuitos que cubren las
limitaciones de SPSS y ofrece muchas otras utilidades adicionales. Dos programas
utilizados son FACTOR y R.
Estimación del ETM
Unas vez estimadas la fiabilidad mediante algunas de las estrategias
empíricas descritas, es posible obtener el error típico de medida a
través de la siguiente formula:

𝐸𝑇𝑀 = 𝐷𝐸 1 − 𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑

Donde DE es la desviación estándar de las puntuaciones del


instrumento

PSI194 Psicometría 40
Error típico de medida: Ejemplo
Supongamos que aplicamos una escala de estrés parental a 100 madres
puérperas. La confiabilidad de las puntuaciones obtenida mediante alfa
de Cronbach es igual a 0,829 y la desviación estándar de la escala es
igual a 7,261. Aplicando la formula nos queda lo siguiente:

𝐸𝑇𝑀 = 𝐷𝐸 1 − 𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = 7,261 1 − 0,829 =

= 7,261 0,171 = 7,261 ∗ 0,413 = 3

PSI194 Psicometría 41
Intervalos de confianza
Existen diversas formas de estimar los intervalos de confianza, sin
embargo, el más empleado es la estimación basada en la distribución
normal de los errores. Según este método, el intervalo de confianza se
define como:

𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 𝑥 − 𝑍 𝐸𝑇𝑀


𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 𝑥 + 𝑍(𝐸𝑇𝑀)

Donde x es la puntuación empírica y Z el valor critico dado un nivel de


confianza.
PSI194 Psicometría 42
Intervalo de confianza: Ejemplo
Supongamos que una participante obtuvo 24 puntos en la escala de
estrés parental ¿En que valores se encontrará su puntuación verdadera,
empleando un nivel de confianza del 95%?

𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 𝑥 − 𝑍 𝐸𝑇𝑀 La puntuación verdadera


= 24 − 1,96 3 = 24 − 5,88 = 18,12 de la participante en la
variable de estrés
𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 𝑥 + 𝑍 𝐸𝑇𝑀 parental se encontrará
= 24 + 1,96 3 = 24 + 5,88 = 29,88 entre 18,12 y 29,88
puntos
PSI194 Psicometría 43
Fuentes de error de distintas estrategias para estimar la fiabilidad del test
Estrategia para estimar Fuente de error
fiabilidad
Test retest Muestreo del tiempo
Formas alternas (inmediata) Muestreo de contenido
Formas alternas (demorada) Muestreo de contenido y tiempo
División por mitades Muestreo de contenido
Multipartición Muestreo de contenido y heterogeneidad de contenido
De calificadores Diferencias entre calificadores
Fuente: Anastasi y Urbina (1998)

PSI194 Psicometría 44

También podría gustarte