Confiabilidad

CAPITULO VIII
CONFIABILIDAD DE INSTRUMENTO DE MEDICIÓN EDUCATIVA
Conceptualización
La confiabilidad es una medida de consistencia y uniformidad de un instrumento

de recolección de datos. Permite determinar si las calificaciones provenientes de la
aplicación de un instrumento son estables en el tiempo y en lugares diferentes. Se
comprueba la confiabilidad de una balanza, si una persona que se pesa en ella en lugares
y momentos diferentes, obtienen un peso similar, es decir, sin diferencias significativas.
En el caso de los instrumentos educativos, se dice que éste es confiable si al aplicar el
instrumento dos veces a las mismas personas o al aplicar dos versiones de un mismo
instrumento a los mismos sujetos se obtiene los mismos resultados. Asimismo un
instrumento es confiable si los sujetos a quienes se le aplica el instrumento lo responden
homogéneamente (consistentemente) en cuanto a la variable que se desea medir.
A continuación se revisan algunas definiciones de confiabilidad. Se comienza con
Anastasi y Urbina (1.998) quienes al respecto expresa lo siguiente: “...El término de
confiabilidad se refiere a la consistencia de las puntuaciones obtenidas por las mima
personas cuando se las examina en distintas ocasiones con el mismo test, con conjunto
equivalentes de reactivos o en otras condiciones de examinación...”(P.84). Más adelante
las autoras mencionadas definen la confiabilidad: “....en términos más técnicos, la
confiabilidad de una prueba permite estimar qué proporción de la varianza verdadera
total de las puntuaciones se debe a varianzas del error ...(P.84).
Es importante expresar que cuando se realizan mediciones en diferentes
ocasiones, siempre existen diferencias, por ejemplo, si nos pesamos hoy y luego lo
volvemos hacer el día siguiente siempre existe una diferencia, auque a veces es mínima,
la cual es originada por factores fortuitos como haber tomando el peso inmediatamente
después de consumir alimentos. Este tipo de diferencias se conocen como varianza del
error y es originada por factores aleatorios, los cuales el investigador cuando aplica un
instrumento debe controlar.
La teoría del error de medición en la confiabilidad de los instrumentos se expresa
de la manera siguiente:
Y= T+E; donde:
Y= Puntuación observada
T= Puntuación verdadera
E= Error de la medición
Transformándose la ecuación en:
V= Vv+ Ve; donde:
V= Varianza total
Vv= Varianza verdadera
Ve= Varianza del error
Interpretación del Coeficiente de Confiabilidad
La confiabilidad se interpreta a través de un coeficiente que tiene los siguientes

rangos:
Rango Interpretación
0,81 a 1,00 Muy alta
0,61 a 0,80 Alta
0,41 a 0,60 Moderada
0,21 a 0,40 Baja
0,00 a 0,20 Muy Baja
Cuando es Negativo Extremadamente Baja
Cuando es Mayor a 1 Extremadamente Alta
Lo normal es que el coeficiente de confiabilidad esté entre 0 y 1; pero en algunos

casos traspasa esté intervalo. Cuando un instrumento tiene una confiabilidad negativa,
significativa que ésta es extremadamente baja, lo cual debe llevar a tomar la decisión de
rechazar el instrumento. Cuando sucede el caso contrario, el coeficiente mayor a 1, la
confiabilidad es extremadamente alta. Debe aceptarse el instrumento. Lo recomendable
cuando ocurre alguno de estos dos casos es revisar determinadamente las respuestas del
instrumento y los cálculos. Es común cuando esto ocurre que el resultado se debe a
incorrecta codificación de las alternativas de
respuestas o cálculos aritméticos incorrectos cuando el coeficiente se calcula en forma
manual.
Métodos de Confiabilidad
Los métodos de confiabilidad son tres, los cuales se desarrollan a continuación:
Reaplicación de la Prueba (Test-Retest)
Este método de confiabilidad consiste en aplicar el instrumento a los mismos

sujetos en dos momentos diferentes. Es aconsejable que el intervalo de tiempo, entre las
dos aplicaciones no sea muy prolongado ni muy breve. Lo recomendable es entre 15 y
30 días. Debe tenerse cuidado que en el periodo entre ambas aplicaciones, los sujetos no
reciban algún estímulo que pudiera influir en la segunda aplicación. Este método
genera medida de estabilidad, porque garantiza que los resultados del instrumento sean
estables en el tiempo.
El procedimiento para aplicarlo es el siguiente:
1. Se aplica el instrumento en dos momentos a los mismos sujetos.
2. Se correlacionan los puntajes de ambas mediciones, a través de un coeficiente
de correlación; cuando la variable está en una escala de medición de intervalo o
de razón se aplican el coeficiente de correlación de Pearson. Si la variable está
expresada en una escala de medición ordinal, el coeficiente de correlación
apropiado es el Spearrman.
A continuación se presentan dos (2) ejemplos que ilustran ambos casos:
Ejemplo 1
Aplicación del Coeficiente de Correlación de Pearson
Puntuación X Puntuación Y
Sujetos X2 Y2 X.Y
(1° aplicación) (2° aplicación)
1 10 12 100 144 120
2 20 19 400 361 380
3 15 15 225 225 225
4 13 15 169 225 195
5 8 9 64 81 72
6 10 12 100 144 120
7 11 11 121 121 121
8 17 16 289 256 272
9 20 19 400 361 380
10 5 4 25 16 20
N = 10 X = 129 Y = 132 X2 = 1.893 Y2 = 1.934 XY = 1.905
  X   Y 
 XY 
r N
   x  2
  y  2
  x2
  y  2
 N   N 
129132
1.905 
10 202,20
r   0,97
  129    132  209,42
2 2
1.893   10  1.934  10 

  
El coeficiente de confiabilidad es 0,97; lo cual indica una confiabilidad muy alta

(ver rangos de interpretación).
Ejemplo 2
Aplicación del Coeficiente de Correlación de Spearman
Primeros Rango Segundos Rango Di

Sujetos Di2
puntajes (RI) Puntajes (R2) (R1-R2)
1 83 2 43 3 -1 1
2 99 6 47 4 2 4
3 88 5 40 2 3 9
4 41 1 38 1 0 0
5 117 10 66 8 2 4
6 114 9 89 11 -2 4
7 112 8 87 10 -2 4
8 84 3 57 6 -3 9
9 86 4 63 7 -3 9
10 127 12 93 12 0 0
11 107 7 55 5 2 4
12 118 11 83 9 2 4
Total 52
6  Di  2
6 52
r 1   0.82
N  N 12   N
3 3
La confiabilidad es muy alta, aceptándose sin reservas el instrumento

Cuando dos o mas sujetos reciben el mimos puntaje, se le asignaba a cada uno el
promedio de los rangos de los sujetos empatados. A continuación se muestra un
ejemplo:
Rango 1 Rango 2 D
Sujetos Puntuaciones Di2
(R1) (R2) (R1-R2)
1 1 20 1 0 0
2 2 18 3,5 -1,5 2,25
3 3 19 2 1 1
4 4 18 3,5 0,5 0,25
5 5 16 6 -1 1
6 6 15 8 -2 4
7 7 16 6 1 1
8 8 16 6 2 4
9 9 13 10 -1 1
10 10 14 9 1 1
11 11 9 11 0 0
12 12 6 12 0 0
Total 15,5
615,5
r  1  0,95
12 3  12
La confiabilidad es muy alta, por lo tanto, debe aceptarse el instrumento.
Hay programa estadístico, como Excel, STATISTICA, SPSS, etc., que calculan
ambos coeficientes de correlación, lo cual facilita considerablemente la obtención de
estos coeficientes. La rutina para obtenerlos es muy fácil de manejar y presenta además
la prueba de contraste de hipótesis que complementa los resultados obtenidos a través
de los coeficientes.
Pruebas de formas Equivalentes y formas alternas
Este método consiste en elaborar dos versiones de un instrumento que miden la

misma variable, las cuales se aplican a un mismo grupo de sujetos. Genera en el
instrumento medidas de equivalencia, porque garantiza la obtención de resultados
confiables cuando la variable se mide en dos versiones diferentes del instrumento.
Cuando las dos versiones no se aplican simultáneamente al grupo de sujetos, sino que
se aplican en momentos diferentes; además de generar medida de equivalencia, también
genera medida de estabilidad.
El procedimiento para obtener el coeficiente de confiabilidad de equivalencia es el
siguiente.
1. Elaborar las dos versiones equivalentes del instrumento.
2. Correlacionar los puntajes de ambas versiones de la prueba de la misma
manera que en el caso del método de reaplicación de la prueba, es decir a través del
coeficiente de correlación de Pearson, si la escala de medición de la variable es de
intervalo o de razón; si la escala de medición de la variable es ordinal, se aplica el
coeficiente de correlación de Spearman.
Hay autores que establecen diferencias entre pruebas equivalentes y pruebas
alternas, argumentado que solamente puede hablarse de pruebas equivalentes cuando
ambas versiones no tiene diferencias significativas en la media y la varianza de las
puntuaciones obtenidas. Cuando sólo se asume que hay dos versiones equivalentes de
una prueba, sin comprobar la igualdad de medias y varianzas, se está en presencia de
una prueba paralela.
Al respecto Cohen y Swerdlik (2.000) expresan lo siguiente:
Formas alternas y formas equivalentes son términos que en ocasiones se

usan en forma indiscriminada, aunque hay una diferencia técnicas entre
ellos. Existen formas equivalentes de una prueba cuando para cada forma de
la prueba son iguales las medias y las varianzas de las puntuaciones de
pruebas observadas. ... Las formas alternas tan sòlo son versiones diferentes
de una prueba que se han construido con el fin de ser equivalentes. Aunque
no cumplen con los requisitos para la designación legítima de
“equivalentes“, las formas alternas de una prueba están diseñadas
generalmente para ser equivalentes con respecto a variables (o ítems) como
contenido y nivel de dificultad. (p. 160)
Método de Consistencia Interna

Este método tiene como propósito determinar la homogeneidad en las respuestas
de sujetos a quienes se le aplicó el instrumento, puede aplicarse a pruebas que miden
habilidades como prueba de aprovechamiento, aptitud, inteligencia, de nivel de
conocimiento, etc, y a pruebas afectivas (o de personalidad) como las escalas de actitud,
test de personalidad, escalas de motivación, etc. Es incorrecto aplicar este método a los
cuestionarios de opinión; porque al medir homogeneidad en las respuestas de los sujetos
a quienes se aplica el instrumento, es apropiado para aquellos instrumentos que
persiguen obtener una calificación única, con alternativas de respuestas en grado de
intensidad.
En los cuestionarios de opinión no hay inconsistencia si los sujetos responden las
preguntas en forma heterogéneas, porque las mismas no son para obtener una
puntuación única que indica una alta, media o baja presencia del atributo (variable) en
los sujetos. En el caso de los cuestionarios de opinión, cada pregunta como se mencionó
en el capítulo V, se analiza por separado. No es posible una calificación única, porque,
primero, las opiniones están en una escala de medición nominal (sólo son
clasificatorias), y en segundo lugar, generalmente este tipo de instrumento, aunque
describa una sola variable, incluye preguntas con las cuales no se puede obtener una
calificación única, porque los ítemes miden o describen aspectos diferentes de la
variable.
A continuación se presentan varias fórmulas para calcular la consistencia interna
de un instrumento.
Fórmula Kuder-Richardson (KR – 20) Datos dicotómicos.
n vt   p.q ó n  p.q
Rt  ( )( ) Rt  ( )  (1  )
n 1 vt n 1 vt
Rt = Coeficiente de Confiabilidad
n = Número de ítemes que contiene el instrumento.
Vt: Varianza total de la prueba
p.q = Sumatoria de la varianza individual de los ítemes
Se puede aplicar cualquiera de ambas fórmulas, obteniéndose resultados similares.
Determinar el coeficiente de la confiabilidad Kuder-Richardson

(Matriz de ítemes dicotómicos)
ítemes Total
Sujetos X2
1 2 3 4 5 (x)
1 1 1 1 1 1 5 25
2 1 1 1 1 1 5 25
3 1 1 1 1 1 5 25
4 1 1 1 1 1 5 25
5 0 1 1 1 1 4 16
6 1 0 0 1 1 3 9
7 1 1 1 1 1 5 25
8 1 1 1 1 1 5 25
9 0 1 1 1 0 3 9
Total 7 8 8 9 8 40 184
P 0,78 0,89 0,89 1 0,89 - -
q = 1-P 0,22 0,11 0,11 0 0,11 - -
p.q 0,17 0,10 0,10 0 0,10 0,47 -
Cálculo de la varianza
p.q = 0.47
( x) 2 ( 40) 2
 2  x2  184 
( x  x ) n  9  0.78
Vt 
n 1 n 1 9 1
Vt = Varianza total
n = número de sujetos
La varianza, al igual que el coeficiente de confiabilidad de Kuder-Richardson, se
puede calcular por dos fórmulas. Se recomienda calcular el promedio por la segunda
fórmula que lo calcula abreviado y es menos susceptible a errores de redondeo, los
cuales cuando se calculan coeficientes pueden afectar significativamente los resultados.
Cálculo del Coeficiente Kuder-Richardson
n  p.q 5 0.47
Rt  ( )  (1  ) Rt  ( ) x (1  )  0,50
n 1 vt 5 1 0.78
Rt = Coeficiente de confiabilidad Kuder-Richardson

n = número de ítemes que contiene el instrumento
Al interpretar los resultados de acuerdo a los rangos explicados, se concluye que
la confiabilidad de consistencia interna es moderada. Si el instrumento evaluado es un
test afectivo (como una escala de actitud, escala de motivación, test de personalidad,
etc.) debe rechazarse el instrumento. Si es un instrumento que mide habilidades (como
una prueba de conocimiento, prueba de rendimiento académico, prueba de aptitud, etc.)
se puede aceptar el instrumento, complementando el análisis con otros indicadores de
validación. Cuando la confiabilidad es baja, muy baja o extremadamente baja (negativa)
debe rechazarse el instrumento, aunque sea un test de habilidades.
Datos en Escalas no Dicotómicas (más de 2 Alternativas de Respuestas)
Fórmula Alfa de Cronbach

n Vi
n St   Vi rt  ( )  (1  )
rt  ( )  ( ) n 1 Vt
n 1 Vt
rt = Coeficiente de confiabilidad
n = Número de ítemes que contiene el instrumento
Vt ò St = varianza total
Vi = varianzas individuales
Se puede aplicar cualquiera de las dos fórmulas, obteniéndose resultados

similares.
Determinar el coeficiente Alfa de Cronbach
(matriz de ítemes con cinco (5) alternativas de respuestas).
Ítemes Total
Sujetos X2
1 2 3 4 5 6 (X)
1 4 4 3 2 1 1 15 225
2 3 1 3 3 1 2 13 169
3 4 5 4 4 4 4 25 625
4 4 3 2 3 1 1 14 196
5 5 2 4 4 3 1 19 361
6 5 4 3 2 4 2 20 400
7 4 4 2 3 2 3 18 324
8 4 4 2 5 2 4 21 441
Total (x) 33 27 23 26 18 18 145 2.741
X2 139 103 71 92 52 52 - -
Vi2 0.41 1,70 0,70 1.07 1,64 1,64 7,16 -
Cálculo de la varianza
Varianza total
(145) 2
2.741 
Vt  8
2  16,13
8(33
 1)
139 
V 12  Cálculo 8de las
 0varianzas
,41 individuales
8 1
(27) 2
103 
V 22  8  1,70
8 1
(23) 2 (26) 2
71  92 
V 32  8  0,70 V 42  8  1,07
8 1 8 1
Coeficiente de Confiabilidad
(18) 2 (18) 2
52  52 
8  1,64 V 32  8  1,64
V 52 
8 1 8 1
rt=( n ) *( 1- Vi ) =( 6 )* (1–7,16/16,13)

n- 1 VT 6-1
rt = 0,67
rt = Coeficiente de confiabilidad
n = número de ítemes que contiene el instrumento
Vt = Varianza total
Vi = Varianzas individuales
En este ejemplo la confiabilidad es alta. Si el instrumento mide habilidades se
debe aceptar el instrumento; pero cuando es una prueba afectiva, el coeficiente como
mínimo debe ser 0.81, es decir, poseer una confiabilidad muy alta.
La formula alfa de Cronbach también es aplicable a datos dicotómicos. Al
respecto Cohen y Swerdlik (2.000) expresa lo siguientes:.....El coeficiente alfa también
puede ser usado en pruebas con reactivos dicotómicos. Además, el coeficiente alfa es
apropiado para ser usado en pruebas que contienen reactivos que no son dicotómicos...
(P.166). Los resultados de la confiabilidad de datos dicotómicos, aplicando la fórmula
Alfa de Cronback, son similares a los obtenidos aplicando la formula Kuder-
Richardson, si las respuestas de los sujetos a quienes se aplicó el instrumento son muy
homogéneas. En la medida que se incrementa la homogeneidad, mayor será la similitud
de los resultados de ambas fórmulas. Si las respuestas de los sujetos son heterogéneas,
la diferencia de los resultados obtenidos por ambas fórmulas será considerable. En este
último caso no es recomendable aplicar la fórmula Alfa de Cronbach a ítemes de
respuestas dicotómicas. Se puede proceder en el cálculo de la confiabilidad de datos
dicotómica de la manera siguiente: se calcula el coeficiente de confiabilidad alfa de
Cronbch a través de SPSS, si el coeficiente es muy alto, se acepta como indicador
adecuado de la confiabilidad (en este caso los datos son muy homogéneos). Si es bajo,
se considera heterogéneo, siendo aconsejable determinar el coeficiente por la fórmula
Kuder- Richardson, porque indica diferencias entre los resultados de ambas fórmulas.
Cuando se calcula el coeficiente Kuder-Richardson hay que hacerlo manual; porque el
Programa SPSS no lo calcula. Se puede calcular también a través del programa Excel,
siguiendo la rutina que se incluye en el anexo D. Se justifica la aplicación de este
programa cuando el número de ítems del instrumento es alto.
Correlación ìtem-test y confiabilidad sin el ítem

Correlación ítem-test
Este indicador de homogeneidad del test, permite establecer la correlación entre
el ítem y el total de la escala. Pardo y Ruiz (2.002) Expresan que “...lo deseable es que
esas correlaciones sean altas; una correlación baja estaría indicando que el elemento (el
ítem) en cuestión no apunta en la misma dirección que el resto de los elementos. (p.
605)
El paquete estadístico SPSS, lo presenta como opcional cuando se calcula el
coeficiente de confiabilidad. Ruiz (1998) recomienda que el ítem aceptado debe poseer
una relación con el total, superior a 0,25; porque de lo contrario la relación no es
aceptable.
Confiabilidad del Instrumento si se Excluye el Ítem Analizado
Este indicador de confiabilidad del instrumento, permite determinar si el ítem

analizado aporta confiabilidad al instrumento. El criterio que se estable es excluir el
ítem y observar el comportamiento de la confiabilidad del instrumento. Si la
confiabilidad sube o permanece igual a la obtenida con el ítem incorporado, se toma la
decisión de excluirlo del instrumento; porque se demuestra que el mismo no aporta
confiabilidad al instrumento, en caso contrario, cuando la confiabilidad baja, debe
aceptarse el ìtem; porque indica que si èste se excluye del instrumento, la confiabilidad
serà afectada (disminuirà).
Ccàlculo de Ambos Indicadores
Su cálculo manual es muy engorroso y complejo; pero el programa SPSS lo

calcula, siguiendo la siguiente rutina: Menú Estadístico ( o Menú Analizar)→
Escalas→Análisis de fiabilidad→Estadístico: activar la opciòn “Escala si se elimina el
elemento”→ Continuar→Aceptar.
Confiabilidad de Dos Mitades
Es un método que determina consistencia interna del instrumento. Consiste en

dividir el instrumento en dos mitades y proceder a determinar si existen relación entre
ambas, aplicando el coeficiente de Spearman-Brown, el cual introduce en la fórmula
una corrección, porque al dividir el instrumento en dos mitades se reduce el número de
ítemes, afectando la confiabilidad.
¿Cómo se constituyen las dos mitades?
Las dos mitades pueden conformarse de varias formas; las más usuales son las
siguientes:
1. Ítemes pares e ítemes impares
2. Procedimientos aleatorios para seleccionar los ítemes de cada mitad
Pasos para calcular el coeficiente de las dos mitades
1. Se constituyen las dos mitades

2. Se calcula el coeficiente de correlación de Pearson correlacionando las dos
mitades
3. Se aplica la fórmula de Spearman-Broawn
El procedimiento para calcularlo es similar a los métodos de reaplicación de la
prueba y al de confiabilidad de formas equivalentes y formas alternas. Se aplica la
fórmula del coeficiente de correlación de Pearson cuando la escala de medición de la
variable es de intervalo o de razón. Si la escala de medición de la variable es ordinal, el
coeficiente de correlación adecuado es el de Speraman (ver en este mismo capítulo la
subsección correspondiente al método de reaplicación de la prueba).
Fórmula de Spearman – Brown
2r1, 2
rsp 
1  r1, 2
rsp = coeficiente de correlación Spearman-Brown

r 1,2 = coeficiente de correlación de las dos mitades
Ejemplo
Calificaciones de 10 estudiantes de un curso

Calificaciones primera Calificaciones segunda
Estudiantes
mitad de la prueba mitad prueba
1 15 16
2 14 13
3 20 20
4 8 10
5 17 16
6 19 19
7 14 15
8 12 13
9 20 20
10 8 6
En este ejemplo el coeficiente de correlación de Pearson (r1,2) de las dos mitades

es 0,96
Se procede a calcular el coeficiente de confiabilidad aplicando la fórmula de
Spearman-Brown. Los resultados son los siguientes:
2  0.96
rsp   0.98
1  0.96
4. Se interpreta la confiabilidad como muy alta (0,98), por lo tanto, el

instrumento tiene consistencia interna.
Diferencias entre Dos Mitades de la Prueba y Formas Paralelas
Pardo (2.000) al referirse a ambos indicadores de evaluación de un instrumento,

expresa lo siguiente:
“Dos Mitades. Divide la escala en dos partes y calcula la fiabilidad a partir de la
correlación entre ambas partes”. (p. 596). Al referirse a las formas paralelas de un
instrumento, expresa: “...Asume que todos los elementos (ítems o variables) tienen
iguales varianzas observadas y error.” (p. 596). Pardo, también establece diferencias
entre las formas paralelas de una prueba y el paralelo estricto. Al referirse a este último
expresa: “...Asume los supuestos del modelo paralelo y, además, que las medias de
todos los elementos son iguales."
Para acceder a estos tres modelos incorporados en el programa SPSS desde la
Base de datos que se analiza, se sigue la siguiente rutina: Clic en analizar
→Escala→Anàlisis de fiabilidad→en “Modelo” cambiar Alfa (opciòn por defecto) por
Dos Mitades o Paralelo o Paralelo estricto.
Factores que Incrementan la Confiabilidad

1. Exclusión del instrumento ítemes ambiguos: las ítemes deben formularse
de manera clara y precisa, para evitar a quienes los responden
interpretaciones diferentes al sentido para el cual fue formulado.
2. Instrucciones claras tienden a reducir los errores de medición: el
instrumento de recolección de datos, debe ir acompañado de
instrucciones donde se especifique la manera de responder las preguntas
y donde se aclare posibles dudas del respondiente en el momento de
contestar las preguntas formuladas.
3. Control de las condiciones del espacio físico y el personal responsable de
aplicar el instrumento: cuando se aplica un instrumento debe disponerse
de condiciones de espacio físico similares para todas aquellas personas a
quienes se le aplicará la prueba. Asimismo el personal responsable de
aplicarlas debe poseer el mismo entrenamiento y las mismas
instrucciones.
Estableciendo estos mecanismos de control se puede reducir la varianza del error,
la cual es causada por factores externos a la prueba. Si este tipo de varianza no se
controla, puede afectar considerablemente los resultados de la prueba, y por lo tanto, la
confiabilidad del instrumento.
Incremento de la Confiabilidad de un Instrumento
Si el instrumento posee baja confiabilidad, ésta puede incrementarse agregando

ítemes de igual tipo y calidad
A continuación se presenta ejemplos de cómo incrementar la confiabilidad
aumentando el número de ítemes:
¿Cuantos ítemes deben agregarse a un instrumento para alcanzar la confiabilidad
deseada?
Fórmula
N= CD(1-CI)
CI(1-CD)
n = número de ítemes necesarios para lograr la confiabilidad desea

CI = Confiabilidad del test inicial
CD = Confiabilidad deseada
Ejercicios Resueltos
Si la confiabilidad de un instrumento de 10 ítemes es 0.46 ¿Cuantos ítemes

deben agregarse para alcanzar una confiabilidad de 0.81?
N= 0,81(1-0,46) = 5 veces más largo, es decir, necesita 50 ìtemes para lograr la

0,46(1-0,81) confiabilidad deseada
Si la confiabilidad de un instrumento de 30 ítemes es 0.05. ¿Cuántos ítemes deben

agregarse para alcanzar una confiabilidad de 0.90?
N= 0,90(1-0,05) = 171 veces màs largo. Tendría que tener 5.130 ìtemes
0,05(1-0,90)
Si la confiabilidad de un instrumento de 30 ítemes es 0.55. ¿Cuantos ítemes deben

agregarse para incrementarla a 0.61?
N= 0,61(1-0,55) = 1,28 veces más largo. Tendría que tener 38 ìtemes.

0,55(1-0,61)
EJERCICIOS PROPUESTOS
Actividad 1
CONFIABILIDAD POR REAPLICACIÓN DE LA PRUEBA Y POR PRUEBAS EQUIVALENTES
Calcule el coeficiente de estabilidad y equivalencia en las siguientes situaciones e interprete los resultados :
(Las pruebas F1 y F2 son dos versiones del mismo instrumento que miden la misma variable y
se asume los datos en una escala de mediciòn de intervalo)
Prueba (F1) aplicada Prueba (F1) aplicada Prueba (F2) aplicada
Sujetos el 29/02/04 el 22/03/04 el 22/03/04
(Puntaje total) (Puntaje Total) (Puntaje total)
1 267 275 272
2 246 236 240
3 246 229 260
4 244 267 265
5 274 267 270
6 264 280 275

7 274 276 260
8 275 257 270
9 264 269 230
10 248 231 255
11 277 256 250
12 246 253 252
13 224 236 240
14 247 272 271
15 241 258 257
16 240 247 250
17 251 262 260
18 254 266 265

Actividad 2
Desarrolle el procedimiento manual exigido para calcular el coeficiente de
consistencia interna en los siguientes ejercicios e interprete los resultados
EJERCICIO 1
ítemes
Sujetos
1 2 3 4 5
1 1 1 1 1 1
2 1 0 1 1 1
3 1 1 0 0 0
4 1 1 1 1 1
5 1 1 1 1 1
6 1 1 1 1 1
7 1 0 1 0 1
8 1 0 1 0 0
9 0 1 1 1 0
EJERCICIO 2
Items
Sujetos
1 2 3 4 5 6
1 4 4 4 4 4 4
2 5 4 4 5 4 2
3 5 5 5 5 5 5
4 4 5 4 4 5 4
5 4 4 4 4 5 4
6 4 4 5 5 5 5
7 4 5 2 3 5 5
8 5 5 4 5 4 5
9 4 4 4 4 4 4
10 5 5 5 5 5 5
Actividad 3
Aplicando el programa SPSS como herramienta tecnológica, calcule e interprete
en la siguente base de datos el coeficiente de confiabilidad alfa de Cronbach y excluye
del instrumento los ìtems que no aportan confiabilidad y presenten una correlación ítem-
test menor o igual a 0.25:
ÌTEMS
sujetos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
1 5 4 5 5 2 4 4 5 4 1 5 5 4 4 5 5 5 5 5
2 4 4 4 4 1 4 4 4 4 1 4 5 5 4 4 4 5 4 4
3 2 1 3 2 2 2 2 2 1 2 1 1 1 2 2 3 4 5 2
4 4 4 4 4 4 4 4 4 4 2 4 4 4 4 1 4 4 4 4
5 5 4 4 4 2 5 3 4 4 4 5 5 2 4 4 4 5 5 4
6 5 5 5 5 2 5 5 5 5 2 5 5 5 5 5 5 1 5 5
7 5 4 4 4 4 4 1 4 4 2 4 4 4 5 5 4 5 5 4
8 3 4 5 2 5 5 3 3 3 2 5 2 5 2 4 4 5 4 4
9 4 4 4 4 4 4 1 4 4 2 4 4 4 4 1 4 4 4 4
10 4 4 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4
11 5 5 5 4 4 4 1 5 5 5 4 4 4 5 1 5 4 2 3
12 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
13 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 1 1 2 2
14 4 5 4 4 4 4 5 5 5 1 5 5 5 5 5 5 5 5 5
15 4 4 3 2 4 4 3 2 4 5 4 4 4 4 1 4 5 4 5
16 3 2 2 2 2 2 1 2 4 1 2 4 2 4 2 4 2 4 2
17 4 4 4 4 1 4 1 4 4 1 4 4 4 4 2 4 4 4 4
18 2 4 4 4 1 4 1 4 4 1 5 5 4 2 1 4 2 5 5
19 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
20 4 4 5 5 1 5 5 4 4 2 5 1 4 4 4 2 5 5 5
21 2 1 1 1 1 1 1 1 1 1 1 1 2 2 1 2 2 1 1
Referencias
Anastasi, A., Y Urbina, U. (1.998). Test psicológicos. México: Prentice Hall.
Cohen, R., y Swerdlik, M. (2.001). Prueba y evaluación psicológicas. México: Mc.

Graw Hill
Pardo, A. (2.000). SPSS 11: Guìa para el análisis de datos. Madrid: Mc Graw Hill.
Ruiz, B (2001) Instrumento de Investigación Educativa. Barquisimeto: Ediciones
CIDEG. C.A.
Lecturas Sugeridas
Aiken, L. (1.996). Tests psicológicos y evaluación (octava edición), México; Prentice

Hall. Se recomienda el capitulo 4: Estandarización, confiabilidad y validez.
Apartado de confiabilidad.
Anastasi, A., Y Urbina, U. (1.998). Test psicológicos. México: Prentice Hall. Capítulo
4: confiabilidad. Apartado: tipos de confiabilidad.
Ary, D., Jacobs, L., Y Razavieh, A. (1.989). Introducción a la investigación pedagógico.

México: Mc Graw Hill. Se recomienda el capítulo 8: validez y confiabilidad.
Apartado: confiabilidad.
Cohen, R., y Sswerdlik,, M. (2.001). Pruebas y evaluación psicológicas. México: Mc

Graw Hill. Se recomienda el capítulo 5: Confiabilidad. Apartado: Estimaciones de
confiabilidad.
Kerlinger, F. (1.988). Investigación del comportamiento (tercera edición en español).

México: MC Graw Hill.. Se recomienda el capítulo 26. El contenido es el siguiente:
definiciones de confiabilidad, teoría de la confiabilidad, interpretaciones del
coeficiente de confiabilidad, error estándar de la media y el error estándar de la
medición, mejoramiento de la confiabilidad y el valor de la confiabilidad.
Pardo, A. (2.000). SPSS 11: Guìa para el análisis de datos. Madrid: Mc Graw Hill. Se
recomienda leer el capìtulo 25: Fiabilidad de las escalas: Procedimiento. Análisis
de Fiabilidad. Exxplica los métodos de confiabilidad analizados en este capìtulo y
el procedimiento para calcularlos a travès del programa SPSS.
Ruiz, B (2001) Instrumento de Investigación Educativa. Barquisimeto: Ediciones

CIDEG. C.A.

Confiabilidad

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Confiabilidad

Cargado por

Copyright:

Formatos disponibles

CAPITULO VIII

CONFIABILIDAD DE INSTRUMENTO DE MEDICIÓN EDUCATIVA

La confiabilidad es una medida de consistencia y uniformidad de un instrumento

Interpretación del Coeficiente de Confiabilidad

La confiabilidad se interpreta a través de un coeficiente que tiene los siguientes

Lo normal es que el coeficiente de confiabilidad esté entre 0 y 1; pero en algunos

Los métodos de confiabilidad son tres, los cuales se desarrollan a continuación:

Reaplicación de la Prueba (Test-Retest)

Este método de confiabilidad consiste en aplicar el instrumento a los mismos

A continuación se presentan dos (2) ejemplos que ilustran ambos casos:

Aplicación del Coeficiente de Correlación de Pearson

1.893   10  1.934  10 

El coeficiente de confiabilidad es 0,97; lo cual indica una confiabilidad muy alta

Aplicación del Coeficiente de Correlación de Spearman

Primeros Rango Segundos Rango Di

La confiabilidad es muy alta, aceptándose sin reservas el instrumento

Pruebas de formas Equivalentes y formas alternas

Este método consiste en elaborar dos versiones de un instrumento que miden la

Al respecto Cohen y Swerdlik (2.000) expresan lo siguiente:

Formas alternas y formas equivalentes son términos que en ocasiones se

Método de Consistencia Interna

Determinar el coeficiente de la confiabilidad Kuder-Richardson

Cálculo del Coeficiente Kuder-Richardson

Rt = Coeficiente de confiabilidad Kuder-Richardson

Datos en Escalas no Dicotómicas (más de 2 Alternativas de Respuestas)

Fórmula Alfa de Cronbach

Se puede aplicar cualquiera de las dos fórmulas, obteniéndose resultados

rt=( n ) *( 1- Vi ) =( 6 )* (1–7,16/16,13)

Correlación ìtem-test y confiabilidad sin el ítem

Confiabilidad del Instrumento si se Excluye el Ítem Analizado

Este indicador de confiabilidad del instrumento, permite determinar si el ítem

Ccàlculo de Ambos Indicadores

Su cálculo manual es muy engorroso y complejo; pero el programa SPSS lo

Confiabilidad de Dos Mitades

Es un método que determina consistencia interna del instrumento. Consiste en

Pasos para calcular el coeficiente de las dos mitades

1. Se constituyen las dos mitades

Fórmula de Spearman – Brown

rsp = coeficiente de correlación Spearman-Brown

Calificaciones de 10 estudiantes de un curso

En este ejemplo el coeficiente de correlación de Pearson (r1,2) de las dos mitades

4. Se interpreta la confiabilidad como muy alta (0,98), por lo tanto, el

Diferencias entre Dos Mitades de la Prueba y Formas Paralelas

Pardo (2.000) al referirse a ambos indicadores de evaluación de un instrumento,

Factores que Incrementan la Confiabilidad

Incremento de la Confiabilidad de un Instrumento

Si el instrumento posee baja confiabilidad, ésta puede incrementarse agregando

n = número de ítemes necesarios para lograr la confiabilidad desea

Si la confiabilidad de un instrumento de 10 ítemes es 0.46 ¿Cuantos ítemes

N= 0,81(1-0,46) = 5 veces más largo, es decir, necesita 50 ìtemes para lograr la

Si la confiabilidad de un instrumento de 30 ítemes es 0.05. ¿Cuántos ítemes deben

Si la confiabilidad de un instrumento de 30 ítemes es 0.55. ¿Cuantos ítemes deben

N= 0,61(1-0,55) = 1,28 veces más largo. Tendría que tener 38 ìtemes.

2 246 236 240

3 246 229 260

4 244 267 265

5 274 267 270

6 264 280 275

8 275 257 270

9 264 269 230

10 248 231 255

11 277 256 250

12 246 253 252

rt=( n ) ( 1- Vi ) =( 6 ) (1–7,16/16,13)