Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(CONFIABILIDAD Y VALIDEZ)
Asignatura
PSICOMETRÍA
NRC: 29989
Alumna
ID: 610452
Docente
FLORENCIA – CAQUETÁ
2019
Síntesis
(Confiabilidad y validez)
¨La estandarización es un paso importante en el diseño y la evaluación de pruebas
psicológicas y otros instrumentos de evaluación, pero no es el último paso. Antes de que una
prueba pueda utilizarse con cierta seguridad, debe obtenerse información acerca de su
confiabilidad y validez por lo que a sus propósitos específicos concierne¨ (Aiken, 2003, p. 85).
confiabilidad no es lo mismo que estabilidad: al determinar la confiabilidad se asume que la
prueba mide una característica relativamente estable. A diferencia de la inestabilidad, la falta de
confiabilidad es resultado de errores de medición producidos por estados internos temporales,
como la baja motivación o la falta de disposición, o de condiciones externas como un ambiente
de prueba incómodo o con distracciones, existen diversos métodos para estimar la confiabilidad
entre estos se encuentra:
Coeficiente test-retest: Para calcular un coeficiente test-retest o determinar si un instrumento
mide de manera consistente de una ocasión a otra. este coeficiente, conocido también como
coeficiente de estabilidad, se encuentra correlacionando las calificaciones obtenidas por un grupo
de personas en una aplicación con sus puntuaciones en la segunda aplicación de la prueba. El
procedimiento test-retest toma en consideración los errores de medición que resultan de
diferencias en las condiciones (ambientales, personales) asociadas con las dos ocasiones en que
se administró la prueba.
Coeficiente de formas paralelas: También conocida como coeficiente de equivalencia, se
aplican dos o más instrumentos cuyos ítems son diferentes en forma, pero miden lo mismo, luego
se calcula el coeficiente de correlación de Pearson o Spearman (de acuerdo al tipo de variable)
entre cada par de instrumentos.
Coeficiente de consistencia internas: Se dispone de formas paralelas para una serie de
pruebas, en particular para pruebas de habilidad (aprovechamiento, inteligencia, aptitudes
especiales). Sin embargo, una forma paralela de una prueba a menudo es costosa y difícil de
elaborar.
Por esta razón se elaboró un método menos directo de tomar en cuenta los efectos de
diferentes muestras de los reactivos de una prueba sobre la confiabilidad. Éste es el método de
consistencia interna, que incluye el método de división por mitades de Spearman, las fórmulas de
Kuder-Richardson y el coeficiente alfa de Cronbach.
Método por mitades
En este enfoque simplificado de la consistencia interna una sola prueba se considera
compuesta por dos partes (formas paralelas) que miden la misma cosa. De este modo, puede
aplicarse una prueba y asignar calificaciones separadas a sus dos mitades seleccionadas de
manera arbitraria, para la confiabilidad de la prueba como un todo puede estimarse mediante la
fórmula Spearman-Brown.
Método de Kuder-Richardson.
Una prueba puede dividirse de muchas formas diferentes en dos mitades que contengan igual
número de reactivos. Como cada forma puede dar por resultado un valor algo diferente, no queda
claro qué estrategia de división producirá el mejor estimado de confiabilidad. Una solución al
problema es calcular el promedio de los coeficientes de confiabilidad obtenidos de todas las
divisiones por mitades como el estimado global de confiabilidad., para esta se utiliza la formula
K-R 20-21.
Coeficiente alfa.
Las fórmulas especiales del coeficiente alfa más general (Cronbach, 1951). Se utiliza para
casos especiales, el coeficiente alfa es una fórmula general para estimar la confiabilidad de una
prueba que consta de reactivos en los cuales pueden asignarse calificaciones de distinto peso a
respuestas diferentes. Todos los procedimientos de consistencia interna (división por mitades,
Kuder-Richardson, coeficiente alfa) sobrestiman la confiabilidad de las pruebas de velocidad.
Aiken
Aiken, L. R. (2003). tests psicologicos y
evaluación. En L. R. Aiken, tests
Validez
Grado en que una prueba
Confiabilidad: Grado en mide lo que está diseñado
que el instrumento produce para medir.
los mismos resultados al
aplicarse repetidad veces. Tipos de
Error estándar de medición validez
Es una estimación de la
desviación estándar de una
distribución normal de las Validez de Validez con relación a Validez de
calificaciones. contenido criterio constructo se
Produce un rango de Hace referencia a los refiere al grasdo en
respuestas que son procedimientos en los que el instrumento
Tipos de representativas del cuales las calificaciones mide un construto
confiabilidad dominio entero o en la prueba de un particular.
universo de grupo se comparan las
habilidades. puntuaciones.
REACTIVO A B C D E F G H I J
1 1 1 0 1 1 0 1 0 1 0
2 1 0 0 0 0 1 0 0 0 1
3 1 1 1 1 1 0 1 0 0 0
4 1 1 1 0 0 1 0 1 0 0
5 1 0 1 1 0 0 0 0 0 0
6 1 1 1 0 1 1 1 0 0 0
7 1 0 1 1 0 0 1 1 0 1
8 1 1 1 0 1 1 0 0 1 0
9 1 1 0 1 1 1 0 1 0 0
10 1 1 1 1 1 0 0 0 1 0
Totales 10 7 7 6 6 5 4 3 3 2
Pi 1 0,7 0,7 0,6 0,6 0,5 0,4 0,3 0,3 0,2
1−Pi 0 0,3 0,3 0,4 0,4 0,5 0,6 0,7 0,7 0,8 4,7
∑ Pi ( 1−Pi ) 0 0,21 0,21 0,24 0,24 0,25 0,24 0,21 0,21 0,2 1,97
Datos:
K = número de X́ = 5.30
reactivos S2=5.21
10- 5.30 ( 10−5.30 ) / 5.21
K= 10 KR 21=
10−1
KR 21=0,5798
KR 20 =0.691
KR 21=0,580
La confiabilidad se califica como: baja
Muy baja.
0,452
r 11=
750−702 1, 226
r = √ 930−729∗√ 900−676
r 11=0,3686
48
r = √201∗√ 224
Se califica como no
48 Confiable.
r = √(201)(224)
48
r = √ 45024
48
r= 212,18
r = 0,226
2. Describa tres tipos de confiabilidad y tres tipos de validez. ¿Para qué tipos de pruebas y
situaciones es más apropiado cada tipo de validez y confiabilidad?
Tipos de confiabilidad
Medida de estabilidad (coeficiente por test – retest).
Éste método incluye el método de división por mitades de Spearman, las fórmulas de Kuder-
Richardson y el coeficiente Alfa de Cronbach. Sin embargo, los errores de medición causados
por diferentes condiciones o momentos de aplicación no se reflejan en un coeficiente de
consistencia interna. En consecuencia, este tipo de coeficientes no pueden verse como
verdaderos equivalentes de los coeficientes test-retest o de formas paralelas.
El coeficiente alfa de Cronbach, por su parte, suele utilizarse para estimar la consistencia
interna de un test y se trata de un método basado en la covarianza de los ítems. El coeficiente α
oscila entre 0 y 1. Cuanto más próximo esté a 1, los ítems serán más consistentes entre sí. Hay
que tener en cuenta que, a mayor longitud del test, mayor será alfa.
Ahora bien, la fórmula para obtener el coeficiente alfa de Cronbach es la siguiente.
Método de Kuder-Richardson.
Las fórmulas deducidas por Kuder y Richardson están destinadas a estimar la confiabilidad de
una prueba. Estas fórmulas se basan en la consistencia inter ítem y sólo requieren una
administración de la prueba. La más usada de ellas, la fórmula 20, requiere información basada
en el número de ítems de la prueba, la desviación estándar de la puntuación total y la proporción
de examinados que aprobaron cada ítem. Se trata de dos fórmulas aplicables a sendos casos
particulares de alfa. KR20 se aplica en el caso en que los ítems del test sean dicotómicos, y
KR21, en el caso de que además de ser dicotómicos, tengan la misma dificultad. Las fórmulas de
Kuder-Richardson no deben utilizarse con pruebas en donde la velocidad de resolución es
importante. El modelo de Kuder-Richardson es aplicable en las pruebas de ítem dicotómicos en
los cuales existen respuestas correctas e incorrectas. Las fórmulas de KR 20 Y 21 son las
siguientes.
K - X́ ( K − X́ ) / S2
K [ 1−∑ Pi ( 1−Pi ) /S 2 ] K 21=
K 20= K−1
K −1
Tipos de Validez
Validez de contenido.
Juicio de expertos: Conjunto de opiniones que pueden brindar profesionales expertos en una
industria o disciplina, relacionadas al proyecto que se está ejecutando. Este tipo de información
puede ser obtenida dentro o fuera de la organización, en forma gratuita o por medio de una
contratación, en asociaciones profesionales, cámaras de comercio, instituciones
gubernamentales, universidades.
Todas estas son cualidades hipotéticas llamadas construcciones, cuya existencia se supone
para explicar la conducta en muchas y diferentes situaciones específicas.
Referencias Bibliográficas