Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE FILOSOFÍA
CARRERA DE PSICOLOGÍA – AREA BÁSICA
PSICOMETRÍA BÁSICA
3er. Curso 3ra. Sección
Contacto: liccarlosriego@gmail.com
“Cualquier cosa que existe, existe en alguna cantidad”.
Thorndike, 1918.
en Investigación Cuantitativa
FIABILIDAD DE UN INSTRUMENTO
en Investigación Cuantitativa
¿Qué implica una
Buena Prueba?
Normas y
Fiabilidad Validez
Sistemas de Medidas
Test-Retest
Formas alternas
Edad del Sujeto
División por mitades Contenido
Spearman-Brown Criterio Percentiles
Kuder y Richardson Puntuaciones
Constructo
Alfa Típicas
Kappa
FIABILIDAD
Sinónimo de seguridad o consistencia.
Atributo de consistencia en la medición.
Confiabilidad en el sentido psicométrico denota algo que es
consistente, no necesariamente consistentemente bueno o malo.
Es importante para nosotros como administradores de
pruebas y consumidores de información sobre ellas saber qué
tan confiables son así como otros procedimientos de medición.
Pero la confiabilidad rara vez es una cuestión de todo o nada;
hay diferentes tipos y grados de confiabilidad.
Un coeficiente de confiabilidad es un índice de confianza.
ERROR EN LA MEDICIÓN
Tipos de Confiabilidad
Fiabilidad de Prueba y Posprueba:
El grado de la relación entre varias formas de una prueba puede evaluarse por medio
de un coeficiente de confiabilidad de formas alternas o equivalentes, el cual a menudo se
denomina “coeficiente de equivalencia.
Formas alternas y formas equivalentes son términos que en ocasiones se usan en
forma indiscriminada, aunque hay una diferencia técnica entre ellos.
Existen formas equivalentes de una prueba cuando para cada forma de la prueba son
iguales las medias y las varianzas de las puntuaciones de pruebas observadas.
Son versiones diferentes de una prueba que se han construido con el fin de ser
equivalentes. Equivalentes con respecto a variables como contenido y dificultad.
Son similares a una estimación de la confiabilidad de test-retes en: 1° Se requieren dos
aplicaciones de la prueba con el mismo grupo. 2° Las puntuaciones pueden ser afectadas
por factores como la motivación, fatiga, eventos como la práctica, el aprendizaje o
terapia.
Su desventaja es de índole financiera y temporal.
Su ventaja primordial es que minimiza el efecto de la memoria para el contenido de
una forma de prueba aplicada con anterioridad.
Tipos de Fiabilidad de Consistencia interna:
Una forma de evitar esta fuente potencia de dificultad ha sido aplicar una serie de
pruebas homogéneas, cada una diseñada para medir algún componente de una
variable heterogénea.
Además algunas de las influencias aleatorias que pueden afectar a las medidas de
confiabilidad, la varianza de error en una medida de consistencia entre reactivos
proviene de dos fuentes: 1° El muestreo de reactivos. 2° La heterogeneidad del área
de contenido.
Entre más heterogénea sea el área de contenido de la que se extrae la muestra, será
menor la consistencia entre reactivos..
Las decisiones importantes rara vez se toman sólo en base en una prueba. Los
psicólogos se basan con frecuencia en una batería de pruebas, una colección selecta
de pruebas y procedimientos de evaluación en el proceso de valoración. Una batería
de pruebas puede componerse o no de pruebas homogéneas.
F. de División por Mitades.
La insatisfacción con los métodos de división por mitades existentes para estimar la
confiabilidad llevo a G. Frederic Kuder y M. W. Richardson a desarrollar sus propias
medidas de estimar la confiabilidad.
La más conocidas de las muchas fórmulas en las que colaboraron es su fórmula
Kuder-Richardson 20 y 21.
KR 20 es la estadística de elección para determinar la consistencia entre reactivos
de reactivos dicotómicos.
Usado en pruebas que miden un solo factor (homogeneidad) del tipo aptitudinal,
con reactivos dicotómicos (correcto o equivocado).
Los reactivos de la prueba deben tener aproximadamente el mismo grado de
dificultad.
En el caso en que los reactivos de la prueba son muy homogéneos, las estimaciones
de confiabilidad KR 20 y de división por mitades serán similares.
Si los reactivos de prueba son más heterogéneos, la KR 20 producirá estimaciones
de confiabilidad inferiores que el método de división por mitades.
Fiabilidad Alfa:
La estadística Kappa fue modificada después por Fliess (1971) para ser usada con
múltiples evaluadores.
Ejemplo: El grado de acuerdo entre dos o más profesores al calificar una prueba de
ensayo o un examen oral.
Fuerza de la
Valor de K
concordancia
≤ 0,20 Pobre
0,21 a 0,40 Débil
0,41 a 0,60 Moderado
0,61 a 0,80 Bueno
0,81 a 1 Muy bueno
Fuente: Urbina (2007, p. 39)
Referencia Bibliográfica:
Cohen, R. y Swerdlik M. (2001) Pruebas y
Evaluación Psicológicas. Editorial McGraw
Hill. 4ª Edic. México.
Urbina, S. (2007) Test Psicológicos. TEA
Ediciones. Madrid.
Hulley S. y Cummings S. (1993) Diseño de la
Investigación Clínica. Editorial Doyma. España.