Estimaciones de confiabilidad: tipos y procedimientos

Estimaciones de confiabilidad
|Un instrumento que resulta consistente o confiable puede considerarse como un

instrumento verdaderamente de valor. La confiabilidad resulta ser una propiedad de las
puntuaciones que se obtienen después de haber aplicado la prueba o instrumento a un grupo
determinado de personas en una ocasión particular y bajo condiciones específicas (Thompson,
1994).
La confiabilidad tiene como objetivo determinar probabilísticamente, el grado de
variación que se puede atribuirse a los errores aleatorios o causales contenidos en la medida, pero
que no se encuentran relacionados con factores pertenecientes a la construcción del instrumento.
Lo que la fiabilidad garantiza en sus propios términos es consistencia expresada en la
determinación del grado de error contenido en la aplicación de una escala, y por lo tanto, en la
medición del fenómeno.
Tipos de estimaciones de confiabilidad

Los procedimientos para la estimación de la confiabilidad son variados, las diferencias
que emergen en ellos se explican en base a la aplicabilidad de cada instrumento, los objetivos
que persigue el investigador respecto a la búsqueda de una profundidad analítica, así como el
tiempo y los recursos disponibles para el desarrollo de los instrumentos. Los procedimientos que
más se conocen actualmente para llevar a cabo las estimaciones son los referidos a la estabilidad,
equivalencia y consistencia.
Confiabilidad como estabilidad

La estabilidad se puede definir como la comparación de las puntuaciones que arroja un
mismo instrumento de medida después de varias aplicaciones repetidas en el tiempo. El
procedimiento que más se utiliza en ese objetivo es la denominada Test-retest.
Se encuentra correlacionando las calificaciones obtenidas por un grupo de personas en
una aplicación con sus puntuaciones en la segunda aplicación de la prueba. Este procedimiento
considera los errores de medición que resultan de diferencias en las condiciones (ambientales,
personales) asociadas con las dos ocasiones en que se administró la prueba. Dado que en las dos
ocasiones se aplicó la misma prueba, los errores que involucran a diferentes muestras de los
reactivos de la prueba no se reflejan en un coeficiente de un test-retest.
Es apropiada cuando el principal propósito es medir algo que resulte relativamente
estable en el tiempo, como por ejemplo: el rasgo de personalidad. Pues, a medida que pasa el
tiempo las personas tienden a cambiar, pueden aprender cosas nuevas, tal vez olvidar otras y de
igual manera adquirir nuevas habilidades.
Cuando el intervalo entre las pruebas es mayor a seis meses, se hace referencia a la
estimación de confiabilidad test-retest como coeficiente de estabilidad.
Esta prueba entra en función cuando se considera una correlación existente entre los
resultados de las distintas aplicaciones, donde las de tipo positivo determinan la confiabilidad
como estabilidad.
Por ejemplo, si X1 y X2 son puntajes obtenidos en la medición a través de dos aplicaciones de un
instrumento, la estabilidad se define como:
Donde la aplicación de la medición es una muestra de población con tamaño n, sería

posible estimar a partir de un coeficiente de estabilidad que incluye los datos de la muestra:
Donde X1i y X2i son puntajes obtenidos por el sujeto i en la primera y segunda aplicación
de la prueba, x́ 1y x́ 2son medidas de puntajes observados para la primera y segunda aplicación y
S1 y S2 corresponden a las desviaciones típicas de los puntajes observados en ambas pruebas.
Latiesa (1994) citado en Mora hace referencia a cuatro aspectos concernientes a problemas y
limitaciones de este procedimiento enunciados por Carmines y Zeller, 1979):
1. Costos y disponibilidad: la aplicación del instrumento en
dos oportunidades puede ser costosa, y muchas veces por oportunidad o contingencia, no
es posible realizar una segunda aplicación.
2. Cambio en características o actitudes de los individuos.
3. La reflexividad: la obtención de información a través dela prueba por parte de los
individuos puede incidir en sus concepciones acerca del fenómeno en estudio.
4. Efecto de la memoria: si el tiempo de aplicación entre dos pruebas es breve, el
recuerdo de algunos ítems y sus respuestas puede llevar a sobrestimar la confiabilidad.
El procedimiento del test-retest solo resulta efectivo cuando es posible aplicar las pruebas
en momentos diferentes, existe un interés en estimar el error debido a las variaciones en el
tiempo, las características de los elementos que componen la escala pueden suponer el efecto
mínimo del recuerdo o la practica con el instrumento, y si el periodo de tiempo que transcurre
entre una y otra aplicación de la prueba de la escala, permite suponer que las variaciones que se
observan se deben a inconsistencias dentro del instrumento y no a cambios que se hayan
generado en los atributos que se pretenden medir.
Confiabilidad como formas equivalentes

Se basan en la consideración de dos o más formas paralelas de un mismo instrumento de
medida, lo que facilita que se obtengan dos o más puntuaciones del mimo sujeto de forma
simultánea o tras un periodo temporal. El supuesto se refiere a que las formas sean equivalentes
tan en contenido, formato, longitud, dificultad y variabilidad. La confiabilidad se obtiene de
puntuaciones equivalentes entre sujetos que responden a las muestras de ítems, en donde la
diferencia entre éstas marcara el error y el coeficiente de equivalencia. Este procedimiento
después de una primera aplicación aplica uno similar o alternativo que mide el mismo atributo o
fenómeno.
El procedimiento que más se ha utilizado para estimar la equivalencia se conoce como formas
paralelas y contempla las siguientes etapas:
1. La construcción de dos instrumentos de medida con idénticos criterios de planeación y
selección de preguntas
2. Su aplicación simultánea al mismo grupo.
3. La obtención los puntajes para cada sujeto, uno para cada forma de la prueba
4. La estimación de la correlación entre los puntajes en las formas
Para su cálculo se puede aplicar la siguiente formula, en donde X e Y simbolizan variables
aleatorias que son los puntajes obtenidos en do formas equivalentes obtenidas por
En tanto que su estimación a partir de una muestra de tamaño n será:
Donde Xi y Yi corresponden a los puntajes obtenidos por un sujeto i en la primera y segunda

prueba; x́ y ý son medidas de puntaje observados para la primera y segunda prueba y Sx y Sy
son las desviaciones típicas de los puntajes observados para la primera y segunda prueba.
Los instrumentos de medida paralela deben cumplir con algunos requisitos como lo son: el tener
la misa cantidad de elementos intercambiables uno a uno, que la redacción y estructura entre los
elementos sean similares, que el contenido y objetivo de los pares de elementos sean los mismos,
así mimos los índices de dificultad resulten equivalentes y que las instrucciones, el tiempo y las
condiciones de aplicación sean iguales.
Confiabilidad como consistencia interna:

Este procedimiento es menos directo al tomar en cuenta los efectos de diferentes
muestras de los reactivos de una prueba sobre la confiabilidad, incluye el método de división por
mitades de Spearman, las fórmulas de Kuder-Richarson y el coeficiente alfa de Cronbach.
Método de división por mitades:
Una sola prueba es considerada como opuesta por dos partes (formas paralelas) que miden la
misma cosa. De esta manera, se puede aplicar una prueba y determinar las calificaciones
separadas por sus mitades seleccionadas de manera arbitraria.
Su cálculo se presenta a través de tres pasos:
1. Dividir la prueba en mitades equivalentes
2. Calcular la r de Pearson entre las puntuaciones en las dos mitades de la prueba
3. Ajustar la confiabilidad de la prueba usando la fórmula de Spearman-Brown, Rulon o
Guttman.
Para la estimación de la confiabilidad a partir del coeficiente de Spearman-Brown en una

prueba de longitud original por mitades se utiliza la siguiente formula
Rhh = confiabilidad de la mitad dividida

Rxx = estimación de la confiabilidad de la prueba de longitud original.
También resulta de utilidad la fórmula propuesta por Guttman para caso en los que no se
asume que la variabilidad entre las dos mitades es la misma.
Sa y S b son desviaciones estándar de los puntaes de dos sub-pruebas y Sx es la desviación
del puntaje total.
Una última alternativa es la utilización de la fórmula de Rulon, la cual procede a

partir del cálculo de las puntuaciones D para cada sujeto (D=A-B), donde A es la puntuación del
sujeto en la mitad A y B, la puntuación del sujeto en la mitad B. Se utiliza la varianza de estas
diferencias en tanto permite estimación de la varianza de las puntuaciones error en la definición
del coeficiente de confiabilidad.
Si se sustituye las varianzas por sus respectivos estimadores

muéstrales:
Se debe sustituir la varianza error por la varianza de las puntuaciones D:
Coeficiente alfa de Cronbach:

Se puede definir como
Donde:
k es el número de reactivos
Si2 la varianza de las calificaciones en el reactivo i
Si2 la varianza de las calificaciones totales de la prueba.
Cuanto más se aproxime su valor máximo a 1 mayor es la fiabilidad de la escala. En

algunos contestos el valor alfa suficiente para obtener confiabilidad de la escala se considera de
0.7 o 0.8.
Las fórmulas de Kuder-Richardson solo son aplicables cuando los reactivos de la prueba se
califican con 0 o 1, pero el coeficiente alfa es una formula general para estimular la confiabilidad
de una prueba que consta de reactivos en los cuales pueden asignarse calificaciones de distinto
peso a respuestas diferentes.
Confiabilidad entre calificadores:

Son determinadas por el grado de acuerdo o consistencia que existe entre dos o más evaluadores
(o jueces calificadores). Es el cálculo de un coeficiente de correlación
DEFINCIONES DE CONFIABILIDAD
Para el caso de las puntuaciones en una medición, la fiabilidad puede definirse como el grado
de precisión que ésta ofrece; para ser fiable, una escala debe tener la capacidad de
exhibir resultados consistentes en mediciones sucesivas del mismo fenómeno (Cea D’ancona,
1998;Prat y Doval, 2003).
Una definición probabilística común de confiabilidad, (Meeker y Escobar, 1998), es la

siguiente: ``confiabilidad es la probabilidad de que una unidad realice su función hasta un tiempo
especificado bajo las condiciones de uso encontradas.'' Es importante que esta probabilidad sea evaluada a
las condiciones ambientales o de uso encontradas por el producto, en lugar de las condiciones de trabajo
para las que el producto fue diseñado.
(Lawless, 2000) dice ``la confiabilidad se refiere al funcionamiento adecuado de equipos y sistemas, lo
cual incluye factores como software, hardware, humanos y ambientales.'' Este es un concepto más amplio
y muestra la complejidad de lo que se entiende por confiabilidad, su evaluación, el mantenimiento y su
mejora.
(Condra, 2001) afirma que ``un producto confiable es aquel que hace lo que el usuario quiere que haga
cuando el usuario quiere que lo haga.'' De acuerdo con esto, la confiabilidad es calidad a través del
tiempo, por lo tanto un producto confiable debe permanecer dentro de sus limites de especificación
durante su vida tecnológica.. Esto es, buena calidad necesaria pero no suficiente para garantizar buena
confiabilidad. Esto plantea otra dificultad, la confiabilidad de un producto se puede evaluar directamente
solo después de que ha estado en servicio por algún tiempo, por lo tanto la evaluación y pronostico de la
confiabilidad presenta varios desafíos técnicos.
http://www.redalyc.org/articulo.oa?id=49614003
La confiabilidad de una prueba ( escala o cuestionario) hace referencia a “la presicion, consistencia y la
constancia” que tiene la medida ( Álvaro, 1996). Es decir, una prueba aplicada en diferentes ocasiones en
una misma muestra y en condiciones de constancia, debería arrojar resultados similares. Dentro de los
métodos clásicos para estimar los coeficientes de confiabilidad encontramos el uso de formas paralelas,
método de las dos mitades y el de consistencia interna ( Aiken, 2003, Alvaro 1996, Anastacia y Urbina
1998, Cronbach 1998 y Muñiz 1998). http://books.google.com.mx/books?
id=tosxHIa6JZAC&pg=PP14&dq=estimaciones+de+confiabilidad+psicometria&hl=es&sa=X&ei=qaZd
VJ7IHquaigK5g4DQCg&ved=0CB8Q6AEwAQ#v=onepage&q=estimaciones%20de%20confiabilidad
%20psicometria&f=false
La confiabilidad de un instrumento de medición se refiere al grado en que su aplicación repetida al mismo

sujeto u objeto produce iguales resultados y ésta se determina mediante diversas técnicas. (Silva y Brain
2006). http://books.google.com.mx/books?id=q0EzLNie4kYC&pg=PA63&dq=definici
%C3%B3n+de+confiabilidad&hl=es&sa=X&ei=_X5eVNSnE5S0yATP54K4BA&ved=0CE4Q6wEwCQ
#v=onepage&q=definici%C3%B3n%20de%20confiabilidad&f=false
Confiabilidad
Definición ( cita) Paráfrasis

Para el caso de las puntuaciones en una
medición, la fiabilidad puede definirse como el
grado de precisión que ésta ofrece; para ser
fiable, una escala debe tener la capacidad de
exhibir resultados consistentes en mediciones
sucesivas del mismo fenómeno (Cea D’ancona,
1998;Prat y Doval, 2003).
Confiabilidad es la probabilidad de que una

unidad realice su función hasta un tiempo
especificado bajo las condiciones de uso
encontradas.'' Es importante que esta
probabilidad sea evaluada a las condiciones
ambientales o de uso encontradas por el
producto, en lugar de las condiciones de
trabajo para las que el producto fue diseñado.
(Meeker y Escobar, 1998)
La confiabilidad se refiere al funcionamiento
adecuado de equipos y sistemas, lo cual
incluye factores como software, hardware,
humanos y ambientales.'' Este es un concepto
más amplio y muestra la complejidad de lo que
se entiende por confiabilidad, su evaluación, el
mantenimiento y su mejora. (Lawless, 2000)
, la confiabilidad es calidad a través del tiempo, por
lo tanto un producto confiable debe permanecer
dentro de sus limites de especificación durante su
vida tecnológica.. Esto es, buena calidad necesaria
pero no suficiente para garantizar buena
confiabilidad. Esto plantea otra dificultad, la
confiabilidad de un producto se puede evaluar
directamente solo después de que ha estado en
servicio por algún tiempo, por lo tanto la
evaluación y pronostico de la confiabilidad
presenta varios desafíos técnicos.
( Condra, 2001)
La confiabilidad de una prueba ( escala o
cuestionario) hace referencia a “la presicion,
consistencia y la constancia” que tiene la medida
( Álvaro, 1996). Es decir, una prueba aplicada en
diferentes ocasiones en una misma muestra y en
condiciones de constancia, debería arrojar
resultados similares. Dentro de los métodos
clásicos para estimar los coeficientes de
confiabilidad encontramos el uso de formas
paralelas, método de las dos mitades y el de
consistencia interna ( Aiken, 2003, Alvaro 1996,
Anastacia y Urbina 1998, Cronbach 1998 y Muñiz
1998).
La confiabilidad de un instrumento de medición se
refiere al grado en que su aplicación repetida al
mismo sujeto u objeto produce iguales resultados y
ésta se determina mediante diversas técnicas. (Silva
y Brain 2006).

Estimaciones de confiabilidad: tipos y procedimientos

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estimaciones de confiabilidad: tipos y procedimientos

Cargado por

Copyright:

Formatos disponibles

Estimaciones de confiabilidad

|Un instrumento que resulta consistente o confiable puede considerarse como un

Tipos de estimaciones de confiabilidad

Confiabilidad como estabilidad

Donde la aplicación de la medición es una muestra de población con tamaño n, sería

Confiabilidad como formas equivalentes

En tanto que su estimación a partir de una muestra de tamaño n será:

Donde Xi y Yi corresponden a los puntajes obtenidos por un sujeto i en la primera y segunda

Confiabilidad como consistencia interna:

Para la estimación de la confiabilidad a partir del coeficiente de Spearman-Brown en una

Rhh = confiabilidad de la mitad dividida

Una última alternativa es la utilización de la fórmula de Rulon, la cual procede a

Si se sustituye las varianzas por sus respectivos estimadores

Coeficiente alfa de Cronbach:

Cuanto más se aproxime su valor máximo a 1 mayor es la fiabilidad de la escala. En

Confiabilidad entre calificadores:

Una definición probabilística común de confiabilidad, (Meeker y Escobar, 1998), es la

La confiabilidad de un instrumento de medición se refiere al grado en que su aplicación repetida al mismo

Definición ( cita) Paráfrasis

Confiabilidad es la probabilidad de que una

También podría gustarte