Está en la página 1de 46

Ps.

WALTER IVN ABANTO VLEZ


PROCESO DE
CONFIABILIDAD
REA DE INVESTIGACIN
ESCUELA DE POSTGRADO
1. Ingresar los datos obtenidos en la aplicacin de
la prueba

2. Para la columna PAR







3. En la columna IMPAR

4. Colocar el cursor en la celda libre

5. Click en Insertar

6. Seleccionar Funcin (fx)

7. Seleccionar Estadstica

8. Opcin Pearson

9. Ingresar datos en matrices

10. Matriz 1: Columna PAR

11. Matriz dos: Columna IMPAR

12. Clic para obtener resultado

13. Frmula de Spearman-Brown

r
11 =
2r



1+ r


Pearson r = -0. 1893885
14. Mayor a 0.80: Prueba confiable

CONFIABILIDAD
Es la cualidad, la que hace que una misma
prueba aplicada dos veces a la misma
persona en circunstancias idnticas,
proporcione similares resultados.
Se refiere al grado en que su aplicacin
repetida al mismo sujeto u objeto produce
iguales resultados.
Una tcnica de muestreo es confiable
cuando varias muestras de una misma
poblacin arrojan datos similares.
Es la caracterstica de precisin de los instrumentos
de medicin, independiente de lo que quiera medir.

Es un indicador de calidad global de una prueba.

Indica si los resultados que se obtienen con los
instrumentos de medicin son consistentes en el tiempo
y entre formas de la prueba. El concepto surge del
hecho que las variables que se miden en Psicologa
conllevan una importante carga de error.


El puntaje que se obtiene para una persona a
partir de la aplicacin de una prueba est
compuesto por el verdadero nivel de la
variable y por un componente error.

Se define para la prueba global a partir del
concepto de varianza de puntajes, como la
proporcin de varianza total de los resultados
de una prueba que se debe o que es varianza
verdadera.

1. Obtencin de la Confiabilidad.
Puede computarse por medio de mtodos
correlacionales, aunque tambin por mtodos no
correlacionales.

Los resultados de los clculos constituyen el valor
numrico de la confiabilidad, y se denominan
Coeficientes de confiabilidad.

El clculo de un Coeficiente de confiabilidad
(simbolizado con la sigla rtt) es la manera precisa
de evaluar la confiabilidad del instrumento (lo que
implica determinar que nivel de error se est
cometiendo al estimar los puntajes).



Este coeficiente entrega valores que
fluctan entre 0 y 1.

Un coeficiente igual a 1 indicar
confiabilidad perfecta, por el contrario,
un coeficiente igual a 0 sealar una
total falta de confiabilidad.

Los errores condicionan distintos tipos
de estimaciones de la confiabilidad.


Existen diversos factores que afectan
el clculo de un coeficiente de
confiabilidad; por ello, se han
determinado tres procedimientos
diferentes para calcularlo:

- Testretest
- Formas paralelas
- Consistencia Interna.

1.1.- Coeficiente Testretest:
Se basa en la aplicacin del mismo instrumento,
a un nico grupo de personas, en 2 momentos
distintos, y sirve para determinar si un
instrumento mide de forma consistente en
distintas ocasiones.
Este procedimiento opera con la creencia de que
las caractersticas medidas son estables en el
tiempo.
Es decir, el supuesto es que si efectivamente la
caracterstica es estable en el tiempo, la
variacin entre un momento y otro NO va a ser
estadsticamente significativa.

Desde sta perspectiva, la falta de
confiabilidad se podra entender como el
resultado de los errores que se producen
por Estados internos temporales de
las personas que contestan o por
Condiciones externas.

De esta manera, al calcular la confiabilidad
Test-retest es importante que las
condiciones de aplicacin sean
equivalentes en ambos momentos (misma
hora, mismo lugar, mismo examinadores).

En casos como las pruebas de
rendimiento o educacionales, No se
utiliza el procedimiento test-retest, ya que
puede existir aprendizaje entre los
momentos de rendicin del test.

La modalidad para establecer si han
existido modificaciones en los puntajes
entre un momento y otro es un coeficiente
de correlacin, que en ste caso se
denomina Coeficiente de Estabilidad.

El tiempo mnimo de aplicacin para un
Test Retest son 15 das, ya que dicho
perodo de tiempo sera el necesario para
que las personas olviden la mayor parte
de las respuestas que entregaron la
primera vez.

De hecho, la magnitud de un coeficiente
de estabilidad tiende a ser mayor cuando
el intervalo entre la prueba inicial y la
segunda es breve, en lugar de
prolongado.

1.2.- Pruebas Paralelas:
Cuando el intervalo de tiempo entre la prueba inicial y
la segunda es breve, los sujetos pueden responder a la
segunda evaluacin en funcin de lo que recuerdan
hicieron previamente (y no segn el nivel de la variable
es ese momento).
Para superar este defecto se gener una segunda forma
de calcular confiabilidad: se puede administrar una
Prueba Paralela, es decir, una prueba que posee
reactivos equivalentes a la prueba original pero no
iguales.
Dos pruebas pueden ser consideradas paralelas cuando
miden las mismas variables, bajo los mismos principios
y de la misma forma.

En la prctica, esto se determina cuando:

1. El promedio y las varianzas de ambos tests no difieren
significativamente
2. Los tems presentan un similar grado de dificultad y
estn distribuidos de manera similar.
3. Las correlaciones tem test son equivalentes.

Es importante destacar que en psicologa
casi no existen pruebas que posean una
versin paralela, por la dificultad que
implica cumplir cada uno de los criterios
estadsticos recin descritos.

El supuesto que opera a la base de este
procedimiento es el siguiente: Al aplicar
una forma paralela despus de un tiempo,
puede calcularse un Coeficiente de
Equivalencia, que refleja los errores de
medicin debidos a distintos reactivos y
ocasiones diferentes de aplicacin.

Para obtener dicho coeficiente
simplemente se ocupa algn
procedimiento correlacional.


En algunos casos es posible combinar las
modalidades testretest y formas
paralelas, a lo que se llama: Formas
paralelas con intervalo de tiempo. El
coeficiente que se obtiene pasa a
denominarse de estabilidad y
equivalencia.

3.3.- Consistencia
(Homogeneidad) Interna
Como ya se seal, la creacin de pruebas paralelas es
costosa y difcil (especialmente en pruebas de
capacidad). Por ello se desarrolla un mtodo menos
directo que tome en cuenta los diversos fenmenos que
afectan a la confiabilidad

Este mtodo se denomina Consistencia Interna.

Permite conocer si los resultados son consistentes entre
dos mitades que comparo (de la misma prueba)

En otras palabras, responde a la pregunta
:Son consistentes los resultados en el
tiempo entre dos mitades del mismo
instrumento?

Existen diversas formas de calcularlo (y
no todas son correlaciones):

1. Mtodo de Equivalencia Racional o biparticin del
test.
2. Mtodo Kuder Richardson (Frmulas 20 y 21).
3. Alfa de Cronbach.


1) Mtodo de Equivalencia racional de un
test. (Biparticin o Split half)
Consiste en un mtodo para estimar
directamente un coeficiente de
confiabilidad sin tener que calcular antes
una correlacin, a partir de la varianza de
los puntajes de las mitades de prueba.
Es un mtodo fcil y expedito de clculo.
Puede ser conveniente conceptualizar una
sola prueba como si consistiera en dos
partes (paralelas), cada una de las
cuales mide lo mismo.



En otras palabras, se aplica el instrumento y se
califican a cada sujeto con dos puntuaciones
separadas, pero provenientes de aquella nica
evaluacin.
Se puede realizar la biparticin de diversas maneras:

1. Si el test evala slo una variable, se puede dividir el
test en reactivos pares e impares.
2. Por el nmero de variables que posee la prueba
(Segn Tabla de especificaciones)

El primer mtodo fue desarrollado por Rulon (1939).
Posteriormente, Guttman (quien fue colaborador de
Rulon) desarrolla una nueva frmula para determinar la
confiabilidad.
Una nica prueba aplicada en una oportunidad se puede
dividir en sus resultados, en al menos dos partes.

Lo usual es usar biparticin par impar, aunque
pueden hacerse otros tipos de particin.

La frmula se basa en el establecimiento de la varianza
de cada una de las dos mitades del test, relacionndolas
con la varianza total del test.




Spearman Brown trabajan con el
mtodo de biparticin par impar.

Se supone que ambas mitades son
equivalentes, con medias y varianzas
iguales.

Es decir, los autores exigen que las dos
mitades resulten estrictamente paralelas
(lo cual no es enunciado por ninguno de
los autores revisados hasta aqu).

2) Mtodo derivado de los datos del
anlisis de tems: Frmulas de
Kuder Richardson.
Se aprovechan los resultados del anlisis de
tems, en que se intentaba calcular el grado de
consistencia interna de cada reactivo, uniendo
estos resultados para calcular el grado de
homogeneidad de todo el instrumento.
Los mtodos ms usados son las de Kuder
Richardson 20 y 21.
Suele aplicarse cuando los resultados a un tem
slo pueden ser calificados con valores 0 y 1.


3) Alfa de Cronbach
Cronbach adapta la frmula propuesta por
Guttman para establecer la confiabilidad
en test que tuvieran ms de dos partes.

Ejemplo: Instrumentos que evalan dos o
ms variables simultneamente.

Tambin es posible de obtener mediante
el uso de una Matriz de correlaciones.



Confiabilidad
Consistencia u obtencin de los
mismos resultados
Confiabilidad de la medicin
Reducir el
error de
medicin
Escribir
claramente
los reactivos
Plantear la
instruccin
facilmente
Condiciones
de
administraci
n
Explicitar
reglas de
calificacin
Entrenamiento
del evaluador
Medidas de confiabilidad y
validez
Confiabilidad de un Utilizar el sistema de
sistema de evaluacin 2 o ms evaluadores
Correlacin Alta = sistema confiable
Si una prueba es confiable, un sujeto recibir aproximadamente
la misma puntuacin cada vez que resuelva dicha prueba o una
equivalente de sta
Puntuacin alcanzada Correlaciona con medidas posteriores
de conducta
Coeficiente de correlacin
Mayor con respecto al rasgo
Coeficiente de
confiabilidad
Desviacin estndar de los
puntajes obtenidos
Tamao
relacionado con
Independiente de la
desviacin estndar
Varianza de los
errores de
medicin
Efectos de la dispersin sobre la
confiabilidad
Confiabilidad
Vara segn dispersin de los puntajes
No altera el significado directo del coeficiente de Confiabilidad
Proporcin entre la
varianza de los
puntajes verdaderos
y puntajes obtenidos
Proporcin pequea
Atenuar la
correlacin con
otras variables