Está en la página 1de 6

Confiabilidad

La confiabilidad se refiere a la consistencia de las puntuaciones obtenidas por las


mismas personas cuando se les examina en distintas ocasiones con el mismo test, o
conjuntos equivalentes de reactivos o en otras condiciones de examinacin. Esto quiere
decir que los resultados de una prueba deben ser consistentes por tanto si administramos
nuevamente la prueba debe darnos resultados parecidos.
Toda prueba luego de ser elaborada debe someterse a un riguroso procedimiento en el
cual debe establecerse su confiabilidad y validez, de manera tal que el examinador al
momento de aplicarlo puede tener la certeza que la misma cumpla con estos requisitos.
Una variable importante en el establecimiento de la confiabilidad es lo que se conoce
como varianza de error que son variaciones o fluctuaciones de medidas que no se
pueden explicar. cualquier condicin que sea irrelevante para el propsito de la prueba
representa lo que se conoce como varianza de error

Coeficiente de correlacin
Existe correlacin cuando dos o ms variables guardan relacin entre s. La correlacin
es el grado de correspondencia o relacin entre dos conjuntos de puntuaciones.
El coeficiente de correlacin es un ndice numrico de la relacin existente entre dos
variables.
El coeficiente de correlacin puede oscilar entre -1.00 a+1.00
La relacin perfecta es igual a -1.00 o +1.00
Una correlacin de cero indica ausencia absoluta de relacin. Es importante precisar que
la correlacin no equivale a casualidad. Se dice que existe significancia estadstica
cuando la probabilidad de que los resultados se deben a la suerte o error es poca. 0.05
significa 5 probabilidades en 100

Tipos de correlacin
Se puede decir que la correlacin puede ser positiva, negativa o nula.
Cuando se habla de correlacin positiva significa que dos o ms variables covaran en
la misma direccin (de 0 a +1.00).
Una correlacin directa o positiva entre la variable Y significa que las elevaciones en X
tienden a asociarse en altas puntuaciones en Y.
La correlacin negativa indica que dos variables covaran en direccin contraria, un
ejemplo de esta correlacin es cuando un estudiante obtiene puntuaciones altas en el test
TRDA sin embargo en el test PMA obtiene una puntuacin baja.

Diagrama de Dispersin
El diagrama de dispersin es una representacin grfica que nos permite establecer la
relacin lgica entre dos variables.
Tal como se ha planteado un diagrama de dispersin puede sugerir varios tipos de
correlacin entre las variables: es positiva cuando ambas variables van en aumento,
negativa cuando una va en ascenso y otra va en descenso y nula o dispersa cuando las
variables no estn relacionadas.

Coeficiente de Correlacin Producto-Momento de Pearson


Es un ndice que mide la relacin lineal entre dos variables siempre que sean
cuantitativas su interpretacin es fcil pues su valor finales oscilan entre -1 y +1.
Este coeficiente permite conocer la magnitud de la relacin entre dos variables
continuas y la direccin de dicha relacin, la cual puede ser directa e inversa.
La interpretacin de la puntuacin del Coeficiente de Correlacin Producto Momento de
Pearson es muy simple: cuanto ms lejos de 1 est el resultado, menor ser la
correlacin y mientras ms cerca de 1, mayor ser la correlacin entre dos variables.
La puntuacin deseable para los coeficientes de confiabilidad en pruebas psicolgica es
la que se ubica entre .80 y .90; y un puntaje de correlacin inferior al .65 debe ser
considerado como reprobatorio o inaceptable.

Tipos de Confiabilidad
Con fiabilidad Test Retest
la forma ms prctica de encontrar la confiabilidad de las puntuaciones de una
prueba consiste en aplicar el mismo instrumento en una segunda ocasin a los
mismos sujetos.
Anastasi y Urbina sealan que cuando se ha establecido este tipo de
confiabilidad, debe sealarse en el manual de la prueba el intervalo en el que se
midi pues las correlaciones test-retest disminuyen progresivamente conforme
aumenta el intervalo. En los casos de aplicacin de pruebas a nios pequeos el
perodo debe ser ms corto, ya que a edades ms tempranas es posible percibir
cambios progresivos del desarrollo en un plazo de un mes e incluso menos. En
sentido general el intervalo recomendable para la administracin de ambas
pruebas no debe ser mayor a los seis meses.

Con fiabilidad de Formas Alternas


Otra forma muy utilizada es la confiabilidad de formas alternas en esta las
mismas personas son evaluadas con una forma del pez en una primera ocasin y
con otra forma equivalente en una segunda ocasin.

Estas formas deben ser similares en contenido, instrucciones, tipos de preguntas


y dificultad. Un dato interesante es que deben ser aplicadas ambas pruebas en un
perodo relativamente corto.
Al igual que en la confiabilidad test-retest la duracin de aplicacin del intervalo
debe sealarse en el manual.

Con fiabilidad de Divisin dos Mitades


El mtodo de confiabilidad de Divisin dos Mitades consiste en dividir la prueba
en dos Mitades equivalentes, obteniendo de esa manera dos puntuaciones de
cada persona.
Un procedimiento para la divisin en dos mitades iguales, es que una est
compuesta por los tems pares y la otra por los por los nones. Luego de esta
divisin se procede a establecer la correlacin de ambos grupos.

Con fiabilidad de Kuder Richardson


La confiabilidad de kuder Richardson se utiliza para encontrar la consistencia
interna de los reactivos.
La formula de kuder Richardson puede ser aplicada a pruebas cuyos reactivos se
califican como verdadero-falso o de acuerdo o desacuerdo.
En ese sentido Cohen y Swerdlik (2002) concluyen sealando que la
confiabilidad de kuder Richardson es el mtodo a utilizar para determinar la
consistencia entre los reactivos de tipo dicotmicos, sobre todo en aquellos que
pueden ser calificados como correctos o incorrectos (como los de opinin
mltiple).

Confiabilidad entre los Examinadores


Este tipo de confiabilidad es muy utilizado en las pruebas proyectivas los cuales
tienen ingrediente objetivo en la interpretacin de los datos.

Validez

La validez es cuando la prueba mide lo que pretende medir. Es la concordancia


entre las puntuaciones o medidas de una prueba y la cualidad que se cree que
est midiendo. La validez es un trmino fundamental en la medicin y en la
ciencia psicolgica.
Ahora bien llamamos validacin (Cohen y Swerdlik, 2002) al proceso de
recopilar y evaluar la validez de la evidencia. En ese sentido tanto el creador de
la prueba como el usuario de la misma puede desempear una labor en la
validacin de una prueba para un propsito especfico. El diseador de la prueba
debe suministrar evidencia en el manual de la validez de la prueba. Una labor
muy productiva es que los usuarios de los test realicen investigaciones
destinadas a confirmar la validacin de la prueba aportando de esta manera datos
que confirman su valor psicomtrico.

Tipos de Validez
Los especialistas de la medicin psicolgica han clasificado en sentido general
tres categoras de validez, (las cuales se conocen como percepcin Trinitaria) las
que se sealan a continuacin:
1. Validez relacionada con el criterio
2. Validez de contenido
3. Valides de constructo

Validez Aparente
La cual se refiere a que parece medir, no a lo que mide, es decir, tiene que
ver si la prueba parece vlida. La validez aparente tiene que ver con el
rapport y las relaciones pblicas.
Se dice que una prueba tiene validez aparente si los reactivos se perciben
razonablemente, relacionndolos con el propsito de la prueba.
Entre las variables relacionadas con la validez aparente est el tipo de letras,
color del papel y las letras y l formato de los tems.

1. Validez Relacionada con el Criterio


Segn nos plantean Kaplan y Saccuzzo (2006), la validez relacionada al
criterio nos dice que tambin corresponde una prueba con criterio particular.
Tal evidencia la proporcionan las correlaciones altas entre una prueba y una
medida de criterio adecuadamente definida. Cuando se habla de un criterio
se refiere al estndar contra el que se compara la prueba. Un ejemplo sencillo
sera: el uso de una prueba para predecir qu parejas comprometidas tendrn
xito en un matrimonio y cules se divorciaran. En este caso el xito en el
matrimonio es el criterio, pero no se puede saber en el momento en el que las
parejas contestan la prueba premarital.

En sentido general tenemos dos formas de validez relacionada con l


criterio: Validez Predictiva y Validez Concurrente.

Validez Predictiva

Es aquella que trata de predecir el futuro desempeo del sujeto, por tanto,
su propsito es predecir la probabilidad de xito.

Validez Concurrente

La validez concurrente estima l desempeo actual del sujeto. Este tipo


de validez se aplica cuando la prueba y l criterio pueden medirse al
mismo tiempo.

2. Validez de Contenido
Cuando hablamos de validez de contenido nos referimos al grado en que una
prueba representa el universo de reactivos del cual se extrajo.
Chen y Swerdlik (2006) sealan que este tipo de validez describe un juicio
de cuan adecuadamente una prueba es una muestra de la conducta
representativa dentro del universo de conductas que la prueba fue diseada
para ejemplificar.
Para establecer la validez de contenido se utiliza en la mayora de los casos,
la opinin de expertos para establecerla. La validez de contenido requiere
buena lgica, habilidades intuitivas y perseverancia. La validez de contenido
designa la representatividad del dominio que la prueba debe abarcar. Un dato
interesante es que esta validez se evala mediante la lgica ms que
mediante procesos estadsticos.

3. Validez de Constructo
La validez de constructo o construccin es el grado en que los resultados de
una prueba se relacionan con los constructos psicolgicos subyacentes.
Cuando hablamos de constructo nos referimos a un concepto terico
psicolgico que no podemos observar, por ejemplo la inteligencia o factores
de la personalidad.
A travs de la validez de constructo se vinculan los puntajes con alguna
teora o modelo de conducta subyacente. La validez de constructo plantea
hasta qu punto tenemos evidencia de que una prueba mide un constructo
hipottico en particular.
Para asegurar el establecimiento de la validez de constructo se debe
desarrollar un conjunto de reactivos de la prueba en base a este constructo y
se debe demostrar que los reactivos reflejan el contenido del constructo.

También podría gustarte