Está en la página 1de 27

Seminario Taller: Identificacin y evaluacin de los calidad de los aspectos psicolgicos implicados en la Resolucin 1555 de 2005

CONFIABILIDAD Y VALIDEZ

Junio 25 de 2012

Definicin de prueba psicolgica.


Una de las definiciones ms aceptadas es la de Pichot (Bonboir,1974:91) que indica que se llama prueba a una situacin estandarizada que sirve de estmulo a un comportamiento. Tal comportamiento se evala por una comparacin estadstica con el de otros individuos colocados en la misma situacin, lo que permite clasificar al sujeto examinado, ya sea cuantitativa, ya sea tipolgicamente.

CONFIABILIDAD
Es el grado de congruencia con el cual se mide el atributo

Congruencia

Exactitud

La confiabilidad hace referencia a si la escala funciona de manera similar bajo diferentes condiciones

CONFIABILIDAD

Relacionado Instrumento

con

el

Relacionado con el Tiempo de aplicacin Relacionado con la aplicacin por diferentes personas

La pregunta clave para determinar la confiabilidad de un instrumento de medicin es: Si se miden fenmenos o eventos una y otra vez con el mismo instrumento de medicin, Se obtienen los mismos resultados u otros muy similares?

Si la respuesta es afirmativa, se dice que el instrumento es confiable.

Confiabilidad: Alfa de Cronbach Kuder Richardson

> 0.70 > 0.80

Test Re test

Coeficiente de Kappa

> 0.80

Valoracin del coeficiente kappa (Landis y Koch, 1977)4 Coeficiente Fuerza de la concordancia kappa 0,00 - Pobre (Poor) 0,01 - 0,20 Leve (Slight) 0,21 - 0,40 Aceptable (Fair) 0,41 - 0,60 Moderada (Moderate) 0,61 - 0,80 Considerable (Substantial) 0,81 - 1,00 Casi perfecta (Almost perfect)

Mtodos para Calcular los Coeficientes de confiabilidad


1. 2. 3. 4.

Mtodo del Test Retest. Mtodo de las Formas paralelas. Mtodo de las Mitades. Consistencia Interna (Alfa de Cronbach)

Confiabilidad Test y retest

Mide la estabilidad del instrumento, se aplica dos o ms veces al mismo grupo de personas despus de un corto periodo de tiempo. Si la correlacin es altamente positiva el instrumento es confiable. La confiabilidad del retest muestra el grado en el que los resultados de una prueba pueden generalizarse en otras ocasiones. Entre mayor sea la confiabilidad menos susceptibles sern los resultados de los examinados o en el entorno en el que se aplica la prueba.

Confiabilidad Formas alternas o paralelas

El uso de formas alternas de la prueba es una manera de evitar las dificultades de la confiabilidad test-retest. La correlacin entre las puntuaciones de las dos formas representa el coeficiente de confiabilidad de la prueba. la confiabilidad de formas alternas siempre debe ser acompaada por el informe de la duracin del intervalo entre las aplicaciones de la prueba y de una descripcin de las experiencias intermedias relevantes. Si las dos formas se aplican en sucesin inmediata, la correlacin muestra la confiabilidad nicamente entre las formas, no entre las ocasiones.

Confiabilidad De divisin por Mitades Partidas

Se puede obtener una medida de confiabilidad a partir de una nica aplicacin de una forma de la prueba ya que al dividirla en mitades equivalentes se obtienen dos puntuaciones de cada

persona.

Especficamente en el conjunto total de tems o componente se dividen en dos mitades y se comparan las puntuaciones o resultado de ambas.

La confiabilidad de divisin por mitades proporciona una medida de la consistencia del contenido muestreado, pero no de la estabilidad temporal de las puntuaciones porque el procedimiento

consiste en una nica sesin de prueba.

Error Estndar De Medicin Interpretacin de las puntuaciones

La confiabilidad de una prueba puede expresarse en

trminos del error estndar de las puntuaciones.

Esta medida es en especial adecuada para la interpretacin de las puntuaciones individuales, por lo que resulta ms til que el coeficiente de confiabilidad para muchos propsitos de la investigacin.

Interpretacin de las diferencias de las puntuaciones

Cuando se evalan las diferencias entre dos puntuaciones es muy importante considerar la confiabilidad de la prueba y los errores de medicin.

Es bueno recordar que el error estndar de la diferencia entre dos puntuaciones es mayor que el error de medicin de cualquiera de esos resultados. Esto se deriva del hecho de que los errores aleatorios o fortuitos de ambas puntuaciones influyen en esta diferencia.

VALIDEZ

Se refiere al grado en que un instrumento, mide lo que se supone debe medirse


Validez de Criterio Validez de Contenido Validez de Constructo

VALIDEZ

La validez de los instrumentos de medicin tiene que ver con lo que miden y con que tan bien lo hacen; nos indica que se puede inferir a partir de sus resultados El rasgo medido por determinada prueba solo puede definirse mediante el examen de las fuentes objetivos de informacin y las operaciones empricas utilizadas para establecer su validez.

Validez de Contenido

Describe la idoneidad del muestreo de reactivos para el constructo que se mide y se aplica a mediciones tanto de atributos emocionales o afectivos como cognitivos. Se requiere una muestra adecuada y representativa del contenido

Validez de Criterio

Evala si el instrumento constituye un predictor til de conductas, experiencias y condiciones subsecuentes. Grado en que la medida de la prueba refleja el estndar admitido.

Validez de Constructo

A travs del resultado se evala si el instrumento es valido para inferir el grado en que el sujeto posee determinadas caractersticas. Est referido a la concepcin de la variable a trabajar.

Validez:

r de Pearson
r de Spearman

> 0.20

Criterios Existencia: tem 1 tem 2

El tem es claramente redactado

comprensible

Apropiado tericamente

Ayuda a medir la variable de investigacin

Claridad: De redaccin: tem 1


tem 2

Validez: V de Aiken La validez fue obtenida de cada tem mediante la aplicacin del Coeficiente V de Airen, utilizando la siguiente formula: V= S . (n(c-1))

siendo: S = la sumatoria de si si = valor asignado por el juez i n = nmero de jueces c = nmero de valores de la escala de valoracin (2, e este caso)

Cuestionario 1

M A 01

M V 02

C H 03

M R 04

M S 05

W M 06

N N 07

pr ov 08

JF 09

L S 10

Acu erdo s

V de Aike n

Descripti vo

Clarament_redac
Comprensible Existencia Item 1 Apropiado Ayuda a medir

1
1 1 1

0
1 0 0

1
1 1 0

1
1 1 1

1
1 1 1

1
1 1 1

1
1 1 1

1
1 1 1

1
1 1 1

1
1 1 0

9
10 9 7

0,90
1,00 0,90 0,70

0,001
0,001 0,001 > 0.05

Vlido
Vlido Vlido No vlido

Clarament_redac Comprensible Existencia Item 2 Apropiado Ayuda a medir

1 1 1 1

1 1 1 1

1 1 1 1

0 1 1 0

1 1 1 1

1 1 1 1

1 1 1 1

1 1 1 1

1 1 1 1

1 1 1 1

9 10 10 9

0,90 1,00 1,00 0,90

0,001 0,001 0,001 0,001

Vlido Vlido Vlido Vlido

Clarament_redac Comprensible Claridad_redac Item 1 Apropiado Ayuda a medir

1 1 1 1

1 1 1 1

1 1 1 0

1 0 0 0

0 0 0 0

1 1 0 0

1 1 1 1

1 1 1 1

1 1 1 1

1 1 0 0

9 8 6 5

0,90 0,80 0,60 0,50

0,001 0,049 >0.05 >0.05

Vlido Vlido No vlido No vlido

El Anlisis Factorial supone que existe un factor comn subyacente a todas las variables, el Anlisis de Componentes Principales no hace tal asuncin.

VALIDEZ DE LAS PRUEBAS


Capacidad de un instrumento para obtener y proporcionar informacin directa y efectiva. VALIDACIN DE CONTENIDO: Trata de garantizar que el test constituye una muestra adecuada y representativa del contenido que ste pretende evaluar. - Definir tipos de contenidos y capacidad. - Muestra representativa de contenidos

VALIDEZ DE LAS PRUEBAS


VALIDACIN CONSTRUCTO:
Trata de garantizar la existencia de un constructo psicolgico que subyaga y d sentido y significado a las puntuaciones del test. Modo de evaluar: Anlisis Factorial y Matriz multimtodo-multirrasgo

VALIDACIN PREDICTIVA
Pronostica CAPACIDAD. Se correlaciona resultados obtenidos mediante Series Temporales con uno o ms de un grupo. Aplicar varias pruebas que midan lo mismo a Un aula o Varias aulas, y ver Relacin.

VALIDEZ DE LAS PRUEBAS


VALIDACIN FUNCIONAL:
O Validacin por Referencia a un Criterio. Finalidad: Contar con un mecanismo de comprobacin conductual para emitir juicios y tomar decisiones. VALIDACIN CONCURRENTE:
Se mide en forma sucesiva el desempeo del estudiante en relacin con una prueba o tarea especfica. Anlisis Estadstico Correlacional: a) Correlacin Por Rangos (rho) b) Correlacin Por Puntuaciones Netas (r)

También podría gustarte