Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEMA 2
VALIDEZ DE LAS PUNTUACIONES DE LOS TESTS
Objetivos
Introducir y diferenciar distintos tipos de validez de las puntuaciones de los tests
Calcular e interpretar distintos tipos de validez de las puntuaciones de los tests
Aplicar los distintos tipos de validez a las puntuaciones de tests concretos
Lecturas
Martínez Arias, M. R. (1995). Psicometría. Madrid: Síntesis
Capítulo 12: : La validez de los tests. Pp. 329-360
Martínez Arias, M. R., Hernández, M.J. y Hernández, M.V. (2006). Psicometría.
Madrid: Alianza Editorial
Capítulo 8: Validez de los tests. Pp. 219-244
Capítulo 9: Evidencias de validez referidas a un criterio, I: una variable predictora.
Pp. 245-258
Capítulo 10: Evidencias de validez referidas a un criterio, II: validez y utilidad. Pp.
279-288
Capítulo 12: Evidencias de validez relativas a la estructura interna del test, I:
Análisis Factorial Exploratorio. Pp. 317-352
Paz, M.D. (1996). Validez. (pp: 88-93) En Muñiz, J. (1996). Psicometría. Madrid:
Universitas
1
Facultad de Psicología. T. Rivas Moya
Definición de Validez
Validez es el grado en el que un instrumento de medida mide lo que se propone
medir (Cronbach, 1984). Aunque la definición del concepto parece simple no lo es,
como se puede comprobar en la extensa bibliografía que hay acerca del mismo.
Anteriormente, otros autores dieron definiciones similares. Vernon (1963) añade que
un test es válido para algún fin o propósito.
2
Psicometría. Validez de las puntuaciones de los tests
Aparente
Criterio Predictiva
o Concurrente
VALIDEZ Retrospectiva
Empírica
Muestral
Comprobada o
Contenido
Teórica
Factorial
Convergente
Conceptual Divergente
o Otros
Constructo
3
Facultad de Psicología. T. Rivas Moya
Validez de Contenido
Expresa el grado en el que una medida empírica (conjunto de ítems de un test) es
representativa de un dominio específico de contenido. Es decir, validez de contenido
es el grado en que la muestra de ítems que forman un test representa una muestra
adecuada del dominio de objetivos o conductas de interés.
En la validez de contenido hay dos aspectos según Messick (1975). Los ítems deben
ser relevantes para el uso que se va a dar a las puntuaciones del test y
representativos del dominio de ítems de interés.
4
Psicometría. Validez de las puntuaciones de los tests
Ejemplos
Ejemplo: Test de rendimiento en matemáticas.
Objetivo: Evaluar conocimiento general de matemáticas
Objetivo: Evaluar conocimiento de matemáticas después del curso de 1º de bachiller
Martínez Arias, (1995, pp. 337-340) describe las etapas y algunos procedimientos a
seguir para llevar a cabo el análisis de la validez de contenido. Uno de estos
procedimientos consiste en analizar el grado de acuerdo del emparejamiento ítems-
objetivos entre ‘jueces expertos en el contenido’. Los jueces emiten juicios sobre el
grado en que ítems-objetivos definidos en la tabla de Especificaciones están
emparejados. Posteriormente, esta información se resume mediante algunos índices
(Indice de Congruencia de Rovinelli & Hambleton, 1977; etc.)
La representatividad de los items con relación al dominio de contenido se puede
analizar con la Teoría de la Generalizabilidad.
5
Facultad de Psicología. T. Rivas Moya
Validez Aparente
Un test tiene validez aparente si mide lo que parece medir. Este tipo de validez
suele venir dada por los sujetos que responden al test.
“No hay una relación lógica entre ‘validez aparente’ y ‘validez real’. Aunque en
algunas situaciones puede haber una relación positiva entre ambas, en otras
situaciones - por ejemplo, en selección - la validez aparente puede ser una
desventaja” (Cattell y Warbuton, 1967).
Validez de Criterio
Es la capacidad del test para predecir un criterio relevante. Es decir, el grado en el
que el test es útil para predecir un objetivo determinado viene dado por su relación
con un criterio externo al test.
6
Psicometría. Validez de las puntuaciones de los tests
Ejemplos
Un test de inteligencia (Stanford-Binet) se administra a una muestra de niños de
5 años y sus controles. En el futuro, se mide éxito académico (libros y artículos
publicados, compañías dirigidas, patentes que han generado y salarios, etc.) La
relación entre las puntuaciones del test y las de estas variables pueden dar
evidencia de la validez predictiva del test, excepto cuando esta relación se pueda
explicar por otras causas.
Test de inteligencia. Criterio de ‘Rendimiento académico’
7
Facultad de Psicología. T. Rivas Moya
i Xi Yi
N X N YN
8
Psicometría. Validez de las puntuaciones de los tests
Dependiendo del nivel de medida de las variables se pueden obtener los siguientes
coeficientes de correlación:
S XY
rXY 1 rXY 1
S X SY
Coeficiente de determinación
2
rXY 0 rXY
2
1
Siendo:
S XY Covarianza de X eY
9
Facultad de Psicología. T. Rivas Moya
N número de sujetos
XA X p
rbp 1 rbp 1
SX q
Siendo:
X Media de las puntuaciones en X
S X Desviación típica de las puntuaciones en X
X A Media de las puntuaciones X en los sujetos que han puntuado ‘uno’ en el criterio
Y.
N 1
p siendo N 1 número de sujetos que han puntuado ‘uno’ en el
N
criterio
siendo N 0 número de sujetos que han puntuado ‘cero’ en el
N ( 0)
q 1 p
N
criterio
10
Psicometría. Validez de las puntuaciones de los tests
Siendo:
p X 1,Y 1 proporción de respuestas 1 a ambas X e Y
p X 1 proporción de respuestas 1 al test X
p Y 1 proporción de respuestas 1 al criterio Y
Validez de Constructo
Cronbach y Meehl (1955) introducen el concepto de validez de constructo. Para
estos autores, un test se crea para medir un constructo. Para medir el constructo se
especifica la teoría acerca de este constructo y lo que se espera acerca de la
relación entre
a) este constructo y otros constructos,
b) este constructo y otras medidas (es decir, tests), y
c) el test que se va a validar y otras medidas.
Estos autores denominan a estas relaciones red nomológica. La validez se prueba si
se puede demostrar que los resultados obtenidos con el test se ajustan al
constructo.
11
Facultad de Psicología. T. Rivas Moya
Este tipo de validez no se puede expresar mediante un único coeficiente, sino que el
estudio de la misma es un proceso continuo que requiere muchos tipos y fuentes de
evidencia. Para mostrar evidencias de validez de constructo, se plantea un conjunto
de hipótesis/relaciones - derivadas de las características psicológicas que mide el
test -se presentan los resultados obtenidos a partir del test acerca de este modelo de
relaciones. Posteriormente, se decide, de forma subjetiva, si estos resultados se
ajustan o no al constructo.
12
Psicometría. Validez de las puntuaciones de los tests
Ejemplo
25 items de afecto ¿forman una escala o varias escalas de diferentes estados de
afecto como depresión, euforia, hostilidad, ansiedad, etc.? ¿Deberían estar en dos
escalas diferentes items positivos de afecto e items negativos de afecto (‘feliz’
versus ‘triste’ para depresión, ‘tenso’ versus ‘calma’ para ansiedad) La pregunta es
¿Subyace una o mas variables latentes a un conjunto de items de varios estados de
afecto?
Spearman (1904) fue el primero que aplicó esta técnica en el análisis de habilidades
humanas e inteligencia. Desde entonces, el AF es una técnica ampliamente utilizada
en Psicometría.
13
Facultad de Psicología. T. Rivas Moya
• Obtención de factores de primer orden. Una vez que una prueba con 5 (n) items
se administra a una muestra de N sujetos se obtiene la siguiente matriz de
respuestas.
Items
Sujetos 1 2 3 … 5(n)
1
2
3
…
14
Psicometría. Validez de las puntuaciones de los tests
como % de Varianza
15
Facultad de Psicología. T. Rivas Moya
16
Psicometría. Validez de las puntuaciones de los tests
Método2
Rasgo1
Rasgo2
Rasgo3
Método 3
Rasgo1
Rasgo2
Rasgo3
17
Facultad de Psicología. T. Rivas Moya
METODOS METODOS
Resumen =
Metodo 2
A2 0,76 0,32 0,57 (0,95)
B2 (2) 0,30 0,65 0,40 (3) 0,39 (0,76)
C2 0,40 0,31 0,60 0,55 0,26 (0,74)
( ) Coeficientes de fiabilidad
Coeficientes para diferentes rasgos medidos con el mismo método
Coeficientes para diferentes rasgos medidos con distintos métodos
___ Coeficientes para el mismo rasgo evaluado con diferentes métodos
18
Psicometría. Validez de las puntuaciones de los tests
Validez y utilidad
La utilidad de las decisiones que se toman con los tests es un concepto asociado a
la validez de criterio. Se va a exponer este concepto asociado a un criterio
dicotómico. Así mismo, el tipo de decisión que se va a tomar con el test es
dicotómica, por ejemplo, admitir o no admitir a sujetos a un puesto de trabajo,
considerar a un sujeto apto o no apto en una materia, asignar a un sujeto o no a una
categoría de diagnóstico.
Se considera:
N sujetos a los que se les administra, por ejemplo, un cuestionario (test
predictor) y una entrevista clínica (criterio)
19
Facultad de Psicología. T. Rivas Moya
20
Psicometría. Validez de las puntuaciones de los tests
CON TRASTORNO
. . . .
. . .
PUNTO DE CORTE
. .
EN CRITERIO ( Yc )
. . . . .
. . .
SIN TRASTORNO
. .
VERDADEROS NEGATIVOS FALSOS POSITIVOS
b d
21
Facultad de Psicología. T. Rivas Moya
Test + X X C Test - X X C
Total
Con a (VP) c (FN) a+c
Criterio de trastorno
diagnóstico Sin d (FP) b (VN) b+d
Y trastorno
Total a+d b+c N
ac
Prevalencia (Tasa Base)
N
VP a
Sensibilidad (Proporción de Verdaderos Positivos)=
VP FN a c
FN c
Proporción de Falsos Negativos=
VP FN a c
VN b
Especificidad (Proporción de Verdaderos Negativos)=
VN FP b d
FP d
Proporción de Falsos Positivos=
FP VN b d
Indice de Youden J =
Máximo (Sensibilidad i + Especificidad i – 1)
posibles puntos de corte (i) sobre el test
23
Facultad de Psicología. T. Rivas Moya
TEMA 2. ACTIVIDADES
Suj X Y
1 6 11
2 8 15
3 7 16
4 7 14
5 5 10
6 4 12
7 6 10
8 9 17
9 9 18
10 9 17
Suj X Y XY
1 6 11 66
2 8 15 120
3 7 16 112
4 7 14 98
5 5 10 50
6 4 12 48
7 6 10 60
8 9 17 153
9 9 18 162
10 9 17 153
70 140 1022
70 140
X 7 Y 14
10 10
S X 1,6733 S Y 2,8983
7,14 102,2 98 4,2
1022
S XY
10
4, 2
rXY 0,8574
1,6733 * 2,8983
Coeficiente de determinación
rXY 0,8574 0,7351 73,5%
2 2
24
Psicometría. Validez de las puntuaciones de los tests
6 d 2j 6 * 22 132
XY 1 1 1 1 0,13 0,86
N N
3
10 10
3
990
25
Facultad de Psicología. T. Rivas Moya
Suj X Y X Y
1 Sin trastorno Sin trastorno 0 0
2 Con trastorno Con trastorno 1 1
3 Sin trastorno Con trastorno 0 1
4 Con trastorno Sin trastorno 1 0
5 Con trastorno Sin trastorno 1 0
6 Sin trastorno Con trastorno 0 1
7 Con trastorno Sin trastorno 1 0
8 Sin trastorno Con trastorno 0 1
9 Sin trastorno Sin trastorno 0 0
10 Con trastorno Con trastorno 1 1
Criterio (Y)
1 0 Total
Test (X) 1 2 3 5
0 3 2 5
Total 5 5 10
2 5 5 2 25 2
p X 1, Y 1 p X 1 p Y 1
10 10 10 10 100 10 1
p X 1 1 p X 1 p Y 1 1 p Y 1 5 5 5 5 25 25
10 10 10 10 100 100
2100 20 5
1 1 0,20
2510 25 25
26
Psicometría. Validez de las puntuaciones de los tests
27
Facultad de Psicología. T. Rivas Moya
En sujetos que reciban tratamiento psiquiátrico debería ser más probable obtener
puntuaciones altas que puntuaciones bajas en el test.
En sujetos con ocupaciones estresantes o peligrosas, debería ser más probable
obtener puntuaciones bajas que puntuaciones altas en el test.
El test de ansiedad debería tener correlaciones positivas con otros tests de
ansiedad ya validados
El test de ansiedad debería tener correlación cero con tests de personalidad que
no midan ansiedad
El test de ansiedad debería tener correlación cero con tests de habilidades y
motivación
Si estas hipótesis se pueden probar es difícil mantener que el test no mide ansiedad.
Dada la naturaleza del constructo ansiedad, estos son los resultados que se
deberían esperar.
28
Psicometría. Validez de las puntuaciones de los tests
Se presentan 10 frases en las que se expresan una serie de pensamientos y sentimientos. Señala
con una “X” el casillero que más se aproxime a cómo te percibes a ti mismo/a de acuerdo con la
siguiente escala:
Las características de ambas muestras, los resultados del ACP, análisis de los ítems
y fiabilidad (consistencia interna) se describen a continuación.
29
Facultad de Psicología. T. Rivas Moya
30
Psicometría. Validez de las puntuaciones de los tests
31
Facultad de Psicología. T. Rivas Moya
siendo:
NEO A – Afabilidad
NEO C – Conciencia
NEO O – Apertura a la Experiencia (Openess)
NEO N – Neuroticismo
NEO E – Extraversión
EPQ E – Extraversión
EPQ N – Neuroticismo (Ansiedad)
EPQ P – Psicoticismo
32
Psicometría. Validez de las puntuaciones de los tests
33
Facultad de Psicología. T. Rivas Moya
34
Psicometría. Validez de las puntuaciones de los tests
Escala
‘rating’
de la pareja
SL 0,65 0,10 0,15 0,92
SM 0,02 0,61 0,18 0.40 0,89
AS 0,04 0,10 0,66 0,60 0,52 0,86
Cuestionario
de iguales
SL 0,59 0,08 0,11 0,69 0,00 0,04 0,80
SM 0,01 0,55 0,09 0,00 0,72 0,02 0,10 0,85
AS 0,06 0,11 0,58 0,02 0,05 0,68 0,50 0,46 0,88
35
Facultad de Psicología. T. Rivas Moya
Test ( X C 19 )
+ - Total
Criterio Con Trastorno 174 a 184 c 358
Sin Trastorno 18 d 23 b 41
Total 192 207 399
174
Se 0,4860 48,60%
358
23
Es 0,5609 56,09%
41
184
Proporción de Falsos Negativos=1-Se
358
18
Proporción de Falsos Positivos=1-Es
41
174 23
ED 0,4937 49,37%
399
36
Psicometría. Validez de las puntuaciones de los tests
a c 64
Tasa Base = 0,6038 60%
N 106
ad 31
Razón de Selección = 0,2925 29%
N 106
a 26
Razón de Eficacia= 0,8387 84%
a d 31
37
Facultad de Psicología. T. Rivas Moya
Ejemplo
La Tabla 1 muestra las respuestas de 10 sujetos a un test (X) y a un test criterio (Y).
La puntuación 8 determina si un sujeto es apto o no apto en el test y en el criterio.
Tabla 1
S X Y
1 8 10
2 8 8
3 8 8
4 8 9
5 8 8
6 8 7
7 8 6
8 7 8
9 6 7
10 4 5
Obtener la Tabla 2 (2x2) para los sujetos aptos/no aptos en test y criterio
--------------------------------------------------------------------------------
Ayuda:
Cada puntuación de X se dicotomiza de forma que si:
X XC 8 X 0 no apto
X XC 8 X 1 apto
Cada puntuación de Y se dicotomiza de forma que si:
Y YC 8 Y 0 no apto
Y YC 8 Y 1 apto
--------------------------------------------------------------------------
Criterio (Y)
Apto No Apto Total
Apto 5 2 7
Test (X) No Apto 1 2 3
Total 6 4 10
5 7 6
10 10 10
7 76 6
1 1
10 10 10 10
Calcular e interpretar la Eficiencia Diagnostica del test X con respecto al test criterio Y
38
Psicometría. Validez de las puntuaciones de los tests
52 7
ED 0,7 70%
10 10
-------------------------------------------------------------------------
Disponible en http://psicologia.cv.uma.es
Basado en 20111025
39