Esquema Validez

TEMA 4:
VALIDEZ
Profa. Carmen Delgado
EN LA MEDIDA
1. Introducción: historia y concepto
2. Evidencias de validez de constructo:

1. Basadas en el contenido
2. Basadas en la estructura interna (validez del rasgo)
3. Basadas en los procesos de respuesta
4. Basadas en las consecuencias sociales
5. Basadas en la relación con otras variables:

• Relaciones teóricas (validez nomológica)
• Correlación con criterio externo: Factores
• Matrices multirrasgo-multimétodo
1. Introducción:
Concepto e Historia
Enfoque Inicial
AERA (American Educational Research Association), APA (American Psychological Association) & NCME (National
Council on Measurement in Education) (1954). Standards for Educational and Psychological Testing.
Washington, DC: American Educational Research Association.
“Un test es válido

para medir aquello
con lo que correlaciona”

(Guilford 1946)
Enfoque Inicial: TIPOS de validez
(Standards, 1954)
Evolución histórica
Ejecución del Ejecución del Universo Constructo
sujeto en sujeto en otros representado subyacente
desempeños tests o conductas por los ítems al test
posteriores del test
Ejército Empresa Educación Investigación
estadístico estadístico juicios expertos estadístico

correlación correlación representación multivariante
VALIDEZ VALIDEZ VALIDEZ DE VALIDEZ DE

PREDICTIVA CONCURRENTE CONTENIDO CONSTRUCTO
(Standards, 1954)


(Standards, 1954)


Medidas empíricas que
avalen modelos teóricos:
Validez de constructo
Modelos inteligencia
Validez del constructo
Validez Nomológica
V1 V2 V3 V4
Validez de Rasgo
CONSTRUCTO
INDICADORES
(Standards, 1954)


CONCEPCIÓN TRIPARTITA de validez (Standards, 1966, 1974)
Tipos de validez
1 2 3
Temporalidad del criterio Universo Constructo
representado subyacente
Predictiva Criterio posterior
Concurrente Criterio simultáneo por los ítems al test
Postdictiva Criterio anterior del test
juicios expertos estadístico

estadístico
representación multivariante
correlación
VALIDEZ DE VALIDEZ DE
CONTENIDO CONSTRUCTO
VALIDEZ DE CRITERIO
CONCEPCIÓN UNITARIA de validez (Standards, 1985)
Validez de Validez de
contenido rasgo
Validez
Validez de nomológica
criterio
Validez de Constructo
2. Validez de constructo:
Evidencias
AERA (American Educational Research Association), APA (American Psychological Association)

& NCME (National Council on Measurement in Education) (1999). Standards for Educational and
Psychological Testing. Washington, DC: American Educational Research Association.
http://www.apa.org/science/standards.html
Modificación del concepto (Standards, 1999)
1. La validación de un test es el proceso de acumulación de

evidencias de la validez de constructo.
2. Se validan las inferencias realizadas a partir de las
puntuaciones, no el test. Es un proceso dinámico y afecta
también a quienes usan el test.
3. No hay un único coeficiente de validez. Existen varios

descriptores numéricos de la validez.
4. El proceso de validación incluye el análisis de las
consecuencias sociales del test y es responsabilidad de
los usuarios del test.
Enfoque Actual
AERA (American Educational Research Association), APA (American Psychological Association) & NCME (National
Council on Measurement in Education) (1999). Standards for Educational and Psychological Testing.
Washington, DC: American Educational Research Association.
“La validez es un juicio integrado del

grado en que la evidencia empírica y la
racionalidad teórica apoyan la suficiencia
y la conveniencia de las inferencias y
acciones basadas en las puntuaciones

de los tests u otros modos de evaluación”
(Messick, 1989)
EVIDENCIAS de la Validez de CONSTRUCTO
(Standards, 1999)
CONTENIDO Relevancia de los contenidos para
medir el constructo
ESTRUCTURA Estructura del constructo: las
INTERNA puntuaciones empíricas reproducen la
formulación teórica del constructo
PROCESOS DE Procesos cognitivos desarrollados por
RESPUESTA el sujeto para responder al test
CONSECUENCIAS Implicaciones sociales del uso del test

SOCIALES
RELACIÓN CON Utilidad predictiva
OTRAS VARIABLES Utilidad diagnóstica
1. Evidencias basadas en el contenido:
Un test tiene validez bajo la perspectiva del contenido, si sus ítems son
una muestra adecuada, de un dominio más amplio de ítems
representativos del constructo.
• Relevancia: los ítems deben ser relevantes para el uso que se dará a las
puntuaciones.
Ejemplo: para predecir competencia clínica en psicología ¿es adecuado
utilizar un test que mide conocimientos memorizados?
• Representatividad: los ítems deben constituir una muestra aleatoria del

universo del constructo: “los ítems representan o reproducen las

características esenciales del constructo”.
Ejemplo: para medir burnout ¿se pueden utilizar sólo ítems de cansancio
emocional? ¿se puede excluir las otras dimensiones del constructo?
“Validez aparente” es una estrategia, no es una evidencia de validez

2. Evidencias basadas la estructura interna:
Las puntuaciones del test deben reproducir la estructura teórica del
constructo.
Estructura interna
(Validez del rasgo)
Procedimientos de validación Análisis factorial
Ítem 5 Ítem 10
Varianza común
entre los ítems
FACTOR
Despersonalización
Ítem 11 Ítem 15
3. Evidencias basadas en procesos respuesta:
Aportaciones de la Psicología Cognitiva (simulación de procesos) para
explorar los procesos que miden los tests de inteligencia (investigación
liderada por Embretson, desde los años 80 hasta la actualidad).
• Análisis de protocolos verbales (Ericsson y Simon): se pide a los sujetos que

piensen en voz alta, mientras realizan la tarea o que la reconstruyan
retrospectivamente.
• Análisis cronométrico (Sternberg): que contrasta los tiempos de respuesta entre
tareas que difieren en carga de procesamiento.
• Correlatos cognitivos (Pellegrino y Glaser): grupos de sujetos con alto y bajo
rendimientos en el test, son comparados en tareas sencillas de laboratorio para

ver cómo difieren en la ejecución.
• Análisis de razones, se pide a los sujetos que justifiquen o razonen la elección
de la respuesta.
• Análisis de movimientos oculares (soporte informático): permite analizar áreas a
las que se dirige a atención y de activación cerebral en la ejecución del test
4. Evidencias basadas en consecuencias
sociales del uso del test:
¿Cuándo incorporar el análisis de las consecuencias del uso de los
tests durante el proceso de validación?
Siempre que la validez de la interpretación de las mediciones esté

amenazada por evidencias
1. Baja representación del constructo: cuando los ítems no

representan de forma adecuada todos los componentes

importantes del constructo.
2. Fuentes de varianza irrelevantes: factores extraños al

constructo objeto de la medición que afectan a las
puntuaciones.
4. Evidencias basadas en consecuencias
sociales del uso del test:
• Inadecuada representación del constructo: algunas universidades
norteamericanas hacen pruebas de admisión con tests muy cargados en
conocimientos científicos básicos y no en otras destrezas relevantes para los
estudios. Algunas escalas de violencia en la pareja no incluyen la violencia de género,
que es la más grave y frecuente.
• Impacto adverso: efectos colaterales no anticipados de los usos

legítimos del test: la aplicación de los tests no puede producir discriminación
social de grupos
• Resultados contradictorios con evidencias empíricas: si los estudios

sociológicos indican que en Europa la primera causa de muerte en hombres jóvenes
son los accidentes de tráfico, y en mujeres jóvenes la violencia de género (OMS), los
tests que miden estos constructos (riesgo de accidentabidad o violencia de género)
no tendrán validez si sus resultados son contradictorios con la evidencia empírica.
5. Evidencias basadas en la relación con otras
variables:
• Validez nomológica: La relación de las puntuaciones de los tests con otros
constructos, reproducen las relaciones hipotetizadas por la teoría.
Psicosomática
BURNOUT
Conductual Emocional
variables:
• Relación con un criterio: relación entre las puntuaciones del test y variables
externas al test, entendiendo por tales algún criterio que se supone predecible por el
test, u otros tests construidos para medir el mismo constructo (antigua “validez de
criterio).
TEMPORALIDAD DEL CRITERIO:

1. Validez Predictiva  Medidas del criterio posteriores a la
aplicación del test. Fines pronósticos o predictivos.
2. Validez Concurrente  Medidas del criterio simultáneas a la

aplicación del test. Fines diagnósticos.
3. Validez Postdictiva  Medidas del criterio previas a la

aplicación del test. Investigación retrospectiva.
Factores que afectan a la correlación con el criterio
1. Fiabilidad:  XY
  XX '
 YY '
 
  
Coef .validez   X 1Y 1
 
XY
X 2Y 2
VxVy
 XX '
 YY '
Coef .validez _ máximo
X 1 X '1 Y 1Y '1
 X 2 X '2
 Y 2Y ' 2
2. Longitud:  k
1    

2
 XY
1   k  1 
XX ' XY ( 2 )
XY K K
  
2 2
XX
XY XY ( 2 ) XX '
3. Variabilidad:  

X
 XY (1)
    
XY 2 2 2 2 2
X XY (1) X (1) X (1) XY (1)
variables:
• Matrices multirrasgo-multimétodo: Las correlaciones entre medidas de un
mismo constructo con distintos métodos, deben ser más altas que las correlaciones
entre constructos diferentes.
Medida Método 1
A1 Constructo A A2
B1 B2
Constructo B
Medida Método 2
Procedimientos de validación
Matrices multirrasgo-multimétodo
Matrices multirrasgo-multimétodo
Procedimientos de validación MÉTODO 1: MÉTODO 2:

Tests Composiciones
M. 1: A. R. A. R.
Tests Verbal Espacial Verbal Espacial
A. Verbal (0.97)
R. Espacial 0.21 (0.92)
M. 2: A. Verbal 0.78 0.09 (0.95)

Composic.
R. Espacial 0.10 0.82 0.22 (0.89)
Coeficientes de fiabilidad: (sombreado gris )

Coeficientes de validez convergente: (en negrita )
Coeficientes de validez discriminante:
- heterorrasgo monométodo: 0,21 y 0,22
- heterorrasgo heterométodo: 0,10 y 0,09

Esquema Validez

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Esquema Validez

Cargado por

Copyright:

Formatos disponibles

TEMA 4:

2. Evidencias de validez de constructo:

5. Basadas en la relación con otras variables:

“Un test es válido

con lo que correlaciona”

estadístico estadístico juicios expertos estadístico

VALIDEZ VALIDEZ VALIDEZ DE VALIDEZ DE

estadístico estadístico juicios expertos estadístico

VALIDEZ VALIDEZ VALIDEZ DE VALIDEZ DE

estadístico estadístico juicios expertos estadístico

VALIDEZ VALIDEZ VALIDEZ DE VALIDEZ DE

estadístico estadístico juicios expertos estadístico

VALIDEZ VALIDEZ VALIDEZ DE VALIDEZ DE

juicios expertos estadístico

AERA (American Educational Research Association), APA (American Psychological Association)

1. La validación de un test es el proceso de acumulación de

3. No hay un único coeficiente de validez. Existen varios

“La validez es un juicio integrado del

acciones basadas en las puntuaciones

RESPUESTA el sujeto para responder al test

CONSECUENCIAS Implicaciones sociales del uso del test

• Representatividad: los ítems deben constituir una muestra aleatoria del

universo del constructo: “los ítems representan o reproducen las

“Validez aparente” es una estrategia, no es una evidencia de validez

• Análisis de protocolos verbales (Ericsson y Simon): se pide a los sujetos que

rendimientos en el test, son comparados en tareas sencillas de laboratorio para

Siempre que la validez de la interpretación de las mediciones esté

1. Baja representación del constructo: cuando los ítems no

representan de forma adecuada todos los componentes

2. Fuentes de varianza irrelevantes: factores extraños al

• Impacto adverso: efectos colaterales no anticipados de los usos

• Resultados contradictorios con evidencias empíricas: si los estudios

TEMPORALIDAD DEL CRITERIO:

2. Validez Concurrente  Medidas del criterio simultáneas a la

3. Validez Postdictiva  Medidas del criterio previas a la

Procedimientos de validación MÉTODO 1: MÉTODO 2:

M. 2: A. Verbal 0.78 0.09 (0.95)

Coeficientes de fiabilidad: (sombreado gris )

También podría gustarte