Está en la página 1de 28

TEMA 4:

VALIDEZ
Profa. Carmen Delgado

EN LA MEDIDA
1. Introducción: historia y concepto

2. Evidencias de validez de constructo:


1. Basadas en el contenido
2. Basadas en la estructura interna (validez del rasgo)
3. Basadas en los procesos de respuesta
4. Basadas en las consecuencias sociales
Profa. Carmen Delgado

5. Basadas en la relación con otras variables:


• Relaciones teóricas (validez nomológica)
• Correlación con criterio externo: Factores
• Matrices multirrasgo-multimétodo
1. Introducción:
Profa. Carmen Delgado

Concepto e Historia
Enfoque Inicial
AERA (American Educational Research Association), APA (American Psychological Association) & NCME (National
Council on Measurement in Education) (1954). Standards for Educational and Psychological Testing.
Washington, DC: American Educational Research Association.

“Un test es válido


para medir aquello
Profa. Carmen Delgado

con lo que correlaciona”


(Guilford 1946)
Enfoque Inicial: TIPOS de validez
(Standards, 1954)
Evolución histórica
Ejecución del Ejecución del Universo Constructo
sujeto en sujeto en otros representado subyacente
desempeños tests o conductas por los ítems al test
posteriores del test
Ejército Empresa Educación Investigación
Profa. Carmen Delgado

estadístico estadístico juicios expertos estadístico


correlación correlación representación multivariante

VALIDEZ VALIDEZ VALIDEZ DE VALIDEZ DE


PREDICTIVA CONCURRENTE CONTENIDO CONSTRUCTO
Enfoque Inicial: TIPOS de validez
(Standards, 1954)
Evolución histórica
Ejecución del Ejecución del Universo Constructo
sujeto en sujeto en otros representado subyacente
desempeños tests o conductas por los ítems al test
posteriores del test
Ejército Empresa Educación Investigación
Profa. Carmen Delgado

estadístico estadístico juicios expertos estadístico


correlación correlación representación multivariante

VALIDEZ VALIDEZ VALIDEZ DE VALIDEZ DE


PREDICTIVA CONCURRENTE CONTENIDO CONSTRUCTO
Enfoque Inicial: TIPOS de validez
(Standards, 1954)
Evolución histórica
Ejecución del Ejecución del Universo Constructo
sujeto en sujeto en otros representado subyacente
desempeños tests o conductas por los ítems al test
posteriores del test
Ejército Empresa Educación Investigación
Profa. Carmen Delgado

estadístico estadístico juicios expertos estadístico


correlación correlación representación multivariante

VALIDEZ VALIDEZ VALIDEZ DE VALIDEZ DE


PREDICTIVA CONCURRENTE CONTENIDO CONSTRUCTO
Medidas empíricas que
avalen modelos teóricos:
Validez de constructo

Modelos inteligencia
Profa. Carmen Delgado
Validez del constructo
Validez Nomológica
V1 V2 V3 V4

Validez de Rasgo
Profa. Carmen Delgado

CONSTRUCTO

INDICADORES
Enfoque Inicial: TIPOS de validez
(Standards, 1954)
Ejecución del Ejecución del Universo Constructo
sujeto en sujeto en otros representado subyacente
desempeños tests o conductas por los ítems al test
posteriores del test
Ejército Empresa Educación Investigación
Profa. Carmen Delgado

estadístico estadístico juicios expertos estadístico


correlación correlación representación multivariante

VALIDEZ VALIDEZ VALIDEZ DE VALIDEZ DE


PREDICTIVA CONCURRENTE CONTENIDO CONSTRUCTO
CONCEPCIÓN TRIPARTITA de validez (Standards, 1966, 1974)
Tipos de validez
1 2 3
Temporalidad del criterio Universo Constructo
representado subyacente
Predictiva Criterio posterior
Concurrente Criterio simultáneo por los ítems al test
Postdictiva Criterio anterior del test
Profa. Carmen Delgado

juicios expertos estadístico


estadístico
representación multivariante
correlación
VALIDEZ DE VALIDEZ DE
CONTENIDO CONSTRUCTO
VALIDEZ DE CRITERIO
CONCEPCIÓN UNITARIA de validez (Standards, 1985)

Validez de Validez de
contenido rasgo
Validez
Validez de nomológica
criterio
Profa. Carmen Delgado

Validez de Constructo
2. Validez de constructo:
Evidencias
Profa. Carmen Delgado

AERA (American Educational Research Association), APA (American Psychological Association)


& NCME (National Council on Measurement in Education) (1999). Standards for Educational and
Psychological Testing. Washington, DC: American Educational Research Association.
http://www.apa.org/science/standards.html
Modificación del concepto (Standards, 1999)

1. La validación de un test es el proceso de acumulación de


evidencias de la validez de constructo.
2. Se validan las inferencias realizadas a partir de las
puntuaciones, no el test. Es un proceso dinámico y afecta
también a quienes usan el test.
Profa. Carmen Delgado

3. No hay un único coeficiente de validez. Existen varios


descriptores numéricos de la validez.
4. El proceso de validación incluye el análisis de las
consecuencias sociales del test y es responsabilidad de
los usuarios del test.
Enfoque Actual
AERA (American Educational Research Association), APA (American Psychological Association) & NCME (National
Council on Measurement in Education) (1999). Standards for Educational and Psychological Testing.
Washington, DC: American Educational Research Association.

“La validez es un juicio integrado del


grado en que la evidencia empírica y la
racionalidad teórica apoyan la suficiencia
y la conveniencia de las inferencias y
Profa. Carmen Delgado

acciones basadas en las puntuaciones


de los tests u otros modos de evaluación”
(Messick, 1989)
EVIDENCIAS de la Validez de CONSTRUCTO
(Standards, 1999)
CONTENIDO Relevancia de los contenidos para
medir el constructo
ESTRUCTURA Estructura del constructo: las
INTERNA puntuaciones empíricas reproducen la
formulación teórica del constructo
PROCESOS DE Procesos cognitivos desarrollados por
Profa. Carmen Delgado

RESPUESTA el sujeto para responder al test

CONSECUENCIAS Implicaciones sociales del uso del test


SOCIALES
RELACIÓN CON Utilidad predictiva
OTRAS VARIABLES Utilidad diagnóstica
1. Evidencias basadas en el contenido:
Un test tiene validez bajo la perspectiva del contenido, si sus ítems son
una muestra adecuada, de un dominio más amplio de ítems
representativos del constructo.

• Relevancia: los ítems deben ser relevantes para el uso que se dará a las
puntuaciones.
Ejemplo: para predecir competencia clínica en psicología ¿es adecuado
utilizar un test que mide conocimientos memorizados?

• Representatividad: los ítems deben constituir una muestra aleatoria del


Profa. Carmen Delgado

universo del constructo: “los ítems representan o reproducen las


características esenciales del constructo”.
Ejemplo: para medir burnout ¿se pueden utilizar sólo ítems de cansancio
emocional? ¿se puede excluir las otras dimensiones del constructo?

“Validez aparente” es una estrategia, no es una evidencia de validez


2. Evidencias basadas la estructura interna:
Las puntuaciones del test deben reproducir la estructura teórica del
constructo.
Profa. Carmen Delgado
Estructura interna
(Validez del rasgo)
Procedimientos de validación Análisis factorial

Ítem 5 Ítem 10
Varianza común
entre los ítems
FACTOR
Profa. Carmen Delgado

Despersonalización

Ítem 11 Ítem 15
3. Evidencias basadas en procesos respuesta:
Aportaciones de la Psicología Cognitiva (simulación de procesos) para
explorar los procesos que miden los tests de inteligencia (investigación
liderada por Embretson, desde los años 80 hasta la actualidad).

• Análisis de protocolos verbales (Ericsson y Simon): se pide a los sujetos que


piensen en voz alta, mientras realizan la tarea o que la reconstruyan
retrospectivamente.
• Análisis cronométrico (Sternberg): que contrasta los tiempos de respuesta entre
tareas que difieren en carga de procesamiento.
• Correlatos cognitivos (Pellegrino y Glaser): grupos de sujetos con alto y bajo
Profa. Carmen Delgado

rendimientos en el test, son comparados en tareas sencillas de laboratorio para


ver cómo difieren en la ejecución.
• Análisis de razones, se pide a los sujetos que justifiquen o razonen la elección
de la respuesta.
• Análisis de movimientos oculares (soporte informático): permite analizar áreas a
las que se dirige a atención y de activación cerebral en la ejecución del test
4. Evidencias basadas en consecuencias
sociales del uso del test:
¿Cuándo incorporar el análisis de las consecuencias del uso de los
tests durante el proceso de validación?

Siempre que la validez de la interpretación de las mediciones esté


amenazada por evidencias

1. Baja representación del constructo: cuando los ítems no


Profa. Carmen Delgado

representan de forma adecuada todos los componentes


importantes del constructo.

2. Fuentes de varianza irrelevantes: factores extraños al


constructo objeto de la medición que afectan a las
puntuaciones.
4. Evidencias basadas en consecuencias
sociales del uso del test:
• Inadecuada representación del constructo: algunas universidades
norteamericanas hacen pruebas de admisión con tests muy cargados en
conocimientos científicos básicos y no en otras destrezas relevantes para los
estudios. Algunas escalas de violencia en la pareja no incluyen la violencia de género,
que es la más grave y frecuente.

• Impacto adverso: efectos colaterales no anticipados de los usos


legítimos del test: la aplicación de los tests no puede producir discriminación
Profa. Carmen Delgado

social de grupos

• Resultados contradictorios con evidencias empíricas: si los estudios


sociológicos indican que en Europa la primera causa de muerte en hombres jóvenes
son los accidentes de tráfico, y en mujeres jóvenes la violencia de género (OMS), los
tests que miden estos constructos (riesgo de accidentabidad o violencia de género)
no tendrán validez si sus resultados son contradictorios con la evidencia empírica.
5. Evidencias basadas en la relación con otras
variables:
• Validez nomológica: La relación de las puntuaciones de los tests con otros
constructos, reproducen las relaciones hipotetizadas por la teoría.

Psicosomática
Profa. Carmen Delgado

BURNOUT
Conductual Emocional
5. Evidencias basadas en la relación con otras
variables:
• Relación con un criterio: relación entre las puntuaciones del test y variables
externas al test, entendiendo por tales algún criterio que se supone predecible por el
test, u otros tests construidos para medir el mismo constructo (antigua “validez de
criterio).

TEMPORALIDAD DEL CRITERIO:


1. Validez Predictiva  Medidas del criterio posteriores a la
aplicación del test. Fines pronósticos o predictivos.
Profa. Carmen Delgado

2. Validez Concurrente  Medidas del criterio simultáneas a la


aplicación del test. Fines diagnósticos.

3. Validez Postdictiva  Medidas del criterio previas a la


aplicación del test. Investigación retrospectiva.
Factores que afectan a la correlación con el criterio

1. Fiabilidad:  XY
  XX '
 YY '

 
  
Coef .validez   X 1Y 1

 
XY
X 2Y 2
VxVy
 XX '
 YY '
Coef .validez _ máximo
X 1 X '1 Y 1Y '1

 X 2 X '2
 Y 2Y ' 2

2. Longitud:  k
1    

2
Profa. Carmen Delgado

 XY

1   k  1 
XX ' XY ( 2 )
XY K K
  
2 2
XX
XY XY ( 2 ) XX '

3. Variabilidad:  

X
 XY (1)

    
XY 2 2 2 2 2
X XY (1) X (1) X (1) XY (1)
5. Evidencias basadas en la relación con otras
variables:
• Matrices multirrasgo-multimétodo: Las correlaciones entre medidas de un
mismo constructo con distintos métodos, deben ser más altas que las correlaciones
entre constructos diferentes.

Medida Método 1
A1 Constructo A A2
Profa. Carmen Delgado

B1 B2
Constructo B
Medida Método 2
Profa. Carmen Delgado

Procedimientos de validación
Matrices multirrasgo-multimétodo
Matrices multirrasgo-multimétodo

Procedimientos de validación MÉTODO 1: MÉTODO 2:


Tests Composiciones
M. 1: A. R. A. R.
Tests Verbal Espacial Verbal Espacial
A. Verbal (0.97)
R. Espacial 0.21 (0.92)

M. 2: A. Verbal 0.78 0.09 (0.95)


Composic.
R. Espacial 0.10 0.82 0.22 (0.89)
Profa. Carmen Delgado

Coeficientes de fiabilidad: (sombreado gris )


Coeficientes de validez convergente: (en negrita )
Coeficientes de validez discriminante:
- heterorrasgo monométodo: 0,21 y 0,22
- heterorrasgo heterométodo: 0,10 y 0,09

También podría gustarte