Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Validez de Un Instrumento - Carlos Riego
Validez de Un Instrumento - Carlos Riego
FACULTAD DE FILOSOFÍA
CARRERA DE PSICOLOGÍA
AREA BÁSICA
en Investigación Cuantitativa
¿Qué es valido?
• En lenguaje cotidiano decimos que es válido si es
sólido, si está bien fundado en principios y evidencias.
• En términos legales cuando es “ejecutado con las
formalidades apropiadas”. Ej. Contrato válido,
testamento válido. Es la significación o grado de
veracidad de algo.
• En lenguaje de Evaluación Psicológica, Validez es un
término usado conjuntamente con la significación de
una puntuación de prueba.
Concepto de Validez
• La palabra validez cuando se aplica a una prueba se
refiere a un juicio concerniente a lo bien que mide de
hecho una prueba lo que pretende medir.
• De manera específica, es un juicio basado en evidencia
sobre lo apropiado de las inferencias extraídas de las
puntuaciones de prueba.
• ¿Qué es inferencia? Es un resultado lógico o
deducción en un proceso de razonamiento.
• Las características de validez de las pruebas y las
puntuaciones de prueba son expresadas con
frecuencia con términos “aceptable” o “débil”.
• En un juicio de validez hay inherente un juicio de
utilidad de un instrumento de medición. “Útil desde el
punto de vista científico” (Nunnally, 1978, p.86)
• Entonces ¿Qué es Validación?
Es el proceso de recopilación y valoración de la
evidencia de validez.
Tanto quien elabora la prueba como el administrador
de la misma pueden desempeñar una función en la
validación de una prueba para un propósito específico.
OBS: Es responsabilidad del elaborador de la prueba
suministrar evidencia de la validez en el manual de la
misma.
En ocasiones puede ser apropiado para los
administradores de la prueba realizar sus propios
estudios de validación con los grupos de personas que
responderán la prueba. Estos estudios de validación
“local” son necesarios cuando el usuario de la prueba
planea alterar de alguna manera el formato,
instrucciones, lenguaje o contenido de la prueba.
Los estudios de validación local también serían
apropiados cuando la prueba será usada con una
población de personas que difiere de alguna manera
significativa de la población en la que fue
estandarizada.
¿Cómo se procede a valorar la validez de una prueba?
Respuestas:
1- Autoestima. 4- Extroversión.
2- Ideación suicida – Depresión. 5- Extroversión.
3- Habilidades Sociales. 6- Introversión.
• Por otra parte, una prueba de personalidad en la que
la responden se les hacen preguntas sobre una
variedad de manchas de tintas puede ser percibida por
lo general como una prueba con validez aparente baja.
• Pueden preguntar:
¿Cómo dicen que vieron en mis respuestas a las
manchas de tinta algo que tiene que ver en realidad
con la personalidad?
Ejemplo: Persona bajo la lluvia (Aparición de paraguas
en el dibujo relacionado con baja tolerancia a la
frustración), Rorschach, Test de los Colores, etc.
• A diferencia de los juicios concernientes de la
confiabilidad de una prueba y a la validez de
contenido, constructo o relacionada con un criterio de
una prueba, los juicios concernientes a la validez
aparente de una prueba son considerados con
frecuencia desde la perspectiva de quien responde la
prueba en oposición a la del administrador de la
prueba.
Ejemplo: La falta de Validez Aparente podría contribuir a
una falta de confianza con respecto a la efectividad
percibida de la prueba, con una disminución
consecuente en la motivación de quien la responde
para hacer su mejor esfuerzo.
• Su preocupación podría derivarse de una creencia de que
dichas pruebas dará como resultado conclusiones
inválidas.
• Desde la perspectiva del administrador de la prueba, la
Validez Aparente también puede ser importante ya que
contribuye (o deja de contribuir) a la confianza del
administrador en la prueba.
VALIDEZ DE CONTENIDO
• Es un juicio concerniente a lo adecuado del muestreo
que hace una prueba del comportamiento
representativo del universo de comportamiento del
que la prueba estaba diseñada para tomar una
muestra.
•Ítem 1:
•Ítem 2:
ne – N/2 5 – (10/2) 5-5 0
CVR = = = = = 0,00
N/2 10/2 5 5
CVR = Razón de Validez de Contenido.
ne = número de expertos que indican “esencial”.
N = Número total de expertos.
•Ítem 3:
•Ítem 4
ne – N/2 9 – (10/2) 9-5 4
CVR = = = = = 0,80
N/2 10/2 5 5
• Cuadro 6.1: Valores mínimos de la razón de validez de
contenido para asegurar que es improbable que el
acuerdo se deba al azar.
Número de
Valor mínimo
expertos
5 .99
6 .99
7 .99
8 .85
9 .78
10 .62
11 .59
VALIDEZ DE CRITERIO
• Es un juicio respecto a lo adecuado que puede ser el
uso de una puntuación de prueba para inferir la
posición más probable del individuo en alguna medida
de interés, siendo la medida de interés el criterio.
• Dos tipos de evidencias de validez se incluyen bajo el
encabezado de “Validez con base en Criterios”:
1° Validez Concurrente y 2° Validez Predictiva.
• 1° Validez Concurrente: Es un índice del grado en que
una puntuación de prueba se relaciona con alguna
medida criterio obtenida al mismo tiempo (en forma
concurrente).
• 2° Validez Predictiva: Es un índice del grado en que
una puntuación de prueba predice alguna medida
criterio.
Pero…. ¿QUÉ ES UN CRITERIO?
Un Criterio puede definirse como la norma contra la
cual es valorada una prueba o una puntuación de
prueba.
• Desde el punto de vista operativo un criterio puede
ser cualquier cosa:
Ejemplo: Número de ventas de un producto, ficha clínica
con el Dx. de un paciente, notas de un colegio,
desempeño laboral, índice de ausentismo, puntaje de
una prueba, cantidad de tiempo, etc.
• La fórmula se lee como sigue: el coeficiente de validez
es menor o igual que la raíz cuadrada del coeficiente
de confiabilidad de la prueba multiplicado por el
coeficiente de confiabilidad del criterio.
Número
Suspenso Aprobado Notable Sobresaliente
de casos
90 o más 11 22 67
Entre
8 25 50 17
80 y 89
Puntuación a
Entre
mitad de 23 46 31
70 y 79
curso
Entre
33 67
60 y 69
59 o
67 33
menos
Fuente: Urbina, S. (2007, pp. 138-139)
¿Qué tan alto debería ser un coeficiente de validez para
que un administrador o un elaborador de pruebas
infieran que la prueba es válida?
•No hay reglas para determinar el rango mínimo
aceptable de un coeficiente de validez. De hecho,
Cronbach y Gleser (1965) advirtieron contra el
establecimiento de tales reglas.
•Afirmaron que los coeficientes de validez no necesitan
ser tan elevados.
• Debe permitir al administrador de la prueba tomar
decisiones precisas dentro del contexto único en el
que se está usando una prueba.
• En esencia, el coeficiente de validez debería ser lo
bastante alto para que conduzca a la identificación y
diferenciación de personas que responderán la prueba
con respecto a un atributo o atributos deseados.
• Validez incremental: Los administradores de pruebas
implicados en la predicción de algún criterio a partir de
puntuaciones de prueba a menudo están interesados
en la utilidad de pronosticadores múltiples.
• El valor de incluir más de un pronosticador depende
de un par de factores: 1° Validez predictiva (Ya
explicado) y 2° Validez incremental.
• 2° Validez incremental: Es el grado en que un
pronosticador adicional explica algo de la medida
criterio que no estaba explicado por los otros
pronosticadores.
Ejemplo: Cuando se predice algo como el éxito
académico.
Un estudio de pronosticadores potenciales del
promedio de calificaciones puede revelar:
a) tiempo pasado en la biblioteca, Correlacionan con
b) tiempo dedicado al estudio y el promedio de
calificaciones
c) cantidad de horas de sueño.
Entonces ¿Cuál es la forma más eficiente de predecir el
promedio de calificaciones?
•Empleando un enfoque con los principios de la validez
incremental, es comenzar con el mejor pronosticador, el
pronosticador que se correlaciona de manera más alta
con el promedio de calificaciones.
Ejemplo: El tiempo dedicado al estudio. Entonces,
utilizando técnicas de regresión múltiple, uno analiza la
utilidad de los otros pronosticadores.
•OJO: Aún cuando el tiempo pasado en la biblioteca se
correlaciona de manera alta con el promedio de
calificaciones, puede no poseer validez incremental si se
superpone demasiado con el primer pronosticador.
• Dicho de otra manera, si el tiempo dedicado al estudio
y el tiempo pasado en la biblioteca se correlacionan de
manera tan alta entre sí que reflejan en esencia lo
mismo, entonces sólo uno de ellos necesita incluirse
como pronosticador; incluir ambos proporcionaría
poca información nueva sobre uno solo.
• En contraste, uno puede encontrar que la cantidad de
sueño durante los exámenes tiene buena validez
incremental debido a que refleja un aspecto diferente
de la preparación para los exámenes (descansar) que
el primer pronosticador (estudiar).
• La validez incremental se utiliza para mejora la
predicción.
Tiempo
Promedio de Tiempo en la
dedicado al
Calificaciones biblioteca
estudio
Tiempo en la
0,78 * 1 0,96 **
biblioteca
Tiempo
dedicado al 0,80 * 0,96 ** 1
estudio
Horas de sueño
0,67 * 0,12 - 0, 23
(descanso)
Enfermedad
Presente Ausente
Positiva Verdaderos positivos Falsos positivos Total de pruebas positivas
Prueba
Negativa Falsos negativos Verdaderos negativos Total de pruebas negativas
= a+c b+d N
Sensibilidad Especificidad
* CISNEROS = Cuestionario Individual sobre Psicoterror, Negación, Estigmatización y Rechazo en Organizaciones Sociales.
VALIDEZ DE CONSTRUCTO
• Es un juicio de lo apropiado de las inferencias
extraídas de las puntuaciones de prueba respecto a
posiciones individuales en una variable llamada
“constructo”.
• Un constructo es una idea científica informada
elaborada o construida para describir o explicar el
comportamiento.
Ej. Si la prueba es una medida válida del constructo,
quienes obtienen puntuaciones altas y quienes
obtienen puntuaciones bajas se comportarán como lo
predice la teoría.
Evidencia de validez de constructo:
Evidencia de Homogeneidad: La homogeneidad,
también denominada consistencia interna, por lo
general se refiere a lo bien que mide una prueba un solo
concepto.
Evidencia de cambios con la edad: La naturaleza de
algunos constructos es tal que se esperaría que
ocurrieran cambios en ellos a lo largo del tiempo.
Ej. Comprensión lectora, maduración motriz, etc.
Evidencia de cambios preprueba/posprueba: La
evidencia que muestra que las puntuaciones de prueba
cambian como resultado de alguna experiencia entre
una preprueba y una posprueba puede ser evidencia de
validez de constructo.
Ej. Satisfacción matrimonial, medida poco después de
haber contraído nupcias y una posprueba aplicada poco
después de solicitar el divorcio (empleando sólo parejas
que consultaron abogados especialistas en divorcios
para los propósitos del grupo experimental en este
estudio).
Evidencia de grupos distintos: También conocido
como el “método de grupos contrastados”, una forma
de proporcionar evidencia de la validez de una prueba
es demostrar que las puntuaciones en la prueba varían
en una forma predecible como una función de la
pertenencia a algún grupo.
El razonamiento aquí es que si una prueba es una
medida válida de un constructo particular, entonces...
las puntuaciones de prueba de grupos de personas que
se supone que difieren con respecto a ese constructo
tendrían puntuaciones de prueba
correspondientemente diferentes.
Ej. Grupo de “Casos” (pacientes con Depresión) y grupo
de “Control” (estudiantes universitarios sin Depresión).
Evidencia convergente: Puede provenir de diversas
fuentes, como otras pruebas o medidas diseñadas para
evaluar el mismo constructo (o uno similar). Por tanto, si
las puntuaciones en la prueba sometida a validación de
constructo tienden a correlacionarse altamente en la
dirección predicha con las puntuaciones en pruebas
anteriores, más establecidas y ya validadas diseñadas
para medir.....
el mismo constructo (o uno similar), éste sería un
ejemplo evidencia convergente.
Ej. Satisfacción matrimonial con adaptación
matrimonial. Depresión y ansiedad.
Evidencia discriminante: Un coeficiente de validez que
muestra poca relación (estadísticamente insignificante)
entre puntuaciones de prueba y/u otras variables con
las que las puntuaciones en la prueba que se está
sometiendo a validez de constructo no debería
correlacionarse desde el punto de vista teórico
proporciona evidencia discriminativa de la validez de
constructo.
Ej. Neuroticismo y Psicoticismo. Razonamiento verbal y
razonamiento matemático.
Análisis Factorial: La evidencia convergente o
discriminativa de la validez de constructo puede
obtenerse por medio del uso del análisis factorial.
Análisis factorial es un término abreviado singular que
es usado para describir una clase de procedimientos
matemáticos que están diseñados para identificar
factores o variables específicas que comúnmente son
atributos, características o dimensiones en las que
pueden diferir las personas.
Un término empleado por lo común en el análisis
factorial es la carga factorial. La carga de un factor en
una prueba transmite información del grado en que el
factor determina la puntuación o puntuaciones de
prueba.
Referencia Bibliográfica:
Cohen, R. y Swerdlik M. (2001) “Pruebas y
Evaluación Psicológicas”. Editorial McGraw
Hill. 4ª Edic. México.
Hulley S. y Cummings S. (1993) Diseño de la
Investigación Clínica. Editorial Doyma. España.
Urbina, S. (2007) Test Psicológicos. TEA
Ediciones. Madrid.