Está en la página 1de 4

la validez y los instrumentos psicomtricos

el concepto de validez

el sentido ltimo de las escalas psicomtricas es la determinacin de diferencias en un atributo dado entre distintas personas.
tradicionalmente se alude a la validez mediante la pregunta referida a que mide la tcnica y como lo mide.
jams debe darse por sentado que la denominacin de la tcnica responde exactamente al constructo que se pretende evaluar. debemos
contar con pruebas empricas que lo hayan verificado aportadas por los autores del texto mismo as como por otros investigadores que
lo hayan analizado ulteriormente.
la validez de un instrumento se refiere a que esa herramienta sirva para medir aquello que intenta medir.
ya no hablamos de discriminacin confiabilidad y validez como tributos inherentes al test ya que yo crea cierta sensacin de
invariabilidad de permanencia, de fijeza. actualmente nos referimos a la confiabilidad y validez de los resultados arrojados por el test
as como la capacidad discriminativa de sus tems en tales o cuales sujetos que poseen tales y cuales caractersticas determinadas. esto
quiere decir que la validez y la confiabilidad de los resultados no vienen dados con el instrumento sino que se hayan sujetas a ciertas
condiciones referidas especialmente a la variabilidad de la muestra de sujetos que se ha utilizado para poner a prueba justamente la
validez y la confiabilidad de los resultados as como la discriminacin de los tems que componen la escala.
tambin quiere decir que tales atributos vinculados a los resultados arrojados por el instrumento deben ser empricamente
determinados mediante investigaciones cientficas meticulosamente planificadas y desarrolladas, a la vez que tales estudios deben ser
replicados y rediseados a intervalos temporales relativamente cortos, as como cada vez que la prueba se traslade de un contexto
cultural a otro.
cuando un instrumentos psicomtricos estandariza se trabaja este proceso de tipificacin con muestras de sujetos que renan
caractersticas homogneas a las personas a las que se ha destinado esa prueba. la muestra de sujetos sobre la que se realicen las
investigaciones sobre la validez y confiabilidad de los resultados debe estar compuesta por sujetos que sean representativos,
especialmente teniendo en cuenta que cientficos en relacin a la variable evaluada por el test.
las medidas de variabilidad nos indican si las puntuaciones o valores obtenidos por los distintos sujetos que componen la muestra
estn prximos entre s o si por el contrario se encuentran muy dispersas. si la variabilidad es pequea este dato nos informa que la
mayora de las puntuaciones se ubican cerca de la media o promedio.
antes de las ltimas ediciones de estos estndares se hablaba de la validez de los instrumentos psicomtricos actualmente nos
referimos a la validez de las puntuaciones arrojadas por una prueba pero adems se especifica que ya no se trata de la validez del test
sino de evidencias de validez de tal o cual tipo aportadas por tal o cual investigacin desarrollada sobre tales o cuales sujetos.
por lo tanto, sus resultados son provisorios temporarios y sujetos a refutacin y verificacin constantes y en segundo trmino se tiene
muy en cuenta que al diferenciarse varios tipos de validez de las puntuaciones obtenidas por medio de una tcnica no se puede
concluir sin escalas vlida o no sino que debe afirmarse que se han obtenido evidencias de validez de tal o cual tipo en las
puntuaciones derivadas de tal o cual instrumento en tales sujetos y bajo determinadas condiciones.

distintos tipos de validez

es posible distinguir cuatro grandes reas en las que pueden categorizarse las distintas aristas e implicaciones del trmino validez el
rea del contenido el rea emprica el rea terica y el rea formal.

aspectos de la validez vinculados con el contenido del test

este tipo de evidencia de validez se refiere a la verificacin de que la muestra de tems incluida en el test cubra efectivamente todos
los aspectos o dimensiones relevantes de la variable en estudio o a ser medida. implica que no slo debern elegirse elementos claros
y de buena calidad psicomtrica sino que los finalmente incluidos cumplan con el criterio fundamental de no haber descuidado
ninguna de las dimensiones de la variable. ejemplo si la teora segn la que se ha construido el instrumento postura que la variable de
presin se operacionaliza en tres dimensiones: ideacin, componentes psicomotores y anhedonia, pero la primera dimensin posee
mayor importancia en la determinacin de un cuadro depresivo, segun el marco teorico empleado, entonces los tems a ser
seleccionados e incorporados al test deberan aludir a los 3 contenidos mencionados habiendo una mayor cantidad de los vinculados a
ideacin a fin de respetar el cuerpo terico en q se que basa la escala. esta tarea debe ser desempeada por los diseadores
originales del instrumento y posteriormente controlada en aquella instancia que se conoce como juicio experto.
el juicio experto es un procedimiento mediante el que los autores del test convocan un pequeo grupo de expertos en el tema que se
quiere evaluar mediante su nueva escala y si es posible siempre resulta preferible que tal es expertos tengan adems conocimientos de
psicometra.
frecuentemente se califica este procedimiento de juicio experto como un medio subjetivo de aportar evidencias de validez terica
aunque debe destacarse que incluirse varios jueces en l y l fijarse con anterioridad los mrgenes segn los que se separan ofertas a
las modificaciones se asegura una notable disminucin de la subjetividad individual de cada experto sin embargo no puede nunca
hablarse de subjetividad nula en la actividad cientfica.

aspectos empricos de la validez (aspectos de la validez vinculados al criterio)


sin estos resultados no nos encontraremos en condiciones de saber fehacientemente qu mide la tcnica (constructo/variable y
dimensiones) y cmo lo mide (segn qu teora e indicadores).
este tipo de evidencias de validez deben ser establecidas empricamente es decir en base a estudios de campo realizados con rigor
metodolgico y sobre personas concretas. deber contar con un criterio externo, que es una medida de la misma variable que el
instrumento intenta medir, obtenida en forma independiente de aquel, que nos permite verificar empricamente si la escala nos brinda
una informacin semejante a la obtenida mediante esa medicin independiente. el objetivo ltimo de estos estudios es el de aportar
resultados vinculados al uso emprico o prctico del test pero por supuesto el criterio externo que se emplee para llevar a cabo esta
investigacin deber estar sustentado en el mismo marco terico que el instrumento cuyos resultados se desean validar y, por ende,
operacionalizado en forma similar.

la validez concurrente

para probar que esta nueva herramienta aporta los mismos resultados de la observacin de cada alumno ser necesario sector una
pequea investigacin que permita corroborar la equivalencia de tallas resultados. esta actividad ser llevada a cabo por
investigadores y no por el usuario administrador que de todas maneras de ver hallarse suficientemente capacitado para interpretar
adecuadamente los resultados de las mencionadas evidencias de validez emprica.
el investigador deber administrar el test a una muestra de sujetos. a la misma muestra de sujetos se la har objeto de una observacin
sumamente detallada y minuciosamente pautada, que funcionar como criterio externo. ambas vas de evaluacin apuntarn, al menos
hipotticamente, a medir la misma variable y segn el mismo modelo terico.
se emplear un coeficiente de correlacin para valorar el grado en que ambos caminos de evaluacin se hacen asociados es decir
coincidencia es un ndice que nos informa el grado de covariacin asociacin entre dos variables tratndose de una correlacin directa
de signo positivo cuando ambas variables aumentan o disminuyen juntas y siendo la correlacin inversa de signo negativo cuando la
aumentar una de las variables la otra disminuye o viceversa.
independientemente del signo o sentido de la correlacin el grado de disociacin entre las variables consideradas ser mayor cuanto
ms se seque su coeficiente a uno ser menor cuanto ms cerca de ser o se ubique.
una correlacin ser nula igual a cero cuando la asociacin entre las variables sea inexistente por ejemplo la cantidad de dinero que
alguien tiene en el banco y la cantidad de lunares que advierte tener su cuerpo.
tenemos correlaciones no perfecta cuando encontramos asociacin entre dos variables cualquiera sea su signo distinto de cero y
distintas de 1.
de ninguna forma una correlacin an una muy elevada puede interpretarse como una variable causando determinando la otra sino que
simplemente se muestra la asociacin o relacin entre ellas siendo las hiptesis causales terreno diferencias tericas que acceden al
coeficiente de correlacin.
en el caso de un estudio de validez concurrente 7 coeficiente positivo y elevado estar indicando que ambas mediciones criterio y
escala realizadas a una nica muestra el sujeto se arrojan resultados muy similares por lo que ser prcticamente lo mismo me di la
variable de session amerian mediante la prueba o mediante el criterio si se desea conocer estos resultados en un lapso muy breve con
menos esfuerzo se administrar el test.
ejemplos de criterios externo:
calificaciones acadmicas para aportar evidencias de validez de los resultados de la prueba de rendimiento en alguna asignatura
determinada en el nivel universitario de enseanza.
una suv escala de un test de personalidad tmida de presin para brindar evidencias de validez de los resultados de una tcnica que
mira ese mismo constructo en pacientes adultos.
el rendimiento real observado en tareas visomotriz es de coordinacin ojo mano para recabar evidencias de validez de los resultados
aportados por un test de maduracin visomotriz en escolares.
rxy: r simboliza al coeficiente de correlacin r de pearson, x representa las puntuaciones obtenidas en el test por la muestra, de
sujetos en tanto que y representa la puntuacin obtenida por esos mismos sujetos en el criterio externo.
validez y confiabilidad: mientras que la validez emprica (rxy) se dirige a estudiar la relacin entre las puntuaciones arrojadas por el
instrumento y las obtenidas mediante el criterio externo, la confiabilidad (rxx) analiza las puntuaciones al interior de la prueba o las
puntuaciones de esta comparadas con las de una forma paralela de la misma. la validez emprica siempre trabaja en forma externa la
tcnica (criterio externo) en tanto que la confiabilidad lo hace en forma interna examinando la consistencia entre las puntuaciones
obtenidas mediante la escala al interior del conjunto de los tems que la componen o comprando contra una forma paralela del test o
bien comparando las puntuaciones obtenidas en sus administraciones sesin de la tcnica. se compara la prueba consigo misma.

la validez predictiva

un estudio destinado a aportar evidencias de validez predictiva se basa en la idea de intentar verificar que el instrumento administrado
en el presente resulta un buen predictor de otra variable, relacionada tericamente con la que se ha medido, pero distinta, cuyo
comportamiento futuro interesa estimar.
dado que se usa tambin un criterio externo en su procedimiento comparte con la validez concurrente la pertenencia la categora
validez de criterio la diferencia es que la predictiva el criterio se predice y es otra variable, diferente de la medida de antel test, que se
mide futuro. en cambio, en la concurrente, el criterio se mide en el mismo momento, o casi, en que se administra la prueba, y es
la misma variable evaluada por el instrumento pero obtenida por medio de una medicin independiente a la prueba. y, lgicamente,
el rtulo de predictiva obedece a que se intenta predecir el criterio futuro, en tanto que en la concurrente se intenta que concurra o
coincida con los resultados de la escala en el mismo corte temporal. sin embargo, la diferencia lgica entre validacin concurrente
predictiva en los objetivos de la evaluacin se basa en q: mientras que la primera es la elegida cuando la prueba emplearse para
efectuar diagnstico del estado actual, la segunda lo ser cuando el instrumento busque predecir resultados futuros.
la validez predictiva se clasifica dentro de la validez emprica junto con la concurrente porque ambas hacen al uso prctico un pico de
la tcnica, a su utilidad.
el concepto de validez incremental implica conocer el grado en que cada predictor cada test usado para predecir el criterio explica
predice algo de la medida del criterio que no estaba predicho por los otros test o predictores. si se aade en cada paso un nuevo
predictor se incrementa la capacidad de ese grupo de productores -test- para estimar el criterio.

la validez retrospectiva

se vincula con la correlacin verificado entre los resultados de un test administrado en un momento determinado criterio externo
medido con antelacin a la aplicacin del instrumento psicomtrico an aos antes.

otros estudios posibles

estudio por grupos contrastados: el objetivo consiste en demostrar que las puntuaciones arrojadas adquieren valores predecibles en
funcin de la pertenencia de los individuos a un grupo dado.

aspectos de la validez vinculados con el modelo terico que sustenta la prueba

tales aspectos tericos de la validez se circunscriben a que los autores del test u otros investigadores sean capaces de aportar
evidencias de que tal operacionalizacin ha sido efectuada en forma coherente con ese modelo terico y cubriendo todos los aspectos
o dimensiones incluidos en el.
para muchos autores el tipo principal de evidencia de validez, la terica, tambin llamada estructural o de constructo, se dedicar
precisamente responder a la pregunta de si esta tcnica mide efectivamente aquello que dice medir, segn tal o cual modelo terico, y
por lo tanto si la misma es una adecuada operacionalizacin de un constructo terico dado, derivado de ese modelo.
cuando se dice que el conocimiento cientfico es objetivo se alude que es metdico verificable comunicable replicable y lo menos
subjetivo posible.
la validacin de constructo se define como un proceso continuo en tanto requiere de investigaciones desarrolladas y renovadas en
forma permanente. tambin se la puede definir como el grado en que un test mide un constructo en tanto es una buena
operacionalizacin del mismo.

procedimientos ms frecuentes para aportar evidencias de validez de constructo

estudios evolutivos

por ejemplo, si se ha verificado en diversos estudios que los nios aumentan junto con la edad cronolgica su habilidad de
coordinacin visomotriz en tareas de dibujo y reproduccin de formas grficas, un test que hubiera sido construido para evaluar
estabilidad visomotriz debera tambin demostrar mediante sus resultados qu medida que le documentos incrementa tal habilidad de
los nios.

estudios clnicos

x ejemplo, los resultados aportados por el instrumento en pacientes psicticos deberan ser significativamente distintos de aquellos
obtenidos por sujetos no psicticos vase estudios por grupos contrastados. los diferentes aspectos de la validez se relacionan y en
muchos casos como por ejemplo en este es un mismo tipo de estudio podra brindar evidencias as ambas aristas del tema de la
validacin de los resultados aportados por el instrumento.

anlisis factorial

es definido como mtodo de reduccin de datos por el que es posible disminuir la cantidad de datos a ser analizados tenidos en cuenta
a unos pocos factores o variables latentes que podramos tomar como lo que ya conocemos con el nombre de dimensiones de la
variable.
se correlaciona las respuestas de cada tem colas de cada uno del resto de los reactivos, todos los elementos con todos los tems.
nos hablar de su asociacin y de alguna manera de su semejanza. aquellos elementos que han registrado entre s elevado grado de
asociacin se agruparn bajo lo que llamamos un factor, dimension, o variable latente. cada uno de estos factores ser un grupo de
tems que aluden a contenidos relacionados de alguna manera especfica. luego ser tarea de los investigadores determinar cmo
podr etiquetarse un hombre hacia cada factor mediante el minucioso anlisis de los contenidos aludidos en cada uno de los tems que
se han agrupado en ellos.
si la cantidad de factores aislados o identificados y sus contenidos coinciden con la cantidad e identificacin de las dimensiones
previstas en la teora, entonces podr decirse que el test es una adecuada operacionalizacin de tal marco terico, o bien que
mide tal variable segn tal teora x.
la metodologa del anlisis factorial es un procedimiento controvertido ya que existen potencialmente infinitas soluciones factoriales
capaces de explicar un conjunto de datos determinado.

validez convergente y discriminante

dentro de la validez de constructo es posible distinguir dos grandes aspectos las evidencias de validez convergente y las evidencias de
validez discriminante.
evidencias de validez convergente: son aquellas que se recogen cuando los resultados de un estudio de validez de constructo
convergen en un mismo sentido verificando la relacin entre constructos vinculados tericamente. un ndice de correlacin cercano 1
indicar una elevada covariacin o asociacin de ambas dimensiones tericas, sealando su vinculacin. si tal relacin ha sido
prevista por el modelo, entonces estas evidencias reforzarn las afirmaciones postuladas por la teora y, por ende, su capacidad
explicativa sobre una porcin de la realidad.
evidencias de validez discriminante: cuando tengamos coeficientes de correlacin relativamente bajos entre las dimensiones o
constructos diferentes del que se desea medir, que el modelo ha concebido como relacionados tericamente pero con una frecuencia
de aparicin conjunta en la realidad muy escasa. (ej, depresion y mania en cuadros bipolares se relac pero no se superponen)

otros estudios posibles

los meta-anlisis, los estudios de evidencia de cambio pretest-postest, y las matrices multi-mtodo/ multi-rasgo.
matrices multi-mtodo/multi-rasgo: multi mtodo, varios test que miden el constructo que interesa y los otros relacionados. multi
rasgo, todos esos constructos que ya nombramos, el inters y los que con l se vinculan.

aspectos de la validez vinculados con las caractersticas formales de la prueba

la validez aparente tiene que ver con que el instrumento resulte vlido a los ojos del examinado, ya que si los materiales, la consigna,
el estilo de respuesta o las condiciones propuestas para el examen dejan de aparecer como "serias" o adecuadas a su edad o a sus
caractersticas, podra suceder que los sujetos vieron afectadas actitud de respuesta, producindose un efecto contrario a lo deseado en
aras de lograr un buen rapport.

a modo de sntesis de lo hasta aqu desarrollado


(esquema de pp.70)

sesgo y error sistemtico

el sesgo se define como un error constante o sistemtico, como opuesto al aleatorio o azaroso. ese error sistemtico se da siempre de
la misma manera y en el mismo sentido, toda vez que instrumento se administra a algn integrante de ese subgrupo.
un test que funciona en forma diferencial en su grupo de poblacin dado, deja de arrojar resultados vlidos para los miembros del
subgrupo, ya que estas personas obtienen puntuaciones distintas en la medicin de la variable por factores ajenos a ella. es decir. que
sus desempeos no obedecen a diferencias reales en el nivel de la variable a medirse, sino a cuestiones vinculadas con su insercin en
un subgrupo. el concepto de sesgo, relacionado con la validez, se vincula al error sistemtico, en tanto que el de confiabilidad y el de
error de medicin se relacionan con el error aleatorio.

resumen gral
(esq. pp.73)