Está en la página 1de 19

PSICOMETRA

PSICOMETRA
Carlos Camacho M. Vara de Rey
E. Francisco Snchez Garca
M. Snchez Garca

INDICE

0.- Introduccin

.........................................................6

1.- La medicin psicolgica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


1.1.- Definicin y objeto de estudio de la Psicometra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.- Introduccin a la Teora de la Medida. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.- El error de medida. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1.- Tipos de errores de medida y sus consecuencias . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2.- La estimacin del error aleatorio en la validacin de teoras . . . . . . . . . . . . . . . . 13
1.3.- Conceptos de fiabilidad y validez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.- La Teora Clsica de los Tests y su extensin Congenrica . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.- Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.- Fundamentos de la Teora Clsica de los Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.- Definicin de Coeficiente de Fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.- Modelo de medida en Puntuaciones Directas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.- Modelos de medida en Puntuaciones Estandarizadas . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.- Fiabilidad...........................................................
3.1.- Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.- Procedimientos basados en dos aplicaciones del test . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1.- Test-retest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.2.- Formas paralelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.- Procedimientos basados en una nica aplicacin del test . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1.- Dos mitades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1.1.- Frmula de Rulon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1.1.- Frmula de Flanagan y Guttman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.4.- Coeficiente Alpha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.4.1.- Alpha con elementos dicotmicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.- Fiabilidad desde la perspectiva del anlisis de la varianza . . . . . . . . . . . . . . . . . . . . . . . .
3.5.- Coeficientes de Consistencia interna basados en resultados de Anlisis Factorial. . . . . .
3.5.1.- Coeficiente Theta de Carmines y Zeller (1979) . . . . . . . . . . . . . . . . . . . . . . . . .
3.5.2.- Coeficiente Omega de Heise y Bahrnstedt (1970) . . . . . . . . . . . . . . . . . . . . . .
3.6.- Fiabilidad de un test compuesto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7.- Factores que afectan al coeficiente de fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7.1.- Fiabilidad y variabilidad de la muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7.2.- Fiabilidad y longitud del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7.3.- Fiabilidad y limitacin del tiempo de aplicacin del test . . . . . . . . . . . . . . . . . . . . .
3.7.4.- Fiabilidad y caractersticas del tem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8.- Valoracin de los distintos coeficientes de fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.- Validez.
..........................................................

4.1.- Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.- Validez referida al criterio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1.- Validez y fiabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2.- Validez y longitud. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.3.- Validez y variabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.3.- Validez de contenido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.1.- Evaluacin de la validez de contenido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.- Validez de constructo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.1.- Evaluacin de la validez de constructo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.1.1.- Anlisis factorial exploratorio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.1.2.- Modelos estructurales como validez de constructo. . . . . . . . . . . . . . . . . . . . . .
4.4.1.3.- Matriz multirrasgo-multimtodo (MMRMM). . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.1.4.- MMRMM analizadas con modelos estructurales. . . . . . . . . . . . . . . . . . . . . . . .
4.5.- Prcticas de validez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1.- Validez referida al criterio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1.1.- Prediccin del criterio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1.2.- Validez y Fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1.3.- Validez y longitud del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1.4.- Validez y variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.2.- Validez de constructo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.2.1.- Anlisis factorial exploratorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.2.2.- Anlisis factorial confirmatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.2.3.- Modelos de estructuras de covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.2.4.- Evidencias de validez convergente y discriminante . . . . . . . . . . . . . . . . . . . . .
4.5.2.4.1.- Matrices MRMM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.2.4.2.- Validez Conv. y Disc. a travs de modelos de estructuras de covar . . . . .
4.5.3.- Otros ficheros para prcticas de depuracin de tems, fiabilidad y validez . . . . . . .
4.5.3.1.- Listado de ficheros de prcticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.- Procedimiento general de construccin de una prueba o test . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.- Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.- Identificacin del Objetivo para el que se utilizarn las puntuaciones . . . . . . . . . . . . . . .
5.3.- Definicin del constructo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.- Descripcin general de los componentes del constructo . . . . . . . . . . . . . . . . . . . . . . . . . .
5.5.- Diseo del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.5.1.- Nmero de tems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.5.2.- Tipo de tems y nmero de alternativas de respuesta . . . . . . . . . . . . . . . . . . . . . . . .
5.5.3.- Cmo cuantificar las alternativas de respuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.6.- Redaccin de los tems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7.- Anlisis de la calidad de los tems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7.1.- Juicio de expertos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7.2.- Anlisis estadstico de los tems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7.2.1.- ndices descriptivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7.2.2.- ndice de discriminacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7.2.3.- ndices mixtos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7.2.4.- A modo de conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.8.- Estandarizacin y Baremacin del test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.8.1.- Baremos referidos a la Norma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.9.- Prcticas de depuracin de tems y fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
APNDICE
..........................................................
Frmula 1.5. El error de medida en el modelo de regresin y sus consecuencias . . . . . . . . . . .

Frmula 4.13 Coeficiente Alpha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


Apartado 2.6. Redaccin de los tems: Consideraciones prcticas para la construccin
de tems. Taxonomas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A) Taxonoma de Bloom. Su instrumentacin para definir objetivo . . . . . . . . . . . . .
instruccionales o evaluables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
B) Instrumentos de evaluacin para las habilidades claves. . . . . . . . . . . . . . . . . . . .
REFERENCIAS BIBLIOGRFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

0.- INTRODUCCIN
Estos apuntes han sido previstos en el programa de la asignatura de Psicometra (curso 20062007) como una ayuda o gua para los alumnos que cursan los estudios de Psicologa de la
Universidad de Sevilla.
Cuando se aborda el tema de la docencia en reuniones o congresos del rea de metodologa los
autores se pronuncian como partidarios de una docencia muy prctica, conceptual e intuitiva; que
haga uso de los avances matemticos, estadsticos e informticos, pero sin demostraciones ni
justificaciones sobre los mismos.
En este sentido: Al igual que antiguamente el conductor de un coche deba saber revisar y reponer
los distintos niveles del vehculo, cambiarle la polea al ventilador, cambiar una rueda, etc. y hoy da
los coches vienen preparados para que ninguna de estas cosas haya que hacerlas tan frecuente ni tan
inexcusablemente; en la misma linea presentaremos una asignatura de Psicometra eminentemente
prctica y en la que slo se desarrollarn los fundamentos matemticos en aquellos casos que los
consideremos necesarios para la comprensin del tema. As lo que antes costaba ms trabajo al
tenerlo que hacer con calculadora, papel y lpiz; actualmente, con los avances de la informtica, el
ordenador lo hace en el mnimo tiempo y sin ningn esfuerzo. As pues con la ayuda de la
informtica quizs no sean tan engorrosas las aplicaciones psicomtricas, ni haya que basar la
docencia en frmulas y clculos que, por otra parte, el alumno nunca va a tener que realizar a mano.
Para solucionar algunos problemas didcticos surgidos del seguimiento de una secuenciacin
basada en el proceso cronolgico de construccin de un test este curso seguiremos una secuenciacin
ms clsica y habitual en otras facultades de Psicologa: Despus de un tema 0" de tipo
introductorio en el que se presenta el programa, el plan didctico, la definicin y los contenidos de
la disciplina, pasamos a un tema 1" que planteo el problema de la medicin en las ciencias humanas
y sociales y en Psicologa en particular, un tema 2 el que se presentan de forma sucinta los
postulados fundamentales de la Teora Clsica de los Tests ( en adelante TCT), un 3 en el que se
desarrollan los dintos procedimientos tanto de recogida de datos como de clculo para contrastar la
cualidad fiabilidad de los tests, un tema 4 en el que se aborda la difcil contrastacin de la validez
de los tests, y, para terminar, la aplicacin de todo lo anterior al proceso de construccin de un test
como la mejor estrategia para que las puntuaciones globales con l obtenidas sean tiles para
nuestros objetivos.

1.- LA MEDICIN PSICOLGICA


1.1.- Definicin y Objeto de estudio de la Psicometra
Como su propio trmino indica (definicin etimolgica) Psicometra es la disciplina que
desarrolla todos los aspectos relacionados con la medida (metra) de la psique (psico).
Como los atributos psicolgicos no son abordables de
forma directa para medirlos, podemos decir que la
Psicometra tiene como objeto material la medida de la
psique a travs de los comportamientos psicolgicos externos
de sujetos o grupos sociales (ver fig. 1.1.). Por lo tanto, el
objeto material de la medicin psicolgica y
consecuentemente de la psicometra es tan amplio y variado
como lo son la gran variedad de atributos de psicolgicos y de
comportamientos que de ellos se deriven.
Pero la Psicometra no slo se encarga de solucionar el
problema de la medicin de atributos psicolgicos ya
integrados en teoras desarrolladas en otros campos de la
Figura 1.1.- Medida de la psique.
psicologa, sino que, a veces, informa a la psicologa de
determinadas estructuras perceptivas, aptitudinales o de
personalidad 1(ver fig. 1.1).

Figura 1.1. Relacin de la Psicometra con otros contenidos de la titulacin de Psicologa.


(Adaptado de Meli, 1990. p. 19)

De lo afirmado en el prrafo anterior no se desprende que la Psicometra est desprovista de un


objeto de estudio que le sea especfico dentro de la Psicologa. Al igual que ocurre con las disciplinas
1

As, como se puede apreciar en la figura 1.1 existe comunicacin en ambos sentidos entre
aplicaciones psicomtricas y usos psicomtricos.

8 La Medicin Psicolgica

mtricas de otras titulaciones (como Fsica, Qumica, Biologa, Astronoma, Medicina, Sociologa
o Pedagoga) la Psico-metra queda delimitada y diferenciada del resto de disciplinas psicolgicas
por su objeto formal: la elaboracin de teoras y la implantacin de metodologas para la medicin
en Psicologa (ver fig. 1.1). As pues lo que delimite el objeto de estudio especfico de la Psicometra
no es el atributo que se mide en cada caso (objeto material) ni el resultado de la medida (uso
psicomtrico) sino la fundamentacin terica que justifica el uso de determinadas metodologas
para medir en los distintos contextos psicolgicos que se presenten, esto es el objeto formal de la
psicometra.
Dentro la especialidad de Psicologa se pueden encontrar otras disciplinas relacionadas con la
tarea de la medida, el diagnostico o la evaluacin de personas en las muy distintas manifestaciones
del comportamiento individual o colectivo ( p.e. Psicodiagnstico, evaluacin escolar, ... etc), pero
el campo de la Psicometra queda delimitado por su matiz metodolgico que la hace responsable de
la fundamentacin, elaboracin y evaluacin de las distintas pruebas y tcnicas de medicin
psicolgica. As pues, resumiendo todo lo anterior, la Psicometra tiene como objeto propio el
estudio de los distintos aspectos tericos (Teora Psicomtrica) en los que se basan las Aplicaciones
Psicomtricas (Meli, 1990), consistentes en la construccin de escalas de medida que despus
pueden ser utilizadas para medir a cualquier sujeto y/o estmulo de la poblacin en la que se ha
obtenido la muestra representativa para ensayar, depurar y calibrar el test (ver figura 1.1). En el
mismo sentido Olea (1989) atribuye a la psicometra el objetivo de elaborar mtodos para y teoras
sobre la medicin psicolgica. En un intento de delimitar an ms el objeto de estudio de la
Psicometra, Ponsoda (1984) afirma que la elaboracin de modelos formales con la finalidad de
investigar algn sector de la psicologa entrara dentro del campo de la psicologa matemtica,
mientras que si esos modelos formales se plantean como finalidad el escalamiento de algn tipo de
comportamiento ms que su comprensin, estamos dentro del campo de la Psicometra.
Por el lado prctico de la disciplina psicomtrica conviene distinguir la aplicacin y el uso
diagnstico de un test (uso psicomtrico) de la propia construccin, adaptacin o contrastacin de
las bondades psicomtricas (Teora y Aplicaciones Psicomtricas) de dicho test (ver fig. 1.1). Las
aplicaciones psicomtricas tratan del proceso de elaboracin de un instrumento de medida
siguiendo la teora psicomtrica del modelo de medida correspondiente. Los usos psicomtricos
tratan de la utilizacin con fines de diagnstico de un instrumento de medida construido
previamente. Los usos psicomtricos no son Psicometra pero se nutren de los productos de las
aplicaciones psicomtricas (ver figura 1.1.) y proporcionan, a su vez, a la psicometra masas de datos
que depuran sus instrumentos de medida; as como peticiones que requieren investigaciones de las
que se obtengan productos (aplicaciones psicomtricas) que se necesiten en un momento dado. En
el mismo sentido, la Psicometra hace uso de herramientas matemticas y estadsticas (ver fig. 1.1.)
planteadas en otras asignaturas metodolgicas; as como proporciona, para un posible uso
metodolgico general, modelos y tcnicas que se descubrieron, en principio, para solucionar
necesidades psicomtricas.
Cualquier libro que consultemos y que trate sobre la construccin de instrumentos de medida o
sobre el diseo de situaciones de medida, tratar de concienciarnos de la gran dificulta de la
medicin psicolgica, al tratar de abordar criterios o atributos internos al sujeto y, por lo tanto, no
puestos de manifiesto de forma directa sino indirectamente, esto es, a travs del comportamiento.
Se suele poner la Fsica como ejemplo de reas del saber que no tienen este problema, debido a que
sus medidas las realizan sobre atributos considerados externos. Esto explica que en el campo de la
solucin de los problemas metodolgicos de la medicin psicolgica las mayores aportaciones hayan
sido hechas por psiclogos, especialmente en el campo de la Teora Clsica de los Test. El modelo
lineal aditivo propio de la Teora Clsica de los Tests es un tipo de escalamiento muy adecuado a las
necesidades y posibilidades del comportamiento psicolgico en cuanto al nivel de escala de medida
que con dicha teora (TCT) se obtiene.

Introduccin a la Teora de la Medida 9

Resumiendo, despus de esta contextualizacin de la asignatura se puede entender mejor la


definicin de la Psicometra como la disciplina que trata de los distintos modelos y tcnicas de
escalamiento. Entendiendo por escalamiento el proceso emprico por el que, a travs de una muestra
de sujetos1, elaboramos una escala o regla con la que podemos medir posteriormente a cualquier
sujeto de la poblacin.

1.2.- Introduccin a la teora de la medida


Los distintos modelos de teora de la medida (Campbell, 1928, 1938; Stevens, 1946, 1951; Scott
y Suppes, 1958; y Suppes y Zinnes, 1963) imponen restricciones a la medicin cuantitativa que la
hacen inasequible en Psicologa, aunque til a la Fsica (Carmines y Zeler, 1994) . Habra que
redefinir la tarea de medir para las ciencias psicosociales en aquellos casos en los que no se cumplen
los requisitos exigidos por Stevens en su clasificacin de las escalas de medida. En este sentido la
medida hay que considerarla como el proceso de ligar los conceptos abstractos de las teoras o
constructos con indicadores empricos. O de otra forma, como la puesta en prctica de un plan
sistemtico, explcito, para clasificar, y, en la mayora de los casos, cuantificar los datos
particulares en trminos de los conceptos ms generales del esquema terico2.
En este sentido, la medicin es un proceso que implica tanto consideraciones tericas como
empricas. Desde el lado emprico tenemos las repuestas observables -las respuestas marcadas en un
test o cuestionario, el comportamiento registrado en un estudio observacional, etc -. Del lado
terico, tenemos conceptos no observables directamente3 o constructos, que estn representados
operativamente por los comportamientos observables o indicadores medidos a travs de tests,
cuestionarios u observacin directa. La tarea de medir es establecer los lazos entre ambos lados: el
terico y el emprico.
Los psiclogos que observan la conducta humana aprecian ciertas regularidades a lo largo del
tiempo, y en diferentes contextos, para muchos sujetos. Dado que frecuentemente no se conocen los
procesos psicolgicos que ocurren en el interior de cada sujeto (Prieto, 1997), se interpretan estas
regularidades como constructos o especulaciones tericas hipotticas (Osterlind, 1989). Estos
constructos suelen concretarse en algn tipo de aptitudes o actitudes, rasgo de personalidad o de
rendimiento. Pero la operativizacin o definicin semntica (Lord y Novick, 1968) de estos
constructos psicolgicos tiene algunos problemas (Osterlind, 1989) que queremos analizar:
- No hay un procedimiento aceptado universalmente para medir un constructo. As, por ejemplo
para conocer la habilidad de los sujetos de dividir por varias cifras: unos pueden optar por elegir
tems con divisiones por distinta cantidad de dgitos, otros pueden preguntar por la secuencia de
pasos que seguira el sujeto, otros podran pedir la deteccin de errores en divisiones
desarrolladas, etc.
- Con cualquiera de estos procedimientos el test estara constituido por una muestra limitada de
tems.
- La unidad de medida utilizada (nivel de medida) puede ser distinta en cada caso.
- Adems, como consecuencia de todo ello, las medidas estn sujetas a un cierto margen de error.
Por todo ello, suele ser aconsejable no conformarse con la definicin operativa del constructo,
dada su subjetividad, y ratificarla a posteriori con una definicin estructural (Bollen, 1989) o
1

Frecuentemente tambin los tems son una muestra representativa de un universo de posibles tems
que constituyen el dominio psicolgico (atributo) a medir.
2
Dawes (1975) se refiere a este proceso de ligar el constructo con sus indicadores medicin de
ndices. Nunnally y Bernstein (1995) ponen en boca de Bollen y Lennox este tipo de relacin causal entre el
constructo como causa interna y los indicadores como manifestaciones comportamentales externas.
3
A los que nos solemos referir con trminos como constructo, componente, dimensin, factor, etc.

10 La Medicin Psicolgica

sintctica (Lord y Novick, 1968) que relacione el constructo con otros constructos o variables
observadas de su entorno psicolgico. Esto aporta algunas garantas sobre la validez de los tests, pero
no est exento de problemas que trataremos posteriormente en un tema especfico sobre validez.
En resumidas cuentas, queremos precisar que el objetivo que perseguimos a la hora de medir es
el de elaborar indicadores empricos de los constructos tericos objeto de medida. Para ello es
importante disponer de las pertinentes definiciones tanto sintcticas o estructurales como
semnticas u operativas de dichos constructos, para as construir grupos de tems -se entiende que
agrupados por constructos- que sean relevantes y representativos1.
1.3.- El error de medida.
1.3.1.-Tipos de errores de medida y sus consecuencias
Como no siempre se es lo suficientemente cuidadoso en la medicin de las variables psicolgicas.
Esta fase de medicin de variables psicolgicas (constructos), previa a todo anlisis estadstico
descriptivo o inferencial, condiciona de manera importante los resultados de toda investigacin. Si
no se realiza adecuadamente el proceso de medicin, quedarn desvirtuadas de manera significativa
las conclusiones psicolgicas obtenidas. En estas circunstancias, qu valor tendrn nuestras
decisiones? Estaramos cometiendo errores de medida que haran ms confusa loa teora subyacente
al comportamiento psicolgico.
El trmino error de medida comprende errores de muy diferente naturaleza. Aqu, distinguiremos,
de acuerdo con Jenck y colaboradores (1979, pgs.. 34-36), tres tipos de errores fundamentales: a)
conceptuales, b) sistemticos y c) aleatorios.
Los errores conceptuales son consecuencia no tanto de medir mal una determinada variable
cuanto de medir equivocadamente otra en su lugar. Se trata de un problema relativamente frecuente
en psicologa donde no suele estar muy claro qu es lo que estamos midiendo. Ocurre, por ejemplo,
cuando utilizamos una prueba de razonamiento o de vocabulario como expresin de la inteligencia,
o bien cuando tomamos los ingresos como indicador del nivel social. Son errores que quedaran
enmarcados dentro del tema de la validez, que estudiaremos ms adelante.
Los errores sistemticos son aquellos que siempre se producen en una misma direccin. Por
ejemplo, una prueba puede medir siempre de ms, o bien, todos los individuos de un grupo han
realizado un cierto test con diez minutos menos del tiempo especificado en el manual, o bien, un
encuestador induce sistemticamente a una determinada respuesta. Todas estas situaciones darn
lugar a respuestas sesgadas que repercutirn en los valores estimados como resultado del anlisis.
Es obvio que la estadstica como tal poco tiene que hacer con este tipo de errores, donde slo cabe
ser cuidadoso en la planificacin y desarrollo del proceso de medicin.
Tanto los errores conceptuales como los sistemticos son errores sistemticos, ya que se cometen
sistemticamente y en el mismo sentido con todos los sujetos2. El mejor ejemplo de error sistemtico
es el de el ejemplo de tiro a de la figura 1.6, en pag. 18, en el que todos los disparos dan
sistemticamente por encima de la diana. Pero no todos los errores sistemticos son conceptuales
sino que son ms procedimentales (no seguir las consignas de estandarizacin del test) que
conceptuales.

Dichos aspectos (relevancia y representatividad) de los tems sern desarrollados en los temas de
validez y de construccin de una prueba.
2
Qu ocurre con aquellos tests cuya medida favorece sistemticamente a unos grupos o estratos y
perjudica a otros? No son errores aleatorios sino que son errores conceptuales y por lo tanto sistemticos. As
ocurre con los tests que pretenden medir inteligencia general sin influencia cultural, pero cuyas medidas estn
sesgadas en detrimento de tnias como gitanos y negros (con menor nivel cultural).

Introduccin a la Teora de la Medida 11

Por ltimo, los errores aleatorios son consecuencia de los mltiples factores desconcocidos que
inciden en toda medicin y que introducen en la misma una cierta variabilidad, como en las dianas
b y c de la figura 1.5.
A diferencia de los errores sistemticos, los errores aleatorios no guardan relacin alguna con el
atributo objeto de la medida. Se supone que estos errores aleatorios unas veces actan en un sentido
y otras en otro, de forma tal que se compensan entre ellos (los positivos con los negativos) y a la
larga su suma vale cero. Posiblemente un determinado sujeto tenga la misma inteligencia hoy que
maana, pero si le aplicsemos el mismo test en ambos das, presumiblemente obtenga puntuaciones
diferentes. Variables tales como estado de nimo, cansancio, grado de adivinacin, errores de
codificacin ..etc, puedan afectar a los resultados de la prueba aplicada. Tales errores hacen
referencia a la precisin de las medidas y entran dentro del terreno de la fiabilidad, que ser objeto
de estudio en estos temas.
Los errores conceptuales y los errores sistemticos son consecuencia fundamentalmente de un
diseo defectuoso del proceso de medicin. En el caso de los conceptuales, planteamientos tericos
ms rigurosos en torno a la naturaleza del constructo es lo que se hace exigible, mientras que en los
sistemticos, se hace necesario una mayor estandarizacin de aquellas circunstancias que inciden en
la medicin, en el sentido de mantener su constancia en todo momento.
Los errores aleatorios, aunque pueden reducirse con una mejora en el diseo de medida, nunca
pueden ser eliminados por completo. Estos errores aleatorios son inherentes a las caractersticas de
la medicin psicolgica. Nunca sern controlados en su totalidad, por lo que la estadstica ha de
hacerse cargo de ellos. Su naturaleza de "aleatorios" con sus supuestos de media cero e
incorrelacin los hace idneos para ser tratados estadsticamente y conocer su cuanta, cuestin
que es ms difcil de cuantificar en los otros tipos de error.

1.3.2.- La estimacin del error aleatorio en la validacin de teoras.


La existencia de error conceptual en la medicin de un constructo implica la imposibilidad de
validar teora alguna en la que participe dicho constructo. Dicho de otra forma cuando un modelo
(teora) estructural de medida no resulta vlido puede ser porque dicha teora sea falsa o porque
algunos de los constructor integrados en ella se miden con error conceptual, que es lo mismo que
decir que miden otro constructor distinto y que por lo tanto no se comporta como el que
pretendamos medir ni es integrable en la misma teora que aqul.
Los errores sistemticos en sentido estricto, esto es aquellos que implican sumar o restar una
constante a todos los sujetos a los que se mide con un test, no tiene ningn efecto sobre el modelo
o teora estructural que se pretende contrastar.
Sin embargo la estimacin y posible atenuacin de errores aleatorios como son los errores
aleatorios de medida reflejados en la fiabilidad de los tests, siempre posibilita dejar como ms
evidente o clara la estructura o teora relacional que se da entre los constructos. La no
contemplacin de los errores aleatorios en la medicin psicolgica tiene el mismo efecto sobre la
manifestacin de la teora subyacente, que el que la niebla tiene para visualizar un coche (p.e.) o
que el que el ruido de fondo tiene sobre la audicin de una meloda musical.
As podemos comprobar a modo de ejemplo (ver fig. 1.3) cmo la estimacin de la fiabilidad con
la que se miden dos atributos psicolgicos permite mostrar con mayor evidencia la parte estructural
o de verdadera relacin subyacente entre los constructos.

12 La Medicin Psicolgica

Figura 1.3.- Comparacin de los grficos a, b y c para comprobar cmo disminuye el parmetro de
regresin en la medida en que no controlamos el error de medida.

Pero hay que ser precavidos porque al atenuar los efectos del azar (falta de fiabilidad) cualquier
teora asume parmetros relacionales ms altos. Lo hay que ver es que se trate de una teora
substantiva y de que se ajuste a los datos empricos.

1.4.- Conceptos de Fiabilidad y Validez.


De los errores que hemos visto anteriormente hay dos tipos que no interesan especialmente: los
conceptuales y los de medida (aleatorios). El error conceptual lo identificamos como la diferencia
entre lo que tiene un sujeto de lo que medimos con el test y lo que tiene el sujeto de lo que
pretendemos medir con el test (Vx-Vy), mientras que el error de medida lo identificamos como la
diferencia entre la medida emprica y verdadera de dicho sujeto en el atributo que se mide con el test
(X-Vx). Asociados a estos dos tipos de error nos encontramos con las dos cualidades principales de
los tests a las que vamos a dedicar mayor espacio en esta asignatura: validez (Vx-Vy) y fiabilidad (XVx). As pues, resumiendo, toda medida ha de ser til para medir lo que nos proponemos en cada
caso (validez) y no otra cosa por error conceptual, y adems ha de medirlo con precisin y no con
error de medida (fiabilidad).
A partir de ahora nos vamos a centrar en el concepto de fiabilidad como precisin, concepto que
se manifiesta en dos situaciones distintas: como cercana entre lo que medimos y lo que tiene el
sujeto de lo que medimos (fiabilidad absoluta) y como cercana entre medidas repetidas de un mismo
constructo a un mismo sujeto ( fiabilidad relativa). As pues, tenemos el concepto de fiabilidad
absoluta como precisin y de fiabilidad relativa como estabilidad de medidas. Pero en Psicometra
esta cualidad de la fiabilidad, que puede asumir diferentes grados o niveles, ha de poder fijarse con
un nmero o valor cuantitativo que nos de una idea ms precisa del grado en el que una medida es

Introduccin a la Teora de la Medida 13

fiable (ndice de fiabilidad). En este sentido, los indicadores o ndices que ponen de manifiesto estos
conceptos de fiabilidad absoluta y fiabilidad relativa los vamos a llamar ndice de fiabilidad y
coeficiente de fiabilidad. Segn lo dicho, el ndice de fiabilidad sera el nmero que pone de
manifiesto la cantidad de fiabilidad absoluta, y coeficiente de fiabilidad sera el nmero que pone
de manifiesto la cantidad de fiabilidad relativa.
Pero conceptuar la fiabilidad directamente como error de medida (X-V) es problemtico por dos
motivos: su magnitud sera distinta cada vez que se mide con un mismo test, y, adems su clculo
es imposible al desconocerse la puntuacin verdadera.
El primer problema se evitara calculando el error cuadrtico medio (o su raz cuadrada) de los
posibles ensayos de medida. Pero, an suponiendo que el error tpico de medida fuera calculable (no
olvidemos el segundo problema), su valor no tendra un significado estandard sino que dependera
de la unidad de medida en la que el test ofrece las puntuaciones directas. Este problema se soluciona
dividiendo

S e2 S x2 . Con lo cual tenemos la proporcin de error en las medidas como el mejor

indicador de la falta de fiabilidad de un test (ver ecuacin 1.6). No se puede ni imaginar el paciente
lector cul fue nuestra sorpresa al llegar a la conclusin anterior, pues coincide con lo q ue vamos
a estudiar en el tema tres como proporcin de varianza no asociada o proporcin de error en las
medidas realizadas con el test, que es igual a 1" menos la proporcin de acierto o de varianza
asociada ya que ambas proporciones son complementarias y suman 1".

Se

2
Sx

'

j (Xi&Vi)
N
2
Sx

'

j (Ei)
N
2
Sx

(1.6)

2
2

'

Se

2
Sx

'ex'1&vx

Pero no se
desespere el lector si le decimos que ninguna de las expresiones de la igualdad anterior son
calculables empricamente ya que tratan con errores y puntuaciones verdaderas de cada sujeto, que
son trminos desconocidos para el psicmetra humano y por lo tanto sin poderes divinos. Para que
no cunda el pnico, os informamos que la solucin, que argumentaremos tambin en el tema tres,

est en que vx es igual a xx que es lo que vamos a llamar coeficiente de fiabilidad como indicador
de la fiabilidad relativa. Y su raz cuadrada, que no es otra cosa que volver a puntuaciones no
cuadrticas lo que en su origen elevamos al cuadrado para obtener la varianza, es igual al ndice de
fiabilidad que es el concepto del que partimos en el prrafo anterior. Y dado 1.6 tenemos que

xx = 1

ex2 +

Resumimos los pasos seguidos en este apartado. El concepto de fiabilidad absoluta siempre ir
unido al de error de medida, pero como el error de medida es fluctuante preferimos como indicador
la varianza de los errores. Como esta varianza depende de la escala de medida en que estn los
errores dividimos estos por la varianza del test o varianza de las puntuaciones empricas y obtenemos
un indicador estandard de la varianza de los errores en trminos de proporcin de varianza error (ver
ecuacin 1.6) Calculamos su complementario o proporcin de varianza acierto. Para reconvertir
dicho indicador a puntuaciones no cuadrticas (puntuaciones directas) calculamos su raz cuadrada
y obtenemos el nmero que vamos a utilizar como indicador de la fiabilidad absoluta o ndice de
fiabilidad. Tambin se ha explicado que como dicho indicador no puede ser calculado
empricamente, se obtiene a partir de raz cuadrada del coeficiente de fiabilidad.

14 La Medicin Psicolgica

As pues, la fiabilidad, en cuanto precisin, es un concepto que no puede ser conocido


empricamente en trminos absolutos (Fiabilidad Absoluta), si entendemos por precisin el grado
de correspondencia entre la medida emprica y la magnitud real, que llamaremos verdadera, de
aquello que estamos midiendo. As, por ejemplo, sera preciso un examen que reflejara fielmente los
verdaderos conocimientos del alumno sobre los contenidos del examen. Es obvio que la nica
informacin de la que disponemos en cualquier medida es la propia puntuacin observada, mientras
que desconocemos la verdadera magnitud de lo medido. Es por ello que se recurre a otro concepto
de fiabilidad (Fiabilidad Relativa) que nos permite saber de forma indirecta si estamos midiendo
con cierta precisin, ya que la fiabilidad relativa depende, como veremos despus, de la fiabilidad
absoluta. En este sentido, como no conocemos cules son los conocimientos de los sujetos
(puntuacin verdadera) si no es a travs de su medida en un examen, para apreciar el grado de
precisin del examen tendr que examinar dos veces al sujeto y deducir la precisin del examen de
su estabilidad cuando se mide una misma cosa (p.e. los conocimientos de Periquito Prez). Del
mismo modo que detectamos la fiabilidad (precisin) del tirador haciendole disparar repetidas veces
a una diana (ver figura 1.6).
Hemos definido la Fiabilidad Absoluta como el
acuerdo o correspondencia entre la puntuacin que
verdaderamente posee el sujeto en el atributo (V) y la
puntuacin observada como resultado de la medicin
(X) (ver en figura 1.4. su identificacin como
correlacin (xv) o efecto (xv)) Que es en los modelos
Figura 1.4.- Diagrama path de la
estructurales la dependencia entre el comportamiento
Fiabilidad Absoluta
y el factor o rasgo latente aptitudinal o de
personalidad.
La Fiabilidad Relativa (ver figura 1.5) hace referencia a la estabilidad o consistencia en las
medidas. Aqu el trmino "fiabilidad" corresponde a su significado coloquial o ms frecuente. As,
se suele decir que es fiable aquello que se mantiene
constante en situaciones semejantes (como debera
ocurrir con la nota del examen). Un test cualquiera
(como p.e. un examen) es fiable si cada vez que se
aplica a los mismos sujetos en las mismas
circunstancias proporciona los mismos resultados.
Y es a partir de la constancia como inferimos la
precisin del instrumento, que es el concepto que
realmente nos interesa; cuanto ms constante estable- , ms preciso. Como en la figura 1.6.
cuanto ms cercanos entre s estn los disparos
ms fiable es el sujeto que dispara. Fiabilidad se
identifica con estabilidad y ausencia de fiabilidad
con variabilidad, porque suponemos que la
Figura 1.5.-Diagrama path de la fiabilidad relativa
puntuacin verdadera estar dentro del rango de
variabilidad observada, y deduciremos que
estamos midiendo con mayor precisin cuanto menor sea la fluctuacin entre las puntuaciones
observadas en circunstancias iguales.

Introduccin a la Teora de la Medida 15

Figura 1.6. cuatro pruebas de tiro distintas tanto en variabilidad alrededor del centro como en centrado
respecto de la diana. (Adaptado de Trochin, 1997, pag. 1)

Si nos preguntamos qu relacin hay entre ndice y coeficiente de fiabilidad, la respuesta queda
insinuada en las pginas anteriores cuando hemos hablado de precisin versus estabilidad de las
medidas, proporcin de variabilidad verdadera en trmino de desviaciones tpicas versus proporcin
de variabilidad verdadera en trminos de varianza. Esto es xv versus xx .
2

xx('xvxv 'xv
xv ' xx(

(1.7)

Efectivamente, como se puede comprobar aplicando la regla del trazado1 en la figura 1.5, como
se puede apreciar, el coeficiente de fiabilidad es igual al producto del ndice de fiabilidad de la
medida de X por el ndice de fiabilidad de la medida de X , lo que es igual al cuadrado del
ndice si ambos ndices son iguales (ver ecuacin 1.7). Para una mejor comprensin de esta regla se
puede poner la analoga de la teora de la informacin aplicada a un ejemplo: Supongamos que un
padre narra a sus dos hijos (X y X) la novela recientemente filmada como pelcula Ala triste,
despus de un tiempo se evala de alguna forma el porcentaje del mensaje emitido retenido por cada
nio. El porcentaje de aspectos retenidos comunes para ambos nios es igual al producto del
porcentaje de recuerdo -precisin- de X por el porcentaje de recuerdo precisin de X*. Ms
adelante al presentar la teora clsica de los test necesitaremos recurrir al supuesto de medidas
paralelas, de igual fiabilidad de ambas medidas, para poder estimar el ndice de fiabilidad a partir
del coeficiente de fiabilidad (ver ecuacin 1.7). En la visin congenrica de la Tora Clsica de los
Tests (TCT) propia de los MEM no es necesario asumir esta restriccin de paralelismo de las
medidas (Batista y Coonders, 2000).

Que especifica, a este respecto, que un efecto complejo es igual al producto de los efectos simples
que lo constituyen.

16 La Medicin Psicolgica

El concepto de validez es algo ms complejo, aunque no lo parezca en esta primera aproximacin


que hemos ofrecido. Parece una obviedad sin ms complicaciones afirmar como hemos hecho que
"una medida es vlida si es til para medir aquello que pretende". Segn esta definicin, un metro
es vlido para medir longitudes y una balanza lo es para medir pesos. Y no parece necesario en este
contexto replantearse la validez del metro o de la balanza, ya que las magnitudes fsicas estn ah,
al alcance de la mano. Esto es que el valor verdadero del objeto (tamao o peso) se percibe
directamente con los sentidos y puede resultar fcil apreciar la covariacin entre las medidas
obtenidas y el dicho valor verdadero. Pero en psicologa las cosas cambian sustancialmente porque...
Dnde est aquello que pretendemos medir? Realmente, tal test mide la inteligencia? No medir
razonamiento o fluidez verbal? Y cuando mido ansiedad, estoy seguro de que no estar midiendo
depresin?
En psicologa la cuestin es que las variables ms que darse en la naturaleza (peso, longitud,
densidad) son variables creadas por nosotros mismos (esto no quiere decir que sean arbitrarias o
irreales como esperamos poder mostrar). Se trata de conceptos -constructos- constituyentes de una
teora. En estas circunstancias, supongo que el lector estar de acuerdo en que es ms difcil saber,
cuando medimos, qu es exactamente lo que estamos midiendo. En una primera aproximacin,
estamos considerando la validez (que llamamos terica) como la correspondencia entre lo que tiene
el sujeto de lo que medimos y la magnitud en la que posee el concepto o constructo que se pretende
medir. Pero dado que el concepto o constructo que se pretende medir no se suele conocer
empricamente y sin error, est claro que las evidencias sobre validez de las medidas obedece ms
a consideraciones tericas que empricas. As en el tema cinco, ms que presentar un ndice
incuestionable de la validez de un test, presentaremos distintos tipos de evidencias de validez en
funcin del uso que habitualmente se de a dicho test.
Por lo que respecta a la fiabilidad de las medidas, no nos preguntamos qu estamos midiendo sino
con cuanta precisin. Este grado de precisin es fcil de determinar (indirectamente) por la
constancia de los resultados. Hay un aspecto cuantitativo, emprico, al cual aferrarse como criterio
de fiabilidad. Por el contrario, en la validez, el "qu se mide" otorga a la cuestin una dimensin
cualitativa, dependiendo la validez de nuestra especial consideracin sobre lo que son las cosas, esto
es dependiendo de nuestro criterio de validez.
As, si recurrimos al ejemplo de los disparos de un tcnico a una diana (ver figura 1.6) con un
rifle, nos encontramos con una situacin anloga a lo que ocurre cuando un psiclogo evala un
atributo a un sujeto en repetidas ocasiones a travs de un test. El psiclogo es el tcnico, el test es
el rifle y el centro es el valor del sujeto en el atributo que se pretende medir. La cercana entre los
puntos de cada nube es equiparable a la estabilidad entre las medidas -coeficiente de fiabilidad-. La
cercana entre la nube de puntos de cada diana se deber tanto a caractersticas del rifle (Qu pasara
si fuera de goma) como a fluctuaciones en el pulso del que dispara. As la falta de estabilidad entre
las medidas puede deberse tanto a imprecisiones en la materia prima que son los tems como a
fluctuaciones en las distintas circunstancias de aplicacin entre las que la actuacin del psiclogo
es fundamental. Por otra parte, por lo que respecta a la validez, la cercana entre el centro de la nube
y el de la diana es equiparable a la relacin o cercana entre lo que en realidad mide el test y lo que
se pretende medir con su uso. Posibles explicaciones de falta de validez del rifle seran el tener alto
o bajo el punto de mira as como disponer de un can curvado, de igual forma veremos muchas
explicaciones de faltas de validez pero todas ellas englobables como errores conceptuales al
confundir nuestro objetivo de medida con lo que en realidad medimos.
As pues, los conceptos de fiabilidad y validez son diferentes e independientes por lo que respecta
a la validez terica como correspondencia entre el verdadero nivel del sujeto en lo que medimos y
en lo que pretendemos medir. Pero, dado que esta validez terica es difcil de contrastar,
frecuentemente hacemos uso de la validez emprica de los tests con respecto a determinados criterios.
Es en este sentido en el que se suele decir que una deficiente fiabilidad hace que tambin se muestre
baja la validez emprica, aunque una baja validez emprica se puede producir por baja fiabilidad o

Introduccin a la Teora de la Medida 17

por baja validez terica. Nos serviremos de algunos ejemplos tpicos y tpicos para explicar el hecho
de que la fiabilidad es condicin necesaria aunque no suficiente para que se produzca validez
emprica.
As, si representamos en un diagrama causal la medida emprica en el test como X; el constructo
que en realidad mide el test o puntuacin verdadera en el test como Vx; el constructo o criterio que
se pretende medir con el test como Vy y la medida emprica del criterio por Y; entonces, segn las
siguientes figuras; podemos encontrarnos con distintas situaciones en las que, utilizando la regla del
trazado del path anlisis, la validez emprica ( xy ) es igual al ndice de fiabilidad del test ( xv )
x

multiplicada por la validez terica ( v

xvy

) y multiplicada por la fiabilidad del criterio ( yv ).


y

Figura 1.7.- Validez emprica baja con baja validez terica y alta fiabilidad

En las dos figuras 1.7 y 1.8 presentamos, a modo de ejemplo, dos casos con resultados parecidos
por lo que respecta al valor de su coeficiente emprico de validez pero opuestos por lo que respecta
a su configuracin de fiabilidades y validez terica. As, en la figura 1.7, se representa el caso
supuesto de que medimos la inteligencia de las personas en base a la longitud de cierta lnea de la
mano izquierda. Est claro que aunque midamos con gran rigor dicha lnea de la mano ( xv = 0.8 )
x

e, incluso, midamos con un test muy preciso la inteligencia ( yv y = 0.98 ), de poco nos servir (para
despecho de los quiromnticos) pues parece ser que la relacin estricta de dicha linea de la mano con
. ). Este es un ejemplo de baja validez
la inteligencia de los sujetos es bastante baja ( v x v y = 010
emprica como consecuencia de baja validez terica -ver figura 1.7-. Algo parecido ocurre en la
prueba de tiro a de la fig. 1.6. Su autor tiene gran pulso (precisin en el disparo) pero no es
consciente de que en lugar de al centro sus disparos van por sistema a la parte superior de la diana.
En resumidas cuentas en este ejemplo el problema es la baja validez del arma para dar al centro de
la diana y de las lineas de la mano para el diagnstico de la inteligencia.
Igualmente, puede ser baja la validez emprica ( xy = 0.0882 ) (ver figura 1.8) por existir una baja
fiabilidad del test ( xv

= 010
. )

-igualmente hubiera sido baja la validez emprica por baja

fiabilidad del criterio-, aunque sea alta la validez terica ( v x v y = 0.98 ). As ocurre si medimos la
inteligencia de un sujeto con un test muy malo, en el que un da se le indica que es un genio y al
siguiente que es un deficiente mental (suponemos que no le ha pasado nada grave de un da para
otro). De poco nos servir este test para conocer la inteligencia de dicho individuo (supongamos que
el valor criterial ha sido obtenido con una buena prueba) . Algo parecido a lo anterior suele ocurrir

18 La Medicin Psicolgica

Figura 1.8.- Validez emprica baja con alta validez terica y baja fiabilidad
con los tests proyectivos, por gozar de una (supuesta) gran validez terica, pero de una gran
imprecisin en la medida (baja fiabilidad). As como ocurre en la prueba de disparo b, en la que
el arma est bien centrada (es vlida para dispara al centro de la diana) pero el sujeto que dispara es
muy inestable o el can es de plstico. En este mismo sentido, los diagnsticos obtenidos con los
tests proyectivos o las entrevistas personales parecen instrumentos muy adecuados para medir la
complejidad del ser humano, pero la subjetividad de sus diagnsticos los hace poco fiables.

Figura 1.9. Validez emprica alta exige altas fiabilidades de tests y criterio, y altavalidez terica o validez
en sentido estricto.

Por ltimo, vase en la figura 1.9 cmo una alta validez emprica, implica tanto fiabilidades como
validez terica, o validez en sentido estricto, buenas. Si un test de inteligencia, por ejemplo, predice
de forma rigurosa el rendimiento en un examen ( xy = 0.84 ), es porque hay precisin en las
medidas de ambos constructos ( xv

= 0.95 y yv y = 0.9 ),

y estricta validez o utilidad del

constructo-inteligencia de ese test para predecir los conocimientos que mide el examen
( v x v y = 0.98 ).

Introduccin a la Teora de la Medida 19

Para concluir, es evidente que una dbil o fuerte ligazn entre X y Vx as como entre Y y Vy, no
afecta de ninguna forma a la validez terica o validez en sentido estricto ( v v ), mientras que
x y

fiabilidades relativamente bajas de test o criterio s reducen xy .


Esto es, para que X e Y estn fuertemente relacionados, tambin lo estarn necesariamente
los pasos intermedios (recordemos la regla del trazado). Habr de ser alta tanto la dependencia de
X con respecto a su constructo Vx -ndice de fiabilidad del test- , como de Y con respecto al
suyo (Vy) -ndice de fiabilidad del criterio-, as como de un constructo con respecto a otro ( v v ).
x y

En resumidas cuentas, con la fiabilidad y la validez ocurre como cuando el ruido nos impide or la
meloda, as como cuando la niebla nos impide ver la figura de un coche que se acerca por la
carretera; una baja fiabilidad nos puede oscurecer la validez terica con una baja validez criterial
emprica.
Con este primer tema de introduccin a la psicometra, y en especial con su apartado de
introduccin a la medicin psicolgica, hemos querido poner de manifiesto la importancia del
proceso de medicin en Psicologa. Por eso, a continuacin, vamos a dedicar un captulo a los
conceptos de fiabilidad (cap II) y otro (cap III) al de validez, as como a sus manifestaciones
prcticas y operativizaciones. Por ltimo terminaremos con la presentacin, todo lo prctica que sea
posible, del proceso adecuado de construccin de un test para que tenga las aludidas cualidades
(fiabilidad y validez).