Está en la página 1de 9

El proceso de la construcción de un test

1. El test como instrumento de medición objetiva


Un test psicológico es un procedimiento de medida objetiva y estandarizada de una muestra
de comportamientos:
• La medida mediante el desarrollo y la administración de tests es objetiva, no subjetiva.
• La medida que pretenden los test es estandarizada, es decir, dependen de un procedimiento
establecido de administración, corrección e interpretación.
• Los test se enfrentan a los fenómenos psicológicos no observables mediante una muestra
de comportamientos.
La dificultad intrínseca que representa la medida indirecta mediante tests es la naturaleza
no observable de los fenómenos psicológicos.
• El valor de un test se encuentra en su capacidad para suscitar y medir comportamientos que
resulten un buen indicador –es decir, una buena representación– del conjunto global de
comportamientos implicados en los fenómenos de interés.

1.1 Clasificación de los test


Los test podemos clasificarlos en función de algunas de sus características más importantes:
• Según el propósito:
✓ La diagnosis: orientada a la evaluación de las condiciones actuales de los individuos.
✓ La predicción: se propone relacionar la medida actual con el comportamiento de las
personas en situaciones futuras.
• Según el contenido:
Según el área de la psicología a la que pertenecen los fenómenos psicológicos que pretenden
medir. En el nivel más general podemos distinguir básicamente tres grandes grupos, que
incluirían los tests orientados a la evaluación de las habilidades cognitivas, la personalidad
y las actitudes.
• Según el formato:
Es frecuente distinguir los tests de lápiz y papel, de manipulación y de medidas fisiológicas.
Los tests computerizados, a pesar de que no usan el papel, podrían ser incluidos en esta
categoría en cuanto que exigen algún tipo de respuesta escrita mediante dispositivos
electrónicos.
• Según el tipo de administración:
El modo como son administrados nos permite distinguir los tests individuales y grupales.
También podemos distinguir los tests verbales y no verbales, en función de si se hace o no
una presentación oral o escrita del test y sus instrucciones.
• Según el tratamiento de las respuestas:
✓ Pruebas de ejecución máxima: si evalúan el acierto en las respuestas para determinar
la competencia, la aptitud o los conocimientos de los individuos.
✓ Pruebas de ejecución típica: si tratan de evaluar motivaciones, preferencias, opiniones
o actitudes.
• Según la interpretación de las puntuaciones:
✓ Los tests normativos: permiten comparar la puntuación del individuo con la ejecución
observada en un grupo de referencia que previamente ha respondido al mismo test.

1
✓ Los tests referidos a criterio: toman como referencia la definición de un dominio de
conocimientos o habilidades específicos y permiten medir la ejecución del individuo no
ya en comparación con un grupo de referencia, sino en función de su grado de
adecuación o consecución de este criterio.
• Según el estatus comercial:
✓ Los tests propietarios o comerciales: son tests que requieren el pago para su uso e
incluyen los ejemplares del propio test y un manual que contiene información sobre su
desarrollo y sus propiedades psicométricas, las hojas de corrección de las respuestas y
las tablas para interpretar las puntuaciones en relación con los grupos de referencia.
✓ Tests abiertos o no comerciales: generalmente se pueden obtener contactando con el
autor, que normalmente también ha desarrollado algún tipo de manual que
contextualiza el test. En algunas ocasiones esta información queda reducida a la
publicación de un artículo científico en el que el autor lo introduce, realiza una primera
administración y presenta sus propiedades psicométricas.

2. Plan para la elaboración de un test


Un instrumento de evaluación debe construirse de forma rigurosa para que sea adecuado para
el uso a que está dirigido.
La elaboración de un test es una tarea laboriosa que requiere de la colaboración entre expertos
en el constructo a evaluar y expertos en medición.
Los tests pueden desarrollarse en el marco de dos grandes modelos:
• Teoría Clásica de los Tests (TCT).
• Teoría de Respuesta al Ítem (TRI).

2.1 Definición del atributo a medir


A partir del propósito del test y del dominio o constructo que se pretende medir se desarrolla el
marco sobre el que comenzará el diseño del test
Para comenzar con la elaboración del test:
• Se parte del constructo que se pretende medir.
• Se especificarán las conductas que revelarán esos constructos.
• Qué tareas o situaciones elicitarán dichas conductas.
El fenómeno o constructo que intentamos reflejar en una escala se denomina variable latente
que se caracteriza porque no es directamente observable, pero creemos que es la causa de las
respuestas a los ítems construidos para medirlo.
Es una variable, es decir, su fuerza o magnitud cambia y esto es precisamente lo que la escala
pretende estimar, la magnitud actual para cada persona, en el tiempo y lugar de la medida.
Una tarea fundamental para medir un determinado constructo es la definición precisa del
mismo, así como también lo han de estar sus facetas y dominio. Es el primer paso y,
probablemente, el más difícil en el proceso del desarrollo de escalas de medida.
Todo constructo está basado en un marco teórico, disponer de una teoría bien especificada, se
convierte en un elemento imprescindible.
Una revisión exhaustiva de la bibliografía puede revelar intentos anteriores de medir el
constructo, y las fuerzas y debilidades de esos intentos.

2
El proceso de construcción de tests guiado por la teoría es el más recomendable y el único que
llevará a tests con fuertes evidencias de validez de constructo.
Una vez delimitado el constructo, habrá que especificar las principales conductas observables
representativas del constructo (dominio o atributo de interés) e identificar las tareas mentales
o procesos que el sujeto debe realizar en la materia particular, tales como recuerdo, análisis,
aplicación, descubrimiento, etc.
En psicología se parte de un modelo teórico en el que se inscribe el constructo y una serie de
conductas observables ligadas a éste.
Si el dominio teórico no está suficientemente especificado, suelen recomendarse actividades
como:
• Análisis de contenidos: se plantean preguntas abiertas a los sujetos sobre el constructo
de interés clasificándose posteriormente en categorías.
• Revisión de las investigaciones publicadas.
• Estudio de incidentes críticos: consiste en la identificación de conductas que
caracterizan a los extremos del constructo de interés.
• Realización de observaciones directas.
• Entrevistas con informadores clave.
• Grupos de discusión.
• Juicios de expertos o a través de los objetivos instruccionales o de programas de
intervención.

2.2 Objetivos del test


1. Un primer paso es considerar cuál es la población a la que está destinado y el tipo de
decisiones que se tomarán con las puntuaciones obtenidas.
2. Determinar la edad de los sujetos.
3. Decidir si el test se aplicará a todos los sujetos o a grupos seleccionados de alguna forma.
4. Definir los requisitos de lenguaje que deben tener los sujetos.
5. Con respecto a los posibles usos de las puntuaciones:
a) Para tomar decisiones relativas al nivel de instrucción o habilidad: determinar si los
sujetos poseen dominio de ciertos conocimientos o destrezas predeterminados de
antemano.
b) Para tomar decisiones de diagnóstico: identificación de fallos o deficiencias en el
comportamiento para emprender alguna intervención o tratamiento.
c) Decisiones de selección: selección de los sujetos más capaces en algún sentido o
materia.
d) Decisiones de asignación: determinar en qué lugar debe colocarse una persona dentro
de una jerarquía.
e) Decisiones de clasificación: asignar a los sujetos a ciertas categorías pero, en este caso,
las asignaciones son de tipo en lugar de nivel.
f) Decisiones de consejo: orientar al sujeto con respecto a algún aspecto de su
comportamiento futuro.
g) De screening (detección rápida): detección rápida de algún tipo de trastorno, deficiencia
o anomalía.

3
2.3 Restricciones del test
Cualquier test debe plantearse siempre dentro de unos límites:
• El tiempo de aplicación, ya que los sujetos solamente pueden disponer de un tiempo
limitado para la realización del test. (existe una estrecha relación entre la longitud del
test y la fiabilidad de las puntuaciones). Aclaración: ya lo veremos más adelante, pero
cuanto mayor es la longitud del test, mayor es la fiabilidad de este.
• La modalidad de aplicación del test: si será aplicado de forma individual, colectiva,
informatizada, etc.
• Los materiales a utilizar durante la realización del test, tales como calculadoras,
diccionarios, materiales de laboratorio, etc.

2.4 Especificación de los contenidos


La especificación del contenido de test comienza determinando cuál es su dominio de
conductas.
Hay ocasiones en las que el constructo no está claramente definido y, por lo tanto, no se tiene
una idea clara del conjunto de las áreas de conductas a través de las cuales se puede manifestar.
Para solucionarlo:
a) Podemos hacer un análisis del contenido del constructo: haciendo preguntas abiertas
a los sujetos acerca del constructo y seleccionando las respuestas que aparecen con
mayor frecuencia como relevantes para la definición del mismo.
b) Revisar las investigaciones publicadas: una revisión de los trabajos realizados con
anterioridad acerca del constructo, y de los instrumentos de evaluación existentes,
pueden constituir un buen marco de referencia.
c) Realizar un análisis de tareas: para elaborar una lista de conductas críticas que
posteriormente se puede utilizar para la evaluación del rendimiento.
d) La observación directa por parte del constructor del test le permitirá identificar
conductas relacionadas con el constructo a medir.
e) Utilizar el juicio de expertos: las opiniones de aquellas personas que ya hayan trabajado
en el constructo de interés pueden resultar muy valiosas.
f) Revisar los objetivos instruccionales o de programas de intervención: la revisión de los
contenidos de los programas y/o de los textos u otros materiales permite establecer una
serie de objetivos que han de evaluarse en el test y que especifican una serie de
conductas que deberán mostrar los sujetos.

2.5 Especificación del formato


El propósito del test y el dominio o constructo a evaluar también impondrá ciertas restricciones
al formato de los ítems.
Entre los posibles formatos de respuesta, ordenados de menor a mayor elaboración requerida,
encontramos:
• Elección múltiple: el sujeto ha de elegir entre un conjunto limitado (entre 3 y 5) de
respuestas posibles.
• Selección o identificación: el sujeto ha de elegir entre un número de respuestas posibles
pero, a diferencia del anterior, el número es grande, evitándose de esta forma el efecto
del azar.

4
• Ordenación del material estimular: el sujeto ha de disponer los estímulos en la
secuencia correcta, por ejemplo, ha de ordenar frases o dibujos para que sigan una
secuencia lógica, expresiones matemáticas, etc.
• Sustitución/corrección: el sujeto ha de sustituir algún elemento por una alternativa
correcta. Corregir errores gramaticales u ortográficos, corregir sentencias de un
programa de ordenador, etc.
• Completar: el sujeto ha de completar algún estímulo que se presenta de forma
incompleta, como por ejemplo, dar una respuesta numérica a un programa de cálculo,
indicar qué palabra completa una frase, etc.
• Construcción: el sujeto ha de generar la respuesta completa. Por ejemplo, hacer un
dibujo, un ensayo, gráficos a partir de un conjunto de datos, etc.
• Presentación: el sujeto es evaluado bajo condiciones reales o simuladas. Es muy
utilizado en selección de personal, ejemplos de este tipo de formato son las «muestras
de trabajo».

3. Plan de pilotaje
El objetivo es probar el funcionamiento del test, recabando información relativa a los métodos
de recogida de datos, estímulos, materiales y cuestiones, validez y fiabilidad, criterios de
puntuación, etc., que permitirá mejorar el instrumento para la versión definitiva.
La prueba se realizará sobre una muestra de sujetos, que ha de ser de características similares
a la población objetivo.
Es importante recoger la máxima información posible de los sujetos sobre si comprenden las
instrucciones, las cuestiones y los procedimientos de respuesta.
Es importante desarrollar un cuestionario para que los que hacen el estudio piloto recojan las
incidencias y dificultades implicadas, pudiéndose realizar también entrevistas después de la
sesión.
Es importante la recogida del tiempo de realización, para ajustar los tiempos finales.
Normalmente se cuenta con muchos más ítems de los que se usarán. Es decir, hay que elaborar
más ítems de los que formarán el test final, ya que algunos no superarán esta fase.

3.1 Muestreo
Una muestra es el grupo de personas que participan en la investigación.
Las personas que participan se les conoce como "participantes". IMPORTANTE ENTENDER ESTO.
El muestreo es el proceso de selección de los participantes de la población.
La población objetivo es el grupo total de individuos de la que puede extraerse la muestra.
La generalización se refiere a la medida en que podemos aplicar los resultados de nuestra
investigación a la población objetivo que nos interesa.
Estamos interesados en conocer que tienen en común grandes grupos de personas.
La población objetivo puede ser tan amplia como todos los seres humanos, en otros tipos de
investigación la población objetivo puede ser un grupo más pequeño, como los adolescentes,
los niños o estudiantes de Psicología.
Es imposible estudiar cada persona en una población objetivo por lo que es necesario
seleccionar una muestra o subgrupo de la población que es probable que sea representativa de
la población objetivo que nos interesa.

5
Si la muestra que seleccionamos va a representar a la población objetivo entonces tenemos que
asegurarnos que las personas que la forman son similares a los miembros de la población
objetivo no seleccionados.
Uno de los problemas que pueden ocurrir cuando se selecciona una muestra de una población
objetivo es el sesgo de muestreo: se refiere a situaciones en las que la muestra no refleja las
características de la población objetivo.
Métodos de Muestreo:
• Muestreo Aleatorio: todo el mundo en toda la población objetivo tiene la misma
probabilidad de ser seleccionado. Las ventajas es que la muestra representa la población
objetivo pero la desventaja es que es muy difícil de lograr (es decir, tiempo, esfuerzo y
dinero).
• Muestreo estratificado: el investigador identifica los diferentes tipos de personas que
conforman la población objetivo y trabaja en las proporciones necesarias para que la
muestra sea representativa. La muestra a continuación, debe contener todos estos grupos
en la misma proporción que en la población objetivo (estudiantes universitarios). La
recopilación de una muestra de este tipo sería extremadamente lenta y difícil de hacer
(desventaja) sin embargo, la ventaja es que la muestra es altamente representativa de la
población objetivo.
• Oportunidad de muestreo: utiliza personas de la población objetivo disponible en el
momento y dispuestos a participar. Se basa en la conveniencia. Esta es una manera rápida
y fácil de elegir a los participantes (ventaja), pero no puede proporcionar una muestra
representativa, y podría estar sesgada (desventaja).
• El muestreo sistemático: escoge temas de manera sistemática (es decir, ordenada / lógica)
de la población objetivo, al igual que todos los participantes enésimo en una lista de
nombres. Al dividir el número de personas en la población por el número de personas que
desea en su muestra, se obtiene un número que llamaremos n. La ventaja de este método
es que es debería proporcionar una muestra representativa, pero la desventaja es que es
muy difícil de lograr (es decir, tiempo, esfuerzo y dinero).
¿Cuántos participantes se debe utilizar?
• Esto depende de varios factores; el tamaño de la población objetivo es importante. Si
la población objetivo es muy grande, entonces necesitas una muestra bastante grande
para ser representativa.
• Si la población objetivo es mucho más pequeña, la muestra puede ser menor, pero aún
así ser representativa.
Resumiendo:
• Debe haber suficientes participantes para que la muestra sea representativa de la
población objetivo.
• La muestra no debe ser tan grande para que el estudio tarde demasiado tiempo o sea
demasiado caro.

6
3.2 Instrucciones de Administración
Queremos que las personas a las que va a ser aplicado entiendan perfectamente lo que deben
hacer y que estén motivados para hacerlo.
Cada tipo de prueba requerirá unas determinadas instrucciones, pero hay algunas que suelen
ser bastante comunes:
• Evitar el uso del lenguaje ampuloso y amenazante.
• En los tests de ejecución máxima, se debe explicitar que los ítems son de dificultad
variable, que hay algunos que resultarán muy difíciles para todos los sujetos, y que la
prueba está pensada para que haya ejercicios que no se puedan resolver.
• En los tests de velocidad, en los que el tiempo está limitado de manera que sólo muy
pocos lleguen a completar la prueba, se deberá explicitar también en las instrucciones.
• Proporcionar uno o más ítems como ejemplo, para informar a los sujetos acerca de
cómo deben resolver cada uno de ellos y la forma de elegir la solución correcta en caso
de que la hubiera. A veces se incluyen también algunos ítems de práctica, sobre todo si
la población a la que va dirigido el test no está familiarizada con este tipo de pruebas.
• Informar sobre cómo distribuir el tiempo y qué hacer cuando no se conoce la respuesta
a un ítem. Cuando hay tiempo límite para responder a la prueba se debe informar a los
sujetos para que trabajen con rapidez y advertirles de que no desperdicien mucho
tiempo intentando contestar a un ítem cuya respuesta desconocen, ya que es mejor
pasar al siguiente, y que una vez terminada la prueba, si es posible, vuelvan a intentar
resolverlos.
• Las instrucciones deben animar a los sujetos a responder a todas las preguntas y
favorecer así su rendimiento, dado que la puntuación de los sujetos tiende a bajar
considerablemente cuando se dejan muchas respuestas en blanco. En los ítems de
elección múltiple se puede sugerir a los sujetos una doble estrategia, en primer lugar se
les puede decir que traten de encontrar la alternativa correcta y, en caso de que no la
puedan identificar, que traten de identificar una o más alternativas erróneas,
eliminarlas, y analizar las alternativas restantes seleccionando una de ellas.
• Dado que muchas pruebas se corrigen hoy día mediante hoja de lectora óptica, o se
aplican a través del ordenador, las instrucciones deben explicitar claramente la forma
de responder en ellas.

3.3 Formato de presentación y organización del test


Hay que organizar y ordenar los ítems seleccionados para su posterior presentación a los sujetos:
• El formato de presentación debe ser claro y legible, evitando que se puedan cometer
errores involuntarios como por ejemplo saltarse una pregunta, confundir la casilla de
respuesta, etc.
• Solicitar al comienzo de la prueba los datos de identificación de las personas, su
nombre, apellidos, datos de contacto, etc. o, en el caso en el que se requiera el
anonimato de los sujetos, utilizar una clave de identificación.
• A continuación deben presentarse las instrucciones para la realización de la prueba,
siguiendo las pautas establecidas en el punto anterior.
• Después de las instrucciones se presentan los ítems: en las pruebas diseñadas para
medir variables cognitivas (conocimientos, aptitudes, destrezas ... ) es importante que
los ítems estén ordenados en función de su nivel de dificultad. Si al principio de la

7
prueba se pusieran ítems difíciles es posible que muchas personas se sintieran
desmotivadas y dejaran de responder. En las pruebas diseñadas para medir variables no
cognitivas, en las que a veces se incluyen preguntas que pueden resultar embarazosas,
es necesario cuidar que éstas no aparezcan al principio de la prueba ya que los sujetos
pueden darla por terminada nada más empezar al negarse a contestar.
• Cuando un mismo test incluye ítems de varios formatos conviene que aparezcan
agrupados los de un mismo formato para no provocar desconcierto en los sujetos.
• Hay que tratar de que los ítems sigan una ordenación lógica. Las preguntas referidas a
un mismo tema deben situarse unas a continuación de otras de manera que los sujetos
no tengan que ir saltando de un tema a otro.

3.4 Registro de respuestas


La forma de registrar las respuestas de los sujetos va a influir en:
• Las instrucciones.
• El formato final del test.
Se puede optar porque los sujetos respondan en la misma hoja o cuadernillo del test o, por el
contrario, se puede optar porque respondan en una hoja aparte que les será entregada junto
con la hoja o cuadernillo del test. (La ventaja es que los tests pueden ser reutilizados).
La hoja de respuesta puede ser una hoja de lectora óptica que facilita la corrección de la prueba.
En los tests informatizados el registro de las respuestas se hace a través del ordenador.

4. Plan de asignación de puntuaciones y análisis de datos


Una vez establecido el formato de respuesta que se considera más apropiado para cada caso, y
de cara al estudio psicométrico de la prueba, es preciso decidir la manera de cuantificar los
posibles resultados a las cuestiones y su posterior análisis estadístico.

4.1 Asignación de puntuaciones


Para los ítems de cuestionarios de rendimiento óptimo se cuantificará con 1 el acierto y con 0
el error, de tal manera que la puntuación directa de un sujeto en un cuestionario determinado
será igual al número de ítems que ese sujeto acierta.
La cuantificación de las respuestas a ítems de pruebas de rendimiento típico requiere ciertos
matices:
• Dado un formato de respuesta determinado (opción binaria, categorías ordenadas o
adjetivos bipolares) es necesario cuantificar las posibles respuestas a un ítem teniendo
en cuenta que la alternativa con mayor valor sea la que indique mayor nivel de rasgo,
aptitud y opinión.
• Si el formato de respuesta es de “n” categorías ordenadas, las diversas categorías se
cuantificarán normalmente desde 1 hasta n, teniendo en consideración (como en el caso
anterior) la dirección de la afirmación o cuestión.
• En estos casos, la puntuación directa de un sujeto en un test (o subtest) resulta de sumar
las cantidades asignadas por el constructor de la prueba a las diferentes respuestas que
el sujeto ha emitido; según esto, convendría cuantificar las diversas alternativas con
valores entre 1 y n para evitar una puntuación directa negativa.

8
4.2 Análisis de datos
Hasta hace poco tiempo, la mayoría de los análisis estadísticos requeridos para estudios
psicométricos se hacían con la ayuda de calculadoras.
En la actualidad se dispone de una variedad de programas informáticos que simplifican
enormemente estas tareas y permiten la realización de análisis cada vez más poderosos y
sofisticados.
En este apartado nos referiremos a algunos análisis psicométricos que emplean el SPSS aunque
existen otros programas para realizar análisis más específicos, tales como el BILOG para la teoría
de respuesta al ítem, y EQS, AMOS y LISREL para el modelo de ecuaciones estructurales.

También podría gustarte