Documentos de Académico
Documentos de Profesional
Documentos de Cultura
¿QUÉ ES UN TEST?
Un test es un instrumento estandarizado y tipificado que compara conductas de dos o más personas.
Para llevar a cabo este procedimiento de observar la conducta y describirla, los requisitos que cumple
un test son que presente escalas numéricas o categorías establecidas, a todas las personas se les debe
observar bajo las mismas condiciones y debe permitir las comparaciones interindividuales. En
definitiva, los tests son procedimientos de medida cuyo material, forma de administración,
puntuación, corrección y valoración son estándares y de ellos se derivan puntuaciones normativas. El
evaluador por lo tanto, no es necesariamente un constructor de tests, sino un usuario de ellos. Sin
embargo, el evaluador debe conocer qué principios y requisitos deben reunir los dispositivos de
medida a utilizar en el caso concreto, para así seleccionar tests estándar que sean idóneos a la hora de
medir las unidades de análisis objeto de estudio.
Respecto a las características generales de los test podemos citar que el material, las instrucciones,
modelos de aplicación e interpretación estandarizados; además el resultado que se obtiene es
independiente del profesional que realiza la evaluación y siempre se expresa de forma numérica;
como ya dijimos, la interpretación de la puntuación que se obtiene se compara con un grupo
normativo; lo que se mide es un constructo a partir de la recogida de una muestra de comportamientos
conductuales, cognitivos o biológicos, representativos de este mismo; elicitan la conducta verbal
escrita u oral, o la ejecución manipulativas, que se interpreta como rasgos de los que son; pueden
proporcionar al evaluador datos válidos para emitir un juicio sobre la presencia de un síntoma y sobre
el nivel de la alteración de forma más objetiva cuantificable y fiable; facilitan también el diagnóstico
diferencial pero en ningún test puede realizarse un diagnóstico.
CONSTRUCCIÓN DE UN TEST
El proceso a la hora de construir un test contribuye a la calidad de las mediciones que se obtienen. Las
características principales del proceso de elaboración son: sistemática y orden para guiar el proceso de
elaboración; flexibilidad para para optimizar los resultados en cada uno de los pasos, y existencia de
«controles de calidad» (análisis de ítems, estudios de fiabilidad y validez). Los pasos generales del
proceso de construcción son:
2. Definición del constructo que se pretende medir: el constructo se debe definir primero en
términos de comportamientos observables y después en términos de sus relaciones con otros
constructos dentro de un sistema teórico. La primera fuente de información sobre la
definición del constructo es la teoría sobre el constructo, la cual proporciona las relaciones
entre el constructo y otros constructos o variables relevantes en la práctica (definción
sintáctica) y la relación de los indicadores conductuales representativos del constructo
(definición semántica). El objetivo del proceso construcción es identificar las conductas que
representan el constructo.
3. Diseño del test: Su finalidad es la planificación del intrumento de evaluación previa a la
redacción de los items, para que estos reflejen el objetivo y la definición del constructo. El
diseño se concreta en la tabla de especificaciones (descripción detalla y precisa de la
estructura del test e items). El diseño de cuestionario o inventarios (test de rendimiento)
requiere normalmente la toma de decisiones en relación a los componentes en que se van a
agrupar los distintos indicadores conductuales (cognitivos, afectivos) cómo se relacionan
entre ellos, el número de ítems previsto, el tipo y número de alternativas de respuesta para los
ítems, etc
4. Desarrollo o redacción de los items: Partiendo de la definción del constructo y siguiendo las
especificaciones del test y de sus contenidos, se elaboran los items para cada uno de los
indicadores previstos del constructo. Normalmente se agrupan los formatos disponibles para
los test de rendimiento y amplitud en dos categorías: formato de respuesta elegida, los cuales
ofrecen distintas opciones para que el individuo elija su respuesta (ej: elección múltiple, V o
F, etc…); y formatos de respuesta elaborada o construida, en los que la persona debe producir
o elaborar la respuesta (eje: terminación de frases, respuesta breve, ensayo, etc…). Además,
se debe evitar o minimizar potenciales errores que puedan generar ambigüedad en la
interpretación de las respuestas (términos ambiguos, enunciados confusos, frases
gramaticalmente complejas, etc…)
5. Análisis de los items: Una vez redactados los items, se juzga su calidad, con el objetivo de
seleccionar del conjunto inicial aquellos que formarán parte del test final. El criterio que se
emplea tiene dos componentes que son: adecuar los ítems como medida de la variable y, la
contribución de cada ítem a formar un test internamente consistente. Además, los dos
procedimientos que se utilizan para recabar la información que se necesita son
procedimientos subjetivos (los ítems son presentados a un grupo de expertos para que los
revisen) y empíricos o análisis numérico de ítems (analizan las propiedades estadísticas de las
respuestas, de un conjunto de personas).
Cabe citar que las propiedades estadísticas que se analizan con el fin de valorar la calidad de
los items son: Dificultad de los items, cuantificado a partir del porcentaje (proporción) de
personas que responden correctamente y Discriminación de los items, referido al grado en el
que las respuestas de los individuos a un ítem se relacionan con sus puntuaciones totales en el
conjunto de los items, cuantificándose dicha relación con coeficientes de correlación y otros
índices estadísticos. Dicho esto, La elección de los ítems se basa en comprobar la relación
entre la discriminación de los ítems y la consistencia final del test.
El proceso de evaluación y las técnicas con que éste se lleve a cabo, deben realizarse cubriendo ciertas
garantías de calidad y la subdisciplina de la psicología que se ocupa de estas garantías es la psicometría.
Desde la teoría clásica de los test (TCT) se desarrollan los conceptos de fiabilidad y validez que deben
cumplir los instrumentos de evaluación y se integran en las normas APA.
En primer lugar, la fiabilidad hace referencia a la precisión con la que mide la prueba. Un test será más
fiable cuanto mayor sea la proporción de variabilidad de las puntuaciones obtenidas que se deba a la
variabilidad de las puntuaciones verdaderas, y será menor, si se debe a la del error. Por lo tanto, las
diferencias entre las puntuaciones observadas y la puntuación verdadera se conocen como error de
medida. Existen tres tipos de evidencias de fiabilidad:
Estabilidad temporal de la medida (replicable), hace referencia a que una medida será fiable si
medidas hechas en momentos distintos ofrecen resultados iguales. Esta es calculada mediante
Test-retest, calculándose el coeficiente de fiabilidad pasando el mismo test dos veces a los mismos
individuos.
Cabe destacar que se considera a una fiabilidad alta cuando es mayor de .90, a una fiabilidad moderada
cuando se encuentra entre .75 y .90, y se considera baja cuando es menor a .65.
Respecto a los distintos indices de validez, propuestos por Messick nos encontramos con:
La validez de contenido, proceden del análisis de las relaciones entre el contenido del test y el
constructo que se quiere medir y cuyo cálculo se realiza mediante el juicio de expertos y
correlaciones con otras medidas de la misma variable. Además, esta incluye evidencia de
relevancia, representatividad y calidad técnica del instrumento.
La validez de criterio enfatiza la estructura externa del test, es decir, sus relaciones con la
variable criterio pero no las posibles generalizaciones de este. Además, los tipos de evidencia que
se incluyen son:
o la validez predictiva, hace referencia a un tipo de variable criterio que se quiere medir
con el test, para predecir así el desempeño futuro del sujeto. El instrumento estadístico
que se emplea es la correlación con el criterio.
Cabe destacar que las evidencias basadas en la estructura interna pretenden analizar las relaciones de
los ítems de un test entre sí y de ellos con el constructo, empleándose para ello como herramientas
matemáticas los análisis factoriales, tanto exploratorios como confirmatorios, que permiten saber si
los items de un test forman una estructura coherente con la teoría desde la que se han elaborado.
Los percentiles, que hacen referencia al porcentaje de sujetos del grupo normativo que está
por debajo de la puntuación obtenida por el sujeto, siendo esta información no demasiado
completa.
Las puntuaciones típicas son una transformación lineal de la puntuación directa en función
de la media y desviación típica del grupo y nos indican cuánto se separa el sujeto de la media
del grupo en relación con lo que se separan los demás, pero estas puntuaciones presentan
valores decimales y negativos, por lo que se suelen utilizar las puntuaciones típicas
derivadas. Otro tipo de puntuaciones típicas son las normalizadas, que modifican la
distribución de las puntuaciones ajustándola a la curva normal.
La sustitución en determinadas áreas de la Teoría Clásica de Test (TCT) por la Teoría de Respuesta al
ítem (TRI) se ha producido debido a que los modelos de esta última permiten una mayor flexibilidad
en el proceso de elaboración de tests y de análisis de las respuestas de los individuos evaluados. La
TRI está más interesada por las propiedades de los ítems que por las del test en su conjunto, por lo
tanto, mantiene que en la respuesta a cada ítem está lo esencial de la respuesta, ya que cada sujeto
contesta de una manera diferente a cada uno de ellos.
Esta teoría se centra en determinar la probabilidad de dar una determinada respuesta al ítem para cada
nivel del rasgo medido por este, por lo que si dos individuos presentan idéntico nivel de rasgo medido
ambos tendrán igual probabilidad de dar la misma respuesta. Esta calcula la capacidad discriminativa
de un ítem por medio de diagramas de regresión, donde aparece la proporción de personas que
contesta a cada ítem adecuadamente en cada nivel de puntuación total, observándose así que cada
ítem tiene diferente discriminación entre unos individuos que obtuvieron la misma puntuación total.
La principal aportación de esta teoría es que proporciona medidas invariantes al obtener mediciones
que no cambian en función del instrumento utilizado y poseer instrumentos de medida cuyas
propiedades no cambian en función de las personas a las que se administran el test. Otras aportaciones
son que lo importante es cada sujeto y el ítem, y no importa la representativas de la muestra, que la
evaluación debe llevarse a cabo en el nivel de ítem individual, no en el del test y en esta medición no
es aplicable el error de medida.
Cabe destacar que ha sido en el ámbito de las soluciones prácticas donde la TRI ha mostrado una
superioridad sobre la Teoría Clásica de Test, como en los bancos de ítems, los tests adaptativos, la
equiparación de puntuaciones entre tests equivalentes, la construcción automatizada de tests, etc…
Tests de rendimiento máximo: Hacen referencia a aquellos test que buscan recoger los
niveles más altos de rendimiento de un individuo, exigiendo que la persona rinda lo máximo
posible, como por ejemplo en los tests de inteligencia y/o aptitudes. Estos test tienen una sola
respuesta correcta. Cabe destacar que lo importante en cada ítem es su nivel de dificultad o la
rapidez de ejecución que se es exigida.
Tets de rendimiento típico: hace mención a aquellos instrumentos que intentan recoger el
modo habitual de comportarse de una persona, como por ejemplo en los tests de personalidad
y cuestionarios, escalas o inventarios de intereses y/o actitudes. Estos tienen la característica
de ser técnicas voluntarias, ya que el sujeto percibe, el constructo a evaluar, teniendo el
control sobre las respuesta que da. Además, en muchas ocasiones estos tests están interesados
en recoger la opinión o juicio del sujeto, por lo que no existen respuestas verdaderas, sino
distintas opciones de respuesta con diferente significado psicológico.
TEST
MMPI-2-RF Adolescentes y adultos Sus 42 escalas sustantivas
permiten una evaluación
eficiente y actualizada de las
variables clínicamente
relevantes en distintas áreas de
la personalidad y la
psicopatología (ej., ansiedad,
miedos, obsesividad,
depresión).
Inventario Clínico Multiaxial A partir de los 18 años Cuenta con 4 índices que
de Millon (MCMI-III) permiten evaluar la validez del
protocolo y 24 escalas clínicas
agrupadas de acuerdo con el
nivel de gravedad: patrones
clínicos de personalidad (ej.,
esquizoide, antisocial),
síndromes clínicos (ej.,
ansiedad, depresión,
pensamiento psicótico).
El código deontológico hace referencia a los conjuntos de normas: «directrices» (o estándares) y «guías».
Algunas de las normas recogías en este son: