Criterios de Calidad y Éticos

TEMA 3 Y 6: CRITERIOS DE CALIDAD Y ÉTICOS; TEST PSICOLÓGICOS
¿QUÉ ES UN TEST?
Un test es un instrumento estandarizado y tipificado que compara conductas de dos o más personas.
Para llevar a cabo este procedimiento de observar la conducta y describirla, los requisitos que cumple
un test son que presente escalas numéricas o categorías establecidas, a todas las personas se les debe
observar bajo las mismas condiciones y debe permitir las comparaciones interindividuales. En
definitiva, los tests son procedimientos de medida cuyo material, forma de administración,
puntuación, corrección y valoración son estándares y de ellos se derivan puntuaciones normativas. El
evaluador por lo tanto, no es necesariamente un constructor de tests, sino un usuario de ellos. Sin
embargo, el evaluador debe conocer qué principios y requisitos deben reunir los dispositivos de
medida a utilizar en el caso concreto, para así seleccionar tests estándar que sean idóneos a la hora de
medir las unidades de análisis objeto de estudio.
Respecto a las características generales de los test podemos citar que el material, las instrucciones,
modelos de aplicación e interpretación estandarizados; además el resultado que se obtiene es
independiente del profesional que realiza la evaluación y siempre se expresa de forma numérica;
como ya dijimos, la interpretación de la puntuación que se obtiene se compara con un grupo
normativo; lo que se mide es un constructo a partir de la recogida de una muestra de comportamientos
conductuales, cognitivos o biológicos, representativos de este mismo; elicitan la conducta verbal
escrita u oral, o la ejecución manipulativas, que se interpreta como rasgos de los que son; pueden
proporcionar al evaluador datos válidos para emitir un juicio sobre la presencia de un síntoma y sobre
el nivel de la alteración de forma más objetiva cuantificable y fiable; facilitan también el diagnóstico
diferencial pero en ningún test puede realizarse un diagnóstico.
CONSTRUCCIÓN DE UN TEST
El proceso a la hora de construir un test contribuye a la calidad de las mediciones que se obtienen. Las
características principales del proceso de elaboración son: sistemática y orden para guiar el proceso de
elaboración; flexibilidad para para optimizar los resultados en cada uno de los pasos, y existencia de
«controles de calidad» (análisis de ítems, estudios de fiabilidad y validez). Los pasos generales del
proceso de construcción son:
1. Identificación del objetivo previsto para el test: El proceso de construcción de cualquier

test debe comenzar considerando los objetivos para los que se utilizaran las puntuaciones, es
decir, predicción, clasificación, diagnóstico, etc. Anticipando así, los procesos de decisión
para la utilización de la información que aporta el test. Las categorías generales de objetivos
para las que se suelen utilizar los test o cuestionarios son: la medición del constructo teórico,
evaluación académica o conductual, selección de personal y la clasificación diagnóstica.
Además de esto, en el primer paso de la elaboración se debe incluir el análisis del «contexto»
en el que se empleará el test, siendo los elementos del contexto de utilización más relevantes
y que condicionan la interpretación de las medidas: Características de la población a la que el
test se dirige; restricciones temporales y administración individual o colectiva.
2. Definición del constructo que se pretende medir: el constructo se debe definir primero en
términos de comportamientos observables y después en términos de sus relaciones con otros
constructos dentro de un sistema teórico. La primera fuente de información sobre la
definición del constructo es la teoría sobre el constructo, la cual proporciona las relaciones
entre el constructo y otros constructos o variables relevantes en la práctica (definción
sintáctica) y la relación de los indicadores conductuales representativos del constructo
(definición semántica). El objetivo del proceso construcción es identificar las conductas que
representan el constructo.
3. Diseño del test: Su finalidad es la planificación del intrumento de evaluación previa a la
redacción de los items, para que estos reflejen el objetivo y la definición del constructo. El
diseño se concreta en la tabla de especificaciones (descripción detalla y precisa de la
estructura del test e items). El diseño de cuestionario o inventarios (test de rendimiento)
requiere normalmente la toma de decisiones en relación a los componentes en que se van a
agrupar los distintos indicadores conductuales (cognitivos, afectivos) cómo se relacionan
entre ellos, el número de ítems previsto, el tipo y número de alternativas de respuesta para los
ítems, etc
4. Desarrollo o redacción de los items: Partiendo de la definción del constructo y siguiendo las
especificaciones del test y de sus contenidos, se elaboran los items para cada uno de los
indicadores previstos del constructo. Normalmente se agrupan los formatos disponibles para
los test de rendimiento y amplitud en dos categorías: formato de respuesta elegida, los cuales
ofrecen distintas opciones para que el individuo elija su respuesta (ej: elección múltiple, V o
F, etc…); y formatos de respuesta elaborada o construida, en los que la persona debe producir
o elaborar la respuesta (eje: terminación de frases, respuesta breve, ensayo, etc…). Además,
se debe evitar o minimizar potenciales errores que puedan generar ambigüedad en la
interpretación de las respuestas (términos ambiguos, enunciados confusos, frases
gramaticalmente complejas, etc…)
5. Análisis de los items: Una vez redactados los items, se juzga su calidad, con el objetivo de
seleccionar del conjunto inicial aquellos que formarán parte del test final. El criterio que se
emplea tiene dos componentes que son: adecuar los ítems como medida de la variable y, la
contribución de cada ítem a formar un test internamente consistente. Además, los dos
procedimientos que se utilizan para recabar la información que se necesita son
procedimientos subjetivos (los ítems son presentados a un grupo de expertos para que los
revisen) y empíricos o análisis numérico de ítems (analizan las propiedades estadísticas de las
respuestas, de un conjunto de personas).
Cabe citar que las propiedades estadísticas que se analizan con el fin de valorar la calidad de
los items son: Dificultad de los items, cuantificado a partir del porcentaje (proporción) de
personas que responden correctamente y Discriminación de los items, referido al grado en el
que las respuestas de los individuos a un ítem se relacionan con sus puntuaciones totales en el
conjunto de los items, cuantificándose dicha relación con coeficientes de correlación y otros
índices estadísticos. Dicho esto, La elección de los ítems se basa en comprobar la relación
entre la discriminación de los ítems y la consistencia final del test.
6. Análisis de la fiabilidad y validez de las mediciones:Un vez realizado el análisis de items se

suele administrar a una nueva muestra de personas para así analizar la fiabilidad y validez de
las mediciones a partir de estos nuevos datos obtenidos. Por un lado, la determinación de la
fiabilidad hace referencia a la cualidad que tiene una medida, de tal manera que al repetir al
medición, no se debería producir cambios ni importantes fluctuaciones. Respecto a la
determinación de la validez, esta se refiere a cuando la prueba mide aquello que busca y dice
medir.
7. Elaboración de las normas de interpretación de las puntuaciones: Las perspectivas desde

las que se lleva a cabo la interpretación son la interpretación referida a normas y la referente a
criterios. La primera implica aportar información sobre como ejecuta la persona el test
comparándolo con la distribución de puntuaciones de una muestra normativa o un grupo de
referencia. La segunda analiza la ejecución de un individuo relacionándolo con estándares o
criterios de ejecución anteriormente establecidos en la fase de definición de la variable o
también cuando se ha sobrepasado el límite de lo normal.
CRITERIOS DE CALIDAD: FIABILIDAD Y VALIDEZ
El proceso de evaluación y las técnicas con que éste se lleve a cabo, deben realizarse cubriendo ciertas
garantías de calidad y la subdisciplina de la psicología que se ocupa de estas garantías es la psicometría.
Desde la teoría clásica de los test (TCT) se desarrollan los conceptos de fiabilidad y validez que deben
cumplir los instrumentos de evaluación y se integran en las normas APA.
En primer lugar, la fiabilidad hace referencia a la precisión con la que mide la prueba. Un test será más
fiable cuanto mayor sea la proporción de variabilidad de las puntuaciones obtenidas que se deba a la
variabilidad de las puntuaciones verdaderas, y será menor, si se debe a la del error. Por lo tanto, las
diferencias entre las puntuaciones observadas y la puntuación verdadera se conocen como error de
medida. Existen tres tipos de evidencias de fiabilidad:
 Consistencia interna (homogeneidad de la prueba), es decir, en aquellos tests que se componen

de un conjunto de elementos, los ítems o reactivos que componen una prueba deben ser
equivalentes. Este se basa en estimar el coeficiente de fiabilidad a partir de las covarianzas entre
todos los test. En relación a los procedimientos estadísticos que se utilizan para calcular la
fiabilidad a partir de la covarianza existente entre los items, destaca el Coeficiente Alfa de
Cronbach, coeficientes de Kuder y Richardson. La dificultad que generó la realización de dos
administraciones del test llevaron al desarrollo del procedimiento de dos mitades, el cual agrupa
los items en dos mitades pretendiendo que sean lo más paralelas posible. A continuación se
calcula la correlación entre las puntuaciones totales de los sujetos en cada mitad y, por último, se
corrige el valor de la correlación para conseguir la estimación de la fiabilidad del test.
 Estabilidad temporal de la medida (replicable), hace referencia a que una medida será fiable si
medidas hechas en momentos distintos ofrecen resultados iguales. Esta es calculada mediante
Test-retest, calculándose el coeficiente de fiabilidad pasando el mismo test dos veces a los mismos
individuos.
 Objetividad del registro (formas paralelas), en el que diferentes evaluadores (observadores,

entrevistadores, puntuadores, etc.) obtienen resultados similares. Las puntuaciones que se obtienen
por parte de los distintos evaluadores han de ser comprobadas mediante el Coeficiente de Kappa y
el coeficiente de concordancia.
Cabe destacar que se considera a una fiabilidad alta cuando es mayor de .90, a una fiabilidad moderada
cuando se encuentra entre .75 y .90, y se considera baja cuando es menor a .65.
Descripción test (fiabilidad): ejemplo

Cuestionario de Personalidad de Eysenck Revisado-Abreviado (Eysenck Personality Questionnaire
Revised-Abreviated [EPQR- A]; Francis, et al., 1992; versión española de Sandín, Valiente, Chorot, et al.,
2002). Es un cuestionario autoinformado que consta de 24 ítems que conforman cuatro subescalas de seis
ítems cada una. Tres subescalas miden los rasgos de personalidad neuroticismo, extraversión, psicoticismo
y la cuarta subescala (sinceridad) evalúa la tendencia emitir respuestas de deseabilidad social. Cada
afirmación presentada se contesta de forma dicotómica (sí/no). El rango de puntuaciones en cada subescala
oscila de 0 a 6, donde una mayor puntuación es indicativa de mayor presencia del rasgo. Su consistencia
interna (Alpha de Cronbach) es de 0,78 para la subescala de neuroticismo, 0,74 para extraversión 0,63 para
psicoticismo y 0,54 para sinceridad.
La validez hace referencia a la capacidad de un test para cuantificar de forma significativa y adecuada el
rasgo para cuya medición ha sido diseñado. La validez está relacionada con las inferencias sobre el
significado de comportamientos o de atributos consistentes, que se hagan a partir de las puntuaciones
obtenidas por medio de un instrumento de medida, por lo que no se valida el instrumento, sino las
interpretaciones que se hagan a partir de sus puntuaciones.
Respecto a los distintos indices de validez, propuestos por Messick nos encontramos con:
 La validez de contenido, proceden del análisis de las relaciones entre el contenido del test y el
constructo que se quiere medir y cuyo cálculo se realiza mediante el juicio de expertos y
correlaciones con otras medidas de la misma variable. Además, esta incluye evidencia de
relevancia, representatividad y calidad técnica del instrumento.
 La validez de criterio enfatiza la estructura externa del test, es decir, sus relaciones con la
variable criterio pero no las posibles generalizaciones de este. Además, los tipos de evidencia que
se incluyen son:
o la validez concurrente que hace referencia a la correlación entre el test y un criterio,

para demostrar así la concurrencia entre medidas simultáneas.
o Sensibilidad y especificidad, mediante el coeficiente de sensibilidad y especificidad se

calcula la puntuación mínima que debe obtener el sujeto que presenta la condición que
queremos medir, es decir, que de positivo. Mientras que la sensibilidad hace referencia a
que el sujeto obtenga en la prueba como que presenta el rasgo que queremos medir
(capacidad para detectar el trastorno), por otro lado, la especificidad se refiere a que el
rasgo que se mida en el sujeto no esté presente, por lo tanto, da negativo (capacidad para
detectar la ausencia del trastorno).
o la validez predictiva, hace referencia a un tipo de variable criterio que se quiere medir
con el test, para predecir así el desempeño futuro del sujeto. El instrumento estadístico
que se emplea es la correlación con el criterio.
 La validez de constructo (interna) hace referencia al grado en el que el test mide el

constructo y expresa la teoría que subyace en el test, además dentro de este se incluye la
validez convergente/ divergente que se calcula mediante correlaciones con medidas
similares y diferentes.
Cabe destacar que las evidencias basadas en la estructura interna pretenden analizar las relaciones de
los ítems de un test entre sí y de ellos con el constructo, empleándose para ello como herramientas
matemáticas los análisis factoriales, tanto exploratorios como confirmatorios, que permiten saber si
los items de un test forman una estructura coherente con la teoría desde la que se han elaborado.
Fiabilidad y validez: ejemplos

Ej. Validez y fiabilidad: Vázquez et al. (2006). Una adaptación de la Escala de Depresión del Centro
de Estudios Epidemiológicos para su uso en poblaciones españolas no psiquiátricas. Para adaptar la
Escala de Depresión del Centro de Estudios Epidemiológicos para su uso en poblaciones españolas no
psiquiátricas, se administró una versión en español de la escala a 554 sujetos de 18 a 34 años (65,9%
de mujeres) Y las calificaciones obtenidas se compararon con los diagnósticos basados en SCID-CV
de expertos clínicos. La consistencia interna de la escala fue satisfactoria (α de Cronbach = 0,89).
Cuatro factores identificados por el análisis factorial exploratorio (depresivo / somático, afecto
positivo, actividad retardada y relaciones interpersonales) representaron el 55,9% de la varianza. Una
puntuación de 26 se identificó como un corte adecuado para fines de cribado, con una sensibilidad de
0,906 y una especificidad de 0,918.
Validez divergente y convergente: ejemplos

En la subescala de Neuroticismo, se hallaron correlaciones inversas y significativas con la
autoeficacia (r = -0,35, p < 0,001) y con los contactos sociales agradables (r = -0,22, p < 0,001). Por
otra parte, se hallaron correlaciones directas y significativas con la sintomatología depresiva (r = 0,59,
p < 0,001) y con los pensamientos negativos (r = 0,53, p < 0,001).
PUNTUACIONES REFERIDAS A LA NORMA

El evaluador como ya sabemos, utiliza escalas de medida que se suelen representar en puntuaciones, y
las distintas escalas con las que contamos son la escala nominal, ordinal, de intervalo y de razón.
Normalmente, el evaluador atribuye número a los eventos o situaciones a evaluar mediante una
escala, es decir, utiliza la medición. A partir de estos se obtiene lo que se denomina puntuaciones
directas (o de porcentaje) que nos da una información de valor muy relativo, por lo que para conseguir
mayor información con una puntuación existen dos métodos de comparación básicos como referencia
al criterio y referencia a la norma. Respecto a las primeras, este criterio de logros u objetivos a
cumplir sería el marco de referencia frente al cual hay que interpretar la puntuación (información)
recogida del sujeto. En segundo lugar, una puntuación se halla referida a una norma cuando el marco
de referencia con el que se compara para que obtenga significado es un grupo. Para la interpretación
de estas puntuaciones son necesarias dos fases: el establecimiento del grupo de referencia adecuado; y
la transformación de la puntuación directa del sujeto en otra que indique la posición que ocupa
respecto a ese grupo de referencia elegido. Los test por lo tanto se publican con una tabla de normas
(baremos) que se construyen a partir de una muestra representativa. Las puntuaciones más usuales
referidas a la normas suelen ser:
 Los percentiles, que hacen referencia al porcentaje de sujetos del grupo normativo que está
por debajo de la puntuación obtenida por el sujeto, siendo esta información no demasiado
completa.
 Las puntuaciones cronológicas se refieren a la relación que guarda la puntuación que

obtiene el sujeto en un test en función de la edad cronológica (edad mental, coeficiente
intelectual)
 Las puntuaciones típicas son una transformación lineal de la puntuación directa en función
de la media y desviación típica del grupo y nos indican cuánto se separa el sujeto de la media
del grupo en relación con lo que se separan los demás, pero estas puntuaciones presentan
valores decimales y negativos, por lo que se suelen utilizar las puntuaciones típicas
derivadas. Otro tipo de puntuaciones típicas son las normalizadas, que modifican la
distribución de las puntuaciones ajustándola a la curva normal.
OTRAS APROXIMACIONES A LA CONSTRUCCIÓN DE TESTS DESDE LA TEORÍA

CLÁSICA DE LOS TEST
 Construcción racional: Se india el proceso de elaboración del test con la redacción de un

grupo inicial de ítems y estos se construyen en base a relaciones lógicas o racionales con el
constructo que se quiere medir. Posteriormente, se administran los items a una muestra para
realizar el análisis y finalmente se selecciona la población o grupo el número deseado de
ítems que sean de calidad para el test o cuestionario en su versión final.
 Construcción empírica: En este también se inicia la construcción del test con la elaboración
de los ítems, pretendiéndose elaborar ítems que maximicen las diferencias entre las respuestas
de los individuos en la dimensión o constructo, es decir, items que mejoren la predicción de
una medida criterio. Además, a diferencia del procedimiento anterior, se pueden incluir ítems
cuyo contenido no tenga una relación obvia con la dimensión que se está midiendo.
 Construcción analítico-factorial: El rasgo que define esta estrategia de construcción es el

énfasis en la estructura interna final del cuestionario. Por lo tanto, en esta se prima la
contribución de los items a la estructura interna y la homogeneidad de las futuras escalas o
dimensiones del instrumento. El proceso de construcción se caracteriza por analizar de forma
factorial una gran cantidad de ítems tomados de diferentes tests para determinar las
dimensiones básicas que subyacen al conjunto de ítems. Estas dimensiones básicas se
convierten en las escalas o factores y los ítems con cargas factoriales más altas en dichos
factores son empleados para construir el test.
PROCESO DE CONSTRUCCIÓN DESDE LA TEORÍA DE RESPUESTA AL ÍTEM
La sustitución en determinadas áreas de la Teoría Clásica de Test (TCT) por la Teoría de Respuesta al
ítem (TRI) se ha producido debido a que los modelos de esta última permiten una mayor flexibilidad
en el proceso de elaboración de tests y de análisis de las respuestas de los individuos evaluados. La
TRI está más interesada por las propiedades de los ítems que por las del test en su conjunto, por lo
tanto, mantiene que en la respuesta a cada ítem está lo esencial de la respuesta, ya que cada sujeto
contesta de una manera diferente a cada uno de ellos.
Esta teoría se centra en determinar la probabilidad de dar una determinada respuesta al ítem para cada
nivel del rasgo medido por este, por lo que si dos individuos presentan idéntico nivel de rasgo medido
ambos tendrán igual probabilidad de dar la misma respuesta. Esta calcula la capacidad discriminativa
de un ítem por medio de diagramas de regresión, donde aparece la proporción de personas que
contesta a cada ítem adecuadamente en cada nivel de puntuación total, observándose así que cada
ítem tiene diferente discriminación entre unos individuos que obtuvieron la misma puntuación total.
La principal aportación de esta teoría es que proporciona medidas invariantes al obtener mediciones
que no cambian en función del instrumento utilizado y poseer instrumentos de medida cuyas
propiedades no cambian en función de las personas a las que se administran el test. Otras aportaciones
son que lo importante es cada sujeto y el ítem, y no importa la representativas de la muestra, que la
evaluación debe llevarse a cabo en el nivel de ítem individual, no en el del test y en esta medición no
es aplicable el error de medida.
Cabe destacar que ha sido en el ámbito de las soluciones prácticas donde la TRI ha mostrado una
superioridad sobre la Teoría Clásica de Test, como en los bancos de ítems, los tests adaptativos, la
equiparación de puntuaciones entre tests equivalentes, la construcción automatizada de tests, etc…
GARANTÍAS DE LOS DATOS RECOGIDOS
 Generalizabilidad de puntuaciones: consiste en la capacidad de que se obtengan los mismos

valores por diversos autores, usando el mismo instrumento, es decir, se debe averiguar si los
datos obtenidos son generalizables a otros evaluadores, teniendo así evidencia de objetividad.
Con esto hacemos referencia a la objetividad o fiabilidad interjueces.
 Generalizabilidad de elementos: posibilidad de que cada uno de los elementos de una
prueba y su conjunto cubran y den cuenta por completo del constructo a evaluar. Por lo tanto,
los elementos de los cuales se obtienen los datos deben ser representativos del ámbito total
sobre el que vamos a llevar la generalización. Con esto hacemos referencia a la validez de
contenido y la consistencia interna.
 Generalizabilidad de tiempo: posibilidad de que puntuaciones obtenidas al respecto de un

sujeto en un momento dado sean medidas válidas o extensibles en otro momento de su vida.
Podemos hablar de estabilidad en las mediciones o de que hemos obtenido una adecuada
fiabilidad test-retest, si los datos que se recogen en un momento determinado se repiten en
otros períodos. Se suele presentar como fuente de error la reactividad, que puede hacer que el
sujeto responda, en un primer momento, de forma no habitual, produciendo que los datos
registrados en un momento temporal no puedan contrastarse en otros momentos.
 Generalizabilidad de situaciones: capacidad de una prueba para obtener sus puntuaciones

cuando es aplicada a diferentes contextos. Con esto, hacemos referencia a diferentes criterios
de bondad de la medida que son: si por una parte la conducta es consistente
intersituacionalmente y también se hace referencia a la validez ecológica en relación a que los
datos recogidos en situaciones artificiales de laboratorio puedan ser generalizados a la vida de
al del individuo. Cabe destacar que el evaluador debe ser conocedor de hasta que punto la
conducta de un sujeto en una situación, ocurre en otra también.
 Generalizabilidad de métodos: generalizar las puntuaciones obtenidas a través de dos o más

métodos diferentes, haciéndose referencia a la validez convergente y concurrente de los
instrumentos de evaluación. Dicha generalización dependerá de los sesgos especiales de los
procedimientos que se empleen en la evalaución, el tipo de conductas o comportamientos que
sean evaluados y la modalidad de respuesta a la que estos mismos pertenezcan.
 Generalizabilidad de dimensiones: generalizar aquellas puntuaciones que se han obtenido

mediante el análisis de un determinado constructo, de forma que sirvan también para apreciar
otro distinto, haciéndose así referencia a la validez de constructo. Lo que trata es de conocer
en qué medida una serie de conductas, que teóricamente saturan una variable, se dan con esta
asociación o si diferentes modalidades de respuesta, que teóricamente han de estar asociadas,
covarían entre sí.
CLASIFICACIÓN DE LOS TEST
 Tests de rendimiento máximo: Hacen referencia a aquellos test que buscan recoger los
niveles más altos de rendimiento de un individuo, exigiendo que la persona rinda lo máximo
posible, como por ejemplo en los tests de inteligencia y/o aptitudes. Estos test tienen una sola
respuesta correcta. Cabe destacar que lo importante en cada ítem es su nivel de dificultad o la
rapidez de ejecución que se es exigida.
La clasificación en función de lo anteriormente mencionado es:
o Test de potencia: los ítems van aumentando progresivamente de dificultad,

determinado el nivel máximo de ejecución que un sujeto puede lograr sin tener límite
de tiempo (nivel de habilidad).
o Test de velocidad: estos se componen de ítems con índice de dificultad similar en los
que lo importante es determinar la cantidad de ítems correctos, dandole un tiempo
limitado al sujeto que los resuelve. El evaluador busca establecer el nivel de eficacia
y precisión de la persona.
Ejemplos de Test de inteligencia
TEST
WPPSI III: Escala de 2,6-7,3 años Inteligencia general según 6
inteligencia de Wechsler subescalas: verbal y
para preescolares manipulativa, velocidad de
procesamiento y lenguaje, y 14
subtests.
WISC-IV: Escala de 6-16 años Inteligencia general,
inteligencia de Wechsler comprensión verbal,
para niños revisada razonamiento perceptivo,
memoria de trabajo, velocidad
de procesamiento y 10 subtests
principales y 5 optativos
WAIS-III: Escala de 16 a 94 años Inteligencia general: según dos
inteligencia de Wechsler subescalas: verbal y
para adultos manipulativa, y tres índices:
comprensión verbal,
organización perceptiva,
memoria de trabajo y
velocidad de procesamiento
K-Bit: Tes breve de 4-90 años Inteligencia general según dos
inteligencia de Kaufman subescalas: verbal y no verbal
 Tets de rendimiento típico: hace mención a aquellos instrumentos que intentan recoger el
modo habitual de comportarse de una persona, como por ejemplo en los tests de personalidad
y cuestionarios, escalas o inventarios de intereses y/o actitudes. Estos tienen la característica
de ser técnicas voluntarias, ya que el sujeto percibe, el constructo a evaluar, teniendo el
control sobre las respuesta que da. Además, en muchas ocasiones estos tests están interesados
en recoger la opinión o juicio del sujeto, por lo que no existen respuestas verdaderas, sino
distintas opciones de respuesta con diferente significado psicológico.
Ejemplo de Test de personalidad:
TEST
MMPI-2-RF Adolescentes y adultos Sus 42 escalas sustantivas
permiten una evaluación
eficiente y actualizada de las
variables clínicamente
relevantes en distintas áreas de
la personalidad y la
psicopatología (ej., ansiedad,
miedos, obsesividad,
depresión).
Inventario Clínico Multiaxial A partir de los 18 años Cuenta con 4 índices que
de Millon (MCMI-III) permiten evaluar la validez del
protocolo y 24 escalas clínicas
agrupadas de acuerdo con el
nivel de gravedad: patrones
clínicos de personalidad (ej.,
esquizoide, antisocial),
síndromes clínicos (ej.,
ansiedad, depresión,
pensamiento psicótico).
7.GARANTÍAS ÉTICAS: EL CÓDIGO DEONTOLÓGICO
El código deontológico hace referencia a los conjuntos de normas: «directrices» (o estándares) y «guías».
Algunas de las normas recogías en este son:
 Actuar siempre con independencia (art. 4).

 Confidencialidad: mantener bajo un estricto secreto profesional los datos del cliente (art. 39 y 40), aún
después de la muerte (art. 49)
 No aprovecharse para propio beneficio de la información obtenida del cliente (art. 11).
 Al elaborar un informe usar palabras comprensibles y que no hieran la sensibilidad del cliente (art. 12).
 No firmar un informe que no sea el resultado verdadero de nuestro proceso de evaluación (art. 14).
 No aceptar un caso si no se está suficientemente preparado para resolverlo (art. 17)
 La instrumentación y los procedimientos deben ser los adecuados, con garantías científicas y no dar
acceso a los mismos a gente no capacitada (arts. 18 y 19).
 Precisar cómo la interacción con otros profesionales para llevar a cabo ha de realizarse directamente o
indicando al paciente con precisión lo que debe hacer (art. 20).
 Cerciorarse del uso correcto de los informes que se solicitan (art. 24).
 No evaluar a un menor sin avisar a sus padres o tutores legales (art. 25).
 Cerciorarse antes de iniciar una evaluación que el cliente no está ya con otro profesional (art. 30).
 No preguntar más allá de lo que el caso requiere (art. 39).
 Pedir el consentimiento del cliente para comunicarse con terceras personas (arts. 40 y 41).
 Si la evaluación es solicitada por terceras personas, el sujeto también tiene derecho a saber su
contenido (arts. 42 y 43).
 Los datos obtenidos se podrán usar en docencia o investigación si no es posible la identificación del
sujeto (art. 45).
 La presencia de otra persona en el proceso de evaluación debe ser consentida por el paciente (art. 47)
 El informe psicológico ha de tener claridad, sin perder precisión, e informar de las posibles
incertidumbres de los datos, su validez temporal, las técnicas utilizadas y la identificación del
profesional que lo hizo (part. 48).
ELECCIÓN DEL MEJOR TEST

 Conocer cuáles son los test estandarizados para lo que queremos evaluar.
 Elegir aquellos que posean unos adecuados criterios de calidad (fiabilidad y validez)
 Seleccionar aquellos test que puedan aplicarse a la edad del sujeto/s
 Seleccionar un instrumento de administración individual o grupal
 Considerar los aspectos:
o Tiempo de aplicación
o Formato de la prueba, como realizado a lápiz y papel o computadorizada.
o El objetivo del mismo: diagnosticar, seleccionar, etc.
 Una vez elegido el test, el evaluador debe:

o Familiarizarse con el test
o Preparar el lugar dónde se aplicará el test
o Crear un ambiente y rapport adecuados
o Preparar los materiales necesarios
o Seguir estrictamente las normas de aplicación
o Corregir el test siguiendo los pasos del manual
o Cumplir con las obligaciones éticas y deontológicas

Criterios de Calidad y Éticos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Criterios de Calidad y Éticos

Cargado por

Copyright:

Formatos disponibles

TEMA 3 Y 6: CRITERIOS DE CALIDAD Y ÉTICOS; TEST PSICOLÓGICOS

1. Identificación del objetivo previsto para el test: El proceso de construcción de cualquier

6. Análisis de la fiabilidad y validez de las mediciones:Un vez realizado el análisis de items se

7. Elaboración de las normas de interpretación de las puntuaciones: Las perspectivas desde

 Consistencia interna (homogeneidad de la prueba), es decir, en aquellos tests que se componen

 Objetividad del registro (formas paralelas), en el que diferentes evaluadores (observadores,

Descripción test (fiabilidad): ejemplo

o la validez concurrente que hace referencia a la correlación entre el test y un criterio,

o Sensibilidad y especificidad, mediante el coeficiente de sensibilidad y especificidad se

 La validez de constructo (interna) hace referencia al grado en el que el test mide el

Fiabilidad y validez: ejemplos

Validez divergente y convergente: ejemplos

PUNTUACIONES REFERIDAS A LA NORMA

 Las puntuaciones cronológicas se refieren a la relación que guarda la puntuación que

OTRAS APROXIMACIONES A LA CONSTRUCCIÓN DE TESTS DESDE LA TEORÍA

 Construcción racional: Se india el proceso de elaboración del test con la redacción de un

 Construcción analítico-factorial: El rasgo que define esta estrategia de construcción es el

PROCESO DE CONSTRUCCIÓN DESDE LA TEORÍA DE RESPUESTA AL ÍTEM

GARANTÍAS DE LOS DATOS RECOGIDOS

 Generalizabilidad de puntuaciones: consiste en la capacidad de que se obtengan los mismos

 Generalizabilidad de tiempo: posibilidad de que puntuaciones obtenidas al respecto de un

 Generalizabilidad de situaciones: capacidad de una prueba para obtener sus puntuaciones

 Generalizabilidad de métodos: generalizar las puntuaciones obtenidas a través de dos o más

 Generalizabilidad de dimensiones: generalizar aquellas puntuaciones que se han obtenido

CLASIFICACIÓN DE LOS TEST

La clasificación en función de lo anteriormente mencionado es:

o Test de potencia: los ítems van aumentando progresivamente de dificultad,

Ejemplo de Test de personalidad:

7.GARANTÍAS ÉTICAS: EL CÓDIGO DEONTOLÓGICO

 Actuar siempre con independencia (art. 4).

ELECCIÓN DEL MEJOR TEST

 Una vez elegido el test, el evaluador debe:

También podría gustarte