Está en la página 1de 12

Psicometría, evaluación psicológica y ámbitos de aplicación.

Liporace –
Cayssials

LA EVALUACIÓN PSICOLOGICA
Definición: Es un proceso de toma de decisiones que funciona como una instancia
consultiva (no decisoria), en tanto es solicitada por el interesado o por un tercero, para dar
respuesta a alguna pregunta o consulta, o para indicar un curso de acción o solución a
algún problema concreto. El objeto de esta área de trabajo es el estudio, análisis y
valoración de las características de un sujeto, de sus formas de acción, reacción e
interacción con los demás y con la realidad, y de sus procesos de cambio. La evaluación
psicológica es un examen basado en pruebas psicológicas y la valoración de programas de
intervención. Es un concepto más amplio que el psicodiagnóstico, ya que éste último es una
sub-área orientada hacia el ámbito clínico, mientras que la evaluación psicológica está
orientada a todos los ámbitos. Dentro del ámbito psicológico, es una tarea dirigida a la
solución de problemas (personales, grupales, institucionales, etc.), basada en un
determinado modelo teórico; y el psicólogo asume el rol de usuario de técnicas, aplicador,
administrador o evaluador. En el ámbito de la investigación, el principal objetivo de la tarea
del psicólogo es la generación de nuevos conocimientos que luego serán transferibles al
ámbito de aplicación de la Psicología.

Pasos que hace el especialista en una evaluación psicológica:


- Recabar información mediante diversas herramientas técnicas seleccionadas
cuidadosamente
- Organizar la información en un mapa conceptual contemplando la temporalidad y
pluricausalidad de los fenómenos psíquicos
- Formular hipótesis diagnósticas y explicativas acerca de la naturaleza y definición de los
procesos y productos involucrados en la evaluación, que irá fortaleciendo o descartando
según avance en el análisis del material recogido y contraste dichas hipótesis con datos de
la realidad
- Elaborar una síntesis del caso y efectuar una o varias recomendaciones en términos de
cursos de acción sugeridos
- Hacer la devolución oral y/o un informe de la síntesis y recomendaciones
- Realizar una evaluación de control, seguimiento o análisis de cambio, según corresponda,
efectuados con el objeto de validar en la práctica los resultados de su evaluación.

Ámbitos de aplicación:
-Ámbito clínico: el proceso de evaluación psicológica se asimila al nombre de
psicodiagnóstico, el motivo de consulta está gavillado por algún malestar, sufrimiento,
disfunción, sintomatología o por algún grado de invalidez.
-Ámbito laboral: en psicología institucional o en organizaciones. Ej.: psicotécnicos,
consultora, elección de personal.
-Ámbito educacional: gabinetes psicopedagógicos en las escuelas, orientación vocacional.
-Ámbito forense o jurídico: será el juez quien determine el curso de acción a seguir en
virtud de las recomendaciones que el psicólogo ha redactado, por ejemplo en cuanto a
determinar si un sujeto era capaz de comprender o no la criminalidad de un acto al
momento de cometerlo, o si alguien que ha sido víctima de un accidente automovilístico
padece un trastorno por estrés post-traumático.
-Ámbito de investigación: se recaban datos o indicadores que den cuenta de aquel
fenómeno que se quiere investigar, siendo esta actividad un paso más dentro del proceso de
investigación.
-Ámbito de evaluación de programas: la actividad del evaluador está encaminada a
determinar la eficacia de una intervención, tratamiento o programa, orientado a cambiar
ciertas circunstancias que se desea alterar, p.ej., un tratamiento para dejar de fumar con la
menor ansiedad posible.

Psicometría: es una rama de la psicología, la disciplina que tiene por finalidad el


desarrollo de modelos, preferentemente cuantitativos (construcción y teoría de los test) que
permitan ‘transformar’ o codificar los fenómenos o los hechos en datos, diseñando
métodos adecuados (test) para la aplicación de tales modelos con el fin de determinar las
diferencias individuales de los sujetos en cuanto a sus atributos, sus propiedades o sus
rasgos.

Los instrumentos psicométricos.


Una técnica, prueba, test, test psicológico, escala, o instrumento psicométrico es un
dispositivo o procedimiento estandarizado en el que se obtiene una muestra de
comportamiento de un examinado en un dominio específico, subsiguientemente evaluado y
puntuado usando procedimientos estandarizados; y cuenta con evidencias empíricas sobre
la validez y la confiabilidad de los resultados que arroja.

Una técnica, prueba, test, test psicológico, escala, o instrumento psicométrico es un


dispositivo o procedimiento estandarizado -es uniforme para los sujetos- (una medida
objetiva- porque hay instrucciones, consignas - y estandarizada-se puntualiza un método de
trabajo: qué tipo de materiales deben utilizarse, qué consignas, qué ítems, en qué tiempos
de administración, si habrá o no tiempo límite, de qué forma se entregará el material, qué
actitud asumirá el examinador frente al sujeto, etc.) en el que se obtiene una muestra de
comportamiento de un examinado en un dominio específico -evalúa variables distintas, p.ej.
la ansiedad, la mcp, la atención, la inteligencia; es decir que la consigna y los materiales
elegidos restringirán el dominio al que se quiere circunscribir los comportamientos que se
desea registrar y analizar-, subsiguientemente evaluado y puntuado usando procedimientos
estandarizados -se siguen las consignas del autor o manual-, y cuenta con evidencias
empíricas sobre la validez -si el test mide o evalúa aquello que dice medir- y la
confiabilidad-si aporta resultados o mediciones en las que se puede confiar, con un error de
medición predecible y determinable- de los resultados que arroja.
Un test NO evalúa TODO el comportamiento de una persona, sino una muestra de todos
sus comportamientos posibles, reducidos a un área específica o dentro de un área
específica. Los test son indicadores de un constructo teórico que es la variable a evaluar.

Rapport: son los esfuerzos puestos en juego por el evaluador para generar en el evaluado
una actitud general de cooperación, un clima tranquilo, cómodo, distendido, ameno y
relajado, despertar su interés y motivación y estimularlo a responder a los test y
entrevistas de la mejor manera posible y así dar su mejor rendimiento, según los objetivos
planteados en cada uno de ellos. Para ello, el examinador debe mantenerse atento desde el
primer contacto, y a lo largo de todo el proceso de evaluación, a las características
personales del evaluado, y así poder reaccionar de manera rápida e intuitiva.

Clasificación de los test:

 Por el método:
-Técnicas psicométricas: son más cuantitativas en su evaluación. Se obtienen puntajes que
luego se interpretan. Son más estructurados en su material, consignas, estímulos y
alternativas de respuesta. Pueden fundamentarse en diversos marcos teóricos, porque las
variables evaluadas no corresponden a la personalidad profunda, sino más bien se trata de
elementos tales como la inteligencia, habilidades, ansiedad, maduración visomotriz y
conceptual o memoria a corto plazo, es decir que aíslan atributos diversos, valorándolos de
a uno a la vez. Se basan más en la psicología clásica y el análisis factorial.
-Técnicas proyectivas: la persona utiliza el mecanismo de defensa de la proyección, el cual
supone exteriorizar, ‘poner en el afuera’ o adjudicar a otros (proyecta en su respuesta)
aquellos aspectos inconscientes y preconcientes de su psiquismo. No se obtienen puntajes,
hay indicadores que se interpretan, es un análisis cualitativo. Es menos estructurado en
estímulos y consignas. Se basan más en el psicoanálisis, por lo que se evaluan elementos y
contenidos relativos a la personalidad profunda. Si bien admiten separar y analizar
individualmente ciertos componentes de la personalidad, tratan a los mismos como parte de
un todo inter-relacionado y separable sólo a los fines de estudio y análisis. Ej.: Test
Proyectivo del Dibujo de una Persona; H.T.P.

Los test psicométricos en cuanto a la base sobre la que se valoran o comparan las respuestas
o desempeño del sujeto evaluado, se subdividen en:
+Test por Baremos (o normativos): se rigen por baremos o normas estadísticas. Ellas
comparan el rendimiento o respuestas de una persona individual con el rendimiento
promedio registrado por una muestra normativa o de tipificación, es decir, por un grupo de
individuos homogéneos al examinado, según edad, sexo, hábitat, etc. Así, el baremo o
norma estadística es un cuadro de doble entrada en el que se consigan el promedio de las
puntuaciones obtenidas por esa muestra de sujetos y su dispersión o desviación típica. Se
obtiene un puntaje bruto y se lo compara con una muestra que lo representa (si esta por
arriba o abajo).

+Test de criterio o dominio: no se obtienen puntajes y no emplean normas para comparar el


desempeño o respuestas del individuo, sino que las valora según un criterio previamente
establecido. Se observa si se cumplen con criterios pre-establecidos presentes (tienen
diagnóstico) o ausentes (no tienen diagnóstico). Son muy estructurados. La comparación se
efectúa sobre el criterio o dominio especificado.

 Por los materiales: test gráficos; test materiales-manipulables o ejecutivos; test verbales;
test de lápiz y papel; test de estímulo oral y respuesta escrita.

 Por la forma de administración: administración individual (solo los puede administrar


una persona, y requiere la interacción personalizada examinador-examinado) o auto-
administrables (puede ser de forma individual, a un sujeto, o de forma colectiva, a varias
personas en un mismo momento; sus consignas, materiales e ítems son muy claros y el
sujeto no necesita ayuda para dar su respuesta).

 Según el objeto de la evaluación: alude al gran grupo de conceptos o variables al que


pertenece aquel constructo que se quiere evaluar, p.ej.: test de habilidades, test de potencia,
test de personalidad.

 Por el tipo de respuesta: test de forma dicotómico (pone al examinado ante la


obligatoriedad de decir su rta. entre dos opciones polares, como V o F, Sí o No,
suspendiendo pensamientos tales como ‘depende de la situación’); escalas likert (hay tablas
que tienen ítems, e implican un ordenamiento de las opciones según un gradiente que va
desde la máxima aceptación al máximo rechazo, o viceversa, donde se marca con cruces - a
veces, nunca, siempre, casi siempre, etc-. Indican frecuencias, cada columna indica un
valor.); diferencial semántico (forma de respuesta que prevé una escala, en cuyos extremos
se ubican dos adjetivos o expresiones con significados contrapuestos, y el examinado
marca en qué punto de ese continuo ubica su parecer con respecto a la variable que se está
evaluando para valorar significados posibles de ser atribuidos); de resolución de tareas
específicas (se pide al sujeto que realice una producción determinada, p.ej., copiar tarjetas,
dibujar bajo determinadas condiciones; y luego suelen re-codificarse las rtas. según
criterios diversos; p.ej., como éxito-fallo, o como respuesta completamente adecuada-
parcialmente adecuada-inadecuada); de opción múltiple; de valoración de éxito o error.

 Según su formato: inventarios (listados de afirmaciones que el sujeto debe leer y


responder, p.ej., V o F, o según un gradiente en el que expresa su acuerdo o desacuerdo-
likert-, como p.ej., el MMPI-2); cuestionarios (listados de preguntas que el sujeto debe
responder según su formato preestablecido, p.ej., sí-no); escalas clásicas (se componen de
tareas que el sujeto debe resolver o preguntas que debe contestar para reflejar algún
conocimiento o destreza, como p.ej., el WISC y el WAIS); encuestas (similares a los
inventarios, se utilizan para recolectar opiniones o actitudes de las personas sobre algún
tema en especial); protocolo de entrevistas dirigidas-cerradas-(listados de preguntas
preestablecidas que se hacen oralmente al sujeto en una administración individual y que
deben responderse oralmente, con la posibilidad de ampliar esas rtas. por medio de
comentarios y detalles, y para la codificación de tales rtas. se utiliza un protocolo
preimpreso que permite un rápido registro de éstas); protocolo de observación u hojas de
registro (formularios impresos que establecen qué aspectos específicos deben observarse en
determinados comportamiento o interacciones, en los que el examinador va codificando
aquellos atributos que son objeto de su evaluación).

 Según el tiempo: con tiempo límite (luego de éste se suspende la tarea); sin tiempo límite
(permiten que el examinado trabaje libremente y a su ritmo); se trabaja libremente pero se
toma el tiempo (para valorarlo en una forma determinada).
 Según el objetivo de la pesquisa: diagnóstico (intenta brindar al usuario una evaluación
detallada y pormenorizada de una situación, atributo o estado o rasgo dado; sus tiempos de
administración y evaluación serán mayores, pero permitirán arribar a una descripción más
acabada, complementada por una cierta cantidad de datos y detalles); screening-despistaje
o rastrillaje-(sirve mucho en epistemología. Se usan para detectar riesgo, es decir que dan
una evaluación poco detallada, preliminar y que debe profundizarse. Son breves y
altamente sensibles, ya que deben reaccionar fácilmente ante los mínimos indicadores de
riesgo potencial. Funcionan como un filtro que separa los elementos más gruesos-
indicadores poco específicos-, para que sean examinados en detalle mediante técnicas
diagnósticas).

Propiedades que tienen que tener las técnicas psicométricas:

-Discriminación: capacidad de un instrumento (en realidad, refiere a la capacidad de sus


ítems) para captar diferencias individuales en la variable que está siendo medida. Éste es el
sentido último de las escalas psicométricas: la determinación de diferencias en un atributo
dado entre distintas personas.

-Confiabilidad: Es la confianza que podemos tener en los resultados que arroja, o sea, que
el test mide o puntúe bien, con precisión. Se dirige a valorar cuánto error existe en la
medición, siempre teniendo en cuenta que se incluyen errores en la misma. Es la
consistencia de los puntajes obtenidos por las mimas personas cuando son evaluadas con
una misma técnica en situaciones diferentes. El coeficiente de confiabilidad (Cxx) informa
el grado de precisión del instrumento, es un nº que indica en qué medida una técnica es
confiable. El coeficiente de correlación (r), expresa el grado de correspondencia, o
relación, o covariación, entre dos conjuntos de puntuaciones, siempre y cuando las mismas
sean medidas en un nivel de intervalos o de razón. Cuando la correlación entre dos
variables es perfecta, el coeficiente de correlación es igual a 1, y cuando no existe
asociación alguna, es cero. El que se utiliza con más frecuencia es el coeficiente de
correlación lineal de Pearson (r xy). Las correlaciones son afectadas por la variabilidad del
grupo en que fueron calculadas. Conforme disminuye la variabilidad de la muestra, también
lo hace el coeficiente de correlación. El coeficiente de confiabilidad es útil para conocer
ciertas propiedades psicométricas de una técnica, para valorarla, para tener criterios de
selección entre instrumentos, para calcular el error de medición de las puntuaciones
obtenidas e interpretarlas adecuadamente.
Los estudios sobre la confiabilidad se ocupan de los errores asistemáticos: son aquellos sin
posibilidad de ser controlados, impredecibles o aleatorios, ya que son generados por las
variaciones cuya causa es el azar. Dichas fuentes de error pueden haber sido generadas en
la etapa de construcción de la técnica (p.ej., el muestreo de contenido, la variación depende
de los ítems incluidos en la técnica), en la administración (en la atención o motivación del
sujeto-desgano, ansiedad, experiencias anteriores-; las variables relacionadas con las
condiciones ambientales-temperatura, ventilación, ruido- y las variables relacionadas con el
examinador-su estilo, su comportamiento-), en la puntuación y en la interpretación de los
resultados arrojados por la misma; características propias de la prueba (p.ej., una fotocopia
borrosa), características circunstanciales del entrevistador y del entrevistado (cansancio,
miedo), extensión de la técnica.

Hay 3 procedimientos para estudiar la confiabilidad:


1) Test-Retest: es un método basado en medidas repetidas. Mide la estabilidad de las
puntuaciones sabiendo que conforme transcurre el tiempo las personas cambian. Se
administra el test que va ser evaluado, a una muestra de personas y se evalúa. Se obtienen
los puntajes. Pasado un cierto tiempo se vuelve a tomar el mismo test a las mismas
personas y se vuelve a puntuar. Luego se correlacionan los puntajes obtenidos en el primer
test y en el segundo y se obtiene el coeficiente de correlación o de confiabilidad, o r de
Pearson, que siempre va a dar entre 0 y 1 (0=no hay correlación, y 1=hay correlación
perfecta). Cuanto más cerca de 1, más confiable va a ser el test (por encima de r=0.75 es
publicable). Por último, se interpreta el coeficiente hallado. No puede pasar más de 6 meses
para hacer el re-test.
2) Formas equivalentes o paralelas: pueden ser con intervalo (requiere repetidas
aplicaciones) o sin intervalo (requiere una sola aplicación). No se administra dos veces el
mismo test, sino que primeros se toma el original y luego una forma paralela del mismo,
similar en contenido, instrucciones, duración, medias y varianzas de las puntuaciones que
arrojan, índices de dificultad y discriminación de los ítems. La forma paralela con
intervalo se utiliza cuando se necesita minimizar el efecto de la memoria del contenido de
otra prueba aplicada con anterioridad. Se aplica la forma A, que es la que se diseño, y en
otra sesión se aplica la forma B, es decir, la forma paralela, a las mismas personas. Este
procedimiento controla dos fuentes de falta de confiabilidad, las fluctuaciones temporales
aleatorias (al igual que el test-retest) y además la inconsistencia de las respuestas a
diferentes muestras de ítems, ya que hay cambios en los reactivos del instrumento
administrado en la primera sesión y en la segunda sesión. Luego se calcula la correlación
entre las puntuaciones obtenidas con una forma y con la otra, y por último se interpreta el
coeficiente. En el caso de las formas paralelas sin intervalo, no hay lapso de tiempo que
separa ambas administraciones, por lo tanto, se aplican ambas formas (A y B) en una
misma sesión a la misma muestra de personas, una después de la otra. Luego se
correlacionan ambas muestras y se interpreta el coeficiente hallado. En este caso, pueden
verse afectados por la fatiga y/o la falta de motivación por parte de los sujetos; así como
también, las diferencias que pueden deberse al orden de aparición de cada una de las formas
en la aplicación.

3) División por mitades: se aplica una sola vez. Estima el grado de consistencia interna del
instrumento, es decir, controla o identifica la inconsistencia de la muestra de ítems. Es
condición que la técnica en estudio sea homogénea, que evalúe un único atributo o factor.
Se aplica el test a la muestra y luego se mutua y se divide en dos mitades homogéneas al
test, apareadas en contenido, dificultad, formato, número de ítems y estadísticos (medias,
varianzas e índices de dificultad y discriminación). Una forma para lograr las dos mitades
homogéneas es asignar cada ítem, a una mitad o a la otra, al azar; otra forma consiste en
dividirlos en números pares e impares, de modo que los ítems queden ordenados según su
dificultad creciente; otra alternativa es dividir la prueba por contenidos, de modo que cada
mitad del test contenga ítems equivalentes en cuanto al contenido y la dificultad. Luego se
correlacionan los puntajes de una y otra mitad, y se interpreta el coeficiente hallado. Lo
negativo de este método es que es muy difícil encontrar ítems parecidos para dividir el test.

-Validez: se refiere a qué mide y cómo lo mide el test. El autor debe proporcionar pruebas
empíricas-resultados verificados, verificables y replicables por otros investigadores-que
demuestren que, efectivamente, se está midiendo aquello que intenta medir, el constructo
que se ha propuesto. El análisis de la validez del instrumento puede detectar errores
sistemáticos o constantes: son aquellos que desplazan las puntuaciones en cierta dirección,
generando una puntuación sistemáticamente elevada o baja. Si bien introduce diferencias en
el resultado de la medición, no cambia la variabilidad, la distribución de las puntuaciones
de un grupo de sujetos en la variable que se está evaluando.

Procedimientos por los cuales se obtiene la validez:

1) Validez de contenido: se refiere a la verificación de que la muestra de ítems incluida en


el test cubra todos los aspectos o dimensiones relevantes de la variable en estudio o a ser
medida. Esta tarea debe ser desempeñada por los diseñadores originales del instrumento y
posteriormente controlada mediante el juicio experto; el cual es un procedimiento mediante
el cual, un pequeño grupo de expertos en el tema que se quiere evaluar, revisan el contenido
y la redacción de cada ítem y su adecuación con respecto a cada dimensión prevista por la
teoría, efectuando críticas a algunos de ellos, mostrando su conformidad con respecto a
otros, sugiriendo modificaciones en otros casos. Cada experto trabajará en forma
independiente y hará llegar su evaluación a los autores, quienes sopesarán el dictamen de
cada uno de los expertos, efectuando sobre los ítems propuestos aquellas modificaciones
que hayan sido sugeridas por la mayoría.

2) Validez teórica o de constructo o estructural: es un proceso continuo por medio del que
se realizan múltiples investigaciones con el fin de poner a prueba diferentes hipótesis sobre
la estructura interna del constructo, así como de sus relaciones con otras variables o
constructos. Es el grado en que un test mide un constructo. Se refiere a qué mide y cómo
mide. Es el más importante. Parte de un modelo teórico y luego se diseña el test que sirva
de verificación de ese constructo teórico. Se lleva lo teórico a la práctica. Se lo realiza a una
muestra cualquiera y luego a una muestra que padezca eso que estoy estudiando. Se lo debe
aplicar a todos los test.

3) Validez de criterio o empírica: es un tipo de evidencia que se vincula con el uso práctico
que puede darse al test, en base a los resultados que arroja. Trabaja utilizando el criterio
externo, que es una medida de la misma variable que el instrumento intenta medir, pero
obtenida en forma independiente, la cual permite verificar empíricamente si la escala brinda
una información semejante a la obtenida mediante esa medición independiente, o criterio
externo.

4) Validez concurrente: es una validez empírica, se le administra el test a una muestra de


sujetos. Luego se les toma a las mismas personas otro test que ya este validado y que evalúe
lo mismo, el cual funcionará como criterio externo y deberá ser determinada a priori con
idénticos criterios a los utilizados para la construcción de la escala. Se correlacionan los
puntajes para valorar el grado en que ambos caminos de evaluación se hallan asociados, es
decir, coinciden. Este tipo de validez se establece en y para el momento presente-aquí y
ahora-con el fin de asegurar que la escala mide aquella variable que prometía medir.
Cuanto más cerca de 1, más válido será. Esto indica que la técnica psicométrica y criterio
concurren juntos, en un mismo sentido, arrojando idénticos resultados o muy similares.

5) Validez predictiva: es una validez empírica, y al igual que la concurrente, trabaja con un
criterio externo y un coeficiente de correlación. Pero se diferencia en que la validez
predictiva, trabaja a futuro y con un criterio externo a predecirse, también empleando el
coeficiente de correlación como medida de las evidencias de validez aportada. Se utiliza
sobre todo en tests donde es posible anticipar o predecir un logro futuro, p.ej., el test de
Bender. El criterio externo se correlaciona con el puntaje del test, y así se puede anticipar
un logro futuro.

6) Validez aparente o de facies: facies significa rostro o cara en latín. Tiene que ver con
que el instrumento resulte válido a los ojos del examinado, ya que si los materiales, la
consigna, el estilo de respuesta o las condiciones propuestas para el examen dejan de
aparecer como ‘serias’ o adecuadas a su edad o características, podría suceder que los
sujetos vieran afectada su actitud de respuesta, produciéndose un efecto contrario a lo
deseado en aras del logro de un buen rapport. Es decir que, el test en su apariencia está
vinculado con lo que se quiere evaluar y tiene que tener seriedad. Se determina con juicios
expertos o administración piloto para saber si lo entienden. Se hacen las correlaciones
correspondientes.

También podría gustarte