Está en la página 1de 5

Centro Universitario Metropolitino

Materia: Pruebas psicométricas

Alumna: Díaz Fuentes Aislinn Mariel Guadalupe

Docente: Trejo Torres Carolina

Ciclo escolar 2022- 2023

Psicología tercer semestre

04- Octubre – 2022


Resumen confiabilidad, validez e interpretacion de resultados

En la actualidad coexisten dos teorías generales de los test, la teoría clásica de los test y la de respuesta al ítem.

 La puntuación observada de una persona en un test es una función de dos componentes: su puntaje
verdadero

 Que es inobservable y el error de medición implícito en toda medición.

La confiabilidad es la exactitud o precisión de una medición, o el grado en el cual las puntuaciones de un test están
libres de esos errores de medición.

La exactitud de las puntuaciones permite que éstas se mantengan constantes en diferentes hechos. la confiabilidad
se verifica mediante un coeficiente de correlación entre las medidas repetidas de un fenómeno.

Los diferentes métodos utilizados para evaluar la confiabilidad utilizan el coeficiente de correlación como
estadístico fundamental. De este modo, un coeficiente de 0,80 sugiere que un 64% de la varianza observada es
asimilable a la variabilidad de la puntuación verdadera, con un margen de error del 36%.

Hay factores que afectan la confiabilidad de las puntuaciones obtenidas mediante la aplicación de un test. La APA
(1999) los clasifica en factores internos (fluctuaciones en el nivel de atención del examinado, por ejemplo) o
externos (diferentes criterios de corrección de un test, según evaluadores distintos.)

 Contenido del tests: debe tenerse en cuenta que la elección de los ítems, los materiales a través de los
cuales estimulamos la respuesta del individuo, y la formulación de las consignas pueden ser una fuente de
error aleatorio en la medición. Si se desea estimar el puntaje de un individuo en un cierto dominio, los
errores en el muestreo de contenido pueden afectar la confiabilidad.
 Administración: Las condiciones generales del ambiente en que se administran los tests deben ser lo más
semejantes que sea posible (iluminación, nivel de ruido o confort del lugar).
 Calificación: En los tests de opción múltiple pueden cometerse errores cuando la corrección es manual,
tales como calificar accidentalmente algunas respuestas correctas como erróneas y viceversa, o realizar
mal la sumatoria de los respuestas clave o correctas.
 Factores internos del examinado: El comportamiento de la persona examinada, que aumentan o
disminuyen su puntaje. En este sentido, las distracciones momentáneas, las preocupaciones de índole
personal y otros acontecimientos semejantes pueden afectar la estabilidad de los puntajes de tests.

Existen tres dimensiones de la confiabilidad

La primera son las características de la variable que se desea medir, puesto que si se están evaluando rasgos que
teóricamente tienen cierta estabilidad (por ejemplo, rasgos de personalidad o aptitudes cognitivas), es esperable
que las puntuaciones obtenidas en los instrumentos de medición sean también relativamente estables. Cuando se
evalúan estados de ánimo o tiempos de reacción, no resulta relevante atender a la estabilidad temporal de la
prueba, ya que teóricamente se espera una modificación de los resultados al aplicarla en distintas ocasiones.

También el grado en que distintas partes o ítems del test miden el mismo constructo o dominio

De igual manera los individuos obtengan puntuaciones idénticas en sus ejecuciones independientemente de quién
sea su examinador

La validez es de mucha importancia en la medición psicológica y se relaciona con la investigación del significado
teórico de las puntuaciones obtenidas por medio de un test.

Fuentes de evidencia de validez de los tests

Con respecto a las fuentes internas se dice que la primera categoría se relaciona con el test y sus componentes
(ítems) en sí mismos. La lógica implícita de las evidencias incluidas en esta categoría se relaciona con el primer
objetivo del proceso de validación de las puntuaciones de un test

Evidencia basada en el contenido del test: Para Murat (1985), este tipo de evidencia se obtiene demostrando que
el contenido (ítems) del test es una muestra representativa del constructo o dominio respecto del cual se desea
hacer alguna inferencia. Debe existir correspondencia entre el contenido del test y el dominio (área de
comportamiento o conocimiento) que éste pretende medir

Evidencia basada en la estructura interna del test: indican si las relaciones entre los ítems y las dimensiones
(factores, escalas) permiten confirmar la existencia de los constructos que el test pretende medir.

Evidencia basada en el proceso de respuesta: refleja la interacción entre la psicología cognitiva y la psicometría,
donde el análisis de los procesos cognitivos comprometidos en el proceso de respuesta a los tests adquiere
particular importancia.

Las fuentes externas de evidencia, pueden ser las medidas de algún criterio que el test intenta predecir, así como
las puntuaciones de otros tests que miden constructos semejantes o diferentes, las variables categóricas externas
como lo es el sexo.

Evidencia convergente-discriminante en esta se deben comparar los puntajes obtenidos, tanto con otros tests
elaborados para medir el mismo atributo.

Evidencia de las relaciones entre las puntuaciones del test y criterios externos: importante en los contextos
aplicados de la psicología en los que se busca predecir de manera precisa un determinado comportamiento o
desempeño a partir de las puntuaciones de un test.
Correlación bivariada con un criterio significa la efectividad con que se puede predecir el desempeño de una
muestra en una situación real (laboral o académica, por ejemplo) o criterio diferente del test en sí mismo.

La generalización de la validez, es el método que permite integrar y combinar los resultados de diversos estudios
empíricos mediante técnicas específicas. En lo que se refiere a la validez, la utilización de este método surgió como
respuesta a los coeficientes débiles de correlación observados en muchas investigaciones en relación con la
evidencia de las relaciones test.

Con respeto a la interpretación hace mención que es un un test está formado por varios ítems ante los cuales el
individuo debe emitir sus respuestas. El resultado inicial de un test es el puntaje bruto, directo u original que se
obtiene por la sumatoria de las respuestas correctas

Por otra parte, los tests construidos sobre la base de la teoría de respuesta al ítem, esta puntuación original se
denomina puntuación theta. A diferencia de las puntuaciones originales de tests basados en la teoría clásica de los
tests las puntuaciones theta no se obtienen de la simple sumatoria de las respuestas a los ítems, sino que resultan
de la interacción de las respuestas del examinado con las características de los reactivos

Los test pueden usarse como instrumentos de medición tales como la carencia de cero absoluto (el cero en
puntuación no indica ausencia absoluta del rasgo porque nunca se realiza un

muestreo exhaustivo o representativo de sus posibles “indicadores operacionales” otros de ello es que no poseen
unidades de medida constantes (situación muy diferente a otras unidades de medida, como el metro para medir la
longitud o el kilogramo para el peso)

En los tests que miden rasgos latentes (como inteligencia o personalidad) la estrategia comúnmente empleada
para atribuir significado a las puntuaciones originales es comparar los resultados individuales con las puntuaciones
del grupo de referencia en la misma prueba.

Muestra de estandarización

En este último caso se deben tomar precauciones especiales antes de utilizar el test, tales como confirmar que los
baremos estén actualizados y que la muestra de estandarización original sea semejante a la población meta de un
test particular. Estas consideraciones adquieren especial relevancia en nuestro medio, dado que muchas veces no
contamos con normas locales y el profesional se ve enfrentado a la difícil situación de escoger entre un baremo
elaborado para una población diferente a la cual pertenecen los individuos que pretende evaluar o no hacer uso de
baremo alguno
En particular, debe enfatizarse que, si se construye un baremo para interpretar los puntajes de un test, debe ser
generado a partir de una muestra representativa de la población meta de evaluación. De otro modo, la utilización
del baremo puede conducir a interpretaciones equívocas y a errores considerables para el autoconocimiento de los
individuos o la clasificación efectuada a partir de un test.

También podría gustarte