Documentos de Académico
Documentos de Profesional
Documentos de Cultura
RESUMEN PSICOMETRÍA
El desarrollo de las primeras dinastías del antiguo imperio chino generó los primeros sistemas de evaluación de los
individuos en función de su habilidad.
Los antecedente recientes de la psicometría se encontrarían en el desarrollo del estudio sistemático de las
diferencias humanas durante el siglo XIX (Bessel y Gaus).
El desarrollo de la psicofísica representó el inicio de la psicología como disciplina académica (Fechner y
Helmholtz).
Galton, Catell y Binet – pioneros de la psicometría moderna.
Binet fue responsable de lo que se considera el primer test de aplicación general para la medida de las habilidades
cognitivas.
Los test “Army Alpha y Beta” de Robert Yerkes abordaron una controversia importante sobre los sesgos
culturales de los test.
Spearman introdujo las técnicas de análisis factorial.
Woodworth desarrolló un nuevo tipo de prueba que evaluaba la estabilidad emocional de los soldados (Personal
Data Sheet).
Thurstone propuso la ley del juicio comparativo como el método para la medida de las actitudes, las preferencias
y los valores.
Podemos situar la época dorada de la psicometría entre los años 30 y 60 del siglo XX.
Thurstone fue el primer presidente de la Psychometric Society, e impulsor de la primera revista especializada
(Psychometrica). Fue también presidente de la División de Evaluación y Medida de la American Psychological
Association.
Stevens con su trabajo On the theory of scales of measurement dio un paso fundamental para el desarrollo del
denominado modelo representacional de medida psicométrica. Definió la medida como el proceso de asignación de
números a objetos de acuerdo con unas reglas, producto de las cuales se obtendrían los diferentes tipos de escalas
propuestas: nominal, ordinal, de intervalo y de razón.
En los años 50 aparece la Teoría Clásica de los Test (TCT) que propone un nuevo enfoque basado en el concepto
de puntuación verdadera.
En los 60, Cronbach y colaboradores propusieron la teoría de la generabilidad. En poco tiempo esta teoría fue
reformulada por otro enfoque: la teoría de respuesta al ítem (TRI).
También en los 60 se desarrollaron los tests referidos a criterio, que tienen como objetivo evaluar la destreza de
las personas en un campo de conocimiento muy bien delimitado. Los tests referidos al criterio permiten medir la
ejecución del individuo en función de su grado de conocimiento de un dominio.
La Psicometría es una rama de la psicología que, mediante teorías, métodos y técnicas vinculados al desarrollo y la
administración de tests, se ocupa de la medida indirecta de los fenómenos psicológicos con el objetivo de hacer
descripciones, clasificaciones, diagnósticos, explicaciones o predicciones que permitan orientar una acción o tomar
decisiones sobre el comportamiento de las personas en el ejercicio profesional de la psicología.
A diferencia de la psicometría, la psicología matemática no está tan interesada por las diferencias individuales
como en la definición de leyes generales que modelen el comportamiento medio de las personas.
El modelo representacional define la medida como el proceso de asignación de números a objetos a partir de unas
reglas, de modo que reflejen relaciones empíricas entre los objetos. Estas relaciones quedarían representadas por
las propiedades de los números.
De acuerdo con el modelo operacional la medida sería el conjunto de operaciones necesarias para definir un
concepto que, en última instancia, acaban produciendo números.
El modelo clásico define la medida como la determinación de la cantidad en la que un atributo se presente en el
objeto medido. Mide atributos, no objetos.
1
RESUMEN PS 2017 whymarc
Teoría clásica de los test (TCT). Tres conceptos fundamentales: puntuación verdadera (V) que es el resultado
ideal o deseado, puntuación empírica (X) y error de medida (e).
X=V+e
Dos test son paralelos siempre que sus puntuaciones verdaderas y sus varianzas de errores de medida sean
idénticas.
Teoría de respuesta al ítem (TRI). Cambia el foco desde el tratamiento del test entero al tratamiento individual de
los ítems.
M2.- FIABILIDAD (la precisión con la que los tests llevan a cabo la medida)
CALCULAR PEARSON
! !"! ! ( !)
𝑟!" =
! ! !! ! ! ! ! !! ! !
Coeficiente de fiabilidad. Correlación entre las puntuaciones obtenidas por un grupo de sujetos en dos formas
paralelas del test.
Cualquier valor inferior a 1 se deberá a los errores aleatorios propios del instrumento de medida.
Índice de fiabilidad (Pxv): correlación entre las puntuaciones empíricas de un test y las puntuaciones verdaderas.
!
𝑃!" = 𝑃!!!
=
!
!!
CONSISTENCIA INTERNA.
Rulon: 𝑟 !! 𝑺𝟐𝒅 : varianza de las diferencias entre las puntuaciones de los sujetos.
!! ! !!! !!
!!
𝑺𝟐𝒙 : varianza de las puntuaciones totales de los sujetos en el test.
2
RESUMEN PS 2017 whymarc
Gutman-Flanagan: 𝑟 !! !
! !!!
!! ! !! !!
!!!
Coeficiente ALFA DE CRONBACH: expresa la consistencia interna de un test a partir de la covariación entre sus
ítems.
Se distribuye según una distribución F de Snedecor con (N-1) y (n-1)(N-1) grados de libertad, siendo:
N: número de sujetos.
n: número de ítems.
α: valor de alfa en la población.
αˆ: valor de alfa calculado en la muestra.
Si el valor obtenido se encuentra dentro del intervalo comprendido entre los valores, aceptamos la hipótesis nula,
por lo que el coeficiente no sería estadísticamente significativo.
2º. Calcular el Error máximo de medida: Emáx = Zα/2 * Se (Zα/2 n.c. del 95%=1,96)
3º. Calcular el intervalo de confianza: 𝐈𝐂 = 𝐗 ± 𝐄𝐦á𝐱 (siendo X el valor del sujeto) Redondeando el
resultado al entero más próximo.
𝒏𝒇
1º. Indicar el nº de veces que se alarga el test: 𝑲 = (nf: nº ítems finales; ni: nº ítems iniciales)
𝒏𝒊
3
RESUMEN PS 2017 whymarc
𝑹𝒙𝒙 𝟏!𝒓𝒙𝒙
1º. Aislar K de Spearman Brown: 𝑲 =
𝒓𝒙𝒙 𝟏!𝑹𝒙𝒙
Para calcular la % de varianza de las puntuaciones verdaderas que hay en la varianza de las puntuaciones
empíricas:
!!
P!!! = 1 − (!!! ) Pxx’: coeficiente de fiabilidad del test
!
Psicólogo 1
Presencia trastorno Ausencia trastorno Total
Psicólogo Presencia trastorno 18 7 25
2 Ausencia trastorno 5 50 55
23 57 80
Grado de acuerdo entre las valoraciones de los dos psicólogos (coeficiente Kappa de Cohen):
M3.- VALIDEZ (confianza en que las medidas se corresponden realmente con lo que se propone medir).
VALIDEZ: correlación entre el cuestionario y el criterio de interés. Hace referencia al grado en el que la evidencia
empírica y la teoría apoyan la interpretación de las puntuaciones de los test relacionada con su uso específico.
Validez predictiva: si el test sirve para predecir el comportamiento en un constructo que será evaluado después de
la aplicación del cuestionario.
4
RESUMEN PS 2017 whymarc
Validez concurrente: si sirve para predecir el comportamiento en un constructo que se evalúa simultáneamente a la
aplicación del cuestionario.
Criterio: variable de interés.
Validez de contenido: hace referencia a que los ítems que componen el cuestionario sean representativos de
aquello que se pretende evaluar.
Validez de constructo: hace referencia a que las dimensiones de un determinado constructo estén bien
relacionadas.
Validez de criterio: validez predictiva + validez concurrente
ANÁLISIS DE COMPONENTES PRICIPALES: sólo será validada la estructura de los factores del test con
valores propios superiores a 1 en el análisis de componentes principales (análisis factorial). El test será
bidimensional si se extraen 2 componentes con valores propios mayores que 1.
Para calcular el MÁXIMO VALOR que puede tomar el coeficiente de validez de la escala, se aplica la raíz
cuadrada de la fiabilidad de la escala: 𝑟!" = 0,75 = 0,87
𝟐𝟎
Si alargamos el test 10 ítems más a los 10 iniciales: 𝒏 = =𝟐
𝟏𝟎
5
RESUMEN PS 2017 whymarc
Expresión de la línea recta: y = a + bx, siendo “b” la pendiente de la recta y “a” la intersección u ordenada
en el origen.
1. Calcular la pendiente (b) y la intersección (a).
𝐒𝐲
𝐛 = 𝐫𝐱𝐲 ∗ 𝐚=𝐲−𝐛∗𝐱
𝐒𝐱
rxy: coeficiente de validez del test
Sy: desviación típica del test A
Sx: desviación típica del test B
𝐗: media de las puntuaciones del test B
𝐘: media de las puntuaciones del test A
COMUNALIDAD. Proporción de la varianza que el factor (conjunto de ítems) explica del ítem.
componente comunalidad
1 2 C1 C2 conjunta
0,7056 cuadrado valor 0,0001 cuadrado valor 0,7057 Suma
ítem 1 0,84 -0,01
ítem1 (0,84) ítem2 factorial (-0,01) valores C1+C2
ítem 2 0,71 0,05 0,5041 0,0025 0,5066
ítem 3 0,69 0,15 0,4761 0,0225 0,4986
ítem 4 0,68 -0,07 0,4624 0,0049 0,4673
ítem 5 0,12 0,82 0,0144 0,6724 0,6868
ítem 6 0,59 0,01 0,3481 0,0001 0,3482
ítem 7 -0,07 0,77 0,0049 0,5929 0,5978
ítem 8 0,71 0,05 0,5041 0,0025 0,5066
3,0197 Sumatorio 1,2979 Sumatorio 4,3176 Sumatorio
valor propio
valores C1 valores C2 valores conjuntos
53,97 Ídem
37,74625 “valor propio C1” 16,22375 Ídem usando
varianza explicada usando valor propio
(3,02)/nº ítems x 100 valor propio C2
conjunto
6
RESUMEN PS 2017 whymarc
- El test tiene estructura bidimensional (2 constructos) dado que presentan saturaciones factoriales elevadas con
alguno de los dos componentes.
- El componente 1 explica el 37,74% de la variabilidad total de los 8 ítems, mientras que el componente 2 explica un
porcentaje del 16,22%. Ambos componentes extraídos conjuntamente explican un 53,97% de la variabilidad total.
𝒇𝒂! 𝟎,𝟓∗𝒇𝒊
PERCENTILES: 𝑷𝒄 = x 100
𝑵
Fa: frecuencia acumulada previa a la puntuación directa de la que se quiere calcular el percentil (3ª columna de la
tabla).
Fi: frecuencia absoluta (2ª columna de la tabla).
N: nº de personas que constituyen la muestra.
PUNTUACIONES ESTANDARIZADAS
La puntuación estandarizada o típica es aquella que permite expresar cuántas desviaciones típicas por encima o por
debajo de una media sitúa una observación.
𝑿−𝑿
𝒁𝒙 =
𝑺𝒙
X: puntuación directa
Sx: desviación típica de la muestra.
𝑿: media de la muestra (media de las puntuaciones directas “x”).
ENEATIPO = 5 + 2 Zn La “Z” es la puntuación normal estandarizada (se divide el valor del percentil entre 100 y se
busca en la tabla de la normal).
DECATIPO = 5,5 + 2 Zn
El nivel de razonamiento abstracto es la “Zx”, como la media de Z=0, si es negativa la puntuación directa su nivel
estará por debajo de la media de su grupo normativo.
7
RESUMEN PS 2017 whymarc
!"
Y= ∗ X−X +Y
!"
!
Y = ∗ 40 − 45 + 35 = −7,5 + 35 = 27,5
!
Obtener una puntuación de 40 en el test X, equivale a obtener una puntuación de 27,5 en el test Y.
DISCRIMINACIÓN: capacidad de un ítem de distinguir entre las personas que tienen un buen rendimiento en el
test respecto a las que lo tienen malo.
D= Pa – Pb
Pa: proporción de personas del grupo de alto rendimiento que acierta el ítem.
Pb: proporción de personas del grupo de bajo rendimiento que acierta el ítem.
𝟔 𝟎
𝑫 = − = 𝟏 → 𝟏𝟎𝟎%
𝟔 𝟔
Los 6 sujetos del grupo “puntuaciones altas” aciertan (6 de 6); ninguno de los 6 sujetos del grupo “puntuaciones
bajas” aciertan el ítem (0 de 6).
Clasificación de Ebel:
> 40 Alta discriminación
30-40 Aceptable
20-30 Baja
0-20 Mala
< 20 Inaceptable
DISCRIMINACIÓN DE LOS DISTRACTORES. Los distractores son las alternativas de respuesta incorrectas.
Se hace el “índice D” pero para cada alternativa de respuesta incorrecta. Si los índices de discriminación dan
negativos son adecuados.
! !
Alternativa A: 𝐷 = − = −𝟎, 𝟑𝟑
! !
! !
Alternativa B: 𝐷 = − = −𝟎, 𝟑𝟑
! !
! !
Alternativa C: 𝐷 = − = −𝟎, 𝟑𝟑
! !
8