Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
¿De qué trata la Psicometría?
¿Qué es medir?
2
¿En qué se diferencia la Psicometría de ….
3
Objetivos de la asignatura
4
Definición
RAE:
¿Qué es lo psicológico?
¿Qué es la medida?
5
¿Qué es lo psicológico? – Objeto de estudio
Constructos
X1 X2 X3
6
¿Qué es medir?
7
Definición
11
Desarrollo histórico de la psicometría
Desarrollo
Histórico
Escalamiento
Experimental Psico-físico
Diferencias
Correlacional individuales
12
Desarrollo histórico de la
psicometría
13
Autores asociados al desarrollo de la psicometría
15
16
Escalar: situar a personas o estímulos a lo largo de un continuo
-1 1 1.5
Métodos de escalamiento de estímulos.
a) según el tipo de continuo a lo largo del cual varía el atributo pueden ser:
- escalas psicofísicas (Fechner, Stevens, etc.)
- escalas psicológicas (Thurstone)
b) según el tipo de respuesta de los sujetos pueden ser:
- juicio categórico
- juicio comparativo
•Instrumento estandarizado
•Prueba objetiva
•Cuantificar
20
21
Instrumento estandarizado:
1. Preguntas
2. Respuestas
3. Formato de presentación
4. Orden de presentación
5. Instrucciones
6. Contexto y tiempo de aplicación
7. Corrección y puntuación de los ítems
8. Puntuación del test
9. Interpretación de las puntuaciones
La relación entre indicadores y
constructos, e inferir los constructos a
partir de los indicadores, es uno de los
mayores problemas asociados a los
tests, por ello una característica que los
identifica es la necesidad de aportar
evidencias de la fiabilidad y validez de
las mediciones realizadas.
Inferencia psicométrica
Definiciones:
Operacional o semántica
Estructural o sintáctica
Los ítems …
Las respuestas …
Precisión Fiabilidad
Utilidad Validez
25
Problemas/limitaciones de la medición psicológica:
26
Teoría de los tests
Relación entre puntuaciones en un test y la variable inobservable que intenta medir
ese tests.
X = Observable
V = No observable
28
Modelo de la TCT
1. Escalamiento de sujetos
1. Construcción de ítems: ítems paralelos
Item 7
Item 6
Item 5
Item 4
Item 3
Item 2
Item 1
María Luis
- María Pepa
Inmaculada
Rosa Juan Pepe Luisa
+
De todos los
santos
Modelo de la TCT
1. Escalamiento de sujetos
Ventajas
Limitaciones:
1. Propiedades psicométricas dependientes de las muestras de sujetos
2. No ordenación de los ítems
3. Medidas ordinales
4. No se pueden verificar los supuestos
5. Igual cantidad de error a lo largo del continuo
TRI
Análisis de ITEMS
Ventajas de la TRI:
1. Independencia de las muestras
2. Medidas de intervalo
3. Escalamiento conjunto
4. Verificación del ajuste de los ítems
5. Precisión de las medidas para cada nivel en el continuo
Limitaciones:
1. Modelos matemáticos complejos
2. Cálculo de las puntuaciones
3. Tamaños muestrales elevados
Modelo de la TRI
1. Escalamiento conjunto
1. Construcción de ítems: ítems a lo largo de todo
el continuo
María Luis
- María Pepa
Inmaculada
Rosa Juan Pepe Luisa
+
De todos los
santos
Clasificaciones de los test:
35
Objetivos
Conocer y comprender las fases del proceso
general de elaboración de tests.
Seleccionar el modelo de medida más adecuado en
función del objetivo y del contexto de medición
Conocer y comprender la función de las
especificaciones de tests e ítems.
Conocer los distintos formatos de ítems.
Identificar los controles de calidad que se realizan
sobre los tests.
36
Para dominar a fondo todas las fases de
construcción de tests:
Construcción de cuestionarios
Optativa de 4º de psicología
Etapas en la elaboración de un test
39
Proceso de construcción de un test:
Es … Secuencial
Flexible
1. Asegurar la validez
Objetivos: ¿para qué? ¿qué vamos a hacer una vez conocidas las
puntuaciones de cada sujeto?
• Diagnóstico
• Selección
• Clasificación
• Certificación
• Consejo
• Descripción/Información
Tests de Ejecución Típica
1. Identificación de los objetivos de la prueba, de la población de estudio y
de las condiciones de aplicación del test.
Población:
1. Nivel de rasgo
2. Características sociodemográficas
Contexto:
Tiempo/Dinero
Tests de Ejecución Típica
2. Selección del modelo de medida a utilizar:
Objetivos
Teoría psicológica
TCT - TRI
Redacción de ítems
Análisis de ítems
44
TCT vs TRI
¿Variables nominales?
¿Ítems paralelos?
Software accesible
¿Modelos multidimensionales?
Tests de Ejecución Típica
3. Definición del constructo:
Doble vía:
46
Tests de Ejecución Típica
1. Revisión bibliográfica
2. Consulta a expertos
3. Observación directa
47
Tests de Ejecución Típica
4. Diseño del test: Especificaciones del test y de los
ítems
48
Tests de Ejecución Típica
Especificaciones de un test de ejecución típica
49
Tests de Ejecución Típica
50
Tests de Ejecución Típica
b) Diferencial semántico:
A continuación aparece una frase seguida de seis pares de adjetivos. Pon una X en la casilla que
mejor exprese tu posición (cercana, lejana o intermedia) respecto a los adjetivos que se hallan
en ambos extremos.
Para mí, hacer 20 minutos de ejercicio físico diario es (o sería) algo ...
Agradable|__|__|__|__|__|__|__|__|__|__|__|Desagradable(act1)
Insalubre|__|__|__|__|__|__|__|__|__|__|__|Saludable (act2)
Incómodo|__|__|__|__|__|__|__|__|__|__|__|Cómodo (act4)
0 1 2 3 4 5 6 7 8 9 10
52
Tests de Ejecución Típica
Formato de los ítems de elección (preguntas cerradas)
Formato tipo Likert
53
Tests de Ejecución Típica
Formato de los ítems de elección (preguntas cerradas)
54
Tests de Ejecución Típica
Formato de los ítems de elección (preguntas cerradas)
Formato tipo Likert
a) Muy en desacuerdo
b) En desacuerdo
c) De acuerdo
d) Muy de acuerdo
55
Formato tipo Likert
Los ítems tipo Likert no solo expresan grado de acuerdo, también pueden expresar
frecuencia, cantidad, probabilidad, …
0 1 2 3 4 5 6
Nunca Alguna vez al Una vez al Algunas veces Una vez por Algunas veces Todos los días
año o menos mes o menos al mes semana por semana
¿Crees que tú tienes posibilidades de contagiarte con el VIH? (Responde rodeando un número de 1 a 7)
Ninguna Muchas
posibilidad posibilidades
1 2 3 4 5 6 7
Expresa tu grado de seguridad rodeando un número desde 1 (Totalmente seguro de que no) hasta 7 (Totalmente
seguro de que sí):
Totalmente Totalmente
seguro de que no seguro de que sí
56
Tests de Ejecución Típica
Recomendaciones para la redacción de los ítems
Deseabilidad social
[Asegurar el anonimato]
[Aproximaciones sucesivas]
[Justificar la conducta]
[Incorporar una escala de deseabilidad social]
[Elección forzada]
59
Tests de Ejecución Típica
5. Redacción y análisis preliminares de los ítems
Autocrítica:
1. Contenido
a) ¿Es necesaria esta pregunta?
b) ¿Es necesario concretar más la pregunta?
2. Redacción
a) ¿Se podría expresar de un modo más claro?
b) ¿Puede tener varias interpretaciones?
c) ¿Presenta algún sesgo o prejuicio?
d) ¿Las alternativas son exhaustivas?
e) ¿Se solapan las alternativas de respuesta?
63
Tests de Ejecución Típica
6. Organización y formato del test
3) Opciones de respuesta (letras / números)
4) Instrucciones para responder
5) Estructura matricial de las preguntas
6) No romper ítems entre páginas
7) Los ítems que miden un mismo contenido deben ir juntos
8) Ordenados desde los menos hasta los más comprometidos
9) Colocación de las variables sociodemográficas
10) ¿Dónde responden los sujetos?
64
Tests de Ejecución Típica
7. Estudio piloto
Muestra representativa
Al final incluir:
66
¿Pero qué tipo de análisis?
¿Para qué?
67
Objetivos:
68
Contenidos:
a)Propiedades de los ítems: dificultad / discriminación / fiabilidad
/ validez
i. Fórmulas, cálculo, interpretación, conclusiones, decisiones
69
1º Tests de ejecución típica
Ítems de exámenes
70
Tests de ejecución típica
Análisis de ítems
Cuanto mejores sean los parámetros de cada uno de los ítems, mejor será el test
71
1. Tests de ejecución típica:
1.1. Medias y varianzas X i ; Si2
rix S x − Si
ri ( x −i ) =
Si2 + S x2 − 2rix S x Si
72
Tests de ejecución típica
Medias y varianzas
1-5 3
0-6 3
0-4 2
1-10 5.5
Mínimo Máximo Media Desv. Típica
Ítem 1 1 8 4.23 1.05
Ítem 2 1 8 2.01 0.67
Ítem 3 1 8 3.08 1.92
Ítem 4 1 8 2.09 2.16
Ítem 5 1 8 2.55 2.12
Ítem 6 1 8 3.00 0.87
Ítem 7 1 8 7.50 0.46
74
i1 i2 i3 i4 total
1 7 6 7 5 25
2 7 3 4 1 15
3 6 5 4 5 20
4 1 1 2 1 5
5 1 2 2 4 9
6 6 6 5 4 21
Correlaciones
total
i1 Correlación de Pearson .879
Sig. (bilateral) .021
i2 Correlación de Pearson .976
Sig. (bilateral) .001
i3 Correlación de Pearson .937
Sig. (bilateral) .006
i4 Correlación de Pearson .678
Sig. (bilateral) .138
75
Tests de ejecución típica
Correlación ítem-test corregida
Al calcular la correlación entre el ítem y el test (rix) calculamos la correlación entre dos
puntuaciones: i (ítem) y X (puntuación total en el test).
Pero X (puntuación total en el test) contiene a ‘i’. X es la suma de todos los ‘i’
rix S x − Si
ri ( x −i ) =
Si2 + S x2 − 2rix S x Si
76
Tests de ejecución típica
Correlación ítem-test corregida
Estadísticos descriptivos
N Mínimo Máximo Media Desv. típ. Varianza
i1 4 2 6 4.00 1.633 2.667
i2 4 2 6 4.00 1.826 3.333
i3 4 4 8 6.25 1.708 2.917
i4 4 3 9 6.00 2.582 6.667
test 4 14 25 20.25 4.646 21.583
N válido (según lista) 4
78
Estadísticos de fiabilidad
Alfa de
Cronbach N de elementos
.371 4
Estadísticos total-elemento
Media de la Varianza de Alfa de
escala si se la escala si Correlación Cronbach si
elimina el se elimina elemento-total se eleimina
elemento el elemento corregida el elemento
i1 16.2500 9.583 .923 -.522a
i2 16.2500 26.250 -.428 .800
i3 14.0000 10.000 .802 -.400a
i4 14.2500 12.917 .108 .465
a. El valor es negativo debido a una covarianza promedio entre los
elementos negativa, lo cual viola los supuestos del modelo de
fiabilidad. Puede que desee comprobar las codificaciones de los
elementos.
79
Resúmenes de casosa
i1 i3 i4 test134
1 4 7 3 14.00
2 2 4 5 11.00
3 6 8 9 23.00
4 4 6 7 17.00
Total N 4 4 4 4
a. Limitado a los primeros 100 casos.
Estadísticos descriptivos
N Mínimo Máximo Media Desv. típ. Varianza
i1 4 2 6 4.00 1.633 2.667
i3 4 4 8 6.25 1.708 2.917
i4 4 3 9 6.00 2.582 6.667
test134 4 11.00 23.00 16.2500 5.12348 26.250
N válido (según lista) 4
80
Estadísticos de fiabilidad
Alfa de
Cronbach N de elementos
.800 3
Estadísticos total-elemento
Media de la Varianza de Alfa de
escala si se la escala si Correlación Cronbach si
elimina el se elimina elemento-total se eleimina
elemento el elemento corregida el elemento
i1 12.2500 12.917 .909 .516
i3 10.0000 14.667 .663 .727
i4 10.2500 10.917 .508 .977
81
1º Tests de ejecución típica
Ítems de exámenes
83
1. Tests de ejecución máxima:
Índice D = ps – pi
pi2 = 0.05; 5%
85
Tests de ejecución máxima
Índice de dificultad
9. ¿Cuál de las siguientes es una característica de los modelos organísmicos del desarrollo
humano?
a) Defienden la existencia de estadios en el desarrollo
b) El desarrollo carece de dinámica interna
c) El desarrollo humano tiene carácter teleonómico
d) Las opciones a) y c) son correctas*
i9
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
1 Opción A 20 25.6 25.6 25.6
2 Opción B 10 12.8 12.8 38.5
Válidos 3 Opción C 4 5.1 5.1 43.6
4 Opción D 44 56.4 56.4 100.0
Total 78 100.0 100.0
86
Tests de ejecución máxima
Índice de dificultad
3. ¿Cuáles son las propiedades de los contenidos cerrados de nuestro código genético?
a) Son potencialidades que, a través de la interacción social, se desarrollan
b) Son diferentes de una cultura a otra, y dentro de la misma cultura, de una generación a otra
c) Nos definen como especie*
d) Las opciones a y c son correctas
i3
i3
Porcentaje Porcentaje
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Frecuencia Porcentaje válido acumulado
1 Opción A 14 17.9 21.2 21.2
1 Opción A 14 17.9 21.2 21.2
2 Opción B 5 6.4 7.6 28.8
2 Opción B 5 6.4 7.6 28.8
Válidos 3 Opción C 30 38.5 45.5 74.2
Válidos 3 Opción C 30 38.5 45.5 74.2
4 Opción D 17 21.8 25.8 100.0
4 Opción D 17 21.8 25.8 100.0
Total 66 84.6 100.0
Total 66 84.6 100.0
Perdidos Sistema 12 15.4
Perdidos Sistema 12 15.4
Total 78 100.0
Total 78 100.0 87
Tests de ejecución máxima
Índice de dificultad
i1
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 1 Opción A 8 10.3 10.3 10.3
2 Opción B 7 9.0 9.0 19.2
3 Opción C 7 9.0 9.0 28.2
4 Opción D 56 71.8 71.8 100.0
Total 78 100.0 100.0
Una proporción de sujetos no sabe la respuesta correcta –no tiene los conocimientos-
pero acierta por azar
Para conocer la verdadera dificultad del ítem debemos restar al porcentaje de personas
que responden corresponden el porcentaje de personas que aciertan al azar
A 700
p = I .D. = Índice de dificultad = = = 0.70; 70%
N 1000
90
Tests de ejecución máxima
Índice de dificultad
E
A−
pc = I .D.c = Índice de dificultad corregida = k −1
N
Siendo:
E 300
A− 700 -
pc = I .D.c = Índice de dificultad corregida = k −1 = 3 = 0.60; 60%
N 1000
91
Tests de ejecución máxima
Índice de dificultad
E 300
A− 700 -
pc = I .D.c = Índice de dificultad corregida = k −1 = 3 = 0.60; 60%
N 1000
En relación al índice de dificultad corregida (.60), de entre las
opciones que se ofrecen, ¿qué podríamos decir de las personas a las
que identifica?
a) Saben la respuesta correcta al ítem *
b) Aciertan, por azar, la respuesta correcta
c) Eligen la opción correcta
92
Tests de ejecución máxima
Índice de dificultad
N = 1000 Correcta = b Los que no saben Frecuencias finales
Saben = 600 a) a) 100 a) 100
No saben = 400 b) 600 b)100 b)700
c) c) 100 c) 100
d) d) 100 d) 100
Entonces, ¿cuál es la proporción de sujetos que aciertan por azar?
100
= .10;10%
1000
p − p c = I . D . − I . D .c = 0 . 70 − 0 . 60 = 0 . 10
Índice de dificultad − Índice de dificultad corregida = 0.70 - 0.60 = 0.10; 10%
93
Un ítem con 3 opciones de respuesta. Índice de
dificultad de 0.84. Los errores no restan.
fallan 0.16
= = = 0.8; 8%
(nº opciones de respuesta) - 1 2
95
Tests de ejecución máxima
Índice de dificultad
i14
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
1 Opción A 43 55.1 55.1 55.1
2 Opción B 14 17.9 17.9 73.1
Válidos 3 Opción C 8 10.3 10.3 83.3
4 Opción D 13 16.7 16.7 100.0
Total 78 100.0 100.0
96
Observa la siguiente tabla. En ella aparecen las respuestas de 153 personas a 3 ítems con 4
opciones de respuesta. En negrita y subrayado aparece el número de personas que
eligieron la opción correcta en cada ítem.
Opciones de
Ítem 1 Ítem 2 Ítem 3
respuesta
A 44 89 20
B 32 40 19
C 13 18 94
D 64 6 20
S1 A 0
S2 B 1
S3
S4
B
C
1
0
X I 1r = pI 1 = I .D.I 1
S5 A 0
S6 B 1
S7 B 1
A 4 ∑ 0 +1+1+ 0 + 0 +1+1 4
p I 1 = = = 0.57 X I 1r =
X I 1r
= = = 0.57
N 7 N 7 7
Tests de ejecución máxima
Índice de dificultad
Estadísticos descriptivos
S1 A A B C
S2 B C C C
S3 B C C C
S4 C A A A
S5 A C A A
S6 B C C B
S7 B C B C
104
Tests de ejecución máxima
Índice de dificultad
Aunque en la práctica, en TCT, la dificultad de los ítems dependerá del nivel de
conocimientos de la muestra a la que apliquemos la prueba, se intenta que la distribución
de los ítems, en función de la dificultad, sea:
Rango de índices de
Porcentaje de ítems Dificultad
dificultad corregida
5% Muy difíciles .01 - .25
20% Difíciles .25 - .40
50% Intermedios .40 - .60
20% Fáciles .60 - .75
5% Muy fáciles .75 - .99
Tests de ejecución máxima
Índice de dificultad
1. Suponiendo que somos distintos en aquello que miden nuestros ítems. Que existe
variabilidad entre personas.
2. Lo ideal es que nuestros ítems sean capaces de captar toda esa variabilidad. ¿Qué
estadístico nos permite conocer le grado de dispersión o de variabilidad de una variable?
3. La varianza es una medida de lo diferentes que somos. Ya que suponemos que somos
distintos, será bueno que la varianza sea elevada.
4. Manteniendo el resto de condiciones constantes, cuanto mayor sea la varianza de un
ítem mejor es dicho ítem. Mejor discrimina entre los sujetos.
5. Cuando los valores de una variable son 0-1 [como en un ítem corregido], la varianza de
dicho ítem se calcula aplicando la siguiente fórmula:
S = p*q
2
106
i9
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
1 Opción A 20 25.6 25.6 25.6
2 Opción B 10 12.8 12.8 38.5
Válidos 3 Opción C 4 5.1 5.1 43.6
4 Opción D 44 56.4 56.4 100.0
Total 78 100.0 100.0
107
Tests de ejecución máxima
Índice D de discriminación
Nuestros ítems deben ser tan buenos que nos permitan discriminar entre quienes tienen
conocimientos suficientes para superar la prueba y quienes no los tienen.
Nuestros ítems deben discriminar entre los sujetos que saben y los que no saben.
Y hacerlo no sólo globalmente, en el total del test, sino que cada ítem debe contribuir a esa
discriminación.
i8
1 Opción A 2 Opción B * 3 Opción C 4 Opción D Total
1 Grupo inferior 3 1 6 10 20
15.0% 5.0% 30.0% 50.0% 100.0%
2 Grupo intermedio 3 3 8 5 19
15.8% 15.8% 42.1% 26.3% 100.0%
3 Grupo intermedio 1 7 4 4 16
6.3% 43.8% 25.0% 25.0% 100.0%
4 Grupo superior 0 17 3 3 23
.0% 73.9% 13.0% 13.0% 100.0%
Total 7 28 21 22 78
9.0% 35.9% 26.9% 28.2% 100.0%
i13
1 Opción A 2 Opción B* 3 Opción C 4 Opción D Total
1 Grupo inferior 3 5 6 6 20
15.0% 25.0% 30.0% 30.0% 100.0%
2 Grupo intermedio 3 4 10 2 19
15.8% 21.1% 52.6% 10.5% 100.0%
3 Grupo intermedio 3 3 7 3 16
18.8% 18.8% 43.8% 18.8% 100.0%
4 Grupo superior 8 7 7 1 23
34.8% 30.4% 30.4% 4.3% 100.0%
Total 17 19 30 12 78
21.8% 24.4% 38.5% 15.4% 100.0%
Valor de D Ítem
D ≥ 0.40 Muy bueno
0.30≤ D ≤0.39 Aceptable
0.20≤ D ≤0.29 Regular. Revisar
0≤ D ≤0.19 Malo. Modificar o eliminar
D <0 Muy malo. Problemático
Tests de ejecución máxima
Índice D de discriminación
Ítem 1 (b) Ítem 2 (c) Ítem 3 (a) Ítem 4 (c) Total (test = X)
S1 A A B C
S2 B C C C
S3 B C C C
S4 C A A A
S5 A C A A
S6 B C C B
Para que un ítem cumpla su función, es necesario que los distractores –las
alternativas incorrectas- funcionen adecuadamente.
113
Tests de ejecución máxima
Análisis de las alternativas incorrectas
Las alternativas incorrectas de un ítem funcionan bien si: