Documentos de Académico
Documentos de Profesional
Documentos de Cultura
141-153
141
IMPACT OF THE SAMPLE SIZE IN THE ITEM AND SUBJECT`S PARAMETERS ESTIMATES
UNDER ITEM RESPONSE THEORY
Abstract
Item Response Theory (IRT) has been considered an important development for the modern psychometrics because of its
several advantages compared to Classic Test Theory (CTT), such as: the virtual invariance of item parameters in respect
to the sample used in their estimation, more reliable and interpretable identification of person`s ability and more efficient
procedures for test equating. Nevertheless, there are discussions in respect to the minimal number of subjects in studies
using IRT. The aim of the study was to investigate the effect of sample size in the fluctuations of item and person
parameters. Nine samples with different sizes were assembled from a database of 44.000 answers from students of Bahia
State to an educational exam in mathematics. Results indicated that item and person parameters can be adequately
estimated from samples starting form 200 subjects. Smaller sample size produces greater instability with the threeparameter model.
Keywords: Item Response Theory, Sample Size, Statistics and Methodology
INTRODUO1
Freqentemente os profissionais e/ou
organizaes precisam tomar decises importantes
baseadas na mensurao de variveis mais
142
Impacto do Tamanho da Amostra na Calibrao de Itens e Estimativa de Escores por Teoria de Resposta ao Item
143
144
e D ( bi )
1+ e D ( bi )
e Dai ( bi )
Pi ( )=
1+ e Dai ( bi )
Um parmetro
Pi ( )=
Dois parmetros
1,2
Trs parmetros
Pi ( )= ci +(1 ci )
1
Onde:
=
bi =
0,8
0,6
ai =
ci =
e =
D=
0,4
0,2
e Dai ( bi )
1+ e Dai ( bi )
Figura 2. Funes logsticas de um, dois e trs parmetros da curva caracterstica do item.
0
-4
-3,2
-2,4
-1,6
-0,8
0,8
1,6
2,4
3,2
theta
Item 1
Item
Modelo usado
Item 1
Item 2
Item 3
Item 4
Um parmetro
Dois parmetros
Dois parmetros
Trs parmetros
Item 2
Item 3
Item 4
bi
ai
ci
0
0
1,6
-1,6
1
0,5
0,8
1,2
0
0
0
0,2
Impacto do Tamanho da Amostra na Calibrao de Itens e Estimativa de Escores por Teoria de Resposta ao Item
145
Nmero de
estudantes
44.635
T20Ka
T20Kb
T1000
T500
T200
T100
T52
T30C
22.317
22.318
1.000
500
200
100
52
30
T27
27
Descrio
Composta por todos os estudantes que responderam prova de matemtica, forma A
de 4a srie, de Avaliao de Desempenho no ano de 2002.
Composta pela primeira metade de T40K
Composta pela segunda metade de T40K
Composta pelos 1000 primeiros estudantes de T20Ka
Composta pelos 500 primeiros estudantes de T1000
Composta pelos 200 primeiros estudantes de T500
Composta pelos 100 primeiros estudantes de T100
Composta pelos 52 primeiros estudantes de T100
Composta por 30 estudantes com thetas variados, escolhidos de T200: 10 acima de 1;
10 abaixo de -1 e 10 entre esses valores
Composta pelos 27 primeiros estudantes de T52
Instrumentos
O instrumento utilizado foi a prova de
matemtica para Avaliao de Desempenho,
composto por 25 itens de mltiplas escolhas, com
quatro alternativas. A prova foi elaborada pelo
ncleo de contedo do Projeto de Avaliao
146
RESULTADOS E DISCUSSO
Para verificar o impacto do tamanho da
amostra na estimativa do nvel de dificuldade dos
itens, foi calculada a dificuldade da prova a partir
da mdia dos b de todos os seus itens. Em
seguida, foi calculada a diferena dos valores
encontrados nas amostras parciais em relao
amostra completa (com 44 mil estudantes).
Tambm foram calculadas as correlaes dos b
dos itens entre as amostras parciais e a amostra
completa. A Tabela 2 apresenta as informaes
citadas e a Figura 3 (anexo 1) apresenta os nveis de
dificuldade (parmetro b) para os 5 primeiros itens
da prova, na parte A, e nas partes B e C os
diagramas de disperso dos bs sempre em
comparao com a amostra completa.
T27
-0,03
0,19
0,18
-0,13
-0,54
0,15
-0,33
0,16
-0,07
0,10
-0,15
-0,31
-0,35
-1,55
-0,17
-0,14
-1,07
-1,74
-0,88
-0,86
-0,89
-1,23
-1,27
-1,78
-2,05
T30C
1,12
1,56
1,74
1,11
0,91
1,10
1,42
0,67
1,10
1,30
0,05
0,80
0,48
0,53
1,35
0,44
0,05
0,34
-0,73
-0,02
-0,16
-0,05
-0,08
-1,05
-1,87
T52
0,05
0,42
0,45
0,16
-0,10
0,51
0,04
0,13
-0,19
0,38
-0,04
0,16
0,24
-0,75
-0,23
0,22
-1,02
-0,82
-0,83
-0,95
-0,76
-1,07
-1,20
-1,29
-1,97
T100
0,64
0,95
1,31
0,73
0,72
0,83
0,62
0,44
0,20
0,60
0,36
0,78
0,90
0,29
0,35
0,74
-0,18
-0,05
-0,50
-0,36
-0,51
-0,19
-0,64
-0,77
-1,56
T200
1,04
1,57
1,72
1,46
1,27
1,16
1,15
0,69
0,65
0,89
0,78
1,10
1,00
0,52
0,81
0,75
-0,18
0,33
-0,52
-0,09
-0,69
-0,42
-0,43
-1,00
-1,85
T500
1,36
1,57
1,76
1,55
1,17
1,14
1,19
0,84
0,71
0,61
0,73
1,09
0,88
0,87
0,64
0,60
-0,17
0,15
-0,61
-0,29
-0,70
-0,66
-0,35
-1,11
-2,15
T1000
1,48
1,61
1,54
1,57
0,98
1,12
0,81
0,87
0,81
0,76
0,69
0,77
0,80
0,59
0,68
0,65
-0,13
0,08
-0,62
-0,36
-0,75
-0,59
-0,48
-1,04
-1,95
T20Ka
1,73
1,60
1,51
1,39
1,04
0,95
1,04
0,80
0,79
0,74
0,75
0,87
0,73
0,80
0,75
0,57
-0,36
-0,31
-0,64
-0,78
-0,87
-0,76
-0,99
-1,12
-2,48
T20Kb
2,02
1,66
1,42
1,40
1,00
1,07
0,86
0,97
0,93
0,89
0,87
0,75
0,82
0,73
0,59
0,68
-0,19
-0,20
-0,42
-0,67
-0,64
-0,65
-0,67
-1,06
-2,26
T40K
1,85
1,64
1,46
1,39
1,02
1,02
0,94
0,90
0,87
0,83
0,83
0,81
0,78
0,76
0,69
0,63
-0,25
-0,32
-0,54
-0,73
-0,75
-0,75
-0,87
-1,13
-2,39
Correlao
Diferena
0,84
0,97
0,90
0,39
0,92
0,72
0,94
0,38
0,96
0,25
0,98
0,19
0,99
0,14
1,00
0,07
1,00
0,07
1,00
0,00
Impacto do Tamanho da Amostra na Calibrao de Itens e Estimativa de Escores por Teoria de Resposta ao Item
147
148
1,20
1,00
0,80
0,60
0,40
0,20
0,00
T27
T30C
T52
T100
T200
T500
T1000
T20Ka
T20Kb
Amostra
ITEM
item10
item16
item24
item23
item20
item06
item08
item13
item21
item14
item07
item18
item02
item05
item12
item03
item19
item15
item09
item01
item25
item22
item11
item17
item04
T27
0,81
0,82
0,78
0,78
0,82
0,79
0,77
0,82
0,77
0,79
0,82
0,78
0,76
0,77
0,78
0,72
0,70
0,81
0,75
0,79
0,73
0,72
0,73
0,75
0,77
T30C
0,81
0,87
0,82
0,85
0,81
0,79
0,85
0,87
0,81
0,78
0,77
0,82
0,79
0,86
0,80
0,82
0,81
0,82
0,78
0,82
0,84
0,81
0,82
0,80
0,76
T52
0,85
0,88
0,79
0,86
0,82
0,83
0,86
0,83
0,85
0,81
0,81
0,83
0,83
0,82
0,80
0,80
0,75
0,87
0,80
0,86
0,77
0,76
0,77
0,75
0,76
T100
1,01
1,04
0,93
0,95
0,98
0,92
1,01
0,92
0,98
0,99
0,98
0,93
0,94
0,87
0,93
0,97
0,86
0,94
0,89
0,91
0,96
0,91
0,85
0,82
0,78
T200
0,99
1,02
0,88
0,90
0,94
0,81
0,93
0,82
0,91
0,87
0,90
0,86
0,84
0,75
0,84
0,94
0,76
0,78
0,76
0,77
0,77
0,71
0,72
0,69
0,64
T500
1,25
1,15
0,93
1,08
1,11
0,95
1,13
0,84
0,94
0,93
0,83
0,90
0,83
0,73
0,82
0,96
0,75
0,74
0,72
0,75
0,68
0,62
0,64
0,62
0,53
T1000
1,39
1,16
0,94
1,08
1,08
0,92
1,20
0,94
0,90
0,94
0,93
0,93
0,86
0,77
0,86
1,05
0,72
0,73
0,68
0,76
0,65
0,61
0,56
0,58
0,42
T20Ka
1,49
1,26
1,22
1,16
1,22
1,16
1,10
1,05
1,05
0,94
0,94
0,92
0,81
0,82
0,78
0,80
0,72
0,70
0,65
0,61
0,55
0,48
0,40
0,30
0,28
T20Kb
1,54
1,29
1,28
1,31
1,19
1,09
1,14
1,10
1,14
0,98
0,94
0,92
0,86
0,85
0,80
0,81
0,74
0,73
0,68
0,61
0,62
0,48
0,44
0,37
0,31
T40K
1,54
1,29
1,27
1,25
1,21
1,15
1,12
1,11
1,10
0,97
0,94
0,91
0,85
0,83
0,81
0,80
0,72
0,71
0,66
0,61
0,59
0,48
0,41
0,31
0,29
Correlao
Diferena
0,60
0,26
0,34
0,26
0,66
0,25
0,76
0,24
0,87
0,20
0,92
0,14
0,92
0,12
1,00
0,02
1,00
0,02
1,00
0,00
0,30
0,25
0,20
0,15
0,10
0,05
0,00
T27
T30C
T100
T200
T500
T1000
T20Ka
T20Kb
T40K
Amostra
Figura 6. Diferenas entre o ndice de discriminao mdio das provas nas amostras.
Avaliao Psicolgica, 2005, 4(2), pp. 141-153
T52
Impacto do Tamanho da Amostra na Calibrao de Itens e Estimativa de Escores por Teoria de Resposta ao Item
149
theta20ka
1,00
theta20kb
1,00
theta1k
1,00
1,00
theta500
0,99
0,98
0,98
theta200
0,97
0,96
0,96
0,99
theta100
0,99
0,99
0,99
0,99
0,98
theta50
0,99
0,99
0,99
0,98
0,96
1,00
theta50E
0,98
0,99
0,99
0,98
0,97
0,98
0,98
theta25
0,99
0,99
0,99
1,00
1,00
1,00
1,00
0,98
Tabela 5. Regresso entre o theta das amostras parciais comparados amostra completa.
constante
B
theta25
1,06
0,85
theta50
0,79
0,97
theta50E
0,13
0,85
theta100
0,18
1,06
theta200
0,09
0,93
theta500
0,04
0,94
Theta1000
-0,01
1,03
theta20kA
-0,02
1,00
theta20kB
0,03
0,98
CONSIDERAES FINAIS
Esse estudo objetivou verificar o efeito do
tamanho da amostra na confiabilidade das
estimativas dos parmetros dos itens e das
capacidades dos sujeitos. De forma geral pode-se
Avaliao Psicolgica,
4(2), pp.
141-153
concluir que amostras
com 5002005,
sujeitos
trazem
resultados muito prximos aos estimados com
amostras maiores. Amostras com 200 sujeitos
Avaliao Psicolgica, 2005, 4(2), pp. 141-153
150
Impacto do Tamanho da Amostra na Calibrao de Itens e Estimativa de Escores por Teoria de Resposta ao Item
151
152
ANEXO 1
Sobre os autores:
Carlos Henrique Sancineto da Silva Nunes:
Psiclogo,
Doutor
em
Psicologia
do
Desenvolvimento pela Universidade Federal do Rio
Grande do Sul e pesquisador do Laboratrio de
Mensurao da UFRGS.
Ricardo Primi: Psiclogo, Doutor em Psicologia
Escolar e do Desenvolvimento Humano pela
Universidade de So Paulo e docente na graduao
e Ps Graduao Stricto Sensu em Psicologia da
Universidade So Francisco.
T40K
T27
3,00
T40K
T200
3,00
T40K
T30C
T40K
T52
2,00
T40K
T500
T40K
T1000
2,00
T40K
T100
T40K
T20Ka
T40K
T20Kb
1,00
1,00
0,00
0,00
-1,00
-1,00
-2,00
-2,00
-3,00
-3,00
-3,00
-2,00
-1,00
0,00
1,00
2,00
3,00
-3,00
-2,00
-1,00
0,00
1,00
2,00
3,00
Figura 3. Comparao dos ndices de dificuldade dos itens nas amostras estudadas.
Impacto do Tamanho da Amostra na Calibrao de Itens e Estimativa de Escores por Teoria de Resposta ao Item
153
ANEXO 2
T40K
T27
1,60
T40K
T200
1,60
T40K
T500
T40K
T30C
T40K
T52
1,40
T40K
T1000
1,40
T40K
T20Ka
T40K
T100
T40K
T20Kb
1,20
1,20
1,00
1,00
0,80
0,80
0,60
0,60
0,40
0,40
0,20
0,20
0,20
0,20
0,40
0,60
0,80
1,00
1,20
1,40
0,40
0,60
0,80
1,00
1,20
1,40
1,60
1,60
C
B
Figura 5. ndice de discriminao dos itens nas amostras estudadas.