Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Answer-position balance evaluation on MCQ

0.061MCQ TV

GPT-OSS-20B

0.047520.138510.22950.32049May 12, 2026
Updated 21d ago

Evaluation Results

MethodLinks
2026.05
0.061
2026.05
0.066
2026.05
0.072
2026.05
0.116
2026.05
0.156
2026.05
0.159
2026.05
0.166
2026.05
0.178
2026.05
0.184
2026.05
0.187
2026.05
0.189
2026.05
0.19
2026.05
0.192
2026.05
0.199
2026.05
0.203
2026.05
0.205
2026.05
0.209
2026.05
0.221
2026.05
0.238
2026.05
0.24
2026.05
0.24
2026.05
0.24
2026.05
0.249
2026.05
0.256
2026.05
0.284
2026.05
0.284
2026.05
0.288
2026.05
0.289
2026.05
0.313
2026.05
0.313
2026.05
0.315
2026.05
0.335
2026.05
0.374
2026.05
0.398