Share your thoughts, 1 month free Claude Pro on usSee more

Knowledge Evaluation on SuperGPQA (Original)

11.01Accuracy

STOC

Updated 2mo ago

Evaluation Results

Method	Links
STOC 2026.05		11.01
STOC 2026.05		10.76
LAMOL 2026.05		10.63
LAMOL 2026.05		10.6
Naive 2026.05		9.48
Naive 2026.05		9.4