Share your thoughts, 1 month free Claude Pro on usSee more

Science Question Answering on FrontierScience

70.5Accuracy

Qwen3.5-397B

Updated 2mo ago

Evaluation Results

Method	Links
Qwen3.5-397B 2026.05		70.5
Qwen3.5-122B 2026.05		59.8
Kimi-K2.5 2026.05		55.2
Qwen3.5-35B 2026.05		54.3
Deepseek-V3.2 2026.05		54.2
Qwen3.5-9B + MaR 2026.05		50
Qwen3.5-9B 2026.05		42.4
Qwen3.5-9B + DAPO 2026.05		39
GLM-5.1 2026.05		38.2
ARYA 2026.03		37.5
Qwen3.5-4B 2026.05		34.7
GPT-OSS-120B 2026.05		34.4
Qwen3.5-4B + MaR 2026.05		34
Qwen3.5-4B + DAPO 2026.05		33
GPT-5.2 2026.03		25.8
GPT-5.2 (pub) 2026.03		25.8
Claude Opus 4.6 2026.03		8.8
GPT-5.2 2026.03		7.5