Share your thoughts, 1 month free Claude Pro on usSee more

Deep Search on HLE text-only

40.8Score

DeepSeek-V3.2-671B

Updated 4mo ago

Evaluation Results

Method	Links
DeepSeek-V3.2-671B 2026.02		40.8
Tongyi-DeepResearch-30B 2026.02		32.9
Minimax-M2-230B 2026.02		31.8
GLM-4.6-357B 2026.02		30.4
Nanbeige4.1-3B 2026.02		22.29
MiroThinker-v1.0-8B 2026.02		21.5
AgentCPM-Explore-4B 2026.02		19.1
Qwen3-30B-A3B-2507 2026.02		14.81
Nanbeige4-3B-2511 2026.02		13.89
Qwen3-4B-2507 2026.02		11.13
Qwen3-8B 2026.02		10.24
Qwen3-14B 2026.02		10.17
Qwen3-32B 2026.02		9.26
Qwen3-Next-80B-A3B 2026.02		9.26