Share your thoughts, 1 month free Claude Pro on usSee more

Deep research on BrowseComp-zh

66.6Accuracy

GLM-4.7-358B

Updated 4mo ago

Evaluation Results

Method	Links
GLM-4.7-358B 2026.02		66.6
DeepSeek-V3.2-Thinking-685B 2026.02		65
GPT-5-high 2026.02		63
Kimi-K2-Thinking-1T 2026.02		62.3
o3 2026.02		58.1
RE-TRAC-30B-A3B 2026.02		57.3
Gemini-3-pro 2026.02		51.6
MiniMax-M2-229B 2026.02		48.5
Tongyi-DeepResearch-30B-A3B 2026.02		46.7
IterResearch-30B-A3B 2026.02		45.2
WebSailor-V2-30B-A3B (RL) 2026.02		44.1
OpenAI DeepResearch 2026.02		42.9
Claude-4.5-Sonnet 2026.02		42.4
RE-TRAC-4B 2026.02		36.1
WebExplorer-8B 2026.02		32
InfoAgent-14B 2026.02		29.2
AgentCPM-Explore-4B 2026.02		29
NestBrowse-4B 2026.02		28.4