Share your thoughts, 1 month free Claude Pro on usSee more

Web Browsing and Task Completion on BrowseComp

58.3Pass@1 Rate

Tongyi DeepResearch

Updated 2mo ago

Evaluation Results

Method	Links
Tongyi DeepResearch 2025.10		58.3
OpenAI DeepResearch 2025.10		51.5
OpenAI o3 2025.10		49.7
Tongyi DeepResearch 2025.10		43.4
DeepSeek-V3.1 2025.10		30
OpenAI o4-mini 2025.10		28.3
GLM 4.5 2025.10		26.4
Kimi K2 2025.10		14.1
Claude-4-Sonnet 2025.10		12.2