Share your thoughts, 1 month free Claude Pro on usSee more

Web Browsing and Navigation on BrowseComp

68.9Avg@3 Score

ChatGPT-Agent

Updated 3mo ago

Evaluation Results

Method	Links
ChatGPT-Agent 2025.11		68.9
OpenAI-GPT-5-high 2025.11		54.9
OpenAI DeepResearch 2025.11		51.5
OpenAI-o3 2025.11		49.7
MiroThinker-v1.0-72B 2025.11		47.1
GLM-4.6 2025.11		45.1
Minimax-M2 2025.11		44
Tongyi-DeepResearch-30B 2025.11		43.4
MiroThinker-v1.0-30B 2025.11		41.2
DeepSeek-V3.2 2025.11		40.1
DeepMiner-32B-RL 2025.11		33.5
MiroThinker-v1.0-8B 2025.11		31.1
DeepSeek-V3.1 2025.11		30
Claude-4.5-Sonnet 2025.11		19.6
WebExplorer-8B-RL 2025.11		15.7
Claude-4-Sonnet 2025.11		12.2
AFM-32B-RL 2025.11		11.1
Kimi-K2-0905 2025.11		7.4