Share your thoughts, 1 month free Claude Pro on usSee more

Long-horizon agentic tasks on BrowseComp Full

56.1Pass@1

MiroThinker-v1.5-30B-A3B

Updated 3mo ago

Evaluation Results

Method	Links
MiroThinker-v1.5-30B-A3B 2026.03		56.1
OpenAI DeepResearch 2026.03		51.5
DeepSeek-v3.2 2026.03		51.4
GPT-5.1 High 2026.03		50.8
OpenAI-o3 2026.03		49.7
Tongyi-DR-30B-A3B 2026.03		43.4
AgentFounder-30B-A3B 2026.03		39.9
Gemini-3.0-Pro 2026.03		37.8
IterResearch-30B-A3B 2026.03		37.3
Claude-4.5-Opus 2026.03		37
AgentFold-30B-A3B 2026.03		36.2
DeepMiner-32B-RL 2026.03		33.5
ASearcher-Web-32B 2026.03		5.2