Share your thoughts, 1 month free Claude Pro on usSee more

General AI Assistant Reasoning on BrowseComp

51.5Pass@1 Accuracy

OPENAI DEEPRESEARCH

Updated 4mo ago

Evaluation Results

Method	Links
OPENAI DEEPRESEARCH 2026.03		51.5
MIRO-30B + WEDAS 2026.03		26
GPT-5-MINI + WEDAS 2026.03		17
MIRO-30B + MIROFLOW 2026.03		17
GPT-5-MINI + MIROFLOW 2026.03		15
WEBSAILOR-72B 2026.03		12
WEBSAILOR-32B 2026.03		10.5
O4-MINI 2026.03		6.1
ASEARCHER-WEB-32B 2026.03		5.2
WEBDANCER-QWQ-32B 2026.03		3.8
SEARCH-O1-32B 2026.03		2.8
WEBTHINKER-32B-RL 2026.03		2.8
GPT-4.1 2026.03		1.5
QWEN-2.5-32B 2026.03		0.6
QWEN-2.5-72B 2026.03		0.6
GPT-4O 2026.03		0.6
QWQ-32B 2026.03		0.5