Share your thoughts, 1 month free Claude Pro on usSee more

General AI Assistant Reasoning on BrowseComp-zh (BC-zh)

42.9Pass@1 Accuracy

OPENAI DEEPRESEARCH

Updated 4mo ago

Evaluation Results

Method	Links
OPENAI DEEPRESEARCH 2026.03		42.9
MIRO-30B + WEDAS 2026.03		41
MIRO-30B + MIROFLOW 2026.03		34
WEBSAILOR-72B 2026.03		30.1
GPT-5-MINI + MIROFLOW 2026.03		28
DOUBAO-DEEPTHINK 2026.03		26
WEBSAILOR-32B 2026.03		25.5
GPT-5-MINI + WEDAS 2026.03		25
WEBDANCER-QWQ-32B 2026.03		18
SEARCH-O1-32B 2026.03		17.9
ASEARCHER-WEB-32B 2026.03		15.6
O4-MINI 2026.03		15.2
GPT-4.1 2026.03		14.4
GROK-DEEPRESEARCH 2026.03		12.9
QWQ-32B 2026.03		10
WEBTHINKER-32B-RL 2026.03		7.3
QWEN-2.5-72B 2026.03		7
GPT-4O 2026.03		6.2
QWEN-2.5-32B 2026.03		3.9