Share your thoughts, 1 month free Claude Pro on usSee more

Deep Search on xbench-DS

75Accuracy

Qwen3-30B-A3B-thinking-SFT + SAPO

Updated 1mo ago

Evaluation Results

Method	Links
Qwen3-30B-A3B-thinking-SFT + SAPO 2026.05		75
Tongyi DeepResearch 2026.05		69
Qwen3-30B-A3B-thinking-SFT + GRPO 2026.05		67
OpenAI-o3 2026.05		66.7
Qwen3-30B-A3B-thinking-SFT 2026.05		53
Kimi K2 2026.05		50
Web-30B-E-GRPO 2026.05		48.5
Qwen3-8B-SFT + SAPO 2026.05		22
Qwen3-8B-SFT + GRPO 2026.05		20
Qwen3-8B-SFT 2026.05		18
Qwen3-8B-SFT + ARPO 2026.05		16
MiroThinker-v1.0-8B 2026.05		13.3
WebSailor-32B 2026.05		11
WebSailor-7B 2026.05		9.3
MiroThinker-v1.5-30B 2026.05		5
WebExplorer-8B 2026.05		2