Share your thoughts, 1 month free Claude Pro on usSee more

Search Agent Evaluation on BC-ZH

66.6Average Score

MiniMax-M2.1

Updated 2mo ago

Evaluation Results

Method	Links
MiniMax-M2.1 2026.05		66.6
DeepSeek-V3.2 2026.05		65
GPT-5 High 2026.05		65
Qwen3-8B + ACTGUIDE-RL 2026.05		26.64
Qwen3-8B 2026.05		23.52
Qwen3-8B + RL 2026.05		21.79
Qwen3-4B-Instruct + ACTGUIDE-RL 2026.05		20.41
Qwen3-4B-Instruct + RL 2026.05		15.26
WebSailor-7B 2026.05		14.2
Qwen2.5-7B-Instruct + ACTGUIDE-RL 2026.05		8.31
Qwen3-4B-Instruct 2026.05		7.96
WebThinker-32B-RL 2026.05		7.3
Qwen2.5-7B-Instruct + RL 2026.05		4.84
Qwen2.5-3B-Instruct + ACTGUIDE-RL 2026.05		4.5
Qwen2.5-7B-Instruct 2026.05		4.5
Qwen2.5-3B-Instruct + RL 2026.05		2.42
Qwen2.5-3B-Instruct 2026.05		2.08