Share your thoughts, 1 month free Claude Pro on usSee more

Deep Search Reasoning on XBench DeepSearch2505

41Score

Claude-3.7-Sonnet

Updated 4mo ago

Evaluation Results

Method	Links
Claude-3.7-Sonnet 2026.02		41
CSO 2026.02		29
GPT-4.1 2026.02		27
Step-DPO 2026.02		25
IPR 2026.02		24
CK-Pro-8B 2026.02		23
ETO 2026.02		22
RFT 2026.02		20
Qwen3-8B 2026.02		7