Share your thoughts, 1 month free Claude Pro on usSee more

Deep Search on X-Bench

75Score (%)

OpenAI GPT-5

Updated 5mo ago

Evaluation Results

Method	Links
OpenAI GPT-5 2026.01		75
Tongyi-DeepResearch + DS-MCM 2026.01		74
Tongyi-DeepResearch 2026.01		69
Tongyi-DeepResearch + LLM-Critic 2026.01		68
MiroThinker-DeepResearch + DS-MCM 2026.01		68
OpenAI DeepSearch 2026.01		66.7
OpenAI o3 2026.01		65
MiroThinker-DeepResearch + LLM-Critic 2026.01		64
MiroThinker-DeepResearch 2026.01		62
Gemini 2.5 Pro 2026.01		56
Qwen3-30B-MoE + DS-MCM 2026.01		53
Grok-3 DeeperSearch 2026.01		50
Qwen3-30B-MoE + LLM-Critic 2026.01		47
Qwen3-30B-MoE 2026.01		42