Share your thoughts, 1 month free Claude Pro on usSee more

Multimodal Deep Search on MMBC

13.8Accuracy

Gemini-2.5 Pro

Updated 2mo ago

Evaluation Results

Method	Links
Gemini-2.5 Pro 2026.05		13.8
Qwen3-VL-8B + ODE-RL 2026.05		12.5
Gemini-2.5 Flash 2026.05		11.6
GPT-5 2026.05		11.2
Qwen3-VL-30B + ODE-RL 2026.05		11.2
Gemini-2.5 Pro 2026.05		10.3
Qwen3-VL-30B + ODE-SFT 2026.05		10.3
Qwen3-VL-8B + ODE-SFT 2026.05		8.5
Qwen3-VL-8B 2026.05		7.6
Qwen3-VL-30B 2026.05		7.1
Qwen3-VL-8B 2026.05		6.2
Qwen3-VL-30B 2026.05		6.2
Gemini-2.5 Flash 2026.05		4.9
Qwen3-VL-30B 2026.05		4.5
Qwen3-VL-8B 2026.05		4