Share your thoughts, 1 month free Claude Pro on usSee more

Visual Document Reasoning on VDR

27.2Accuracy

Claude-3.7-Sonnet

Updated 2mo ago

Evaluation Results

Method	Links
Claude-3.7-Sonnet 2026.05		27.2
Qwen3-VL-30B + ODE-RL 2026.05		26.4
Qwen3-VL-30B + ODE-SFT 2026.05		24
Qwen3-VL-8B + ODE-RL 2026.05		20.4
Qwen3-VL-8B + ODE-SFT 2026.05		19.2
GPT-5 2026.05		17.6
Claude-4-Sonnet 2026.05		13.6
Qwen3-VL-30B 2026.05		11
GPT-5 2026.05		10.8
Gemini-2.5 Pro 2026.05		10
Gemini-2.5 Pro 2026.05		8
Gemini-2.5 Flash 2026.05		7.8
Gemini-2.5 Flash 2026.05		6.2
Qwen3-VL-8B 2026.05		5
Claude-3.7-Sonnet 2026.05		4.6
Qwen3-VL-30B 2026.05		4.4
Qwen3-VL-8B 2026.05		4.2
Qwen3-VL-30B 2026.05		3.8
Qwen3-VL-8B 2026.05		2.8
Claude-4-Sonnet 2026.05		2