Share your thoughts, 1 month free Claude Pro on usSee more

General Reasoning on AI2D

84.1Accuracy

Qwen3-VL-8B

Updated 2mo ago

Evaluation Results

Method	Links
Qwen3-VL-8B 2026.05		84.1
S^3-FT 2026.05		83.6
S^3-FT 2026.05		82.6
Qwen2.5-VL-7B 2026.05		80.9
S^3-FT 2026.05		80.9
S^3-FT 2026.05		80.6
Nash 2026.05		78.95
LLaVA Critic 2026.05		76.61
Base 2026.05		76.52
Sherlock 2026.05		61.54
VisionSR1 2026.05		60.32