SOTA Vision-centric Reasoning on RealWorldQA and PapersWithCode

75.4Accuracy

GPT-4o

Updated 29d ago

Evaluation Results

Method	Links
GPT-4o 2025.09		75.4
SAP 2026.02		73.3
Gemini2.0-Flash 2025.09		73.2
Qwen3-VL-8B-Thinking 2026.02		72.8
MiMo-VL-7B-RL 2025.11		72.68
MiMo-VL-7B-SFT 2025.11		71.9
Qwen3-VL-8B-Instruct 2026.02		70.3
Long Grounded Thoughts (SFT + GRPO) 2025.11		69.02
VisionZero-Qwen-7B (Real-World) 2025.09		68.9
Long Grounded Thoughts (Multistage SFT + DPO) 2025.11		68.76
Grok-1.5V 2026.02		68.7
VisionZero-Qwen-7B (Chart) 2025.09		68.5
VisionZero-Qwen-7B (CLEVR) 2025.09		68.4
Qwen2.5-VL-7B 2025.09		68.1
Qwen2.5-VL-7B-Instruct 2025.11		67.84
Gemini-1.5 2026.02		67.5
Qwen2.5-VL-7B-Instruct + LongPerceptualThoughts 2025.11		67.45
Perceval 2026.04		67.4
DeepEyes 2026.04		67
Qwen2.5-VL-7B-Instruct + VLAA-Thinker 2025.11		66.93
ViGaL-Snake+Rotation 2025.09		66.5
OpenVLThinker 2026.04		66.5
Qwen2.5-VL + GRPO 2026.04		66.4
Long Grounded Thoughts (SFT + DPO) 2025.11		66.14
MM-Eureka-Qwen-7B 2025.09		66.1
Long Grounded Thoughts (SFT) 2025.11		65.49
VLAA-Thinker-7B 2025.09		65.4
Perceval 2026.04		64.9
Vision-R1 2026.04		64.1
Pixel-Reasoner 2026.04		64
VL-Rethinker 2026.04		64
Qwen2.5-VL 2026.04		63.4
AKI-4B 2025.03		62.9
Qwen2.5-VL-7B-Instruct + Revisual-R1-final 2025.11		62.48
MM-Eureka 2026.04		62.3
Qwen2.5-VL + GRPO 2026.04		62.1
VLAA-Thinker 2026.04		62
BLIP-3-4B 2025.03		61.6
VLM-R1 2026.04		61.5
GPT-4V 2026.02		61.4
VisRef 2026.02		61.2
Qwen2-VL-2B 2025.03		60.7
Qwen2.5-VL 2026.04		60.6
MolmoE-1B-7B 2026.06		60.5
OpenVLThinker-7B 2025.09		60.2
GeMoE 2026.06		60.1
R1-VL 2026.04		59.5
VisRef 2026.02		59.1
Phi-3-Vision-4B 2025.03		58.8
LMM-R1 2026.04		58.7
TSR 2026.02		58
R1-OneVision-7B 2025.09		58
Jigsaw-R1 2026.04		57.9
ST 2026.02		57.3
TSR 2026.02		56.9
MM1.5-3B 2025.03		56.9
Perception-R1 2026.04		55.8
MiniCPM-V2-3B 2025.03		55.8
ST 2026.02		55.4
LLaVA-1.5-7B 2025.03		54.8
VILA-1.5-3B 2025.03		53.2
Claude-3-Sonnet 2026.02		51.9
Claude-3-Opus 2026.02		49.8
DeepSeek-VL-1.3B 2025.03		49.7
R1-VL 2026.04		49.2
VisRef 2026.02		47.2
TSR 2026.02		44.9
ST 2026.02		44.6