Share your thoughts, 1 month free Claude Pro on usSee more

Visual Reasoning on VSP

83.7Accuracy

DeepLatent-RL-7B

Updated 1mo ago

Evaluation Results

Method	Links
DeepLatent-RL-7B 2026.05		83.7
AdaReasoner 7B 2026.01		78.36
Mirage-7B 2026.05		76
GPT 5 + Tools 2026.01		71.36
Claude 4 sonnet 2026.01		56.27
GPT 5 2026.01		55.64
Gemini 2.5 flash 2026.01		53.55
Qwen 2.5 VL 72B + Tools 2026.01		45
Qwen 2.5 VL 72B 2026.01		39.09
InternVL3 78B 2026.01		35.09
Qwen 2.5 VL 32B 2026.01		33.91
Qwen 2.5 VL 7B + Tools 2026.01		30.45
Qwen 2.5 VL 7B 2026.01		28.09
Qwen 2.5 VL 3B 2026.01		26.73
PixelReasoner 2026.01		24.55
Qwen2.5-VL-7B 2026.05		13.5
DeepEyes 2026.01		12.18