Share your thoughts, 1 month free Claude Pro on usSee more

Relational Reasoning on VSR

85.7Accuracy

QWEN2.5-VL-7B + PGT

Updated 2mo ago

Evaluation Results

Method	Links
QWEN2.5-VL-7B + PGT 2026.05		85.7
QWEN2.5-VL-7B + SPECIALIZED MIX 2026.05		85.5
IMAGE JIGSAW 2026.05		85.4
INTERNVL3-8B + PGT 2026.05		85.3
INTERNVL3-8B 2026.05		85.2
QWEN2.5-VL-3B + PGT 2026.05		84
QWEN2.5-VL-7B 2026.05		83.8
THINKLITE-VL 2026.05		83.3
QWEN2.5-VL-3B + SPECIALIZED MIX 2026.05		82.8
QWEN2.5-VL-3B 2026.05		80.4
VIGORL-3B 2026.05		74.1
LLAVA-NEXT-LLAMA3-8B 2026.05		71.8
LLAVA-NEXT-LLAMA3-8B + PGT 2026.05		71.8
LLAVA-NEXT-7B + PGT 2026.05		70.9
LLAVA-NEXT-7B 2026.05		64.7
SPATIAL-LADDER-3B 2026.05		60.4