Share your thoughts, 1 month free Claude Pro on usSee more

Compositional Reasoning on NaturalBench

35.5Accuracy

InternVL3.5-14B +FINER-Tuning

Updated 4mo ago

Evaluation Results

Method	Links
InternVL3.5-14B +FINER-Tuning 2026.03		35.5
Qwen2.5-VL-7B 2026.03		34.1
Qwen2.5-VL-7B +FINER-Tuning 2026.03		34.1
InternVL3.5-8B +FINER-Tuning 2026.03		31.1
InternVL3.5-14B 2026.03		30.7
InternVL3.5-8B 2026.03		30.4
OmniLMM-12B 2026.03		26.9
LLaVA-1.6-7B +FINER-Tuning 2026.03		19.8
OmniLMM-12B +RLAIF-V 2026.03		19.4
LLaVA-1.6-7B 2026.03		15.7