Share your thoughts, 1 month free Claude Pro on usSee more

Multimodal Document Reasoning on SlideVQA, MMLongBench-Doc, and ViDoSeek

55.6Average Score

Lang2Act

Updated 4mo ago

Evaluation Results

Method	Links
Lang2Act 2026.01		55.6
EVisRAG 2026.01		51.56
Pixel-Reasoner 2026.01		51.32
Vision-R1 2026.01		51.21
OpenVLThinker 2026.01		48.73
ThinkLite-VL 2026.01		46.77
VRAG-RL 2026.01		46.36
MM-Search-R1 2026.01		45.47
VisionMatters 2026.01		44.68
GOT 2026.01		43.78
R1-Onevision 2026.01		42.46
Direct 2026.01		41.96
TOT 2026.01		40.56
VisDom 2026.01		39.57