Share your thoughts, 1 month free Claude Pro on usSee more

Fine-grained visual reasoning on MME Realworld Lite

55.8Avg@1

MAPO

Updated 3mo ago

Evaluation Results

Method	Links
MAPO 2026.04		55.8
Ovis2.5-9B + GRPO 2026.04		55.5
GPT-5 2026.04		55.3
Thyme 2026.04		55.2
Ovis2.5-9B + GSPO 2026.04		54.9
Ovis2.5-9B + DAPO 2026.04		50.3
Mini-o3 2026.04		49.4
Gemini 2.5 Pro 2026.04		49.2
DeepEyes 2026.04		48.4
Ovis2.5-9B + Coldstart SFT 2026.04		47.9
Ovis2.5-9B 2026.04		46.1
Ovis2.5-9B + PPO 2026.04		43