Share your thoughts, 1 month free Claude Pro on usSee more

Multi-discipline Reasoning on MMMU

69.1Accuracy

GPT-4o

Updated 29d ago

Evaluation Results

Method	Links
GPT-4o 2026.03		69.1
InternVL3 2026.03		65.6
VISE 2026.06		62.79
VisionZero-CLEVR 2026.06		60.12
VisionZero-Chart 2026.06		60.04
EvoLMM 2026.06		59.92
iReasoner 2026.06		59.85
Base 2026.06		59.47
VisionZero-RW 2026.06		59.33
VisPlay 2026.06		59.18
BAGEL (Ours) 2026.06		58.8
InternVL2.5 2026.03		56
Vanilla 2026.01		55.44
BAGEL 2026.06		55.3
UniCorn 2026.06		53.8
CAPA 2026.01		53.67
VisionZero-CLEVR 2026.06		52.89
BLIP3o-8B (Ours) 2026.06		52.8
VISE 2026.06		52.69
VisPlay 2026.06		52.61
VRE 2026.03		52.1
Semantic-back 2026.03		52
iReasoner 2026.06		51.83
VARGPT-v1.1 (Ours) 2026.06		51.6
EvoLMM 2026.06		51.56
Qwen2.5-VL 2026.03		51.2
BLIP3o-8B 2026.06		50.6
VisionZero-RW 2026.06		50.43
Base 2026.06		50.12
VisionZero-Chart 2026.06		49.98
CAPA 2026.01		49.33
VISE 2026.06		48.89
LLaVA-OneVision 2026.03		48.8
Vanilla 2026.01		48.68
VARGPT-v1.1 2026.06		48.6
VisionZero-CLEVR 2026.06		46.27
VisionZero-Chart 2026.06		46.2
iReasoner 2026.06		46.13
EvoLMM 2026.06		46.02
VisPlay 2026.06		45.42
VisionZero-RW 2026.06		45.41
Base 2026.06		45.17
UniGame 2026.06		43.8
TokenFlow 2026.06		43.2
MetaMorph 2026.06		41.8
Janus-Pro-7B 2026.06		41
VISE 2026.06		40.67
VisionZero-CLEVR 2026.06		39.58
VisionZero-Chart 2026.06		39.5
VisPlay 2026.06		39.27
VisionZero-RW 2026.06		39.27
iReasoner 2026.06		39.11
EvoLMM 2026.06		39.08
Base 2026.06		38.92
ILLUME 2026.06		38.2
PRUNESID 2026.03		37.2
RubiCap-7B_PixMoCap 2026.03		37
LLaVA-v1.5-7B + Visual Lazy Attention 2026.02		36.8
Vanilla 2024.12		36.4
VisionZip 2024.12		36.4
VisionZip ‡ 2024.12		36.4
VisionZip 2024.12		36.4
GPT-4V 2026.03		36.33
Vanilla 2026.03		36.1
PRUNESID 2026.03		36.1
VisionZip 2026.03		36.1
LLaVA-NEXT-13B + Visual Lazy Attention 2026.02		36.1
VisionZip 2024.12		36.1
PRUNESID 2026.03		36
CAPA 2026.01		35.89
RubiCap-3B_DenseFusion 2026.03		35.89
VisionZip 2026.03		35.6
SEED-X 2026.06		35.6
VisionZip ‡ 2024.12		35.4
LLaVA-v1.5-7B 2026.02		35.3
VisionZip ‡ 2024.12		35.3
RubiCap-3B_PixMoCap 2026.03		35.22
VisionZip 2026.03		34.8
Vanilla 2026.01		34.67
Emu3 2026.06		31.6
Janus 2026.06		30.5
Show-o 2026.06		27.4
Chameleon 2026.06		22.4