Visual Understanding

Benchmarks

Dataset Name	SOTA Method	Metric
MM-Vet		MM-Vet Score76.9	190	18d ago
MME	Qwen2-VL	MME Score2,321	54	4mo ago
SEED-Bench	SPAR-3B	SEED Score75.1	36	1mo ago
BLINK	GPT-5	Accuracy69.86	28	25d ago
ScienceQA, TextVQA, and GQA		Avg Relative Accuracy100	26	3mo ago
MME perception and cognition v1.0	BAGEL	MME Perception Score1,687	24	4mo ago
MME (total)	LVRPO	MME-P Score1,699	18	3mo ago
V* Bench	SenseNova-MARS-32B	Avg@8 EM0.942	18	4mo ago
HR-Bench 8K	SenseNova-MARS-32B	Avg@8 Exact Match86.6	17	4mo ago
HR-Bench 4K	SenseNova-MARS-32B	Avg@8 Exact Match90.2	17	4mo ago
MMStar	MM-Eureka-Qwen-7B	Accuracy (Clean)65.9	16	2mo ago
MME Perception	SPAR-3B	MME-P Score1,638	15	1mo ago
CV-Bench	ERNIE 5.0-Base	Accuracy86.96	15	2mo ago
BLINK sub-tasks	InternVL3.5-4B+P^2	Jigsaw Accuracy90.67	14	3mo ago
VisPuzzle	ThinkMorph	Accuracy79	14	2mo ago
V* Bench, HR-Bench, and MME RealWorld	SenseNova-MARS-32B	Average Score85.9	13	4mo ago
MME RealWorld	SenseNova-MARS-32B	Pass@1 Exact Match72.7	13	4mo ago
SAT	GPT-5	Accuracy73.3	11	4mo ago
BLINK J	InternVL3.5	Accuracy80.67	11	4mo ago
VStar	Qwen2.5-VL	Accuracy85.86	11	4mo ago
VSP	ThinkMorph	Accuracy75.83	11	4mo ago
JARVIS-VLA Benchmark 1.0 (test)	GPT-4o	Accuracy76.7	10	4mo ago
MMBench-EN (full)	Bagel	Score85	9	4mo ago
R-Bench (test)	Robust-R1 (SFT and RL)	MCQ (low)65.29	8	4mo ago
MMT	LLaVA	Score1,075.5	8	4mo ago

Showing 25 of 40 rows