Share your thoughts, 1 month free Claude Pro on usSee more

Large Vision-Language Model Evaluation on DRBench S Subset

47.22MCQ Accuracy

M3ID

Updated 4mo ago

Evaluation Results

Method	Links
M3ID 2026.03		47.22	41.16	43.87
SCI5 2026.03		47.22	42.44	44.58
SCI7 2026.03		47.22	45.98	46.54
VCD 2026.03		46.83	40.84	43.52
TIE 2026.03		45.63	36.66	40.67
SCI3 2026.03		44.05	42.44	43.16
SCI5 2026.03		40.6	60.65	47.95
VCD 2026.03		40.5	56.53	46.38
SCI7 2026.03		40.1	60.65	47.64
M3ID 2026.03		39.9	56.36	45.94
SCI3 2026.03		39.6	60.31	47.2
LLaVA-NeXT 2026.03		39.2	37.63	38.63
TIE 2026.03		39	57.56	45.81
Qwen2-VL 2026.03		38.1	34.41	36.06