General Multi-modal Evaluation Suite

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Multi-modal Understanding	General Multi-modal Evaluation Suite (VQAv2, GQA, VisWiz, ScienceQA-IMG, TextVQA, POPE, MMBench, MM-Vet) standard (test val)	VQAv2 Accuracy77.7		9

Showing 1 of 1 rows