Vision-Language Evaluation Suite

Benchmarks

Task Name	Dataset Name	SOTA Result
Visual Question Answering	Vision-Language Evaluation Suite (MMB, POPE, ScienceQA-Image, TextVQA, GQA, MM-Vet) (test)	MMB Score69.56	10
Vision-Language Understanding	Vision-Language Evaluation Suite MMB, MMStar, MMMU, Hallusion, AI2D, OCR, SEED, SQA (test val)	MMB Score80.7	10
Vision-Language Understanding	Vision-Language Evaluation Suite (ChartQA, DocVQA, AI2D, VQA, AndroidControl, CountBenchQA)	ChartQA Accuracy68.1	2

Showing 3 of 3 rows