GPT-4 assisted benchmark

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Visual Hallucination Mitigation	GPT-4 assisted benchmark	SHR46.7		15

Showing 1 of 1 rows