Personalization Evaluation Benchmark

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Open-ended VQA	Personalization Evaluation Benchmark	BLEU (Single)0.716		11
Existence Recognition	Personalization Evaluation Benchmark	Recall (Single)87.3		11

Showing 2 of 2 rows