SOTA Text-to-Audio benchmarks and papers with code

Benchmarks

Dataset Name	SOTA Method	Metric
AudioCaps	AudioLDM 2	FD (OpenL3)1.86	27	24d ago
RiTTA (test)	AudioLDM (L-Full)	FAD5.47	11	3mo ago
AudioCaps 2019 (test)	UNISON (D24, 16kHz)	FAD1.558	10	1mo ago
VGGSound-Omni (test)	Omni2Sound	KL Divergence1.35	10	4mo ago
AudioSet Strong	T2A-Adapter	F1 Event54.36	9	4mo ago
Downstream Audio Generation TTA	LoSATok	FAD1.987	8	1mo ago
Text-to-Audio (test)	T2A-Adapter	Loudness MAE1.4	7	4mo ago
OpenBookQA (test)	SIFT	Accuracy54.3	6	3mo ago
COSE (test)	BLUR	Accuracy53.6	6	3mo ago
ESNLI (test)	SIFT	Accuracy79.6	6	3mo ago
AudioBox	TangoFLUX	Clarity Score (CE)3.54	6	4mo ago
AudioCaps multi-event prompts	TANGOFLUX	FDopenl375.2	5	4mo ago
English brief-answers	Mini-Omni	Avg CER1.01	3	2mo ago
T2A Evaluation Set	AudioX	Overlap Score (OVL)81.5	3	3mo ago

Showing 14 of 14 rows