Video-to-Audio Generation

Benchmarks

Dataset Name	SOTA Method	Metric
VGGSound (test)	Foley-Flow	FAD0.52	95	1mo ago
VGGSound	MMAudio-L	FD_VGG0.97	32	1mo ago
VGG-Sound		Fréchet Distance (FD)0	10	3mo ago
EchoFoley 6k	EchoVidia	Temporal Control Score72	9	4mo ago
AVSync15	LTX-2	FVD701.21	8	26d ago
LongVale	MMHNet - L	FD (VGG)3.23	8	4mo ago
UnAV100	MMHNet - L	FD (VGG)1.8	8	4mo ago
MUSIC (test)		Overall Score4.3	8	4mo ago
VGGSound sparse (test)		Alignment4.82	8	4mo ago
VGGSound original (test)	DIFF-FOLEY	Inception Score62.37	8	4mo ago
OGameData (test)		FD0	7	3mo ago
FoleyBench (test)		FD0	7	3mo ago
AudioCanvas (out-of-domain)	PrismAudio	CLAP52	7	4mo ago
Kling-Eval (test)	V-AURA	FDPaSST474.56	7	4mo ago
VGGSound-Director (test)		FD (VGG)0	6	4mo ago
VGGSound 10 (test)	MMAudio	FAD5.32	4	4mo ago
VisualSound (test)	V-AURA	KLD1.76	4	4mo ago
Human Evaluation V2A	ReWaS	Audio Quality3.7	4	4mo ago
VAS (test)	V-AURA	KLD1.98	3	4mo ago
Kling-Audio-Eval	Omni2Sound	KL Divergence2.47	3	4mo ago
AudioCaps	MDG	FAD10.77	2	2mo ago
Greatest Hits	CondFoleyGen	Accuracy23.94	2	4mo ago
Multi-Caps VGGSound (test)	MMAudio-S-16k + NAG	Audio Quality71.36	1	24d ago
Video-to-Audio (test)	-	-	0	4mo ago

Showing 24 of 24 rows