LongVALE

Benchmarks

Task Name	Dataset Name	SOTA Result
Dense video captioning	LongVALE	F156.4	9
Video-to-audio generation	LongVale	FD (VGG)3.23	8
Omni-modal segment captioning	LongVALE 1.0 (test)	ROUGE-L0.224	8
Omni-modal dense video captioning	LongVALE 1.0 (test)	SODA_c2.8	8
Omni-modal temporal video grounding	LongVALE 1.0 (test)	R@0.315.7	8
Segment Captioning	LongVALE	BLEU-48.7	6
Temporal Video Grounding	LongVALE	mIoU45.7	6
Audio-visual temporal grounding	LongVALE	IoU39.1	3

Showing 8 of 8 rows