Multi-News

Benchmarks

Task Name	Dataset Name	SOTA Result
Abstractive Summarization	Multi-News	ROUGE-221.1	47
Multi-document Summarization	Multi-News (test)	ROUGE-221.7	45
Indirect Prompt Injection	Multi-News	ASR100	42
Long-context language generation	Multi-News	Average Acceptance Length (τ)3.51	25
News Summarization	Multi-News	ROUGE-155	17
Summarization Faithfulness	Multi-News	SummaC38.02	12
Faithfulness Evaluation	Multi-News (test)	SummaC38.5	12
Multi-Document Summarization	Multi-News 256 (test)	ROUGE-146	12
Abstractive Summarization	Multi-News 56k samples (test)	ROUGE Score20.72	12
Extractive Summarization	Multi-News (test)	ROUGE-149.9	9
Topic Generation	Multi-News	Average Aggregate Score0.524	8
Multi-document summarization	Multi-News (test)	Non-Redundancy149	7
Discrimination between Good Faith and Problematic agents (Summarization)	Multi-News 9.0:1	Cohen's d6.55	6
Multi-document Summarization	Multi-News	ROUGE-154.97	2

Showing 14 of 14 rows