QMSum

Benchmarks

Task Name	Dataset Name	SOTA Result
Query-based meeting summarization	QMSum (test)	ROUGE-219.63	34
Next Token Prediction	QMSum	Next Token Accuracy47	32
Long-context language generation	QMSum	Average Acceptance Length (τ)3.15	25
Query-focused Summarization	QMSum (test)	ROUGE-138.67	23
Summarization	QMSum (val)	ROUGE-L0.2378	17
Traceback (Prompt Injection Attacks)	QMSum	Precision99	13
Query-based Summarization	QMSum Golden v1 (test)	ROUGE-140.85	11
Abstractive Summarization	QMSum	BLEU6.75	11
Meeting Summarization	QMSum	Coherence4.47	10
Query-focused summarization	QMSum	ROUGE-135.8	10
Context Traceback	QMSum LongBench	Precision99	10
Synthetic Text Generation	QMSum	Mean Embedding Similarity52	10
Query-based Meeting Summarization	QMSum	Overall Score14.734	10
Document Summarization	QMSum (test)	ROUGE-138.9	10
Long-context retrieval	QMSum LongEmbed	nDCG@100.813	9
Document Summarization	QMSum	G-mean15.47	9
Summarization	QMSum	Std Dev ROUGE-10.3	8
Payload-splitting attack detection	QMSum	Precision (QMSum)81	6
Query-focused Meeting Summarization	QMSum 50 samples	Fluency4.88	6
Summarization	QMSum (test)	Fluency4.93	5
Retrieval	QMSum	R@1058.82	4
Next Token Prediction	QMSum	Acc (BERT-Small, Epsilon=Inf)32.82	4
Abstractive Meeting Summarization	QMSum	Coreference1.67	4
Meeting Summarization	QMSum (all turns)	ROUGE-134.03	4
Summarization	QMSum Golden (test)	Best Score65	3

Showing 25 of 31 rows