MuTual

Benchmarks

Task Name	Dataset Name	SOTA Result
Dialogue Reasoning	MUTUAL	Accuracy80.8	38
Multi-turn Dialogue Reasoning	MuTual (test)	MRR84.6	19
Information Retrieval	Mutual	NDCG@1047.1	12
Dialogue Generation	MuTual (dev)	MRR54.5	8
Knowledge-Grounded Conversation	Mutual Non-Biased	Performance53	5
Knowledge-Grounded Conversation	Mutual Biased	Performance94	5
Multi-turn dialogue reasoning	MuTual+	R@181.49	3
Multi-turn dialogue reasoning	MuTual	R@188.93	3
Dialogue Reasoning	MuTual (dev)	R4@173.4	3

Showing 9 of 9 rows