HumDial

Benchmarks

Task Name	Dataset Name	SOTA Result
Empathetic Response Generation	HumDial Challenge Track 1 Task 3-en (dev)	LLM Score (0-5)4.36	6
Empathetic Response Generation	HumDial Challenge Track 1 Task 3-zh (dev)	LLM Score (0-5)4.53	6
Emotional Reasoning	HumDial Challenge Track 1 Task 2-zh (dev)	LLM Score4.98	6
Full-duplex dialogue	HumDial 1.5 (dev)	First Response Delay1.528	2
Full-duplex dialogue	HumDial 1.5 (test)	Interruption Score89.7	1

Showing 5 of 5 rows