Share your thoughts, 1 month free Claude Pro on usSee more

Full-Duplex-Bench

Benchmarks

Task Name	Dataset Name	SOTA Result
Pause Handling	Full-Duplex-Bench Candor	TOR1	19
Interruption Handling	Full-Duplex-Bench	GPT-4o Score4.59	18
Turn Taking	Full-Duplex-Bench	TOR99.2	17
Duplex Dialogue Turn-Taking	Full-Duplex-Bench	Synthetic TOR for Pause Handling0.01	15
Smooth Turn Taking	Full-Duplex Bench v1.0	TOR0.983	11
Backchanneling	Full-Duplex-Bench	TOR100	11
Pause Handling	Full-Duplex-Bench Synthetic	TOR99	11
Full-duplex speech interaction	Full-Duplex-Bench v1	TOR (Synthetic Pause)93.4	9
Full-duplex Speech Interaction Latency Analysis	Full-Duplex-Bench v1.5	Stop Latency (Mean)0.68	8
User Interruption	Full-Duplex-Bench 1.0	TOR1	8
Full-Duplex Speech Interaction	Full-Duplex-Bench Background Speech 1.5	Respond Rate93	7
Full-Duplex Speech Interaction	Full-Duplex-Bench 1.5 (Talking to Other)	Response Rate91	7
Full-Duplex Speech Interaction	Full-Duplex-Bench User Backchannel 1.5	Respond Rate7	7
Full-Duplex Speech Interaction	Full-Duplex-Bench User Interruption 1.5	Response Rate78	7
Backchannel	Full-Duplex-Bench 1.0	TOR1	7
Voice Cloning Speaker Similarity	Full-Duplex-Bench	SSIM57	5
Dialog Naturalness	Full-Duplex-Bench	DMOS3.9	5
Backchannel	Full-Duplex Bench v1.5	Respond Rate7	4
Interruption	Full-Duplex Bench v1.5	Respond Rate72	4
Overlap Handling Evaluation	Full-Duplex-Bench User Interruption v1.5	STOI0.97	2
Overlap Handling Evaluation	Full-Duplex-Bench User Backchannel v1.5	STOI91	2
Overlap Handling Evaluation	Full-Duplex-Bench Talking to Other v1.5	STOI0.96	2
Overlap Handling Evaluation	Full-Duplex-Bench Background Speech v1.5	STOI0.98	2
Turn Taking	Full-Duplex-Bench Bilingual Chinese	TOR99.4	2
Turn Taking	Full-Duplex-Bench EN	Latency (ms)205	1

Showing 25 of 26 rows