Seed-TTS-Eval

Benchmarks

Task Name	Dataset Name	SOTA Result
Text-to-Speech	Seed-TTS-Eval (test)	WER1.33	40
Text-to-Speech	Seed-TTS-Eval zh (test)	CER0.93	21
Text-to-Speech	Seed-TTS-Eval (test-hard)	Character Error Rate (CER)5.09	17
Zero-shot Voice Cloning	Seed-TTS-Eval zh (test)	WER0.83	16
Zero-shot Voice Cloning	Seed-TTS-Eval en (test)	WER (%)1.23	16
Zero-shot Voice Cloning	Seed-TTS-Eval Average	WER (%)2.92	12
Zero-shot Voice Cloning	Seed-TTS-Eval zh-hard (test)	WER5.83	12
Text-to-Speech	Seed-TTS-Eval Chinese	WER0.87	10
Zero-shot Speech Generation	Seed-TTS Eval zh (test)	CER0.83	9
Speech Synthesis	Seed-TTS-Eval en (test)	WER1.85	8
Voice-cloning intelligibility	Seed-TTS-Eval zh (test)	WER0.54	8
Speech Synthesis	Seed-TTS-Eval zh-hard (test)	CER6.71	7
Audio Tokenization	Seed-TTS-Eval EN	PESQ (NB)3.02	7
Audio Tokenization	Seed-TTS-Eval ZH	PESQ NB3.3	7
Text-to-Speech	Seed-TTS-Eval English (test)	WER (prompting)1.83	6
Text-to-Speech	Seed-TTS-Eval hard (test)	WER6.83	6
Text-to-Speech	Seed-TTS-Eval EN	UTMOS3.71	3
Zero-shot Voice Conversion	Seed-TTS-Eval en (test)	SMOS3.98	2

Showing 18 of 18 rows