SeedTTS

Benchmarks

Task Name	Dataset Name	SOTA Result
Text-to-Speech	SeedTTS en (test)	WER1.521	21
Speech Reconstruction	SeedTTS en (test)	WER0.0214	21
Text-to-Speech	SeedTTS English (test)	WER1.69	12
Zero-shot Voice Imitation	SeedTTS vc-en (test)	UTMOS3.31	10
Text-to-Speech	SeedTTS	WER1.43	8
Voice Conversion	SeedTTS VC English (test)	WER2.15	8
Neural Audio Compression	SeedTTS English (test)	MOS4.126	8
Neural Audio Compression	SeedTTS Chinese (test)	MOS4.221	8
Text-to-speech	SeedTTS en (eval)	WER1.1	7
Neural Audio Coding	SeedTTS-en (OOD)	WER (RVQ-1)10.46	5
Text-to-Speech	SeedTTS en	Error Rate1.39	5
Text-to-Speech	SeedTTS (test)	WER2.14	5
Speech Generation	SeedTTS ZH (test)	CER0.86	3
Voice Imitation	SeedTTS vc-en (test)	N-MOS4.71	3

Showing 14 of 14 rows