DiffuSeq-v2: Bridging Discrete and Continuous Text Spaces for Accelerated Seq2Seq Diffusion Models

About

Diffusion models have gained prominence in generating high-quality sequences of text. Nevertheless, current approaches predominantly represent discrete text within a continuous diffusion space, which incurs substantial computational overhead during training and results in slower sampling speeds. In this paper, we introduce a soft absorbing state that facilitates the diffusion model in learning to reconstruct discrete mutations based on the underlying Gaussian space, thereby enhancing its capacity to recover conditional signals. During the sampling phase, we employ state-of-the-art ODE solvers within the continuous space to expedite the sampling process. Comprehensive experimental evaluations reveal that our proposed method effectively accelerates the training convergence by 4x and generates samples of similar quality 800x faster, rendering it significantly closer to practical application. \footnote{The code is released at \url{https://github.com/Shark-NLP/DiffuSeq}

Shansan Gong, Mukai Li, Jiangtao Feng, Zhiyong Wu, Lingpeng Kong• 2023

Related benchmarks

Task	Dataset	Result
Paraphrase Detection	QQP (test)	Accuracy91.7	51
Text Simplification	WikiAuto	BLEU26.6	29
Paraphrasing	QQP	BLEU22.1	22
Paraphrase Generation	QQP	BLEU23.07	19
Seq2Seq generation	QQP	BLEU0.2411	17
Question Generation	Question Generation	BLEU0.175	13
Paraphrase	Paraphrase	BLEU0.243	8
Text Simplification	Text Simplification	BLEU0.371	8
Open-domain dialogue	Open Domain Dialogue	BLEU0.011	8
Abstractive Summarization	arXiv	ROUGE-139.12	7

Showing 10 of 12 rows

Other info

Follow for update

@wizwand_team Discord