SDXL-Lightning: Progressive Adversarial Diffusion Distillation

About

We propose a diffusion distillation method that achieves new state-of-the-art in one-step/few-step 1024px text-to-image generation based on SDXL. Our method combines progressive and adversarial distillation to achieve a balance between quality and mode coverage. In this paper, we discuss the theoretical analysis, discriminator design, model formulation, and training techniques. We open-source our distilled SDXL-Lightning models both as LoRA and full UNet weights.

Shanchuan Lin, Anran Wang, Xiao Yang• 2024

Related benchmarks

Task	Dataset	Result
Text-to-Image Generation	GenEval	Overall Score53	914
Text-to-Image Generation	GenEval	Overall Score53	581
Text-to-Image Generation	GenEval	GenEval Score53.32	459
Text-to-Image Generation	GenEval (test)	Two Obj. Acc61	250
Text-to-Image Generation	COCO 30k	FID24.46	77
Text-to-Image Generation	COCO 2014 (val)	--	69
Text-to-Image Generation	COCO 2017 (val)	FID30.16	53
Text-to-Image Generation	HPSv2	HPSv2 Score32.18	35
Text-to-Image Generation	COCO 2014	FID23.92	34
Image Generation	CC3M SDXL v1.0 (test)	FID37.49	27

Showing 10 of 25 rows

Other info

Follow for update

@wizwand_team Discord