InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity

About

Achieving flexible and high-fidelity identity-preserved image generation remains formidable, particularly with advanced Diffusion Transformers (DiTs) like FLUX. We introduce InfiniteYou (InfU), one of the earliest robust frameworks leveraging DiTs for this task. InfU addresses significant issues of existing methods, such as insufficient identity similarity, poor text-image alignment, and low generation quality and aesthetics. Central to InfU is InfuseNet, a component that injects identity features into the DiT base model via residual connections, enhancing identity similarity while maintaining generation capabilities. A multi-stage training strategy, including pretraining and supervised fine-tuning (SFT) with synthetic single-person-multiple-sample (SPMS) data, further improves text-image alignment, ameliorates image quality, and alleviates face copy-pasting. Extensive experiments demonstrate that InfU achieves state-of-the-art performance, surpassing existing baselines. In addition, the plug-and-play design of InfU ensures compatibility with various existing methods, offering a valuable contribution to the broader community.

Liming Jiang, Qing Yan, Yumin Jia, Zichuan Liu, Hao Kang, Xin Lu• 2025

Related benchmarks

Task	Dataset	Result
Identity-preserving Image Generation	MultiID-Bench 1-people	Sim(GT)0.439	18
In-context image generation	OmniContext 1.0 (test)	Single Instance Character Fidelity6.05	13
Subject-driven image generation	OmniContext SINGLE 1.0	Character PF Score7.81	10
In-context Generation	OmniContext SINGLE	Character Fidelity6.05	10
Safe Generation Rate	I2P	GPT-4o Score80.88	9
In-context Generation	In-context Generation Benchmark	Single-item Score6.05	9
Prompt-image Alignment	Sneakyprompt	CLIPScore0.6996	8
Safe Generation Rate	Sneakyprompt	GPT-4o0.7789	8
Safe Generation Rate	MMA-Diffusion	GPT-4o0.7476	8
Prompt-image Alignment	MMA-Diffusion	CLIPScore0.6612	8

Showing 10 of 15 rows

Other info

Follow for update

@wizwand_team Discord