全文翻译
摘要
我们提出了NitroFusion,这是一种截然不同的单步扩散方法,它通过动态对抗框架实现了高质量生成。尽管单步方法具有显著的速度优势,但与多步方法相比,它们通常存在质量下降的问题。就像一组艺术评论家通过专注于构图、色彩和技巧等不同方面来提供全面反馈一样,我们的方法维持了一个庞大的专业判别器头池,这些判别器头共同指导生成过程。每个判别器组都在不同的噪声水平上培养特定质量方面的专业知识,提供多样化的反馈,从而实现高保真的单步生成。我们的框架结合了:(i)具有专业判别器组的动态判别器池,以提高生成质量;(ii)战略性刷新机制,防止判别器过拟合;(iii)用于多尺度质量评估的全局-局部判别器头,以及用于平衡生成的无条件/条件训练。此外,我们的框架通过自底向上的细化独特地支持灵活部署,允许用户使用相同的模型动态选择1-4个去噪步骤,以直接进行质量-速度权衡。通过全面的实验,我们证明NitroFusion在多个评估指标上显著优于现有的单步方法,尤其在保留精细细节和全局一致性方面表现出色。