全文翻译
摘要
扩散概率模型(Diffusion Probabilistic Models, DPMs)在图像生成领域展现出巨大潜力,但其采样效率受限于大量的去噪步骤。现有的解决方案大多通过提出快速常微分方程(ODE)求解器来加速采样过程。然而,当函数评估次数(NFE)较少时,ODE 求解器不可避免的离散化误差会被显著放大。在本研究中,我们提出了 PFDiff,这是一种全新的无需训练的正交跳步策略,它能使现有的快速 ODE 求解器在较少的 NFE 下运行。具体而言,PFDiff 首先利用过去时间步的分数替换来预测一个 “跳板” 状态。随后,它结合受 Nesterov 动量启发的前瞻更新机制,利用这个 “跳板” 状态快速更新当前的中间状态。这种方法在减少不必要的 NFE 的同时,还能校正一阶 ODE 求解器固有的离散化误差。实验结果表明,PFDiff 在各种预训练的 DPM 模型上都具有灵活的适用性,在条件 DPM 模型中表现尤为出色,超越了以往最先进的无需训练的方法。例如,以 DDIM 为基线,在 ImageNet 64x64 数据集上使用分类器引导时,我们的方法达到了 16.46 的 FID(4 次 NFE),而 DDIM 的 FID 为 138.81;在引导尺度为 7.5 的 Stable Diffusion 模型上,我们的方法以 10 次 NFE 达到了 13.06 的 FID。代码可在https://github.com/onefly123/PFDiff获取。

