全文翻译
摘要
扩散模型作为一类新型生成模型近年来备受关注。尽管取得了成功,但这类模型存在一个显著缺陷——采样速度缓慢,需要进行数百甚至数千次函数评估(NFE)。为此,研究人员探索了无学习(learning-free)和有学习(learning-based)两类采样策略来加速采样过程。无学习采样基于扩散常微分方程(ODE)的公式表述,采用各种常微分方程求解器。然而,该方法在准确追踪真实采样轨迹方面面临挑战,尤其是在函数评估次数较少的情况下。相反,基于知识蒸馏等有学习采样方法需要大量额外训练,限制了其实用性。为克服这些局限性,我们提出了蒸馏型常微分方程求解器(D-ODE求解器),这是一种基于常微分方程求解器公式表述的简洁蒸馏方法。该方法无缝融合了无学习采样和有学习采样的优势。
D-ODE求解器通过对现有常微分方程求解器进行单一参数调整构建而成。此外,我们利用知识蒸馏技术,从大步数常微分方程求解器中提取知识,优化小步数D-ODE求解器,并在一批样本上完成这一过程。综合实验表明,与现有常微分方程求解器(包括DDIM、PNDM、DPM-Solver、DEIS和EDM)相比,D-ODE求解器性能更优,尤其在函数评估次数较少的场景中表现突出。值得注意的是,与以往蒸馏技术相比,我们的方法计算开销可忽略不计,便于与现有采样器快速集成。定性分析表明,D-ODE求解器不仅能提升图像质量,还能忠实遵循目标常微分方程轨迹。