全文翻译
摘要
我们提出了一个用于单步生成建模的有原则且有效的框架。与Flow Matching方法所建模的瞬时速度不同,我们引入了平均速度的概念来刻画流场。我们推导了平均速度和瞬时速度之间明确的恒等式,并将其用于指导神经网络训练。我们的方法被称为MeanFlow模型,它是自包含的,不需要预训练、蒸馏或课程学习。MeanFlow在实验中表现出了强大的性能:在ImageNet 256×256上,从头开始训练的模型通过单次函数评估(1-NFE)实现了3.43的FID,显著优于之前最先进的单步扩散/流模型。我们的研究大幅缩小了单步扩散/流模型与其多步前身之间的差距,希望能激励未来的研究重新审视这些强大模型的基础。