Generative Modeling by Estimating Gradients of the Data Distribution
全文翻译
摘要
我们提出了一种新的生成模型,该模型通过朗之万动力学(Langevin dynamics)来生成样本,所使用的梯度是通过分数匹配(score matching估计的数据分布梯度。由于当数据位于低维流形上时,梯度可能定义不明确且难以估计,因此我们用不同程度的高斯噪声对数据进行扰动,并联合估计相应的分数,即所有噪声水平下扰动数据分布的梯度向量场。在采样时,我们提出了一种退火朗之万动力学方法,在采样过程接近数据流形时,使用对应逐渐降低噪声水平的梯度。我们的框架允许灵活的模型架构,在训练过程中无需采样或使用对抗方法,并且提供了一个可用于原则性模型比较的学习目标。我们的模型在MNIST、CelebA和CIFAR - 10数据集上生成的样本可与生成对抗网络(GANs)相媲美,在CIFAR - 10数据集上达到了8.87的新最先进的初始得分(inception score)。此外,我们通过图像修复实验证明了我们的模型能够学习到有效的表示。