全文翻译
摘要
在本文中,我们揭示了扩散U-Net中未被充分利用的潜力,它可作为一种“免费午餐”,在不增加计算成本的情况下显著提升生成质量。我们首先研究了U-Net架构在去噪过程中的关键贡献,发现其主骨干主要负责去噪,而跳跃连接主要将高频特征引入解码器模块,导致网络忽略了骨干的语义信息。基于这一发现,我们提出了一种简单而有效的方法——称为“FreeU”,它无需额外的训练或微调即可提高生成质量。我们的核心见解是策略性地重新加权来自U-Net跳跃连接和骨干特征图的贡献,以利用U-Net架构两个组件的优势。在图像和视频生成任务上的实验结果表明,我们的FreeU可以轻松集成到现有的扩散模型中,例如Stable Diffusion、DreamBooth、ModelScope、Rerender和ReVersion,只需几行代码即可提高生成质量。你所需要做的就是在推理过程中调整两个缩放因子。项目页面:https://chenyangsi.top/FreeU/