去噪步数减少50%,图像生成质量反而更好!西湖大学等提出TPDM:自适应噪声调度

模型 图像 生成 步骤 TPDM
发布于 2025-08-01
751

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

扫码阅读
手机扫码阅读

文章主旨:

提出了一种时间预测扩散模型(TPDM),通过自适应噪声调度提高图像生成质量和效率。

关键要点:

  • TPDM可动态调整去噪步骤和噪声水平,实现高质量图像生成和高效率推理。
  • 引入时间预测模块(TPM),根据隐空间特征预测下一步噪声水平并进行优化。
  • 使用强化学习方法,以图像质量为奖励,优化去噪步骤数量和性能表现。
  • 实验表明TPDM在多个基准评估中减少推理步骤的同时提升图像质量,优于现有扩散模型。
  • 提出模型的部分局限性,如模块架构简单和训练方法改进空间。

内容结构:

  • 总览全文:扩散模型在图像生成中表现优秀,但固定去噪调度限制了效率和灵活性。TPDM通过自适应调度解决这一问题,兼顾质量和效率。
  • 动机:不同提示需要不同去噪步数,TPDM动态调整噪声水平,使生成过程更加高效和精准。
  • 方法:
    • 基础知识:介绍扩散模型的原理及流匹配算法。
    • 时间预测扩散模型(TPDM):通过TPM预测噪声衰减率,动态调整去噪调度。
    • 训练算法:采用邻近策略优化(PPO),以最终图像质量为奖励,优化整个生成过程。
  • 实验:
    • 实现细节:使用大型数据集和优化器进行训练。
    • 主要结果:TPDM在减少去噪步骤的同时提升生成性能,特别是在复杂图像生成任务中表现优异。
    • 定量结果:TPDM在多项指标上优于基准模型,符合人类偏好。
    • 用户研究:志愿者评价表明TPDM生成的图像更受欢迎。
    • 消融实验:验证TPM输入选择的重要性。
  • 结论与局限性:TPDM在效率与质量间找到平衡,但模块架构和方法仍有改进空间。

文章总结:

TPDM通过自适应噪声调度在图像生成领域展现了竞争力,同时为未来扩散模型的优化提供了新的方向。

AI生成未来

AIGC最新技术及资讯

334 篇文章
浏览 388.9K

还在用多套工具管项目?

一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。

加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线