CVPR 2025 | 数据荒漠终结者!DoraCycle跨模态自循环算法:让生成不再依赖配对数据

图像 模型 生成 配对 文本
发布于 2025-07-31
568

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

扫码阅读
手机扫码阅读

文章主旨:

DoraCycle框架通过多模态循环一致性学习,显著减少对成对数据的依赖,实现生成模型的高效领域适应。

关键要点:

  • DoraCycle利用无配对数据进行领域适应,通过循环一致性学习实现跨模态对齐。
  • 框架设计了两个循环路径(图像-文本-图像和文本-图像-文本),确保输入与输出的一致性。
  • 采用EMA模型和梯度裁剪技术,解决训练不稳定问题并提升伪数据生成质量。
  • 支持多任务适应,实现无需成对知识的风格化任务和结合少量配对数据的身份生成任务。
  • 实验结果表明,DoraCycle显著减少对成对数据的需求,同时性能可比甚至更优。

内容结构:

  • 解决的问题:

    生成模型适应复杂领域时对成对数据依赖高且获取成本昂贵;现有方法难以利用无配对数据;跨模态对齐存在挑战。

  • 提出的方案:

    设计DoraCycle框架,通过循环一致性学习和自监督学习实现跨模态对齐;采用梯度优化技术提升训练稳定性。

  • 应用的技术:

    使用统一生成模型进行多模态生成;通过循环一致性学习实现领域适应;采用梯度裁剪和EMA技术优化训练。

  • 实验成果:

    无配对数据的风格化任务中,DoraCycle生成效果优于传统方法;结合少量配对数据的身份生成任务中,模型表现出色。

  • 对比实验与消融实验:

    DoraCycle在减少配对数据依赖的同时保持性能优异;移除关键组件如EMA和梯度手术会显著影响模型性能。

文章总结:

DoraCycle框架提供了生成模型领域适应的新思路,适合配对数据稀缺或难以获取的场景,显著降低数据需求并提升模型性能。

AI生成未来

AIGC最新技术及资讯

295 篇文章
浏览 218.5K

还在用多套工具管项目?

一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。

加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线