如何高效定制视频扩散模型？卡内基梅隆提出VADER：通过奖励梯度进行视频扩散对齐

发布于 2024-10-25

1417

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：如何高效定制视频扩散模型？卡内基梅隆提出VADER：通过奖励梯度进行视频扩散对齐

文章来源：

AI生成未来

扫码关注公众号

扫码阅读

手机扫码阅读

VADER: Video Diffusion Alignment via Reward Gradients

亮点摘要

引入奖励模型梯度对齐方法，通过奖励模型的梯度对视频扩散模型进行调整和对齐。
广泛使用预训练视觉模型，提高任务适应能力和性能。
内存使用的优化技巧，允许在单个16GB VRAM的GPU上训练。
显著改进模型生成质量，优于传统对齐方法。

研究背景

建立视频扩散模型方面取得了进展，但下游任务的调整至关重要。监督微调复杂且繁琐，本文提出利用预训练奖励模型来适应视频扩散模型，学习顶尖视觉辨别模型的偏好。

VADER框架

本文提出VADER，通过奖励函数R(.)指定的特定任务来调整视频扩散模型θ。利用奖励函数相对于模型权重θ的梯度进行高效学习。

奖励模型

使用多种奖励函数来对齐视频扩散模型，包括图像-文本相似度奖励、视频-文本相似度奖励、图像生成目标和视频生成目标。

内存开销优化

VADER提出了减少内存使用的技巧，包括LoRA、混合精度、梯度检查点、截断反向传播和帧子采样。

实验结果

VADER专注于通过图像和视频定制的奖励模型对条件视频扩散模型进行微调，表现出高样本效率和计算效率，并在多种奖励模型上表现良好。

结论

VADER是一个样本和计算高效的框架，通过奖励梯度对预训练视频扩散模型进行微调。它对条件无关，并且适用于文本到视频和图像到视频的扩散模型。

AI生成未来

查看原文：如何高效定制视频扩散模型？卡内基梅隆提出VADER：通过奖励梯度进行视频扩散对齐

文章来源：

AI生成未来

扫码关注公众号

相关推荐

WPS Office AI实战：AI带来的文档智能化体验

4118

AI 文档 ChatGPT WPSAI

Word、Excel、PPT，办公三件套的AI时刻

让GPT开发基于动量的ETF轮动策略

2268

ETF 策略动量 .dropna

让GPT来帮助宝马为“冰淇淋”事件公关

智慧防汛系统里的黑科技有哪些？

1164

在自然灾害频发的背景下，防汛抗旱监测预警系统的重要性愈发凸显。

Google Gemini，人工智能的未来

1732

Gemini 模型生成文本

即将与谷歌的 Gemini 一起踏上疯狂的星际之旅，进入人工智能的未来

兼顾身份保护和文本对齐！中山大学等提出CoRe：任意提示的文本到图像个性化生成！

947

提示语文本生成 embedding

点击下方卡片，关注“AI生成未来”作者：Feize Wu、Xud

DeepSeek + 语雀画网络拓扑图【Graphviz】

1289

AI 连接网络拓扑交换机

Graphviz 适用于复杂网络关系图、树形结构、复杂网络拓扑等场景。网络拓扑图能有效服务于网络规划、故障排查、审计和团队协作，成为网络管理的关键文档。

AI生成未来

AIGC最新技术及资讯

334 篇文章

浏览 429.6K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

查看方案

AI生成未来的其他文章

文本到3D肖像最强生成方案！DiffusionGAN3D: 3D GANs和Diffusion先验强强联合！

关注【AI生成未来】公众号，回复“GAI”，免费获取??

ECCV`24 | 艺术文本和场景文本分割任务新SOTA 方法！华科&Adobe提出WAS！

点击下方卡片，关注“AI生成未来”>>后台回复“

超越α！PixArt家族新秀PixArt-Σ: 由弱到强训练的文本生成4K图像DiT（华为诺亚）

点击下方卡片，关注“AI生成未来”>>后台回复“

即插即用，效率远超ControlNet！贾佳亚团队重磅开源ControlNeXt：超强图像视频生成方法

点击下方卡片，关注“AI生成未来”>>后台回复“

突破空间限制！从2D到3D：北大等开源Lift3D，助力精准具身智能操作！

点击下方卡片，关注“AI生成未来”后台回复“GAI”??

随机阅读

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

如何高效定制视频扩散模型？卡内基梅隆提出VADER：通过奖励梯度进行视频扩散对齐

版权声明

亮点摘要

研究背景

VADER框架

奖励模型

内存开销优化

实验结果

结论

人人都夸的IPD（集成产品开发）究竟好在哪？

还在用多套工具管项目？

联系我们

融实践库

微信公众号

微信视频号

社区微信群