让数字人视频告别"恐怖谷"！字节团队最新DreamActor-M1实现人类表情动作像素级操控

本文面部视频 3D 动画

发布于 2025-07-31

1169

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：让数字人视频告别"恐怖谷"！字节团队最新DreamActor-M1实现人类表情动作像素级操控

文章来源：

AI生成未来

扫码关注公众号

扫码阅读

手机扫码阅读

文章主旨：

本文提出了一种基于DiT的框架DreamActor-M1，结合混合控制信号和渐进训练策略，实现多尺度适应、鲁棒性和表现力强的人像动画生成。

关键要点：

提出基于DiT的DreamActor-M1框架，解决细粒度可控性、多尺度适应性和长期时间一致性问题。
设计了混合控制信号，包括隐式面部表征、3D头部球体和身体骨架，解耦面部表情、身份和身体姿态。
开发补充的外观引导机制，以缓解未见区域信息差距，实现复杂动作和长期一致的视频生成。
采用渐进式训练策略，逐步优化模型性能，实现从肖像到全身视图的多尺度适应。
实验表明，DreamActor-M1在肖像、上半身和全身生成方面优于现有方法，提供高质量动画效果。

内容结构：

解决的问题：现有基于图像的人像动画在细粒度控制、多尺度适应性和长期时间一致性上的不足。
提出的方案：DreamActor-M1框架结合混合控制信号和渐进训练策略。
应用的技术：
- 动作引导：隐式面部表征、3D头部球体和3D身体骨架。
- 尺度适应：通过渐进训练策略处理多尺度图像。
- 外观引导：多参考注入协议增强视频生成一致性。
方法：详细介绍DiT骨干网络、混合控制信号、外观引导和分阶段训练过程。
实验与结果：定量和定性评估表明DreamActor-M1在视频生成质量和一致性上优于现有方法。
局限性：动态摄像机运动控制和极端情况下的骨长调整稳定性仍需进一步研究。

文章总结：

本文介绍了一种创新的人像动画生成方法，解决了动画生成中的多项核心挑战，为未来复杂动作建模和实际应用提供了重要启发。

AI生成未来

查看原文：让数字人视频告别"恐怖谷"！字节团队最新DreamActor-M1实现人类表情动作像素级操控

文章来源：

AI生成未来

扫码关注公众号

相关推荐

CVPR`24 | 4D编辑哪家强？浙大首次提出通用指导4D编辑框架：Instruct 4D-to-4D

813

编辑 4D 本文场景

点击下方卡片，关注“AI生成未来”>>后台回复“

YYDS！数字人终于实现穿、脱衣自由!上大、腾讯等提出3D服装合成新方法：ClotheDreamer

752

服装本文生成高斯

.点击下方卡片，关注“AI生成未来”>>后台回复??

CVPR 2024 Highlight | 让SD乖乖学会文本生360°全景！PanFusion 强势来袭！

844

全景生成本文图像

点击下方卡片，关注“AI生成未来”>>后台回复“

CVPR 2025 | AI视频定制进入多角色狂想时代!英伟达等发布VideoMage巧用"时空组合拳"

1166

主体运动本文视频

Tiamat AI 重磅开源EasyControl！DiT控制新纪元！

图像生成开源界又出“王炸”！南洋理工&阶跃星辰发布iMontage：解锁“多对多”生成新玩法！

297

本文图像训练模型

点击下方卡片，关注“AI生成未来”????扫码免费加入A

1步顶100步！TwinFlow:无需教师模型，仅单步推理，Qwen-Image-20B生成速度涨100倍！

395

本文模型生成 NFE

点击下方卡片，关注“AI生成未来”????扫码免费加入A

AIGC最新技术及资讯

323 篇文章

浏览 338.8K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

AI生成未来的其他文章

ECCV2024｜LightenDiffusion 超越现有无监督方法，引领低光图像增强新纪元！

点击下方卡片，关注“AI生成未来”>>后台回复??

深入探讨用于图像和视频生成的基于transformer的扩散模型

作者：Shoufa Chen 等解读：AIGCer 今天这篇文章探索了?

单GPU一分钟生成16K高清图像！新加坡国立发布LinFusion:无缝兼容Stable Diffusion插件

点击下方卡片，关注“AI生成未来”作者：Songhua Liu等

个性化图像生成新王炸！无需微调，Meta重磅发布Imagine yourself:三大核心全面SOTA！

点击下方卡片，关注“AI生成未来”作者：Zecheng He等?

ECCV2024 | 小成本微调CLIP大模型！CLAP开源来袭：零样本和少样本训练有救了！

.点击下方卡片，关注“AI生成未来”>>后台回复?

随机阅读

提问的目的？好像没那么简单

敏捷测试四象限、测试金字塔与分层自动化

为什么我的团队不承担责任

敏捷教练需要懂多少技术？

如何为你的产品建立护城河？

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询