3D人体重建新SOTA!清华&腾讯等重磅发布MagicMan:单一图像生成高质量人体新突破
发布于 2024-10-22
1157
版权声明
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
AI生成未来
扫码关注公众号
扫码阅读
手机扫码阅读
摘要
本文介绍了一种名为MagicMan的新方法,它旨在从单张参考图像生成高质量的多视角人像,以促进3D人体重建。MagicMan通过融合预训练的2D扩散模型和参数化的SMPL-X模型强化泛化能力和几何感知。此外,该方法引入了一种高效的混合多视角注意力机制和几何感知的双分支结构,以及通过迭代优化策略逐步提高SMPL-X姿态的准确性,减少几何畸形问题。
方法与技术
MagicMan方法采用一个预训练的扩散模型作为主干网络,利用单张参考图像和对应的SMPL-X姿态进行生成。通过混合多视角注意力机制和双分支结构,以及迭代优化策略,该方法可生成多达20个视角的一致人体图像。
实验结果
在THuman2.1和CustomHumans数据集上进行的实验结果表明,MagicMan在新视角合成和3D人体重建任务中均显著优于现有方法。同时,作者提供了消融实验和讨论,进一步证实了所提出机制和优化策略的有效性。
总结
MagicMan利用2D生成先验和3D身体先验,有效地从单张图像生成人体的新视角图像,并通过迭代优化提高一致性,为3D人体重建任务提供了有力的支持。
AI生成未来
AI生成未来
扫码关注公众号
还在用多套工具管项目?
一个平台搞定产品、项目、质量与效能,告别整合之苦,实现全流程闭环。
查看方案
AI生成未来的其他文章
LLM和自动驾驶强强联合 | DriveDreamer-2:自动驾驶定制视频生成世界模型!
点击下方卡片,关注“AI生成未来”>>后台回复“
几秒生成逼真3D场景,泛化媲美Stable Diffusion | 浙大&蚂蚁等提出Prometheus
点击下方卡片,关注“AI生成未来”
后台回复“GAI”?
拒绝复制粘贴!Snap&卡内基梅隆提出多主体开集个性化视频生成新范式Video Alchemist!
点击下方卡片,关注“AI生成未来”
后台回复“GAI”?
图像生成/编辑应用落地必不可少!MuLAn:首个实例级RGBA分解数据集(华为诺亚)
点击下方卡片,关注“AI生成未来”>>后台回复“
CVPR 2024 Highlight | 让SD乖乖学会文本生360°全景!PanFusion 强势来袭!
点击下方卡片,关注“AI生成未来”>>后台回复“
加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线
白皮书上线