用SVC做特定人物AI配音 - 你奶奶都会的AI声音教程

模型 AI 10 音频数据集

发布于 2024-09-29

1805

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：用SVC做特定人物AI配音 - 你奶奶都会的AI声音教程

文章来源：

数字生命卡兹克

扫码关注公众号

扫码阅读

手机扫码阅读

文章摘要

《流浪地球》二创配音技术分享

作者分享了如何使用AI技术复现李雪健老师的声音进行《流浪地球》的二创配音。AI声音技术已经大幅提升，变得简单易用，可用于影视、音乐和配音等领域。技术过程主要包括三步：准备声音数据集、在云上训练模型和使用AI声音。

一. 准备数据集

要制作声音数据集，首先找到5~10分钟的干净人声音频，作者是从李雪健老师的作品中提取。使用剪辑软件分离声音并导出为WAV格式。如果数据量不足，可以使用5分钟的迷你数据集。建议使用UVR5工具去除伴奏和混响，最后使用Audio Slicer工具将音频剪裁为10秒小段。

二. 在云上训练模型

使用AutoDL平台进行模型训练，注册并充值后租用实例并选择合适的镜像。按照教程操作，上传数据集并设置模型的参数。训练开始后，关注步数提示和loss参数，每训练800步会保存一个模型，一般3000步左右的模型可以听听效果。

三. 在云上使用AI声音

模型训练完毕后，下载到本地或在云端进行推理使用。通过WebUI上传自己的音频，并选择模型和F0预测器进行音频转换。得益于强大的算力，转换过程快速且不易出错，可以立即体验转换后的声音。

作者感慨AI技术的飞速发展和个人学习的艰辛。通过分享教程和创作，作者希望能够帮助更多人了解并进入AI的世界，完成自己作为“AI世界门童”的使命，为自己找到了价值所在。

数字生命卡兹克

查看原文：用SVC做特定人物AI配音 - 你奶奶都会的AI声音教程

文章来源：

数字生命卡兹克

扫码关注公众号

相关推荐

极佳、中科院等9机构联合首发 | 3万字长文全面解析世界模型(内容生成/自动驾驶等)

1576

模型世界生成视频

击下方卡片，关注“AI生成未来”>>后台回复“GAI

大语言模型的前世今生：万字长文完整梳理所有里程碑式大语言模型（LLMs）

1941

模型训练语言 GPT

点击下方卡片，关注“AI生成未来”>>后台回复“

理解 DDD：编程中的模型思维

1358

模型业务计算机逻辑

业务设计上往往没有建立起特定的领域模型，这是我们架构腐化和软件开发困难的关键原因。**业务领域建立好的模型，并指导代码实践，这就是 ”编程思维“。** DDD 领域驱动设计就是解决这部分问题，与其叫领域驱动设计，不如叫做模型驱动设计。

具身智能成败之关键！干货长文首次全面回顾具身智能领域中的视觉-语言-动作模型！

1699

模型语言视觉机器人

点击下方卡片，关注“AI生成未来”>>后台回复“

超越CogVideoX-5B、Pika、Kling 和 Gen-3！苹果再发新作，视频生成大模型全面报告

1323

模型视频生成图像

点击下方卡片，关注“AI生成未来”后台回复“GAI”??

大模型推理必看！2025最值得读的14篇论文和2篇博客

1116

模型推理论文 LLM

Datawhale干货作者：曾浩龙，Datawhale团队大模型的

数字生命卡兹克

努力分享一些很新、很酷的AI干货。

330 篇文章

浏览 458.3K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

查看方案

数字生命卡兹克的其他文章

笑疯了，AI换装大法让奥特曼都性感起来了。

AI一键换装后，奥特曼和老黄被“玩坏”了

2025，我们又一次用AI，交了个朋友。

我们下一站见。

我把2.0时代的四家AI视频做了个评测对比，发现最好的还是它。

王座轮流坐，今天到我家。

关于ChatGPT的兄弟 - AI绘图的小思考

要成长为新的物种，就要经历所有你不会再扮演的角色。

体验完腾讯元宝的深度阅读，我觉得我以后的论文和研报有救了。

阅读的救星。

随机阅读

一个即将秃头的工程师，解答你对“变异测试”的所有困惑

07-15

明知“空降兵”存活率低，为什么还要引入“空降兵”？

读书踩坑，速读《三板斧-阿里巴巴管理之道》

08-17

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

用SVC做特定人物AI配音 - 你奶奶都会的AI声音教程

版权声明

《流浪地球》二创配音技术分享

一. 准备数据集

二. 在云上训练模型

三. 在云上使用AI声音

敏捷和瀑布研发模式如何进行融合？

还在用多套工具管项目？

联系我们

融实践库

微信公众号

微信视频号

社区微信群