扫码阅读
手机扫码阅读
用SVC做特定人物AI配音 - 你奶奶都会的AI声音教程
36 2024-09-29
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
文章来源:
数字生命卡兹克
扫码关注公众号
《流浪地球》二创配音技术分享
作者分享了如何使用AI技术复现李雪健老师的声音进行《流浪地球》的二创配音。AI声音技术已经大幅提升,变得简单易用,可用于影视、音乐和配音等领域。技术过程主要包括三步:准备声音数据集、在云上训练模型和使用AI声音。
一. 准备数据集
要制作声音数据集,首先找到5~10分钟的干净人声音频,作者是从李雪健老师的作品中提取。使用剪辑软件分离声音并导出为WAV格式。如果数据量不足,可以使用5分钟的迷你数据集。建议使用UVR5工具去除伴奏和混响,最后使用Audio Slicer工具将音频剪裁为10秒小段。
二. 在云上训练模型
使用AutoDL平台进行模型训练,注册并充值后租用实例并选择合适的镜像。按照教程操作,上传数据集并设置模型的参数。训练开始后,关注步数提示和loss参数,每训练800步会保存一个模型,一般3000步左右的模型可以听听效果。
三. 在云上使用AI声音
模型训练完毕后,下载到本地或在云端进行推理使用。通过WebUI上传自己的音频,并选择模型和F0预测器进行音频转换。得益于强大的算力,转换过程快速且不易出错,可以立即体验转换后的声音。
作者感慨AI技术的飞速发展和个人学习的艰辛。通过分享教程和创作,作者希望能够帮助更多人了解并进入AI的世界,完成自己作为“AI世界门童”的使命,为自己找到了价值所在。
想要了解更多内容?
文章来源:
数字生命卡兹克
扫码关注公众号
数字生命卡兹克的其他文章
我花了4天时间,做了一个能实时监控主流AI信息的频道....
免费向所有人开放!
倒反天罡,人类研究起模仿AI了。
“不行啊,再这么发展下去,人类会取代AI的”
2024,我们在深圳,又用AI一起交了个朋友
下一站,我们休闲点,一遍交个朋友一遍度个假。\x0d\x0a所以,云南见。
看了《孤注一掷》后,我决定写一篇防AI诈骗指南...
我想用我自己对AI所有的了解、所有的经验,写这样一篇防AI诈骗指南。
Meta发布Llama3.1,OpenAI推出AI搜索SearchGPT,Deepmind获得奥数银牌,这就是这周的AI大新闻。
7.24~7.29,又是刺激的一周。\x0d\x0a这周的AI大事件,都在这里啦。
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设
白皮书上线