转载请注明出处: CHATWEB
本文的链接地址: https://chatweb.com.cn/post-29.html
你是否曾经遇到过这样的困扰:
想提取一段完美的配音,却被背景音乐干扰;
录制了一段重要语音,却发现充斥着环境噪音;
需要纯净的背景音乐,却无法将人声完全分离...这些音频处理的痛点不仅让创作效率大打折扣,更是让许多创作者感到无从下手。但现在,这些烦恼都将成为过去!我们精心筛选了几款强大的音频分离工具,它们就像音频世界的魔法师,能够:
无论你是:
→ 视频创作者寻找完美配乐
→ 配音演员需要纯净的录音效果
→ 音乐爱好者想要提取喜爱的音轨
→ AI训练师需要高质量的声音样本这些工具都能让你的音频处理工作变得轻松自如,让我们一起来探索这些音频处理的黑科技吧!
注意本文中介绍的工具对电脑要求不高,通常加用电脑之类的均可正常使用。
粉丝福利:点击《送给大家的一些福利:各种视频/音频/连环画/文档等》
本文章中用到的工具下载地址:
下载地址1:https://pan.baidu.com/s/1QWdpnGtHTARJ9ghweW6inQ?pwd=avhs
下载地址2:https://pan.quark.cn/s/3c4ba06e02af
剪映
大家剪辑视频时大部分人都会用到的工具,该工具不止能够对视频进行处理,对于视频中的音频同样也能够处理。这里我们以一段视频为例说明。
仅保留人声
对于视频中的音效/杂音之类的比较少的那种视频,我们可以采用这种方法来分离音频,使用起来简单快捷。
这里我们可以实际需要选择"仅保留人声"或者"仅保留背景声",例如我"仅保留人声",再根据时间轴和实际的需要进行剪切,得到的一小段音频如下:
注:剪映适合于使用在那种视频中使用音效/杂音等比较少的场合身上,这样我们就不需要再去安装其他的东西,直接就可以在界面上操作并获取我们想要的音频。
vocal-separate
项目地址:https://github.com/jianchang512/vocal-separate一款由国内大佬封装的AI大模型工具,具备以下特点:核心功能:支持分离音频中的人声和背景音乐,适用于歌曲或包含音乐的音频文件。部署方式:支持本地化部署,无需连接外网即可使用。内置模型:工具自带 2stems、4stems 和 5stems 模型,满足不同音频分离需求。操作便捷:可通过浏览器直接访问,界面简洁,操作简单。也支持通过api调用来访问方便进行集成。格式兼容:支持多种视频和音频格式的处理,包括:
该工具非常适合需要对音频内容进行高效分离的用户,尤其在音乐和音频制作领域具有广泛应用。
使用如下:(打开浏览器访问http://127.0.0.1:9999/)
上传视频后,此工具自动对音频进行提取,接着我们需要对一品进行人声背景声等等的分离。
原音频如下:
分离后背景音如下:
分离后人声如下:
注意:上面这些音频只是进行了分离,还需要进行剪辑,那么我们可以回到剪映进行裁剪即可。
Ultimate Vocal Remover
官网:https://github.com/Anjok07/ultimatevocalremovergui/
Ultimate Vocal Remover(终伴奏人声提取)使用最先进的源分离模型从音频文件中删除人声。核心开发人员通过AI深度学习训练了此软件中所需的所有模型。此安装包包含 UVR 接口、Python、PyTorch 以及有效运行应用程序所需的其他依赖项。
要想获得最好的分离效果,分离模型的选择是最主要的,一般会选择一个专项功能的模型,搭配 MDX-Net 算法下的 UVR-MDX-NET Main
模型,通过 Ensemble Mode 算法融合进行音频分离,能获得较好的结果。
如下图,为提取较纯净的伴奏,把 VR Arc 算法下提取伴奏的专项模型 2_HP-UVR
和 MDX-Net 算法下的 UVR-MDX-NET Main
模型通过 Ensemble Mode 算法融合,即可获得不错的伴奏音频,对于非专业的使用场景,这样的音频质量已经完全足够了。
模型下载
点击小扳手后切换至"Download center"页按照需要下载对应的模型即可
提取伴奏(无和声)
以下模型中,通过 7_HP2-UVR
模型提取的伴奏质量是最好的,但提取速度很慢,可与 2_HP-UVR.pth
模型交替使用。
VR Arch 算法:
1_HP-UVR.pth:非常强的伴奏提取模型
2_HP-UVR.pth:基于1_HP-UVR.pth的微调模型(推荐)
7_HP2-UVR.pth:使用了更多的数据和新参数训练的超强伴奏提取模型(推荐)
8_HP2-UVR.pth:超强伴奏提取模型
9_HP-UVR.pth:基于8_HP2-UVR.pth微调的模型
提取伴奏(带和声)
以下模型中,通过 6_HP-Karaoke-UVR
模型和 UVR Model
模型提取的伴奏质量都比较好,可根据实际情况选择使用。
VR Arch 算法:
5_HP-Karokee-UVR.pth:保留和声模型
6_HP-Karaoke-UVR.pth:作用同5_HP-Karokee-UVR.pth一样(推荐)
MDX-Net 算法:
UVR-MDX-NET Karaoke:保留和声模型
Demuvs 算法:
UVR Model:保留和声模型(推荐)
提取人声
以下模型中提取的人声质量都比较好,可根据实际情况选择使用。
VR Arch 算法:
3_HP-Vocal-UVR.pth:用于人声提取,人声部分会很清晰,但伴奏部分可能会变得浑浊(推荐)
4_HP-Vocal-UVR.pth:用于人声提取,但是比3_HP-Vocal-UVR.pth更加强势(Aggressive)(推荐)
提取吉他
使用 Demucs 算法下的 mdx_extra
模型,设置 CHOOSE STEM(S)
为 Other
,其余设置保持默认,即可完成对音频文件内吉他音轨的提取(或清除,提取剩下的文件就没有吉他音轨了)。提取后的文件中,带 Other 标签的文件就是吉他音轨,带 No Other 标签的文件就是去吉他音轨。具体设置如下图:
这里我们提取某视频人声,设置如下:
源视频:https://www.bilibili.com/video/BV16K411J74p/?spm_id_from=333.337.search-card.all.click&vd_source=2a590f08340930545c7bea183aed992c
最终效果如下:
听着这个效果很不错,里面的背景音等都被清理干净。
最后
音频分离工具的出现,极大地方便了音频剪辑和视频制作,从此告别嘈杂和混乱。无论你是专业的音频工程师,还是普通的内容创作者,这些工具都能让你的工作事半功倍。所以,不妨赶快挑选一款试试看,体验一下这些音频分离黑科技带来的便利与惊喜吧!我相信,
推荐阅读:
转载请注明出处: CHATWEB
本文的链接地址: https://chatweb.com.cn/post-29.html