Handytool
音频免费本地运行

人声分离

在您的浏览器中将人声与音乐、人群和背景噪声分离。

.mp3.wav.ogg.m4a.aac.flac.webm.opus
正在加载模型…

完全在您的浏览器中运行。

关于人声分离

人声分离工具可以从被背景音乐、人群嘈杂声、交通噪声或房间噪声淹没的录音中提取人声——非常适合救助在咖啡厅录制的播客嘉宾、从嘈杂街道上的采访音频中提升音质,或从人声干轨中去除音乐床。上传 MP3、WAV、M4A、OGG 或 FLAC,Handytool 在您的浏览器内完全运行堆叠的 RNNoise 管道和语音活动驱动的门限,您的音频永远不会离开您的设备。两个控制——分离强度和清理次数——让您可以选择轻度清理或完全静音说话者外的任何内容的硬隔离。结果下载为 48 kHz 单声道 WAV 文件。

人声分离功能

  • 01

    两阶段分离,不仅仅是降噪

    多次传递神经网络降噪在每次传递时收紧噪声底线。语音活动驱动的门限随后沉默化模型确信不包含语音的帧——因此背景音乐、掌声和对话完全在短语之间消失。

  • 02

    可调式设计,适应播客或救援工作

    分离强度控制非人声帧被门限的激进程度。降低它以获得自然音效播客效果,提高它以完全去除音乐床或从嘈杂录音中分离人群。

  • 03

    本地运行,无需上传

    整个管道是一个 125 KB WebAssembly 模块,加载一次后保持缓存。音频在您的计算机上完全进行解码、分离和下载——无需服务器往返、无需账户、无需超过 200 MB 文件上限的长度限制。

人声分离常见问题

这与语音增强器有什么区别?
语音增强器运行单次降噪传递并保留录音的自然感受——最适合清理稳定噪声如风扇或空调嗡嗡声。人声分离堆叠多次传递并添加语音活动门限,沉默化说话者外的任何内容——最适合从背景中去除音乐、人群或其他对话。
它能从语音录音中去除背景音乐吗?
是的,当音乐在音量级别上明显低于人声时。门限沉默化不检测到语音的帧,多次降噪在单词期间拉下音乐渗漏。掌握的重音乐与人声音量相同时较难——尝试强度 90–100 和三次传递来处理这些情况。
分离强度滑块做什么?
它设置非人声帧被衰减的激进程度。在 0 处门限松散,您会听到微弱的背景;在 100 处模型不确信是人声的任何内容都变为沉默。70–80 是播客的良好起点,90–100 用于音乐或人群去除。
音频会被上传到服务器吗?
不会。模型和您的文件保留在您的浏览器中。管道是一个小型 WebAssembly 模块,在您的 CPU 上本地运行,因此没有任何内容离开您的计算机。
我得到什么输出格式?
单声道 48 kHz 16 位 PCM WAV 文件。WAV 是无损格式,在每个音频编辑器和播客主机中都能工作。如果需要较小文件,请使用转换音频工具导出 MP3。
录音可以有多长?
接受最高 200 MB 的文件。两次传递在现代笔记本电脑上以大约 3–5 倍实时速度处理,因此 10 分钟的录音在两到三分钟内完成分离。

相关工具

音频

探索更多工具

全部工具