Handytool
音訊免費本機執行

人聲分離

在您的瀏覽器中將人聲與樂曲、人群和背景噪聲分離。

.mp3.wav.ogg.m4a.aac.flac.webm.opus
正在載入模型…

完全在您的瀏覽器中執行。

關於人聲分離

人聲分離工具可以從被背景樂曲、人群嘈雜聲、交通雜音或室內雜音淹沒的錄音中萃取人聲——非常適合拯救在咖啡廳錄製的播客來賓、從嘈雜街道上的訪談音訊中提升音質,或從人聲乾軌中移除樂曲背景。上傳 MP3、WAV、M4A、OGG 或 FLAC,Handytool 在您的瀏覽器內完全執行堆疊的 RNNoise 管道和語音活動驅動的閘限,您的音訊永遠不會離開您的裝置。兩個控制——分離強度和清理次數——讓您可以選擇輕度清理或完全靜音說話者外的任何內容的硬隔離。結果下載為 48 kHz 單聲道 WAV 檔案。

人聲分離功能

  • 01

    雙階段分離,不僅止於降噪

    多次處理神經網路降噪在每次處理時收緊噪聲底線。語音活動驅動的閘限隨後靜音化模型確信不包含語音的幀——因此背景樂曲、掌聲和交談完全在短語之間消失。

  • 02

    可調式設計,適應播客或拯救工作

    分離強度控制非人聲幀被閘限的激進程度。降低它以取得自然音效播客效果,提高它以完全移除樂曲背景或從嘈雜錄音中分離人群。

  • 03

    本地執行,無需上傳

    整個管道是一個 125 KB WebAssembly 模組,載入一次後保持快取。音訊在您的電腦上完全進行解碼、分離和下載——無需伺服器往返、無需帳號、無需超過 200 MB 檔案上限的長度限制。

人聲分離常見問題

這與語音增強器有什麼區別?
語音增強器執行單次降噪處理並保留錄音的自然感受——最適合清理穩定雜音如風扇或空調嗡嗡聲。人聲分離堆疊多次處理並新增語音活動閘限,靜音化說話者外的任何內容——最適合從背景中移除樂曲、人群或其他談話。
它能從語音錄音中移除背景樂曲嗎?
是的,當樂曲在音量級別上明顯低於人聲時。閘限靜音化不偵測到語音的幀,多次降噪在單字期間拉下樂曲滲漏。掌握的重樂曲與人聲音量相同時較難——嘗試強度 90–100 和三次處理來處理這些情況。
分離強度滑塊的作用為何?
它設定非人聲幀被衰減的激進程度。在 0 處閘限鬆散,您會聽到微弱的背景;在 100 處模型不確信是人聲的任何內容都變為靜音。70–80 是播客的良好起點,90–100 用於樂曲或人群移除。
音訊會被上傳到伺服器嗎?
不會。模型和您的檔案保留在您的瀏覽器中。管道是一個小型 WebAssembly 模組,在您的 CPU 上本地執行,因此沒有任何內容離開您的電腦。
我取得什麼輸出格式?
單聲道 48 kHz 16 位 PCM WAV 檔案。WAV 是無損格式,在每個音訊編輯器和播客主機中都能運作。如果需要較小檔案,請使用轉換音訊工具匯出 MP3。
錄音可以有多長?
接受最高 200 MB 的檔案。兩次處理在現代筆記型電腦上以大約 3–5 倍實時速度執行,因此 10 分鐘的錄音在兩到三分鐘內完成分離。

相關工具

音訊

探索更多工具

所有工具