音訊免費本機執行
人聲分離
在您的瀏覽器中將人聲與樂曲、人群和背景噪聲分離。
.mp3.wav.ogg.m4a.aac.flac.webm.opus
正在載入模型…
完全在您的瀏覽器中執行。
關於人聲分離
人聲分離工具可以從被背景樂曲、人群嘈雜聲、交通雜音或室內雜音淹沒的錄音中萃取人聲——非常適合拯救在咖啡廳錄製的播客來賓、從嘈雜街道上的訪談音訊中提升音質,或從人聲乾軌中移除樂曲背景。上傳 MP3、WAV、M4A、OGG 或 FLAC,Handytool 在您的瀏覽器內完全執行堆疊的 RNNoise 管道和語音活動驅動的閘限,您的音訊永遠不會離開您的裝置。兩個控制——分離強度和清理次數——讓您可以選擇輕度清理或完全靜音說話者外的任何內容的硬隔離。結果下載為 48 kHz 單聲道 WAV 檔案。
人聲分離功能
- 01
雙階段分離,不僅止於降噪
多次處理神經網路降噪在每次處理時收緊噪聲底線。語音活動驅動的閘限隨後靜音化模型確信不包含語音的幀——因此背景樂曲、掌聲和交談完全在短語之間消失。
- 02
可調式設計,適應播客或拯救工作
分離強度控制非人聲幀被閘限的激進程度。降低它以取得自然音效播客效果,提高它以完全移除樂曲背景或從嘈雜錄音中分離人群。
- 03
本地執行,無需上傳
整個管道是一個 125 KB WebAssembly 模組,載入一次後保持快取。音訊在您的電腦上完全進行解碼、分離和下載——無需伺服器往返、無需帳號、無需超過 200 MB 檔案上限的長度限制。
人聲分離常見問題
- 這與語音增強器有什麼區別?
- 語音增強器執行單次降噪處理並保留錄音的自然感受——最適合清理穩定雜音如風扇或空調嗡嗡聲。人聲分離堆疊多次處理並新增語音活動閘限,靜音化說話者外的任何內容——最適合從背景中移除樂曲、人群或其他談話。
- 它能從語音錄音中移除背景樂曲嗎?
- 是的,當樂曲在音量級別上明顯低於人聲時。閘限靜音化不偵測到語音的幀,多次降噪在單字期間拉下樂曲滲漏。掌握的重樂曲與人聲音量相同時較難——嘗試強度 90–100 和三次處理來處理這些情況。
- 分離強度滑塊的作用為何?
- 它設定非人聲幀被衰減的激進程度。在 0 處閘限鬆散,您會聽到微弱的背景;在 100 處模型不確信是人聲的任何內容都變為靜音。70–80 是播客的良好起點,90–100 用於樂曲或人群移除。
- 音訊會被上傳到伺服器嗎?
- 不會。模型和您的檔案保留在您的瀏覽器中。管道是一個小型 WebAssembly 模組,在您的 CPU 上本地執行,因此沒有任何內容離開您的電腦。
- 我取得什麼輸出格式?
- 單聲道 48 kHz 16 位 PCM WAV 檔案。WAV 是無損格式,在每個音訊編輯器和播客主機中都能運作。如果需要較小檔案,請使用轉換音訊工具匯出 MP3。
- 錄音可以有多長?
- 接受最高 200 MB 的檔案。兩次處理在現代筆記型電腦上以大約 3–5 倍實時速度執行,因此 10 分鐘的錄音在兩到三分鐘內完成分離。