重點摘要
- 01兩階段管道:多次通過神經去噪加上一個沉默非語音框的語音活動門。
- 02隔離強度和通過次數的控制讓您在自然聲音和硬隔離之間調整。
- 03當語音比背景音樂或群聲更大聲時效果最好。
- 04輸出為 48 kHz mono WAV;無任何內容上傳到任何伺服器。
當您需要超過雜音降低的功能時
標準雜音降低處理穩定的背景嘶嘶聲和嗡嗡聲。但是,在繁忙咖啡館中錄製的播客嘉賓怎麼樣,在音樂層上進行的訪問,或在擁擠活動中拍攝的演講?當背景很大聲、多變或音樂性時,單個去噪通過不足夠 — 您需要一個系統,也可以識別哪些音頻部分是語音並沉默所有其他部分。
Handytool 的語音隔離器運行一個兩階段管道:多個 RNNoise 神經去噪通過以緊縮噪聲層,然後是一個語音活動驅動的門,抑制模型識別為非語音的框。結果是一個軌道,其中沉默取代短語之間的背景,而不是原始雜音的更安靜版本。整個過程在您的瀏覽器中本機運行 — 無上傳、無帳戶需要。
如何從背景雜音中隔離語音
- 01
拖入您的音頻檔案
將 MP3、WAV、M4A、OGG 或 FLAC 檔案拖入工具中。接受高達 200 MB。
- 02
設定隔離強度
強度控制非語音框被門擊中的激進程度。對於播客或訪問從 70–80 開始;推至 90–100 以去除音樂層或群聲。
- 03
選擇通過次數
每個額外的神經去噪通過會緊縮噪聲層。一個通過適用於輕微嘈雜的錄音;當背景雜音很大聲或混合時,兩個或三個通過改善結果。
- 04
按一下隔離並下載
管道在您的瀏覽器中本機運行。完成後,將隔離的語音下載為 48 kHz mono WAV。
最受益於語音隔離的錄音
- 01在咖啡館或餐廳中錄製的播客嘉賓
- 02在會議或活動中有群聲拍攝的訪問
- 03下面有音樂層的演講或演示
- 04來自室外的現場錄音,風和交通
- 05一端環境嘈雜的電話或視頻通話錄音
您的音頻在本機處理,不在伺服器上
隔離管道是在您的瀏覽器中加載的 125 KB WebAssembly 模組。當您拖入檔案時,它完全在您自己的機器上解碼和處理。無音頻被流送到伺服器,無帳戶被建立,無任何內容在您關閉標籤後被保留。
處理時間取決於通過次數和檔案長度。兩個通過 10 分鐘檔案在現代筆記型電腦上大約需要兩到三分鐘。接受高達 200 MB 的檔案。
語音隔離器常見問題
我如何從語音錄音中移除背景音樂?
將您的檔案拖入語音隔離器,將強度設定為 90–100,選擇兩個或三個通過,然後按一下隔離。門沉默非語音框;去噪機在言語期間拉下滲出的音樂。
這與聲音增強器有何不同?
聲音增強器做一個單一去噪通過,對穩定雜音的自然感受清理。語音隔離器堆疊多個通過並添加一個沉默任何非語音的語音活動門 — 更適合音樂、群聲和多變雜音。
隔離強度滑塊做什麼?
它設定非語音框被衰減的激進程度。在 0 時門很鬆;在 100 時任何模型不確定是語音的東西都進入沉默。70–80 是播客的好起點,90–100 用於音樂或群聲移除。
我的音頻是否上傳到伺服器?
否。管道是在您的 CPU 上本機運行的 WebAssembly 模組。無任何內容離開您的電腦。
我得到什麼輸出格式?
Mono 48 kHz 16 位 PCM WAV。如果您需要更小的檔案,使用轉換音頻工具匯出為 MP3。
錄音可以有多長?
高達 200 MB。兩個通過在現代筆記型電腦上以大約 3–5 倍實時的速度處理,因此 10 分鐘的錄音在兩到三分鐘內隔離。