Handytool
音頻指南5 分鐘閱讀更新於 2026年3月30日

人工智慧語音分離

從嘈雜的錄音中取出清晰的語音 — 私密地、在您的瀏覽器中。

Handytool 的語音隔離器將多次通過 RNNoise 去噪與語音活動門堆疊起來,以從任何 MP3、WAV 或 M4A 檔案中去除音樂、群聲和房間聲。

重點摘要

  • 01兩階段管道:多次通過神經去噪加上一個沉默非語音框的語音活動門。
  • 02隔離強度和通過次數的控制讓您在自然聲音和硬隔離之間調整。
  • 03當語音比背景音樂或群聲更大聲時效果最好。
  • 04輸出為 48 kHz mono WAV;無任何內容上傳到任何伺服器。

當您需要超過雜音降低的功能時

標準雜音降低處理穩定的背景嘶嘶聲和嗡嗡聲。但是,在繁忙咖啡館中錄製的播客嘉賓怎麼樣,在音樂層上進行的訪問,或在擁擠活動中拍攝的演講?當背景很大聲、多變或音樂性時,單個去噪通過不足夠 — 您需要一個系統,也可以識別哪些音頻部分是語音並沉默所有其他部分。

Handytool 的語音隔離器運行一個兩階段管道:多個 RNNoise 神經去噪通過以緊縮噪聲層,然後是一個語音活動驅動的門,抑制模型識別為非語音的框。結果是一個軌道,其中沉默取代短語之間的背景,而不是原始雜音的更安靜版本。整個過程在您的瀏覽器中本機運行 — 無上傳、無帳戶需要。

如何從背景雜音中隔離語音

  1. 01

    拖入您的音頻檔案

    將 MP3、WAV、M4A、OGG 或 FLAC 檔案拖入工具中。接受高達 200 MB。

  2. 02

    設定隔離強度

    強度控制非語音框被門擊中的激進程度。對於播客或訪問從 70–80 開始;推至 90–100 以去除音樂層或群聲。

  3. 03

    選擇通過次數

    每個額外的神經去噪通過會緊縮噪聲層。一個通過適用於輕微嘈雜的錄音;當背景雜音很大聲或混合時,兩個或三個通過改善結果。

  4. 04

    按一下隔離並下載

    管道在您的瀏覽器中本機運行。完成後,將隔離的語音下載為 48 kHz mono WAV。

最受益於語音隔離的錄音

  • 01在咖啡館或餐廳中錄製的播客嘉賓
  • 02在會議或活動中有群聲拍攝的訪問
  • 03下面有音樂層的演講或演示
  • 04來自室外的現場錄音,風和交通
  • 05一端環境嘈雜的電話或視頻通話錄音

您的音頻在本機處理,不在伺服器上

隔離管道是在您的瀏覽器中加載的 125 KB WebAssembly 模組。當您拖入檔案時,它完全在您自己的機器上解碼和處理。無音頻被流送到伺服器,無帳戶被建立,無任何內容在您關閉標籤後被保留。

處理時間取決於通過次數和檔案長度。兩個通過 10 分鐘檔案在現代筆記型電腦上大約需要兩到三分鐘。接受高達 200 MB 的檔案。

語音隔離器常見問題

我如何從語音錄音中移除背景音樂?

將您的檔案拖入語音隔離器,將強度設定為 90–100,選擇兩個或三個通過,然後按一下隔離。門沉默非語音框;去噪機在言語期間拉下滲出的音樂。

這與聲音增強器有何不同?

聲音增強器做一個單一去噪通過,對穩定雜音的自然感受清理。語音隔離器堆疊多個通過並添加一個沉默任何非語音的語音活動門 — 更適合音樂、群聲和多變雜音。

隔離強度滑塊做什麼?

它設定非語音框被衰減的激進程度。在 0 時門很鬆;在 100 時任何模型不確定是語音的東西都進入沉默。70–80 是播客的好起點,90–100 用於音樂或群聲移除。

我的音頻是否上傳到伺服器?

否。管道是在您的 CPU 上本機運行的 WebAssembly 模組。無任何內容離開您的電腦。

我得到什麼輸出格式?

Mono 48 kHz 16 位 PCM WAV。如果您需要更小的檔案,使用轉換音頻工具匯出為 MP3。

錄音可以有多長?

高達 200 MB。兩個通過在現代筆記型電腦上以大約 3–5 倍實時的速度處理,因此 10 分鐘的錄音在兩到三分鐘內隔離。

相關工具

繼續使用 音訊 工具

音訊 工具