重要なポイント
- 012段階パイプライン:マルチパスニューラルデノイズと非音声フレームをサイレンスにする音声活動ゲート。
- 02分離強度とパス数のコントロールで、自然に聞こえるものと硬い分離のバランスを調整できます。
- 03背景音楽または群衆ノイズが音声よりも大きい場合に最も効果的です。
- 04出力は48 kHz単一チャネルWAV、サーバーにアップロードされません。
ノイズ低減以上のものが必要な場合
標準のノイズ削減は定常背景ノイズとハムを処理します。しかし、忙しいカフェで録音されたポッドキャストゲスト、音楽ベッドを使用して行われたインタビュー、または混雑した会場で撮影されたスピーチはどうですか?背景が大きく、多様、または音楽的である場合、単一のデノイズパスは十分ではありません — 音声のどの部分が音声であるかを識別して、他のすべてをサイレンスにすることができるシステムが必要です。
Handytoolのボイスアイソレーターはマルチパスパイプラインを実行します:複数のRNNoiseニューラルデノイズパスでノイズフロアを緊密化し、その後、モデルが非音声として識別するフレームを抑制する音声活動駆動ゲート。その結果、トラックは元のノイズよりも静かいバージョンではなく、フレーズ間の無音で背景を置き換えます。プロセス全体がブラウザ内でローカルに実行されます — アップロード、アカウント不要。
背景ノイズから音声を分離する方法
- 01
オーディオファイルをドロップします
MP3、WAV、M4A、OGG、またはFLACファイルをツールにドラッグします。200 MBまで受け入れられます。
- 02
分離強度を設定します
強度は非音声フレームがどの程度積極的にゲートされるかを制御します。ポッドキャストまたはインタビューの場合は70~80から始めます。音楽ベッドまたは群衆ノイズを削除するには90~100にプッシュします。
- 03
パス数を選択します
ニューラルデノイズの各追加パスでノイズフロアが緊密になります。軽いノイズの多い録音では1パスで動作します。背景ノイズが大きい場合または混合されている場合、2~3パスは結果を改善します。
- 04
[分離]をクリックしてダウンロードします
パイプラインはブラウザ内でローカルに実行されます。完了したら、分離された音声を48 kHz単一チャネルWAVとしてダウンロードします。
音声分離の恩恵を受けるほとんどの録音
- 01カフェやレストランで録音されたポッドキャストゲスト
- 02会議またはイベントで群衆ノイズを伴って撮影されたインタビュー
- 03音楽ベッドの下のスピーチまたはプレゼンテーション
- 04風とトラフィックを伴う屋外からのフィールド録音
- 05一方の端がノイズの多い環境を持つ電話またはビデオ通話の録音
オーディオはサーバーではなくローカルで処理されます
分離パイプラインはブラウザ内で一度読み込まれる125 KB WebAssemblyモジュールです。ファイルをドロップすると、自分のマシン内でのみデコードされて処理されます。オーディオはサーバーにストリーミングされず、アカウントは作成されず、タブを閉じた後は保持されません。
処理時間はパス数とファイル長に異なります。2つのパスで10分のファイルは最新のラップトップで約2~3分かかります。200 MBまでのファイルが受け入れられます。
ボイスアイソレーターFAQ
音声録音から背景音楽を除去するにはどうすればよいですか?
ファイルをボイスアイソレーターにドロップし、強度を90~100に設定し、2~3パスを選択して、[分離]をクリックします。ゲートは非音声フレームをサイレンスに、デノイザーは言葉を通じて出血する音楽を引き下げます。
これはボイスエンハンサーと何が違いますか?
ボイスエンハンサーは定常ノイズのナチュラルに感じるクリーンアップを行う単一のデノイズパスを実行します。ボイスアイソレーターはマルチパスをスタックし、音声活動ゲートを追加して、音声以外のすべてをサイレンスにします — 音楽、群衆、多様なノイズに適しています。
分離強度スライダーは何をしますか?
非音声フレームがどの程度積極的に減衰されるかを設定します。0ではゲートは緩い、100ではモデルが音声であることに自信があるもの以外はすべてサイレンスになります。ポッドキャストの場合は70~80が良い出発点で、音楽または群衆除去の場合は90~100です。
オーディオはサーバーにアップロードされますか?
いいえ。パイプラインはCPU上でローカルに実行されるWebAssemblyモジュールです。コンピューターからは何も出ていきません。
どの出力形式を取得しますか?
16ビットPCMの単一チャネル48 kHz WAV。より小さいファイルが必要な場合は、[オーディオ変換]ツールを使用してMP3としてエクスポートします。
録音はどのくらいの長さにできますか?
200 MBまで。2つのパスは最新のラップトップで約3~5倍の実時間で処理されるため、10分の録音は2~3分で分離されます。