Handytool
音声無料ローカルで実行

音声分離

ブラウザ内で音声と音楽、群衆、背景ノイズを分離します。

.mp3.wav.ogg.m4a.aac.flac.webm.opus
モデルを読み込み中…

ブラウザ内で完全に実行されます。

音声分離について

音声分離は、背景音楽、群衆の雑音、交通音、室内ノイズに埋もれた音声を引き出します。カフェで録音されたポッドキャストゲストを救助したり、騒がしい通りでのインタビュー音声を向上させたり、ボーカルステムから音楽ベッドを削除するのに最適です。MP3、WAV、M4A、OGG、または FLAC をアップロードすると、Handytool はスタックされた RNNoise パイプラインと音声活動駆動ゲートをブラウザ内で完全に実行し、オーディオはデバイスを離れません。分離強度とクリーンアップパス数の 2 つのコントロールにより、ソフトクリーンアップから発話者以外のすべてを沈黙させるハード分離まで、選択できます。結果は 48 kHz モノラル WAV でダウンロードされます。

音声分離の機能

  • 01

    単なるノイズ除去ではなく、2 段階の分離

    マルチパスニューラルネットワークノイズ除去は各パスでノイズフロアを引き締めます。音声活動駆動ゲートはその後、音声を含まないと確信されるフレームを沈黙させます。背景音楽、拍手、会話は句と句の間で完全に消え去ります。

  • 02

    ポッドキャストや救助作業に対応可能

    分離強度は非音声フレームがゲートで減衰される激しさを制御します。ポッドキャストの自然な音を保つには低く、音楽ベッドまたは群衆をノイズの多い録音から完全に削除するには高くします。

  • 03

    ローカル実行、アップロードなし

    パイプライン全体は 125 KB の WebAssembly モジュールであり、一度読み込むとキャッシュされたままになります。オーディオはマシン上で完全にデコード、分離、ダウンロードされます。サーバーのラウンドトリップなし、アカウントなし、200 MB ファイル上限を超えない長さ制限なし。

音声分離のよくある質問

これはボイスエンハンサーとどう違いますか?
ボイスエンハンサーは単一のノイズ除去パスを実行し、録音の自然な感覚を保ちます。ファンまたは AC のハムなどの定常ノイズのクリーンアップに最適です。音声分離は複数のパスをスタックし、音声活動ゲートを追加して、発話者以外のすべてを沈黙させます。音楽、群衆、または他の会話を背景から削除するのに最適です。
音声録音から背景音楽を除去できますか?
はい、音楽が音量レベルで音声の明らかに背後にある場合。ゲートは音声が検出されていないフレームを沈黙させ、マルチパスノイズ除去は単語中に音楽がしみ込むのを引き下げます。マスターされた重い音楽が音声と同じラウドネスの場合は難しいです。それらのケースに対して強度 90–100 と 3 パスを試してください。
分離強度スライダーは何をしますか?
非音声フレームが減衰する激しさを設定します。0 ではゲートがルーズで、かすかな背景が聞こえます。100 では、モデルが音声であると確信していないすべてが沈黙します。ポッドキャストには 70–80 が良い出発点で、音楽または群衆除去には 90–100 です。
オーディオはサーバーにアップロードされますか?
いいえ。モデルとファイルはブラウザに残ります。パイプラインはあなたの CPU 上でローカルに実行される小さな WebAssembly モジュールなので、コンピュータから何も離れません。
どのような出力形式が得られますか?
モノラル 48 kHz 16 ビット PCM WAV ファイル。WAV は無圧縮で、すべてのオーディオエディタとポッドキャストホストで機能します。より小さいファイルが必要な場合は、オーディオ変換ツールを使用して MP3 をエクスポートしてください。
録音はどのくらいの長さにできますか?
最大 200 MB のファイルが受け入れられます。2 パスは最新のラップトップで約 3~5 倍のリアルタイム速度で処理されるため、10 分の録音は 2~3 分で分離します。

関連ツール

音声

他のツールを見る

すべてのツール