Punti salienti
- 01Pipeline a due stadi: riduzione del rumore neurale multi-passaggio più un gate di attività vocale che silenzia i frame non vocali.
- 02I controlli per la forza di isolamento e il numero di passaggi ti permettono di regolare tra un suono naturale e un isolamento più marcato.
- 03Funziona meglio quando la voce è più forte della musica di sottofondo o del rumore di folla.
- 04L'output è un WAV mono a 48 kHz; nulla viene caricato su alcun server.
Quando Hai Bisogno di Più Della Semplice Riduzione del Rumore
La riduzione del rumore standard gestisce il sibilo e il ronzio di fondo costanti. Ma cosa fare con un ospite di podcast registrato in un bar affollato, un'intervista fatta su una base musicale, o un discorso filmato a un evento affollato? Quando lo sfondo è forte, vario o musicale, un singolo passaggio di riduzione del rumore non è sufficiente — hai bisogno di un sistema che possa anche identificare quali parti dell'audio sono voce e silenziare tutto il resto.
L'isolatore vocale di Handytool esegue una pipeline a due stadi: più passaggi di riduzione del rumore neurale RNNoise per abbassare il livello di rumore, seguiti da un gate controllato dall'attività vocale che sopprime i frame che il modello identifica come non vocali. Il risultato è una traccia dove il silenzio sostituisce lo sfondo tra le frasi, piuttosto che una versione più silenziosa del rumore originale. L'intero processo viene eseguito localmente nel tuo browser — nessun caricamento, nessun account necessario.
Come Isolare una Voce dal Rumore di Fondo
- 01
Trascina il tuo file audio
Trascina un file MP3, WAV, M4A, OGG o FLAC nello strumento. Sono accettati fino a 200 MB.
- 02
Imposta la forza di isolamento
La forza controlla quanto aggressivamente i frame non vocali vengono silenziati. Inizia con 70–80 per podcast o interviste; aumenta a 90–100 per rimuovere una base musicale o rumore di folla.
- 03
Scegli il numero di passaggi
Ogni passaggio aggiuntivo di riduzione del rumore neurale abbassa il livello di rumore. Un passaggio funziona per registrazioni leggermente rumorose; due o tre passaggi migliorano i risultati quando il rumore di fondo è forte o misto.
- 04
Fai clic su Isola e scarica
La pipeline viene eseguita localmente nel tuo browser. Al termine, scarica la voce isolata come WAV mono a 48 kHz.
Registrazioni Che Traggono Maggior Beneficio Dall'Isolamento Vocale
- 01Ospiti di podcast registrati in caffè o ristoranti
- 02Interviste filmate a conferenze o eventi con rumore di folla
- 03Discorsi o presentazioni con una base musicale sottostante
- 04Registrazioni sul campo da esterno con vento e traffico
- 05Registrazioni di chiamate telefoniche o videochiamate con ambienti rumorosi da un'estremità
Il Tuo Audio Viene Elaborato Localmente, Non su un Server
La pipeline di isolamento è un modulo WebAssembly da 125 KB caricato una volta nel tuo browser. Quando trascini un file, viene decodificato ed elaborato interamente sulla tua macchina. Nessun audio viene trasmesso a un server, nessun account viene creato e nulla viene conservato dopo aver chiuso la scheda.
Il tempo di elaborazione dipende dal numero di passaggi e dalla durata del file. Due passaggi su un file di 10 minuti richiedono circa due o tre minuti su un laptop moderno. Sono accettati file fino a 200 MB.
Domande Frequenti sull'Isolatore Vocale
Come rimuovo la musica di sottofondo da una registrazione vocale?
Trascina il tuo file nell'Isolatore Vocale, imposta la forza a 90–100, scegli due o tre passaggi e fai clic su Isola. Il gate silenzia i frame non vocali; il riduttore di rumore abbassa la musica che filtra durante le parole.
Qual è la differenza rispetto al Potenziatore Vocale?
Potenziatore Vocale esegue un singolo passaggio di riduzione del rumore per una pulizia dal suono naturale del rumore costante. Isolatore Vocale impila più passaggi e aggiunge un gate controllato dall'attività vocale che silenzia qualsiasi cosa al di fuori della voce — migliore per musica, folla e rumore vario.
Cosa fa il cursore di forza di isolamento?
Imposta quanto aggressivamente i frame non vocali vengono attenuati. A 0 il gate è lasco; a 100 qualsiasi cosa il modello non sia sicuro sia voce va al silenzio. 70–80 è un buon punto di partenza per podcast, 90–100 per rimozione di musica o folla.
Il mio audio viene caricato su un server?
No. La pipeline è un modulo WebAssembly che viene eseguito localmente sulla tua CPU. Nulla lascia il tuo computer.
Quale formato di output ricevo?
Un WAV mono a 48 kHz in PCM a 16 bit. Usa lo strumento Converti audio per esportare come MP3 se hai bisogno di un file più piccolo.
Quanto può essere lunga la registrazione?
Fino a 200 MB. Due passaggi elaborano a circa 3–5 volte il tempo reale su un laptop moderno, quindi una registrazione di 10 minuti si isola in due o tre minuti.