Points clés
- 01Pipeline à deux étages : débruitage neuronal multi-passes plus une porte de détection vocale qui réduit au silence les trames non-vocales.
- 02Les contrôles de force d'isolation et du nombre de passes vous permettent de trouver l'équilibre entre un son naturel et une isolation complète.
- 03Fonctionne mieux quand la voix est plus forte que la musique de fond ou le bruit de foule.
- 04La sortie est un WAV mono 48 kHz ; rien n'est uploadé sur aucun serveur.
Quand vous avez besoin de plus que la simple réduction de bruit
La réduction de bruit standard gère le sifflement et le bourdonnement de fond constants. Mais qu'en est-il d'un invité de podcast enregistré dans un café animé, d'une interview réalisée sur un lit musical, ou d'un discours filmé lors d'un événement bondé ? Quand le bruit de fond est fort, varié ou musical, une seule passe de débruitage ne suffit pas — vous avez besoin d'un système capable d'identifier quelles parties de l'audio sont de la parole et de réduire au silence tout le reste.
L'isolateur vocal de Handytool exécute un pipeline à deux étages : plusieurs passes de débruitage neuronal RNNoise pour resserrer le plancher de bruit, suivies d'une porte commandée par la détection d'activité vocale qui supprime les trames que le modèle identifie comme non-vocales. Le résultat est une piste où le silence remplace le bruit de fond entre les phrases, plutôt qu'une version plus silencieuse du bruit original. L'ensemble du processus s'exécute localement dans votre navigateur — pas d'upload, pas de compte nécessaire.
Comment isoler une voix du bruit de fond
- 01
Déposez votre fichier audio
Glissez-déposez un fichier MP3, WAV, M4A, OGG ou FLAC dans l'outil. Jusqu'à 200 Mo sont acceptés.
- 02
Réglez la force d'isolation
La force contrôle l'agressivité avec laquelle les trames non-vocales sont réduites au silence. Commencez à 70–80 pour les podcasts ou les interviews ; augmentez à 90–100 pour supprimer un lit musical ou le bruit de foule.
- 03
Choisissez le nombre de passes
Chaque passe supplémentaire de débruitage neuronal resserre le plancher de bruit. Une passe fonctionne pour les enregistrements légèrement bruyants ; deux ou trois passes améliorent les résultats quand le bruit de fond est fort ou mélangé.
- 04
Cliquez sur Isoler et téléchargez
Le pipeline s'exécute localement dans votre navigateur. Quand il est terminé, téléchargez la voix isolée en tant que WAV mono 48 kHz.
Enregistrements qui bénéficient le plus de l'isolation vocale
- 01Invités de podcast enregistrés dans des cafés ou restaurants
- 02Interviews filmées lors de conférences ou d'événements avec bruit de foule
- 03Discours ou présentations avec un lit musical en dessous
- 04Enregistrements de terrain en extérieur avec vent et trafic
- 05Enregistrements d'appels téléphoniques ou vidéo avec des environnements bruyants d'un côté
Votre audio est traité localement, pas sur un serveur
Le pipeline d'isolation est un module WebAssembly de 125 Ko chargé une fois dans votre navigateur. Quand vous déposez un fichier, il est décodé et traité entièrement sur votre propre machine. Aucun audio n'est diffusé vers un serveur, aucun compte n'est créé, et rien n'est conservé après la fermeture de l'onglet.
Le temps de traitement dépend du nombre de passes et de la durée du fichier. Deux passes sur un fichier de 10 minutes prennent environ deux à trois minutes sur un ordinateur portable moderne. Les fichiers jusqu'à 200 Mo sont acceptés.
FAQ de l'isolateur vocal
Comment supprimer la musique de fond d'un enregistrement vocal ?
Déposez votre fichier dans l'Isolateur vocal, réglez la force à 90–100, choisissez deux ou trois passes, et cliquez sur Isoler. La porte réduit au silence les trames non-vocales ; le débruiteur réduit la musique qui s'échappe pendant les paroles.
En quoi cela diffère-t-il de l'Améliorateur vocal ?
L'Améliorateur vocal effectue une seule passe de débruitage pour un nettoyage au son naturel du bruit constant. L'Isolateur vocal empile plusieurs passes et ajoute une porte de détection vocale qui réduit au silence tout ce qui n'est pas de la parole — meilleur pour la musique, les foules et le bruit varié.
Que fait le curseur de force d'isolation ?
Il définit l'agressivité avec laquelle les trames non-vocales sont atténuées. À 0, la porte est souple ; à 100, tout ce que le modèle n'est pas sûr que c'est de la voix devient du silence. 70–80 est un bon point de départ pour les podcasts, 90–100 pour la suppression de musique ou de foule.
Mon audio est-il uploadé sur un serveur ?
Non. Le pipeline est un module WebAssembly qui s'exécute localement sur votre CPU. Rien ne quitte votre ordinateur.
Quel format de sortie j'obtiens ?
Un WAV mono 48 kHz en PCM 16 bits. Utilisez l'outil Convertir l'audio pour exporter en MP3 si vous avez besoin d'un fichier plus petit.
Quelle peut être la durée de l'enregistrement ?
Jusqu'à 200 Mo. Deux passes traitent à environ 3–5 fois la vitesse réelle sur un ordinateur portable moderne, donc un enregistrement de 10 minutes s'isole en deux à trois minutes.