Handytool
Lyd-guide5 min læsetidOpdateret 30. mar. 2026

AI stemme-adskillelse

Træk ren stemme ud af støjende optagelser — privat, i din browser.

Handytools stemme-isolator stakler multi-pass RNNoise denoising med en stemmeaktivitets-port til at fjerne musik, publikumsstøj og rumeklang fra enhver MP3-, WAV- eller M4A-fil.

Vigtigste punkter

  • 01To-trins pipeline: multi-pass neural denoising plus en stemmeaktivitets-port, der stiller ikke-talte frames til tavshed.
  • 02Kontroller til isolationsstyrke og antallet af passes lader dig stemme mellem naturlig-lyd og hård isolation.
  • 03Fungerer bedst, når stemmen er højere end baggrundsmusik eller publikumsstøj.
  • 04Output er en 48 kHz mono WAV; intet uploades til nogen server.

Når du har brug for mere end støjreduktion

Standard støjreduktion håndterer steady baggrundsklysing og brumme. Men hvad med en podcast-gæst optaget i en travl cafe, et interview gjort over en musikbund, eller en tale optaget på et overfyldt event? Når baggrunden er høj, varieret eller musikal, er en enkelt denoise-pass ikke nok — du har brug for et system, der også kan identificere, hvilke dele af lyden der er tale, og få alt andet til tavshed.

Handytools stemme-isolator kører en to-trins pipeline: flere passes af RNNoise neural denoising for at strammer støjgulvet, efterfulgt af en stemmeaktivitets-drevet port, der undertrykkertavshed der, modellen identificerer som ikke-tale. Resultatet er et spor, hvor tavshed erstatter baggrunden mellem sætninger, i stedet for en stille version af originalen støj. Hele processen kører lokalt i din browser — intet upload, ingen konto påkrævet.

Sådan isolerer du en stemme fra baggrundslyden

  1. 01

    Dro din lydfil

    Træk en MP3-, WAV-, M4A-, OGG- eller FLAC-fil ind i værktøjet. Op til 200 MB accepteres.

  2. 02

    Indstil isolationsstyrke

    Styrke styrer, hvor aggressivt ikke-stemme-frames er portede. Start ved 70–80 for podcasts eller interviews; tryk til 90–100 for at fjerne en musikbund eller publikumsstøj.

  3. 03

    Vælg antallet af passes

    Hver yderligere pass af neural denoising strammer støjgulvet. En pass fungerer for let støjende optagelser; to eller tre passes forbedrer resultaterne når baggrundslyden er høj eller blandet.

  4. 04

    Klik Isoler og download

    Pipeline'en kører lokalt i din browser. Når den afsluttes, download den isolerede stemme som en 48 kHz mono WAV.

Optagelser, der drager mest nytte af stemme-isolation

  • 01Podcast-gæster optaget i caféer eller restauranter
  • 02Interviews filmet på konferencer eller events med publikumsstøj
  • 03Taler eller præsentationer med en musikbund under
  • 04Feltoptagelser fra udendørs med vind og trafik
  • 05Telefon- eller videosamtale optagelser med støjende miljøer på en side

Din lyd behandles lokalt, ikke på en server

Isolations-pipeline'en er et 125 KB WebAssembly-modul indlæst én gang i din browser. Når du dro en fil ind, dekodes og behandles det udelukkende på din egen maskine. Ingen lyd streames til en server, ingen konto oprettes, og intet bevares efter du lukker fanen.

Behandlingstiden afhænger af antallet af passes og fillængden. To passes på en 10-minutter fil tager cirka to til tre minutter på en moderne bærbar. Filer op til 200 MB accepteres.

Stemme-isolator FAQ

Hvordan fjerner jeg baggrundsmusik fra en stemmeoptagelse?

Dro din fil ind i stemme-isolatoren, sæt styrke til 90–100, vælg to eller tre passes, og klik Isoler. Porten får ikke-tale-frames til tavshed; denoiseren trækker musik ned, der bløder igennem under ord.

Hvordan adskiller det sig fra stemmeforbedrerer?

Stemmeforbedrerer gør en enkelt denoise-pass for en naturlig-følende oprydning af steady støj. Stemme-isolator stakler flere passes og tilføjer en stemmeaktivitets-port, der stiller alt uden tale til tavshed — bedre til musik, publikum og varieret støj.

Hvad gør isolationsstyrke-skyderen?

Den sætter, hvor aggressivt ikke-stemme-frames er dæmpet. Ved 0 er porten løs; ved 100 går alt modellen ikke er sikker på er stemme til tavshed. 70–80 er et godt udgangspunkt for podcasts, 90–100 for musik eller publikumsstøj fjernelse.

Uploades min lyd til en server?

Nej. Pipeline'en er et WebAssembly-modul, der kører lokalt på din CPU. Intet forlader din computer.

Hvilket outputformat får jeg?

En mono 48 kHz WAV i 16-bit PCM. Brug værktøjet Konverter lyd til at eksportere som MP3, hvis du har brug for en mindre fil.

Hvor lang kan optagelsen være?

Op til 200 MB. To passes behandles med cirka 3–5 gange real-time på en moderne bærbar, så en 10-minutters optagelse isoleres på to til tre minutter.

Relaterede værktøjer

Fortsæt med Lyd-værktøjer

Lyd-værktøjer