Hur transkriberar jag en ljudfil?

Ladda upp din ljudfil (MP3, WAV, M4A, OGG, FLAC eller WebM) och klicka på "Transkribera". Vid första körning laddas talmodellen ner (~150 MB); därefter körs transkribering lokalt utan internetanslutning.

Kan jag spela in ljud med min mikrofon?

Ja. Klicka på "Spela in röst", tillåt mikrofonåtkomst i din webbläsare, tala och klicka på "Stoppa inspelning". Det infångade ljudet behandlas som en uppladdad fil och kan transkriberas omedelbar.

Alla 99 språk som Whisper stöder – inklusive engelska, spanska, mandarin, franska, arabiska, hindi, tyska, ryska, portugisiska, japanska och många fler. Transkriptet förblir på det talade språket.

Hur långt kan ljudet vara?

Filer upp till 200 MB accepteras. Långa inspelningar behandlas i 30-sekundersblock med 5-sekunders överlappning, så en poddserie på en timme producerar fortfarande ett sammanhängande transkript. Bearbetningstiden beror på om din webbläsare stöder WebGPU.

Laddas ljudet upp till en server?

Nej. Både modellen och ditt ljud förblir i din webbläsare. Whisper-modellen hämtas en gång från ett CDN och cachelagras, sedan sker transkribering helt på enheten med WebGPU eller WebAssembly.

Kan jag få undertexter för en video?

Ja. Ladda ner .srt- eller .vtt-filen och släpp den i din videoredigerare, eller ladda upp den som ett undertextspår på YouTube och andra plattformar. Varje undertextrád innehåller det tidsstämpelintervall som Whisper identifierade.

LjudGratisKörs lokalt

Konvertera ljud till text

Omvandla talat ljud på vilket språk som helst till text direkt i din webbläsare.

.mp3.wav.ogg.m4a.aac.flac.webm.opus

Språk

Laddar modell…

Körs helt i din webbläsare.

Släpp en ljudfil här

MP3 · WAV · OGG · M4A · FLAC · WebM · max 200 MB

Första körning laddar ~150 MB; cachelagrat efteråt.

Välj fil

eller

Om Konvertera ljud till text

Ladda upp en ljudfil eller spela in direkt från din mikrofon och få ett skriftligt transkript på talårens språk – ingen uppladdning till servrar, inget konto, ingen app att installera. Handytool kör OpenAIs open-source-modell Whisper direkt i din webbläsare och använder WebGPU för acceleration. Dina podcasts, intervjuer, röstmeddelanden, föreläsningar och mötesupptagningar förblir helt privata. Ladda ner resultatet som textfil, SRT-undertextfil eller WebVTT-fil för videospelare.

Funktioner i Konvertera ljud till text

01
99 språk, automatiskt identifierade
Whisper identifierar det talade språket och skapar transkriptet på samma språk – spanska förblir spanska, japanska förblir japanska, svenska förblir svenska. Ingen språkväljare, inga extra inställningar.
02
Ladda upp en fil eller spela in live
Ta med en MP3-, WAV-, M4A-, OGG-, FLAC- eller WebM-fil, eller klicka på "Spela in röst" för att fånga ljud direkt från din mikrofon. Stoppa när du är klar och inspelningen börjar omedelbar transkribering.
03
Privat, bearbetning enbart i webbläsaren
Whisper-modellen laddas ner en gång till din webbläsarcache och körs helt på din enhet med WebGPU-acceleration där det stöds. Ingenting laddas upp – ditt ljud lämnar aldrig din dator.

Vanliga frågor om Konvertera ljud till text

Hur transkriberar jag en ljudfil?: Ladda upp din ljudfil (MP3, WAV, M4A, OGG, FLAC eller WebM) och klicka på "Transkribera". Vid första körning laddas talmodellen ner (~150 MB); därefter körs transkribering lokalt utan internetanslutning.
Kan jag spela in ljud med min mikrofon?: Ja. Klicka på "Spela in röst", tillåt mikrofonåtkomst i din webbläsare, tala och klicka på "Stoppa inspelning". Det infångade ljudet behandlas som en uppladdad fil och kan transkriberas omedelbar.
Vilka språk stöds?: Alla 99 språk som Whisper stöder – inklusive engelska, spanska, mandarin, franska, arabiska, hindi, tyska, ryska, portugisiska, japanska och många fler. Transkriptet förblir på det talade språket.
Hur långt kan ljudet vara?: Filer upp till 200 MB accepteras. Långa inspelningar behandlas i 30-sekundersblock med 5-sekunders överlappning, så en poddserie på en timme producerar fortfarande ett sammanhängande transkript. Bearbetningstiden beror på om din webbläsare stöder WebGPU.
Laddas ljudet upp till en server?: Nej. Både modellen och ditt ljud förblir i din webbläsare. Whisper-modellen hämtas en gång från ett CDN och cachelagras, sedan sker transkribering helt på enheten med WebGPU eller WebAssembly.
Kan jag få undertexter för en video?: Ja. Ladda ner .srt- eller .vtt-filen och släpp den i din videoredigerare, eller ladda upp den som ett undertextspår på YouTube och andra plattformar. Varje undertextrád innehåller det tidsstämpelintervall som Whisper identifierade.

Guider

Artiklar →

5 min
Audio-guide
Transkribera ljud – online och gratis
Omvandla röstanteckningar, intervjuer och inspelningar till sökbar text i din webbläsare, med lokalt talöverförande.
Uppdaterad 1 maj 2026Läs

Relaterade verktyg

Ljud →

Utforska fler verktyg

Alla verktyg →

Konvertera ljud till text

Om Konvertera ljud till text

Funktioner i Konvertera ljud till text

99 språk, automatiskt identifierade

Ladda upp en fil eller spela in live

Privat, bearbetning enbart i webbläsaren

Vanliga frågor om Konvertera ljud till text

Guider

Transkribera ljud – online och gratis

Relaterade verktyg

Röstförbättrare

Röstisoleringsfiler

Trimma ljud

Utforska fler verktyg

PDF to PNG

Japan Visum Fotogenerator

Undertextbränning

JSON-visare

Grammatikkontroll