Handytool
LjudGratisKörs lokalt

Konvertera ljud till text

Omvandla talat ljud på vilket språk som helst till text direkt i din webbläsare.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Språk
Laddar modell…

Körs helt i din webbläsare.

eller

Om Konvertera ljud till text

Ladda upp en ljudfil eller spela in direkt från din mikrofon och få ett skriftligt transkript på talårens språk – ingen uppladdning till servrar, inget konto, ingen app att installera. Handytool kör OpenAIs open-source-modell Whisper direkt i din webbläsare och använder WebGPU för acceleration. Dina podcasts, intervjuer, röstmeddelanden, föreläsningar och mötesupptagningar förblir helt privata. Ladda ner resultatet som textfil, SRT-undertextfil eller WebVTT-fil för videospelare.

Funktioner i Konvertera ljud till text

  • 01

    99 språk, automatiskt identifierade

    Whisper identifierar det talade språket och skapar transkriptet på samma språk – spanska förblir spanska, japanska förblir japanska, svenska förblir svenska. Ingen språkväljare, inga extra inställningar.

  • 02

    Ladda upp en fil eller spela in live

    Ta med en MP3-, WAV-, M4A-, OGG-, FLAC- eller WebM-fil, eller klicka på "Spela in röst" för att fånga ljud direkt från din mikrofon. Stoppa när du är klar och inspelningen börjar omedelbar transkribering.

  • 03

    Privat, bearbetning enbart i webbläsaren

    Whisper-modellen laddas ner en gång till din webbläsarcache och körs helt på din enhet med WebGPU-acceleration där det stöds. Ingenting laddas upp – ditt ljud lämnar aldrig din dator.

Vanliga frågor om Konvertera ljud till text

Hur transkriberar jag en ljudfil?
Ladda upp din ljudfil (MP3, WAV, M4A, OGG, FLAC eller WebM) och klicka på "Transkribera". Vid första körning laddas talmodellen ner (~150 MB); därefter körs transkribering lokalt utan internetanslutning.
Kan jag spela in ljud med min mikrofon?
Ja. Klicka på "Spela in röst", tillåt mikrofonåtkomst i din webbläsare, tala och klicka på "Stoppa inspelning". Det infångade ljudet behandlas som en uppladdad fil och kan transkriberas omedelbar.
Vilka språk stöds?
Alla 99 språk som Whisper stöder – inklusive engelska, spanska, mandarin, franska, arabiska, hindi, tyska, ryska, portugisiska, japanska och många fler. Transkriptet förblir på det talade språket.
Hur långt kan ljudet vara?
Filer upp till 200 MB accepteras. Långa inspelningar behandlas i 30-sekundersblock med 5-sekunders överlappning, så en poddserie på en timme producerar fortfarande ett sammanhängande transkript. Bearbetningstiden beror på om din webbläsare stöder WebGPU.
Laddas ljudet upp till en server?
Nej. Både modellen och ditt ljud förblir i din webbläsare. Whisper-modellen hämtas en gång från ett CDN och cachelagras, sedan sker transkribering helt på enheten med WebGPU eller WebAssembly.
Kan jag få undertexter för en video?
Ja. Ladda ner .srt- eller .vtt-filen och släpp den i din videoredigerare, eller ladda upp den som ett undertextspår på YouTube och andra plattformar. Varje undertextrád innehåller det tidsstämpelintervall som Whisper identifierade.

Relaterade verktyg

Ljud

Utforska fler verktyg

Alla verktyg