Konvertera ljud till text
Omvandla talat ljud på vilket språk som helst till text direkt i din webbläsare.
Körs helt i din webbläsare.
Om Konvertera ljud till text
Ladda upp en ljudfil eller spela in direkt från din mikrofon och få ett skriftligt transkript på talårens språk – ingen uppladdning till servrar, inget konto, ingen app att installera. Handytool kör OpenAIs open-source-modell Whisper direkt i din webbläsare och använder WebGPU för acceleration. Dina podcasts, intervjuer, röstmeddelanden, föreläsningar och mötesupptagningar förblir helt privata. Ladda ner resultatet som textfil, SRT-undertextfil eller WebVTT-fil för videospelare.
Funktioner i Konvertera ljud till text
- 01
99 språk, automatiskt identifierade
Whisper identifierar det talade språket och skapar transkriptet på samma språk – spanska förblir spanska, japanska förblir japanska, svenska förblir svenska. Ingen språkväljare, inga extra inställningar.
- 02
Ladda upp en fil eller spela in live
Ta med en MP3-, WAV-, M4A-, OGG-, FLAC- eller WebM-fil, eller klicka på "Spela in röst" för att fånga ljud direkt från din mikrofon. Stoppa när du är klar och inspelningen börjar omedelbar transkribering.
- 03
Privat, bearbetning enbart i webbläsaren
Whisper-modellen laddas ner en gång till din webbläsarcache och körs helt på din enhet med WebGPU-acceleration där det stöds. Ingenting laddas upp – ditt ljud lämnar aldrig din dator.
Vanliga frågor om Konvertera ljud till text
- Hur transkriberar jag en ljudfil?
- Ladda upp din ljudfil (MP3, WAV, M4A, OGG, FLAC eller WebM) och klicka på "Transkribera". Vid första körning laddas talmodellen ner (~150 MB); därefter körs transkribering lokalt utan internetanslutning.
- Kan jag spela in ljud med min mikrofon?
- Ja. Klicka på "Spela in röst", tillåt mikrofonåtkomst i din webbläsare, tala och klicka på "Stoppa inspelning". Det infångade ljudet behandlas som en uppladdad fil och kan transkriberas omedelbar.
- Vilka språk stöds?
- Alla 99 språk som Whisper stöder – inklusive engelska, spanska, mandarin, franska, arabiska, hindi, tyska, ryska, portugisiska, japanska och många fler. Transkriptet förblir på det talade språket.
- Hur långt kan ljudet vara?
- Filer upp till 200 MB accepteras. Långa inspelningar behandlas i 30-sekundersblock med 5-sekunders överlappning, så en poddserie på en timme producerar fortfarande ett sammanhängande transkript. Bearbetningstiden beror på om din webbläsare stöder WebGPU.
- Laddas ljudet upp till en server?
- Nej. Både modellen och ditt ljud förblir i din webbläsare. Whisper-modellen hämtas en gång från ett CDN och cachelagras, sedan sker transkribering helt på enheten med WebGPU eller WebAssembly.
- Kan jag få undertexter för en video?
- Ja. Ladda ner .srt- eller .vtt-filen och släpp den i din videoredigerare, eller ladda upp den som ett undertextspår på YouTube och andra plattformar. Varje undertextrád innehåller det tidsstämpelintervall som Whisper identifierade.
Relaterade verktyg
Ljud →Utforska fler verktyg
Alla verktyg →- Aktiv
PDF till JPG
Konvertera varje sida i en PDF till en skarp JPG-, PNG- eller WebP-bild direkt i din webbläsare — ingen uppladdning, ingen kvalitetsförlust.
PDFGratisKörs lokaltÖppna - Aktiv
Ta bort bakgrund
Radera bakgrunden i ett foto med en AI-modell i webbläsaren — ingen uppladdning, dina bilder stannar på din enhet.
BildGratisKörs lokaltÖppna - Aktiv
Trimma video
Kapa början eller slutet av en video med precision på bildruta.
VideoGratisÖppna - Aktiv
Markdown till HTML
Rendera Markdown till ren HTML.
DokumentGratisKörs lokaltÖppna - Aktiv
Grammatikkontroll
Åtgärda stavning, grammatik och interpunktion i vilken text som helst med en gratis AI-driven grammatikkontroll — ingen inloggning, ingenting sparat.
AIGratisÖppna