Viktiga punkter
- 01Whisper AI körs inuti din webbläsare — din video laddas aldrig upp till någon server.
- 02Stöder 99 språk med automatisk språkdetektering.
- 03Matar ut vanlig text, SRT-undertextfiler och WebVTT för direkt användning i redigerare och YouTube.
- 04Efter första körningen cachelagras modellen och transkriptionen fungerar offline.
Varför transkribera video i din webbläsare?
Att transkribera en intervju, föreläsning, Zoom-inspelning eller YouTube-video brukade betyda antingen att skriva ut det manuellt eller skicka filen till en molntjänst. Molntjänster är snabba men kommer med en verklig integritetsavvägning — du laddar upp potentiellt känslig ljud till en tredjepartsserver. Handytool tar en annan väg: det laddar ner OpenAI:s open-source Whisper-tal-modell en gång och kör sedan den helt på din enhet med WebGPU eller WebAssembly.
Resultatet är samma AI-kvalitets transkription som du skulle få från en molntjänst, men din videofil och ditt ljud förblir helt privat. Den första körningen laddar ner modellen (cirka 150 MB), men därefter fungerar verktyget helt offline.
Hur man transkriberar en video
Släpp en videofil och få ett utskrift på några minuter.
- 01
Öppna transkriptionsverktyget
Gå till Transkribera video-verktyget på Handytool. Inget konto behövs.
- 02
Lägg till din videofil
Släpp en MP4-, MOV-, WebM-, MKV-, M4V- eller AVI-fil upp till 500 MB. Ljudet extraheras lokalt med FFmpeg.wasm — ingenting laddas upp.
- 03
Välj ett språk (valfritt)
Whisper detekterar det talade språket automatiskt för de flesta inspelningar. Om din video har en tung accent eller är på ett mindre vanligt språk förbättrar manuell språkval noggrannheten.
- 04
Klicka Transkribera
Vid första användningen laddas Whisper-modellen (~150 MB) ner till din webbläsarcache. Senare körningar använder den cachelagrade modellen och fungerar offline. Transkriptionen behandlas i 30-sekundersintervaller med överlappning för att hålla sammanhanget sammanhängande.
- 05
Ladda ned dina resultat
När utskriften visas laddar du ned den som vanlig text, en SRT-undertextfil eller en WebVTT-fil. Alla tre genereras från samma transkriptionskörning.
Vad du kan göra med en videotranskript
Transkriptioner och undertexter låser upp många nedströmsarbetsflöden.
- 01Lägg till undertextning till YouTube eller Vimeo-videor för att förbättra tillgängligheten.
- 02Skapa sökbara anteckningar från föreläsningar, webbseminarier eller utbildningsinspeningar.
- 03Omvandla intervjufilmmaterial till ett blogginlägg eller artikel.
- 04Lägg till graverad undertextning i en videoredigerare med SRT-filen.
- 05Generera en sammanfattning eller handlingspunkter från en mötesinspenad.
- 06Översätt transkriptet till ett annat språk efter nedladdning av texten.
Whisper körs på din enhet — ingenting överförs
Handytool använder FFmpeg.wasm för att extrahera ljudspåret lokalt, sedan lämnar det det till Whisper som körs i din webbläsare via WebGPU (där tillgängligt) eller ren WebAssembly. Vid ingen punkt skickas något ljud- eller videodata över nätverket.
Detta gör verktyget lämpligt för konfidentiella inspelningar — medicinska intervjuer, juridiska vittnesmål, interna affärsmöten, terapisessioner — där uppladdning till en molntranskriptionstjänst inte är acceptabel.
Videotranskription FAQ
Vilka videoformat stöds?
MP4-, MOV-, WebM-, MKV-, M4V- och AVI-behållare upp till 500 MB. Vanliga ljud-codecs inuti dessa behållare (AAC, MP3, Opus, Vorbis) fungerar alla.
Vilka språk kan det transkribera?
Alla 99 språk Whisper stöder, inklusive engelska, spanska, mandarin, franska, arabiska, hindi, tyska, ryska, portugisiska och japanska. Transkriptet förblir på det talade språket.
Kan jag generera undertexter för YouTube?
Ja. Efter transkribering laddar du ner SRT- eller VTT-filen och laddar upp den direkt i YouTube Studio:s undertexteditor.
Hur lång kan videon vara?
Filer upp till 500 MB accepteras. Långa inspelningar delas upp i 30-sekundersintervaller med 5-sekunders överlappning, så transkriptet förblir sammanhängande över hela videon.
Laddas videon upp till en server?
Nej. Både FFmpeg.wasm och Whisper-modellen körs lokalt i din webbläsare. Ingenting laddas upp vid någon fas.
Fungerar det offline?
Efter första körningen cachelagras Whisper-modellen i din webbläsare. Senare transkriptioner fungerar helt offline — du behöver bara en internetanslutning första gången.