Viktigste punkter
- 01Whisper AI kjører inne i nettleseren — videoen lastes aldri opp til noen server.
- 02Støtter 99 språk med automatisk språkgjenkjenning.
- 03Utgir vanlig tekst, SRT-undertekstfiler og WebVTT for direkte bruk i editorer og YouTube.
- 04Etter første kjøring cachelagres modellen og transkripsjon fungerer frakoblet.
Hvorfor transkribere video i nettleseren?
Transkribering av et intervju, forelesning, Zoom-opptak eller YouTube-video pleide å bety enten å skrive det ut manuelt eller å sende filen til en skytjeneste. Skytjenester er raske, men kommer med en reell integritetskompromiss — du laster opp potensielt sensitiv lyd til en tredjeparts server. Handytool tar en annen tilnærming: den laster ned OpenAI's åpen kildekode Whisper-talemodell en gang og kjører den deretter fullstendig på enheten din med WebGPU eller WebAssembly.
Resultatet er samme AI-kvalitets transkripsjon du ville få fra en skytjeneste, men videofilen og lyden forblir fullstendig privat. Første kjøring laster ned modellen (rundt 150 MB), men etter det fungerer verktøyet fullstendig frakoblet.
Slik transkriberer du en video
Slipp en videofil og få et transkripsjon på minutter.
- 01
Åpne transkribsjonsverktøyet
Gå til Transkriber Video-verktøyet på Handytool. Ingen konto er nødvendig.
- 02
Legg til videofilen
Slipp inn en MP4-, MOV-, WebM-, MKV-, M4V- eller AVI-fil på opptil 500 MB. Lyden ekstraheres lokalt med FFmpeg.wasm — ingenting lastes opp.
- 03
Velg et språk (valgfritt)
Whisper gjenkjenner det talte språket automatisk for de fleste opptak. Hvis videoen har en tung dialekt eller er på et mindre utbredt språk, forbedrer manuell valg av språk nøyaktigheten.
- 04
Klikk Transkriber
Ved første bruk laster Whisper-modellen (~150 MB) ned til nettlesercachen. Senere kjøringer bruker cachelagret modell og fungerer frakoblet. Transkripsjon behandles i 30-sekund-biter med overlapping for å holde konteksten sammenhengende.
- 05
Last ned utdataene
Når transkripsjonen vises, laster du det ned som vanlig tekst, en SRT-undertekstfil eller en WebVTT-fil. Alle tre genereres fra samme transkribsjønskjøring.
Hva du kan gjøre med et videotranskript
Transkripsjoner og undertekster låser opp mange etterfølgende arbeidsflyting.
- 01Legg bildetekst til YouTube- eller Vimeo-videoer for å forbedre tilgjengeligheten.
- 02Opprett søkbare notater fra forelesninger, webinarer eller treningsopptak.
- 03Gjenbru intervjuopptak til et blogginnlegg eller artikkel.
- 04Legg inn bildetekst i videoen med SRT-filen.
- 05Generer et sammendrag eller handlingspunkter fra et møteopptak.
- 06Oversett transkripsjonen til et annet språk etter nedlasting av teksten.
Whisper kjører på enheten — ingenting blir overført
Handytool bruker FFmpeg.wasm for å ekstraherer lydspor lokalt, deretter overfører det til Whisper som kjører i nettleseren via WebGPU (der tilgjengelig) eller ren WebAssembly. Ingen lyd- eller videodata sendes over nettverket på noe punkt.
Dette gjør verktøyet egnet for konfidensielle opptak — medisinske intervjuer, juridiske uttalelser, interne forretingsmøter, terapi-sesjoner — der opplasting til en sky-transkribsjonstjeneste ikke er akseptabelt.
Videotranskribering – ofte stilte spørsmål
Hvilke videoformater støttes?
MP4-, MOV-, WebM-, MKV-, M4V- og AVI-containere opptil 500 MB. Vanlige lydkodeker inne i disse containerne (AAC, MP3, Opus, Vorbis) fungerer alle.
Hvilke språk kan det transkribere?
Alle 99 språk Whisper støtter, inkludert engelsk, spansk, mandarin, fransk, arabisk, hindi, tysk, russisk, portugisisk og japansk. Transkripsjonen forblir på talespråket.
Kan jeg generer undertekster for YouTube?
Ja. Etter transkribering laster du ned SRT- eller VTT-filen og laster den opp direkte i YouTube Studio's bildeteksteditor.
Hvor lang kan videoen være?
Filer opptil 500 MB godtas. Lange opptak deles inn i 30-sekunders biter med 5-sekunders overlapping, så transkripsjonen forblir sammenhengende over hele videoen.
Lastes videoen opp til en server?
Nei. Både FFmpeg.wasm og Whisper-modellen kjører lokalt i nettleseren. Ingenting lastes opp på noe stadium.
Fungerer det frakoblet?
Etter første kjøring cachelagres Whisper-modellen i nettleseren. Senere transkripsjon fungerer fullstendig frakoblet — du trenger bare internettilkobling første gang.