Jak mohu přepsat zvukový soubor?

Vložte svůj zvukový soubor (MP3, WAV, M4A, OGG, FLAC nebo WebM) do nástroje a klikněte na Přepsat. První spuštění stáhne model řeči (~150 MB); poté se přepis spouští lokálně bez internetového připojení.

Mohu nahrávat zvuk pomocí mikrofonu?

Ano. Klikněte na Nahrávat hlasem, povolte přístup k mikrofonu v prohlížeči, mluvte a klikněte na Zastavit nahrávání. Zachycený zvuk se zpracovává jako nahraný soubor a můžete ho okamžitě přepsat.

Které jazyky jsou podporovány?

Všech 99 jazyků, které Whisper podporuje — včetně angličtiny, španělštiny, mandarínštiny, francouzštiny, arabštiny, hindštiny, němčiny, ruštiny, portugalštiny, japonštiny a mnoha dalších. Přepis zůstává v jazyce, kterým mluvčí hovořil.

Jak dlouhý může být zvuk?

Soubory do 200 MB jsou přijímány. Dlouhé nahrávky se zpracovávají v 30sekundových blocích s 5sekundovým překrytím, takže jednorhodinový podcast stále vytváří koherentní přepis. Doba zpracování závisí na tom, zda váš prohlížeč podporuje WebGPU.

Je zvuk nahrán na server?

Ne. Jak model, tak váš zvuk zůstávají v prohlížeči. Model Whisper se stáhne jednou ze CDN a uloží se v mezipaměti, poté se přepis provádí zcela na zařízení pomocí WebGPU nebo WebAssembly.

Mohu získat titulky k videu?

Ano. Stáhněte si soubor .srt nebo .vtt a vložte ho do video editoru, nebo ho nahrajte jako stopa titulků na YouTube a dalších platformách. Každý řádek titulků obsahuje interval, který Whisper detekoval.

AudioZdarmaSpouštěno lokálně

Přepis zvuku na text

Převeďte řeč v jakémkoliv jazyce na text v prohlížeči.

.mp3.wav.ogg.m4a.aac.flac.webm.opus

Jazyk

Načítání modelu…

Běží zcela v prohlížeči.

Přetáhněte zvukový soubor sem

MP3 · WAV · OGG · M4A · FLAC · WebM · max 200 MB

První spuštění stáhne ~150 MB; poté se cache.

Vybrat soubor

nebo

O Přepis zvuku na text

Vložte zvukový soubor nebo nahrávejte přímo z mikrofonu a získejte přepis napsaný ve stejném jazyce, kterým mluvčí hovořil — bez nahrávání, bez účtu, bez instalace aplikace. Handytool spouští open-source Whisper od OpenAI přímo v prohlížeči s WebGPU, když je dostupné, takže vaše podcasty, rozhovory, hlasové poznámky, přednášky a nahrávky schůzek zůstávají zcela soukromé. Stáhněte si výsledek jako prostý text, soubor titulků SRT nebo soubor WebVTT připravený pro přehrávače videa.

Funkce: Přepis zvuku na text

01
99 jazyků, automatická detekce
Whisper detekuje mluvený jazyk a vytvoří přepis ve stejném jazyce — španělština zůstává španělština, japonština zůstává japonština, němčina zůstává němčina. Bez výběru jazyka, bez dalších nastavení.
02
Nahrajte soubor nebo nahrávejte živě
Přineste soubor MP3, WAV, M4A, OGG, FLAC nebo WebM, nebo klikněte na Nahrávat hlasem a zachyťte zvuk přímo z mikrofonu. Zastavte se, když skončíte, a nahrávka jde přímo do přepisu.
03
Soukromé zpracování v prohlížeči
Model Whisper se stáhne jednou do mezipaměti prohlížeče a běží zcela na vašem zařízení s akcelerací WebGPU, pokud je podporována. Nic se nenahrává — váš zvuk nikdy neopustí váš počítač.