Handytool
AudioZdarmaSpouštěno lokálně

Přepis zvuku na text

Převeďte řeč v jakémkoliv jazyce na text v prohlížeči.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Jazyk
Načítání modelu…

Běží zcela v prohlížeči.

nebo

O Přepis zvuku na text

Vložte zvukový soubor nebo nahrávejte přímo z mikrofonu a získejte přepis napsaný ve stejném jazyce, kterým mluvčí hovořil — bez nahrávání, bez účtu, bez instalace aplikace. Handytool spouští open-source Whisper od OpenAI přímo v prohlížeči s WebGPU, když je dostupné, takže vaše podcasty, rozhovory, hlasové poznámky, přednášky a nahrávky schůzek zůstávají zcela soukromé. Stáhněte si výsledek jako prostý text, soubor titulků SRT nebo soubor WebVTT připravený pro přehrávače videa.

Funkce: Přepis zvuku na text

  • 01

    99 jazyků, automatická detekce

    Whisper detekuje mluvený jazyk a vytvoří přepis ve stejném jazyce — španělština zůstává španělština, japonština zůstává japonština, němčina zůstává němčina. Bez výběru jazyka, bez dalších nastavení.

  • 02

    Nahrajte soubor nebo nahrávejte živě

    Přineste soubor MP3, WAV, M4A, OGG, FLAC nebo WebM, nebo klikněte na Nahrávat hlasem a zachyťte zvuk přímo z mikrofonu. Zastavte se, když skončíte, a nahrávka jde přímo do přepisu.

  • 03

    Soukromé zpracování v prohlížeči

    Model Whisper se stáhne jednou do mezipaměti prohlížeče a běží zcela na vašem zařízení s akcelerací WebGPU, pokud je podporována. Nic se nenahrává — váš zvuk nikdy neopustí váš počítač.

Přepis zvuku na text – časté dotazy

Jak mohu přepsat zvukový soubor?
Vložte svůj zvukový soubor (MP3, WAV, M4A, OGG, FLAC nebo WebM) do nástroje a klikněte na Přepsat. První spuštění stáhne model řeči (~150 MB); poté se přepis spouští lokálně bez internetového připojení.
Mohu nahrávat zvuk pomocí mikrofonu?
Ano. Klikněte na Nahrávat hlasem, povolte přístup k mikrofonu v prohlížeči, mluvte a klikněte na Zastavit nahrávání. Zachycený zvuk se zpracovává jako nahraný soubor a můžete ho okamžitě přepsat.
Které jazyky jsou podporovány?
Všech 99 jazyků, které Whisper podporuje — včetně angličtiny, španělštiny, mandarínštiny, francouzštiny, arabštiny, hindštiny, němčiny, ruštiny, portugalštiny, japonštiny a mnoha dalších. Přepis zůstává v jazyce, kterým mluvčí hovořil.
Jak dlouhý může být zvuk?
Soubory do 200 MB jsou přijímány. Dlouhé nahrávky se zpracovávají v 30sekundových blocích s 5sekundovým překrytím, takže jednorhodinový podcast stále vytváří koherentní přepis. Doba zpracování závisí na tom, zda váš prohlížeč podporuje WebGPU.
Je zvuk nahrán na server?
Ne. Jak model, tak váš zvuk zůstávají v prohlížeči. Model Whisper se stáhne jednou ze CDN a uloží se v mezipaměti, poté se přepis provádí zcela na zařízení pomocí WebGPU nebo WebAssembly.
Mohu získat titulky k videu?
Ano. Stáhněte si soubor .srt nebo .vtt a vložte ho do video editoru, nebo ho nahrajte jako stopa titulků na YouTube a dalších platformách. Každý řádek titulků obsahuje interval, který Whisper detekoval.

Související nástroje

Audio

Prozkoumat další nástroje

Všechny nástroje