Handytool
HangIngyenesHelyi futtatás

Hangfelvétel szöveggé alakítása

Konvertálja a beszédet bármilyen nyelvről szöveggé a böngészőben.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Nyelv
Modell betöltésre…

Teljesen a böngészőben működik.

vagy

Hangfelvétel szöveggé alakítása – áttekintés

Adjon hozzá egy hangfájlt vagy rögzítsen közvetlenül a mikrofonból, és kapjon szöveges átiratot ugyanabban a nyelvben, amelyen a beszélő beszélt — feltöltés nélkül, fiók nélkül, szoftver telepítése nélkül. A Handytool az OpenAI nyílt forráskódú Whisper modelljét futtatja közvetlenül a böngészőjében, WebGPU-val ahol elérhető, így a podcastjaik, interjúik, hangjegyzeteik, előadásaik és megbeszélésének felvételei teljesen magánjellegűek maradnak. Töltse le az eredményt egyszerű szövegként, SRT felirat fájlként vagy WebVTT fájlként, amely készen áll a videó lejátszók számára.

Hangfelvétel szöveggé alakítása – funkciók

  • 01

    99 nyelv, automatikus felismerés

    A Whisper felismeri a beszélt nyelvét és ugyanebben a nyelvben írja meg az átiratot — a spanyol spanyol marad, a japán japán marad, a német német marad. Nincs nyelvválasztó, nincs további beállítás.

  • 02

    Töltsön fel fájlt vagy rögzítsen élőben

    Hozzon be egy MP3, WAV, M4A, OGG, FLAC vagy WebM fájlt, vagy kattintson a Hangot rögzítésre, hogy közvetlenül a mikrofonból rögzítsen hangot. Hagyjon abba, amikor végzett, és a felvétel közvetlenül az átiratba kerül.

  • 03

    Privát feldolgozás a böngészőben

    A Whisper modell egyszer letöltésre kerül a böngésző gyorsítótárába és teljes egészében az Ön eszközén fut, WebGPU gyorsítással, ahol támogatott. Semmi nem kerül feltöltésre — a hangja soha nem hagyja el a számítógépét.

Hangfelvétel szöveggé alakítása – GYIK

Hogyan tudom átírni egy hangfájlt?
Adja hozzá a hangfájlt (MP3, WAV, M4A, OGG, FLAC vagy WebM) az eszközhöz, és kattintson az Átírás gombra. Az első futtatás letölti a beszédmodellt (~150 MB); ezt követően az átirat helyileg működik internetkapcsolat nélkül.
Rögzíthetek hangot a mikrofonról?
Igen. Kattintson a Hangot rögzítésre, engedélyezze a mikrofon hozzáférést a böngészőben, beszéljen, és kattintson a Rögzítés leállítása gombra. A rögzített hang feltöltött fájlként kezelhető, és azonnal átírható.
Mely nyelvek támogatottak?
A Whisper által támogatott mind a 99 nyelv — beleértve az angolt, spanyolt, mandarin kínait, franciát, arabat, hindit, németet, oroszokat, portugált, japánt és sok mást. Az átirat abban a nyelvben marad, amelyen a beszélő beszélt.
Meddig tarthat a hangfelvétel?
Legfeljebb 200 MB-os fájlok elfogadottak. A hosszú felvételek 30 másodperces blokkokra osztva feldolgozottak, 5 másodperces átfedéssel, így egy egyórás podcast továbbra is koherent átiratot eredményez. A feldolgozási idő attól függ, hogy a böngésző támogatja-e a WebGPU-t.
Fel van töltve a hang egy szerverre?
Nem. A modell és a hangja egyaránt a böngészőjében marad. A Whisper modell egyszer letöltésre kerül a CDN-ből és gyorsítótárba kerül, majd az átirat teljes egészében az eszközön történik WebGPU vagy WebAssembly segítségével.
Kaphatok feliratok egy videóhoz?
Igen. Töltse le az .srt vagy .vtt fájlt, és dobja be a videó szerkesztőjébe, vagy töltse fel feliratsor következtében a YouTube-ra és más platformokra. Minden feliratsor tartalmazza az időintervallumot, amelyet a Whisper detektált.

Kapcsolódó eszközök

Hang

Fedezz fel más eszközöket

Összes eszköz