Handytool
AudioGratuitRulează local

Transcriere audio în text

Convertiți vorbirea în orice limbă în text în browser-ul dvs.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
Limbă
Se încarcă model…

Funcționează complet în browser.

sau

Despre Transcriere audio în text

Adăugați un fișier audio sau înregistrați direct din microfonul dvs. și obțineți o transcriere scrisă în aceeași limbă pe care a vorbit vorbitorului — fără încărcare, fără cont, fără aplicație de instalat. Handytool rulează modelul Whisper open-source de la OpenAI direct în browser-ul dvs. folosind WebGPU atunci când este disponibil, deci podcast-urile, interviurile, notele vocale, prelegerile și înregistrările întâlnirilor dvs. rămân complet private. Descărcați rezultatul ca text simplu, fișier de subtitrări SRT sau fișier WebVTT gata pentru playere video.

Transcriere audio în text – funcționalități

  • 01

    99 de limbi, detecție automată

    Whisper detectează limba vorbită și scrie transcrierea în aceeași limbă — spaniola rămâne spaniolă, japoneza rămâne japoneză, germana rămâne germană. Fără selector de limbă, fără setări suplimentare.

  • 02

    Încărcați un fișier sau înregistrați în direct

    Aduceți un fișier MP3, WAV, M4A, OGG, FLAC sau WebM, sau faceți clic pe Înregistrează voce pentru a captura audio direct din microfonul dvs. Opriți-vă când ați terminat și înregistrarea intră direct în transcriere.

  • 03

    Procesare privată, în browser

    Modelul Whisper este descărcat o dată în cache-ul browser-ului și rulează complet pe dispozitivul dvs. cu accelerare WebGPU unde este suportat. Nimic nu este încărcat — audio-ul dvs. nu părăsește niciodată computerul dvs.

Transcriere audio în text – întrebări frecvente

Cum pot transcriere un fișier audio?
Adăugați fișierul audio (MP3, WAV, M4A, OGG, FLAC sau WebM) în instrument și faceți clic pe Transcriere. Prima rulare descarcă modelul vorbirii (~150 MB); după aceea, transcrierea rulează local fără conexiune la internet.
Pot înregistra audio cu microfonul?
Da. Faceți clic pe Înregistrează voce, permiteți accesul la microfon în browser, vorbți și faceți clic pe Opriți înregistrarea. Audio-ul capturat este tratat ca un fișier încărcat și îl puteți transcriere imediat.
Care sunt limbile suportate?
Toate cele 99 de limbi pe care Whisper le suportă — inclusiv engleză, spaniolă, mandarină, franceză, arabă, hindi, germană, rusă, portugheză, japoneză și multe altele. Transcrierea rămâne în limba pe care a vorbit vorbitorului.
Cât timp poate fi audio-ul?
Se acceptă fișiere de până la 200 MB. Înregistrările lungi sunt procesate în blocuri de 30 de secunde cu suprapunere de 5 secunde, deci un podcast de o oră produce încă o transcriere coerentă. Timpul de procesare depinde de faptul că browser-ul dvs. suportă WebGPU.
Este audio-ul încărcat pe un server?
Nu. Atât modelul, cât și audio-ul dvs. rămân în browser-ul dvs. Modelul Whisper este descărcat o dată din CDN și cache-at, apoi transcrierea se întâmplă în întregime pe dispozitiv folosind WebGPU sau WebAssembly.
Pot obține subtitrări pentru un videoclip?
Da. Descărcați fișierul .srt sau .vtt și adăugați-l în editorul video, sau încărcați-l ca pistă de subtitrări pe YouTube și alte platforme. Fiecare linie de subtitrări include intervalul de timp pe care Whisper l-a detectat.

Instrumente similare

Audio

Explorează alte instrumente

Toate instrumentele