Cum pot transcriere un fișier audio?

Adăugați fișierul audio (MP3, WAV, M4A, OGG, FLAC sau WebM) în instrument și faceți clic pe Transcriere. Prima rulare descarcă modelul vorbirii (~150 MB); după aceea, transcrierea rulează local fără conexiune la internet.

Pot înregistra audio cu microfonul?

Da. Faceți clic pe Înregistrează voce, permiteți accesul la microfon în browser, vorbți și faceți clic pe Opriți înregistrarea. Audio-ul capturat este tratat ca un fișier încărcat și îl puteți transcriere imediat.

Care sunt limbile suportate?

Toate cele 99 de limbi pe care Whisper le suportă — inclusiv engleză, spaniolă, mandarină, franceză, arabă, hindi, germană, rusă, portugheză, japoneză și multe altele. Transcrierea rămâne în limba pe care a vorbit vorbitorului.

Cât timp poate fi audio-ul?

Se acceptă fișiere de până la 200 MB. Înregistrările lungi sunt procesate în blocuri de 30 de secunde cu suprapunere de 5 secunde, deci un podcast de o oră produce încă o transcriere coerentă. Timpul de procesare depinde de faptul că browser-ul dvs. suportă WebGPU.

Este audio-ul încărcat pe un server?

Nu. Atât modelul, cât și audio-ul dvs. rămân în browser-ul dvs. Modelul Whisper este descărcat o dată din CDN și cache-at, apoi transcrierea se întâmplă în întregime pe dispozitiv folosind WebGPU sau WebAssembly.

Pot obține subtitrări pentru un videoclip?

Da. Descărcați fișierul .srt sau .vtt și adăugați-l în editorul video, sau încărcați-l ca pistă de subtitrări pe YouTube și alte platforme. Fiecare linie de subtitrări include intervalul de timp pe care Whisper l-a detectat.

AudioGratuitRulează local

Transcriere audio în text

Convertiți vorbirea în orice limbă în text în browser-ul dvs.

.mp3.wav.ogg.m4a.aac.flac.webm.opus

Limbă

Se încarcă model…

Funcționează complet în browser.

Trageți un fișier audio aici

MP3 · WAV · OGG · M4A · FLAC · WebM · max 200 MB

Prima rulare descarcă ~150 MB; cache după aceea.

Alegeți fișier

Despre Transcriere audio în text

Adăugați un fișier audio sau înregistrați direct din microfonul dvs. și obțineți o transcriere scrisă în aceeași limbă pe care a vorbit vorbitorului — fără încărcare, fără cont, fără aplicație de instalat. Handytool rulează modelul Whisper open-source de la OpenAI direct în browser-ul dvs. folosind WebGPU atunci când este disponibil, deci podcast-urile, interviurile, notele vocale, prelegerile și înregistrările întâlnirilor dvs. rămân complet private. Descărcați rezultatul ca text simplu, fișier de subtitrări SRT sau fișier WebVTT gata pentru playere video.

Transcriere audio în text – funcționalități

01
99 de limbi, detecție automată
Whisper detectează limba vorbită și scrie transcrierea în aceeași limbă — spaniola rămâne spaniolă, japoneza rămâne japoneză, germana rămâne germană. Fără selector de limbă, fără setări suplimentare.
02
Încărcați un fișier sau înregistrați în direct
Aduceți un fișier MP3, WAV, M4A, OGG, FLAC sau WebM, sau faceți clic pe Înregistrează voce pentru a captura audio direct din microfonul dvs. Opriți-vă când ați terminat și înregistrarea intră direct în transcriere.
03
Procesare privată, în browser
Modelul Whisper este descărcat o dată în cache-ul browser-ului și rulează complet pe dispozitivul dvs. cu accelerare WebGPU unde este suportat. Nimic nu este încărcat — audio-ul dvs. nu părăsește niciodată computerul dvs.

Transcriere audio în text – întrebări frecvente

Cum pot transcriere un fișier audio?: Adăugați fișierul audio (MP3, WAV, M4A, OGG, FLAC sau WebM) în instrument și faceți clic pe Transcriere. Prima rulare descarcă modelul vorbirii (~150 MB); după aceea, transcrierea rulează local fără conexiune la internet.
Pot înregistra audio cu microfonul?: Da. Faceți clic pe Înregistrează voce, permiteți accesul la microfon în browser, vorbți și faceți clic pe Opriți înregistrarea. Audio-ul capturat este tratat ca un fișier încărcat și îl puteți transcriere imediat.
Care sunt limbile suportate?: Toate cele 99 de limbi pe care Whisper le suportă — inclusiv engleză, spaniolă, mandarină, franceză, arabă, hindi, germană, rusă, portugheză, japoneză și multe altele. Transcrierea rămâne în limba pe care a vorbit vorbitorului.
Cât timp poate fi audio-ul?: Se acceptă fișiere de până la 200 MB. Înregistrările lungi sunt procesate în blocuri de 30 de secunde cu suprapunere de 5 secunde, deci un podcast de o oră produce încă o transcriere coerentă. Timpul de procesare depinde de faptul că browser-ul dvs. suportă WebGPU.
Este audio-ul încărcat pe un server?: Nu. Atât modelul, cât și audio-ul dvs. rămân în browser-ul dvs. Modelul Whisper este descărcat o dată din CDN și cache-at, apoi transcrierea se întâmplă în întregime pe dispozitiv folosind WebGPU sau WebAssembly.
Pot obține subtitrări pentru un videoclip?: Da. Descărcați fișierul .srt sau .vtt și adăugați-l în editorul video, sau încărcați-l ca pistă de subtitrări pe YouTube și alte platforme. Fiecare linie de subtitrări include intervalul de timp pe care Whisper l-a detectat.

Ghiduri

Articole →

5 min
Ghid audio
Cum să transcrieți audio în text online
Transformați notițe vocale, interviuri și înregistrări în text căutabil în browser, cu recunoaștere vocală pe dispozitiv.
Actualizat 1 mai 2026Citit

Instrumente similare

Audio →

Explorează alte instrumente

Toate instrumentele →

Transcriere audio în text

Despre Transcriere audio în text

Transcriere audio în text – funcționalități

99 de limbi, detecție automată

Încărcați un fișier sau înregistrați în direct

Procesare privată, în browser

Transcriere audio în text – întrebări frecvente

Ghiduri

Cum să transcrieți audio în text online

Instrumente similare

Îmbunătățitor de voce

Izolator de voce

Taie audio

Explorează alte instrumente

PDF to PNG

Generator de fotografie pentru viză Japonia

Subtitle Burner

Vizualizator JSON

Verificator de gramatică