Handytool
აუდიოუფასოახორციელდება ადგილობრივად

აუდიოს ტექსტად გადაყვანა

გადააქციეთ ნებისმიერ ენაზე ჩაწერილი საუბარი ტექსტად პირდაპირ თქვენს ბრაუზერში.

.mp3.wav.ogg.m4a.aac.flac.webm.opus
ენა
მოდელი იტვირთება…

სრულად თქვენს ბრაუზერში მუშაობს.

ან

აუდიოს ტექსტად გადაყვანა შესახებ

ჩააგდეთ აუდიო ფაილი ან ჩაწერეთ პირდაპირ მიკროფონით და მიიღეთ ტექსტური ტრანსკრიპტი იმავე ენაზე, რომელზეც მომხსენებელი საუბრობს — ატვირთვის, ანგარიშისა და აპის დაყენების გარეშე. Handytool OpenAI-ის ღია კოდის Whisper მოდელს უშუალოდ თქვენს ბრაუზერში უშვებს და, როცა ხელმისაწვდომია, WebGPU-ს იყენებს, ამიტომ პოდკასტები, ინტერვიუები, ხმოვანი ჩანაწერები, ლექციები და შეხვედრის ჩანაწერები კონფიდენციალურად რჩება. შედეგი ჩამოტვირთეთ უბრალო ტექსტად, SRT სუბტიტრების ფაილად ან WebVTT ფაილად, რომელიც ვიდეო პლეერებისთვის მზადაა.

აუდიოს ტექსტად გადაყვანა მახასიათებელი

  • 01

    99 ენა, ავტომატური ამოცნობა

    Whisper ამოიცნობს საუბრის ენას და ტრანსკრიპტს იმავე ენაზე წერს — ქართული ქართულად რჩება, იაპონური იაპონურად, გერმანული გერმანულად. ენის არჩევა და დამატებითი პარამეტრები საჭირო არ არის.

  • 02

    ატვირთეთ ფაილი ან ჩაწერეთ პირდაპირ

    გამოიყენეთ MP3, WAV, M4A, OGG, FLAC ან WebM ფაილი, ან დააჭირეთ ხმის ჩაწერას, რომ აუდიო პირდაპირ მიკროფონიდან ჩაიწეროს. დასრულებისას გააჩერეთ ჩაწერა და ჩანაწერი მაშინვე ტრანსკრიფციაში გადავა.

  • 03

    პირადი დამუშავება ბრაუზერში

    Whisper მოდელი ერთხელ ჩამოიტვირთება თქვენი ბრაუზერის ქეშში და სრულად თქვენს მოწყობილობაზე მუშაობს, WebGPU აჩქარებით იქ, სადაც მხარდაჭერილია. არაფერი იტვირთება სერვერზე — თქვენი აუდიო კომპიუტერს არ ტოვებს.

აუდიოს ტექსტად გადაყვანა ხშირი კითხვები

როგორ გადავიყვანო აუდიო ფაილი ტექსტად?
ჩააგდეთ თქვენი აუდიო ფაილი (MP3, WAV, M4A, OGG, FLAC ან WebM) ინსტრუმენტში და დააჭირეთ ტრანსკრიფციას. პირველი გაშვებისას ჩამოიტვირთება საუბრის მოდელი (~150 MB); შემდეგ ტრანსკრიფცია ლოკალურად, ინტერნეტის გარეშე მუშაობს.
შემიძლია აუდიოს მიკროფონით ჩაწერა?
დიახ. დააჭირეთ ხმის ჩაწერას, ბრაუზერში მიკროფონზე წვდომა დაუშვით, ისაუბრეთ და დააჭირეთ ჩაწერის შეჩერებას. ჩაწერილი აუდიო ატვირთული ფაილივით მუშავდება და მისი ტრანსკრიფცია მაშინვე შეგიძლიათ.
რომელი ენებია მხარდაჭერილი?
ყველა 99 ენა, რომელსაც Whisper უჭერს მხარს — მათ შორის ინგლისური, ესპანური, მანდარინი, ფრანგული, არაბული, ჰინდი, გერმანული, რუსული, პორტუგალიური, იაპონური და მრავალი სხვა. ტრანსკრიპტი იმ ენაზე რჩება, რომელზეც საუბარი იყო.
რამდენად გრძელი აუდიო შეიძლება იყოს?
მიიღება 200 MB-მდე ფაილები. გრძელი ჩანაწერები მუშავდება 30-წამიან ნაწილებად 5-წამიანი გადაფარვით, ამიტომ ერთსაათიანი პოდკასტიც თანმიმდევრულ ტრანსკრიპტს იძლევა. დამუშავების დრო დამოკიდებულია იმაზე, უჭერს თუ არა თქვენი ბრაუზერი WebGPU-ს მხარს.
იტვირთება აუდიო სერვერზე?
არა. მოდელიც და თქვენი აუდიოც ბრაუზერში რჩება. Whisper მოდელი ერთხელ ჩამოიტვირთება CDN-იდან და ქეშში ინახება, შემდეგ კი ტრანსკრიფცია მთლიანად მოწყობილობაზე ხდება WebGPU-ს ან WebAssembly-ის გამოყენებით.
შემიძლია ვიდეოსთვის სუბტიტრების მიღება?
დიახ. ჩამოტვირთეთ .srt ან .vtt ფაილი და დაამატეთ ვიდეო რედაქტორში, ან ატვირთეთ სუბტიტრების ბილიკად YouTube-ზე და სხვა პლატფორმებზე. სუბტიტრის თითოეულ ხაზში არის დროის ის დიაპაზონი, რომელიც Whisper-მა ამოიცნო.

დაკავშირებული ინსტრუმენტები

აუდიო

სხვა ინსტრუმენტების გამოკვლევა

ყველა ინსტრუმენტი