نکات کلیدی
- 01Whisper AI در مرورگر شما اجرا میشود — ویدیوی شما هرگز به سرویسی آپلود نمیشود.
- 0299 زبان با تشخیص خودکار زبان پشتیبانی میکند.
- 03متن ساده، فایل های زیرنویس SRT و WebVTT برای استفاده مستقیم در ویرایشگر و YouTube تولید میکند.
- 04پس از اول بار اجرا، مدل کش شده و رونویسی به صورت آفلاین کار میکند.
چرا ویدیو را در مرورگر رونویس کنید؟
رونویسی یک مصاحبه، سخنرانی، ضبط Zoom یا ویدیوی YouTube به معنای تایپ کردن دستی یا ارسال فایل به سرویس ابری است. سرویس های ابری سریع هستند اما با معامله حریم خصوصی واقعی آمدهاند — شما صدا به صورت بالقوه حساسی را به سرویس خادم شخص ثالث آپلود میکنید. Handytool یک رویکرد متفاوت را میگیرد: مدل سخن Whisper متن باز OpenAI را یکبار دانلود میکند و سپس کاملاً در دستگاه شما با استفاده از WebGPU یا WebAssembly اجرا میکند.
نتیجه رونویسی کیفیت AI یکسانی است که از سرویس ابری دریافت میکنید، اما فایل ویدیو و صدای شما کاملاً خصوصی باقی میمانند. اول بار صدای مدل را دانلود میکند (حدود 150 مگابایت)، اما بعد از آن، ابزار کاملاً به صورت آفلاین کار میکند.
نحوه رونویسی ویدیو
فایل ویدیویی را رها کنید و در دقیقه ها رونویس دریافت کنید.
- 01
ابزار رونویسی را باز کنید
به ابزار رونویسی ویدیو در Handytool بروید. هیچ حساب کاربری لازم نیست.
- 02
فایل ویدیویی خود را اضافه کنید
فایل MP4، MOV، WebM، MKV، M4V یا AVI تا 500 مگابایت را رها کنید. صدا با FFmpeg.wasm محلی استخراج میشود — چیزی آپلود نمیشود.
- 03
زبان را انتخاب کنید (اختیاری)
Whisper زبان سخن شده را برای اکثر ضبطها خودکار شناسایی میکند. اگر ویدیوی شما تاکید سنگین یا زبان کمتر رایج داشته باشد، انتخاب دستی زبان دقت را بهبود میبخشد.
- 04
بر روی رونویس کلیک کنید
هنگام اول استفاده، مدل Whisper (~150 مگابایت) به کش مرورگر شما دانلود میشود. اجراهای بعدی از مدل کش شده استفاده میکنند و به صورت آفلاین کار میکنند. رونویسی در قطعات 30 ثانیهای با همپوشانی برای نگاهداشتن بافت منسجم پردازش میشود.
- 05
خروجی خود را دانلود کنید
هنگامی که رونویس ظاهر میشود، آن را به عنوان متن ساده، فایل زیرنویس SRT یا فایل WebVTT دانلود کنید. هر سه از اجرای رونویسی یکسان تولید میشوند.
آنچه میتوانید با رونویس ویدیویی انجام دهید
رونویسها و زیرنویسها جریانهای کاری پایین دستی بسیاری را باز میکنند.
- 01زیرنویس بستهای را به ویدیوهای YouTube یا Vimeo اضافه کنید تا رسانهی بهتر شود.
- 02یادداشتهای قابل جستجو از سخنرانیها، وبینارها یا ضبطهای آموزشی ایجاد کنید.
- 03ویدیوی مصاحبه را به پست وبلاگ یا مقاله تبدیل کنید.
- 04زیرنویسهای سوخته شده را با استفاده از فایل SRT در ویرایشگر ویدیویی اضافه کنید.
- 05خلاصه یا اقدام عناصر از ضبط جلسه تولید کنید.
- 06رونویس را به زبان دیگری ترجمه کنید پس از دانلود متن.
Whisper در دستگاه شما اجرا میشود — چیزی منتقل نمیشود
Handytool از FFmpeg.wasm برای استخراج مسیر صوتی به صورت محلی استفاده میکند، سپس آن را به Whisper اجرا شده در مرورگر شما از طریق WebGPU (در دسترس) یا WebAssembly خالص میپاسد. در هیچ نقطهای دادهی صوتی یا ویدیویی در شبکه ارسال نمیشود.
این ابزار را برای ضبطهای محرمانه — مصاحبههای پزشکی، شهادت قانونی، جلسات تجاری داخلی، جلسات درمانی — مناسب میسازد، جایی که آپلود به سرویس رونویسی ابری قابل قبول نیست.
سوالات متداول رونویسی ویدیو
کدام فرمتهای ویدیویی پشتیبانی میشوند؟
ظرفهای MP4، MOV، WebM، MKV، M4V و AVI تا 500 مگابایت. کوڈکهای صوتی متداول در آن ظرفها (AAC، MP3، Opus، Vorbis) همه کار میکنند.
کدام زبانها را میتوانند رونویس کنند؟
تمام 99 زبانی که Whisper پشتیبانی میکند، از جمله انگلیسی، اسپانیایی، مندارین، فرانسوی، عربی، هندی، آلمانی، روسی، پرتغالی و ژاپنی. رونویس در زبان سخن شده باقی میماند.
آیا میتوانم زیرنویس برای YouTube تولید کنم؟
بله. بعد از رونویسی، فایل SRT یا VTT را دانلود کنید و مستقیماً در ویرایشگر زیرنویس YouTube Studio آپلود کنید.
ویدیو چقدر طول میتواند باشد؟
فایل های تا 500 مگابایت قبول میشوند. ضبطهای طولانی به قطعات 30 ثانیهای با 5 ثانیه همپوشانی تقسیم میشوند، بنابراین رونویس در کل ویدیو منسجم باقی میماند.
آیا ویدیو به سرویس آپلود میشود؟
خیر. FFmpeg.wasm و مدل Whisper هر دو به صورت محلی در مرورگر شما اجرا میشوند. چیزی در هیچ مرحلهای آپلود نمیشود.
آیا به صورت آفلاین کار میکند؟
بعد از اول اجرا، مدل Whisper در مرورگر شما کش شده است. رونویسهای بعدی کاملاً به صورت آفلاین کار میکنند — شما تنها هنگام اول بار به اتصال اینترنت نیاز دارید.