Handytool
ویدیورایگانبه‌صورت محلی اجرا می‌شود

تبدیل ویدیو به متن

گفتار درون ویدیو را مستقیماً در مرورگرتان به متن و زیرنویس تبدیل کنید.

.mp4.mov.webm.mkv.m4v.avi
زبان
در حال بارگیری مدل…

کاملاً در مرورگر شما اجرا می‌شود.

درباره تبدیل ویدیو به متن

یک فایل ویدیو رها کنید و متن نوشتاری به‌همراه زیرنویس آماده به‌همان زبانی که گوینده صحبت می‌کند به‌دست آورید — بدون آپلود، بدون حساب کاربری، بدون نصب اپ. Handytool صدا را با FFmpeg استخراج می‌کند و مدل Whisper از OpenAI را مستقیماً در مرورگر شما اجرا می‌کند، با شتاب‌دهی WebGPU در صورت پشتیبانی، تا مصاحبه‌ها، کلاس‌ها، ضبط‌های Zoom و ویدیوهای YouTube کاملاً خصوصی بمانند. خروجی را به‌صورت متن ساده، فایل SRT یا WebVTT آماده برای پخش‌کننده‌ها و YouTube دانلود کنید.

ویژگی‌های تبدیل ویدیو به متن

  • 01

    ۹۹ زبان با تشخیص خودکار

    Whisper زبان گفتاری را تشخیص می‌دهد و متن را به همان زبان می‌نویسد — فارسی فارسی می‌ماند، ژاپنی ژاپنی، آلمانی آلمانی. اگر ویدیو با لهجه‌ای ناآشنا یا گویشی کم‌کاربرد است، زبان را دستی انتخاب کنید.

  • 02

    زیرنویس آماده برای هر پخش‌کننده

    هر متن همراه با قطعه‌های زمان‌دار است که می‌توانید در قالب .srt یا .vtt صادر کنید — درون Premiere، Final Cut، DaVinci Resolve بکشید یا به‌عنوان مسیر زیرنویس در YouTube، Vimeo و LinkedIn بارگذاری کنید.

  • 03

    پردازش خصوصی در مرورگر

    صدا با FFmpeg.wasm استخراج می‌شود و Whisper آن را به متن تبدیل می‌کند؛ همه روی دستگاه شما با شتاب‌دهی WebGPU در صورت پشتیبانی. ویدیو هرگز ارسال نمی‌شود — همه‌چیز در حافظهٔ موقت مرورگر می‌ماند.

سؤالات متداول درباره تبدیل ویدیو به متن

چگونه یک فایل ویدیو را به متن تبدیل کنم؟
فایل ویدیو (MP4، MOV، WebM، MKV، M4V یا AVI) را به ابزار بکشید و روی «تبدیل به متن» بزنید. صدا به‌صورت محلی با FFmpeg استخراج و سپس به Whisper سپرده می‌شود. اولین اجرا مدل (~۱۵۰ مگابایت) را دانلود می‌کند؛ پس از آن آفلاین کار می‌کند.
می‌توانم برای YouTube زیرنویس بسازم؟
بله. پس از تبدیل، روی «دانلود .srt» یا «دانلود .vtt» بزنید — هر دو قالب توسط بارگذار زیرنویس YouTube Studio و همچنین Vimeo، LinkedIn و بیشتر ویرایشگرهای ویدیو پذیرفته می‌شوند.
چه قالب‌های ویدیویی پشتیبانی می‌شود؟
محفظه‌های MP4، MOV، WebM، MKV، M4V و AVI تا ۵۰۰ مگابایت. آنچه مهم است مسیر صدای داخل ویدیو است — کدک‌های رایج مثل AAC، MP3، Opus و Vorbis همه کار می‌کنند.
چه زبان‌هایی را می‌تواند تبدیل کند؟
تمام ۹۹ زبانی که Whisper پشتیبانی می‌کند — فارسی، انگلیسی، چینی، فرانسوی، عربی، هندی، آلمانی، روسی، پرتغالی، اسپانیایی، ژاپنی و بسیاری دیگر. متن به همان زبانی می‌ماند که در ویدیو صحبت می‌شود.
ویدیو حداکثر چقدر می‌تواند طولانی باشد؟
فایل تا ۵۰۰ مگابایت پذیرفته می‌شود — معمولاً یک ساعت ویدیوی HD یا چند ساعت محتوای فشرده. ضبط‌های طولانی در بلوک‌های ۳۰ ثانیه‌ای با ۵ ثانیه همپوشانی پردازش می‌شوند تا متن منسجم بماند.
آیا ویدیو روی سرور آپلود می‌شود؟
خیر. هم مدل و هم ویدیوی شما در مرورگر می‌مانند. FFmpeg.wasm صدا را به‌صورت محلی استخراج می‌کند و Whisper روی دستگاه شما با WebGPU یا WebAssembly آن را تبدیل می‌کند. هیچ‌چیز از کامپیوترتان خارج نمی‌شود.

ابزارهای مرتبط

ویدیو

کاوش در ابزارهای دیگر

همه ابزارها