چگونه فایل صوتی را رونویسی کنم؟

فایل صوتی خود را (MP3 یا WAV یا M4A یا OGG یا FLAC یا WebM) در ابزار بریزید و بر روی رونویسی کلیک کنید. اولین اجرا مدل سخنرانی را دانلود می کند (~150 مگابایت)؛ پس از آن، رونویسی به صورت محلی و بدون اتصال اینترنتی کار می کند.

آیا می توانم صوت را با میکروفن خود ضبط کنم؟

بله. بر روی ضبط صوت کلیک کنید، دسترسی به میکروفن در مرورگر خود را مجاز کنید، صحبت کنید و بر روی توقف ضبط کلیک کنید. صوت ضبط شده همانند فایل آپلود شده رفتار می شود و می توانید آن را بلافاصله رونویسی کنید.

کدام زبان ها پشتیبانی می شوند؟

تمام 99 زبان که Whisper از آن ها پشتیبانی می کند - از جمله فارسی، انگلیسی، اسپانیایی، چینی، فرانسوی، هندی، آلمانی، روسی، پرتغالی، ژاپنی و بسیاری دیگر. رونویسی در هر زبانی که صحبت شده ماند.

صوت می تواند چقدر طول داشته باشد؟

فایل هایی تا 200 مگابایت پذیرفته می شوند. ضبط های طولانی در قطعات 30 ثانیه ای با 5 ثانیه همپوشانی پردازش می شوند، بنابراین پادکست یک ساعته نیز رونویسی منسجم تولید می کند. زمان پردازش به این بستگی دارد که آیا مرورگر شما از WebGPU پشتیبانی می کند.

آیا صوت به سرور آپلود می شود؟

نه. هم مدل و هم صوت شما در مرورگر شما می مانند. مدل Whisper یک بار از CDN دانلود می شود و ذخیره می شود، سپس پردازش کاملاً بر روی دستگاه شما با استفاده از WebGPU یا WebAssembly اتفاق می افتد.

آیا می توانم زیرنویس ویدیو دریافت کنم؟

بله. فایل .srt یا .vtt را دانلود کنید و آن را در ویرایشگر ویدیو خود بریزید، یا آن را به عنوان مسیر زیرنویس در YouTube و سایر پلتفرم ها آپلود کنید. هر خط زیرنویس شامل محدوده مهر زمانی است که Whisper تشخیص داده است.

صوترایگانبه‌صورت محلی اجرا می‌شود

تبدیل صوت به متن

صوت ضبط شده را در هر زبانی به متن مستقیم در مرورگر خود تبدیل کنید.

.mp3.wav.ogg.m4a.aac.flac.webm.opus

زبان

بارگذاری مدل...

کاملاً در مرورگر شما اجرا می شود.

فایل صوتی را اینجا بریزید

MP3 · WAV · OGG · M4A · FLAC · WebM · حداکثر 200 مگابایت

اولین دانلود ~150 مگابایت است؛ بعد از آن ذخیره می شود.

انتخاب فایل

یا

درباره تبدیل صوت به متن

فایل صوتی را بریزید یا مستقیم از میکروفن خود ضبط کنید و رونویسی نوشتاری را در همان زبانی که سخنگو استفاده کرد دریافت کنید - بدون آپلود فایل، بدون حساب، بدون نیاز به نصب برنامه. Handytool مدل Whisper منبع باز OpenAI را مستقیم در مرورگر شما اجرا می کند و از WebGPU زمانی که در دسترس است استفاده می کند، بنابراین پادکست های شما، مصاحبه ها، یادداشت های صوتی، سخنرانی ها و ضبط های جلسات کاملاً خصوصی می مانند. نتیجه را به عنوان فایل متن ساده، فایل SRT برای زیرنویس، یا فایل WebVTT آماده برای پخش کننده های ویدیو دانلود کنید.

ویژگی‌های تبدیل صوت به متن

01
99 زبان، تشخیص خودکار
Whisper زبان سخن شده را تشخیص می دهد و رونویسی را در همان زبان می نویسد - فارسی فارسی می ماند، ژاپنی ژاپنی می ماند، آلمانی آلمانی می ماند. بدون انتخاب زبان، بدون تنظیمات اضافی.
02
آپلود فایل یا ضبط زنده
فایل MP3 یا WAV یا M4A یا OGG یا FLAC یا WebM بیاورید، یا بر روی ضبط صوت کلیک کنید تا صوت را مستقیم از میکروفن خود ضبط کنید. وقتی تمام شدید متوقف کنید و ضبط مستقیم به رونویسی می رود.
03
پردازش ایمن در مرورگر
مدل Whisper یک بار به حافظه پنهان مرورگر شما دانلود می شود و به طور کامل بر روی دستگاه شما با شتاب دهنده WebGPU که در صورت پشتیبانی کار می کند اجرا می شود. هیچ چیز آپلود نمی شود - صوت شما هرگز رایانه شما را ترک نمی کند.

سؤالات متداول درباره تبدیل صوت به متن

چگونه فایل صوتی را رونویسی کنم؟: فایل صوتی خود را (MP3 یا WAV یا M4A یا OGG یا FLAC یا WebM) در ابزار بریزید و بر روی رونویسی کلیک کنید. اولین اجرا مدل سخنرانی را دانلود می کند (~150 مگابایت)؛ پس از آن، رونویسی به صورت محلی و بدون اتصال اینترنتی کار می کند.
آیا می توانم صوت را با میکروفن خود ضبط کنم؟: بله. بر روی ضبط صوت کلیک کنید، دسترسی به میکروفن در مرورگر خود را مجاز کنید، صحبت کنید و بر روی توقف ضبط کلیک کنید. صوت ضبط شده همانند فایل آپلود شده رفتار می شود و می توانید آن را بلافاصله رونویسی کنید.
کدام زبان ها پشتیبانی می شوند؟: تمام 99 زبان که Whisper از آن ها پشتیبانی می کند - از جمله فارسی، انگلیسی، اسپانیایی، چینی، فرانسوی، هندی، آلمانی، روسی، پرتغالی، ژاپنی و بسیاری دیگر. رونویسی در هر زبانی که صحبت شده ماند.
صوت می تواند چقدر طول داشته باشد؟: فایل هایی تا 200 مگابایت پذیرفته می شوند. ضبط های طولانی در قطعات 30 ثانیه ای با 5 ثانیه همپوشانی پردازش می شوند، بنابراین پادکست یک ساعته نیز رونویسی منسجم تولید می کند. زمان پردازش به این بستگی دارد که آیا مرورگر شما از WebGPU پشتیبانی می کند.
آیا صوت به سرور آپلود می شود؟: نه. هم مدل و هم صوت شما در مرورگر شما می مانند. مدل Whisper یک بار از CDN دانلود می شود و ذخیره می شود، سپس پردازش کاملاً بر روی دستگاه شما با استفاده از WebGPU یا WebAssembly اتفاق می افتد.
آیا می توانم زیرنویس ویدیو دریافت کنم؟: بله. فایل .srt یا .vtt را دانلود کنید و آن را در ویرایشگر ویدیو خود بریزید، یا آن را به عنوان مسیر زیرنویس در YouTube و سایر پلتفرم ها آپلود کنید. هر خط زیرنویس شامل محدوده مهر زمانی است که Whisper تشخیص داده است.

راهنما‌ها

مقاله‌ها →

5 دقیقه
راهنمای صوت
تملیل صوت به متن آنلاین
یادداشت‌های صوتی، مصاحبه‌ها و تسجیلات را به متن قابل‌جستجو در مرورگر خود تبدیل کنید، با تشخیص گفتار روی دستگاه.
به‌روزشده در ۱۱ اردیبهشت ۱۴۰۵خواندن

ابزارهای مرتبط

صوت →

کاوش در ابزارهای دیگر

همه ابزارها →

تبدیل صوت به متن

درباره تبدیل صوت به متن

ویژگی‌های تبدیل صوت به متن

99 زبان، تشخیص خودکار

آپلود فایل یا ضبط زنده

پردازش ایمن در مرورگر

سؤالات متداول درباره تبدیل صوت به متن

راهنما‌ها

تملیل صوت به متن آنلاین

ابزارهای مرتبط

تقویت کننده صدا

جداساز صدا

برش صوت

کاوش در ابزارهای دیگر

PDF to PNG

سازنده عکس ویزای ژاپن

سوزاننده زیرنویس

مشاهده‌گر JSON

بررسی دستور زبان