تبدیل صوت به متن
صوت ضبط شده را در هر زبانی به متن مستقیم در مرورگر خود تبدیل کنید.
کاملاً در مرورگر شما اجرا می شود.
درباره تبدیل صوت به متن
فایل صوتی را بریزید یا مستقیم از میکروفن خود ضبط کنید و رونویسی نوشتاری را در همان زبانی که سخنگو استفاده کرد دریافت کنید - بدون آپلود فایل، بدون حساب، بدون نیاز به نصب برنامه. Handytool مدل Whisper منبع باز OpenAI را مستقیم در مرورگر شما اجرا می کند و از WebGPU زمانی که در دسترس است استفاده می کند، بنابراین پادکست های شما، مصاحبه ها، یادداشت های صوتی، سخنرانی ها و ضبط های جلسات کاملاً خصوصی می مانند. نتیجه را به عنوان فایل متن ساده، فایل SRT برای زیرنویس، یا فایل WebVTT آماده برای پخش کننده های ویدیو دانلود کنید.
ویژگیهای تبدیل صوت به متن
- 01
99 زبان، تشخیص خودکار
Whisper زبان سخن شده را تشخیص می دهد و رونویسی را در همان زبان می نویسد - فارسی فارسی می ماند، ژاپنی ژاپنی می ماند، آلمانی آلمانی می ماند. بدون انتخاب زبان، بدون تنظیمات اضافی.
- 02
آپلود فایل یا ضبط زنده
فایل MP3 یا WAV یا M4A یا OGG یا FLAC یا WebM بیاورید، یا بر روی ضبط صوت کلیک کنید تا صوت را مستقیم از میکروفن خود ضبط کنید. وقتی تمام شدید متوقف کنید و ضبط مستقیم به رونویسی می رود.
- 03
پردازش ایمن در مرورگر
مدل Whisper یک بار به حافظه پنهان مرورگر شما دانلود می شود و به طور کامل بر روی دستگاه شما با شتاب دهنده WebGPU که در صورت پشتیبانی کار می کند اجرا می شود. هیچ چیز آپلود نمی شود - صوت شما هرگز رایانه شما را ترک نمی کند.
سؤالات متداول درباره تبدیل صوت به متن
- چگونه فایل صوتی را رونویسی کنم؟
- فایل صوتی خود را (MP3 یا WAV یا M4A یا OGG یا FLAC یا WebM) در ابزار بریزید و بر روی رونویسی کلیک کنید. اولین اجرا مدل سخنرانی را دانلود می کند (~150 مگابایت)؛ پس از آن، رونویسی به صورت محلی و بدون اتصال اینترنتی کار می کند.
- آیا می توانم صوت را با میکروفن خود ضبط کنم؟
- بله. بر روی ضبط صوت کلیک کنید، دسترسی به میکروفن در مرورگر خود را مجاز کنید، صحبت کنید و بر روی توقف ضبط کلیک کنید. صوت ضبط شده همانند فایل آپلود شده رفتار می شود و می توانید آن را بلافاصله رونویسی کنید.
- کدام زبان ها پشتیبانی می شوند؟
- تمام 99 زبان که Whisper از آن ها پشتیبانی می کند - از جمله فارسی، انگلیسی، اسپانیایی، چینی، فرانسوی، هندی، آلمانی، روسی، پرتغالی، ژاپنی و بسیاری دیگر. رونویسی در هر زبانی که صحبت شده ماند.
- صوت می تواند چقدر طول داشته باشد؟
- فایل هایی تا 200 مگابایت پذیرفته می شوند. ضبط های طولانی در قطعات 30 ثانیه ای با 5 ثانیه همپوشانی پردازش می شوند، بنابراین پادکست یک ساعته نیز رونویسی منسجم تولید می کند. زمان پردازش به این بستگی دارد که آیا مرورگر شما از WebGPU پشتیبانی می کند.
- آیا صوت به سرور آپلود می شود؟
- نه. هم مدل و هم صوت شما در مرورگر شما می مانند. مدل Whisper یک بار از CDN دانلود می شود و ذخیره می شود، سپس پردازش کاملاً بر روی دستگاه شما با استفاده از WebGPU یا WebAssembly اتفاق می افتد.
- آیا می توانم زیرنویس ویدیو دریافت کنم؟
- بله. فایل .srt یا .vtt را دانلود کنید و آن را در ویرایشگر ویدیو خود بریزید، یا آن را به عنوان مسیر زیرنویس در YouTube و سایر پلتفرم ها آپلود کنید. هر خط زیرنویس شامل محدوده مهر زمانی است که Whisper تشخیص داده است.
ابزارهای مرتبط
صوت →کاوش در ابزارهای دیگر
همه ابزارها →- فعال
PDF به JPG
هر صفحه از PDF را به تصویر JPG، PNG یا WebP درخشان مستقیم در مرورگر خود تبدیل کنید — بدون آپلود، بدون کاهش کیفیت.
PDFرایگانبهصورت محلی اجرا میشودباز کردن - فعال
حذف پسزمینه
پسزمینه تصویر را با مدل هوش مصنوعی حذف کنید که درون مرورگر اجرا میشود — بدون آپلود، تصاویر شما در دستگاهتان میمانند.
تصویررایگانبهصورت محلی اجرا میشودباز کردن - فعال
برش ویدیو
ابتدا یا انتهای ویدیو را با دقت فریم به فریم ببرید.
ویدیورایگانباز کردن - فعال
Markdown به HTML
Markdown را به صورت مستقیم در مرورگر خود به HTML تمیز تبدیل کنید.
سندرایگانبهصورت محلی اجرا میشودباز کردن - فعال
بررسی دستور زبان
اشتباهات املایی، دستوری و نشانهگذاری را در هر متنی با بررسیکننده دستور زبان رایگان و پیشرفتهشده با هوش مصنوعی تصحیح کنید — بدون ثبتنام، هیچ چیز ذخیره نمیشود.
هوش مصنوعیرایگانباز کردن