Handytool
راهنمای صدا5 دقیقه خواندنبه‌روزشده در ۱۰ فروردین ۱۴۰۵

جداسازی صوت با هوش مصنوعی

صدای تمیز را از ضبط‌های پر سر و صدا بیرون بکشید — به صورت خصوصی، در مرورگر شما.

جداساز صوت Handytool کاهش نویز RNNoise چند‌گذرنده را با یک دروازه فعالیت صدایی برای حذف موسیقی، نویز جمعیت و صدای اتاق از هر فایل MP3، WAV یا M4A ترکیب می‌کند.

نکات کلیدی

  • 01خط لوله دو مرحله‌ای: کاهش نویز عصبی چند‌گذرنده بعلاوه دروازه فعالیت صدایی که فریم‌های غیرصحبت را سکوت می‌دهد.
  • 02کنترل‌های قدرت جداسازی و تعداد گذرها شما را قادر می‌سازند تا بین طبیعی‌تر و جداسازی سخت تنظیم کنید.
  • 03بهترین وقتی صدا بلندتر از موسیقی یا نویز جمعیت پس‌زمینه است.
  • 04خروجی یک WAV مونو 48 کیلوهرتز است؛ چیزی به سرور آپلود نمی‌شود.

وقتی بیش‌تر از کاهش نویز نیاز دارید

کاهش نویز استاندارد نویز پس‌زمینه پایدار و وزوز را مدیریت می‌کند. اما در مورد مهمان پادکست ضبط‌شده در کافه شلوغ، مصاحبه انجام‌ شده روی بستر موسیقی یا سخنرانی فیلم‌شده در رویداد شلوغ؟ وقتی پس‌زمینه بلند، متنوع یا موسیقایی است، یک گذر انکاری تنهایی کافی نیست — شما یک سیستم نیاز دارید که بتواند شناسایی کند کدام قسمت‌های صدا سخنرانی هستند و همه‌چیز دیگری را سکوت کند.

جداساز صوت Handytool یک خط لوله دو مرحله‌ای را اجرا می‌کند: گذرهای چندگانه کاهش نویز عصبی RNNoise برای تحکیم کف نویز، به دنبال یک دروازه محرک فعالیت صدایی که فریم‌های مدل را شناسایی می‌کند به عنوان غیرصحبت را سرکوب می‌کند. نتیجه یک درک است که جایی سکوت جایگزین نویز پس‌زمینه بین عبارات است، تا یک نسخه سکوت‌تر از نویز اصلی. کل فرآیند به صورت محلی در مرورگر شما اجرا می‌شود — بدون آپلود، بدون حساب.

نحوه جداسازی صدا از نویز پس‌زمینه

  1. 01

    فایل صدا خود را رها کنید

    یک فایل MP3، WAV، M4A، OGG یا FLAC را به ابزار بکشید. تا 200 مگابایت پذیرفته می‌شود.

  2. 02

    قدرت جداسازی را تنظیم کنید

    قدرت کنترل می‌کند چقدر تهاجمانه فریم‌های غیرصدا درونزدایی می‌شوند. برای پادکست‌ها یا مصاحبه‌ها 70–80 شروع کنید؛ برای حذف بستر موسیقی یا نویز جمعیت تا 90–100 فشار دهید.

  3. 03

    تعداد گذرها را انتخاب کنید

    هر گذر اضافی کاهش نویز عصبی کف نویز را تحکیم می‌دهد. یک گذر برای ضبط‌های کم سر و صدا کار می‌کند؛ دو یا سه گذر نتایج را بهبود می‌بخشند وقتی نویز پس‌زمینه بلند یا مخلوط است.

  4. 04

    بر روی جداسازی کلیک کنید و دانلود کنید

    خط لوله به صورت محلی در مرورگر شما اجرا می‌شود. وقتی تمام شود، صدای جداشده‌ را به صورت WAV مونو 48 کیلوهرتز دانلود کنید.

ضبط‌های که بیشتر‌ از جداسازی صوت بهره می‌برند

  • 01مهمان‌های پادکست ضبط‌شده در کافه‌ها یا رستوران‌ها
  • 02مصاحبه‌های فیلم‌شده در کنفرانس‌ها یا رویدادها با نویز جمعیت
  • 03سخنرانی‌ها یا ارائه‌ها با بستر موسیقی پایین
  • 04ضبط‌های میدان از بیرون با باد و ترافیک
  • 05ضبط‌های تماس تلفنی یا ویدیویی با محیط‌های سر و صدا از یک طرف

صدای شما به صورت محلی پردازش می‌شود، نه روی سرور

خط لوله جداسازی یک ماژول WebAssembly 125 کیلوبایتی است که یک بار در مرورگر شما بارگذاری می‌شود. وقتی فایل را رها می‌کنید، آن را رمزگشایی و پردازش می‌کند کاملاً روی ماشین شخصی شما. هیچ صدایی به سرور جریان نمی‌یابد، هیچ حسابی ایجاد نمی‌شود، و چیزی پس از بسته شدن برگه حفظ نمی‌شود.

مدت پردازش به تعداد گذرها و طول فایل بستگی دارد. دو گذر روی فایل 10 دقیقه‌ای تقریباً دو تا سه دقیقه روی لپ‌تاپ مدرن طول می‌کشد. فایل‌های تا 200 مگابایت پذیرفته می‌شوند.

جداساز صوت — سؤالات متداول

نحوه حذف موسیقی پس‌زمینه از ضبط صوتی؟

فایل خود را به جداساز صوت رها کنید، قدرت را به 90–100 تنظیم کنید، دو یا سه گذر انتخاب کنید و بر روی جداسازی کلیک کنید. دروازه فریم‌های غیرصحبت را سکوت می‌کند؛ انکاری موسیقی را خیس می‌کند که از طریق کلمات می‌خزد.

این از بهبود دهنده صوت چگونه متفاوت است؟

بهبود دهنده صوت یک گذر کاهش نویز تنهایی برای پاکسازی احساس‌طبیعی نویز پایدار انجام می‌دهد. جداساز صوت گذرهای چندگانه و یک دروازه فعالیت صدایی را اضافه می‌کند که چیزی خارج از صحبت را سرکوب می‌کند — بهتر برای موسیقی، جمعیت و نویز متنوع.

لغزنده قدرت جداسازی چه کار می‌کند؟

تنظیم می‌کند چقدر تهاجمانه فریم‌های غیرصدا میرایی می‌شوند. در 0 دروازه شل است؛ در 100 هر چیزی که مدل اطمینان ندارد صدا است به سکوت می‌رود. 70–80 نقطه شروع خوبی برای پادکست، 90–100 برای حذف موسیقی یا جمعیت است.

آیا صدای من به سرور آپلود می‌شود؟

خیر. خط لوله یک ماژول WebAssembly است که روی CPU شما به صورت محلی اجرا می‌شود. چیزی کامپیوتر شما را ترک نمی‌کند.

قالب خروجی چیست؟

یک مونو 48 کیلوهرتز WAV در 16 بیت PCM. اگر فایل کوچک‌تری نیاز دارید از ابزار تبدیل صدا برای صادرات به‌ عنوان MP3 استفاده کنید.

ضبط می‌تواند چقدر طول داشته باشد؟

تا 200 مگابایت. دو گذر تقریباً 3–5 برابر سریع‌تر از زمان واقعی روی لپ‌تاپ مدرن پردازش می‌شود، بنابراین ضبط 10 دقیقه‌ای دو تا سه دقیقه جداسازی می‌شود.

ابزارهای مرتبط

ادامه کار با ابزارهای صوت

ابزارهای صوت