نکات کلیدی
- 01خط لوله دو مرحلهای: کاهش نویز عصبی چندگذرنده بعلاوه دروازه فعالیت صدایی که فریمهای غیرصحبت را سکوت میدهد.
- 02کنترلهای قدرت جداسازی و تعداد گذرها شما را قادر میسازند تا بین طبیعیتر و جداسازی سخت تنظیم کنید.
- 03بهترین وقتی صدا بلندتر از موسیقی یا نویز جمعیت پسزمینه است.
- 04خروجی یک WAV مونو 48 کیلوهرتز است؛ چیزی به سرور آپلود نمیشود.
وقتی بیشتر از کاهش نویز نیاز دارید
کاهش نویز استاندارد نویز پسزمینه پایدار و وزوز را مدیریت میکند. اما در مورد مهمان پادکست ضبطشده در کافه شلوغ، مصاحبه انجام شده روی بستر موسیقی یا سخنرانی فیلمشده در رویداد شلوغ؟ وقتی پسزمینه بلند، متنوع یا موسیقایی است، یک گذر انکاری تنهایی کافی نیست — شما یک سیستم نیاز دارید که بتواند شناسایی کند کدام قسمتهای صدا سخنرانی هستند و همهچیز دیگری را سکوت کند.
جداساز صوت Handytool یک خط لوله دو مرحلهای را اجرا میکند: گذرهای چندگانه کاهش نویز عصبی RNNoise برای تحکیم کف نویز، به دنبال یک دروازه محرک فعالیت صدایی که فریمهای مدل را شناسایی میکند به عنوان غیرصحبت را سرکوب میکند. نتیجه یک درک است که جایی سکوت جایگزین نویز پسزمینه بین عبارات است، تا یک نسخه سکوتتر از نویز اصلی. کل فرآیند به صورت محلی در مرورگر شما اجرا میشود — بدون آپلود، بدون حساب.
نحوه جداسازی صدا از نویز پسزمینه
- 01
فایل صدا خود را رها کنید
یک فایل MP3، WAV، M4A، OGG یا FLAC را به ابزار بکشید. تا 200 مگابایت پذیرفته میشود.
- 02
قدرت جداسازی را تنظیم کنید
قدرت کنترل میکند چقدر تهاجمانه فریمهای غیرصدا درونزدایی میشوند. برای پادکستها یا مصاحبهها 70–80 شروع کنید؛ برای حذف بستر موسیقی یا نویز جمعیت تا 90–100 فشار دهید.
- 03
تعداد گذرها را انتخاب کنید
هر گذر اضافی کاهش نویز عصبی کف نویز را تحکیم میدهد. یک گذر برای ضبطهای کم سر و صدا کار میکند؛ دو یا سه گذر نتایج را بهبود میبخشند وقتی نویز پسزمینه بلند یا مخلوط است.
- 04
بر روی جداسازی کلیک کنید و دانلود کنید
خط لوله به صورت محلی در مرورگر شما اجرا میشود. وقتی تمام شود، صدای جداشده را به صورت WAV مونو 48 کیلوهرتز دانلود کنید.
ضبطهای که بیشتر از جداسازی صوت بهره میبرند
- 01مهمانهای پادکست ضبطشده در کافهها یا رستورانها
- 02مصاحبههای فیلمشده در کنفرانسها یا رویدادها با نویز جمعیت
- 03سخنرانیها یا ارائهها با بستر موسیقی پایین
- 04ضبطهای میدان از بیرون با باد و ترافیک
- 05ضبطهای تماس تلفنی یا ویدیویی با محیطهای سر و صدا از یک طرف
صدای شما به صورت محلی پردازش میشود، نه روی سرور
خط لوله جداسازی یک ماژول WebAssembly 125 کیلوبایتی است که یک بار در مرورگر شما بارگذاری میشود. وقتی فایل را رها میکنید، آن را رمزگشایی و پردازش میکند کاملاً روی ماشین شخصی شما. هیچ صدایی به سرور جریان نمییابد، هیچ حسابی ایجاد نمیشود، و چیزی پس از بسته شدن برگه حفظ نمیشود.
مدت پردازش به تعداد گذرها و طول فایل بستگی دارد. دو گذر روی فایل 10 دقیقهای تقریباً دو تا سه دقیقه روی لپتاپ مدرن طول میکشد. فایلهای تا 200 مگابایت پذیرفته میشوند.
جداساز صوت — سؤالات متداول
نحوه حذف موسیقی پسزمینه از ضبط صوتی؟
فایل خود را به جداساز صوت رها کنید، قدرت را به 90–100 تنظیم کنید، دو یا سه گذر انتخاب کنید و بر روی جداسازی کلیک کنید. دروازه فریمهای غیرصحبت را سکوت میکند؛ انکاری موسیقی را خیس میکند که از طریق کلمات میخزد.
این از بهبود دهنده صوت چگونه متفاوت است؟
بهبود دهنده صوت یک گذر کاهش نویز تنهایی برای پاکسازی احساسطبیعی نویز پایدار انجام میدهد. جداساز صوت گذرهای چندگانه و یک دروازه فعالیت صدایی را اضافه میکند که چیزی خارج از صحبت را سرکوب میکند — بهتر برای موسیقی، جمعیت و نویز متنوع.
لغزنده قدرت جداسازی چه کار میکند؟
تنظیم میکند چقدر تهاجمانه فریمهای غیرصدا میرایی میشوند. در 0 دروازه شل است؛ در 100 هر چیزی که مدل اطمینان ندارد صدا است به سکوت میرود. 70–80 نقطه شروع خوبی برای پادکست، 90–100 برای حذف موسیقی یا جمعیت است.
آیا صدای من به سرور آپلود میشود؟
خیر. خط لوله یک ماژول WebAssembly است که روی CPU شما به صورت محلی اجرا میشود. چیزی کامپیوتر شما را ترک نمیکند.
قالب خروجی چیست؟
یک مونو 48 کیلوهرتز WAV در 16 بیت PCM. اگر فایل کوچکتری نیاز دارید از ابزار تبدیل صدا برای صادرات به عنوان MP3 استفاده کنید.
ضبط میتواند چقدر طول داشته باشد؟
تا 200 مگابایت. دو گذر تقریباً 3–5 برابر سریعتر از زمان واقعی روی لپتاپ مدرن پردازش میشود، بنابراین ضبط 10 دقیقهای دو تا سه دقیقه جداسازی میشود.