Ключові моменти
- 01Двоступенева конвеєр: багатопроходова нейронна денойзація плюс голосовий затвор, який розтамовує кадри, що не є мовленням.
- 02Засоби керування для інтенсивності ізоляції та кількості проходів дозволяють налаштувати баланс між природно звучним і жорсткою ізоляцією.
- 03Найкраще працює, коли голос голосніший за фонову музику або шум натовпу.
- 04Результат — це WAV 48 кГц моно; нічого не завантажується на жодний сервер.
Коли вам потрібно більше ніж просто зменшення шуму
Стандартне зменшення шуму обробляє постійне фонове шипіння і гудіння. Але як щодо гостя подкасту, записаного в зайнятій кав'ярні, інтерв'ю, зробленого поверх музичного шару, або промови, знятої на переповненій події? Коли фон голосний, різноманітний або музичний, одного проходу денойзації недостатньо — вам потрібна система, яка також може визначити, які частини аудіо це мовлення, і розтамувати все іншого.
Голосовий ізолятор Handytool запускає двоступеневу конвеєр: декілька проходів нейронної денойзації RNNoise для затягування шумового поверху, потім голосовий затвор, який придушує кадри, які модель визначає як мовлення. Результат — це доріжка, де тишина замінює фон між фразами, а не тиша версія оригінального шуму. Весь процес працює локально у вашому браузері — без завантаження, без облікового запису.
Як виділити голос із фонового шуму
- 01
Перетягніть аудіофайл
Перетягніть файл MP3, WAV, M4A, OGG або FLAC у інструмент. Приймаються до 200 МБ.
- 02
Установіть інтенсивність ізоляції
Інтенсивність контролює, наскільки агресивно не голосові кадри розтамовуються. Почніть з 70–80 для подкастів або інтерв'ю; піднесіть до 90–100, щоб видалити музичний шар або шум натовпу.
- 03
Виберіть кількість проходів
Кожен додатковий прохід нейронної денойзації затягує шумовий поверх. Один прохід працює для слегка зашумлених записів; два або три проходи поліпшують результати, коли фоновий шум гучний або змішаний.
- 04
Натисніть Виділити та завантажте
Конвеєр працює локально у вашому браузері. Коли він завершиться, завантажуйте виділений голос як WAV 48 кГц моно.
Записи, які найбільше виграють від ізоляції голосу
- 01Гості подкастів, записані в кав'ярнях або ресторанах
- 02Інтерв'ю, знято на конференціях або подіях з шумом натовпу
- 03Промови або презентації з музичним шаром під низом
- 04Записи з поля на вулиці з вітром та трафіком
- 05Записи телефонних або відеоз'єднань з шумним середовищем на одному кінці
Ваше аудіо обробляється локально, а не на сервері
Конвеєр ізоляції — це модуль WebAssembly розміром 125 КБ, завантажений один раз у вашому браузері. Коли ви перетягуєте файл, він декодується та обробляється цілком на вашій машині. Жодне аудіо не потоків на сервер, жоден обліковий запис не створюється, і нічого не зберігається після закриття вкладки.
Час обробки залежить від кількості проходів і тривалості файлу. Два проходи на 10-хвилинному файлі займають приблизно дві-три хвилини на сучасному ноутбуці. Приймаються файли розміром до 200 МБ.
ЧАП голосового ізолятора
Як видалити фонову музику з голосового запису?
Перетягніть файл у Голосовий ізолятор, установіть інтенсивність на 90–100, виберіть два або три проходи та натисніть Виділити. Затвор розтамовує кадри, що не є мовленням; денойзер зменшує музику, яка просачується під час слів.
Чим це відрізняється від голосового посилювача?
Голосовий посилювач робить один прохід денойзації для природного очищення постійного шуму. Голосовий ізолятор складає декілька проходів і додає голосовий затвор, який розтамовує будь-що поза мовленням — краще для музики, натовпу та різноманітного шуму.
Що робить повзунок інтенсивності ізоляції?
Він установлює, наскільки агресивно не голосові кадри послаблюються. При 0 затвор вільний; при 100 все, що модель не впевнена, що це голос, йде в тишу. 70–80 — добра стартова точка для подкастів, 90–100 для видалення музики або натовпу.
Чи моє аудіо завантажується на сервер?
Ні. Конвеєр — це модуль WebAssembly, який працює локально на вашому ЦП. Нічого не залишає вашу машину.
Який формат результату?
Моно WAV 48 кГц в 16-бітній PCM. Використовуйте інструмент Перетворення аудіо для експорту як MP3, якщо вам потрібен менший файл.
Як довго може бути запис?
До 200 МБ. Два проходи обробляються приблизно в 3–5 разів реального часу на сучасному ноутбуці, тому 10-хвилинна запис ізолюється за дві-три хвилини.