Как выделить голос из шума — бесплатно онлайн

Основные выводы

01Двухэтапный процесс: многопроходное нейросетевое снижение шума плюс вентиль активности речи, который подавляет кадры не-речи.
02Управление силой выделения и количеством проходов позволяет подобрать баланс между естественным звучанием и жёстким выделением.
03Работает лучше всего, когда голос громче фоновой музыки или шума толпы.
04Выходной файл — это 48 кГц моно WAV; ничего не загружается на сервер.

Когда нужно больше, чем просто снижение шума

Стандартное снижение шума справляется с постоянным фоновым шипением и гудением. Но что делать с гостем подкаста, записанным в оживлённом кафе, интервью на фоне музыки или речью на шумном мероприятии? Когда фон громкий, неоднородный или музыкальный, одного прохода снижения шума недостаточно — нужна система, которая также определяет, какие части аудио содержат речь, и подавляет всё остальное.

Выделитель голоса Handytool запускает двухэтапный процесс: несколько проходов нейросетевого снижения шума RNNoise для снижения шума, а затем вентиль, управляемый активностью голоса, который подавляет кадры, идентифицированные моделью как не-речь. В результате молчание заменяет фон между фразами вместо более тихой версии исходного шума. Весь процесс работает локально в вашем браузере — без загрузки, без учётной записи.

Как выделить голос из фонового шума

01
Загрузите аудиофайл
Перетащите файл MP3, WAV, M4A, OGG или FLAC в инструмент. Принимаются файлы до 200 МБ.
02
Установите силу выделения
Сила контролирует, насколько агрессивно подавляются кадры не-голоса. Начните с 70–80 для подкастов или интервью; увеличьте до 90–100 для удаления музыкального фона или шума толпы.
03
Выберите количество проходов
Каждый дополнительный проход нейросетевого снижения шума улучшает результат. Один проход подходит для слегка шумных записей; два или три прохода дают лучший результат, когда фоновый шум громкий или смешанный.
04
Нажмите «Выделить» и скачайте
Процесс работает локально в вашем браузере. Когда завершится, скачайте выделенный голос как 48 кГц моно WAV.

Выделитель голоса или улучшитель голоса — какой использовать?

Используйте улучшитель голоса, когда хотите снизить постоянный фоновый шум, сохраняя естественность записи — лучше всего для гула вентилятора, кондиционера или лёгкого шипения. Используйте выделитель голоса, когда фон громкий, неоднородный или музыкальный, и вы готовы принять более жёсткое подавление в обмен на более чистую запись голоса. Если не уверены, начните с улучшителя голоса; переключитесь на выделитель, если результат всё ещё содержит слишком много фона.

Записи, которые больше всего выигрывают от выделения голоса

01Гости подкастов, записанные в кафе или ресторанах
02Интервью, снятые на конференциях или событиях с шумом толпы
03Речи или презентации с музыкальным фоном
04Полевые записи на открытом воздухе с ветром и транспортным шумом
05Записи телефонных или видеозвонков с шумной окружающей средой с одной стороны

Ваше аудио обрабатывается локально, а не на сервере

Конвейер выделения голоса — это модуль WebAssembly объёмом 125 КБ, загружаемый один раз в ваш браузер. Когда вы загружаете файл, он декодируется и обрабатывается полностью на вашем компьютере. Никакое аудио не отправляется на сервер, учётная запись не создаётся, и ничего не сохраняется после закрытия вкладки.

Время обработки зависит от количества проходов и длины файла. Два прохода на 10-минутный файл занимают примерно две-три минуты на современном ноутбуке. Принимаются файлы до 200 МБ.

Часто задаваемые вопросы о выделении голоса

Как убрать фоновую музыку из голосовой записи?

Загрузите файл в выделитель голоса, установите силу 90–100, выберите два или три прохода и нажмите «Выделить». Вентиль подавляет кадры не-речи; снижение шума ослабляет музыку, просачивающуюся сквозь слова.

Чем это отличается от улучшителя голоса?

Улучшитель голоса выполняет один проход снижения шума для естественной очистки постоянного шума. Выделитель голоса складывает несколько проходов и добавляет вентиль активности голоса, который подавляет всё, кроме речи — лучше для музыки, толпы и неоднородного шума.

Что делает ползунок силы выделения?

Он устанавливает, насколько агрессивно ослабляются кадры не-голоса. При 0 вентиль свободный; при 100 всё, в чём модель не уверена, что это голос, переводится в молчание. 70–80 — хорошая отправная точка для подкастов, 90–100 для удаления музыки или шума толпы.

Загружается ли моё аудио на сервер?

Нет. Конвейер — это модуль WebAssembly, который работает локально на вашем процессоре. Ничего не покидает ваш компьютер.

Какой формат выходного файла?

Моно 48 кГц WAV в 16-битном PCM. Используйте инструмент конвертации аудио для экспорта как MP3, если нужен файл меньшего размера.

Какова максимальная длина записи?

До 200 МБ. Два прохода обрабатываются с примерно 3–5 кратной скоростью от реального времени на современном ноутбуке, так что 10-минутная запись выделяется за две-три минуты.

Выделите чистый голос из шумных записей — приватно, в вашем браузере.

Когда нужно больше, чем просто снижение шума

Как выделить голос из фонового шума

Загрузите аудиофайл

Установите силу выделения

Выберите количество проходов

Нажмите «Выделить» и скачайте

Записи, которые больше всего выигрывают от выделения голоса

Ваше аудио обрабатывается локально, а не на сервере

Часто задаваемые вопросы о выделении голоса

Продолжайте работать с инструментами Аудио

Изолятор голоса

Обрезать аудио

Конвертировать аудио

Извлечь аудио