Puntos clave
- 01Tubería de dos etapas: denoising neural de múltiples pasadas más una puerta de actividad de voz que silencia fotogramas que no son habla.
- 02Controles para la intensidad del aislamiento y el número de pasadas te permiten ajustar entre sonido natural y aislamiento agresivo.
- 03Funciona mejor cuando la voz es más fuerte que la música de fondo o el ruido de multitud.
- 04La salida es un WAV mono de 48 kHz; nada se carga en ningún servidor.
Cuándo necesitas más que reducción de ruido
La reducción de ruido estándar maneja el silbido y zumbido de fondo constante. ¿Pero qué pasa con un invitado de podcast grabado en una cafetería concurrida, una entrevista realizada sobre una base musical, o un discurso filmado en un evento abarrotado? Cuando el fondo es fuerte, variado o musical, una sola pasada de denoising no es suficiente — necesitas un sistema que también pueda identificar qué partes del audio son habla y silenciar todo lo demás.
El aislador de voz de Handytool ejecuta una tubería de dos etapas: múltiples pasadas de denoising neural RNNoise para reducir el piso de ruido, seguidas por una puerta impulsada por actividad de voz que suprime fotogramas que el modelo identifica como no-habla. El resultado es una pista donde el silencio reemplaza el fondo entre frases, en lugar de una versión más silenciosa del ruido original. Todo el proceso se ejecuta localmente en tu navegador — sin cargas, sin cuenta necesaria.
Cómo aislar una voz del ruido de fondo
- 01
Arrastra tu archivo de audio
Arrastra un archivo MP3, WAV, M4A, OGG o FLAC a la herramienta. Se aceptan hasta 200 MB.
- 02
Establece la intensidad del aislamiento
La intensidad controla qué tan agresivamente se cierran los fotogramas que no son voz. Comienza en 70–80 para podcasts o entrevistas; sube a 90–100 para eliminar una base musical o ruido de multitud.
- 03
Elige el número de pasadas
Cada pasada adicional de denoising neural reduce el piso de ruido. Una pasada funciona para grabaciones ligeramente ruidosas; dos o tres pasadas mejoran los resultados cuando el ruido de fondo es fuerte o mezclado.
- 04
Haz clic en Aislar y descarga
La tubería se ejecuta localmente en tu navegador. Cuando termine, descarga la voz aislada como un WAV mono de 48 kHz.
Grabaciones que se benefician más del aislamiento de voz
- 01Invitados de podcast grabados en cafés o restaurantes
- 02Entrevistas filmadas en conferencias o eventos con ruido de multitud
- 03Discursos o presentaciones con una base musical debajo
- 04Grabaciones de campo al aire libre con viento y tráfico
- 05Grabaciones de llamadas telefónicas o videollamadas con entornos ruidosos en un extremo
Tu audio se procesa localmente, no en un servidor
La tubería de aislamiento es un módulo WebAssembly de 125 KB cargado una vez en tu navegador. Cuando arrastras un archivo, se decodifica y procesa completamente en tu propia máquina. Ningún audio se transmite a un servidor, no se crea cuenta, y nada se retiene después de cerrar la pestaña.
El tiempo de procesamiento depende del número de pasadas y la duración del archivo. Dos pasadas en un archivo de 10 minutos toman aproximadamente dos a tres minutos en una laptop moderna. Se aceptan archivos de hasta 200 MB.
Preguntas frecuentes del aislador de voz
¿Cómo elimino la música de fondo de una grabación de voz?
Arrastra tu archivo al Aislador de voz, establece la intensidad en 90–100, elige dos o tres pasadas, y haz clic en Aislar. La puerta silencia fotogramas que no son habla; el denoiser reduce la música que se filtra durante las palabras.
¿En qué se diferencia esto del Mejorador de voz?
Mejorador de voz realiza una sola pasada de denoising para una limpieza de aspecto natural del ruido constante. Aislador de voz apila múltiples pasadas y añade una puerta de actividad de voz que silencia cualquier cosa fuera del habla — mejor para música, multitudes y ruido variado.
¿Qué hace el deslizador de intensidad de aislamiento?
Establece qué tan agresivamente se atenúan los fotogramas que no son voz. En 0 la puerta es suave; en 100 cualquier cosa de la que el modelo no esté seguro que sea voz se convierte en silencio. 70–80 es un buen punto de partida para podcasts, 90–100 para eliminación de música o multitud.
¿Se carga mi audio en un servidor?
No. La tubería es un módulo WebAssembly que se ejecuta localmente en tu CPU. Nada sale de tu computadora.
¿Qué formato de salida obtengo?
Un WAV mono de 48 kHz en PCM de 16 bits. Usa la herramienta Convertir audio para exportar como MP3 si necesitas un archivo más pequeño.
¿Cuánto tiempo puede durar la grabación?
Hasta 200 MB. Dos pasadas se procesan a aproximadamente 3–5 veces tiempo real en una laptop moderna, así que una grabación de 10 minutos se aísla en dos a tres minutos.