Handytool
คู่มือเสียงอ่าน5นาทีอัปเดต30 มี.ค. 2569

การแยกเสียงด้วย AI

ดึงเสียงสะอาดออกจากการบันทึกที่มีเสียงดัง — เป็นส่วนตัว ในเบราว์เซอร์ของคุณ

Voice Isolator ของ Handytool รวมการลดเสียงรบกวน RNNoise แบบหลายผ่านกับประตูเสียง voice-activity เพื่อลบเพลง เสียงฝูงชน และเสียงห้องออกจากไฟล์ MP3, WAV หรือ M4A ใดๆ

ประเด็นสำคัญ

  • 01ท่อสองขั้นตอน: การลดเสียงรบกวน RNNoise แบบหลายผ่าน บวกกับประตู voice-activity ที่หยุดเฟรมที่ไม่ใช่เสียงพูด
  • 02ตัวควบคุมสำหรับความแรงของการแยกและจำนวนของการผ่านจะให้คุณสามารถปรับความสมดุลระหว่างธรรมชาติและการแยกที่ยาก
  • 03ทำงานได้ดีที่สุดเมื่อเสียงดังกว่าเพลงพื้นหลังหรือเสียงฝูงชน
  • 04ผลลัพธ์เป็น WAV โมโนเดียว 48 kHz; ไม่มีการอัปโหลดไปที่เซิร์ฟเวอร์ใดๆ

เมื่อคุณต้องการมากกว่าการลดเสียงรบกวน

การลดเสียงรบกวนมาตรฐานจัดการเสียงหึ่งและเสียงโครมพื้นหลังที่คงที่ แต่จะเป็นอย่างไรกับแขกพอดแคสต์ที่บันทึกในคาเฟ่ที่เต็มไปด้วยความคึกคัก การสัมภาษณ์ที่ทำบนเตียงเพลง หรือการพูดว่าที่ยังวาก? เมื่อพื้นหลังดัง หลากหลาย หรือดนตรี การผ่านการลดเสียงรบกวนเพียงครั้งเดียวไม่เพียงพอ — คุณต้องการระบบที่สามารถระบุว่าส่วนใดของเสียงเป็นการพูดและปิดเสียงอื่น ๆ ทั้งหมด

Voice Isolator ของ Handytool ใช้งานท่อสองขั้นตอน: การผ่านหลายครั้งของการลดเสียงรบกวน RNNoise ประสาทเพื่อขัดเงาพื้นเสียง ตามด้วยประตูที่ขับเคลื่อนด้วย voice-activity ที่หยุดเฟรมที่โมเดลระบุว่าเป็นการพูด ผลลัพธ์คือแทร็กที่ความเงียบแทนที่พื้นหลังระหว่างวลี แทนที่จะเป็นเวอร์ชันที่เสียงรบกวนเงียบขึ้น กระบวนการทั้งหมดทำงานในเบราว์เซอร์ของคุณเท่านั้น — ไม่มีการอัปโหลด ไม่จำเป็นต้องมีบัญชี

วิธีแยกเสียงออกจากเสียงพื้นหลัง

  1. 01

    ลากไฟล์เสียงของคุณ

    ลากไฟล์ MP3, WAV, M4A, OGG หรือ FLAC ลงในเครื่องมือ ยอมรับสูงสุด 200 MB

  2. 02

    ตั้งความแรงของการแยก

    ความแรงควบคุมความก้าวร้าวในการปิดเฟรมที่ไม่ใช่เสียง เริ่มต้นที่ 70–80 สำหรับพอดแคสต์หรือสัมภาษณ์; ดันไปที่ 90–100 เพื่อลบเตียงเพลงหรือเสียงฝูงชน

  3. 03

    เลือกจำนวนของการผ่าน

    การผ่านเพิ่มเติมแต่ละครั้งของการลดเสียงรบกวนประสาทจะขัดเงาพื้นเสียง การผ่านครั้งเดียวทำงานสำหรับการบันทึกที่มีเสียงรบกวนเบา ๆ; การผ่านสองหรือสามผ่านจะปรับปรุงผลลัพธ์เมื่อเสียงพื้นหลังดังมากหรือผสมกัน

  4. 04

    คลิก Isolate และดาวน์โหลด

    ท่อทำงานภายในเบราว์เซอร์ของคุณ เมื่อเสร็จสิ้น ให้ดาวน์โหลดเสียงที่แยกออกมาเป็น WAV โมโนเดียว 48 kHz

การบันทึกที่ได้รับประโยชน์มากที่สุดจากการแยกเสียง

  • 01แขกพอดแคสต์ที่บันทึกไว้ในคาเฟ่หรือร้านอาหาร
  • 02การสัมภาษณ์ที่ถ่ายทำในการประชุมหรือกิจกรรมที่มีเสียงฝูงชน
  • 03การพูดว่าหรือการนำเสนอที่มีเตียงเพลงอยู่ด้านล่าง
  • 04บันทึกสนามจากกลางแจ้งที่มีลมและจราจร
  • 05บันทึกการโทรศัพท์หรือวิดีโอโทรกับสภาพแวดล้อมที่มีเสียงดังในด้านหนึ่ง

เสียงของคุณได้รับการประมวลผลในเครื่อง ไม่ใช่บนเซิร์ฟเวอร์

ท่อการแยกเป็นโมดูล WebAssembly ขนาด 125 KB ที่โหลดครั้งเดียวในเบราว์เซอร์ของคุณ เมื่อคุณลากไฟล์ลงมา ไฟล์จะถูกถอดรหัสและประมวลผลทั้งหมดบนเครื่องของคุณเอง ไม่มีเสียงใดถูกส่งสตรีมไปยังเซิร์ฟเวอร์ ไม่มีบัญชีสร้างขึ้น และไม่มีการเก็บรักษาหลังจากปิดแท็บ

เวลาการประมวลผลขึ้นอยู่กับจำนวนของการผ่านและความยาวของไฟล์ สองผ่านบนไฟล์ 10 นาทีใช้เวลาประมาณสองถึงสามนาทีบนแล็ปท็อปสมัยใหม่ รองรับไฟล์สูงสุด 200 MB

Voice Isolator FAQ

ฉันจะลบเพลงพื้นหลังจากการบันทึกเสียงได้อย่างไร

ลากไฟล์ลงใน Voice Isolator ตั้งความแรงเป็น 90–100 เลือกสองหรือสามผ่าน และคลิก Isolate ประตูปิดเฟรมที่ไม่ใช่เสียง; เครื่องลดเสียงรบกวนจะดึงเพลงที่รั่วไหลออกมาระหว่างคำพูด

นี่แตกต่างจาก Voice Enhancer อย่างไร

Voice Enhancer ทำการผ่านการลดเสียงรบกวนเพียงครั้งเดียวเพื่อการทำความสะอาดที่ความรู้สึกตามธรรมชาติ Voice Isolator รวมการผ่านหลายครั้งและเพิ่มประตู voice-activity ที่ปิดเฟรมที่ไม่ใช่เสียง — ดีกว่าสำหรับเพลง ฝูงชน และเสียงรบกวนที่หลากหลาย

ตัวเลื่อนความแรงของการแยกทำอะไร

มันตั้งว่าเฟรมที่ไม่ใช่เสียงจะถูกลดลงอย่างก้าวร้าวเพียงใด ที่ 0 ประตูหลวม; ที่ 100 สิ่งที่โมเดลไม่มั่นใจว่าเป็นเสียงไปเป็นความเงียบ 70–80 เป็นจุดเริ่มต้นที่ดีสำหรับพอดแคสต์ 90–100 สำหรับการลบเพลงหรือฝูงชน

เสียงของฉันอัปโหลดไปที่เซิร์ฟเวอร์หรือไม่

ไม่มี ท่อเป็นโมดูล WebAssembly ที่ทำงานภายในเครื่องบน CPU ของคุณ ไม่มีสิ่งใดออกจากคอมพิวเตอร์ของคุณ

ฉันได้รูปแบบผลลัพธ์อะไร

WAV โมโนเดียว 48 kHz ใน 16-bit PCM ใช้เครื่องมือแปลงเสียงเพื่อส่งออกเป็น MP3 หากคุณต้องการไฟล์ที่เล็กกว่า

การบันทึกยาวเท่าไหร่ได้

สูงสุด 200 MB สองผ่านประมวลผลที่ประมาณ 3-5 เท่าเวลาจริงบนแล็ปท็อปสมัยใหม่ ดังนั้นการบันทึก 10 นาทีจึงแยกออกในสองถึงสามนาที

เครื่องมือที่เกี่ยวข้อง

ทำงานต่อด้วยเครื่องมือเสียง

เครื่องมือเสียง