Handytool
ऑडियोमुफ़्तस्थानीय रूप से चलता है

आवाज अलग करना

अपने ब्राउज़र में संगीत, भीड़ और पृष्ठभूमि शोर से स्पीकर को अलग करें।

.mp3.wav.ogg.m4a.aac.flac.webm.opus
मॉडल लोड किया जा रहा है…

पूरी तरह से आपके ब्राउज़र में चलता है।

आवाज अलग करना के बारे में

आवाज अलग करना पॉडकास्ट रिकॉर्डिंग को कैफे से, साक्षात्कार ऑडियो को शोर भरी सड़क से, और संगीत बेड को वोकल स्टेम से अलग करता है। कोई भी MP3, WAV, M4A, OGG या FLAC छोड़ें और Handytool आपके ब्राउज़र में पूरी तरह से एक स्टैकेड RNNoise पाइपलाइन चलाता है, इसलिए आपकी ऑडियो कभी आपके डिवाइस को नहीं छोड़ती है। दो नियंत्रण — अलगाव की शक्ति और सफाई के मार्ग की संख्या — आपको नरम सफाई और कठोर अलगाव के बीच चुनने देते हैं जो स्पीकर के अलावा कुछ भी खामोश करता है। परिणाम 48 kHz मोनो WAV के रूप में डाउनलोड होता है।

आवाज अलग करना की विशेषताएँ

  • 01

    सिर्फ denoising नहीं, दो-चरणीय अलगाव

    मल्टी-पास न्यूरल-नेटवर्क denoising प्रत्येक पास पर शोर को कड़ा करता है। एक आवाज-गतिविधि-संचालित गेट फिर से ऐसे फ्रेम को खामोश करता है जिनमें मॉडल को कोई भाषण नहीं मिला — इसलिए पृष्ठभूमि संगीत, तालियाँ और बातचीत पूरी तरह से वाक्यांशों के बीच बाहर निकल जाती हैं।

  • 02

    पॉडकास्ट या बचाव कार्य के लिए समायोज्य

    अलगाव शक्ति गैर-आवाज़ फ़्रेमों को कितने आक्रामक रूप से गेट किया जाता है इसे नियंत्रित करता है। पॉडकास्ट के लिए प्राकृतिक-सुनने वाली के लिए इसे कम करें, एक शोर भरी रिकॉर्डिंग से संगीत बेड या भीड़ को पूरी तरह से छीनने के लिए इसे बढ़ाएं।

  • 03

    स्थानीय रूप से चलता है, अपलोड नहीं

    पूरी पाइपलाइन 125 KB WebAssembly मॉड्यूल है जो एक बार लोड होता है और कैश किया जाता है। ऑडियो को डिकोड, अलग और पूरी तरह से आपकी मशीन पर डाउनलोड किया जाता है — कोई सर्वर राउंड-ट्रिप नहीं, कोई खाता नहीं, 200 MB फ़ाइल कैप के अलावा कोई लंबाई सीमा नहीं।

आवाज अलग करना अक्सर पूछे जाने वाले प्रश्न

यह आवाज एनहांसर से कैसे अलग है?
आवाज एनहांसर एक ही denoising पास चलाता है और रिकॉर्डिंग की प्राकृतिक भावना को बनाए रखता है — पंखे या AC गुनगुनाहट जैसी स्थिर शोर सफाई के लिए सर्वश्रेष्ठ। आवाज अलग करना कई पास को स्टैक करता है और एक आवाज-गतिविधि गेट जोड़ता है जो स्पीकर के अलावा कुछ भी खामोश करता है — संगीत, भीड़ या पृष्ठभूमि से दूसरी बातचीत को छीनने के लिए सर्वश्रेष्ठ।
क्या यह आवाज रिकॉर्डिंग से पृष्ठभूमि संगीत हटा सकता है?
हाँ, जब संगीत स्पष्ट रूप से आवाज़ के पीछे स्तर पर हो। गेट आवाज के साथ फ्रेम को खामोष करता है, और मल्टी-पास denoising शब्दों के दौरान अनुभव किए जाने वाले संगीत को कम करता है। भारी संगीत जो आवाज़ के समान जोर पर हो — शक्ति 90–100 और तीन पास आज़माएँ।
अलगाव शक्ति स्लाइडर क्या करता है?
यह सेट करता है कि गैर-आवाज़ फ्रेमों को कितने आक्रामक रूप से कम किया जाता है। 0 पर गेट ढीला होता है और आप हल्की पृष्ठभूमि सुनेंगे; 100 पर कुछ भी जो मॉडल को आवाज़ नहीं मानता वह चुप हो जाता है। पॉडकास्ट के लिए 70–80 एक अच्छा शुरुआती बिंदु है, संगीत या भीड़ को हटाने के लिए 90–100।
क्या ऑडियो किसी सर्वर पर अपलोड किया जाता है?
नहीं। मॉडल और आपकी फ़ाइल आपके ब्राउज़र में रहती है। पाइपलाइन एक छोटा WebAssembly मॉड्यूल है जो आपकी CPU पर स्थानीय रूप से चलता है, इसलिए कुछ भी आपके कंप्यूटर को नहीं छोड़ता है।
मुझे कौन सा आउटपुट प्रारूप मिलता है?
एक मोनो 48 kHz WAV फ़ाइल 16-बिट PCM में। WAV असंपीड़ित है और हर ऑडियो संपादक और पॉडकास्ट होस्ट में काम करता है। यदि आप एक छोटी फ़ाइल चाहते हैं तो MP3 निर्यात करने के लिए ऑडियो कनवर्ट करें उपकरण का उपयोग करें।
रिकॉर्डिंग कितनी लंबी हो सकती है?
200 MB तक की फ़ाइलें स्वीकार की जाती हैं। दो पास आधुनिक लैपटॉप पर मोटे तौर पर 3–5× रीयल-टाइम पर प्रक्रिया करते हैं, इसलिए 10-मिनट की रिकॉर्डिंग दो से तीन मिनट में अलग हो जाती है।

संबंधित टूल

ऑडियो

अन्य टूल्स देखें

सभी टूल