मुख्य बिंदु
- 01Discord और Jitsi के पीछे एक ही न्यूरल नेटवर्क RNNoise का उपयोग करता है, वॉइस को संरक्षित करते हुए नॉइज़ को दबाता है।
- 02एक शक्ति स्लाइडर आपको आक्रामक सफाई और प्राकृतिक-सुनने वाले परिणाम के बीच संतुलन बनाने देता है।
- 03प्रोसेसिंग एक 125 KB WebAssembly मॉड्यूल में पूरी तरह से आपके ब्राउज़र में चलता है - कुछ भी अपलोड नहीं होता।
- 04आउटपुट एक मोनो 48 kHz WAV है, किसी भी ऑडियो एडिटर या पॉडकास्ट होस्ट के लिए तैयार।
बैकग्राउंड नॉइज़ रिकॉर्डिंग को खराब क्यों करता है - और इसे कैसे ठीक करें
पंखे, एयर कंडीशनिंग, ट्रैफिक, कीबोर्ड क्लिक और कमरे की गूंज वॉइस रिकॉर्डिंग में सबसे आम शिकायत हैं। एक शोरगुल वाला माइक या खराब रिकॉर्डिंग वातावरण एक अन्यथा उपयोगी इंटरव्यू, पॉडकास्ट या वॉइस मेमो को सुनना मुश्किल बना सकता है। पारंपरिक नॉइज़ गेट या तो बहुत कुछ काटते हैं या ऐसी कलाकृतियां छोड़ते हैं जो अप्राकृतिक लगती हैं।
Handytool का वॉइस एनहांसर RNNoise का उपयोग करता है - एक रीकरेंट न्यूरल नेटवर्क जो सैकड़ों घंटे के स्पीच डेटा पर प्रशिक्षित है, Discord, Jitsi और Mumble द्वारा प्रोडक्शन में उपयोग किया जाता है - वॉइस को नॉइज़ से अलग करने के लिए एक गेट अकेले से कहीं अधिक साफ। यह 125 KB WebAssembly मॉड्यूल के रूप में सीधे आपके ब्राउज़र में चलता है, इसलिए आपकी निजी रिकॉर्डिंग को कभी भी सर्वर को छूने की आवश्यकता नहीं है।
वॉइस रिकॉर्डिंग को ऑनलाइन कैसे साफ करें
- 01
अपनी ऑडियो फाइल डालें
MP3, WAV, M4A, OGG, FLAC या WebM फाइल को टूल में खींचें। 200 MB तक की फाइलें स्वीकार की जाती हैं।
- 02
शक्ति स्लाइडर सेट करें
100% अधिकतम नॉइज़ हटाने के लिए पूर्ण न्यूरल-नेटवर्क आउटपुट लागू करता है। कम मान साफ सिग्नल को मूल के साथ मिश्रित करते हैं - जब पूर्ण डिनॉइज़िंग थोड़ी रोबोटिक लगती है या नॉइज़ पहले से ही हल्का हो तब उपयोगी।
- 03
एनहांस पर क्लिक करें
डिनॉइज़र आपकी फाइल को आपके ब्राउज़र में स्थानीय रूप से प्रोसेस करता है। एक प्रगति संकेतक स्थिति दिखाता है - कोई सर्वर राउंड-ट्रिप शामिल नहीं है।
- 04
सुनें और डाउनलोड करें
डिनॉइज़्ड परिणाम सुनें और इसे 48 kHz मोनो WAV के रूप में डाउनलोड करें। यदि आपको एक छोटी फाइल चाहिए, तो इसे MP3 के रूप में निर्यात करने के लिए कन्वर्ट ऑडियो टूल के माध्यम से चलाएं।
नॉइज़ के प्रकार जो यह सर्वोत्तम संभालता है
- 01स्थिर पंखा और एयर कंडीशनिंग गूंज
- 02ट्रैफिक और बाहरी परिवेश शोर
- 03कंप्यूटर और कीबोर्ड आवाजें
- 04विद्युत हिस और माइक्रोफोन गूंज
- 05कागज की सरसराहट और हल्की कमरे की गूंज
कोई अपलोड आवश्यक नहीं - आपकी रिकॉर्डिंग निजी रहती है
RNNoise मॉडल एक बार 125 KB WebAssembly मॉड्यूल के रूप में लोड होता है और आपके ब्राउज़र में कैश किया जाता है। जब आप एक फाइल डालते हैं, तो इसे डिकोड किया जाता है और पूरी तरह से आपके अपने CPU पर प्रोसेस किया जाता है - कोई डेटा आपकी मशीन से बाहर नहीं जाता। यह संवेदनशील रिकॉर्डिंग के लिए महत्वपूर्ण है: थेरेपी सेशन, कानूनी परामर्श, चिकित्सा नोट्स या अप्रकाशित सामग्री।
प्रोसेसिंग गति आधुनिक लैपटॉप पर लगभग 5-10 गुना वास्तविक-समय है, इसलिए 10-मिनट का साक्षात्कार आमतौर पर एक मिनट के तहत बढ़ता है। 200 MB तक की फाइलें समर्थित हैं।
वॉइस एनहांसर FAQ
मैं वॉइस रिकॉर्डिंग से बैकग्राउंड नॉइज़ को मुफ्त में कैसे हटाऊं?
अपनी ऑडियो फाइल को टूल में डालें, यदि आवश्यक हो तो शक्ति स्लाइडर को समायोजित करें, और एनहांस पर क्लिक करें। डिनॉइज़्ड फाइल 48 kHz WAV के रूप में डाउनलोड होती है - साइन अप की आवश्यकता नहीं।
यह किस तरह की नॉइज़ को हटाता है?
यह स्थिर नॉइज़ पर सबसे अच्छा काम करता है: पंखे, AC गूंज, ट्रैफिक, विद्युत हिस और कीबोर्ड आवाजें। बहुत जोरदार ट्रांजिएंट या एक दूसरी आवाज विषय पर बोलना कठिन मामले हैं।
शक्ति स्लाइडर क्या करता है?
100% पर पूर्ण न्यूरल-नेटवर्क आउटपुट लागू किया जाता है। कम मान साफ सिग्नल को मूल के साथ मिश्रित करते हैं, जब पूर्ण डिनॉइज़िंग बहुत संसाधित लगती है तब उपयोगी।
क्या मेरी ऑडियो किसी सर्वर पर अपलोड की जाती है?
नहीं। डिनॉइज़िंग मॉडल एक WebAssembly मॉड्यूल है जो आपके CPU पर स्थानीय रूप से चलता है। कुछ भी आपके कंप्यूटर से बाहर नहीं जाता।
आउटपुट किस फॉर्मेट में आता है?
एक मोनो 48 kHz 16-बिट PCM WAV फाइल। यदि आपको एक छोटी फाइल चाहिए तो इसे कन्वर्ट ऑडियो टूल से MP3 में कन्वर्ट करें।
रिकॉर्डिंग कितनी लंबी हो सकती है?
200 MB तक। 10-मिनट का साक्षात्कार आधुनिक लैपटॉप पर लगभग एक मिनट में प्रोसेस होता है।