Voice Model Creation

Create the best possible voice model by creating a high-quality dataset using the tips below.

Voice Model Creation

Create the best possible voice model by creating a high-quality dataset using the tips below.

Voice Model Creation

Create the best possible voice model by creating a high-quality dataset using the tips below.

How to create your dataset.

How to create your dataset.

30-60 कुल मिनट की सूखी (कोई प्रभाव नहीं) और मोनोफोनिक (एक समय पर एक नोट) वोकल का संग्रह करें।

- कोई रिवर्ब, डिले, कोरस, या वाद्ययंत्र-ध्वनि नहीं,
- कोई साज की सुरीलापन, लेयरिंग, डबलट्रैकिंग, स्टीरियो प्रभाव नहीं।
- गायन शैलियों में कोई भिन्नता नहीं। उदा: सिर्फ गायन या सिर्फ रॅपिंग, लेकिन दोनों नहीं।

खराब गायकी

खराब गायकी

खराब गायकी

स्टीरियो, रिवर्ब, डिले

0:00/1:34

अच्छी गायकी

अच्छी गायकी

अच्छी गायकी

मोनो, साफ टोन, कम शोर

आपकी फ़ाइल साजिशपूर्वक तैयार की जा रही है।

अपनी फ़ाइलें कोई खामोशी और संगत वॉल्यूम के साथ एक 16-बिट हानिहीत ऑडियो फ़ाइल (.wav पसंद किया गया) के साथ निर्यात करें।

पहले: चुप्पी, असंतुलित वॉल्यूम स्तर

बाद: कटी हुई चुप्पी, संगत आवाज

Once you’ve compiled your vocals, the next step is to prepare your files for training:

एक बार जब आप अपनी ध्वनि संकलित कर चुके हैं, तो अगला कदम यह है कि फ़ाइलें प्रशिक्षण के लिए तैयार करें:

  • किसी भी अतिरिक्त खामोशी को हटाएं (हम सिफ़र Audacity के साथ यह स्वचालित रूप से करने की सिफारिश करते हैं)

  • सही मोनो के रूप में निर्यात करें (बराबर एल + आर चैनल के साथ स्टीरियो की बजाय)

  • 16-बिट .wav के रूप में निर्यात करें (कोई ऑडियो लंबाई की आवश्यकता नहीं है, एक 15-मिनट की फ़ाइल या 15 1-मिनट की फ़ाइल हो सकती है)

ऑडैसिटी के साथ मोनो में परिवर्तित करने और शांति हटाने का तरीका

अपने डेटासेट के लिए किट्स.एआई ध्वनिक विभाजक उपकरण का उपयोग करें ताकि आप ध्वनियाँ अलग कर सकें।

गाने से वोकल को अलग करने के लिए, बस एक फ़ाइल अपलोड करें या किसी यूट्यूब लिंक को किट्स.एआई वोकल सेपरेटर उपकरण में पेस्ट करें। यह अपना डेटासेट बनाने का एक आसान तरीका है।

Advanced dataset techniques.

उच्च गुणवत्ता के लिए अपने ऑडियो को पूर्व-प्रसंस्करण करें।

आपका ऑडियो हो सकता है:

- स्वच्छ EQड (subtractive) ताकि रिकॉर्डिंग में मैडी या कठोर फ्रीक्वेंसी को कम किया जा सके

- सूक्ष्मता से पिच सुधारा गया (धीमी हमले, मध्यम पक्षता) जब तक यह गायकी शैली का प्रमुख हिस्सा नहीं है

- कठोर sibilance को कम करने के लिए De-essed

- संतुलित रूप से कम्प्रेस किया गया ताकि डायनामिक रेंज को समान किया जा सके / ऊचे चीरे कम किए जा सके (~4-5db की गेन रिडक्शन अधिकतम)

- उत्तेजित (जोड़ने वाला EQड) ताकि गायकी की शैली से मेल खाए

- -6db की शीर्ष रेंज में सीमित किया गया है जो कुल श्रेणी -6 से -12db है।

- हाई / लो पास किया गया है जिससे 40hz–100hz और 20khz से ऊपर की फ्रीक्वेंसियों को दूर किया जा सके

- फेज पुनर्संतुलन किया गया है

अपनी खुद की आवाज़ें रिकॉर्ड करें।

अपने मॉडल के लिए ध्वनि रिकॉर्ड कर रहे हैं? यहाँ कुछ विन्यास दिए गए हैं जो आपको शुरू करने में मदद कर सकते हैं:

- एक उच्च आवृत्ति सीमा (40hz–20khz) वाला गुणवत्ता वाला माईक का प्रयोग करें

- अपनी रिकॉर्डिंग सैंपल दर को 48khz पर सेट करें और फ़ाइल प्रकार को हानि रहित (.wav, .aiff, .flac) करें

- सांस की ध्वनि को सीमित करें और एक साफ टोन पकड़ने का प्रयास करें (बब्बर आवाज़, माइक को अफ़–अक्ष लगाएं और/या एक पॉप फ़िल्टर का प्रयोग करें अगर आप सांस लेते हुए गाते हैं)

- कमरे की प्रतिबिम्बनाएँ से बचें (आवाज़ को अवशोषित करने के लिए कारपेट और फर्नीचर जैसी मुलायम सतहों वाले कमरे में रिकॉर्ड करें, माइक्रोफ़ोन को दीवारों से दूर रखें, क़रीब जाएं और अपने इनपुट गेन को कम करें)

- अपनी रिकॉर्डिंग ध्वनि का मॉनिटरिंग करें और -6db dBFS से अधिक न होने का प्रयास करें। अपने स्तरों को -12 और -6 dBFS के बीच रखने की कोशिश करें

- अपनी ऑडियो को सच्चे मोनो के रूप में निर्यात करें (बराबर L + R चैनल्स के साथ स्टीरियो की बजाय)

- ऑडियो पर किसी भी कठोर कट को टालें (शून्य पार करने से पहले या बाद में ऑडियो को काटने से आने वाली डामरी से बचने के लिए एक छोटा फ़ेड आउट जोड़ें)

सामग्री

अधिक विविधता, बेहतर।

अपने पूरे रेंज को कवर करने वाले उदाहरण होना अच्छा है। छाती, मिक्स, फालसेटो; बड़े और छोटे इंटरवल; grit और साफ नोट्स; आदि। जितनी अधिक विविधता, बेहतर।

आप अलग-अलग कीज में एक ही गाने का बोल सिंग कर सकते हैं, अपने रिपर्ट्वार से कुछ गाने, मूल गाने, आदि। ऑडियो कई फाइलों में या एक ही टेक में हो सकता है — जब तक गाने का समय 10–15 मिनट का हो।

Techniques

कैसे सच मोनो में परिवर्तित करें

मुक्त Audacity कार्यक्रम का उपयोग करके स्टीरियो फ़ाइलों को वास्तविक मोनो में परिवर्तित करें।

खामोशी को कैसे हटाएं

फ्री ऑडैसिटी प्रोग्राम का उपयोग करें एक एकपेला से चुप्पी हटाने के लिए।

(इस वीडियो में सेटिंग को कॉपी करें, लेकिन अनुभव करने की इजाजत है। अपने एकपेला के शोर स्तर पर बीच -20db और -40db के बीच एक थ्रेशोल्ड चुनें।)

FAQ

प्रश्न: मॉडल प्रशिक्षण कितनी देर तक लेती है?

आपके डेटा के आकार के आधार पर, मॉडल प्रशिक्षण करने में 30 मिनट से लेकर कई घंटे तक लग सकते हैं! चिंता न करें - जब तक आपकी बनावट डैशबोर्ड पर प्रशिक्षण दिखा रहा हो, तब तक आपका मॉडल जल्द ही समाप्त हो जाएगा।

प्रश्न: मॉडल प्रशिक्षण कितनी देर तक लेती है?

आपके डेटा के आकार के आधार पर, मॉडल प्रशिक्षण करने में 30 मिनट से लेकर कई घंटे तक लग सकते हैं! चिंता न करें - जब तक आपकी बनावट डैशबोर्ड पर प्रशिक्षण दिखा रहा हो, तब तक आपका मॉडल जल्द ही समाप्त हो जाएगा।

प्रश्न: मॉडल प्रशिक्षण कितनी देर तक लेती है?

आपके डेटा के आकार के आधार पर, मॉडल प्रशिक्षण करने में 30 मिनट से लेकर कई घंटे तक लग सकते हैं! चिंता न करें - जब तक आपकी बनावट डैशबोर्ड पर प्रशिक्षण दिखा रहा हो, तब तक आपका मॉडल जल्द ही समाप्त हो जाएगा।

प्रश्न: मेरे मॉडल को अपलोड होने में बहुत समय लग रहा है! क्या हो रहा है?

अगर आप एक बड़ी फ़ाइल अपलोड कर रहे हैं, तो हमारे बैकएंड पर डेटा अपलोड करने में बहुत समय लगेगा। बस “अपलोड” दबाएं और धैर्य रखें - यह आखिरकार प्रक्रिया करेगा। अपलोड के दौरान पृष्ठ को ताज़ा न करें।

प्रश्न: मेरे मॉडल को अपलोड होने में बहुत समय लग रहा है! क्या हो रहा है?

अगर आप एक बड़ी फ़ाइल अपलोड कर रहे हैं, तो हमारे बैकएंड पर डेटा अपलोड करने में बहुत समय लगेगा। बस “अपलोड” दबाएं और धैर्य रखें - यह आखिरकार प्रक्रिया करेगा। अपलोड के दौरान पृष्ठ को ताज़ा न करें।

प्रश्न: मेरे मॉडल को अपलोड होने में बहुत समय लग रहा है! क्या हो रहा है?

अगर आप एक बड़ी फ़ाइल अपलोड कर रहे हैं, तो हमारे बैकएंड पर डेटा अपलोड करने में बहुत समय लगेगा। बस “अपलोड” दबाएं और धैर्य रखें - यह आखिरकार प्रक्रिया करेगा। अपलोड के दौरान पृष्ठ को ताज़ा न करें।

प्रश्न: यदि मुझे त्रुटि दिखाई दे तो मैं क्या करूं?

ए: अगर आप अपलोड के दौरान त्रुटि देखते हैं, तो हमसे हमारे बग फॉर्म! (bug form) पर संपर्क करें।

मुफ्त शुरू करें। कोई क्रेडिट कार्ड आवश्यक नहीं है।

हमारी मुफ्त योजना आपको यह देखने देती है कि कैसे Kits आपकी वोकल और ऑडियो वर्कफ़्लो को सरल बनाने में मदद कर सकते हैं। जब आप अगले कदम पर जाने के लिए तैयार हों, तो सशुल्क योजनाएँ $14.99 / महीने से शुरू होती हैं।

मुफ्त शुरू करें। कोई क्रेडिट कार्ड आवश्यक नहीं है।

हमारी मुफ्त योजना आपको यह देखने देती है कि कैसे Kits आपकी वोकल और ऑडियो वर्कफ़्लो को सरल बनाने में मदद कर सकते हैं। जब आप अगले कदम पर जाने के लिए तैयार हों, तो सशुल्क योजनाएँ $14.99 / महीने से शुरू होती हैं।

मुफ्त शुरू करें। कोई क्रेडिट कार्ड आवश्यक नहीं है।

हमारी मुफ्त योजना आपको यह देखने देती है कि कैसे Kits आपकी वोकल और ऑडियो वर्कफ़्लो को सरल बनाने में मदद कर सकते हैं। जब आप अगले कदम पर जाने के लिए तैयार हों, तो सशुल्क योजनाएँ $14.99 / महीने से शुरू होती हैं।