आवाज मॉडल निर्माण

नीचे दिए गए टिप्स का उपयोग करके एक उच्च गुणवत्ता वाले डेटासेट बनाकर सर्वश्रेष्ठ संभावित ध्वनि मॉडल बनाएं।

आवाज मॉडल निर्माण

नीचे दिए गए टिप्स का उपयोग करके एक उच्च गुणवत्ता वाले डेटासेट बनाकर सर्वश्रेष्ठ संभावित ध्वनि मॉडल बनाएं।

अपना डेटासेट कैसे बनाएं।

अपना डेटासेट कैसे बनाएं।

अपना डेटासेट कैसे बनाएं।

30-60 कुल मिनट की सूखी (कोई प्रभाव नहीं) और मोनोफोनिक (एक समय पर एक नोट) वोकल का संग्रह करें।

- कोई रिवर्ब, डिले, कोरस, या वाद्ययंत्र-ध्वनि नहीं,
- कोई साज की सुरीलापन, लेयरिंग, डबलट्रैकिंग, स्टीरियो प्रभाव नहीं।
- गायन शैलियों में कोई भिन्नता नहीं। उदा: सिर्फ गायन या सिर्फ रॅपिंग, लेकिन दोनों नहीं।

- कोई रिवर्ब, डिले, कोरस, या वाद्ययंत्र-ध्वनि नहीं,
- कोई साज की सुरीलापन, लेयरिंग, डबलट्रैकिंग, स्टीरियो प्रभाव नहीं।
- गायन शैलियों में कोई भिन्नता नहीं। उदा: सिर्फ गायन या सिर्फ रॅपिंग, लेकिन दोनों नहीं।

- कोई रिवर्ब, डिले, कोरस, या वाद्ययंत्र-ध्वनि नहीं,
- कोई साज की सुरीलापन, लेयरिंग, डबलट्रैकिंग, स्टीरियो प्रभाव नहीं।
- गायन शैलियों में कोई भिन्नता नहीं। उदा: सिर्फ गायन या सिर्फ रॅपिंग, लेकिन दोनों नहीं।

खराब गायकी

खराब गायकी

खराब गायकी

स्टीरियो, रिवर्ब, डिले

0:00/1:34

अच्छी गायकी

अच्छी गायकी

अच्छी गायकी

मोनो, साफ टोन, कम शोर

आपकी फ़ाइल साजिशपूर्वक तैयार की जा रही है।

अपनी फ़ाइलें कोई खामोशी और संगत वॉल्यूम के साथ एक 16-बिट हानिहीत ऑडियो फ़ाइल (.wav पसंद किया गया) के साथ निर्यात करें।

पहले: चुप्पी, असंतुलित वॉल्यूम स्तर

बाद: कटी हुई चुप्पी, संगत आवाज

एक बार जब आप अपनी ध्वनि संकलित कर चुके हैं, तो अगला कदम यह है कि फ़ाइलें प्रशिक्षण के लिए तैयार करें:

  • किसी भी अतिरिक्त खामोशी को हटाएं (हम सिफ़र Audacity के साथ यह स्वचालित रूप से करने की सिफारिश करते हैं)

  • सही मोनो के रूप में निर्यात करें (बराबर एल + आर चैनल के साथ स्टीरियो की बजाय)

  • 16-बिट .wav के रूप में निर्यात करें (कोई ऑडियो लंबाई की आवश्यकता नहीं है, एक 15-मिनट की फ़ाइल या 15 1-मिनट की फ़ाइल हो सकती है)

ऑडैसिटी के साथ मोनो में परिवर्तित करने और शांति हटाने का तरीका

अपने डेटासेट के लिए किट्स.एआई ध्वनिक विभाजक उपकरण का उपयोग करें ताकि आप ध्वनियाँ अलग कर सकें।

गाने से वोकल को अलग करने के लिए, बस एक फ़ाइल अपलोड करें या किसी यूट्यूब लिंक को किट्स.एआई वोकल सेपरेटर उपकरण में पेस्ट करें। यह अपना डेटासेट बनाने का एक आसान तरीका है।

उन्नत डेटासेट तकनीक।

उन्नत डेटासेट तकनीक।

उन्नत डेटासेट तकनीक।

उच्च गुणवत्ता के लिए अपने ऑडियो को पूर्व-प्रसंस्करण करें।

आपका ऑडियो हो सकता है:

- स्वच्छ EQड (subtractive) ताकि रिकॉर्डिंग में मैडी या कठोर फ्रीक्वेंसी को कम किया जा सके

- सूक्ष्मता से पिच सुधारा गया (धीमी हमले, मध्यम पक्षता) जब तक यह गायकी शैली का प्रमुख हिस्सा नहीं है

- कठोर sibilance को कम करने के लिए De-essed

- संतुलित रूप से कम्प्रेस किया गया ताकि डायनामिक रेंज को समान किया जा सके / ऊचे चीरे कम किए जा सके (~4-5db की गेन रिडक्शन अधिकतम)

- उत्तेजित (जोड़ने वाला EQड) ताकि गायकी की शैली से मेल खाए

- -6db की शीर्ष रेंज में सीमित किया गया है जो कुल श्रेणी -6 से -12db है।

- हाई / लो पास किया गया है जिससे 40hz–100hz और 20khz से ऊपर की फ्रीक्वेंसियों को दूर किया जा सके

- फेज पुनर्संतुलन किया गया है

अपनी खुद की आवाज़ें रिकॉर्ड करें।

अपने मॉडल के लिए ध्वनि रिकॉर्ड कर रहे हैं? यहाँ कुछ विन्यास दिए गए हैं जो आपको शुरू करने में मदद कर सकते हैं:

- एक उच्च आवृत्ति सीमा (40hz–20khz) वाला गुणवत्ता वाला माईक का प्रयोग करें

- अपनी रिकॉर्डिंग सैंपल दर को 48khz पर सेट करें और फ़ाइल प्रकार को हानि रहित (.wav, .aiff, .flac) करें

- सांस की ध्वनि को सीमित करें और एक साफ टोन पकड़ने का प्रयास करें (बब्बर आवाज़, माइक को अफ़–अक्ष लगाएं और/या एक पॉप फ़िल्टर का प्रयोग करें अगर आप सांस लेते हुए गाते हैं)

- कमरे की प्रतिबिम्बनाएँ से बचें (आवाज़ को अवशोषित करने के लिए कारपेट और फर्नीचर जैसी मुलायम सतहों वाले कमरे में रिकॉर्ड करें, माइक्रोफ़ोन को दीवारों से दूर रखें, क़रीब जाएं और अपने इनपुट गेन को कम करें)

- अपनी रिकॉर्डिंग ध्वनि का मॉनिटरिंग करें और -6db dBFS से अधिक न होने का प्रयास करें। अपने स्तरों को -12 और -6 dBFS के बीच रखने की कोशिश करें

- अपनी ऑडियो को सच्चे मोनो के रूप में निर्यात करें (बराबर L + R चैनल्स के साथ स्टीरियो की बजाय)

- ऑडियो पर किसी भी कठोर कट को टालें (शून्य पार करने से पहले या बाद में ऑडियो को काटने से आने वाली डामरी से बचने के लिए एक छोटा फ़ेड आउट जोड़ें)

सामग्री

अधिक विविधता, बेहतर।

अपने पूरे रेंज को कवर करने वाले उदाहरण होना अच्छा है। छाती, मिक्स, फालसेटो; बड़े और छोटे इंटरवल; grit और साफ नोट्स; आदि। जितनी अधिक विविधता, बेहतर।

आप अलग-अलग कीज में एक ही गाने का बोल सिंग कर सकते हैं, अपने रिपर्ट्वार से कुछ गाने, मूल गाने, आदि। ऑडियो कई फाइलों में या एक ही टेक में हो सकता है — जब तक गाने का समय 10–15 मिनट का हो।

तकनीकें

तकनीकें

तकनीकें

कैसे सच मोनो में परिवर्तित करें

मुक्त Audacity कार्यक्रम का उपयोग करके स्टीरियो फ़ाइलों को वास्तविक मोनो में परिवर्तित करें।

खामोशी को कैसे हटाएं

फ्री ऑडैसिटी प्रोग्राम का उपयोग करें एक एकपेला से चुप्पी हटाने के लिए।

(इस वीडियो में सेटिंग को कॉपी करें, लेकिन अनुभव करने की इजाजत है। अपने एकपेला के शोर स्तर पर बीच -20db और -40db के बीच एक थ्रेशोल्ड चुनें।)

पूछे जाने वाले प्रश्न

पूछे जाने वाले प्रश्न

पूछे जाने वाले प्रश्न

प्रश्न: मॉडल प्रशिक्षण कितनी देर तक लेती है?

आपके डेटा के आकार के आधार पर, मॉडल प्रशिक्षण करने में 30 मिनट से लेकर कई घंटे तक लग सकते हैं! चिंता न करें - जब तक आपकी बनावट डैशबोर्ड पर प्रशिक्षण दिखा रहा हो, तब तक आपका मॉडल जल्द ही समाप्त हो जाएगा।

प्रश्न: मॉडल प्रशिक्षण कितनी देर तक लेती है?

आपके डेटा के आकार के आधार पर, मॉडल प्रशिक्षण करने में 30 मिनट से लेकर कई घंटे तक लग सकते हैं! चिंता न करें - जब तक आपकी बनावट डैशबोर्ड पर प्रशिक्षण दिखा रहा हो, तब तक आपका मॉडल जल्द ही समाप्त हो जाएगा।

प्रश्न: मॉडल प्रशिक्षण कितनी देर तक लेती है?

आपके डेटा के आकार के आधार पर, मॉडल प्रशिक्षण करने में 30 मिनट से लेकर कई घंटे तक लग सकते हैं! चिंता न करें - जब तक आपकी बनावट डैशबोर्ड पर प्रशिक्षण दिखा रहा हो, तब तक आपका मॉडल जल्द ही समाप्त हो जाएगा।

प्रश्न: मेरे मॉडल को अपलोड होने में बहुत समय लग रहा है! क्या हो रहा है?

अगर आप एक बड़ी फ़ाइल अपलोड कर रहे हैं, तो हमारे बैकएंड पर डेटा अपलोड करने में बहुत समय लगेगा। बस “अपलोड” दबाएं और धैर्य रखें - यह आखिरकार प्रक्रिया करेगा। अपलोड के दौरान पृष्ठ को ताज़ा न करें।

प्रश्न: मेरे मॉडल को अपलोड होने में बहुत समय लग रहा है! क्या हो रहा है?

अगर आप एक बड़ी फ़ाइल अपलोड कर रहे हैं, तो हमारे बैकएंड पर डेटा अपलोड करने में बहुत समय लगेगा। बस “अपलोड” दबाएं और धैर्य रखें - यह आखिरकार प्रक्रिया करेगा। अपलोड के दौरान पृष्ठ को ताज़ा न करें।

प्रश्न: मेरे मॉडल को अपलोड होने में बहुत समय लग रहा है! क्या हो रहा है?

अगर आप एक बड़ी फ़ाइल अपलोड कर रहे हैं, तो हमारे बैकएंड पर डेटा अपलोड करने में बहुत समय लगेगा। बस “अपलोड” दबाएं और धैर्य रखें - यह आखिरकार प्रक्रिया करेगा। अपलोड के दौरान पृष्ठ को ताज़ा न करें।

प्रश्न: यदि मुझे त्रुटि दिखाई दे तो मैं क्या करूं?

ए: अगर आप अपलोड के दौरान त्रुटि देखते हैं, तो हमसे हमारे बग फॉर्म! (bug form) पर संपर्क करें।

मुफ्त शुरू करें। कोई क्रेडिट कार्ड की आवश्यकता नहीं है।

Streamline your vocal production workflow with Kits AI's free plan. Convert a voice and hear what's possible.

मुफ्त शुरू करें। कोई क्रेडिट कार्ड की आवश्यकता नहीं है।

Streamline your vocal production workflow with Kits AI's free plan. Convert a voice and hear what's possible.