Création de modèle vocal

Créez le meilleur modèle vocal possible en créant un ensemble de données de haute qualité en utilisant les conseils ci-dessous.

Comment créer votre ensemble de données.

Rassemblez 30 à 60 minutes au total de voix sèches (sans effets) et monophoniques (une note à la fois).

  • Pas de réverbération, de retard, de chœur ou d'instrumentaux,

  • Pas d'harmonies, de superposition, de double suivi, d'effets stéréo.

  • Aucune variation dans les styles vocaux. Par exemple. juste chanter ou juste rapper mais pas les deux.

Mauvais chant

Stéréo, réverbération, retard

0:00/1:34

Bonnes voix

Tonalité claire mono, faible bruit

Préparation de votre/vos fichier(s).

Exportez vos fichiers sans silence et avec un volume constant en tant que fichier audio lossless de 16 bits (.wav de préférence).

Avant : silence, niveaux de volume incohérents

Après : silence tronqué, volume constant

Une fois que vous avez enregistré vos voix, l'étape suivante consiste à préparer vos fichiers pour l'entraînement :

  • Supprimez tout silence supplémentaire (nous recommandons de le faire automatiquement avec Audacity)

  • Exportez en vrai mono (plutôt qu'en stéréo avec des canaux L + R égaux)

  • Exportez en .wav 16 bits (aucune exigence de durée audio, cela peut être un fichier de 15 minutes ou 15 fichiers de 1 minute)

Comment convertir en mono et supprimer le silence avec Audacity

Utilisez l'outil de séparation vocale Kits.AI pour isoler les voix de votre ensemble de données.

Pour isoler les voix d'une chanson, il suffit de télécharger un fichier dans l'outil Kits.AI Vocal Separator. C'est un moyen facile de créer votre propre ensemble de données.

Advanced dataset techniques.

Pré-traitez votre audio pour une meilleure qualité.

Votre audio peut être :

  • égalisé correctement (substractif) pour réduire les fréquences boueuses ou stridentes dans l'enregistrement

  • corrigé subtilement en tonalité (attaque lente, force modérée) à moins que ce ne soit une partie clé du style vocal

  • dénoué pour réduire toute sibilance dure

  • compressé légèrement pour égaliser la plage dynamique/réduire les pics (~4-5db de réduction de gain au maximum)

  • amplifié (égalisation additive) pour s'adapter au style du vocal

  • limité à un pic de -6db avec des niveaux globaux entre -6 et -12db.

  • filtré haut/bas pour enlever les fréquences en dessous de 40hz–100hz et au-dessus de 20khz

  • Phase rééquilibrée

Enregistrez votre propre voix.

Enregistrer des voix pour votre modèle ? Voici quelques configurations pour vous aider à démarrer :

  • Utilisez un micro de qualité avec une large plage de fréquences (40hz–20khz)

  • Réglez votre taux d'échantillonnage d'enregistrement sur 48khz et le type de fichier sur sans perte (.wav, .aiff, .flac)

  • Limitez les sons de respiration et essayez de capturer un ton clair (évitez les plosives, placez le micro hors axe et/ou utilisez un filtre anti-pop si vous chantez dans un style léger)

  • Évitez les réflexions de la pièce (enregistrez dans une pièce avec des surfaces douces comme des carpettes et des meubles pour absorber le son, placez les microphones loin des murs, rapprochez-vous et réduisez votre gain d'entrée)

  • Surveillez le volume de votre enregistrement et évitez de dépasser -6db dBFS. Essayez de garder vos niveaux entre -12 et -6 dBFS.

  • Exportez votre audio en mono véritable (plutôt qu'en stéréo avec des canaux L + R égaux)

  • Évitez toute coupure brusque sur l'audio (ajoutez un court fondu pour éviter les bruits de coupure qui surviennent avant ou après un passage par zéro)

Contenu

Plus de variété, c'est mieux.

Mieux vaut avoir des exemples couvrant toute votre gamme. Poitrine, mix, voix de tête ; intervalles larges et courts ; rugosité et notes claires ; etc. Plus il y a de variété, mieux c'est.

Vous pouvez chanter les mêmes paroles dans différentes tonalités, quelques chansons de votre répertoire, des compositions originales, etc. L'audio peut être présenté sous forme de plusieurs fichiers ou en une seule prise — tant que le temps de chant total atteint 10 à 15 minutes.

Techniques

Comment convertir en True Mono

Utilisez le programme Audacity gratuit pour convertir les fichiers stéréo en vraie mono.

Comment supprimer le silence

Utilisez le programme gratuit Audacity pour supprimer rapidement le silence d'un acapella.

(Copiez les paramètres de cette vidéo, mais n'hésitez pas à expérimenter. Choisissez un seuil entre -20db et -40db en fonction du niveau sonore de votre acapella.)

FAQ

Q: Combien de temps prend l'entraînement du modèle?

En fonction de la taille de vos données, l'entraînement du modèle peut prendre entre 30 minutes et plusieurs heures ! Mais ne vous inquiétez pas - dès que vous voyez "Entraînement" sur votre tableau de bord de création de voix, votre modèle va bientôt se terminer.

Q: Mon modèle prend une éternité à télécharger! Que se passe-t-il?

Si vous téléchargez un gros fichier, cela prend du temps pour transférer les données sur notre serveur. Appuyez simplement sur "Télécharger" et soyez patient - le traitement se fera finalement. Assurez-vous de ne pas actualiser la page pendant le téléchargement.

Q: Que dois-je faire si je vois une erreur?

Un: Si vous voyez une erreur lors du téléchargement, contactez-nous sur notre formulaire de bug!

Commencez, c'est gratuit.

Optimisez votre flux de production vocale avec des outils audio AI de qualité studio