Création de modèle vocal

Créez le meilleur modèle vocal possible en créant un ensemble de données de haute qualité en utilisant les conseils ci-dessous.

Tarification

Application de bureau

Recherche

Blog

Select Language

Comment créer votre ensemble de données.

Rassemblez 30 à 60 minutes au total de voix sèches (sans effets) et monophoniques (une note à la fois).

Pas de réverbération, de retard, de chœur ou d'instrumentaux,
Pas d'harmonies, de superposition, de double suivi, d'effets stéréo.
Aucune variation dans les styles vocaux. Par exemple. juste chanter ou juste rapper mais pas les deux.

Pas de réverbération, de délai, de chœur ou d'instrumentaux,
Pas d'harmonies, de superpositions, de doubles prises, d'effets stéréo.
Pas de variation dans les styles vocaux. Par exemple, juste chanter ou juste raper mais pas les deux.

Pas de réverbération, de délai, de chœur ou d'instrumentaux,
Pas d'harmonies, de superposition, de double suivi, d'effets stéréo.
Pas de variation dans les styles vocaux. Par exemple, juste chanter ou juste rapper mais pas les deux.

Mauvais chant

Stéréo, réverbération, retard

0:00/1:34

Bonnes voix

Tonalité claire mono, faible bruit

Préparation de votre/vos fichier(s).

Exportez vos fichiers sans silence et avec un volume constant en tant que fichier audio lossless de 16 bits (.wav de préférence).

Avant : silence, niveaux de volume incohérents

Après : silence tronqué, volume constant

Une fois que vous avez enregistré vos voix, l'étape suivante consiste à préparer vos fichiers pour l'entraînement :

Supprimez tout silence supplémentaire (nous recommandons de le faire automatiquement avec Audacity)
Exportez en vrai mono (plutôt qu'en stéréo avec des canaux L + R égaux)
Exportez en .wav 16 bits (aucune exigence de durée audio, cela peut être un fichier de 15 minutes ou 15 fichiers de 1 minute)

Supprimer tout silence superflu (nous recommandons de le faire automatiquement avec Audacity)
Exporter en mono véritable (plutôt qu'en stéréo avec des canaux L + R égaux)
Exporter en .wav 16 bits (pas d'exigences de durée audio, cela peut être un fichier de 15 minutes ou 15 fichiers de 1 minute)

Supprimez tout silence superflu (nous recommandons de le faire automatiquement avec Audacity)
Exportez en mono réel (plutôt qu'en stéréo avec des canaux L + R égaux)
Exportez en .wav 16 bits (aucune exigence de longueur audio, cela peut être un fichier de 15 minutes ou 15 fichiers d'une minute)

Comment convertir en mono et supprimer le silence avec Audacity

Utilisez l'outil de séparation vocale Kits.AI pour isoler les voix de votre ensemble de données.

Pour isoler les voix d'une chanson, il suffit de télécharger un fichier dans l'outil Kits.AI Vocal Separator. C'est un moyen facile de créer votre propre ensemble de données.

Advanced dataset techniques.

Pré-traitez votre audio pour une meilleure qualité.

Votre audio peut être :

égalisé correctement (substractif) pour réduire les fréquences boueuses ou stridentes dans l'enregistrement
corrigé subtilement en tonalité (attaque lente, force modérée) à moins que ce ne soit une partie clé du style vocal
dénoué pour réduire toute sibilance dure
compressé légèrement pour égaliser la plage dynamique/réduire les pics (~4-5db de réduction de gain au maximum)
amplifié (égalisation additive) pour s'adapter au style du vocal
limité à un pic de -6db avec des niveaux globaux entre -6 et -12db.
filtré haut/bas pour enlever les fréquences en dessous de 40hz–100hz et au-dessus de 20khz
Phase rééquilibrée

Votre audio peut être :

égalisé de manière propre (subtractive) pour réduire les fréquences boueuses ou agressives dans l'enregistrement
légèrement corrigé en pitch (attaque lente, force modérée) à moins que ce ne soit une partie clé du style vocal
Dé-essuyé pour réduire toute sibilance sévère
Compressé légèrement pour égaliser la dynamique/réduire les pics (~4-5db de réduction de gain au maximum)
Amplifié (égalisation additive) pour s'adapter au style du vocal
Limité à un pic de -6db avec des niveaux globaux entre -6 et -12db.
Filtré haut/bas pour supprimer les fréquences en dessous de 40hz–100hz et au-dessus de 20khz
Phase rééquilibrée

Votre audio peut être :

égalisé proprement (subtratif) pour réduire les fréquences boueuses ou agressives dans l'enregistrement
corrigé légèrement en hauteur (attaque lente, force modérée) à moins que ce ne soit une partie clé du style vocal
Dé-essé pour réduire toute sibilance agressive
Comprimé légèrement pour égaliser la plage dynamique/réduire les pics (~4-5db de réduction de gain au maximum)
Boosté (égalisation additive) pour s'adapter au style du vocal
Limité à un pic de -6db avec des niveaux globaux entre -6 et -12db.
Passé haut/bas pour enlever les fréquences en dessous de 40hz–100hz et au-dessus de 20khz
Phase rééquilibrée

Enregistrez votre propre voix.

Enregistrer des voix pour votre modèle ? Voici quelques configurations pour vous aider à démarrer :

Utilisez un micro de qualité avec une large plage de fréquences (40hz–20khz)
Réglez votre taux d'échantillonnage d'enregistrement sur 48khz et le type de fichier sur sans perte (.wav, .aiff, .flac)
Limitez les sons de respiration et essayez de capturer un ton clair (évitez les plosives, placez le micro hors axe et/ou utilisez un filtre anti-pop si vous chantez dans un style léger)
Évitez les réflexions de la pièce (enregistrez dans une pièce avec des surfaces douces comme des carpettes et des meubles pour absorber le son, placez les microphones loin des murs, rapprochez-vous et réduisez votre gain d'entrée)
Surveillez le volume de votre enregistrement et évitez de dépasser -6db dBFS. Essayez de garder vos niveaux entre -12 et -6 dBFS.
Exportez votre audio en mono véritable (plutôt qu'en stéréo avec des canaux L + R égaux)
Évitez toute coupure brusque sur l'audio (ajoutez un court fondu pour éviter les bruits de coupure qui surviennent avant ou après un passage par zéro)

Enregistrement des voix pour votre modèle ? Voici quelques configurations pour vous aider à commencer :

Utilisez un microphone de qualité avec une large plage de fréquences (40 Hz–20 kHz)
Réglez votre taux d'échantillonnage à 48 kHz et le type de fichier à sans perte (.wav, .aiff, .flac)
Limitez les bruits de respiration et essayez de capturer un son clair (évitez les plosives, placez le microphone hors axe et/ou utilisez un filtre anti-pop si vous chantez dans un style vocal détendu)
Évitez les réflexions sonores (enregistrez dans une pièce avec des surfaces douces comme des tapis et des meubles pour absorber le son, placez les microphones éloignés des murs, rapprochez-vous et réduisez votre gain d'entrée)
Surveillez votre volume d'enregistrement et évitez de dépasser -6 dBFS. Essayez de maintenir vos niveaux entre -12 et -6 dBFS.
Exportez votre audio en vrai mono (plutôt qu'en stéréo avec des canaux L + R égaux)
Évitez les coupures brusques sur l'audio (ajoutez un court fondu sortant pour éviter les pops qui proviennent de l'interruption de l'audio avant ou après un passage à zéro)

Enregistrement des voix pour votre modèle ? Voici quelques configurations pour vous aider à commencer. :

Utilisez un micro de qualité avec une large plage de fréquences (40hz–20khz)
Définissez votre fréquence d'échantillonnage d'enregistrement à 48khz et le type de fichier en sans perte (.wav, .aiff, .flac)
Limitez les bruits de respiration et essayez de capturer un ton clair (évitez les plosives, placez le micro hors axe et/ou utilisez un filtre anti-pop si vous chantez dans un style léger)
Évitez les réflexions de la pièce (enregistrez dans une pièce avec des surfaces douces comme des tapis et des meubles pour absorber le son, placez les microphones éloignés des murs, rapprochez-vous et réduisez votre gain d'entrée)
Surveillez le volume de votre enregistrement et évitez de dépasser -6db dBFS. Essayez de maintenir vos niveaux entre -12 et -6 dBFS.
Exportez votre audio en mono vrai (plutôt qu'en stéréo avec des canaux L + R égaux)
Évitez toute coupure nette sur l'audio (ajoutez un court fondu en sortie pour éviter les pops qui viennent de la coupe de l'audio avant ou après un passage par zéro)

Contenu

Plus de variété, c'est mieux.

Mieux vaut avoir des exemples couvrant toute votre gamme. Poitrine, mix, voix de tête ; intervalles larges et courts ; rugosité et notes claires ; etc. Plus il y a de variété, mieux c'est.

Vous pouvez chanter les mêmes paroles dans différentes tonalités, quelques chansons de votre répertoire, des compositions originales, etc. L'audio peut être présenté sous forme de plusieurs fichiers ou en une seule prise — tant que le temps de chant total atteint 10 à 15 minutes.

Techniques

Comment convertir en True Mono

Utilisez le programme Audacity gratuit pour convertir les fichiers stéréo en vraie mono.

Comment supprimer le silence

Utilisez le programme gratuit Audacity pour supprimer rapidement le silence d'un acapella.

(Copiez les paramètres de cette vidéo, mais n'hésitez pas à expérimenter. Choisissez un seuil entre -20db et -40db en fonction du niveau sonore de votre acapella.)

FAQ

Q: Combien de temps prend l'entraînement du modèle?

En fonction de la taille de vos données, l'entraînement du modèle peut prendre entre 30 minutes et plusieurs heures ! Mais ne vous inquiétez pas - dès que vous voyez "Entraînement" sur votre tableau de bord de création de voix, votre modèle va bientôt se terminer.

Q: Mon modèle prend une éternité à télécharger! Que se passe-t-il?

Si vous téléchargez un gros fichier, cela prend du temps pour transférer les données sur notre serveur. Appuyez simplement sur "Télécharger" et soyez patient - le traitement se fera finalement. Assurez-vous de ne pas actualiser la page pendant le téléchargement.

Q: Que dois-je faire si je vois une erreur?

Un: Si vous voyez une erreur lors du téléchargement, contactez-nous sur notre formulaire de bug!

A: Si vous voyez une erreur lors du téléchargement, contactez-nous sur notre formulaire de bug!

Commencez, c'est gratuit.

Optimisez votre flux de production vocale avec des outils audio AI de qualité studio

Commencer

Création de modèle vocal

Fonctionnalités

Fonctionnalités

Tarification

Application de bureau

Recherche

Blog

Se connecter

Comment créer votre ensemble de données.

Comment créer votre ensemble de données.

Préparation de votre/vos fichier(s).

Comment convertir en mono et supprimer le silence avec Audacity

Utilisez l'outil de séparation vocale Kits.AI pour isoler les voix de votre ensemble de données.

Advanced dataset techniques.

Pré-traitez votre audio pour une meilleure qualité.

Enregistrez votre propre voix.

Contenu

Techniques

Comment convertir en True Mono

Comment supprimer le silence

FAQ

Q: Combien de temps prend l'entraînement du modèle?

Q: Mon modèle prend une éternité à télécharger! Que se passe-t-il?

Q: Que dois-je faire si je vois une erreur?

PRODUIT

FONCTIONNALITÉS

JURIDIQUE

RESSOURCES