Kits IA : ElevenLabs pour la musique IA et le chant IA
Written by
Published on
22 février 2024
Le générateur de voix IA pour producteurs, chanteurs et musiciens
Avez-vous utilisé ElevenLabs pour créer des voix off au son professionnel pour votre contenu ? La révolution de l'intelligence artificielle envahit la création de contenu, avec des outils comme ElevenLabs qui vous permettent de créer une narration vocale IA réaliste de haute qualité pour des podcasts et d'autres créations audio plus rapidement et à moindre coût que jamais.
Maintenant, producteurs et chanteurs utilisent une technologie de parole et d'IA similaire pour leur musique. Kits AI peut créer des mélodies principales époustouflantes et des voix de fond, remplacer des chanteurs par un autre d'un style différent, et même cloner une vraie voix. Et ça sonne si bien, que vous ne remarquerez même pas que c'est de l'IA.
Comparons Kits et ElevenLabs pour voir quel outil vocal IA est le meilleur pour votre travail.
Comparer Kits et Elevenlabs
Tant ElevenLabs que Kits peuvent créer des narrations et des voix off au son humain en utilisant la synthèse vocale. Mais seul Kits peut créer des chanteurs IA et convertir des enregistrements chantés, y compris de la musique mixte avec des instruments et des voix de fond. Le processus est tout aussi simple pour les deux outils.
ElevenLabs vous permet de générer de la parole de deux manières : synthèse vocale et parole à parole. Dans ce dernier cas, le locuteur d'un enregistrement existant est remplacé par une voix de stock, une voix personnalisée que vous créez, ou une voix clonée. (Plus d'informations à ce sujet plus tard.) Une fois que vous entrez un texte ou téléchargez un fichier, vous serez invité à choisir une voix et un modèle. (ElevenLabs propose plusieurs modèles d'IA, mais Eleven Multilingual V2 est recommandé pour la plupart des usages.) Vous pouvez ensuite définir quatre paramètres pour votre sortie :
Stabilité : Une stabilité plus élevée rendra la voix plus cohérente à travers les générations, mais les résultats peuvent sembler plus monotones et artificiels.
Clarté + Similarité : Cela améliore la sortie pour la rendre plus facile à comprendre et plus similaire à l'original en parole à parole, mais peut provoquer des artefacts (inclusions non intentionnelles, peut-être des sonorités étranges).
Exagération de style : Ce curseur est réglé sur zéro par défaut pour des vitesses plus rapides. L'augmenter peut styliser des téléchargements plats ou monotones, mais peut également provoquer des résultats étranges à des niveaux élevés.
Amélioration de la voix : Cochez cette case pour augmenter la similarité de la sortie par rapport au locuteur original dans une génération parole à parole.
Kits offre une gamme de fonctionnalités similaire, mais avec des formats de téléchargement supplémentaires et des paramètres conçus pour les producteurs de musique et les chanteurs, ainsi qu'un accès API pour les applications. La principale différence entre les deux outils est que Kits offre une génération parole à parole pour le chant. Téléchargez une chanson, choisissez un générateur de voix IA, mélangez ou clonez votre voix, et générez votre mélodie avec un nouveau chanteur !
Kits AI offre un certain nombre de paramètres avancés pour personnaliser votre piste vocale :
Supprimer les instrumentaux, la réverbération et le délai, et/ou les voix de fond de votre enregistrement pour de meilleurs résultats, instantanément dans Kits.
Changement de hauteur : Augmentez ou abaissez la hauteur jusqu'à 24 demi-tons.
Force de conversion : Ajoute plus d'accent et d'articulation à la génération, mais peut provoquer des résultats inattendus à des niveaux élevés.
Mélange de volume : Contrôlez l'équilibre entre le volume d'entrée et le modèle. Des valeurs plus basses révèlent plus des dynamiques originales.
Effets de prétraitement : Coupez le bruit, les grondements et la dureté, adoucissez le volume, et/ou appliquez l'autotune avant la génération.
Effets de post-traitement : Appliquez un compresseur, un chorus, de la réverbération, et/ou un délai à votre résultat final.
Générateurs de voix IA et de chant IA : Chatgpt pour l'audio
Les voix préétablies sont le moyen le plus simple d'utiliser ElevenLabs et Kits, et les deux offrent un large éventail d'options de haute qualité.
ElevenLabs propose plus de 40 voix préétablies pour la génération de discours. Chacune a un nom et des balises pour son accent, son caractère ou sa qualité (“marin”, “surexcité”, “chuchotement”, etc.), et leur utilisation recommandée, comme les livres audio, les jeux vidéo, l'ASMR, et plus. De plus, il existe une bibliothèque de voix contenant des milliers d'autres provenant d'utilisateurs, y compris des clones de professionnels de la voix et des sons générés par IA.
Kits propose également plus de 50 voix d'artistes stock. Réfléchissant à l'orientation musicale de Kits, les voix sont nommées selon leur genre et leur timbre. Par exemple, deux des plus populaires sont Rock Grunge Masculin et Jazz Féminin. Vous pouvez trier les voix de Kits par plage de hauteur, sexe et genre. De plus, Kits propose quelques instruments de stock instruments, y compris la guitare, la basse, le saxophone et le violoncelle. Ceux-ci peuvent être utilisés pour convertir des mélodies chantées en instrumentaux.
Tutoriel sur le clonage de voix IA
Tant Kits qu'ElevenLabs vous permettent de cloner de vraies voix à utiliser pour les générations futures. ElevenLabs fonctionne parfaitement avec les enregistrements parlés pour la narration et la voix off, tandis que Kits est conçu pour le chant et la musique.
Kits AI appelle ce processus “entraîner” une voix. Il vous suffit de télécharger un fichier audio, votre propre voix, ou de coller un lien YouTube. Kits accepte des téléchargements allant jusqu'à 60 minutes, mais recommande une durée de 10 minutes pour optimiser la vitesse et la qualité. Pour de meilleurs résultats, utilisez un enregistrement avec uniquement des voix nettes (pas de réverbération, d'harmonies ou de bruit de fond). Utilisez le microphone de la meilleure qualité que vous pouvez, et plus il y a de voyelles et de hauteurs utilisées, mieux c'est.
À partir de là, vous pouvez choisir de nettoyer les voix et de supprimer les instrumentaux. Ajoutez un nom et une photo, puis entraînez votre nouvelle voix ! (Ce processus peut prendre un certain temps, alors soyez patient.) Une fois terminé, vous pouvez utiliser cette nouvelle voix pour tout ce que vous souhaitez créer.
Sur ElevenLabs, le processus est appelé clonage vocal instantané. Téléchargez jusqu'à 25 fichiers audio ou vidéo, jusqu'à 10 Mo chacun. Le site avertit que la qualité est plus importante que la quantité ; au-delà de 5 minutes de discours téléchargé, les améliorations sont minimes. Ensuite, donnez-lui un nom, sélectionnez des balises, rédigez une courte description, et vous avez terminé.
Outils IA pour la création de voix
Les deux outils vous permettent de créer de nouvelles voix à partir de zéro. C'est une excellente alternative aux voix de stock ou au clonage, lorsque vous souhaitez un son complètement nouveau et unique.
Générations de texte IA d'Elevenlabs
Les fonctionnalités de Conception de Voix d'ElevenLabs vous permettent de créer de nouvelles voix et du contenu audio en définissant le sexe, l'âge, l'accent et la force de l'accent. Vous pouvez sauvegarder la voix dans la Bibliothèque de Voix pour l'utiliser à nouveau et la partager avec d'autres. De nouvelles voix sont générées à chaque fois, donc même si quelqu'un d'autre sélectionne exactement les mêmes paramètres, le résultat ne sera pas le même.
Dans Kits AI, vous pouvez créer des voix personnalisées en utilisant le Mélangeur de Voix. Au lieu de plusieurs paramètres, vous sélectionnez simplement deux voix à combiner et définissez un rapport de mélange. Vous pouvez mélanger deux voix de stock, des voix entraînées, ou une de chaque. Les voix mélangées seront sauvegardées sous Mes Voix, afin que vous puissiez les utiliser pour des conversions de texte en parole ou de chant.
Fonctionnalités uniques qui font de Kits le meilleur générateur de voix IA
Chaque outil a des applications majeures qui répondent à leur utilisateur cible. Sur Kits, les producteurs de musique, chanteurs et musiciens ont accès à un supresseur vocal IA, qui peut extraire le chanteur de musique mixte, et le solo dans un fichier net.
Kits propose également des voix instrumentales, y compris la guitare, la basse, le saxophone, et plus. Celles-ci vous permettent de générer des mélodies téléchargées en tant qu'instruments et de peaufiner vos créations. Vous ne jouez pas du violoncelle ? Pas besoin d'engager un violoncelliste ni même d'utiliser des instruments MIDI. Chantez simplement la partie de violoncelle dans Kits et générez-la dans la voix du Violoncelle !
La caractéristique la plus unique d'ElevenLabs est le doublage vidéo IA. Téléchargez un fichier vidéo ou un lien de réseau social, puis choisissez une langue cible. ElevenLabs détectera la langue originale et le nombre de locuteurs, puis doublera automatiquement la vidéo dans l'une des 29 langues cibles, y compris l'anglais, l'espagnol et le grec -- tout en préservant le caractère individuel de la voix de chaque locuteur. C'est un changement de jeu pour les créateurs de contenu visant un public mondial.
Conclusion
La parole générée par IA prend le dessus sur la création de contenu, et la technologie s'améliore chaque jour. Les outils de narration et de voix off générés par IA comme ElevenLabs sont déjà monnaie courante sur les réseaux sociaux, et les chanteurs IA de Kits deviennent la prochaine grande tendance dans la production musicale. Les deux offrent la synthèse vocale et la génération parole à parole, le clonage vocal, la création de voix, et plus.
Alors lequel est fait pour vous ? Cela dépend vraiment de parler ou de chanter. ElevenLabs offre de nombreuses voix, de longues limites de caractères et une personnalisation détaillée, ce qui le rend parfait pour le meilleur contenu parlé et le doublage. Pour le chant et la musique, Kits l'emporte facilement. Avec des voix de stock libres de droits pour chaque genre et style, des formats natifs DAW, un supresseur vocal, des voix instrumentales, et plus, vous pouvez créer vos propres voix alimentées par IA pour votre musique avec Kits.