RECHERCHE
Développement éthique de l'IA
9 décembre 2024
par Anastasiia Herus
Lorsque Kits.AI a été lancé en 2023, l'industrie musicale était frénétique d'excitation et d'appréhension à propos de l'IA. Des moments viraux comme le morceau généré par IA Heart on My Sleeve (The Weeknd x Drake IA Clones) ont amplifié un débat polarisé : L'IA est-elle une menace pour l'art ou un nouvel outil puissant ?
Ce post présente le cadre éthique que Kits.AI a développé pour naviguer dans ces zones grises et garantir que l'innovation en IA bénéficie aux artistes, aux développeurs et aux auditeurs.
Source Ouverte (RVC)
« Des clôtures vieillies / l'été est fini / avec mes amis et jamais mieux. »
« Quelque chose dans la façon dont tu sonnes / quand tu chantes à l'improviste. »
« Alors que je dormais sur ton canapé, tu t'es réveillé pour le voir partir, oh... »
« Nous nous réveillerons avec le soleil, car maintenant nous savons pour qui nous vivons. »
« Ceci est pour l'équipe, sans vous que serais-je ? »
L'image ci-dessus contient environ 20 000 valeurs individuelles, ou "poids", qui composent une seule couche d'un modèle d'IA. Chacun de ces paramètres est ajusté des milliers de fois pendant l'entraînement à mesure que le modèle s'améliore pour accomplir sa tâche prévue (convertir des voix, générer de nouveaux sons, etc.). Un seul modèle contient souvent 30 à 50 couches ou plus.
Au-delà de cela, nous sommes en mesure d'obtenir une sortie vocale de plus haute fidélité par rapport à d'autres modèles génératifs de texte à audio en tirant parti des modules de Kits Voice Conversion (KVC). L'intégration de l'encodeur de contenu, de la récupération de contenu et de l'extraction de hauteur stable de KVC corrige les artefacts de prononciation et l'incohérence de hauteur qui sont souvent présents dans d'autres sorties vocales génératives.
De plus, cela donne aux utilisateurs le contrôle sur le timbre et le style de leur voix cible.
Naviguer dans la zone grise
…
En parlant avec des centaines de producteurs, artistes et vocalistes de la communauté Kits, nous croyons que les outils de musique générative sont les plus puissants lorsqu'ils fonctionnent dans le contexte d'un flux de travail musical. Ainsi, les recherches futures nous orienteront vers des signaux de conditionnement musical supplémentaires tels que des morceaux instrumentaux, des courbes de hauteur, des séquences MIDI, le BPM et des incitations de style. Nous voyons KGV1 comme le premier pas vers une intelligence musicale générative qui s'intègre directement dans le flux de travail créatif.
KGV1 sera bientôt disponible en version bêta privée sur app.kits.ai.