Como o Kits AI Fonteia Conjuntos de Dados de Treinamento de IA, Eticamente
Escrito por
Publicado em
11 de abril de 2024
Kits é uma organização de músicos e vocalistas em primeiro lugar. Entendemos o debate sutil entre artistas e ferramentas de IA que usam sua semelhança ou informam seu processo criativo, e quão valioso é apoiar artistas no processo de construir nossa tecnologia. Acompanhamos de perto o trabalho da Artista Rights Alliance, que instiga as empresas de tecnologia a parar de usar IA que infringe os direitos dos artistas, e apoiamos orgulhosamente a missão da ARA de priorizar a ética e queremos compartilhar como e por que nossas práticas de obtenção de dados apoiam o trabalho de músicos e criativos.
Como Modelos de Voz São Criados
Vamos discutir rapidamente como os modelos de voz de IA funcionam. Cada voz de IA no Kits é um modelo de IA exclusivamente ajustado. Para imitar uma voz real, o modelo é treinado em conjuntos de dados de áudio de referência. Idealmente, esse conjunto de dados compreende 30 minutos de vocais secos de alta qualidade. Cada modelo Kits utiliza um conjunto de dados vocais, resultando em um modelo de voz o mais próximo possível do original.
Nossa Biblioteca de Voz AI no Kits está crescendo continuamente, e para cada modelo, nós selecionamos conjuntos de dados vocais de alta qualidade para treinar nossos modelos. É fácil fazer isso de maneira irresponsável e encontrar conjuntos de dados que não foram aprovados por artistas nem os apoiam de qualquer forma. Então, como abordamos isso de forma responsável?
Muitas plataformas de voz de IA simplesmente raspam vocais da web e se apressam em treinar modelos, visando apenas a quantidade. Essa abordagem não é apenas antiética, mas também coloca os usuários finais em risco significativo.
Se um usuário converter com um modelo de voz não conforme, qualquer coisa que criar pode enfrentar violações de direitos autorais e notificações de remoção. Isso significa que as vozes dos artistas são usadas sem consentimento, e qualquer trabalho criado com esses modelos também está em risco.
Como Kits Obtém Nossos Dados de Treinamento, Eticamente
Os modelos Kits são treinados exclusivamente com dados vocais para os quais adquirimos direitos totais. Começamos entrando em contato com vocalistas de sessão e parceiros de estúdio interessados em fornecer conjuntos de dados vocais. Educamos os fornecedores sobre o treinamento de modelos de IA e criamos contratos para compensá-los e adquirir corretamente seus conjuntos de dados vocais para priorizar uma abordagem ética para obtenção de dados.
No lado do fornecedor, esse acordo garante que os vocalistas compreendam as sutilezas da tecnologia de Voz AI e recebam compensação por quaisquer vocais que fornecerem. Do lado do Kits, isso garante que qualquer modelo que você utilize da Biblioteca Kits tenha sido adquirido de forma justa e você, como usuário final, mantenha direitos totais sobre qualquer trabalho criado com esse modelo agora e no futuro.
Começamos o Kits para mostrar aos artistas e à indústria musical como a tecnologia de Voz AI pode ser usada para o bem, e ainda há muito trabalho a ser feito. Nos próximos meses, compartilharemos mais sobre como estamos desenvolvendo ferramentas inovadoras para ajudar a colocar os Artistas no controle de sua própria Propriedade Intelectual e ajudar a informar o futuro da tecnologia de voz de IA.
Você é um artista que deseja compartilhar sua voz com o mundo de forma segura, ética e com compensação? Adoraríamos ouvir de você! Entre em contato conosco em outreach@kits.ai.
Atenciosamente,
A Equipe Kits