Como o Kits AI Fonteia Conjuntos de Dados de Treinamento de IA, Eticamente
Written by
Published on
11 de abril de 2024
Kits é uma organização de músicos e vocalistas em primeiro lugar. Entendemos o debate sutil entre artistas e ferramentas de IA que utilizam sua semelhança ou informam seu processo criativo, e quão valioso é apoiar os artistas no processo de construção de nossa tecnologia. Acompanhamos de perto o trabalho da Artista Rights Alliance, que insta as empresas de tecnologia a pararem de usar IA que infringe os direitos dos artistas, e apoiamos com orgulho a missão da ARA de priorizar a ética e queremos compartilhar como e por que nossas práticas de obtenção de dados apoiam o trabalho de músicos e criativos.
Como Modelos de Voz São Criados
Vamos discutir rapidamente como funcionam os modelos de voz de IA. Cada voz de IA no Kits é um modelo de IA exclusivamente ajustado. Para imitar uma voz real, o modelo treina em conjuntos de dados de áudio de referência. Idealmente, esse conjunto de dados consiste em 30 minutos de vocais secos de alta qualidade. Cada modelo do Kits utiliza um conjunto de dados vocais, resultando em um modelo de voz o mais próximo possível do original.
Nosso Biblioteca de Voz de IA no Kits está em constante crescimento, e para cada modelo, obtemos conjuntos de dados vocais de alta qualidade para treinar nossos modelos. É fácil fazer isso de forma irresponsável e encontrar conjuntos de dados que não foram aprovados pelos artistas nem os apoiam de qualquer maneira. Então, como abordamos isso de forma responsável?
Muitas plataformas de voz de IA simplesmente coletam vocais da web e apressam o treinamento de modelos, visando a pura quantidade. Essa abordagem não é apenas antiética, mas também coloca os usuários finais em risco significativo.
Se um usuário converte com um modelo de voz não conforme, qualquer coisa que criar pode enfrentar violações de direitos autorais e notificações de remoção. Isso significa que as vozes dos artistas são usadas sem consentimento, e qualquer trabalho criado com esses modelos também está em risco.
Como o Kits Obtém Nossos Dados de Treinamento, Eticamente
Os modelos Kits treinam exclusivamente com dados vocais para os quais adquirimos plenos direitos. Começamos entrando em contato com vocalistas de sessão e parceiros de estúdio interessados em fornecer conjuntos de dados vocais. Educamos os provedores sobre o treinamento de modelos de IA e criamos contratos para compensá-los e adquirir adequadamente seus conjuntos de dados vocais.
No lado do provedor, esse acordo garante que os vocalistas entendam as nuances da tecnologia de voz de IA e recebam compensação por quaisquer vocais que forneçam. Do lado do Kits, isso garante que qualquer modelo que você utilize da Biblioteca Kits foi obtido de maneira justa e você, como usuário final, retém plenos direitos sobre qualquer trabalho criado com esse modelo agora e no futuro.
Começamos o Kits para mostrar aos artistas e à indústria da música como a tecnologia de voz de IA pode ser usada para o bem, e ainda há muito trabalho a ser feito. Nos próximos meses, compartilharemos mais sobre como estamos desenvolvendo ferramentas inovadoras para ajudar a colocar os artistas no banco do motorista de sua própria propriedade intelectual e ajudar a informar o futuro da tecnologia de voz de IA.
Você é um artista buscando compartilhar sua voz com o mundo de forma segura, ética e com compensação? Adoraríamos ouvir de você! Entre em contato conosco em outreach@kits.ai.
Atenciosamente,
A Equipe Kits