PESQUISA
Desenvolvimento de IA Ética
9 de dezembro de 2024
por Anastasiia Herus
Quando Kits.AI foi lançado em 2023, a indústria da música estava frenética com excitação e apreensão em relação à IA. Momentos virais como a faixa gerada por IA Coração na Minha Manga (The Weeknd x Drake IA Clones) amplificaram um debate polarizado: A IA é uma ameaça para a arte ou uma nova ferramenta poderosa?
Este post apresenta a estrutura ética que a Kits.AI desenvolveu para navegar nessas áreas cinzentas e garantir que a inovação em IA beneficie artistas, desenvolvedores e ouvintes.
Código Aberto (RVC)
“Weathered fences / summer's ended / with my friends and never better.”
“Something about the way you sound / when you sing out of the blue.”
“As I was sleeping on your couch, you woke up to see him out, oh…”
“We will wake up with the sun, cause now we know just who we’re living for”
“This one goes out to the team, without you what would I be”
A imagem acima contém cerca de 20.000 valores individuais, ou "pesos", que compõem uma única camada em um modelo de IA. Cada um desses parâmetros é ajustado milhares de vezes durante o treinamento, à medida que o modelo melhora em cumprir sua tarefa pretendida (converter vocais, gerar novos sons, etc). Um único modelo geralmente contém de 30 a 50+ camadas.
Beyond that, we’re able to achieve higher fidelity vocal output over other text-to-audio generative models by leveraging modules from Kits Voice Conversion (KVC). Integrating the content encoder, content retrieval, and stable pitch extraction from KVC fixes pronunciation artifacts and pitch inconsistency that are often present in other generative vocal outputs.
Additionally, this gives users control over the timbre and style of their target voice.
Navegando na área cinza
…
From talking with hundreds of producers, artists, and vocalists in the Kits community, we believe generative music tools are most powerful working in the context of a music workflow. As such, future research will move us towards additional musical conditioning signals such as instrumental tracks, pitch curves, MIDI sequences, BPM, and style prompts. We see KGV1 as the first step towards a generative musical intelligence that fits directly into the creative workflow.
KGV1 will soon be available in private beta at app.kits.ai.