연구

윤리적 AI 개발

2024년 12월 9일

아나스타시아 헤루스에 의해

2023년에 Kits.AI가 출범했을 때, 음악 산업은 AI에 대한 흥분과 우려로 혼란스러웠습니다. AI로 생성된 트랙 Heart on My Sleeve (The Weeknd x Drake AI Clones)와 같은 바이럴 순간은 다음과 같은 양극화된 논의를 촉발했습니다: AI는 예술에 대한 위협인가, 아니면 강력한 새로운 도구인가?

이 게시물은 Kits.AI가 개발한 윤리적 프레임워크를 소개하여 이러한 회색 영역을 탐색하고 AI 혁신이 예술가, 개발자 및 청취자 모두에게 이익이 되도록 하는 방법을 설명합니다.

오픈 소스 (RVC)

0:00/1:34

“Weathered fences / summer's ended / with my friends and never better.”

0:00/1:34

“Something about the way you sound / when you sing out of the blue.”

0:00/1:34

“As I was sleeping on your couch, you woke up to see him out, oh…”

0:00/1:34

“We will wake up with the sun, cause now we know just who we’re living for”

0:00/1:34

“This one goes out to the team, without you what would I be”

0:00/1:34

위의 이미지는 AI 모델의 단일 레이어를 구성하는 약 20,000개의 개별 값 또는 '가중치'를 포함하고 있습니다. 이러한 매개변수 각각은 모델이 의도한 작업(음성을 변환하거나 새로운 소리를 생성하는 등)을 수행하는 능력이 향상됨에 따라 훈련 중에 수천 번 조정됩니다. 단일 모델은 종종 30-50개 이상의 레이어를 포함합니다.

Beyond that, we’re able to achieve higher fidelity vocal output over other text-to-audio generative models by leveraging modules from Kits Voice Conversion (KVC). Integrating the content encoder, content retrieval, and stable pitch extraction from KVC fixes pronunciation artifacts and pitch inconsistency that are often present in other generative vocal outputs.

Additionally, this gives users control over the timbre and style of their target voice.

회색 지대를 항해하기

From talking with hundreds of producers, artists, and vocalists in the Kits community, we believe generative music tools are most powerful working in the context of a music workflow. As such, future research will move us towards additional musical conditioning signals such as instrumental tracks, pitch curves, MIDI sequences, BPM, and style prompts. We see KGV1 as the first step towards a generative musical intelligence that fits directly into the creative workflow.

KGV1 will soon be available in private beta at app.kits.ai.