Kits and Descript: 오디오 크리에이터를 위한 AI 도구
Written by
Published on
2024년 3월 19일
인공지능 혁명이 진행된 지난 몇 년 동안, 많은 관심이 시각 예술가를 위해 AI가 할 수 있는 일에 집중되어 왔습니다. 수십억의 사람들이 Dall-E, Midjourney, Photoshop의 생성 채우기 도구와 같은 도구를 실험하여 AI로 이미지를 생성했습니다.
하지만 오디오 프로젝트를 위한 유사한 도구들이 있다는 것을 알고 있었나요? 음악가, 프로듀서, 팟캐스터, 스트리머, 비디오 편집자 등이 AI를 사용하여 작업 흐름의 모든 단계를 향상시킬 수 있습니다.
이 기사에서는 가장 인기 있는 AI 오디오 도구 두 가지를 살펴보겠습니다: Kits, 음악을 위한 AI 보컬 플랫폼과 Descript, AI 기반 팟캐스트 오디오 편집기입니다.
보컬을 위한 Kits AI 도구
Kits는 AI를 사용하여 고품질 오디오를 생성하는 강력한 음악 제작 도구입니다. Kits를 사용하면 한 가수를 다른 가수로 변환하고 가수의 목소리를 복제할 수 있습니다. 창의적인 기회는 무궁무진합니다.
목소리 변환
Kits는 Convert 주위를 중심으로 구축되며, 가수의 목소리를 완전히 다른 목소리로 바꿉니다. 다른 AI 도구들이 이를 음성에 대해 수행하는 동안, Kits는 노래에 대해 이를 제공하는 첫 번째 도구입니다. 결과는 너무 좋아서 고급 스튜디오에서 녹음된 프로 가수로 통과할 수 있어 프로듀서에게 매우 다채로운 도구가 됩니다.
파일을 업로드하거나, YouTube 비디오 링크를 넣거나, 웹 앱에 직접 녹음하세요. 몇 초 안에 당신의 멜로디는 전혀 새로운 가수를 갖게 됩니다!
고급 제어를 사용하여 변환을 미세 조정할 수 있습니다:
더 나은 결과를 위해 녹음에서 인스트루멘탈, 리버브 및 딜레이, 또는 백업 보컬을 제거하십시오.
피치 시프트: 최대 24 반음까지 피치를 올리거나 내리십시오.
변환 강도: 생성에 더 많은 억양과 표현을 추가하지만, 높은 수준에서는 예상치 못한 결과를 초래할 수 있습니다.
볼륨 혼합: 입력 볼륨과 모델 간의 균형을 조정하십시오. 낮은 값은 원래 다이내믹스의 더 많은 부분을 드러냅니다.
전처리 효과: 생성 이전에 노이즈, 저음 및 거칠음을 제거하고, 볼륨을 부드럽게 하거나, 오토튠을 적용하십시오.
후처리 효과: 결과에 압축기, 합창, 리버브 및/또는 딜레이를 적용하십시오.
음성 훈련 튜토리얼
Kits의 가장 미래 지향적인 기능은 음성 훈련입니다. 오디오 파일을 업로드하거나 YouTube 비디오 링크를 붙여넣기만 하면, Kits가 가수의 목소리의 완벽한 클론을 생성할 수 있도록 AI 모델을 훈련시킵니다. 이 새로운 목소리는 변환을 위한 재고 또는 혼합 목소리 대신 사용할 수 있습니다(아래에서 더 자세히 알아보세요).
Kits는 가수를 위한 최고의 음성 훈련 도구를 제공합니다. 다른 AI 도구들은 음성에 대해 제공하지만, Descript는 우리가 아래에서 자세히 다룰 것입니다. 그러나 Descript는 주로 실수를 수정하거나 간단한 텍스트 음성 생성에 이 기능을 사용합니다. Kits는 훈련된 음성 모델을 변환에 사용하여 주요 이점을 제공합니다.
목소리를 훈련시키는 데, Kits는 어떤 녹음 오디오 형식도 허용합니다. 최상의 결과를 위해 10분을 권장하지만 최대 1시간까지 수용합니다. (비교를 위해, Descript는 음성 템플릿으로 사용하기 위해 특정 스크립트를 읽어야 합니다.) 거기서 이름과 사진을 추가한 후 새로운 목소리를 훈련시키세요! 이는 향후 사용을 위해 당신의 음성 라이브러리에 저장됩니다.
음성 라이브러리
Kits는 음성 라이브러리에 50개 이상의 아티스트 목소리를 제공합니다. 각 목소리는 성별과 장르로 이름이 붙여져 있으며, 예를 들어 Male Afro Beat 또는 Female Bedroom Pop와 같습니다. 라이브러리는 피치 범위, 성별 및 장르별로 정렬할 수 있으며, 다른 언어와 세계 음악 스타일에 대한 목소리도 있습니다. 이들은 모두 완전히 저작권이 없는 상태이므로 자유롭게 사용할 수 있습니다.
사운드를 추가로 맞춤 설정하려면 음성 블렌더를 사용하여 두 가지 목소리를 결합할 수 있습니다. 블렌드 비율 슬라이더는 새로운 모델 훈련에 사용할 각 목소리의 비율을 조정합니다.
또한, Kits는 악기, 기타, 베이스, 색소폰, 첼로 등을 제공합니다. 이를 통해 간단하게 악기를 생성할 수 있으며: 자신이 노래하거나 허밍하는 부분을 신속하게 녹음한 다음, 이를 악기 목소리로 변환합니다.
텍스트-투-스피치
Kits는 또한 14개 언어로 텍스트 음성 기능을 제공하여 내레이션, 보이스오버 및 기타 음성 콘텐츠를 위한 것입니다. Kits의 음성 라이브러리는 노래를 위해 캘리브레이션 되므로 결과는 다른 AI보다 자연스러운 경향이 있습니다. 스크립트를 입력하고 피치 범위를 선택한 다음 음성을 생성하세요. 전체 음성 라이브러리를 사용할 수 있으며, 혼합 및 훈련된 목소리도 사용할 수 있습니다.
AI 오디오 향상기
보컬 제거기
Kits의 또 다른 AI 기반 음악 도구는 보컬 제거기입니다. 노래 또는 YouTube 링크를 업로드하면 보컬 제거기는 보컬을 인스트루멘탈 및 다른 배경 소음에서 분리합니다. 고급 설정을 통해 백업 보컬을 제거하고, 리버브, 에코 및 노이즈 감소를 조정할 수 있습니다. AI가 내장된 Kits의 보컬 제거기는 유사한 소리가 겹쳐도 보컬을 정확하게 추출하는 데 전통적인 소프트웨어보다 더 나은 성과를 보입니다.
AI 마스터링
마스터링은 음악 제작 작업 흐름의 최종 단계입니다. 압축, 리미팅, EQ 등이 적용되어 최종 사운드를 완벽하게 하고 개별 트랙이 잘 작동하도록 합니다. 이는 역사적으로 제작에서 가장 어렵고 비싼 요소 중 하나였지만, Kits AI는 심지어 새로운 프로듀서가 몇 초 만에 트랙을 마스터할 수 있도록 합니다.
Kits는 여섯 개의 미리 설정된 마스터링 프리셋을 제공합니다:
가볍고 밝은
베이스 강한
펀치 및 공기
풍부한
테이프 접착제
아날로그 따뜻함
사용자 친화적인 과정은 몇 초 만에 완료되므로, 어떤 것이 가장 잘 작동하는지 실험할 수 있습니다. 또한, Kits가 모델로 사용할 수 있는 참조 트랙을 업로드할 수 있습니다.
Kits는 시장에서 가장 강력한 AI 노래 도구일 뿐만 아니라 현대 음악 프로듀서에게 필수적인 도구입니다. AI를 사용하여 보컬 제작의 각 단계를 향상시켜 더 적은 시간, 더 적은 비용, 그리고 더 많은 창의성으로 더 나은 보컬을 제작할 수 있게 합니다.
Descript: AI 팟캐스트 편집기
Descript 는 팟캐스터를 위한 가장 강력한 도구 중 하나로, 텍스트 기반 팟캐스트 편집기를 중심으로 한 풍부한 AI 오디오 기능을 제공합니다. (Descript는 일부 비디오 콘텐츠 도구도 제공하지만, 여기서 다루지는 않겠습니다.)
잠깐, 텍스트 기반 오디오 편집기? 예, Descript는 당신의 오디오를 자동으로 전사하여 문서처럼 편집할 수 있게 하며, 변경 사항이 오디오에 반영됩니다. 긴 녹음은 몇 초 안에 전사되고 클라우드에 안전하게 저장되며 각 화자는 자동으로 라벨이 붙습니다. 게다가, 22개 언어로 작동합니다. 이 독특한 사용자 경험 위에는 비디오 편집을 위한 다양한 다른 AI 오디오 도구가 있습니다:
AI 목소리
Kits와 마찬가지로, Descript는 텍스트-투-스피치에 사용할 수 있는 재고 목소리를 포함합니다. 총 21개가 있으며, 목소리를 설명하기 위한 태그가 있습니다: 남성적이거나 여성적이며, 젊거나 성인, 또는 나이가 많은 것으로, 억양과 스타일도 포함됩니다.
Descript에는 Kits의 음성 훈련과 유사한 음성 복제 기능도 있습니다. 흥미롭게도 Descript는 당신의 목소리만 복제할 수 있습니다. 이를 확인하기 위해, 특별한 스크립트를 읽는 녹음을 해야 합니다. 당신의 목소리는 텍스트-투-스피치 및 향후 오버더브에 사용할 수 있도록 저장될 수 있습니다.
전사 다시 생성
다시 생성은 본질적으로 미니 보이스 클론을 생성하며(위에 설명된 긴 과정 없이), 그런 다음 녹음 전사에서 선택한 텍스트 조각을 다시 생성합니다. 이는 AI 없이 불가능한 오디오 편집을 가능하게 하며 -- 아마도 Descript의 가장 강력한 기능일 것입니다.
예를 들어, 집에서 녹음하고 있는데 초인종이 울리는 경우를 생각해 보세요. 일반적으로 이 순간을 제거하는 것은 시간이 많이 소요되며, 청취자가 눈치채지 않도록 깨끗하게 수행하는 것은 불가능할 수 있습니다. 그러나 Descript를 사용하면, 전사에서 순간을 찾아 강조 표시한 다음, 바꾸기 → 다시 생성을 클릭하십시오. AI 생성 음성이 원본 녹음의 해당 구간에 매끄럽게 삽입됩니다.
그리고 만약 당신이 친구에게 문을 열라고 부른다면요? 전사에서 불필요한 단어를 쉽게 삭제할 수 있지만, 청취자는 명백한 단절이 남짐을 들을 수 있습니다. 그냥 스플라이스 주변의 문구를 다시 생성하면 AI 목소리가 음조와 억양을 맞춰서 완벽하게 감춰줍니다.
오버더브
대체 메뉴에서 다시 생성 아래에는 오버더브가 있습니다. AI 목소리를 사용하여 편집을 부드럽게 하는 대신, 오버더브는 팟캐스트에 새로운 단어를 삽입합니다. 단어를 잘못 발음했거나, 줄을 놓쳤거나, 또는 그냥 자신을 잘 표현하지 못했다면, 원하지 않는 부분을 즉시 잘라내고 AI 오버더브로 교체할 수 있습니다.
Descript는 다른 화자를 자동으로 식별하므로, 오버더브는 자동으로 올바른 화자와 일치합니다. 게다가, 새로운 오디오는 주변 녹음의 마이크 품질, 배경 소음 및 억양과 일치하게 만들어집니다.
스튜디오 사운드
클릭 한 번으로, 스튜디오 사운드의 알고리즘은 어떤 녹음도 전문 사운드로 만들어 줍니다. 오디오 효과 아래의 스위치를 전환하기만 하면 스튜디오 사운드는 배경 소음에서 목소리를 분리하여 둘 다 향상시킵니다. 강도 슬라이더는 효과가 얼마나 강하게 적용될지를 조절합니다. 목소리는 향상되므로, 심지어 간단한 아이폰 녹음도 고품질 마이크처럼 들립니다. 비디오 파일을 완벽하게 개선하고 배경 소음, 배경 및 방의 에코를 간단하고 직관적인 단계로 제거하십시오.
필러 단어 제거
모든 팟캐스터는 이러한 경험을 해본 적이 있습니다: 에피소드를 녹음하고 나서 훌륭한 결과를 얻었다고 생각합니다. 하지만 다시 들어보면, 당신의 말은 “like”, “um”, 죽은 공기 및 다른 필러로 가득 차 있습니다. 이러한 작은 것들이 당신의 인상에 엄청난 영향을 미칠 수 있습니다.
필러 단어 제거 기능은 Descript에 내장되어 있습니다, 그리고 나머지 기능과 마찬가지로 사용하기 매우 간단합니다. 오디오가 전사되면, 필러 단어는 자동으로 강조 표시됩니다. 별 아이콘을 클릭한 다음, 편집 도구를 사용해 “필러 단어 제거”와 “단어 간격 단축”을 선택하여 당신의 말을 정리하세요.
자신에게 적합한 최고의 AI 도구 찾기
Kits와 Descript는 AI 기반 오디오 제작의 선두주자입니다. 이들의 도구는 당신의 기존 작업 흐름을 간단하고 우아하게 향상시킵니다. 강력한 도구와 강력한 가격, Kits의 음성 변환 및 음성 훈련과 Descript의 텍스트 기반 편집기는 이전에 존재하지 않았던 반응적 가능성을 열어줍니다. 게다가 Kits의 보컬 제거기 및 AI 마스터링과 Descript의 다시 생성 및 필러 단어 제거와 같은 기능은 오디오 제작에서 가장 시간 소모적이고 지루한 측면을 없앱니다. AI 오디오 도구가 당신을 더 나은 창작자로 만들 수 있는 방법은 무엇일까요?