Voice Model Creation

Create the best possible voice model by creating a high-quality dataset using the tips below.

Voice Model Creation

Create the best possible voice model by creating a high-quality dataset using the tips below.

Voice Model Creation

Create the best possible voice model by creating a high-quality dataset using the tips below.

How to create your dataset.

How to create your dataset.

건조한(효과 없이) 모노포닉(한 번에 하나의 음표) 보컬을 총 30-60분 모으세요.

- 반향, 딜레이, 코러스, 악기 연주 등 없어야 합니다.
- 하모니, 레이어링, 더블 트래킹, 스테레오 효과 등 없어야 합니다.
- 보컬 스타일에 변화가 없어야 합니다. 예: 노래 부르기만 하는 것이나 랩만 하는 것 둘 다 아닌 경우.

나쁜 보컬

나쁜 보컬

나쁜 보컬

스테레오, 리버브, 딜레이

0:00/1:34

좋은 보컬

좋은 보컬

좋은 보컬

모노, 깨끗한 음색, 낮은 소음

파일을 준비 중입니다.

정적 음성 일정한 볼륨으로 파일을 16-bit 무손실 오디오 파일 (.wav 선호)로 내보내세요.

이전: 침묵, 일관되지 않은 음량 수준

이후: 줄임말되어 있는 조용함, 일정한 볼륨

Once you’ve compiled your vocals, the next step is to prepare your files for training:

한 번 음성을 모은 후 다음 단계는 파일을 훈련하기 위해 준비하는 것입니다:

  • 모든 추가적인 침묵을 제거합니다 (우리는 이 작업을 Audacity로 자동으로 권장합니다)

  • 진정한 모노로 내보냅니다 (왼쪽 + 오른쪽 채널이 동등한 스테레오가 아닌)

  • 16비트 .wav 파일로 내보냅니다 (오디오 길이 요구 사항 없음, 15분짜리 파일이거나 1분짜리 파일이 15개여도 괜찮음)

오디오디티를 사용하여 모노로 변환하고 침묵을 제거하는 방법

데이터셋에서 보컬을 분리하는 Kits.AI 음성 분리 도구를 사용하세요.

노래에서 보컬을 분리하려면 간단히 파일을 업로드하거나 YouTube 링크를 키츠.AI 보컬 분리 도구에 붙여넣기하세요. 이것은 자신의 데이터셋을 만드는 쉬운 방법입니다.

Advanced dataset techniques.

고음질을 위해 오디오를 사전 처리하십시오.

당신의 오디오는 다음과 같습니다:

- 레코딩에서 거친 또는 심하게 파장이 있는 주파수를 줄이기 위해 정제된(clean EQd) 상태

- 보케스트일 부분이 아닌 한 (느린 어택, 적당한 강도로) 약간의 음 높이 수정

- 가돌성 스피릿을 줄이기 위해 데-싿 처리

- (-6db의 픽 값으로) 동적 범위를 줄이거나 피크를 완화하기 위해 약간의 압축

- 보케스트일에 맞게 설정하기 위해 강화된 (추가적인 EQd) 상태

- -6db의 피크값으로 최대 -6에서 -12db 사이의 전체 레벨로 제한

- 40hz~100hz 미만 및 20khz 이상의 주파수를 제거하기 위해 하이/로우 패스 처리

- 위상을 재균형

당신 자신의 보컬을 녹음하세요.

모델 녹음을 하고 있나요? 시작하는 데 도움이 될 구성 몇 가지:

- 넓은 주파수 범위(40hz–20khz)를 갖춘 고품질 마이크를 사용하세요

- 녹음 샘플률을 48khz로 설정하고 손실 없는 파일 형식(.wav, .aiff, .flac)으로 저장하세요

- 숨소리를 제한하고 깨끗한 음색을 캡처하기 위해 노력하세요(파탄음 피하기, 마이크를 축에 맞게 배치하거나 숨소리가 많은 스타일로 노래를 부를 경우 팝 필터 사용)

- 방 반사를 피하세요(카펫과 가구 같은 부드러운 표면의 방에서 녹음, 마이크를 벽에서 떨어뜨리고 입력 이득을 줄이기 위해 가까이서 녹음, 녹음 소리를 흡수하기 위해 가까이서 녹음)

- 녹음 볼륨을 모니터링하여 -6db dBFS를 초과하지 않도록 하세요. 레벨을 -12에서 -6 dBFS 사이로 유지하세요

- 오디오를 진정한 단일 단조로 내보내세요(좌측과 우측 채널이 동일한 스테레오 대신)

- 오디오에 갑작스러운 절단을 피하세요(영점을 통과하기 전 또는 후에 오디오를 자르면 나오는 폭발음을 피하기 위해 짧은 페이드아웃을 추가하세요)

콘텐츠

더 많은 다양성이 좋습니다.

전체 음역대를 커버하는 예시가 가장 좋습니다. 가슴음, 혼합음, 펠셋토; 넓고 짧은 간격; 격조와 깨끗한 음; 등이 필요합니다. 다양성이 더 많을수록 좋습니다.

동일한 가사를 다른 음으로 불러볼 수도 있고, 레퍼토리에서 여러 곡, 자작곡 등도 노래할 수 있습니다. 음원은 여러 파일에 나누어 저장되어도 되고, 하나의 연속된 녹음으로도 상관 없습니다 — 노래하는 시간만 10–15분이 되면 됩니다.

Techniques

참 모노로 변환하는 방법

무료 프로그램 오디시티를 사용하여 스테레오 파일을 진정한 모노로 변환하세요.

침묵을 제거하는 방법

무료 Audacity 프로그램을 사용하여 아카펠라에서 고요한 부분을 빠르게 제거하세요.

(이 비디오의 설정을 복사하지만 자유롭게 실험해보세요. 아카펠라의 소음 수준에 따라 -20db에서 -40db 사이의 임계값을 선택하세요.)

FAQ

Q: 모델 훈련에는 얼마나 시간이 걸리나요?

데이터 크기에 따라 모델 교육에는 30분에서 몇 시간이 걸릴 수 있습니다! 걱정하지 마세요. 자신의 목소리 만들기 대시보드에서 교육 중이라면 곧 모델이 완료될 것입니다.

Q: 모델 훈련에는 얼마나 시간이 걸리나요?

데이터 크기에 따라 모델 교육에는 30분에서 몇 시간이 걸릴 수 있습니다! 걱정하지 마세요. 자신의 목소리 만들기 대시보드에서 교육 중이라면 곧 모델이 완료될 것입니다.

Q: 모델 훈련에는 얼마나 시간이 걸리나요?

데이터 크기에 따라 모델 교육에는 30분에서 몇 시간이 걸릴 수 있습니다! 걱정하지 마세요. 자신의 목소리 만들기 대시보드에서 교육 중이라면 곧 모델이 완료될 것입니다.

Q: 내 모델이 업로드하는 데 영원히 걸리고 있어요! 무슨 일이죠?

만약 큰 파일을 업로드하는 경우, 백엔드에서 데이터를 업로드하는 데 시간이 오래 걸립니다. 그냥 “업로드”를 누르고 참으면 결국 처리될 거에요. 업로드하는 동안 페이지를 새로고치지 않도록 주의하세요.

Q: 내 모델이 업로드하는 데 영원히 걸리고 있어요! 무슨 일이죠?

만약 큰 파일을 업로드하는 경우, 백엔드에서 데이터를 업로드하는 데 시간이 오래 걸립니다. 그냥 “업로드”를 누르고 참으면 결국 처리될 거에요. 업로드하는 동안 페이지를 새로고치지 않도록 주의하세요.

Q: 내 모델이 업로드하는 데 영원히 걸리고 있어요! 무슨 일이죠?

만약 큰 파일을 업로드하는 경우, 백엔드에서 데이터를 업로드하는 데 시간이 오래 걸립니다. 그냥 “업로드”를 누르고 참으면 결국 처리될 거에요. 업로드하는 동안 페이지를 새로고치지 않도록 주의하세요.

Q: 에러를 발견했을 때 어떻게 해야 하나요?

A: 만약 업로드 중에 오류를 발견하면 버그 양식으로 연락해주세요!

A: 만약 업로드 중에 에러를 보게 되면, 저희에게 연락해주세요. 버그 제보 양식으로 연락해주세요!

A: 만약 업로드 중에 오류가 발생하면 저희 버그 제보 양식으로 연락해주세요!

무료로 시작하세요. 신용카드가 필요하지 않습니다.

Streamline your vocal production workflow with Kits AI's free plan. Convert a voice and hear what's possible.

무료로 시작하세요. 신용카드가 필요하지 않습니다.

Streamline your vocal production workflow with Kits AI's free plan. Convert a voice and hear what's possible.

무료로 시작하세요. 신용카드가 필요하지 않습니다.

Streamline your vocal production workflow with Kits AI's free plan. Convert a voice and hear what's possible.