Voice Model Creation

Create the best possible voice model by creating a high-quality dataset using the tips below.

Voice Model Creation

Create the best possible voice model by creating a high-quality dataset using the tips below.

Voice Model Creation

Create the best possible voice model by creating a high-quality dataset using the tips below.

How to create your dataset.

How to create your dataset.

Reúna de 30 a 60 minutos totales de voces secas (sin efectos) y monofónicas (una nota a la vez).

- Sin reverberación, delay, chorus o instrumentos,
- Sin armonías, capas, doblajes, efectos estéreo.
- Sin variación en los estilos vocales. Por ejemplo, solo cantar o solo rapear pero no ambos.

Malas voces

Malas voces

Malas voces

Estéreo, reverberación, retardo

0:00/1:34

Buenas voces

Buenas voces

Buenas voces

Mono, tono limpio, bajo ruido

Preparando tu(s) archivo(s).

Exporta tus archivos sin silencio y con volumen consistente como un archivo de audio lossless de 16 bits (preferiblemente .wav).

Antes: silencio, niveles de volumen inconsistentes

Después: silencio truncado, volumen consistente

Once you’ve compiled your vocals, the next step is to prepare your files for training:

Una vez que hayas compilado tus vocales, el siguiente paso es preparar tus archivos para el entrenamiento:

  • Elimina cualquier silencio adicional (recomendamos hacer esto automáticamente con Audacity)

  • Exporta como verdadero mono (en lugar de estéreo con canales L + R iguales)

  • Exporta como .wav de 16 bits (sin requisitos de duración de audio, puede ser un archivo de 15 minutos o 15 archivos de 1 minuto)

Cómo convertir a mono y eliminar el silencio con Audacity

Utilice la herramienta de separación vocal Kits.AI para aislar las voces de su conjunto de datos.

Para aislar la voz de una canción, simplemente carga un archivo o pega un enlace de YouTube en la herramienta Separador Vocal de Kits.AI. Esta es una forma fácil de crear tu propio conjunto de datos.

Advanced dataset techniques.

Prepare su audio antes para obtener una calidad superior.

Su audio puede ser:

- limpio EQd (sustractivo) para reducir frecuencias opacas o ásperas en la grabación

- sutilmente corregido de tono (ataque lento, fuerza moderada) a menos que sea una parte clave del estilo vocal

- De-essed para reducir cualquier sibilancia áspera

- comprimido ligeramente para nivelar el rango dinámico/reducir picos (~4-5db de reducción como máximo)

- realzado (EQd aditivo) para adaptarse al estilo vocal

- limitado a un pico de -6db con niveles generales entre -6 y -12db.

- paso alto/bajo para eliminar frecuencias por debajo de 40hz–100hz y por encima de 20khz

- reequilibrado de fase

Graba tu propia voz.

¿Grabando voces para tu modelo? Aquí tienes algunas configuraciones para comenzar:

- Utiliza un micrófono de calidad con un amplio rango de frecuencia (40hz–20khz)

- Configura tu frecuencia de muestreo de grabación a 48khz y el tipo de archivo a sin pérdida (.wav, .aiff, .flac)

- Limita los sonidos de respiración e intenta capturar un tono limpio (evita las oclusivas, coloca el micrófono fuera del eje y/o utiliza un filtro antipop si cantas con un estilo susurrante)

- Evita las reflexiones de la habitación (graba en una habitación con superficies suaves como alfombras y muebles para absorber el sonido, coloca los micrófonos lejos de las paredes, acércate y reduce tu ganancia de entrada)

- Supervisa el volumen de tu grabación y evita exceder -6db dBFS. Intenta mantener tus niveles entre -12 y -6 dBFS.

- Exporta tu audio como verdadero mono (en lugar de estéreo con canales L + R iguales)

- Evita cualquier corte brusco en el audio (agrega un breve desvanecimiento para evitar los chasquidos que provienen de cortar el audio antes o después de un cruce por cero)

Contenido

Más variedad, mejor.

Es mejor tener ejemplos que abarquen todo tu rango. Pecho, mix, falsete; intervalos grandes y cortos; notas ásperas y limpias; etc. Cuanta más variedad, mejor.

Puedes cantar las mismas letras en diferentes tonos, un par de canciones de tu repertorio, originales, etc. El audio puede estar en varios archivos o en una toma única, siempre y cuando el tiempo de canto sume 10-15 minutos.

Techniques

Cómo convertir a True Mono

Utilice el programa gratuito Audacity para convertir archivos estéreo a verdadero mono.

Cómo eliminar el silencio

Utilice el programa gratuito Audacity para eliminar rápidamente el silencio de un acapella.

(Copie la configuración de este video, pero siéntase libre de experimentar. Elija un umbral entre -20db y -40db dependiendo del nivel de ruido de su acapella.)

FAQ

P: ¿Cuánto tiempo lleva el entrenamiento del modelo?

Según el tamaño de tus datos, el entrenamiento del modelo podría tomar desde 30 minutos hasta varias horas. ¡Pero no te preocupes! Mientras veas 'Entrenamiento' en tu panel de creación de voces, tu modelo terminará pronto.

P: ¿Cuánto tiempo lleva el entrenamiento del modelo?

Según el tamaño de tus datos, el entrenamiento del modelo podría tomar desde 30 minutos hasta varias horas. ¡Pero no te preocupes! Mientras veas 'Entrenamiento' en tu panel de creación de voces, tu modelo terminará pronto.

P: ¿Cuánto tiempo lleva el entrenamiento del modelo?

Según el tamaño de tus datos, el entrenamiento del modelo podría tomar desde 30 minutos hasta varias horas. ¡Pero no te preocupes! Mientras veas 'Entrenamiento' en tu panel de creación de voces, tu modelo terminará pronto.

P: ¡Mi modelo está tardando una eternidad en cargar! ¿Qué está sucediendo?

Si estás subiendo un archivo grande, tarda mucho tiempo en subir los datos en nuestro servidor. Simplemente presiona “Subir” y ten paciencia; se procesará eventualmente. Asegúrate de no refrescar la página durante la carga.

P: ¡Mi modelo está tardando una eternidad en cargar! ¿Qué está sucediendo?

Si estás subiendo un archivo grande, tarda mucho tiempo en subir los datos en nuestro servidor. Simplemente presiona “Subir” y ten paciencia; se procesará eventualmente. Asegúrate de no refrescar la página durante la carga.

P: ¡Mi modelo está tardando una eternidad en cargar! ¿Qué está sucediendo?

Si estás subiendo un archivo grande, tarda mucho tiempo en subir los datos en nuestro servidor. Simplemente presiona “Subir” y ten paciencia; se procesará eventualmente. Asegúrate de no refrescar la página durante la carga.

P: ¿Qué hago si veo un error?

A: Si ves un error durante la carga, contáctanos en nuestro formulario de errores!

Comience, gratis. No se requiere tarjeta de crédito.

Nuestro plan gratuito te permite ver cómo Kits puede ayudar a optimizar tu flujo de trabajo vocal y de audio. Cuando estés listo para dar el siguiente paso, los planes de pago comienzan desde $9.99 al mes.

Comience, gratis. No se requiere tarjeta de crédito.

Nuestro plan gratuito te permite ver cómo Kits puede ayudar a optimizar tu flujo de trabajo vocal y de audio. Cuando estés listo para dar el siguiente paso, los planes de pago comienzan desde $9.99 al mes.

Comience, gratis. No se requiere tarjeta de crédito.

Nuestro plan gratuito te permite ver cómo Kits puede ayudar a optimizar tu flujo de trabajo vocal y de audio. Cuando estés listo para dar el siguiente paso, los planes de pago comienzan desde $9.99 al mes.