INVESTIGACIÓN

Desarrollo ético de IA

9 de diciembre de 2024

por Anastasiia Herus

Cuando Kits.AI se lanzó en 2023, la industria musical estaba frenética con emoción y aprensión sobre la IA. Momentos virales como la pista generada por IA Heart on My Sleeve (Los Clones de IA de The Weeknd x Drake) amplificaron un debate polarizado: ¿Es la IA una amenaza para el arte o una poderosa nueva herramienta?

Esta publicación presenta el marco ético que Kits.AI ha desarrollado para navegar por estas áreas grises y garantizar que la innovación en inteligencia artificial beneficie a artistas, desarrolladores y oyentes por igual.

Código Abierto (RVC)

0:00/1:34

"Cercas desgastadas / el verano ha terminado / con mis amigos y nunca mejor."

0:00/1:34

“Algo sobre la forma en que suenas / cuando cantas sin previo aviso.”

0:00/1:34

“Mientras dormía en tu sofá, te despertaste para verlo salir, oh…”

0:00/1:34

“Despertaremos con el sol, porque ahora sabemos para quién vivimos”

0:00/1:34

“Este va para el equipo, sin ustedes ¿qué sería yo?”

0:00/1:34

La imagen de arriba contiene alrededor de 20,000 valores individuales, o "pesos", que conforman una sola capa en un modelo de IA. Cada uno de estos parámetros se ajusta miles de veces durante el entrenamiento a medida que el modelo mejora en cumplir con su tarea prevista (convertir voces, generar nuevos sonidos, etc.). Un solo modelo a menudo contiene entre 30 y 50 capas o más.

Más allá de eso, podemos lograr una mayor fidelidad en la salida vocal en comparación con otros modelos generativos de texto a audio, aprovechando módulos de la Conversión de Voz de Kits (KVC). La integración del codificador de contenido, la recuperación de contenido y la extracción de tono estable de KVC corrige los artefactos de pronunciación y la inconsistencia de tono que a menudo están presentes en otras salidas vocales generativas.

Además, esto le da a los usuarios el control sobre el timbre y el estilo de su voz objetivo.

Navegando por el área gris

Al hablar con cientos de productores, artistas y vocalistas en la comunidad de Kits, creemos que las herramientas de música generativa son más poderosas trabajando en el contexto de un flujo de trabajo musical. Como tal, la investigación futura nos llevará hacia señales adicionales de acondicionamiento musical, como pistas instrumentales, curvas de tono, secuencias MIDI, BPM y prompts de estilo. Vemos KGV1 como el primer paso hacia una inteligencia musical generativa que encaja directamente en el flujo de trabajo creativo.

KGV1 estará disponible pronto en beta privada en app.kits.ai.