Cómo Kits AI obtiene conjuntos de datos de entrenamiento de IA de forma ética
Escrito por
Publicado el
11 de abril de 2024
Kits es una organización centrada en músicos y vocalistas. Comprendemos el debate matizado entre artistas y herramientas de IA que utilizan su imagen o informan su proceso creativo, y lo valioso que es apoyar a los artistas en el proceso de construir nuestra tecnología. Seguimos de cerca el trabajo de la Artist Rights Alliance instando a las empresas tecnológicas a dejar de usar IA que infringe los derechos de los artistas, y apoyamos con orgullo la misión de la ARA de priorizar la ética y queremos compartir cómo y por qué nuestras prácticas de obtención de datos apoyan el trabajo de músicos y creativos.

Cómo se crean los modelos de voz
Hablemos rápidamente sobre cómo funcionan los modelos de voz de IA. Cada voz de IA en Kits es un modelo de IA afinado de manera única. Para imitar una voz real, el modelo se entrena con conjuntos de datos de referencia de audio. Idealmente, este conjunto de datos comprende 30 minutos de voces secas de alta calidad. Cada modelo de Kits usa un conjunto de datos vocales, resultando en un modelo de voz lo más cercano posible al original.
Nuestra Biblioteca de Voces de IA en Kits está creciendo continuamente, y para cada modelo obtuvimos conjuntos de datos vocales de alta calidad de canto para entrenar nuestros modelos. Es fácil hacer esto de manera irresponsable, encontrando conjuntos de datos que no han sido aprobados por los artistas ni los apoyan de ninguna manera. Entonces, ¿cómo abordamos esto de manera responsable?
Muchas plataformas de voces de IA simplemente extraen voces de la web y se apresuran a entrenar modelos, buscando solo cantidad. Este enfoque no solo es poco ético, sino que también pone a los usuarios finales en un riesgo significativo.
Si un usuario convierte con un modelo de voz no conforme, cualquier cosa que cree podría enfrentar violaciones de derechos de autor y avisos de retirada. Esto significa que las voces de los artistas son utilizadas sin consentimiento, y cualquier trabajo creado con esos modelos también está en riesgo.
Cómo Kits obtiene nuestros datos de entrenamiento, éticamente
Los modelos de Kits entrenan exclusivamente con datos vocales para los cuales adquirimos todos los derechos. Comenzamos contactando a los vocalistas de sesión y socios de estudio interesados en proporcionar conjuntos de datos vocales. Educamos a los proveedores sobre el entrenamiento de modelos de IA y creamos contratos para compensarlos y adquirir correctamente sus conjuntos de datos vocales para priorizar un enfoque ético en la obtención de datos.
Del lado del proveedor, este acuerdo asegura que los vocalistas comprendan los matices de la tecnología de Voces de IA y reciban compensación por las voces que proporcionan. Del lado de Kits, esto asegura que cualquier modelo que uses de la Biblioteca de Kits ha sido obtenido de manera justa y tú, como usuario final, retienes todos los derechos sobre cualquier trabajo creado con ese modelo ahora y en el futuro.

Comenzamos Kits para mostrar a los artistas y a la industria musical cómo la tecnología de Voces de IA puede utilizarse para el bien, y todavía queda mucho por hacer. En los próximos meses, compartiremos más sobre cómo estamos desarrollando herramientas innovadoras para ayudar a poner a los artistas en el asiento del conductor de su propia propiedad intelectual y ayudar a informar el futuro de la tecnología de voces de IA.
¿Eres un artista buscando compartir tu voz con el mundo de forma segura, ética y con compensación? ¡Nos encantaría saber de ti! Por favor, contáctanos en outreach@kits.ai.
Saludos,
El equipo de Kits