Cómo Kits AI obtiene conjuntos de datos de entrenamiento de IA de forma ética
Escrito por
Publicado el
11 de abril de 2024
Kits es una organización de músicos y vocalistas en primer lugar. Comprendemos el matizado debate entre los artistas y las herramientas de IA que utilizan su semejanza o informan su proceso creativo, y lo valioso que es apoyar a los artistas en el proceso de construir nuestra tecnología. Seguimos de cerca el trabajo de la Artist Rights Alliance instando a las empresas tecnológicas a dejar de usar IA que infringe los derechos de los artistas, y apoyamos con orgullo la misión de la ARA de dar prioridad a la ética y queremos compartir cómo y por qué nuestras prácticas de obtención de datos apoyan el trabajo de los músicos y creativos.
Cómo se Crean los Modelos de Voz
Discutamos rápidamente cómo funcionan los modelos de voz de IA. Cada voz de IA en Kits es un modelo de IA ajustado de manera única. Para imitar una voz real, el modelo se entrena con conjuntos de datos de audio de referencia. Idealmente, este conjunto de datos consta de 30 minutos de voces en seco de alta calidad. Cada modelo de Kits utiliza un conjunto de datos vocal, lo que resulta en un modelo de voz lo más cercano posible al original.
Nuestra Biblioteca de Voces de IA en Kits está creciendo continuamente, y para cada modelo obtuvimos conjuntos de datos vocales de calidad alta para entrenar nuestros modelos. Es fácil hacer esto de la manera irresponsable y encontrar conjuntos de datos que no han sido aprobados por los artistas ni los apoyan de ninguna manera. Entonces, ¿cómo abordamos esto de manera responsable?
Muchas plataformas de voz de IA simplemente recopilan voces de la web y se apresuran a entrenar modelos, buscando la pura cantidad. Este enfoque no solo es poco ético, sino que también pone a los usuarios finales en un riesgo significativo.
Si un usuario convierte con un modelo de voz no conforme, cualquier cosa que cree podría enfrentar violaciones de derechos de autor y avisos de retirada. Esto significa que las voces de los artistas se utilizan sin consentimiento, y cualquier trabajo creado con esos modelos también está en riesgo.
Cómo Kits Obtiene Nuestros Datos de Entrenamiento, Éticamente
Los modelos de Kits se entrenan exclusivamente con datos vocales para los cuales adquirimos derechos completos. Comenzamos contactando a vocalistas de sesión y socios de estudio interesados en proporcionar conjuntos de datos vocales. Educamos a los proveedores sobre el entrenamiento de modelos de IA y creamos contratos para compensarlos y adquirir correctamente sus conjuntos de datos vocales.
Por parte del proveedor, este acuerdo asegura que los vocalistas entiendan los matices de la tecnología de Voz de IA y reciban compensación por cualquier voz que proporcionen. Por el lado de Kits, esto asegura que cualquier modelo que utilices de la Biblioteca de Kits haya sido obtenido de manera justa y tú como usuario final retengas todos los derechos sobre cualquier trabajo creado con ese modelo ahora y en el futuro.
Comenzamos Kits para mostrar a los artistas y a la industria musical cómo la tecnología de Voz de IA puede usarse para el bien, y aún queda mucho trabajo por hacer. En los próximos meses, compartiremos más sobre cómo estamos desarrollando herramientas innovadoras para ayudar a poner a los Artistas al volante de su propia propiedad intelectual y ayudar a informar el futuro de la tecnología de voz IA.
¿Eres un artista que busca compartir tu voz con el mundo de manera segura, ética y con compensación? ¡Nos encantaría saber de ti! Por favor, contáctanos en outreach@kits.ai.
Saludos,
El Equipo de Kits