Le magazine The Atlantic a mis à disposition une base de données interrogeable recensant la musique utilisée pour l’entraînement des modèles d’intelligence artificielle.
Le journaliste Alex Reisner a découvert quatre ensembles de données musicales employés pour former des IA. Deux de ces collections sont particulièrement vastes, comptant respectivement 12 millions et 9 millions de titres. Les deux autres, bien que plus modestes, représentent également un volume significatif de données d’entraînement.
Cette initiative offre au public un accès inédit à ces informations. La base de données permet de rechercher et d’identifier les œuvres musicales intégrées aux systèmes d’IA. Cette transparence intervient dans un contexte de discussions croissantes sur l’utilisation des contenus protégés par le droit d’auteur pour l’apprentissage des modèles génératifs.
La disponibilité de ces données pourrait éclairer les débats futurs sur la rémunération des artistes et l’éthique de l’IA.
Source : The Verge AI