Gnosys Labs, une entreprise spécialisée dans l’ingénierie de modèles autonomes, a démontré une méthode efficace pour optimiser les classifieurs et les invites d’intelligence artificielle, même lorsque les données étiquetées sont trop rares pour les approches conventionnelles.
Le défi majeur en apprentissage automatique réside souvent dans la disponibilité de « vérités terrain » (données labellisées) suffisantes pour entraîner et affiner les modèles. Gnosys Labs s’attaque à ce problème en améliorant les performances des modèles dans des contextes de rareté des étiquettes, une situation fréquente et coûteuse dans de nombreux domaines d’application.
La méthode a été testée sur ToxicChat, un banc d’essai public dédié à la sécurité des systèmes conversationnels. Dans des conditions réalistes de rareté des données, l’approche de Gnosys Labs a permis d’améliorer un classifieur, surpassant à la fois le point de départ de l’équipe et GEPA, un optimiseur d’invites standard. Ces résultats ont été observés sur deux exécutions distinctes de leur méthode actuelle.
Cette avancée suggère de nouvelles voies pour le déploiement de l’IA dans des environnements où la collecte intensive de données labellisées reste un obstacle significatif.
Source : Reddit r/MachineLearning