Un expérimentateur a développé une méthode permettant à des agents d’intelligence artificielle locaux d’améliorer leurs performances de manière autonome. En appliquant un processus de réflexion et de réécriture sur des conversations quotidiennes, il a observé une augmentation spectaculaire des résultats.
Initialement testée sur un sous-ensemble de dix tâches pour gravir les échelons d’un classement de référence (TerminalBench), cette approche a fait passer les performances d’environ 30 % à près de 90 %. Le système fonctionne en enregistrant chaque échange avec un modèle d’IA local via un proxy.
Un autre agent, utilisant le même modèle, analyse ensuite ces journaux pour en extraire des leçons concrètes et les intégrer dans de nouvelles instructions. Cette boucle d’amélioration continue pourrait potentiellement s’appliquer à l’ensemble des interactions, transformant chaque discussion en une opportunité d’apprentissage pour l’IA.
Source : Reddit r/LocalLLaMA