Un développeur a conçu un outil, baptisé Followloop, qui achemine automatiquement les requêtes d’intelligence artificielle vers le modèle le plus adapté et économique.
L’idée repose sur le constat que la majorité des tâches courantes, comme la synthèse de textes ou la rédaction d’ébauches, ne nécessitent pas des modèles de pointe. Des modèles plus modestes, tels que Cerebras Llama, Groq ou Gemini Flash, suffisent pour ces usages.
Followloop analyse la complexité de chaque demande et la dirige vers la solution la plus pertinente. Après 9 200 tâches traitées, cette approche aurait permis d’économiser 21 dollars, pour un coût réel de 0,14 dollar par tâche. Cette optimisation soulève la question de l’efficience dans l’utilisation des ressources d’IA.
Source : Reddit r/artificial