Les agents de recherche IA confirment plus qu’ils ne cherchent réellement
Une étude révèle que les agents de recherche IA majeurs utilisent principalement le web pour confirmer des informations déjà apprises, plutôt que pour une recherche active.
Une étude révèle que les agents de recherche IA majeurs utilisent principalement le web pour confirmer des informations déjà apprises, plutôt que pour une recherche active.
L’évaluation d’un agent IA de support client révèle des signaux trompeurs et des bugs de récupération masqués.
Hugging Face et le TII UAE ont lancé QIMMA, un classement novateur pour évaluer la qualité des grands modèles de langage (LLM) arabes.
La méthode actuelle d’évaluation des grands modèles de langage (LLM) est remise en question pour son coût en ressources et son efficacité par la communauté IA.
La phase de discussion des réfutations pour la conférence IJCAI 2026 a débuté, avec environ 70% des articles soumis toujours en cours d’évaluation.