L’IA perd la moitié de ses performances face aux graphiques complexes
Une nouvelle étude comparative révèle que les meilleurs modèles d’IA perdent près de la moitié de leurs performances lorsqu’ils analysent des graphiques complexes.
Une nouvelle étude comparative révèle que les meilleurs modèles d’IA perdent près de la moitié de leurs performances lorsqu’ils analysent des graphiques complexes.
Un utilisateur de Reddit a publié une analyse comparative des modèles « abliterated » de HauhauCS, Heretic et Huihui face aux modèles Qwen 3/3.5, suscitant des réactions dans la communauté.
IBM Research a lancé VAKRA, un benchmark évaluant la capacité des agents d’IA à raisonner et utiliser des outils, révélant leurs forces et faiblesses actuelles.
Google conteste un taux d’erreur de 10 % pour ses AI Overviews, mais ses propres outils de test révèlent un chiffre de 22 %.
Les agents IA échouent à accomplir la majorité des tâches en ligne du quotidien, selon le banc d’essai ClawBench.