Les meilleurs modèles d’intelligence artificielle perdent près de la moitié de leurs performances face à des graphiques complexes, révèle une nouvelle étude comparative.
Le benchmark RealChart2Code a mis à l’épreuve 14 modèles d’IA de pointe sur des visualisations de données complexes. Ces graphiques ont été conçus à partir de jeux de données réels, simulant des scénarios d’utilisation concrets. L’objectif était d’évaluer leur capacité à interpréter et à extraire des informations pertinentes de représentations visuelles élaborées.
Les résultats sont significatifs : même les modèles propriétaires les plus performants ont vu leur efficacité diminuer de près de 50 % par rapport à des tests plus simples. Cette baisse de performance souligne les défis persistants pour l’IA dans la compréhension des nuances et des subtilités des visualisations complexes. Cela met en lumière une limite actuelle des capacités de raisonnement visuel des systèmes d’IA.
Cette découverte suggère que l’amélioration de la compréhension des graphiques complexes représente un axe de recherche crucial pour le développement futur de l’intelligence artificielle.
Source : The Decoder