AI Overviews : Google conteste 10 % d’erreurs, mais en dénombre 22 %

Google conteste un taux d’erreur de 10 % pour ses AI Overviews, mais ses propres outils de test révèlent un chiffre de 22 %.

Les AI Overviews, la fonctionnalité de Google qui vise à synthétiser la meilleure réponse directement dans les résultats de recherche, sont sous le feu des critiques. Le New York Times avait initialement avancé un taux d’erreurs d’environ 10 % pour ces résumés générés par IA, en se basant sur un benchmark développé par OpenAI.

Google a rapidement réagi, contestant publiquement ce chiffre. L’entreprise a justifié sa position en affirmant que le benchmark d’OpenAI utilisé pour cette évaluation était biaisé et ne reflétait pas fidèlement la performance de ses systèmes. Paradoxalement, Google a ensuite communiqué les résultats de son propre outil de test, lequel, après avoir été revu et corrigé dans le but d’offrir une évaluation plus juste, a mis en évidence un taux d’erreurs de 22 %.

Cette divergence significative entre les évaluations externes et internes, ainsi que la contradiction interne chez Google, soulève des questions importantes quant à la fiabilité des méthodes de mesure de la précision des intelligences artificielles génératives et à la transparence de leur déploiement.

Source : Next.ink

Catégories : Brèves IA
← Article précédentNVIDIA rend l'IA open source pour fiabiliser les processeurs quantiquesArticle suivant →Mythos d'Anthropic : l'Europe écartée de l'accès au nouveau modèle IA

Restez informé de l'actualité IA

Recevez chaque semaine notre sélection des meilleures analyses sur l'intelligence artificielle.

Pas de spam. Désinscription en un clic.

Laisser un commentaire

FR EN ES