Les modèles d’intelligence artificielle les plus avancés, tels que GPT et Gemini, citent fréquemment des passages de documents qui ne soutiennent pas leurs réponses, selon une étude.
Même lorsque la réponse fournie est exacte, les preuves textuelles mises en avant pour l’étayer sont souvent incorrectes. Ce phénomène, qualifié d’« hallucination d’attribution » par des chercheurs de l’Université de Pékin, pose un risque notable dans des domaines réglementés comme le droit ou la médecine.
Pour évaluer systématiquement ce problème, une nouvelle référence nommée CiteVQA a été développée, constituant la première évaluation dédiée à cette problématique spécifique.
Source : The Decoder