Les modèles Claude les plus récents, notamment Opus 4.8, rencontrent des difficultés inattendues lors de l’utilisation d’outils externes, générant des appels non conformes aux schémas.
Selon un rapport d’Armin relayé par Simon Willison, ces modèles tendent à inventer des champs supplémentaires dans les arguments de fonction, spécifiquement au sein du tableau edits[] de l’outil Pi. Bien que l’intention de modification soit souvent correcte, l’ajout de clés non définies entraîne le rejet de l’appel par l’outil.
Ce comportement oblige l’IA à retenter l’opération, signalant une friction dans l’intégration des capacités d’outillage des modèles avancés. Le problème, bien que surprenant pour un modèle comme Opus 4.8, n’est pas entièrement inédit, les modèles générant parfois des sorties malformées.
Cette situation soulève des questions sur la robustesse des interactions entre les grands modèles de langage et les interfaces de programmation d’applications.
Source : Simon Willison Blog