Anthropic a lancé Claude Opus 4.8, un modèle qui surpasse GPT-5.5 et Gemini 3.1 Pro dans la plupart des benchmarks, marquant une amélioration qualifiée de « modeste mais tangible ».
Cette nouvelle itération de Claude Opus démontre des capacités accrues, notamment en matière de détection d’erreurs. Le modèle est désormais capable de repérer ses propres erreurs de codage quatre fois plus souvent que la version précédente, suggérant une robustesse améliorée pour les tâches de développement et de programmation.
Parallèlement à ce déploiement, Anthropic introduit des flux de travail dynamiques. Ces derniers permettent de lancer des centaines de sous-agents parallèles, une fonctionnalité conçue pour faciliter la gestion de tâches complexes, telles que les migrations de bases de code complètes. Cette approche vise à optimiser l’efficacité des opérations à grande échelle.
L’arrivée de Claude Opus 4.8 et ses nouvelles fonctionnalités illustrent la compétition intense et l’innovation constante qui animent le secteur des grands modèles de langage.
Source : The Decoder