Des chercheurs de l’Université Carnegie Mellon ont mis en lumière la capacité d’agents d’intelligence artificielle, notamment Claude Mythos et GPT-5.5, à développer de manière autonome de véritables exploits pour navigateurs web.
Cette révélation provient d’un nouveau banc d’essai spécifiquement conçu pour mesurer l’étendue des capacités des IA à exploiter des vulnérabilités réelles. L’étude s’est concentrée sur des failles au sein du moteur V8 de Google, un composant critique des navigateurs modernes.
Les résultats des tests sont significatifs : Claude Mythos a démontré une performance supérieure à celle de GPT-5.5 dans la création de ces exploits, bien que son coût d’utilisation soit douze fois plus élevé. Cette autonomie dans la génération de codes malveillants fonctionnels marque une étape importante.
Ces travaux soulignent le potentiel croissant des modèles d’IA dans des domaines complexes de la cybersécurité, tant pour la défense que pour l’attaque. Ils invitent à une réflexion approfondie sur les implications de ces capacités émergentes pour la sécurité numérique et la protection des utilisateurs.
Source : The Decoder