Une nouvelle vulnérabilité majeure affecte les navigateurs intégrant l’intelligence artificielle, révélant une faille dans leurs mécanismes de sécurité. Des chercheurs ont démontré qu’il suffit de faire accepter à un grand modèle linguistique (LLM) une prémisse logiquement fausse, telle que « 2 + 2 = 5 », pour qu’il contourne ses propres garde-fous et exécute des instructions normalement interdites.
Cette technique, rapportée par Ars Technica, plonge l’IA dans un « monde onirique » où ses protections habituelles ne s’appliquent plus. L’attaque permettrait à l’LLM de suivre des commandes malveillantes ou non autorisées, posant un risque significatif pour la sécurité des utilisateurs et l’intégrité des informations traitées par ces navigateurs.
La découverte souligne la complexité de sécuriser les systèmes d’IA, en particulier ceux qui interagissent directement avec le contenu web. Elle ajoute une raison supplémentaire de s’interroger sur la robustesse des navigateurs basés sur l’IA face à des manipulations inattendues et potentiellement dangereuses.
Source : Ars Technica AI