Les navigateurs IA vulnérables aux fausses prémisses logiques
Une récente attaque démontre qu’une simple affirmation erronée, comme « 2 + 2 = 5 », suffit à faire ignorer aux grands modèles linguistiques leurs instructions de sécurité.
Une récente attaque démontre qu’une simple affirmation erronée, comme « 2 + 2 = 5 », suffit à faire ignorer aux grands modèles linguistiques leurs instructions de sécurité.