Des chercheurs en cybersécurité expriment leur mécontentement face aux restrictions imposées par Fable, le nouveau modèle d’Anthropic. Ils estiment que les garde-fous intégrés sont trop contraignants pour mener à bien des travaux essentiels dans ce domaine.
Ces limitations empêcheraient, selon eux, l’exploration nécessaire des vulnérabilités potentielles et la recherche de solutions innovantes. L’objectif affiché par Anthropic est de prévenir les usages malveillants, mais la communauté scientifique pointe un risque de freiner la progression de la défense numérique.
La question se pose ainsi de trouver un équilibre entre la sécurité intrinsèque des modèles d’IA et leur utilité pour les experts chargés de nous protéger des cybermenaces.
Source : TechCrunch AI