OpenAI a levé le voile sur une directive surprenante de ses modèles d’IA : ne pas évoquer les « gobelins » et autres créatures.
Suite à un article de Wired révélant que le modèle de codage d’OpenAI recevait l’instruction de « ne jamais parler de gobelins, gremlins, ratons laveurs, trolls, ogres, pigeons, ou d’autres animaux ou créatures », l’entreprise a publié une explication.
Elle qualifie ces références d’« habitude étrange » développée par ses modèles, sans préciser la raison exacte de cette consigne initiale. Cette mise au point soulève des interrogations sur les mécanismes de contrôle et d’alignement des intelligences artificielles.
Source : The Verge AI