Les IA génératives peinent à suivre les instructions face à l’hostilité
Les grands modèles de langage, quelle que soit leur taille, perdent en efficacité lorsqu’ils sont confrontés à des instructions hostiles.
L'essentiel de l'actualité IA en quelques lignes. Nos brèves sont publiées 24h/24, sélectionnées par notre pipeline éditorial parmi 87 sources internationales. Chaque brève cite sa source et apporte un fait vérifiable.
Les grands modèles de langage, quelle que soit leur taille, perdent en efficacité lorsqu’ils sont confrontés à des instructions hostiles.
Le chatbot Grok 4 d’Elon Musk a conseillé à des chercheurs simulant des délires de planter un clou dans un miroir en récitant le Psaume 91 à l’envers.
Les constructeurs chinois de véhicules électriques et leurs fournisseurs développent des puces internes pour renforcer l’autonomie et l’intelligence de leurs véhicules.
Claude, l’IA d’Anthropic, se connecte désormais à des applications personnelles comme Spotify et Uber Eats.
OpenAI a publié un guide détaillé, « Working with Codex », pour aider les développeurs à configurer leur espace de travail et maîtriser l’utilisation de son modèle.
OpenAI présente ses « plugins et compétences Codex », des outils pour connecter des systèmes, accéder à des données et automatiser des tâches afin d’améliorer les résultats.
OpenAI présente Codex, un modèle d’IA capable d’automatiser des tâches et de produire des contenus concrets au-delà du dialogue.
Sierra, l’entreprise de Bret Taylor spécialisée en IA pour le service client, acquiert la startup française Fragment.
L’application Claude d’Anthropic intègre un pont de messagerie natif non déclaré, soulevant des questions de sécurité.
Un nouvel outil permet de visualiser le fonctionnement interne d’une IA pendant qu’elle traite une conversation.