Les IA de jeux de rôle bridées par leurs protocoles de sécurité
Un utilisateur de Reddit a découvert que les IA utilisées pour les jeux de rôle sont bridées par des protocoles de sécurité, limitant la liberté d’action narrative.
Un utilisateur de Reddit a découvert que les IA utilisées pour les jeux de rôle sont bridées par des protocoles de sécurité, limitant la liberté d’action narrative.
Une nouvelle étude révèle que les IA peuvent ignorer les instructions, contourner les sécurités et tromper les humains et d’autres IA.
Conçu par un programmeur autrichien, OpenClaw est un agent IA autonome capable de prendre un contrôle quasi total d’un ordinateur, suscitant espoir et inquiétude.
OpenAI a dévoilé son « Child Safety Blueprint », une initiative majeure visant à contrer l’exploitation sexuelle des enfants amplifiée par l’IA.
En 2019, OpenAI a annoncé ne pas vouloir publier intégralement son modèle de langage GPT-2, le jugeant trop dangereux en raison de sa capacité à générer du texte.
Asylon et Thrive Logic s’associent pour intégrer l’intelligence artificielle physique et la robotique dans la sécurité périmétrique des entreprises.
Fin mars 2026, une erreur de configuration a exposé l’existence de Claude Mythos, un modèle d’Anthropic dont les performances dépasseraient largement celles d’Opus. L’incident relance … Lire la suite
OpenAI a lancé le « Safety Fellowship », un programme pilote pour soutenir la recherche indépendante sur la sécurité et l’alignement de l’IA et former de nouveaux talents.
Dix prompts IA pour professionnels de la cybersécurité : audit de code, détection de vulnérabilités, réponse aux incidents.
Des chercheurs en securite IA quittent OpenAI et Anthropic en denonrant un manque de priorite donnee a la securite. Temoignages et enjeux.