OpenAI déploie le Mode Verrouillage pour renforcer la sécurité de ChatGPT
OpenAI déploie le « Mode Verrouillage » (Lockdown Mode) pour les comptes ChatGPT éligibles, une fonctionnalité visant à prévenir l’exfiltration de données sensibles.
OpenAI déploie le « Mode Verrouillage » (Lockdown Mode) pour les comptes ChatGPT éligibles, une fonctionnalité visant à prévenir l’exfiltration de données sensibles.
Anthropic tire la sonnette d’alarme sur les IA capables de s’auto-améliorer et plaide pour une pause dans leur développement.
NVIDIA a introduit Nemotron 3.5 Content Safety, une solution multimodale et personnalisable pour sécuriser les contenus générés par l’IA en entreprise.
Le laboratoire Anthropic a publié un article sur l’auto-amélioration récursive (RSI) des IA, un concept clé pour l’évolution future des systèmes intelligents.
Anthropic a détaillé sa stratégie de « confinement » pour le modèle d’IA Claude, expliquant comment l’entreprise assure son déploiement sûr et responsable.
OpenAI, Anthropic et d’autres leaders de l’IA exhortent les législateurs à mieux suivre les séquences d’ADN synthétiques pour prévenir les armes biologiques.
OpenAI a publié son programme de politique publique, détaillant ses priorités pour un développement responsable de l’IA, incluant sécurité, protection des jeunes et normes mondiales.
Microsoft a lancé une nouvelle spécification permettant aux développeurs de définir des politiques de contrôle pour les agents IA via des fichiers portables.
OpenAI exhorte la communauté internationale à agir pour la sécurité des jeunes face à l’IA, proposant la création d’un institut dédié à cet enjeu crucial.
La startup ZeroDrift a levé 10 millions de dollars pour son service de conformité, visant à protéger les modèles d’IA des problèmes qu’ils pourraient générer.