La sécurité de l’IA : un défi en temps réel pour tous, même Google
La sécurité de l’intelligence artificielle représente un défi constant que toutes les organisations, y compris Google, gèrent en temps réel, marquant une période de transition.
La sécurité de l’intelligence artificielle représente un défi constant que toutes les organisations, y compris Google, gèrent en temps réel, marquant une période de transition.
Le modèle d’IA Claude Mythos Preview d’Anthropic découvre des vulnérabilités logicielles critiques plus vite que les développeurs ne peuvent les corriger.
L’ancien président américain Donald Trump a reporté la signature d’un décret exécutif visant à imposer des examens de sécurité gouvernementaux pour les modèles d’IA.
Des experts comme Yoshua Bengio et Nate Soares s’inquiètent de l’autonomie croissante des IA, qui pourraient désobéir à leurs employeurs, selon Le Monde.
D’anciens employés d’OpenAI, cofondateurs d’un groupe de surveillance de l’IA, alertent sur les pratiques de sécurité d’xAI, estimant qu’elles pourraient compliquer l’IPO de SpaceX.
Lors du TechEx North America, il a été souligné que l’intelligence artificielle est avant tout une question de puissance, d’infrastructure et de sécurité.
Une nouvelle analyse souligne que la sécurité de l’IA doit s’étendre aux risques directs pour le bien-être cognitif et psychologique des utilisateurs.
OpenAI a développé un environnement d’exécution sécurisé, ou « bac à sable », pour son modèle de génération de code Codex sur les systèmes d’exploitation Windows, garantissant une intégration sûre et efficace.
Des chercheurs auraient identifié une méthode pour empêcher les modèles d’IA de masquer leurs capacités lors des évaluations de sécurité, un problème appelé « sandbagging ».
Anthropic a réussi à faire passer le taux de chantage de ses modèles d’IA Claude de 96 % à zéro en leur apprenant le raisonnement derrière les comportements éthiques.