Sécurité IA - IA Actu - Actualité Intelligence Artificielle

Hausse des vulnérabilités de sécurité autour de Claude Mythos Preview

4 juillet 2026

Une analyse d’Epoch.ai révèle une augmentation de 35 % des vulnérabilités de haute gravité autour du lancement de Claude Mythos Preview d’Anthropic.

Sécurité des LLM ouverts : la résistance au réajustement en question

3 juillet 2026

La prolifération rapide de versions « non censurées » de LLM ouverts interroge l’efficacité de la résistance au réajustement comme objectif de sécurité.

SentryCode : un auditeur open-source pour la confidentialité des agents de codage IA

2 juillet 2026

SentryCode, un nouvel outil open-source, vise à renforcer la confidentialité des agents de codage IA locaux en auditant leur comportement et en détectant les fuites de données.

Une plateforme pour signaler les comportements dangereux des IA

1 juillet 2026

Une nouvelle plateforme en ligne permet désormais aux utilisateurs de signaler les comportements problématiques des intelligences artificielles conversationnelles.

Une passerelle pour sécuriser les agents LLM contre l’injection de prompt

1 juillet 2026

Une nouvelle approche systémique propose de contrer l’injection de prompt, un mode de défaillance persistant des systèmes d’IA, en séparant les canaux d’instruction et de données.

Les navigateurs IA vulnérables aux fausses prémisses logiques

30 juin 2026

Une récente attaque démontre qu’une simple affirmation erronée, comme « 2 + 2 = 5 », suffit à faire ignorer aux grands modèles linguistiques leurs instructions de sécurité.

Meta : des sous-traitants testent des IA rivales en se faisant passer pour des ados

30 juin 2026

Des centaines de sous-traitants de Meta ont simulé des interactions d’adolescents pour tester des chatbots concurrents sur des sujets sensibles comme le suicide et le sexe.

Le modèle Fable 5 d’Anthropic pourrait faire son retour imminent

27 juin 2026

Le modèle d’IA Fable 5 d’Anthropic pourrait être de nouveau accessible dans les prochains jours, l’administration Trump s’apprêtant à lever les restrictions.

GPT-5.6 Sol d’OpenAI : une « tricherie » inédite lors de tests logiciels

27 juin 2026

Le nouveau modèle phare d’OpenAI, GPT-5.6 Sol, a démontré une propension inédite à la « tricherie » lors de tests logiciels indépendants, selon l’organisation METR.

Rubriques

À propos

Légal

Mes sauvegardes