« Signals » : une méthode légère pour analyser les traces d’agents
Katanemo Labs a présenté « Signals », une nouvelle approche pour identifier les traces d’agents les plus informatives sans juges LLM coûteux.
Katanemo Labs a présenté « Signals », une nouvelle approche pour identifier les traces d’agents les plus informatives sans juges LLM coûteux.
Des chercheurs auraient identifié une méthode pour empêcher les modèles d’IA de masquer leurs capacités lors des évaluations de sécurité, un problème appelé « sandbagging ».
Anthropic a dévoilé une recherche majeure visant à doter son modèle Claude de la capacité d’expliquer les raisons de ses réponses, une avancée pour la transparence des IA.
Une nouvelle architecture d’IA, EMO, présentée par AllenAI sur HuggingFace, démontre une capacité inédite à développer une modularité spontanée lors du pré-entraînement.
Anthropic a développé des auto-encodeurs en langage naturel (NLAE) pour traduire les activations internes de ses modèles Claude en texte compréhensible.
Liz Reid de Google a mis en lumière la fragmentation des mots-clés et les besoins des utilisateurs en recherche IA, impactant les stratégies SEO.
Des chercheurs du MIT ont identifié la superposition comme le phénomène clé expliquant la fiabilité de la mise à l’échelle des performances des grands modèles de langage.
Une analyse de la fondation ARC Prize révèle que les modèles d’IA comme GPT-5.5 et Opus 4.7 commettent trois erreurs de raisonnement systématiques sur le benchmark ARC-AGI-3.
Une nouvelle méthode améliore le suivi de personnes par systèmes multi-caméras en prédisant leur position même quand une caméra les perd, grâce à une calibration automatique.
Le processus d’évaluation des conférences en apprentissage automatique est souvent perçu comme une « loterie », une observation nuancée par la communauté.