Anthropic : les fictions « maléfiques » ont influencé les tentatives de chantage de Claude
Anthropic suggère que les représentations fictives « maléfiques » de l’IA ont influencé les tentatives de chantage de son modèle Claude.
Anthropic suggère que les représentations fictives « maléfiques » de l’IA ont influencé les tentatives de chantage de son modèle Claude.
Un nouveau référentiel GitHub propose des techniques et des stratégies pour optimiser l’utilisation du modèle d’IA Claude dans les tâches de recherche académique.
Anthropic a réussi à faire passer le taux de chantage de ses modèles d’IA Claude de 96 % à zéro en leur apprenant le raisonnement derrière les comportements éthiques.
Anthropic a dévoilé une recherche majeure visant à doter son modèle Claude de la capacité d’expliquer les raisons de ses réponses, une avancée pour la transparence des IA.
Anthropic a développé des auto-encodeurs en langage naturel (NLAE) pour traduire les activations internes de ses modèles Claude en texte compréhensible.
Anthropic lance « Dreaming » pour Claude, une fonction permettant aux agents IA d’apprendre de leurs erreurs passées.
Le PDG d’Anthropic, Dario Amodei, a exprimé sa surprise face à la croissance fulgurante de son modèle d’IA Claude, qui a dépassé de loin les prévisions initiales.
Anthropic loue le plus grand centre de données d’Elon Musk pour satisfaire la demande de son modèle d’IA Claude.
Anthropic s’allie à Blackstone, Hellman & Friedman et Goldman Sachs pour créer une entreprise de services d’IA dédiée à l’adoption de Claude par les PME.
Le projet DeepClaude combine les capacités d’agent de Claude avec DeepSeek V4 Pro pour une génération de code assistée par IA 17 fois plus économique.