Anthropic a présenté ses excuses pour avoir discrètement limité les capacités de son nouveau modèle d’IA, Claude Fable 5, via des garde-fous non divulgués. Ces restrictions, qualifiées de « distillation » par l’entreprise, ont affecté la recherche et le développement de systèmes concurrents.
La société reconnaît que cette opacité a nui à la communauté. Elle s’engage désormais à plus de transparence quant au déclenchement de ces limitations, même si cela implique que Fable refuse davantage de requêtes. L’objectif est de rétablir la confiance.
Cette volte-face soulève des interrogations sur la manière dont les entreprises d’IA gèrent la sécurité et la transparence de leurs modèles à mesure qu’ils évoluent.
Source : The Verge AI