Malgré les annonces d’Anthropic présentant Claude Fable 5 comme son modèle le plus performant, des tests révèlent son incapacité à répondre à des questions de biologie de niveau lycée.
Le modèle transfère systématiquement ces requêtes vers son prédécesseur, le modèle phare précédent, soulevant des interrogations sur les capacités réelles de cette nouvelle version dans des domaines pourtant mis en avant.
Cette situation interroge sur la fiabilité des annonces des développeurs d’IA et sur la validation des performances avant leur diffusion auprès du grand public.
Source : The Verge AI