Les IA de pointe commettent trois erreurs de raisonnement systématiques
Une analyse de la fondation ARC Prize révèle que les modèles d’IA comme GPT-5.5 et Opus 4.7 commettent trois erreurs de raisonnement systématiques sur le benchmark ARC-AGI-3.
Une analyse de la fondation ARC Prize révèle que les modèles d’IA comme GPT-5.5 et Opus 4.7 commettent trois erreurs de raisonnement systématiques sur le benchmark ARC-AGI-3.
Le modèle GPT-5.5 d’OpenAI intègre désormais des références à des gobelins et autres créatures dans ses réponses.
GPT-5.5 d’OpenAI gagne plus de 50 points en code sur Arena AI, signalant une avancée notable.
OpenAI lance GPT-5.5, une mise à jour de son modèle linguistique, promettant plus de rapidité et d’autonomie.
OpenAI et NVIDIA s’associent pour la prochaine génération d’IA, avec des gains de performance potentiels considérables.
OpenAI a retiré son modèle de codage Codex pour intégrer ses capacités directement à GPT-5.5, promettant un codage agentique plus fort et une consommation de jetons réduite.
Le scientifique en chef d’OpenAI juge les progrès récents de l’IA « étonnamment lents » et promet des avancées majeures.
DeepSeek V4 est dévoilé peu après GPT-5.5, intensifiant la compétition entre les géants de l’IA.
GPT-5.5 domine les benchmarks d’IA mais conserve des hallucinations et coûte 20% de plus via l’API.
OpenAI a récemment dévoilé GPT-5.5, ChatGPT Images 2.0 et un Privacy Filter, marquant une série de mises à jour rapides de ses offres.