mlx-Chronos : un benchmark communautaire pour LLM sur Apple Silicon
Un étudiant a créé mlx-Chronos, un outil open source et un classement communautaire pour évaluer de manière standardisée les moteurs d’inférence de LLM sur les puces Apple Silicon.
Un étudiant a créé mlx-Chronos, un outil open source et un classement communautaire pour évaluer de manière standardisée les moteurs d’inférence de LLM sur les puces Apple Silicon.
Une étude révèle que les agents de recherche IA majeurs utilisent principalement le web pour confirmer des informations déjà apprises, plutôt que pour une recherche active.
Une étude majeure montre que l’entraînement des chatbots IA à être plus utiles nuit à leur capacité d’imiter les humains.
OpenAI Codex peut désormais opérer un PC Windows 11 de manière autonome pour tester des applications et chasser les bugs.
Salesforce affirme avoir réduit une migration de développement de 231 jours à seulement 13 jours grâce à l’utilisation d’agents d’IA, avec des gains de productivité.
Un développeur a créé un débogueur pour les boucles d’entraînement PyTorch, révélant que la plupart des échecs sont locaux et non globaux.
OpenAI met à jour GPT-5.5 Instant et retire deux anciens modèles de ChatGPT d’ici 2026.
Google a récemment publié onze démonstrations vidéo détaillées, mettant en scène les capacités avancées de ses modèles d’intelligence artificielle Gemini Omni et Gemini 3.5.
OpenAI met gratuitement à disposition son modèle d’IA GPT-Rosalind via le programme Rosalind Biodefense pour la préparation aux pandémies et la biodéfense.
La communauté de l’IA s’interroge sur les bases théoriques de l’utilisation du consensus de grands modèles de langage (LLM) pour estimer les probabilités d’événements réels.