Goodfire dévoile Silico pour déboguer les grands modèles de langage
Goodfire lance Silico, un outil d’interprétabilité mécaniste pour analyser et ajuster les LLM pendant l’entraînement.
Goodfire lance Silico, un outil d’interprétabilité mécaniste pour analyser et ajuster les LLM pendant l’entraînement.
IBM lance ses modèles de langage Granite 4.1, optimisés pour les applications d’entreprise et l’intégration par les développeurs.
Talkie-1930, un LLM entraîné uniquement sur des textes d’avant 1931, imagine un monde sans événements majeurs du XXe siècle.
Le modèle d’IA open-source Xiami mimo-v2.5 pro surpasse désormais Opus 4.5 au classement Arena.
Une discussion sur Reddit questionne la prédominance du raisonnement en langage naturel chez les LLM, suggérant une exploration du raisonnement direct dans l’espace vectoriel.
Skymizer propose une carte unique pour l’inférence locale de LLM massifs, optimisant la génération de texte.
Les professionnels de l’assurance qualité rencontrent des difficultés inédites pour tester les agents d’IA basés sur des LLM, dont les sorties sont imprévisibles.
Browser Harness, une nouvelle bibliothèque open source, offre aux LLM une autonomie inédite pour naviguer et interagir sur le Web.
Deepseek AI rend publics ses nouveaux modèles linguistiques de grande taille, Deepseek V4, entraînés sur 2 000 milliards de tokens.
Les grands modèles de langage, quelle que soit leur taille, perdent en efficacité lorsqu’ils sont confrontés à des instructions hostiles.