MiniMax : une nouvelle version attendue d’ici dix jours
MiniMax, acteur de l’IA, annonce une nouvelle version de son modèle d’ici dix jours, soulevant des interrogations sur sa taille.
MiniMax, acteur de l’IA, annonce une nouvelle version de son modèle d’ici dix jours, soulevant des interrogations sur sa taille.
Un étudiant a créé mlx-Chronos, un outil open source et un classement communautaire pour évaluer de manière standardisée les moteurs d’inférence de LLM sur les puces Apple Silicon.
La communauté de l’IA s’interroge sur les bases théoriques de l’utilisation du consensus de grands modèles de langage (LLM) pour estimer les probabilités d’événements réels.
Le PDG de Reddit revendique le rôle central de sa plateforme dans l’entraînement des IA génératives, la qualifiant de source majeure.
Un article récent identifie les « odeurs » (smells) courantes dans les applications basées sur les grands modèles de langage (LLM), signalant des problèmes sous-jacents.
Le 2e atelier Social Sim’26, organisé lors de COLM’26, lance un appel à contributions axé sur la fidélité et l’évaluation rigoureuse des simulations sociales basées sur les grands modèles de langage.
Un nouveau modèle de langage, le Gemma-4-Harmonia-31B-Uncensored-Heretic, issu de la fusion de plusieurs affinements du Gemma-4-31B-it, est disponible.
Hugging Face a introduit le « Delta Weight Sync », une méthode innovante pour synchroniser efficacement les modèles de langage massifs en ne transférant que les modifications.
Une nouvelle méthode permet aux agents IA locaux d’améliorer leurs performances en analysant et réécrivant leurs propres conversations.
La Norvège déploie 2 Po de stockage Huawei pour entraîner ses propres grands modèles linguistiques.