Nemotron 3.5 ASR : l’affinage pour langues et accents spécifiques
NVIDIA Nemotron 3.5 ASR peut désormais être affiné pour s’adapter à des langues, domaines ou accents spécifiques, grâce à Hugging Face.
NVIDIA Nemotron 3.5 ASR peut désormais être affiné pour s’adapter à des langues, domaines ou accents spécifiques, grâce à Hugging Face.
JetBrains présente Mellum2, un modèle d’IA innovant de 12 milliards de paramètres basé sur l’architecture Mixture-of-Experts.
NVIDIA a publié une version quantifiée du modèle de langage Qwen3.6-35B-A3B d’Alibaba, optimisée pour des performances d’inférence accrues.
Liquid AI a lancé LFM-2.5 8B-A1B, un modèle Mixture-of-Experts de 8 milliards de paramètres entraîné sur 38 trillions de tokens, visant l’efficacité et la performance.
Anthropic lance Claude Opus 4.8, six semaines après la version précédente, et promet une surprise.
Un nouveau modèle de langage, le Gemma-4-Harmonia-31B-Uncensored-Heretic, issu de la fusion de plusieurs affinements du Gemma-4-31B-it, est disponible.
Un nouveau modèle, MiMo-V2.5-coder, est proposé comme alternative aux modèles existants pour le codage, nécessitant 128 Go de mémoire vive.
L’entreprise canadienne Cohere a mis en open source Command A+, son modèle de langage le plus puissant à ce jour, sous licence Apache 2.0.
Le modèle CyberSecQwen-4B, petit et spécialisé, offre une solution d’IA locale pour renforcer la cybersécurité défensive, répondant aux enjeux de confidentialité et de ressources.
Le PDG d’Anthropic, Dario Amodei, a exprimé sa surprise face à la croissance fulgurante de son modèle d’IA Claude, qui a dépassé de loin les prévisions initiales.