Qwen3.7Max : un modèle MoE open-source rivalise avec les géants de l’IA
Le modèle open-source Qwen3.7Max, basé sur l’architecture MoE, démontre des performances remarquables pour sa taille, défiant des modèles plus grands.
Le modèle open-source Qwen3.7Max, basé sur l’architecture MoE, démontre des performances remarquables pour sa taille, défiant des modèles plus grands.
Liquid AI a lancé LFM-2.5 8B-A1B, un modèle Mixture-of-Experts de 8 milliards de paramètres entraîné sur 38 trillions de tokens, visant l’efficacité et la performance.
Une nouvelle architecture d’IA, EMO, présentée par AllenAI sur HuggingFace, démontre une capacité inédite à développer une modularité spontanée lors du pré-entraînement.