Gemma 4 e4b : une version optimisée sur Android suscite des interrogations
Une version du modèle Gemma 4 e4b de Google, extraite d’une application Android, semble plus performante que les versions publiques.
Une version du modèle Gemma 4 e4b de Google, extraite d’une application Android, semble plus performante que les versions publiques.
Un chercheur a implémenté un modèle de langage par diffusion sans aide de l’IA, démontrant une faisabilité surprenante.
La nouvelle variante Qwen3.6-35B-A3B « Uncensored Aggressive » est disponible, offrant un modèle linguistique sans aucune restriction de contenu ni perte de capacités.
Le modèle d’IA Qwen 3.6-35B-A3B, doté de capacités multimodales et d’une architecture MoE, est désormais open source.
Anthropic dévoile Claude Opus 4.7, son modèle le plus puissant, améliorant l’ingénierie logicielle et l’analyse d’images.
Arcee AI dépense la moitié de son capital pour un modèle d’IA ouvert rivalisant avec Claude Opus.
Un nouveau modèle de langage open source, LGAI-EXAONE/EXAONE-4.5-33B, a été rendu public sur Reddit.
Anthropic dévoile une « System Card » pour son modèle Claude Mythos, détaillant ses capacités et limites en cybersécurité.
Un développeur a créé un modèle de langage Rust de petite taille, atteignant une vitesse d’inférence 51 fois supérieure grâce à une technique d’attention hybride.
Un développeur a créé un petit modèle de langage spécialisé en Rust, atteignant une vitesse d’inférence 51 fois supérieure grâce à une approche nommée HybridAttention.