Le modèle d’intelligence artificielle Gemma 4 12B de Google est désormais disponible pour une installation locale, ouvrant la voie à son utilisation sur des configurations matérielles individuelles. Publié sous licence Apache 2.0, ce modèle multimodal d’environ 12 milliards de paramètres, initialement proposé en format BF16, a rapidement vu la communauté développer diverses versions optimisées.
Des formats quantifiés comme GGUF et MLX sont déjà proposés par des contributeurs tels qu’Unsloth ou mlx-community, permettant une exécution sur des machines moins puissantes. L’engouement pour l’idée que ce modèle « tourne sur un ordinateur portable » est palpable, bien que des données concrètes sur les performances réelles et les configurations matérielles optimales fassent encore l’objet d’échanges sur des plateformes comme Reddit.
La communauté s’interroge sur les combinaisons de quantifications et de matériels les plus efficaces pour exploiter Gemma 4 12B. Les discussions portent sur le choix des versions les plus pertinentes à télécharger et à exécuter localement, afin de mesurer concrètement les capacités de ce modèle sur des appareils personnels.
Source : Reddit r/MachineLearning