L’équipe PrismML a dévoilé les modèles Bonsai Image 4B, des transformeurs de diffusion texte-image binaires et ternaires capables de fonctionner entièrement localement dans un navigateur web via WebGPU.
Ces modèles se distinguent par leur taille compacte, pesant environ 3 Go, une réduction significative par rapport à des alternatives comme FLUX.2 Klein 4B, qui atteint environ 16 Go. Leur architecture 1-bit/ternaire contribue à cette efficacité. De plus, ils sont distribués sous licence Apache-2.0, favorisant leur adoption et leur intégration.
La capacité d’exécuter ces générateurs d’images directement dans un navigateur, sans nécessiter de serveurs distants, représente une avancée notable pour l’accessibilité de l’IA générative. Cette approche permet aux utilisateurs de bénéficier de la création d’images par IA tout en conservant leurs données localement, renforçant la confidentialité et réduisant la dépendance aux infrastructures cloud.
Cette initiative de PrismML ouvre des perspectives pour le déploiement d’outils d’IA plus légers et autonomes.
Source : Reddit r/LocalLLaMA