Google DeepMind dévoile DiffusionGemma, un nouveau modèle d’IA générant du texte jusqu’à quatre fois plus rapidement que ses prédécesseurs.
Ce gain de vitesse s’explique par une méthode de génération différente des modèles autorégressifs classiques. DiffusionGemma atteint un débit de plus de 1 000 tokens par seconde sur une carte Nvidia H100 et environ 700 tokens par seconde sur une RTX 5090.
Ce modèle ouvert promet d’améliorer l’efficacité des applications basées sur l’intelligence artificielle, ouvrant la voie à de nouvelles possibilités en matière de création de contenu.
Source : Korben