DiffusionGemma : Google accélère la génération de texte IA

Google DeepMind dévoile DiffusionGemma, un nouveau modèle d’IA générant du texte jusqu’à quatre fois plus rapidement que ses prédécesseurs.

Ce gain de vitesse s’explique par une méthode de génération différente des modèles autorégressifs classiques. DiffusionGemma atteint un débit de plus de 1 000 tokens par seconde sur une carte Nvidia H100 et environ 700 tokens par seconde sur une RTX 5090.

Ce modèle ouvert promet d’améliorer l’efficacité des applications basées sur l’intelligence artificielle, ouvrant la voie à de nouvelles possibilités en matière de création de contenu.

Source : Korben

Catégories : Brèves IA
← Article précédentNVIDIA reste incontournable pour l'IA malgré les alternatives ASICArticle suivant →Jeff Bezos lève 12 milliards pour un « ingénieur général artificiel »

Restez informé de l'actualité IA

Recevez chaque semaine notre sélection des meilleures analyses sur l'intelligence artificielle.

Pas de spam. Désinscription en un clic.

Laisser un commentaire

FR EN ES