DeepMind dévoile DiffusionGemma, un modèle de langage capable de générer du texte quatre fois plus rapidement que les approches antérieures.
Ce nouveau modèle s’appuie sur une architecture de diffusion, une technique jusqu’alors principalement utilisée pour la génération d’images. En l’adaptant à la production de texte, les chercheurs de Google ont réussi à améliorer significativement la vitesse d’inférence.
L’objectif est de rendre les modèles de langage plus efficaces et accessibles, ouvrant la voie à des applications plus réactives et à une consommation de ressources informatiques réduite. L’efficacité accrue pourrait accélérer la recherche et le développement dans le domaine du traitement automatique du langage naturel.
La publication de ces travaux soulève des questions sur l’évolution des architectures de modèles pour la génération de texte.
Source : DeepMind Blog