Google a optimisé la génération de texte de ses modèles Gemma 4 en introduisant une technique de prédiction multi-jetons. Cette avancée permet d’accélérer le processus de création de contenu jusqu’à trois fois par rapport aux méthodes précédentes.
Le système repose sur un modèle auxiliaire de petite taille. Celui-ci est chargé de suggérer plusieurs jetons (unités de texte) simultanément. Le modèle principal de Gemma 4 valide ensuite ces suggestions en une seule passe, réduisant ainsi le nombre d’opérations nécessaires.
Cette amélioration technique vise à rendre les modèles ouverts de Google plus performants pour diverses applications de traitement du langage naturel, ouvrant la voie à des interactions plus fluides et rapides avec l’IA.
Source : The Decoder