NVIDIA a dévoilé les modèles de langage par diffusion Nemotron-Labs, une nouvelle approche de l’IA générative visant une génération de texte quasi instantanée.
Ces modèles, inspirés des processus de diffusion utilisés pour la génération d’images, se distinguent des grands modèles de langage (LLM) autoregressifs traditionnels. Contrairement à ces derniers qui produisent du texte jeton par jeton, les DLM de Nemotron-Labs génèrent l’intégralité de la séquence de texte simultanément.
Cette méthode promet une accélération considérable de la production de contenu, ouvrant la voie à des applications en temps réel. Elle offre également un contrôle accru sur les attributs du texte généré, tels que la longueur, le style ou le sentiment, tout en maintenant une qualité comparable aux modèles existants.
Bien qu’encore en phase de recherche, cette technologie pourrait transformer les interactions avec les chatbots, la création de récits interactifs ou la génération de code. NVIDIA a rendu ces modèles et leur code accessibles sur Hugging Face, encourageant ainsi l’expérimentation et le développement.
L’exploration de ces architectures par diffusion pourrait redéfinir les standards de performance et de flexibilité dans la génération de texte par IA.
Source : HuggingFace Blog