IBM a dévoilé Granite Embedding Multilingual R2, une nouvelle génération de modèles d’intégration multilingues sous licence Apache 2.0. Ces modèles se distinguent par leur capacité à gérer un contexte étendu de 32 000 tokens, une avancée significative pour le traitement de longs documents.
La particularité de cette version réside dans ses performances remarquables pour la qualité de récupération d’informations, surpassant les modèles de taille similaire (moins de 100 millions de paramètres). Ils prennent en charge 11 langues, dont le français, et visent à faciliter la recherche et l’organisation de données multilingues.
Ces modèles ouverts sont désormais disponibles sur Hugging Face, permettant aux développeurs et aux chercheurs d’intégrer facilement des capacités de compréhension multilingue avancées dans leurs applications. L’objectif est de démocratiser l’accès à des outils performants pour l’IA multimodale.
Source : HuggingFace Blog