L’équipe Bing de Microsoft a rendu public Harrier, un modèle d’intégration capable de traiter plus de 100 langues. Ce modèle s’est classé premier du benchmark multilingue MTEB v2.
Les modèles d’intégration, ou « embeddings », transforment des données textuelles en vecteurs numériques. Ces vecteurs permettent aux systèmes d’IA de comprendre les relations sémantiques entre les mots et les phrases.
La disponibilité de Harrier en open source pourrait accélérer la recherche et le développement dans le domaine du traitement automatique du langage naturel, notamment pour les applications multilingues.
Source : The Decoder