Un corpus multilingue de 9,8 millions de documents indiens mis en libre accès
Un vaste corpus multilingue de près de 9,8 millions de documents web, axé sur les langues indiennes, a été mis en libre accès sous licence CC0 sur Hugging Face.
Un vaste corpus multilingue de près de 9,8 millions de documents web, axé sur les langues indiennes, a été mis en libre accès sous licence CC0 sur Hugging Face.
IBM lance Granite Embedding Multilingual R2, des modèles d’intégration multilingues open source avec un contexte de 32K tokens.
Nemotron-OCR v2, un modèle OCR multilingue rapide et performant, est désormais disponible.
Le modèle de synthèse vocale Chatterbox-Multilingual de Resemble AI prend désormais en charge huit langues indiennes supplémentaires grâce à une méthode de fine-tuning efficace.