Un projet open-source, NagaTranslate, développe des outils de traduction et de synthèse vocale pour les langues peu documentées du Nagaland, en Inde. L’initiative vise à combler le manque de données parallèles disponibles pour ces dialectes, principalement oraux.
Le système s’appuie sur des technologies d’intelligence artificielle telles que Whisper pour la reconnaissance vocale, VITS pour la synthèse vocale, et des grands modèles de langage (LLM) pour la traduction. Actuellement, NagaTranslate prend en charge le Nagamèse, l’Ao et le Sema, trois des nombreuses langues parlées dans cette région.
Ce travail soulève la question de l’application des avancées de l’IA à des contextes linguistiques marginalisés, ouvrant la voie à la préservation et à la diffusion de patrimoines culturels menacés.
Source : Reddit r/MachineLearning