L’équipe OpenMOSS-Team a dévoilé MOSS-TTS v1.5, une mise à jour de son système de synthèse vocale open source.
Cette nouvelle version conserve les capacités de son prédécesseur, MOSS-TTS 1.0, telles que le clonage vocal en zéro coup (zero-shot), la génération de discours de longue durée, le contrôle de la durée au niveau du token, et la gestion des prononciations en Pinyin et IPA.
MOSS-TTS v1.5 améliore notamment la gestion multilingue et le code-switching. Les détails complets des fonctionnalités et des améliorations sont disponibles sur Hugging Face.
Cette évolution ouvre la voie à des applications vocales plus nuancées et personnalisées.
Source : Reddit r/LocalLLaMA