MOSS-TTS v1.5 : la synthèse vocale s’affine

L’équipe OpenMOSS-Team a dévoilé MOSS-TTS v1.5, une mise à jour de son système de synthèse vocale open source.

Cette nouvelle version conserve les capacités de son prédécesseur, MOSS-TTS 1.0, telles que le clonage vocal en zéro coup (zero-shot), la génération de discours de longue durée, le contrôle de la durée au niveau du token, et la gestion des prononciations en Pinyin et IPA.

MOSS-TTS v1.5 améliore notamment la gestion multilingue et le code-switching. Les détails complets des fonctionnalités et des améliorations sont disponibles sur Hugging Face.

Cette évolution ouvre la voie à des applications vocales plus nuancées et personnalisées.

Source : Reddit r/LocalLLaMA

Catégories : Brèves IA
← Article précédentL'encyclique du Pape sur l'IA aurait-elle été rédigée par une IA ?Article suivant →Samsung : des bonus liés à l'IA pour les employés après un accord

Restez informé de l'actualité IA

Recevez chaque semaine notre sélection des meilleures analyses sur l'intelligence artificielle.

Pas de spam. Désinscription en un clic.

Laisser un commentaire

FR EN ES