MOSS-TTS v1.5 : la synthèse vocale s’affine
OpenMOSS-Team lance MOSS-TTS v1.5, une mise à jour de son outil de synthèse vocale open source.
OpenMOSS-Team lance MOSS-TTS v1.5, une mise à jour de son outil de synthèse vocale open source.
Spotify déploie un outil de création de livres audio basé sur l’IA d’ElevenLabs, marquant une étape stratégique pour renforcer sa présence sur ce marché.
OpenAI a acquis Weights.gg, une startup connue pour le clonage vocal de célébrités, intégrant son équipe sans prévoir de produit autonome.
Scenema.ai a dévoilé Scenema Audio, un modèle de clonage vocal expressif et de génération de parole en « zero-shot », dont les poids et le code sont accessibles.
xAI permet désormais aux développeurs de cloner leur propre voix pour des applications d’IA grâce à sa nouvelle fonctionnalité « Custom Voices », nécessitant une minute de parole.
Google Vids enrichit ses voix synthétiques avec 30 options plus expressives, intégrant émotions et soupirs.
Google a dévoilé Gemini 3.1 Flash TTS, une nouvelle technologie de synthèse vocale IA présentée comme la prochaine génération de parole expressive.
Le modèle de synthèse vocale Chatterbox-Multilingual de Resemble AI prend désormais en charge huit langues indiennes supplémentaires grâce à une méthode de fine-tuning efficace.