xAI a introduit une nouvelle fonctionnalité, « Custom Voices », permettant aux développeurs de créer des clones vocaux personnalisés à partir d’une minute d’échantillon audio.
Cette innovation s’appuie directement sur les API Grok de transcription (Speech-to-Text) et de synthèse vocale (Text-to-Speech) que l’entreprise a récemment mises à disposition. Elle offre désormais la capacité de générer des voix numériques utilisables pour une multitude d’applications d’intelligence artificielle.
La rapidité de création, nécessitant seulement soixante secondes d’enregistrement de la parole, représente un pas significatif dans l’accessibilité du clonage vocal. Cette avancée ouvre des perspectives pour la personnalisation des interactions vocales dans des domaines variés, allant des assistants virtuels aux interfaces utilisateur spécialisées.
L’intégration de telles capacités marque une étape notable dans l’évolution de la personnalisation des interactions homme-machine par l’intelligence artificielle.
Source : The Decoder