Les agents vocaux maîtrisent-ils le langage mêlé ?

Les systèmes de reconnaissance vocale (ASR) actuels peinent à comprendre les clients qui mélangent plusieurs langues au cours d’une même conversation. Une nouvelle étude de ServiceNow et Hugging Face, publiée sur le blog de ce dernier, évalue les performances des modèles ASR de pointe sur ce phénomène appelé « code-switching ».

Les chercheurs ont analysé des données de conversations réelles où des employés utilisaient à la fois l’anglais et une autre langue, comme le français ou l’espagnol. Les résultats montrent que même les modèles les plus performants ont des difficultés à transcrire fidèlement ces échanges, entraînant des erreurs significatives.

Cette limitation pose un défi pour les assistants vocaux et les centres d’appels, qui visent à offrir une expérience client fluide. Améliorer la gestion du code-switching pourrait permettre à ces outils de mieux servir une clientèle internationale et diversifiée.

Source : HuggingFace Blog

Catégories : Brèves IA
← Article précédentAnthropic déploie Fable 5, son IA la plus performante, avec des garde-fousArticle suivant →IA : l'émergence de modèles moins coûteux redéfinit l'économie du secteur

Restez informé de l'actualité IA

Recevez chaque semaine notre sélection des meilleures analyses sur l'intelligence artificielle.

Pas de spam. Désinscription en un clic.

Laisser un commentaire

FR EN ES