La start-up fondée par Mira Murati, Thinking Machines Lab, a dévoilé son premier modèle d’intelligence artificielle, cherchant à dépasser le format question-réponse pour l’IA vocale.
Ce nouveau modèle traite simultanément des données audio, vidéo et textuelles par fragments de 200 millisecondes. L’objectif est d’offrir une qualité d’interaction supérieure à celle des offres actuelles comme GPT Realtime 2 d’OpenAI ou Gemini Live de Google.
Thinking Machines Lab soutient que l’interactivité est le point faible de l’approche d’OpenAI dans le domaine de la voix. La jeune entreprise mise sur une compréhension plus fluide et réactive pour redéfinir l’expérience utilisateur.
Source : The Decoder