Modèle vocal open source : écoute continue et décision rapide
Un nouveau modèle vocal open source, Audio Interaction, écoute en continu et décide toutes les 0,4 secondes s’il doit interagir ou rester silencieux.
Un nouveau modèle vocal open source, Audio Interaction, écoute en continu et décide toutes les 0,4 secondes s’il doit interagir ou rester silencieux.
Adobe lance un agent IA conversationnel pour la création d’images, visant une approche plus collaborative.
Google a annoncé l’intégration de la recherche vocale conversationnelle à Gmail, permettant aux utilisateurs d’interroger Gemini pour retrouver des informations précises dans leurs courriels.
Google Gemini expérimente une option « Niveau de réflexion » pour ajuster l’effort de raisonnement de l’IA et fournir des réponses plus précises.
Threads, la plateforme de Meta, expérimente une intégration de son IA, Meta AI, pour fournir du contexte en temps réel et des recommandations, à l’image de Grok.
Adobe PDF Spaces centralise vos documents pour une analyse et un partage facilités grâce à l’IA.
L’application de commande vocale de Starbucks, basée sur l’IA, a généré une expérience client frustrante lors de tests.
NVIDIA et Hugging Face ont détaillé une méthode pour ancrer les agents IA coréens dans des réalités démographiques précises grâce à des personas synthétiques.
Une IA a géré un appel d’anniversaire en relançant l’appel après être tombée sur la messagerie vocale.
Google Gemini peut désormais générer des visualisations interactives directement dans la conversation, permettant aux utilisateurs de les modifier et de les explorer.