Qwen3.7-Plus : Alibaba lance un agent multimodal autonome
L’équipe Qwen d’Alibaba a dévoilé Qwen3.7-Plus, un modèle d’agent multimodal qui combine perception visuelle, opération d’interface graphique et codage.
L’équipe Qwen d’Alibaba a dévoilé Qwen3.7-Plus, un modèle d’agent multimodal qui combine perception visuelle, opération d’interface graphique et codage.
La start-up chinoise DeepSeek a intégré des capacités multimodales à son chatbot phare, lui permettant de traiter images et vidéos en plus du texte.
Le modèle d’IA Qwen 3.6-35B-A3B, doté de capacités multimodales et d’une architecture MoE, est désormais open source.
Une étude révèle que les modèles d’IA multimodaux préfèrent inventer des réponses plutôt que de solliciter des informations manquantes auprès des utilisateurs.