NVIDIA optimise Nemotron avec la génération de données synthétiques TS-SDG
NVIDIA a développé la méthode TS-SDG pour générer des données synthétiques de haute qualité, optimisant ainsi le pré-entraînement de ses modèles de langage comme Nemotron.
NVIDIA a développé la méthode TS-SDG pour générer des données synthétiques de haute qualité, optimisant ainsi le pré-entraînement de ses modèles de langage comme Nemotron.
Pollen Robotics et Hugging Face ont intégré les outils MCP (Multi-Contact Point) au bras robotique Reachy Mini, améliorant ses capacités de manipulation d’objets.
L’optimisation des préférences directes (DPO) étend son influence au-delà des chatbots pour d’autres modèles d’IA.
Microsoft a dévoilé sept modèles d’IA internes, dont MAI-Thinking-1, marquant une étape vers une plus grande autonomie technologique face à OpenAI.
Une nouvelle alpha, datasette-agent-micropython 0.1a0, permet d’exécuter du code Python généré par IA en toute sécurité.
Holo3.1 est un nouveau cadre open-source permettant de créer des agents d’IA capables d’interagir rapidement et localement avec un ordinateur, simulant l’usage humain.
JetBrains présente Mellum2, un modèle d’IA innovant de 12 milliards de paramètres basé sur l’architecture Mixture-of-Experts.
L’adoption de l’IA en entreprise à grande échelle dépendra de la logique des agents, au-delà des capacités des LLM.
MiniMax, acteur de l’IA, annonce une nouvelle version de son modèle d’ici dix jours, soulevant des interrogations sur sa taille.
NVIDIA lance Cosmos 3, un modèle IA ouvert pour le raisonnement et l’action dans le monde physique.