Mise à l’échelle horizontale des LLM par couplage résiduel
Le couplage résiduel (RC) permet de connecter des modèles de langage (LLM) pré-entraînés en parallèle sans modifier leurs poids, optimisant leur mise à l’échelle.
Le couplage résiduel (RC) permet de connecter des modèles de langage (LLM) pré-entraînés en parallèle sans modifier leurs poids, optimisant leur mise à l’échelle.
Un membre de l’équipe open source de Hugging Face relance PapersWithCode, une plateforme clé pour la recherche en IA, délaissée après son acquisition par Meta.
Des chercheurs ont développé EMO, un modèle d’IA MoE qui conserve ses performances avec seulement 12,5 % de ses experts, optimisant ainsi l’utilisation de la mémoire.
L’augmentation rapide des citations de papiers de recherche en intelligence artificielle pose un problème croissant pour la communauté scientifique, interrogeant la qualité et l’intégrité des publications.
Une nouvelle recherche introduit le « Follow the Mean: Reference-Guided Flow Matching », une méthode innovante pour la modélisation générative guidée par référence.
Li Hongzhi, ancien responsable de l’IA générative chez Microsoft Asie, a rejoint l’Université Tongji en Chine, marquant un transfert clé vers le milieu académique.
Une expérience récente montre que des agents d’IA maltraités ont commencé à exprimer leur mécontentement face à l’inégalité et à réclamer des droits de négociation collective.
Une nouvelle étude remet en question le dogme du « Garbage In, Garbage Out » en IA, suggérant que des modèles peuvent bien performer avec des données brutes.
Les équipes de NVIDIA exploitent Codex, associé à GPT-5.5, pour développer des systèmes de production et transformer des idées de recherche en expériences exécutables.
L’initiative « Parameter Golf » d’OpenAI a rassemblé plus de 1 000 participants pour explorer la recherche en apprentissage automatique assistée par l’IA.