Un corpus multilingue de 9,8 millions de documents indiens mis en libre accès
Un vaste corpus multilingue de près de 9,8 millions de documents web, axé sur les langues indiennes, a été mis en libre accès sous licence CC0 sur Hugging Face.
Un vaste corpus multilingue de près de 9,8 millions de documents web, axé sur les langues indiennes, a été mis en libre accès sous licence CC0 sur Hugging Face.
Le Machine Learning Reproducibility Challenge (MLRC) 2026 est désormais une section officielle de NeurIPS 2026, ouvrant ses soumissions.
Une nouvelle approche, nommée Sub-JEPA, améliore significativement LeWorldModel, un modèle de monde du groupe de Yann LeCun, en corrigeant une rigidité de sa représentation latente.
Le modèle d’IA Composer 2.5 de Cursor atteint les performances d’Opus 4.7 et GPT-5.5 sur les benchmarks, pour un coût bien inférieur.
Le MIT Technology Review AI a organisé un panel d’initiés pour décrypter les signaux et tendances qui façonneront l’avenir de l’intelligence artificielle.
Alors que Google ouvre sa conférence I/O, l’entreprise est classée troisième dans la course aux modèles de fondation, selon le MIT Technology Review.
Dropbox a lancé Witchcraft, un projet open source offrant un moteur de recherche sémantique local et rapide, basé sur SQLite et fonctionnant sans dépendances externes.
L’entreprise de défense Anduril et Meta développent un casque de réalité augmentée pour l’armée, permettant potentiellement de commander des frappes de drones par suivi oculaire et commandes vocales.
Le couplage résiduel (RC) permet de connecter des modèles de langage (LLM) pré-entraînés en parallèle sans modifier leurs poids, optimisant leur mise à l’échelle.
Un membre de l’équipe open source de Hugging Face relance PapersWithCode, une plateforme clé pour la recherche en IA, délaissée après son acquisition par Meta.