Les World Action Models (WAMs) confèrent aux robots la capacité de simuler les conséquences de leurs actions avant de les exécuter.
Cette avancée adresse une faiblesse fondamentale de l’IA robotique actuelle. Jusqu’à présent, les modèles apprenaient à associer des mouvements à des images de caméra, sans réellement comprendre comment le monde physique se modifie suite à ces actions. Les WAMs visent à combler cette lacune.
Une nouvelle étude, qui organise une centaine de publications, met en lumière deux lignes architecturales principales pour ces modèles. Leur avantage clé réside dans leur capacité à apprendre à partir de vidéos quotidiennes ne contenant aucune étiquette d’action robotique. Ce type de données était auparavant presque inutilisable pour l’IA robotique traditionnelle.
En permettant aux robots de prévoir les effets de leurs mouvements, les World Action Models ouvrent la voie à une compréhension plus profonde et autonome de leur environnement.
Source : The Decoder