Un agent d’IA surhumain domine Generals.io grâce à l’auto-apprentissage

Un agent d’intelligence artificielle entraîné par auto-apprentissage a atteint un niveau surhumain et la première place du classement mondial sur le jeu de stratégie en temps réel Generals.io.

Ce projet, initialement une thèse de master, visait à surpasser un algorithme préexistant. Les chercheurs y sont parvenus en combinant le clonage comportemental, l’ajustement par apprentissage par renforcement (RL) et une mise en forme des récompenses. Cependant, l’agent initial restait régulièrement battu par les meilleurs joueurs humains.

Une seconde phase de développement a permis de résoudre les principaux goulots d’étranglement. L’intégralité du pipeline a été réimplémentée en JAX, remplaçant les versions précédentes basées sur NumPy et PyTorch, et des « Vision Transformers » ont été utilisés. Ces améliorations ont conduit l’agent à surpasser tous les joueurs humains et à se classer numéro un du classement 1v1 de Generals.io.

Cette performance illustre le potentiel de l’auto-apprentissage par renforcement dans les jeux de stratégie en temps réel.

Source : Reddit r/MachineLearning

Catégories : Brèves IA
← Article précédentOCR : une plateforme centralise les modèles open-sourceArticle suivant →GLM-5.2 de Zhipu AI rivalise avec Claude Opus 4.7 pour un coût réduit

Restez informé de l'actualité IA

Recevez chaque semaine notre sélection des meilleures analyses sur l'intelligence artificielle.

Pas de spam. Désinscription en un clic.

Laisser un commentaire

FR EN ES