Seuls trois modèles d’intelligence artificielle ont réussi à maintenir leur capital initial lors d’un test de survie de 500 jours simulant la gestion d’une startup.
Des chercheurs de l’Université de Princeton ont développé CEO-Bench, une plateforme d’évaluation où des agents IA sont chargés de diriger une entreprise de logiciels fictive. L’objectif est de survivre et de prospérer sur une période de 500 jours simulés.
Les résultats de cette expérience sont révélateurs : la majorité des modèles d’IA testés ont fait faillite avant la fin de la période. Fait marquant, une heuristique simple, basée sur des règles et ne faisant pas appel à l’IA, a surpassé la quasi-totalité des modèles d’intelligence artificielle.
Seuls trois modèles d’IA ont terminé le test avec un capital supérieur à leur mise de départ. Cette performance modeste souligne les défis actuels des IA à gérer des environnements économiques dynamiques et complexes, où la prise de décision stratégique est cruciale.
Ces résultats soulèvent des questions sur la capacité actuelle des IA à naviguer dans des environnements économiques complexes et imprévisibles.
Source : The Decoder