// FRANDROID — INTELLIGENZA ARTIFICIALE
L’IA peut-elle remplacer le patron ? Cette étude répond non
L’IA sait corriger un bug ou répondre à un client. Diriger une entreprise pendant des mois, c’est une autre histoire. Trois chercheurs de l’université de Princeton, Haozhe Chen, Karthik Narasimhan et Zhuang Liu, viennent de le mesurer avec un test baptisé CEO-Bench : ils ont placé des agents d’IA à la tête d’une start-up fictive de logiciels pendant 500 jours simulés.
Chaque modèle partait avec un million de dollars en caisse et devait fixer les prix, répartir le budget marketing, surveiller la concurrence et tenir une stratégie. Le bilan n’est pas glorieux.
Sur l’ensemble des modèles testés, seuls trois ont fini avec plus d’argent qu’au départ. Selon le papier de recherche publié sur arXiv, Claude Opus 4.8 termine autour de 27,8 millions de dollars (environ 24,6 millions d’euros) et GPT-5.5 vers 21,3 millions (environ 18,9 millions d’euros), sur leur meilleur essai.
Les autres ont soit perdu de l’argent, soit fait carrément faillite avant la fin : Grok 4.20 n’a tenu que 37 jours dans le meilleur des cas, Gemini 3 Flash et DeepSeek V4 Pro n’ont pas survécu non plus. Le plus parlant : un agent « bête », codant des règles fixes sans la moindre IA, a fini avec 15,76 millions de dollars (environ 14 millions d’euros), devant la quasi-totalité des modèles de langage. Il n’a jamais réellement compris son marché, mais il a tenu sa ligne sans se saborder.
Evidemment, il y a des limites à garder en tête avant de conclure. D’abord, les résultats varient énormément d’un essai à l’autre : GPT-5.5 a oscillé entre une faillite au bout de 77 jours et un parcours complet sur 500 jours. Ensuite, un détail qui concerne directement les entreprises : quand les chercheurs lancent Claude Opus 4.7 via Claude Code, un outil conçu pour le développement logiciel, les performances chutent nettement. Les consignes pensées pour coder brident le modèle dès qu’on lui demande de gérer une entreprise. L’agent qui sait écrire du code n’est pas pour autant un bon dirigeant.
Pour l’instant, le métier de patron reste un métier d’avenir. CEO-Bench montre surtout que ces modèles peinent à enchaîner des centaines de décisions liées sous incertitude, là où ils brillent sur des tâches courtes et cadrées. Si une entreprise rêve de confier ses opérations à un agent autonome, ce travail invite clairement à garder un humain aux manettes.
Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !
C'est enregistré ! Surveillez votre boîte aux lettres, vous allez entendre parler de nous !
Les données transmises par le biais de ce formulaire sont destinées à Humanoid,
société éditrice du site Frandroid en sa qualité de responsable de traitement.
Elles ne seront en aucun cas cédées à des tiers. Ces données sont traitées sous réserve d'obtention de votre
consentement pour vous envoyer par e-mail des actualités et informations relatives aux contenus éditoriaux
publiés sur Frandroid. Vous pouvez vous opposer à tout moment à ces e-mails en cliquant
sur les liens de désinscriptions présents dans chacun d'eux. Pour plus d'informations, vous pouvez consulter
l'intégralité de notre politique de traitement
de vos données personnelles. Vous disposez d'un droit d'accès, de rectification, d'effacement,
de limitation, de portabilité et d'opposition pour motif légitime aux données personnelles vous concernant.
Pour exercer l'un de ces droits, merci d'effectuer votre demande via notre
formulaire de demandes d'exercices de droits dédié.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'améli