OpenAI lance un nouvel agent d’intelligence artificielle à usage général dans ChatGPT, qui, selon l’entreprise, peut accomplir une grande variété de tâches informatiques pour les utilisateurs. OpenAI affirme que l’agent peut automatiquement naviguer dans le calendrier d’un utilisateur, générer des présentations et des diapositives modifiables, et exécuter du code.
L’outil, appelé agent ChatGPT, combine plusieurs capacités des outils agentic précédents d’OpenAI, y compris la capacité de Operator à naviguer sur des sites Web, ainsi que la capacité de Deep Research à synthétiser des informations provenant de dizaines de sites Web dans un rapport de recherche concis. OpenAI affirme que les utilisateurs pourront interagir avec l’agent en interpellant simplement ChatGPT en langage naturel.
Jeudi, OpenAI lance l’agent ChatGPT pour les abonnés de ses plans Pro, Plus et Team. Pour activer l’outil, les utilisateurs peuvent sélectionner le mode « agent » dans le menu déroulant des outils de ChatGPT.
Le lancement de l’agent ChatGPT représente la tentative la plus audacieuse d’OpenAI à ce jour de transformer ChatGPT en un produit agentic capable d’accomplir des actions et de décharger des tâches pour les utilisateurs, plutôt que de simplement répondre à des questions. Au cours des dernières années, des entreprises de la Silicon Valley telles qu’OpenAI, Google et Perplexity ont dévoilé des dizaines d’agents d’intelligence artificielle qui ont promis de le faire. Cependant, ces premières versions d’agents d’intelligence artificielle ont du mal avec des tâches complexes et semblent moins convaincantes en tant que produits que la vision ultime que les dirigeants technologiques présentent autour des agents d’intelligence artificielle.
Cela dit, OpenAI affirme que l’agent ChatGPT est bien plus capable que ses offres précédentes.
Le nouvel agent d’OpenAI peut accéder aux connecteurs de ChatGPT, permettant aux utilisateurs de connecter des applications telles que Gmail et GitHub afin que l’agent puisse trouver des informations pertinentes en réponse à vos demandes. De plus, OpenAI affirme que l’agent ChatGPT a accès à un terminal et peut utiliser des APIs pour accéder à certaines applications.
Le modèle sous-jacent de l’agent ChatGPT offre des performances de pointe sur plusieurs benchmarks, selon OpenAI.
L’entreprise affirme que le modèle de l’agent ChatGPT obtient un score de 41,6 % à l’examen final de l’humanité (pass@1), un test difficile composé de milliers de questions dans plus d’une centaine de sujets. C’est environ le double de ce que les modèles o3 et o4-mini d’OpenAI ont obtenu lors de ce test.
Sur FrontierMath, l’un des benchmarks mathématiques les plus difficiles connus, OpenAI affirme que l’agent ChatGPT obtient un score de 27,4 % lorsqu’il a accès à des outils tels qu’un terminal pour l’exécution de code. Le score précédent de pointe provient du modèle o4-mini, qui n’a obtenu que 6,3 %.
OpenAI souligne qu’elle a développé l’agent ChatGPT en tenant compte de la sécurité, principalement parce que le produit présente certaines capacités nouvelles qui pourraient le rendre plus dangereux entre de mauvaises mains. Cependant, il reste à voir dans quelle mesure l’agent ChatGPT est réellement capable.


