Les entreprises rencontrent un problème persistant avec la mémoire des agents, car ces derniers oublient certaines instructions ou conversations au fur et à mesure de leur fonctionnement. Anthropic pense avoir résolu ce problème avec son SDK Claude Agent, en développant une solution à double volet permettant à un agent de travailler sur différents contextes.
Le problème de la mémoire des agents
Les agents étant construits sur des modèles de base, ils restent limités par les fenêtres de contexte limitées, bien que continuellement croissantes. Pour les agents à longue durée de fonctionnement, cela pourrait créer un problème plus important, les amenant à oublier des instructions et à se comporter anormalement lors de l’exécution d’une tâche. Améliorer la mémoire des agents devient essentiel pour garantir des performances cohérentes et sécurisées pour l’entreprise.
Plusieurs méthodes ont émergé au cours de l’année écoulée, toutes visant à combler le fossé entre les fenêtres de contexte et la mémoire des agents. Les solutions proposées par LangChain, Memobase et Swarm d’OpenAI en sont des exemples. La recherche sur la mémoire des agents a également explosé récemment, avec des cadres proposés tels que Memp et le Nested Learning Paradigm de Google offrant de nouvelles alternatives pour améliorer la mémoire.
Comment cela fonctionne
Anthropic a identifié que même si le SDK Claude Agent avait des capacités de gestion du contexte, il n’était pas suffisant pour permettre à un agent de continuer à travailler de manière utile pendant une durée indéfinie. L’entreprise a constaté que le modèle Opus 4.5 exécutant le SDK Claude Agent pouvait ne pas être capable de construire une application web de qualité de production s’il ne recevait qu’une instruction générale, par exemple « construire un clone de claude.ai ».
Les chercheurs d’Anthropic ont proposé une solution en mettant en place un environnement initial pour poser les bases des fonctionnalités et en incitant chaque agent à progresser de manière incrémentielle vers un objectif, tout en laissant une page blanche à la fin. C’est là que la solution à deux volets de l’agent d’Anthropic intervient. L’agent initialisateur met en place l’environnement, en enregistrant ce que les agents ont fait et quels fichiers ont été ajoutés. L’agent de codage demandera ensuite aux modèles de progresser de manière incrémentielle et de laisser des mises à jour structurées.
Recherche future
Anthropic a souligné que son approche est « un ensemble possible de solutions dans un harnais d’agent à longue durée de fonctionnement ». Cependant, il s’agit seulement du début de ce qui pourrait devenir un domaine de recherche plus vaste pour de nombreux acteurs du secteur de l’IA. L’entreprise a déclaré que ses expériences pour renforcer la mémoire à long terme des agents n’ont pas montré si un agent de codage généraliste unique fonctionne mieux dans tous les contextes ou une structure multi-agents. Son démonstrateur s’est également concentré sur le développement d’applications web full-stack, donc d’autres expériences devraient se concentrer sur la généralisation des résultats à différentes tâches.
En conclusion, Anthropic a apporté des améliorations significatives à son SDK Claude Agent en proposant une solution innovante pour résoudre le problème de la mémoire des agents à longue durée de fonctionnement. Cette approche à deux volets offre un moyen efficace de gérer la mémoire des agents et de garantir des performances cohérentes dans un large éventail de tâches.


