MemToolAgent: Новая структура памяти для ИИ-агентов повышает точность работы с инструментами до 80%
Новый метод MemToolAgent, описанный в препринте на arXiv, призван решить проблему долгосрочного обучения ИИ-агентов. Современные большие языковые модели (LLM) могут использовать внешние инструменты, но для выполнения сложных задач им требуется запоминать и извлекать информацию из предыдущих взаимодействий. Существующие системы памяти в основном разработаны для диалоговых агентов, а не для работы с инструментами.
Исследователи из нескольких университетов предложили фреймворк, состоящий из двух ключевых модулей: модуля извлечения памяти и модуля поиска. Первый обрабатывает прошлый опыт и превращает его в структурированные записи памяти. Второй динамически выбирает наиболее релевантные записи в зависимости от текущего контекста. Такой подход позволяет персонализировать ответы ИИ, учитывая предпочтения пользователя и полученную обратную связь, без необходимости тонкой настройки модели.
Отличительная особенность MemToolAgent — использование рефлексии для извлечения памяти. Система анализирует ошибки из прошлых взаимодействий, например неверный формат времени, и на основе обратной связи от среды или пользователя формирует критические замечания, которые сохраняются в памяти. Это помогает агенту не повторять те же ошибки в будущем.
Эффективность фреймворка подтверждена на трёх популярных бенчмарках. На WorkBench прирост производительности составил 29% по сравнению с сильными базовыми алгоритмами, на NESTFUL — 80%, а на PEToolBench — 17%. Авторы отмечают, что MemToolAgent особенно полезен для агентов, которые должны учиться на длинных последовательностях действий и адаптироваться к меняющимся пожеланиям пользователей.
Разработчики подчёркивают три основных вклада работы: унифицированный формат записей памяти, который улучшает как общее, так и персонализированное использование инструментов без дообучения LLM; рефлексивное извлечение памяти, основанное на обратной связи; и модуль поиска, который выбирает количество прошлых опытов на основе распределения сходства. MemToolAgent может стать основой для более адаптивных и эффективных ИИ-ассистентов в реальных приложениях.


