POLAR: Новая система памяти для ИИ-агентов, запоминающая личные предпочтения пользователя
Мультимодальные большие языковые модели (MLLM) активно применяются в робототехнике и виртуальных ассистентах, но им часто не хватает способности запоминать долгосрочный контекст. Новая работа arXiv:2605.26256 предлагает решение — фреймворк POLAR, который добавляет агентам персонализированную память.
POLAR (Personalized Object-Learning Agent with Memory) организует историю взаимодействий в мультимодальный граф знаний. Он хранит семантическую память — о предпочтениях пользователя и визуальных концептах, а также эпизодическую — о прошлых действиях агента, например, траекториях движений.
При выполнении новой задачи агент извлекает релевантные воспоминания, чтобы интерпретировать запрос и строить план. Это особенно важно, когда команда задана неявно — например, «принеси мою любимую кружку» без указания цвета и места.
Эксперименты на нескольких архитектурах MLLM показали, что POLAR стабильно улучшает качество работы. Наибольший прирост — в сценариях, требующих многошагового вывода, отслеживания изменений предпочтений или объединения информации из нескольких сессий.
Работа демонстрирует, что добавление структурированной памяти может стать ключевым шагом к созданию по-настоящему персонализированных ИИ-помощников, способных адаптироваться к привычкам конкретного человека в физическом мире.



