POLAR: Новая система памяти для ИИ-агентов, запоминающая личные предпочтения пользователя

Мультимодальные большие языковые модели (MLLM) активно применяются в робототехнике и виртуальных ассистентах, но им часто не хватает способности запоминать долгосрочный контекст. Новая работа arXiv:2605.26256 предлагает решение — фреймворк POLAR, который добавляет агентам персонализированную память.

POLAR (Personalized Object-Learning Agent with Memory) организует историю взаимодействий в мультимодальный граф знаний. Он хранит семантическую память — о предпочтениях пользователя и визуальных концептах, а также эпизодическую — о прошлых действиях агента, например, траекториях движений.

При выполнении новой задачи агент извлекает релевантные воспоминания, чтобы интерпретировать запрос и строить план. Это особенно важно, когда команда задана неявно — например, «принеси мою любимую кружку» без указания цвета и места.

Эксперименты на нескольких архитектурах MLLM показали, что POLAR стабильно улучшает качество работы. Наибольший прирост — в сценариях, требующих многошагового вывода, отслеживания изменений предпочтений или объединения информации из нескольких сессий.

Работа демонстрирует, что добавление структурированной памяти может стать ключевым шагом к созданию по-настоящему персонализированных ИИ-помощников, способных адаптироваться к привычкам конкретного человека в физическом мире.