UP-NRPA: диалоговые ИИ научились подстраиваться под пользователя без обучения
Группа исследователей представила новый метод адаптации диалоговых систем с использованием больших языковых моделей (LLM). Разработка получила название UP-NRPA (User Portrait based Nested Rollout Policy Adaptation).
Современные диалоговые системы часто полагаются на заранее обученные модели, которые плохо реагируют на изменения в поведении пользователя. UP-NRPA решает эту проблему, используя портрет пользователя — набор характеристик, предпочтений и целей, которые обновляются в реальном времени на основе обратной связи.
В отличие от традиционных методов, UP-NRPA не требует дорогостоящего офлайн-обучения и может адаптироваться на лету. Это позволяет системе динамически подстраивать стратегию диалога под конкретного пользователя, что особенно важно в задачах переговоров и коллаборативного общения.
В ходе тестирования на двух типах диалогов (кооперативных и некооперативных) UP-NRPA продемонстрировал 100% успех в множестве диалоговых задач. Особенно впечатляющие результаты были получены в сценариях переговоров: соотношение продаж к числу предложений (sale-to-list ratio) выросло на 56,41%.
По мнению авторов, отсутствие необходимости в обучении делает UP-NRPA универсальным инструментом для систем, которые должны общаться с разными пользователями в реальном времени. Метод может найти применение в виртуальных ассистентах, службах поддержки и других областях, где важна персонализация.
Исследование опубликовано на платформе arXiv и доступно для ознакомления в формате препринта.


