Последовательная персонализация малых языковых моделей ведёт к забыванию и нестабильности – исследование

Малые языковые модели (SLM) всё чаще рассматриваются для развёртывания на периферийных устройствах — ноутбуках и смартфонах. Это позволяет обеспечить приватность, низкую задержку и локальную персонализацию. Однако персонализация требует адаптации модели к изменяющимся данным пользователя, что ставит перед ней задачу непрерывного обучения.

В таком режиме возникает риск катастрофического забывания: изучение новой информации ухудшает производительность на ранее выученных задачах или снижает общие способности модели. Недавний бенчмарк TRACE показал, что непрерывная донастройка может значительно ухудшить общие способности больших языковых моделей.

В новом исследовании, представленном на arXiv, учёные изучили последовательную LoRA-персонализацию малых языковых моделей. Они сохраняли контрольные точки модели после каждого этапа адаптации и оценивали их на текущих задачах, ранее изученных задачах и фиксированном эталонном наборе.

Этот протокол позволил отслеживать динамику производительности, забывания и дрейфа эталонного набора во времени. Авторы показали, что лёгкие диагностические методы на основе распределения эталонного набора могут выявлять специфические для модели паттерны нестабильности.

Особенно важно, что в некоторых случаях метрики на задачах скрывают вредные изменения — модель может показывать хорошие результаты, но при этом нестабильно вести себя на эталонных данных. Это открывает новые направления для мониторинга стабильности SLM в условиях непрерывного обучения.

Результаты подчёркивают необходимость более тщательного тестирования персонализированных моделей перед внедрением. Исследователи надеются, что их работа стимулирует разработку методов раннего обнаружения нестабильности в SLM.