Символическая обратная связь повысила надежность планирования LLM
Большие языковые модели (LLM) все чаще применяются для планирования, но сталкиваются с проблемами надежности в долгосрочных задачах — решения часто оказываются невыполнимыми или ошибочными. Новое исследование предлагает фреймворк итеративного самоуточнения с символической обратной связью, который призван повысить устойчивость LLM.
Метод включает три ключевых компонента. Во-первых, механизм подсказок на естественном языке отображает логические символы в текстовые описания, помогая модели лучше понимать ограничения и семантику задачи. Во-вторых, символьный верификатор идентифицирует ошибки и преобразует их в корректирующие инструкции, понятные LLM, направляя процесс самоуточнения.
Третий компонент — распознаватель планов, который оценивает достижимость цели и обеспечивает более эффективное продвижение к желаемому результату. Совокупность этих элементов позволяет модели исправлять собственные ошибки без внешнего вмешательства.
Эмпирические результаты демонстрируют последовательное улучшение как осуществимости, так и корректности планов. По данным исследования, предложенный подход значительно превосходит базовые методы в длинных горизонтах планирования.
Авторы работы подчеркивают, что разработка способна повысить доверие к системам на основе LLM за счет снижения числа невыполнимых или неверных решений. Это особенно актуально для приложений, где требуется последовательное выполнение множества шагов — от робототехники до управления процессами.
Исследование опубликовано на платформе arXiv и привлекает внимание сообщества ИИ как практичный шаг к более надежным языковым моделям. В перспективе метод может быть интегрирован в существующие системы планирования для повышения их устойчивости.






