Разработчики представили VegAS: проверка действий повышает надежность ИИ-агентов на 36%

Группа исследователей представила новый подход к повышению надежности воплощенных агентов, работающих на базе мультимодальных больших языковых моделей (MLLM). Фреймворк получил название Verifier-Guided Action Selection (VegAS) и предлагает механизм верификации действий на этапе логического вывода.

Основная проблема современных MLLM-агентов — хрупкость при столкновении с нестандартными сценариями, выходящими за пределы обучающей выборки. Стандартный метод цепочки мыслей (CoT) улучшает рассуждения, но не гарантирует правильного выбора действия в сложных, многозадачных ситуациях.

VegAS решает эту проблему следующим образом: вместо того чтобы полагаться на единственное декодированное действие, система генерирует набор кандидатов и с помощью специального генеративного верификатора выбирает наиболее надежный вариант. При этом сама политика агента не изменяется — верификатор работает только на этапе тестирования.

Ключевой находкой стало то, что использование готовой MLLM в качестве верификатора не дает улучшений. Поэтому авторы разработали метод синтеза данных на основе LLM: автоматически создается разнообразный набор ошибочных сценариев, который обучает верификатор распознавать потенциальные ошибки.

Эксперименты проводились в средах Habitat и ALFRED — популярных бенчмарках для воплощенных рассуждений. VegAS показал последовательное улучшение обобщения: в самых сложных задачах с несколькими объектами и длинным горизонтом планирования прирост точности составил до 36% по сравнению с сильными базовыми линиями CoT.

Разработка может найти применение в робототехнике, системах домашних помощников и автономных агентах, где требуется надежное выполнение последовательных действий в недетерминированной среде. Дальнейшие исследования планируется направить на интеграцию верификации непосредственно в процесс обучения.

Исходный код и данные для воспроизведения результатов, по заявлению авторов, будут опубликованы позже на официальной странице проекта.