COOPA: модульная архитектура LLM-агентов для задач исследования операций повышает точность до 6,7 п.п.

Международная группа исследователей представила COOPA (COoperative OPerations Agent) — модульную архитектуру на основе больших языковых моделей (LLM), предназначенную для автоматизации задач исследования операций (OR). Работа опубликована в репозитории arXiv и описывает подход, сочетающий генерацию множества вариантов моделирования, их самопроверку при помощи LLM и распределение задач по разным решателям.

Классическое исследование операций требует глубоких знаний в предметной области, математической абстракции и опыта работы со специализированными решателями. Существующие LLM-системы частично автоматизируют этот процесс, но страдают от низкой точности на сложных задачах, непрозрачности результатов и ограниченной поддержки решателей. COOPA призвана устранить эти недостатки.

Архитектура состоит из трёх ключевых компонентов. Первый — итеративное моделирование на основе уверенности: система генерирует несколько кандидатов формулировки задачи, самостоятельно оценивает их по различным критериям (например, корректность ограничений и целевой функции) и выбирает лучший с помощью критерия «максимум-минимум уверенности». Второй компонент обеспечивает прослеживаемость: каждый элемент модели (переменные, параметры, ограничения) связывается с исходным текстом из постановки задачи, что позволяет человеку проверить процесс. Третий — маршрутизация к нескольким специализированным решателям в зависимости от класса задачи.

Эксперименты проводились на трёх OR-тестах, восьми различных LLM (включая модели разных размеров и архитектур) и четырёх базовых подходах в идентичных условиях. COOPA достигла наилучшей макро-усреднённой точности на шести из восьми моделей, а улучшение по сравнению с самым сильным базовым методом составило до 6,7 процентных пункта. Раздельное тестирование компонентов подтвердило значимость итеративного моделирования на основе уверенности.

Дополнительные кейсы показали пользу от возможности трассировки решений до исходных данных, а также от динамического распределения задач между решателями. Это делает COOPA не только более точной, но и интерпретируемой, что критически важно для высокоответственных решений в бизнесе, логистике, энергетике и других областях.

Разработка открывает путь к созданию более надёжных и прозрачных систем поддержки принятия решений на основе LLM, которые можно применять без глубокого погружения в математическое программирование. Дальнейшие исследования, вероятно, будут направлены на расширение числа поддерживаемых решателей и улучшение способности агента адаптироваться к новым, ранее не встречавшимся классам задач.