ИИ-фреймворк FAMOU победил в соревновании по захвату флага, создав новые тактики

Команда исследователей разработала фреймворк FAMOU, предназначенный для автоматической эволюции стратегий в соревновательных многоагентных играх с помощью больших языковых моделей (LLM). Работа опубликована на arXiv и описывает решение проблемы стагнации эволюции из-за меняющейся оценки стратегий.

Предложены три механизма: коэволюция оценщика, которая добавляет обнаруженных чемпионов в пул противников; иерархическая глубокая оценка, заменяющая шумные оценки на статистически надежные; и давление слабости, динамически увеличивающее вес самых сложных противников для преодоления плато. Эти механизмы реализованы в фреймворке FAMOU, построенном на парадигме эволюции кода на основе фундаментальных моделей.

Тестирование проводилось на задаче захвата флага MCTF 2026 в формате 3 на 3. FAMOU стабильно превзошел базовые линии при использовании двух разных LLM, достигнув наивысшего общего счета 0,526 и лучшего обобщения на невидимых противников с процентом побед 61,7%. Абляционные эксперименты подтвердили вклад каждого механизма.

Примечательно, что процесс мутации LLM породил тактические структуры, полностью отсутствовавшие в исходных стратегиях, включая поиск с опережением и адаптивное перехватывание. Это демонстрирует, что эволюция на уровне кода способна создавать нетривиальные алгоритмические инновации в adversarial-средах.

На соревнованиях AAMAS 2026 MCTF Competition эволюционированная стратегия FAMOU заняла первое место в аппаратном раунде и третье место в симуляции, что подтверждает ее переносимость в реальный мир. Оптимизированная реализация и соответствующие коды оценки доступны на GitHub.