Нейросеть научилась подсказывать игрокам в StarCraft II на основе 23 тысяч реплеев чемпионов
Группа исследователей разработала метод, позволяющий ИИ давать персонализированные рекомендации по улучшению игры в StarCraft II. Работа основана на фреймворке Latent Maps of Performance, который генерирует контрфактические траектории в латентном пространстве — от проигрышных паттернов к выигрышным.
В основе лежит Guided Variational Autoencoder (VAE), обученный на 23 305 реплеях профессиональных турниров. Модель не просто анализирует действия чемпионов, а находит способы «достроить» путь обычного игрока до уровня топ-игроков, сохраняя реалистичность шагов.
Авторы предложили и протестировали четыре стратегии генерации таких траекторий: линейную интерполяцию, итерационный оптимальный транспорт, градиентный подъём с регуляризацией плотности и нейронный потоковый мэтчинг. Каждый метод создаёт многошаговые цепочки улучшений, оставаясь в рамках наблюдаемого экспертного поведения.
Эксперименты проводились на аут-оф-дистрибуции данных — случайной выборке любительских реплеев. Результаты показали, что разные стратегии лучше подходят для игроков с разным уровнем: например, линейная интерполяция даёт плавные изменения, а градиентный подъём — более агрессивные скачки в мастерстве.
Разработка заполняет пробел для стратегий в реальном времени (RTS): в отличие от шахмат или го, где ИИ давно помогает тренироваться, для StarCraft II не было принципиального фреймворка для перевода экспертных знаний в практические советы. Исследователи надеются, что их работа вдохновит дальнейшие исследования в создании ИИ-решений, ориентированных именно на улучшение человеческих игроков, а не на их поражение.
Полный текст работы доступен на arXiv под номером 2607.00190.



