OpenFinGym: универсальная среда для тестирования ИИ-агентов в финансах

Группа разработчиков опубликовала на arXiv платформу OpenFinGym, призванную решить проблему фрагментированной оценки ИИ-агентов в количественных финансах. Существующие бенчмарки, как правило, сосредоточены на одной задаче, что может переоценивать возможности моделей и скрывать их слабости в обобщении, взаимодействии с реальным рынком и финансово значимых решениях.

OpenFinGym объединяет в едином интерфейсе несколько ключевых этапов финансового рабочего процесса: прогнозирование, генерацию рыночных сценариев, торговлю в реальном времени и обнаружение мошенничества. Такая комплексная проверка позволяет лучше понять, насколько агент способен справляться с взаимосвязанными задачами.

Одной из ключевых особенностей платформы является автоматизированный конвейер создания задач: он превращает публикации по количественным финансам в исполняемые пакеты. Это упрощает пополнение бенчмарка новыми тестами и помогает поддерживать актуальность задач.

OpenFinGym также включает контейнеризированную среду выполнения с верификатором на стороне хоста, который предотвращает утечку данных между тренировочным и тестовым периодами. Такая архитектура позволяет безопасно развёртывать масштабные эксперименты и избегать некорректного завышения результатов.

Для имитации реальной торговли используется движок бумажной торговли с низкой задержкой передачи данных. Платформа поддерживает отсроченное разрешение для долгосрочных прогнозов и рыночных событий, а также интеграцию с методами дообучения — Supervised Fine-Tuning и Reinforcement Learning.

Разработчики надеются, что OpenFinGym станет полезным инструментом для исследователей и практиков, работающих над созданием надёжных и интерпретируемых ИИ-агентов для финансовой сферы. Среда доступна на условиях открытого исходного кода.