SkillFlow: потоковый фреймворк для ИИ-агентов превосходит бенчмарки в решении задач

Редакция RusNews 16-май, 11:36 Наука 1 Искусственный интеллект

Исследователи из анонимной группы опубликовали в архиве препринтов arXiv статью, посвященную новому фреймворку SkillFlow для управления ИИ-агентами. Система автоматизирует сложные задачи через многошаговое взаимодействие агента с динамической библиотекой навыков и замороженным исполнителем.

Основной проблемой существующих методов оркестрации стала стратегическая коллапсация при максимизации вознаграждения — агент зацикливается на одном подходе, теряя гибкость. SkillFlow решает это с помощью Tempered Trajectory Balance (TTB), регрессионной функции потерь, которая выбирает траектории пропорционально вознаграждению, сохраняя разнообразие стратегий.

Дополнительно фреймворк реализует прозрачное присвоение кредитов на каждом шаге без увеличения затрат на вывод. Механизм рекурсивной эволюции навыков определяет, когда создавать новые или удалять старые навыки, а также выявляет пробелы в принятии решений. Это замыкает цикл от обучающего сигнала к автономному росту возможностей.

Эксперименты проводились на 14 датасетах, охватывающих ответы на вопросы, математические рассуждения, генерацию кода и интерактивное принятие решений в реальных сценариях. SkillFlow значительно превзошел базовые методы (baselines) по всем категориям. Код проекта доступен на платформе anonymous.4open.science под лицензией SkillFlow-E850.

Разработка может найти применение в автоматизации процессов, где требуется последовательное выполнение множества подзадач — от написания программ до анализа данных. Авторы отмечают, что SkillFlow легче обучать и он меньше склонен к деградации при увеличении сложности.

Ожидается, что открытый код ускорит внедрение фреймворка в индустриальные ИИ-системы. Полный текст работы доступен по ссылке arXiv:2605.14089.

SkillFlow: потоковый фреймворк для ИИ-агентов превосходит бенчмарки в решении задач

Разделы

Навигация

Теги

SkillFlow: потоковый фреймворк для ИИ-агентов превосходит бенчмарки в решении задач

Читайте также

Разделы

Навигация

Теги