Arbor: новый фреймворк с деревом поиска ускоряет оптимизацию LLM до 193%

Команда разработчиков опубликовала в arXiv описание фреймворка Arbor, который вводит структурированный поиск по дереву в качестве когнитивного слоя для автономных агентов, работающих в больших пространствах действий с состоянием. В отличие от предыдущих систем, нацеленных на изолированные цели с оценкой без сохранения состояния, Arbor поддерживает явное дерево поиска оценённых гипотез, служащее общей рабочей памятью всех агентов.

Дерево эволюционирует с каждым измерением: неудачи трактуются как диагностические сигналы, меняющие последующее исследование, а успехи смещают распределение узких мест. Такой подход позволяет системе адаптироваться и эффективно распределять ресурсы.

Arbor был протестирован на полной оптимизации инференса LLM — задаче, для достижения пиковой производительности которой обычно требуется скоординированная работа инженеров по всему стеку: приложение, фреймворк, компилятор, ядро и аппаратное обеспечение.

Фреймворк включает два типа агентов: Оркестратор, который управляет оптимизацией, делегируя задачи специалистам доменов, и Критик, обеспечивающий стабильность через анализ коренных причин, интроспекцию и проверку измерений. Эта архитектура сдержек и противовесов не позволяет ни одному агенту в одностороннем порядке управлять системой.

Навыки агентов разделены на жёсткие (экспертиза в предметной области) и мягкие (протоколы координации, определяющие, как объединяются вклады), что позволяет проводить полностью автономные многодневные кампании. В экспериментах Arbor достиг до 193% улучшения по Парето-кривой пропускной способности и задержки по сравнению с оптимизированными решениями вендора.

Для сравнения: отдельный агент без использования фреймворка давал прирост пропускной способности лишь на 33% и аварийно завершал работу в течение нескольких часов. Arbor продемонстрировал устойчивость на нескольких поколениях аппаратных платформ, а разброс результатов от запуска к запуску не превысил 2 процентных пункта, что говорит о воспроизводимости и аппаратной независимости метода.