GraphBit: графовый фреймворк решил проблему галлюцинаций LLM-агентов, показав рекордную точность
Исследователи представили GraphBit — фреймворк для оркестровки LLM-агентов, решающий ключевые проблемы существующих подходов. В основе лежит направленный ациклический граф (DAG), который задаёт workflow явно и детерминированно. В отличие от промпт-оркестровки, где языковая модель сама определяет последовательность действий, GraphBit исключает галлюцинации, бесконечные циклы и невоспроизводимость выполнения.
Архитектура фреймворка включает Rust-движок, управляющий маршрутизацией, переходами состояний и вызовом инструментов. Движок поддерживает параллельное выполнение веток, условные переходы на основе предикатов и настраиваемое восстановление после ошибок. Это обеспечивает полную воспроизводимость и аудируемость работы агентов.
Особое внимание уделено управлению памятью. GraphBit использует трехуровневую архитектуру: эфемерное черновиковое пространство, структурированное состояние и внешние коннекторы. Такая изоляция контекста предотвращает лавинообразное разрастание данных, которое ухудшает качество рассуждений в длительных цепочках запросов.
Тестирование на бенчмарке GAIA, включающем задачи без инструментов, с документами и веб-активностями, показало значительное превосходство GraphBit. Фреймворк достиг наивысшей точности — 67,6%, при нулевом количестве галлюцинаций, индуцированных самой системой. Средняя задержка составила всего 11,9 мс, а пропускная способность оказалась самой высокой среди участников.
Абляционные исследования подтвердили вклад каждого уровня памяти в итоговую производительность. Наибольший прирост дало детерминированное выполнение, особенно критичное для задач с интенсивным использованием инструментов, характерных для реальных промышленных сценариев.
Разработчики отмечают, что GraphBit ориентирован на применение в продакшене, где важны стабильность, масштабируемость и предсказуемость. Подход позволяет строить сложные мультиагентные пайплайны без риска потери контроля над процессом, открывая новые возможности для автоматизации задач.





