CHAL: фреймворк для дебатов ИИ с оптимизацией убеждений через иерархические агенты

На arXiv опубликована работа, представляющая CHAL (Council of Hierarchical Agentic Language) — новый фреймворк для многоагентных дебатов. Авторы утверждают, что текущие методы дебатов для LLM имеют структурные ограничения: дебаты ведут к мартингалам траекторий убеждений, большинство улучшений даёт простое голосование, а уверенность моделей растёт без калибровки.

CHAL нацелен на опровержимые (defeasible) области, где любое утверждение может быть опровергнуто лучшим рассуждением. Фреймворк трактует аргументацию как двигатель оптимизации убеждений.

Каждый агент использует CHAL Belief Schema — графовую структуру убеждений с байесовской архитектурой. Обновление убеждений происходит через динамику, учитывающую градиент силы тезиса как дифференцируемой цели.

Мета-когнитивные системы ценностей (эпистемология, логика, этика) вынесены в настраиваемые гиперпараметры, управляющие рассуждениями агентов и результатами принятия решений.

Серия абляционных экспериментов показала, что система ценностей арбитра определяет траектории дебатов в латентном пространстве убеждений, разнообразие участников улучшает общие убеждения, а фреймворк обобщается на разные предметные области.

CHAL является первой известной системой, которая рассматривает многоагентные дебаты как структурированную оптимизацию убеждений в опровержимых областях. Создаваемые артефакты убеждений допускают аудит, что закладывает основу для оценки аргументации и построения ИИ с прозрачными рассуждениями.