Ученые раскрыли механизм "якоря" в многоагентных рассуждениях LLM
Ученые разработали математическую модель, описывающую поведение многоагентных систем на основе больших языковых моделей (LLM) в процессе коллективного рассуждения. Работа, опубликованная на arXiv, показывает, что каждый агент обладает скрытым внутренним убеждением — «якорем», — которое постоянно корректирует его мнение, независимо от соседей.
Традиционные модели коллективного мнения, такие как модель ДеГроота или Фридкина-Джонсена, предполагают, что агенты сходятся к общему консенсусу в пределах диапазона исходных мнений. Однако многоагентные LLM иногда демонстрируют удивительное поведение: уверенность группы в правильном ответе может превысить изначальную уверенность любого из агентов. Новая модель с «якорем» объясняет этот эффект.
Исследователи показали, что якорь может быть восстановлен на основе только записей обсуждения. Если восстановленный якорь успешно предсказывает результаты на новых данных, это подтверждает его реальное влияние. Тестирование на нескольких открытых семействах моделей показало, что эффект якоря — спектральный: все модели в разной степени подвержены его влиянию, но различаются положением якоря.
Ключевой результат: когда якорь находится далеко от исходных мнений агентов, коллективное рассуждение выходит за пределы начального диапазона, и требуется полная замкнутая модель (closed-loop) для описания процесса. Это открытие может помочь лучше понять, как улучшить многоагентные системы и избежать нежелательной групповой поляризации.
Практическое значение работы — возможность диагностировать, действительно ли модель использует такие якоря, и, возможно, корректировать их для повышения точности рассуждений. Исследование подчеркивает, что простое усреднение мнений не всегда отражает истинный механизм работы многоагентных систем.



