Новый метод NBSR: нейросети научились принимать решения с учётом неопределённости
Исследователи представили Neural Bayesian Sequential Routing (NBSR) — новый подход к построению нейронных сетей, основанный на байесовском последовательном накоплении доказательств. В отличие от традиционных сетей с фиксированным числом слоёв, NBSR динамически решает, когда остановиться, и даёт оценку уверенности в каждом решении.
Фреймворк моделирует вычисления как активный сбор свидетельств над иерархическим направленным ациклическим графом (DAG). Внутри используется сопряжённая модель Дирихле-Категориальной: нейронные эксперты обращаются к глобальному хранилищу знаний и извлекают векторы положительных свидетельств, которые обновляют состояние уверенности по формуле точного сопряжённого пополнения.
Для обучения применяется Gumbel-Softmax Straight-Through оценщик, позволяющий реализовать жёсткое маршрутизирование с сохранением суррогатных градиентов. Это даёт возможность сети выбирать различные пути вычислений в зависимости от входных данных.
Ключевое преимущество NBSR — встроенные механизмы количественной оценки неопределённости: точность и энтропия распределения Дирихле служат индикаторами для досрочного выхода из сети, отказа от ответа при OOD-примерах и учёта затрат на сбор доказательств. Авторы доказали, что при положительных свидетельствах полная точность Дирихле монотонно растёт вдоль любой траектории, а предельная дисперсия предсказаний ограничена — это формализует процесс последовательного уточнения гипотез.
Эмпирические испытания проведены на задачах визуальной классификации, структурированной медицинской диагностики, языкового моделирования, управления с частичной наблюдаемостью и затратного байесовского экспериментального дизайна. Результаты показывают, что NBSR достигает конкурентоспособной точности, одновременно предоставляя прозрачные трассы маршрутизации, атрибуцию доказательств по путям и адаптивное управление вычислительными ресурсами.
Таким образом, NBSR предлагает математически обоснованный фреймворк для создания интерпретируемых, модульных и ресурсоэффективных ИИ-агентов. Особенно актуально это для приложений, где важна не только точность, но и понимание того, насколько модель уверена в своём ответе — например, в медицине или автономных системах.



