ReflectiChain: новый подход ИИ повышает устойчивость цепочек поставок на 33%

Группа учёных представила систему ReflectiChain, нацеленную на преодоление фундаментального разрыва между языковыми моделями и алгоритмами обучения с подкреплением в управлении цепочками поставок. Large Language Models хорошо интерпретируют политики и инструкции, но лишены физического grounding, а RL оптимизирует потоки, но не понимает неструктурированных ограничений.

ReflectiChain включает Generative Supply Chain World Model (SC-WM), которая кодирует гетерогенные сети поставок в 6-мерное графо-латентное пространство с сохранением физических законов. Второй ключевой компонент — Double-Loop Learning, разделяющий эпистемическую и алеаторную неопределённость. Первая обрабатывается через KL-ограниченную адаптацию политики, вторая — через стохастические латентные прогоны.

Для тестирования использовался бенчмарк Semi-Sim, моделирующий цепочку поставок полупроводников из 10 узлов с распространением рисков типа SIR, 6 типами возмущений и 10 шаблонами политических ограничений. На этой основе ReflectiChain улучшил Rationale Consistency Score на 33,0% (p < 0.0001, d = 2.78) и сохранил 82,3% операционной способности при adversarial шоках.

Особый интерес представляет антихрупкое поведение системы: при умеренном давлении эффективность возрастала на 40,2%. Это означает, что цепочка поставок не просто восстанавливается, а становится эффективнее под нагрузкой.

Авторы выделили три операционных эпистемических механизма: разделение неопределённости, обнаружение границ знаний и эмпирическое байесовское обновление политики. Также описаны пять категорий ограничений текущего подхода, которые станут основой для дальнейших исследований.

Работа опубликована на arXiv (ID 2606.10359) и может найти применение в логистике, производстве и управлении рисками, где критична одновременная интерпретация текстовых политик и численная оптимизация потоков.