Новый метод шаблон-онтологии исключает галлюцинации ИИ при валидации производственных данных
Группа исследователей опубликовала на arXiv препринт, описывающий принцип Template-as-Ontology — новый подход к созданию синтетических данных для валидации ИИ-агентов в производственной среде. Проблема в том, что реальные данные из MES-систем (Manufacturing Execution Systems) обычно проприетарны, обременены конфиденциальностью и зависят от вендора, что затрудняет тестирование ИИ-инструментов.
Предложенное решение использует один Python-модуль (700–770 строк кода, 45 проверенных экспортов), который служит одновременно спецификацией для пошагового симулятора производства и доменной схемой для инструментов аналитики. Такой подход обеспечивает согласованность по построению, а не через интеграцию. Метод формально определяет доменный шаблон как типизированную реляционную конфигурационную схему.
Архитектура включает пять уровней: симуляция, PostgreSQL, CDC/Iceberg lakehouse, схема «звезда» и 12 параметризованных ИИ-инструментов. Система генерирует причинно-согласованные данные в формате MES, охватывающие 66 типов сущностей в четырёх операционных доменах, отображённых на стандарт ISA-95/IEC 62264.
Валидация проведена на шести отраслевых шаблонах (аэрокосмическая, фармацевтическая, автомобильная, электронная, напитки, складская логистика) с одинаковым кодом фреймворка. Калибровочные эксперименты (60 прогонов по 10 сидов на шаблон) подтвердили параметрическую управляемость: наблюдаемые KPI находились в пределах заданных диапазонов для всех шаблонов.
В контролируемом эксперименте с галлюцинациями (72 вызова инструмента, модель Qwen3-32B) было показано, что ограниченные онтологией параметры полностью устраняют фабрикацию параметров инструмента: 0% в ограниченном режиме против 43% в неограниченном (точный тест Фишера p < 10^-12). Исследователи подчёркивают, что нулевой показатель является архитектурной гарантией и не зависит от конкретной модели.
Разработанный фреймворк предоставляет переиспользуемый уровень данных для валидации ИИ в дискретном производстве. Работа представляет практический интерес для инженеров по данным, разработчиков ИИ и специалистов по автоматизации производства.


