Онтологическая архитектура снизила уровень галлюцинаций ИИ-агентов с 43% до 0%

Учёные из международной исследовательской группы опубликовали на arXiv препринт, в котором описали проблему семантического разрыва у ИИ-агентов, используемых в промышленности. Несмотря на статистическое владение терминологией, модели часто не понимают операционную семантику — взаимосвязи между идентификаторами оборудования, параметрами процессов, кодами ошибок и нормативными требованиями.

Авторы назвали это явление семантическим тренировочным разрывом. Оно приводит к тому, что даже лингвистически корректные ответы могут быть операционно неверными. В многокомпонентных конфигурациях возникает семантический дрейф — нарастающая ошибка при передаче данных между агентами.

Для решения проблемы предложена архитектура, встраивающая промышленную онтологию прямо в слой инструментов ИИ. Она реализована как типизированная реляционная конфигурация: три операции (resolve, contextualize, annotate) с инвариантами, контролируемыми уровнем AIOps.

В контролируемом эксперименте с моделью Qwen3-32B на шести промышленных конфигурациях (72 вызова инструментов) неограниченные параметры давали 43% галлюцинаций для доменных идентификаторов. Применение онтологически обоснованных параметров снизило этот показатель до 0%.

Разработчики отмечают, что единая кодовая база с конфигурациями онтологий для разных доменов позволяет полностью исключить галлюцинации при вызовах инструментов и добиться кросс-доменной настройки без изменения кода приложения. Технология была проверена на платформе цифровых двойников.

Исследование поднимает вопрос о необходимости перехода от статистического обучения к семантически обоснованным агентам в промышленности. Предложенная архитектура может стать основой для надежных AI-систем в производстве и других регулируемых отраслях.