Новое исследование: как AI находит симуляционные модели по естественно-языковым запросам

Поиск подходящих симуляционных моделей для повторного использования остаётся серьёзной проблемой в моделировании и симуляции (M&S). Когда существует множество моделей, определить, какие из них соответствуют задаче, непросто. Новые методы на основе искусственного интеллекта, особенно подходы, связанные с поиском, открывают путь к работе на семантическом уровне.

В статье arXiv:2606.30846 представлено экспериментальное исследование, изучающее влияние представления данных, эмбеддингов на базе трансформеров и стратегий поиска на обнаружение симуляционных моделей с помощью запросов на естественном языке. Авторы оценили производительность для разных типов запросов, используя стандартные метрики информационного поиска, включая recall@5 и nDCG@5.

Результаты показали, что формат данных имеет значение: модели, обученные на структурированных данных, работают иначе, чем на неструктурированных. Открытые эмбеддинги, такие как Sentence-BERT, достигают высокой производительности, сопоставимой с проприетарными решениями. Также выяснилось, что методы реранжирования становятся критически важными по мере усложнения запросов.

Исследование закладывает основу для ИИ-управляемого поиска моделей и обсуждает его роль в продвижении к ИИ-управляемой компоновке и интероперабельности. По мнению авторов, это может существенно ускорить разработку симуляций в науке и промышленности.

Таким образом, комбинация правильного представления данных, эффективных эмбеддингов и стратегий переранжирования позволяет значительно повысить точность обнаружения моделей. Работа доступна в открытом доступе на arXiv.