Мультиагентный метод AgentNLQ достиг 78,1% точности в NL2SQL на бенчмарке BIRD
Преобразование запросов на естественном языке в SQL (NL2SQL) остаётся сложной задачей для искусственного интеллекта. Несмотря на прогресс больших языковых моделей (LLM), точность NL2SQL пока уступает экспертам-людям. Новая работа предлагает мультиагентный подход AgentNLQ, который заметно улучшает результаты.
Метод использует несколько агентов: планировщика, оркестратора, рефлектора и модуль самокоррекции. Они совместно обрабатывают запрос, обогащают схему базы данных контекстной метаинформацией и применяют бизнес-правила пользователя. Это позволяет генерировать более точные SQL-запросы.
На тестовом наборе BIRD (Big Bench for LaRge-scale Database) AgentNLQ достиг 78,1% семантической точности. Это значимый результат, учитывая сложность бенчмарка, включающего реальные сценарии с большими базами данных. Авторы подчёркивают обобщаемость метода на разные домены.
Ключевые новшества: оптимизированный оркестратор, который управляет работой LLM для планирования и самокоррекции, и продвинутое обогащение схемы, создающее контекстную метаинформацию. Это повышает точность без увеличения размера модели.
Разработка может найти применение в корпоративных системах, где пользователям нужно получать данные из реляционных баз без знания SQL. Коммерческие продукты и open-source решения могут интегрировать подобные агентные архитектуры.







