LLM-агенты показали 57,9% успеха в управлении группами дронов с MultiUAV-Plat
Исследователи разработали MultiUAV-Plat — платформу, ориентированную на большие языковые модели (LLM), для планирования совместных задач групп дронов. Она восполняет пробел в существующих симуляторах, которые фокусируются на динамике и управлении, но не учитывают ограничения, связанные с частичной наблюдаемостью, пространственным покрытием и координацией нескольких аппаратов.
Платформа предоставляет простые RESTful API и наблюдения для агентов, ролевой доступ к информации, скрытую логику валидации и опциональную 2D/3D визуализацию. Это позволяет LLM-агентам решать миссии через реалистичное взаимодействие с инструментами, а не через привилегированный доступ к симулятору.
На основе платформы создан MultiUAV-Plat Benchmark, включающий 75 миссий, 1500 задач на естественном языке и 9396 проверок валидации по сценариям назначения целей, поиска в области и патрулирования.
В рамках работы также представлен Agent4Drone — специализированный фреймворк для LLM-агентов, который структурирует поведение дронов в блоки: память, наблюдение, понимание задачи, планирование, выполнение и верификация.
В сравнительном тестировании Agent4Drone показал 57,9% успешного выполнения задач (task pass rate), 74,6% среднего прохождения проверок задач и 72,0% глобального прохождения проверок. Для сравнения, ReAct baseline достиг лишь 30,6%, 47,9% и 43,1% соответственно. Доля полностью неудачных задач снизилась с 32,4% до 12,9%.
Результаты демонстрируют, что MultiUAV-Plat и бенчмарк обеспечивают воспроизводимую основу для изучения LLM-управления мультидронными системами в условиях реальных ограничений информации и выполнения.



