Новый ИИ-агент TrajGenAgent генерирует реалистичные траектории передвижения без дообучения модели

Группа исследователей опубликовала на arXiv препринт, в котором описан TrajGenAgent — новый подход к генерации реалистичных траекторий передвижения людей с использованием больших языковых моделей (LLM). Разработка направлена на решение проблемы дороговизны сбора реальных данных о мобильности и ограничений приватности.

Существующие LLM-генераторы делятся на два типа: одни полагаются на проектирование подсказок (prompt engineering) и сохраняют способность к рассуждению без примеров, но не обеспечивают детальной пространственно-временной привязки; другие используют тонкую настройку на уровне траекторий, что повышает статистическую точность, но требует значительных вычислительных ресурсов и может ослабить общие рассуждения модели.

TrajGenAgent обходит эти ограничения. Его архитектура включает два этапа: на первом этапе LLM синтезирует цепочку активностей, привязанных к конкретному человеку и дню недели, на основе исторических данных через внутриконтекстное обучение (in-context learning). Второй этап — детерминированный workflow, который преобразует каждую активность в полную точку посещения с помощью персонализированного поиска точек интереса (POI), выбора местоположения с учётом расстояния, распространения времени поездки с учётом кинематики и оценки длительности на основе LLM.

Для оценки реалистичности авторы предложили новый фреймворк на основе детекции аномалий, использующий два взаимодополняющих детектора для проверки поведенческой и семантической правдоподобности. Такой подход позволяет оценивать качество генерации не только по агрегированным пространственно-временным статистикам, но и на уровне отдельных траекторий.

Эксперименты на эталонном наборе данных и крупномасштабном симуляционном наборе показали, что TrajGenAgent превосходит репрезентативные нейросетевые и LLM-базлайны по пространственно-временной точности (spatiotemporal fidelity), семантической согласованности (semantic coherence) и поведенческой реалистичности, характерной для конкретных индивидов. При этом метод не требует обновления параметров модели.

Разработка может найти применение в транспорте, городском планировании и моделировании распространения эпидемий, где требуются качественные синтетические данные о передвижении людей. Отказ от дообучения делает метод энергоэффективным и доступным для широкого круга исследователей.