LLM научились создавать аномалии движения: прорыв в синтезе данных мобильности
Группа исследователей представила новый подход к синтезу аномалий в данных о мобильности человека. В основе работы лежит использование LLM-агентов, которые вносят поведенческие отклонения в нормальные траектории, имитируя редкие события — например, нерегулярные посещения или пропуски маршрутов.
Как отмечается в статье на arXiv, главная сложность в изучении аномалий движения — отсутствие эталонных наборов данных. Реальные траектории обычно содержат только обычное поведение, а аномалии встречаются крайне редко. Сбор таких данных вручную дорог и ограничен законами о приватности.
Предложенная архитектура работает на базе симулированных нормальных траекторий. LLM-агенты последовательно модифицируют их, добавляя осмысленные аномалии. Затем система пересчитывает маршруты с учетом картографических ограничений, чтобы физические перемещения между измененными точками были реалистичными.
Для сокращения разрыва между симуляцией и реальными данными авторы добавили контекстно-зависимую пространственную шумовую модель. Она имитирует неоднородность GPS-сенсоров в зависимости от окружения и местоположения, что делает синтезированные данные более похожими на реальные.
Разработка может быть востребована в задачах пространственного дата-майнинга, анализа транспортных потоков и систем безопасности. Возможность получать большие размеченные наборы аномалий без нарушения приватности открывает путь к созданию более точных детекторов нештатного поведения.
Исследование выполнено в формате end-to-end генеративного фреймворка. Полный текст работы доступен на arXiv под идентификатором 2606.10314.


