Метод MST-Direct масштабировали для точного геостатистического моделирования

Ученые представили расширенную версию метода MST-Direct для геостатистического моделирования. Исходный подход, основанный на транспортной оптимизации Синкхорна (Sinkhorn), был ограничен двумерными, безусловными и небольшими сетками. В новой работе авторы устранили три ключевых недостатка: масштабируемость, многомерность и учет жестких данных.

Первая проблема — производительность при большом числе узлов. Решением стал разреженный матчер Sinkhorn с памятью O(nC), который позволяет обрабатывать десятки тысяч точек. Вторая — расширение на несколько переменных: метод сопоставляет целевые кортежи значений с независимым FFT-MA гауссовским базисом, воспроизводящим заданную вариограмму. Третья — жесткие данные: наблюдаемые значения фиксируются в своих координатах, а базис корректируется через кригинг.

Ключевое преимущество — план транспортировки остается перестановкой целевых кортежей, поэтому многомерное совместное распределение сохраняется точно. Авторы протестировали метод на шестимерном, гетероскедастичном и сильно нелинейном распределении, используемом в прямом многомерном моделировании (DMS). Тесты включали безусловную симуляцию на сетке 200x200 и условную на сетке 100x100 с 200 точками жестких данных.

Результаты показали, что MST-Direct воспроизводит совместное распределение с нулевой ошибкой гистограммы, точно учитывает жесткие данные и корректно отражает пространственную корреляцию. Для сравнения, метод Projection Pursuit Multivariate Transform (PPMT) давал лишь приближение. Ученые отмечают, что их подход сочетает точность и масштабируемость, что делает его применимым в геологии, нефтегазовой отрасли и экологии.

Работа опубликована в репозитории arXiv (ID: 2606.07578). Разработка открывает путь к более точному моделированию сложных многомерных геопространственных данных, например, для оценки запасов полезных ископаемых или прогноза загрязнений.