Учёные научили ИИ разделять эффекты сканеров и биологию в коннектомах

Специалисты в области нейровизуализации предложили новый подход к анализу структурных коннектомов, полученных с помощью диффузионной МРТ. Их метод — Joint-VAE с архитектурным аннелированием — позволяет автоматически разделять данные на компоненты, связанные с различиями в оборудовании и протоколах сканирования, и компоненты, отражающие истинные биологические особенности мозга.

Проблема разброса данных между разными клиниками и сканерами давно осложняет объединение результатов исследований. Обычные методы снижения размерности, такие как PCA, смешивают все источники вариации в непрерывном пространстве, из-за чего эффекты оборудования «перекрывают» биологию. Гибридные модели с дискретными и непрерывными компонентами требуют ручной настройки, чтобы дискретная часть захватывала именно нужные различия.

Авторы избавились от этой ручной настройки, введя архитектурное аннелирование: на этапе обучения они постепенно «выключают» часть нейронов в кодировщике, заставляя модель адаптивно распределять информацию между дискретным и непрерывным латентными пространствами. В результате дискретные компоненты естественным образом группируют данные по комбинациям сканер-протокол.

Для проверки метода собрана крупная выборка: 7416 структурных коннектомов из 13 исследований, охватывающих возраст от 2 до 102 лет. 25 различных комбинаций параметров сканирования представляют почти весь спектр клинических и популяционных протоколов. Среди участников 5900 человек без когнитивных нарушений, 877 с мягкими когнитивными нарушениями и 639 с болезнью Альцгеймера.

Сравнение с обычной VAE, PCA с кластеризацией k-means и моделями, использующими аннелирование только в функции потерь, показало преимущество нового подхода. Индекс ARI (Adjusted Rand Index) для разделения по сайтам сканирования достиг 0,53 (p<0,05), что статистически значимо выше, чем у остальных методов.

Разработка, по сути, предлагает инструмент для «калибровки» мультицентровых исследований: теперь можно автоматически выявлять и компенсировать аппаратные расхождения, не теряя при этом информацию о реальных биологических различиях, таких как возрастные изменения или патологии.

Результаты опубликованы на платформе arXiv (препринт 2605.13933). Код и данные, по-видимому, будут доступны после рецензирования, но уже сейчас метод можно использовать в качестве ориентира для построения устойчивых моделей анализа коннектомов.