MMGNN: многоуровневые графовые нейросети точнее предсказывают свойства молекул
Предсказание свойств молекул — ключевая задача для открытия лекарств и материаловедения. Стандартные графовые нейронные сети (GNN) обрабатывают весь молекулярный граф как единое целое, что может смешивать сигналы разных типов взаимодействий и требовать глубоких слоёв для учёта дальних эффектов. Новая архитектура MMGNN (Multi-level, Multi-color Graph Neural Network) предлагает альтернативный подход.
MMGNN разбивает молекулярный граф на перекрывающиеся подграфы, каждый из которых отвечает за пару типов атомов. Для ковалентных связей строится 2D-версия (MMGNN-2D), а для трёхмерной геометрии — 3D-версия (MMGNN-3D), учитывающая расстояния, углы и торсионные углы. Оба варианта используют общий механизм передачи сообщений для каждого подграфа, а затем агрегируют информацию на уровне атома и молекулы.
Модель протестировали на пяти задачах классификации и трёх задачах регрессии из бенчмарка MoleculeNet с использованием стандартных разбиений по молекулярным скелетам. Результаты усреднялись по пяти независимым запускам. MMGNN-2D показал наивысший макро-средний AUC-ROC (0,838) среди всех классификационных наборов и лучшую среднеквадратичную ошибку RMSE на ESOL (0,803).
MMGNN-3D, в свою очередь, достиг рекордного AUC-ROC на BBBP (0,956) и минимальной RMSE на FreeSolv (1,793). Это подчёркивает взаимодополняющий характер топологических и геометрических представлений: 2D-модель эффективнее для общей классификации, а 3D-модель — для задач, связанных с проницаемостью и энергией сольватации.
Структурный анализ и оценка методом leave-one-out показали, как разбиение на подграфы влияет на обученные представления и чувствительность к парам типов атомов. Исследователи отмечают, что MMGNN позволяет лучше интерпретировать, какие именно взаимодействия важны для конкретного свойства.
Работа опубликована на сервере препринтов arXiv. Разработчики считают, что идея многоцветных перекрывающихся подграфов может стать конкурентоспособной стратегией для задач предсказания свойств молекул, сочетая эффективность с интерпретируемостью.



