OpenGadget3: ускорение космологических симуляций на GPU в 2-5 раз

Международная группа учёных провела масштабное тестирование GPU-портирования кода N-body для гидродинамических космологических симуляций OpenGadget3. Результаты работы опубликованы на arXiv и показывают значительное ускорение вычислений.

Тесты охватили как отдельные физические модули, так и полные симуляции. Для индивидуальных модулей — интегратора гравитации, гидродинамического решателя и сопряжённого градиента для теплопроводности — ускорение GPU относительно CPU составило от 3 до 5 раз на один чип.

В более сложных космологических и гидродинамических сценариях, где задействовано множество физических процессов, общее ускорение на один чип (при одинаковом числе узлов и CPU на узел) достигло 2–3 раз.

Для проверки точности были проведены несколько тестов: симуляция только гравитации, гидродинамический тест ударной трубы, нерадиационная вложенная симуляция скопления галактик и полная физическая вложенная симуляция галактики. Сравнение с классической CPU-версией показало отличное согласие, с небольшими расхождениями лишь на очень малых масштабах.

Тестирование проходило на четырёх разных суперкомпьютерах: Leonardo Booster (CINECA), MareNostrum-V (BSC), SuperMUC-NG2 (LRZ) и кластер CIP физического факультета Мюнхенского университета Людвига-Максимилиана.

Разработчики отмечают, что GPU-портирование OpenGadget3 открывает новые возможности для моделирования крупномасштабной структуры Вселенной с более высоким разрешением за приемлемое время. Это особенно актуально для задач космологии и астрофизики, где требуются огромные вычислительные ресурсы.

Работа основана на более ранней публикации Ragagnin et al. (2020), в которой были описаны технические детали портирования, а теперь представлена детальная оценка производительности и точности.