Hyrax: открытый фреймворк для быстрых ML-экспериментов в астрономии
Международная группа исследователей выпустила Hyrax — открытую Python-библиотеку для машинного обучения в астрономии, ориентированную на работу с большими данными от новых телескопов, включая обсерваторию имени Веры Рубин, телескопы Roman и Euclid. Фреймворк написан для GPU и поддерживает полный жизненный цикл ML-проектов: от загрузки данных до обучения, инференса и сравнения экспериментов.
Среди ключевых возможностей Hyrax — поддержка мультимодальных наборов данных (изображения, спектры, кривые блеска), встроенные векторные базы данных для поиска по сходству, а также интерактивное исследование латентного пространства в 2D и 3D для ненаправленного открытия новых объектов. Это решает проблему «бутылочного горлышка» инфраструктуры, которая становится главным тормозом для ML-проектов в астрономии по мере роста объёмов данных.
В демонстрационных тестах на реальных данных авторы применили Hyrax в пяти задачах. На изображениях галактик из обзора LSST DP1 (около 400 тыс. объектов) метод ненаправленного обучения позволил выявить ранее не замеченные кандидаты в сливающиеся галактики и объекты с низкой поверхностной яркостью, которых нет в каталогах Euclid и Dark Energy Survey. Также фреймворк помог отделить артефакты съёмки без использования размеченных данных.
Другое применение — гибридная кластеризация для поиска кандидатов в гравитационные линзы на масштабах скоплений галактик в тех же данных DP1. В задаче классификации транзиентов на ранних стадиях по данным Zwicky Transient Facility Hyrax объединил кривые блеска, спектры, изображения и метаданные, показав эффективность мультимодального подхода.
Кроме того, фреймворк использовался для фильтрации ложноположительных детекций в поиске далёких объектов Солнечной системы по данным проекта DECam Ecliptic Exploration, а также для контролируемого обнаружения карликовых галактик на снимках Hyper Suprime-Cam с помощью синтетической инъекции источников.
По словам разработчиков, Hyrax предоставляет специализированную ML-инфраструктуру для астрономии, позволяющую систематически открывать новые объекты и быстро итерировать методы обработки данных. Код фреймворка опубликован в открытом доступе, что позволяет другим научным группам адаптировать его под свои задачи. Исследование опубликовано на arXiv, рецензирование пока не пройдено.







