Нейросеть Multi-Time Attention ускорила анализ астрономических кривых блеска для телескопа Рубин
Ученые разработали новую вычислительную модель на основе Multi-Time Attention Network для быстрой характеристики астрономических фотометрических временных рядов. Алгоритм работает без учителя и не требует тяжелой предобработки данных, что делает его идеальным для анализа больших массивов.
Модель была протестирована на данных оповещений ZTF, обработанных через систему Fink, которая служит прототипом брокера для будущего телескопа Рубин (Rubin LSST). Результаты показали, что нейросеть точно восстанавливает кривые блеска даже при редких наблюдениях: смещение составило всего 0,01 звездной величины, а разброс — 0,1 звездной величины.
Ключевое преимущество Multi-Time Attention — способность выявлять скрытые закономерности во временной области. Модель строит латентное пространство, которое отражает физически значимые свойства объектов: длительность, время максимума, изменчивость и цвет. При этом она устойчива к менее важным характеристикам, таким как наблюдаемая звездная величина или количество наблюдений.
Важной проверкой стала сепарация сверхновых (SN) и активных ядер галактик (AGN). Несмотря на доминирование AGN в обучающей выборке, модель успешно разделила эти классы. Более того, нейросеть проявила способность к обобщению: она корректно интерполировала и разместила в латентном пространстве объекты долгопериодических переменных и приливных разрушений звезд (TDE), хотя не была обучена на этих классах.
Вместе с тем, у модели есть ограничения: она не смогла уловить быстрые пульсации переменных типа RR Лиры с периодом около 0,4–0,5 суток, поскольку ее временное разрешение составляет два дня. Анализ карт внимания показал, что механизм multi-time attention способен выявлять локальные структуры кривых блеска.
Модель отличается чрезвычайно малым весом (несколько сотен килобайт) и высокой скоростью обработки: около 0,01 секунды на кривую блеска на CPU и 0,0003 секунды на GPU, причем время не зависит от числа наблюдений, в отличие от гауссовских процессов.
Разработчики подчеркивают, что их подход предлагает гибкую и масштабируемую характеристику кривых блеска, что особенно актуально в эпоху телескопа Рубин, который будет генерировать миллионы оповещений за ночь. В будущем планируется включить в модель учет наблюдательных неопределенностей и симметрий для повышения робастности, а также адаптировать ее для задач прогнозирования и оперативного реагирования на транзиенты.






