Новый метод машинного обучения превзошёл традиционные подходы в анализе кривых блеска звёзд
Международная группа учёных разработала новый метод машинного обучения для анализа кривых блеска — временных рядов, описывающих изменение яркости небесных объектов. Предложенный подход, основанный на доменно-информированной многовидовой самодистилляции с использованием архитектуры Joint-Embedding Predictive Architecture (JEPA), значительно превосходит традиционные методы.
Кривые блеска — ключевой источник данных в астрономии, однако их анализ затруднён неравномерной выборкой, сложным шумом и широким диапазоном физических временных масштабов. Существующие фундаментальные модели временных рядов часто не справляются с этими особенностями астрономических наблюдений.
Новый метод решает эти проблемы с помощью трёх компонентов: семантически сохраняющих представлений, токенизации с учётом неопределённости и многовидовой самодистилляции. Кодировщики обучались на наборе данных LEAVES с использованием регуляризации LeJEPA и оценивались на бенчмарке StarEmbed.
Результаты впечатляют: на 15 из 16 метрик классификации метод превзошёл признаки, созданные вручную астрономами. В режиме few-shot (обучение с одним примером на класс) он достиг макро-F1 42,56%, а со 100 примерами — 63,58%, последовательно улучшая показатели.
Помимо классификации переменных звёзд, полученные представления поддерживают поиск по сходству, оценку параметров и обнаружение дрейфа фотометрического нуля. Метод также протестирован на 12 разнородных наборах данных из PYRREGULAR, где адаптированная версия превзошла предыдущие лучшие результаты на 5 из них.
Исследование подчёркивает важность доменно-специфичных индуктивных смещений при обучении представлений временных рядов. Универсальной оптимальной архитектуры не существует — успех приносят подходы, учитывающие особенности предметной области, такие как астрономические временные ряды.







