Auto-FL-Research: новый инструмент для автоматического поиска алгоритмов федеративного обучения
Федеративное обучение (FL) сталкивается с множеством мелких, но важных алгоритмических выборов: варианты оптимизаторов, правила агрегации на сервере, локальные графики обучения, нормализация и архитектура моделей. Ручное исследование этих комбинаций дорого, а справедливое сравнение затруднено, если изменения влияют на сам процесс обучения. Для решения этой проблемы команда исследователей разработала Auto-FL-Research (AFR) — специализированный рабочий процесс на основе агентов, способных предлагать и реализовывать алгоритмы FL.
AFR работает в ограниченном пространстве: агенты могут менять правила агрегации, расписания обновлений клиентов, локальные цели и зарегистрированные варианты моделей, но фиксированы бюджет вычислений, контракт связи и итоговая оценка. Каждая кампания записывает оценки кандидатов, время выполнения, изменённые файлы и статус сбоя. Такой подход позволяет систематически исследовать пространство алгоритмических рецептов.
Разработчики оценили AFR на пяти задачах здравоохранения из набора FLamby (кросс-силос) и на профилях для пяти фиксированных наборов LEAF. Повторные прогоны с разными seed показали улучшения на четырёх задачах FLamby и пяти из шести профилей LEAF. В то же время были выявлены случаи чувствительности к seed и сбои при выборе алгоритма.
Контрольные эксперименты с тем же бюджетом показали, что часть улучшений действительно связана с изменениями рецептов FL, тогда как другие результаты объясняются фиксированными поверхностными настройками или не воспроизводятся при повторных запусках. Эти смешанные результаты, по словам авторов, являются частью вклада: они позволяют отделить устойчивые FL-механизмы от эффектов тонкой настройки и артефактов единичных прогонов.
Работа размещена на arXiv и представляет интерес для исследователей, занимающихся автоматизацией машинного обучения и федеративным обучением, особенно в медицинской сфере, где конфиденциальность данных критична. AFR может ускорить поиск эффективных алгоритмов и повысить воспроизводимость результатов.


