Ученые доказали линейную границу max-information для DP-SGD

Редакция RusNews 27-май, 12:20 Наука 1 Искусственный интеллект

Понимание связи между обобщением и приватностью остается одной из центральных проблем в теории машинного обучения, особенно для глубоких сетей, обучаемых с помощью дифференциально приватного стохастического градиентного спуска (DP-SGD). В новой работе, опубликованной на arXiv, исследователи сделали шаг к решению этой задачи.

Авторы доказали конечную границу приближенной max-information для алгоритма DP-SGD. Этот показатель характеризует, сколько информации о тренировочных данных сохраняется в модели. Полученная граница масштабируется линейно с размером набора данных, что сопоставимо с классическим результатом Дворка и соавторов для ?-дифференциально приватных алгоритмов.

Результат позволяет вывести общую границу обобщения в стиле PAC-Bayes, где априорное распределение может быть изучено самим DP-SGD. Кроме того, получена явная граница обобщения для моделей, обученных с помощью DP-SGD, которая полностью контролируется гиперпараметрами оптимизации.

Практическая значимость работы в том, что она дает теоретическое обоснование того, как DP-SGD балансирует между приватностью и способностью модели обобщать на новые данные. Это важно для приложений, где требуется защита конфиденциальности, например, в медицине или финансах.

Исследование подтверждает, что даже при сильных гарантиях приватности DP-SGD может обеспечивать хорошее обобщение, если правильно настроены гиперпараметры. Работа доступна в виде препринта на arXiv.

Ученые доказали линейную границу max-information для DP-SGD

Разделы

Навигация

Теги

Ученые доказали линейную границу max-information для DP-SGD

Читайте также

Разделы

Навигация

Теги