Метод SPACE удаляет данные из ИИ без доступа к исходным изображениям

Проблема удаления конфиденциальных данных из обученных ИИ-моделей становится всё острее: регуляторы ужесточают требования, а компании рискуют утечками. Однако существующие методы машинного забывания обычно требуют доступа к тем самым данным, которые нужно стереть, что невозможно при строгих политиках хранения. Группа исследователей предложила решение — метод SPACE, работающий без исходных изображений.

SPACE (Source-free Proxy Anchor Concept Erasure) — первый фреймворк source-free unlearning, специально разработанный для мультимодальных больших языковых моделей (MLLM). Он состоит из двух этапов: Text-Guided Proxy Anchor Selection (TPAS) и Dual-Constraint Semantic Isolation (DCSI). На первом этапе система извлекает семантически близкие якоря из общего пространства признаков, используя текстовые подсказки. На втором этапе эти якоря оптимизируются так, чтобы «забыть» целевые концепции, не затрагивая остальные знания.

Особенность DCSI в том, что обновления ограничиваются нулевым пространством сохранённых знаний — это гарантирует, что модель не потеряет способность работать с другими данными. Теоретически доказано, что SPACE строго ограничивает возмущение на сохранённых знаниях и максимизирует спектральную энтропию признаков, сохраняя общую производительность.

Эксперименты на шести датасетах показали, что SPACE достигает результатов, сопоставимых с методами, требующими доступа к данным (data-dependent). Это подтверждает эффективность подхода в сценариях, где исходные изображения недоступны — например, после удаления данных по запросу пользователя или в соответствии с GDPR.

Разработка важна для компаний, работающих с конфиденциальной информацией: здравоохранение, финансы, персональные сервисы. Source-free методы позволяют соблюдать политики конфиденциальности, не снижая качество моделей. Исходный код SPACE будет опубликован после рецензирования.