ИИ-агенты защитят конфиденциальность: новый метод MINIM фильтрует UI-данные перед отправкой на сервер

Современные LLM-агенты часто передают полное состояние пользовательского интерфейса на удалённые серверы для обработки, даже если большинство элементов не относится к текущей задаче. Это создаёт риск утечки конфиденциальных данных, таких как коды аутентификации, личные уведомления или фоновые приложения.

Исследователи из arXiv представили MINIM — доверенный локальный посредник, который выполняет фильтрацию данных на стороне клиента до отправки. Метод основан на концепции Contextual Integrity (контекстной целостности). MINIM оценивает каждый элемент интерфейса по двум параметрам: внутренней чувствительности (s) и необходимости для задачи (n).

На основе этих оценок применяется тройная политика раскрытия: необходимые элементы сохраняются, чувствительные атрибуты абстрагируются, а нерелевантный контент удаляется. Разработчики оптимизировали цель, которая сильнее штрафует ошибки необходимости для высокорискового контента, что позволяет агрессивно сокращать данные без потери критической для задачи информации.

Эксперименты на реальных UI-наблюдениях из WebArena показали, что MINIM существенно снижает утечку чувствительных данных, не относящихся к задаче, при этом сохраняя необходимый семантический контекст и интерактивные возможности для надёжных действий агента.

Разработка особенно актуальна для сценариев, где ИИ-агенты работают с банковскими приложениями, медицинскими сервисами или корпоративными системами — областях, где конфиденциальность критична. MINIM позволяет использовать мощь LLM без передачи лишних приватных данных на внешние серверы.

Метод не требует изменения архитектуры самих LLM, а добавляет прослойку на стороне устройства. Это делает его легко интегрируемым в существующие агентные системы, повышая доверие пользователей к автоматизированным помощникам.