GLARE: Новый интерфейс на LLM упрощает запросы к глобальным объяснениям ИИ-моделей

Понимание того, как нейросети принимают решения, остаётся одной из ключевых задач объяснимого ИИ (XAI). Глобальные объяснения дают общее представление о поведении модели на всём датасете, но их сложность затрудняет практическое использование. Новый подход под названием GLARE призван решить эту проблему.

Как сообщается в препринте на arXiv (2606.19735v1), группа разработчиков создала интерактивный интерфейс на основе большой языковой модели (LLM). Система выступает посредником: пользователь задаёт вопрос на естественном языке, а LLM переводит его в структурированный SQL-запрос к данным локальных объяснений. Это позволяет гибко агрегировать информацию без необходимости изучать низкоуровневые представления.

GLARE выводит ответы, дополненные статистикой и визуализациями, ориентированными на намерение пользователя. Например, можно спросить: «Какие признаки чаще всего влияют на классификацию кошек?» — и получить не абстрактный график, а конкретный текстовый ответ с подтверждающими данными.

Разработчики провели серию экспериментов для оценки системы: точность интерпретации намерений, качество преобразования запросов в SQL, способность обобщать на новые вопросы и датасеты, а также устойчивость к лингвистическим ошибкам. Результаты показали, что LLM-посредничество значительно улучшает доступность и удобство глобальных объяснений.

Авторы отмечают, что GLARE открывает путь к более человеко-центрированному взаимодействию с XAI. Вместо статичных артефактов пользователи получают диалоговый доступ к пониманию моделей, что может быть полезно как для разработчиков, так и для конечных пользователей ИИ-систем.

Исследование выполнено на базе нескольких датасетов изображений и архитектур классификаторов. Полные детали и код, вероятно, будут опубликованы отдельно. Новость носит информационный характер и не является призывом к использованию описанного подхода в продакшне без дополнительной проверки.