Новый метод объясняет решения ИИ с помощью причинности и аргументации

Современные модели машинного обучения часто работают как «черный ящик»: они показывают, какие признаки влияют на прогноз, но не объясняют причин принятия решения. Новый метод, описанный в препринте на arXiv, предлагает ответ на этот вопрос.

Разработчики объединили две области: поиск причинно-следственных связей (causal discovery) и аргументационные рассуждения. Сначала алгоритм выявляет, как переменные влияют друг на друга, затем переводит эти зависимости в Bipolar Argumentation Framework — систему, где каждый признак либо поддерживает, либо оппонирует предсказанию.

Для поиска объяснений используются полустабильные семантики (semi-stable semantics): они находят наборы признаков, которые совместно объясняют итоговый вывод модели. Такой подход не просто перечисляет важные факторы, а показывает логику их взаимодействия.

Метод протестировали на двух эталонных датасетах. Результаты сравнили с популярными post-hoc техниками интерпретации, такими как LIME и SHAP. Новый способ показал сопоставимую или лучшую способность выявлять решающие причины.

По мнению авторов, работа особенно полезна в областях, где необходимо не просто знать «что», но и «почему»: медицина, финансы, автономные системы. Объяснимость остаётся одной из ключевых проблем внедрения ИИ в ответственные сферы.

Разработка не требует доступа к внутренним весам модели — она работает с входными данными и выходами, что делает её применимой к любым алгоритмам.