Вычислительная идентифицируемость: новый подход к причинному анализу от исследователей

Исследователи представили в arXiv новую концепцию — вычислительную идентифицируемость, расширяющую классическое понятие идентифицируемости в причинном выводе. Традиционные методы опираются на теоретические предположения о бесконечных данных и асимптотике, что часто неприменимо на практике.

Авторы предлагают определять идентифицируемость через конечную вычислительную процедуру поиска эмпирической оценки. Если в ходе поиска на данных удается найти оценку с заданной точностью, идентифицируемость считается достигнутой — при условии априорного распределения параметров и конкретного алгоритма поиска.

В экспериментах новый метод показал работоспособность в сложных сценариях: при малых размерах выборок, неоднозначных графических критериях, смешанных наблюдательно-интервенционных данных и при работе с контрафактическими данными и оценками. Это позволяет отвечать на тонкие практические вопросы идентификации, которые ранее были недоступны.

Разработанный фреймворк и код доступны в открытом репозитории на GitHub. Исследователи подчеркивают, что вычислительная идентифицируемость не заменяет теоретический анализ, но дополняет его, делая причинный вывод более применимым в реальных задачах.

Публикация вызвала интерес в сообществе машинного обучения и статистики, поскольку предлагает практический инструмент для оценки причинных эффектов в условиях ограниченных данных и сложных моделей.