Causal ML оценил эффект дополнительного жилья на Airbnb

Научная работа, опубликованная на arXiv, предлагает новый подход к измерению причинно-следственной связи между увеличением предложения и транзакциями на двусторонних рынках. В качестве примера авторы взяли платформу Airbnb, но методология применима и к другим подобным площадкам.

Ключевая задача — понять, как добавление новых объектов размещения влияет на общее количество бронирований. Традиционные статистические методы часто дают смещённые оценки из-за эндогенности, когда решение владельцев выставить жильё может совпадать с высоким спросом. Каузальное машинное обучение позволяет корректно выделить именно эффект от дополнительного предложения.

Авторы объединили два подхода: double/debiased machine learning, который устраняет смещение за счёт кросс-валидации, и иерархическую байесовскую модель. Последняя позволяет использовать априорные знания о рынке — например, что в похожих районах влияние может быть аналогичным. Для измерения схожести сегментов жилья применялись метрики из геопространственного анализа.

Результаты показали, что модель даёт правдоподобные оценки возврата от дополнительного предложения. Вне выборки (out-of-sample) прогнозы оказались достаточно точными, что подтверждает надёжность подхода. Это может помочь платформам вроде Airbnb принимать решения о стимулировании владельцев выставлять новое жильё или о таргетировании маркетинговых усилий.

Метод особенно актуален для рынков с гетерогенными товарами, где эффект от нового предложения сильно различается по сегментам. Например, в густонаселённых районах с высоким спросом дополнительное жильё может дать больший прирост бронирований, чем в отдалённых. Модель позволяет это учесть.

Хотя работа выполнена на данных Airbnb, авторы подчёркивают, что их подход универсален. Он может применяться к маркетплейсам такси, доставки еды, аренды вещей и любым другим платформам, где есть две стороны — продавцы и покупатели.