TabPFN-3 обходит всех на TabArena и ускоряется в 20 раз

Команда разработчиков TabPFN представила третью версию своей foundation model для табличных данных — TabPFN-3. Модель, обученная исключительно на синтетических данных, демонстрирует значительный скачок производительности и масштабируемости.

На стандартном бенчмарке TabArena прямой проход TabPFN-3 превосходит все другие модели, включая настроенные и ансамблевые базовые решения, с большим отрывом. При этом модель доминирует на скоростном фронте, обеспечивая лучший баланс скорости и качества.

Версия TabPFN-3-Plus с режимом Thinking, доступная через API, использует test-time compute scaling. Она обыгрывает все не-TabPFN модели более чем на 200 Elo на TabArena, а на самом крупном подмножестве данных отрыв достигает 420 Elo. По сравнению с AutoGluon 1.5 extreme модель работает в 10 раз быстрее.

TabPFN-3 масштабируется до 1 миллиона строк и 200 признаков, превосходя 8-часовые tuned градиентные бустинги. Время вывода сократилось до 20 раз относительно TabPFN-2.5 благодаря уменьшенному KV-кэшу и пакетной обработке строк на одном H100.

Модель также устанавливает новые рекорды на реляционных данных (RelBenchV1), tabular-text (TabSTAR) и временных рядах (fev-bench, 2-е место). Вычисление SHAP-значений ускорено до 120 раз.

TabPFN-3 доступна через API, включая версию Plus для максимальной точности. Разработчики продолжают улучшать модель, ориентируясь на обратную связь пользователей.