Новая инфраструктура DeepInsight объединяет оценку Physical AI на всех уровнях

Исследователи представили DeepInsight — инфраструктуру для оценки Physical AI, которая охватывает весь стек, от декодирования фундаментальной модели до тысячных долей секунды управления телом. Проблема в том, что существующие фреймворки рассчитаны только на отдельные уровни, и для полной оценки приходится собирать разнородные системы, не имеющие общего рантайма и метрик.

DeepInsight решает эту задачу, работая на едином рантайме. Вместо унификации разных режимов система сохраняет их разнообразие за счет трех узких абстракций — task, resource и result. Каждая из них реализована как инвариантная для каждой подсистемы: единый драйвер эпизода, единый протокол для ресурсоемких бэкендов и единая схема идентификации для записи всех событий.

Инфраструктура уже развернута в продакшене на всех трех уровнях стека воплощенного гуманоидного робота. Благодаря единым инвариантам новые бенчмарки подключаются в основном через конфигурацию, без глубокой интеграции.

Там, где существуют зрелые инструменты для фундаментальных моделей, DeepInsight воспроизводит их результаты в собственных пределах, запускает тесты быстрее на одном узле и масштабируется почти линейно при добавлении новых узлов. Основное преимущество — диагностика: поскольку каждый слой пишет в единый трейс, регрессия, возникшая в одном слое и проявившаяся в другом, локализуется по этому трейсу.

Разработка позволяет отказаться от фрагментированной оценки и перейти к целостному анализу производительности Physical AI. Это важный шаг для робототехники и систем, где важна согласованная работа всех уровней.