Представлен Darwin Mobile Agent — ИИ-агент для самообучения на мобильных интерфейсах

Группа исследователей представила Darwin Mobile Agent — открытую программную инфраструктуру, предназначенную для автономного обучения с подкреплением на мобильных графических интерфейсах (GUI). Работа опубликована на arXiv и описывает путь к созданию саморазвивающихся агентов, способных адаптироваться к сложным, открытым средам.

Авторы опираются на «Bitter Lesson» — концепцию, согласно которой наиболее эффективный путь к общему искусственному интеллекту заключается в систематическом удалении человеческих приоритетов и позволении интеллекту естественным образом возникать при взаимодействии с «Большим миром», на порядки сложнее самого агента.

В качестве практического прокси такого мира выбраны мобильные GUI — они повсеместны, разнообразны и требуют от агента понимания последовательных действий, визуального восприятия и принятия решений в реальном времени.

Darwin Mobile Agent решает проблему сбора данных в реальных мобильных сценариях: он использует асинхронный цикл «агент-среда», работающий на параллельных экземплярах облачных телефонов. Это позволяет масштабировать сбор данных и тренировку политик без привязки к физическим устройствам.

Исследователи также предложили концептуальную дорожную карту для поэтапного удаления человеческих приоритетов из трёх ключевых компонентов саморазвивающегося агента: формирование обучающих заданий (task curricula), проверка результатов (outcome verification) и управление памятью (memory management).

Текущая реализация Darwin подтверждает стабильность и масштабируемость, необходимые для первого этапа — оптимизации политики в домене GUI. По словам авторов, работа закладывает практическую и теоретическую основу для создания по-настоящему автономных, саморазвивающихся GUI-агентов.

Проект распространяется как open-source, что даёт возможность сообществу исследователей и разработчиков присоединиться к экспериментам и дальнейшему развитию подхода.