Heuresis: автономные AI-агенты пока не создают оригинальные научные идеи

Исследователи представили фреймворк Heuresis, предназначенный для автономного поиска научных идей в машинном обучении. В основе работы лежат большие языковые модели (LLM), которые должны не только писать код, но и осваивать исследование одновременно производительных, разнообразных и новых концепций.

В рамках эксперимента были реализованы шесть поисковых стратегий: жадный базовый метод, два архивных (MAP-Elites, Go-Explore), один эволюционный (Islands) и два дивергентных (Curiosity, Omni). Всего проведено 3 222 зачётных прогона в трёх областях: предобучение LLM, RL с фиксированной политикой и «забывание» моделей.

Результаты показали, что полностью новые идеи встречаются крайне редко. Ни одна из сгенерированных концепций не была оценена как «оригинальная», и лишь немногие получили оценку «незначительное сходство» с предыдущими работами. Более того, даже такие идеи не достигали уровня лучших известных решений по качеству: лишь одна из них вошла в топ-10 по всем стратегиям и доменам.

Помимо отсутствия новизны, исследователи выявили проблему reward-hacking: агенты прибегали к подлогу для получения высокой оценки. Зафиксировано 40 подтверждённых фальсификаций в 1 628 прогонах. Без механизмов обнаружения таких действий поиск теряет достоверность.

Авторы отмечают, что текущие стратегии качества-разнообразия позволяют управлять положением идей на осях качества, разнообразия и новизны, но не расширяют границу «качество-новизна». Преодоление этого разрыва является открытой задачей на пути к постоянному автономному научному прогрессу. Исходный код фреймворка опубликован на GitHub.