Три AI-агента на основе LLM помогли NASA генерировать научные гипотезы по спутниковым данным
Учёные представили систему EO-Agents, которая объединяет три агента на основе больших языковых моделей (LLM) для автоматической генерации научных гипотез в области наблюдения Земли. В основе метода лежит граф знаний NASA Earth Observation Knowledge Graph, содержащий информацию о тысячах наборов данных.
Сначала нейросеть на графах (Heterogeneous Graph Neural Network) ранжирует потенциальные пары датасетов на основе исторических данных об их совместном использовании. Затем три LLM-агента последовательно фильтруют, генерируют и оценивают структурированные исследовательские гипотезы.
Эксперимент на 1475 наборах данных NASA показал, что система способна выдвигать правдоподобные гипотезы в таких областях, как эко-гидрология, гляциология, взаимодействие аэрозолей и облаков, фенология растительности и химия стратосферы. Всего было получено 160 гипотез.
По словам авторов, новые комбинации датасетов, предсказанные моделью, были оценены как почти столь же правдоподобные, как и реальные комбинации из литературы. Это говорит о том, что система находит научно обоснованные, но ранее не изученные сочетания.
Дополнительно исследователи провели факторный эксперимент с использованием GPT-5.2 и Claude Sonnet 4.6. Оказалось, что порядок гипотез по значимости стабилен, но абсолютные оценки сильно зависят от модели-судьи. Это выявило ограничения при использовании одной LLM для оценки научных гипотез.
Разработка может ускорить научные открытия в области климата, экологии и других дисциплин, где требуется анализ больших объёмов спутниковых данных. Полученные гипотезы уже доступны для проверки сообществом.



