SciAtlas: граф знаний из 43 млн научных работ для AI-исследований
Современная наука переживает информационный взрыв: количество публикаций растёт экспоненциально, а традиционные поисковые системы не справляются с топологическим анализом логических связей между работами. В ответ на это исследователи создали SciAtlas — крупномасштабный граф знаний, призванный стать «когнитивной картой» для AI-агентов.
SciAtlas объединяет более 43 миллионов статей из 26 дисциплин, формируя панорамную сеть эволюции науки. База данных содержит 157 миллионов сущностей (авторы, организации, концепты) и 3 миллиарда триплетов, описывающих связи между ними.
Разработка включает нейро-символический алгоритм поиска с тройным реколом и графовым реранжированием. Это позволяет перейти от поверхностного семантического сопоставления к детерминированному обнаружению ассоциаций, снижая риск логических галлюцинаций у AI-моделей.
Авторы выделяют несколько ключевых применений SciAtlas: автоматический обзор литературы, синтез исследовательских трендов, позиционирование новых идей и изучение академических траекторий. Система значительно сокращает вычислительные затраты по сравнению с глубокими исследовательскими фреймворками.
Интерфейсы для работы с графом и различные downstream-задачи уже доступны в открытом репозитории проекта на GitHub. SciAtlas демонстрирует новый подход к организации научных данных, делая их доступными для AI-ассистированных исследований.






