Lung-R1: ИИ с графом знаний превзошёл аналоги в диагностике лёгочных болезней

Диагностика лёгочных заболеваний требует анализа разнородных данных, при этом симптомы разных болезней часто пересекаются. Современные большие языковые модели (LLM) неплохо отвечают на общие вопросы, но для постановки диагноза по истории болезни нужен более глубокий анализ, связывающий конкретные симптомы и данные пациента.

Чтобы решить эту проблему, группа исследователей разработала LungKG — первый структурированный граф знаний для систематизации знаний о лёгочных заболеваниях и их диагностике. Граф содержит 59 038 узлов (сущностей) и 164 308 связей (отношений) 15 типов сущностей и 112 типов отношений. По сути, это формализованная база знаний, которая связывает симптомы, заболевания, результаты обследований и методы лечения.

На основе LungKG была создана модель Lung-R1. Её обучали с помощью цепочек рассуждений, ограниченных графом, и подкрепляющего обучения (reinforcement learning), направляемого тем же графом. Такой подход позволил модели не просто запоминать факты, а научиться логически выводить диагноз из данных электронной медицинской карты (EMR).

В тестировании на 20 системах модель Lung-R1 с 14 миллиардами параметров показала наилучшие результаты по трём категориям: выбор ответа (Choice), вопросы по лёгочным заболеваниям (Pulmonary-QA) и диагностика по EMR. В задаче EMR Diagnosis модель набрала 4,3583 балла, что на 0,1476 балла выше, чем у сильнейшего аналога без LungKG.

Исследователи отмечают, что LungKG может служить многоразовым ресурсом для дальнейших разработок в области пульмонологии. Применение графа знаний в обучении значительно повысило точность диагностики, особенно при работе с реальными электронными медицинскими записями.

Работа опубликована на платформе arXiv и представляет собой шаг к созданию ИИ-ассистентов, способных помогать врачам в сложных дифференциальных диагнозах.