ИИ с доступом к медицинским записям дает более точные ответы пациентам — исследование
Ученые провели исследование, в котором оценили, насколько большие языковые модели (LLM) способны помочь пациентам разобраться в их медицинских данных. В работе использовалась модель Gemini 3.0 Flash, а в качестве контекста — обезличенные персональные медицинские записи (PHR).
Всего было сгенерировано 2257 запросов, отражающих типичные вопросы пациентов: от коротких поисковых фраз до развернутых вопросов из чат-ботов и реальных обращений в медучреждения. Эти запросы сопоставили с 1945 наборами PHR.
Ответы модели оценивались в трех режимах: без использования контекста, с базовой сводкой демографических данных и диагнозов, а также с полным набором клинических заметок. Для оценки применяли как автоматические рейтинги (на основе фреймворка SHARP), так и оценки врачей на подвыборке из 95 случаев.
Результаты показали статистически значимое улучшение полезности ответов во всех категориях запросов при наличии PHR (p<0.001). Также отмечен рост безопасности, точности, релевантности и персонализации ответов.
Однако исследователи выявили и проблемные зоны: модель иногда теряет временную ориентацию (например, путает порядок событий) и в редких случаях «галлюцинирует» — выдает правдоподобные, но неверные данные. Для мониторинга таких ошибок была разработана специальная оценочная рамка.
Авторы работы делают вывод, что интеграция персональных медицинских записей в ИИ-ассистенты может помочь широкому кругу пользователей лучше понимать свое здоровье. Они планируют продолжить исследования, чтобы оценить реальную пользу для пациентов.



