Диффузионная модель DiffusionGemma-26B превзошла авторегрессионные аналоги в радиологии

Редакция RusNews 03-июл, 09:47 Наука 1 Искусственный интеллект

Группа исследователей представила адаптацию диффузионной языковой модели DiffusionGemma-26B для медицинских приложений. В отличие от традиционных авторегрессионных моделей, которые генерируют текст слева направо, диффузионный подход использует двунаправленное устранение шума на всём полотне токенов.

В рамках эксперимента модель DiffusionGemma-26B сравнивалась с её авторегрессионным аналогом Gemma-4-26B одинакового размера на наборе данных медицинских вопросов и ответов по визуализации. Оценка проводилась с помощью LLM-судьи, устойчивого к многословию. Результаты показали, что диффузионная модель не уступает или превосходит авторегрессионную по всем метрикам.

Помимо точности, DiffusionGemma-26B продемонстрировала значительное преимущество в скорости: декодирование оказалось в 3,5–4,4 раза быстрее. Это стало возможным благодаря архитектуре смеси экспертов (MoE) и эффективному процессу денойзинга.

Ключевое отличие диффузионного подхода — возможность заполнения любых пропусков в тексте. Радиолог может зафиксировать отдельные фрагменты отчёта, а модель достроит текст между ними. Такая операция естественна для диффузии, но затруднительна для авторегрессионных моделей.

Эта функция особенно полезна при составлении радиологических заключений, которые часто бывают краткими или неоднородными у разных специалистов и учреждений. Модель позволяет гибко редактировать и дополнять отчёты, не требуя генерации с нуля.

Исследование подчёркивает, что медицинские фундаментальные модели пока остаются почти полностью авторегрессионными. Адаптация диффузионной архитектуры открывает новые возможности для интерактивного создания документации.

Диффузионная модель DiffusionGemma-26B превзошла авторегрессионные аналоги в радиологии

Разделы

Навигация

Теги

Диффузионная модель DiffusionGemma-26B превзошла авторегрессионные аналоги в радиологии

Читайте также

Разделы

Навигация

Теги