Машинное обучение превосходит нейросети в классификации синдромов криопатии
Учёные разработали и сравнили методы машинного обучения для автоматической классификации синдромов криопатии — группы редких заболеваний, при которых в крови образуются криоглобулины. Диагностика затруднена из-за перекрытия лабораторных показателей и редкости некоторых форм.
В работе, опубликованной на arXiv, использованы данные 2686 пациентов, разделённых на 14 диагностических категорий. Набор включал демографические переменные, измерения криоглобулинов, тесты преципитации, титры гемагглютинина и гемолизина. Данные прошли очистку, кодирование, нормализацию и дополнение клинически значимыми интерактивными признаками.
Всего оценено 12 стратегий моделирования, включая случайный лес, градиентный бустинг, многослойный перцептрон, ансамбли с мягким голосованием, балансировку классов методом SMOTE, иерархическую классификацию, модели с учётом периода наблюдения, целевые бинарные классификаторы и калибровку вероятностей.
Производительность измеряли по макроусреднённой F1-мере, точности, точности Top-3 и ожидаемой ошибке калибровки. Задача оказалась сложной из-за сильного дисбаланса классов и клинического перекрытия диагнозов.
Лучшую многоклассовую производительность показал ансамбль с мягким голосованием из случайного леса и градиентного бустинга. Кросс-валидация подтвердила стабильность сбалансированной модели случайного леса. Древовидные методы неизменно превосходили нейросетевую модель.
Инженерный отбор признаков улучшил дискриминацию, а наиболее информативными предикторами стали производные интерактивные признаки на основе криоглобулинов. Результаты указывают на практическую применимость ансамблевых методов для поддержки клинических решений при редких синдромах.


