Новый метод машинного обучения повысил точность классификации опухолей ЦНС до 96%
Учёные представили новый подход к классификации опухолей центральной нервной системы (ЦНС) по данным метилирования ДНК. Метод основан на комбинации разреженной случайной проекции для снижения размерности и мультиномиальной логистической регрессии для классификации. Работа опубликована в репозитории arXiv.
Исследователи оценили модель в тех же экспериментальных условиях, что и широко используемый эталонный классификатор. На эталонной когорте из 2801 образца средняя точность при стратифицированной 3-кратной кросс-валидации составила 96%. На независимой клинической выборке из 1104 образцов точность достигла 86% на уровне 91 класса и 93% при оценке на уровне семейств классов метилирования.
Эти результаты улучшают соответствующие показатели предыдущего эталонного метода — 82% на уровне классов и 88% на уровне семейств. Абсолютный прирост составил примерно 4 и 5 процентных пунктов соответственно. Такое улучшение клинически значимо: в диагностических условиях повышение точности классификации на 5% может напрямую повлиять на определение подтипа опухоли и, следовательно, на выбор терапии и последующие клинические решения.
Авторы подчёркивают, что предложенная модель основана на более строгой методологической практике машинного обучения и стабильно превосходит предыдущий best-in-class во всех сценариях оценки. Это может повысить надёжность классификации опухолей ЦНС и улучшить качество медицинской помощи пациентам.
Метилирование ДНК является мощным инструментом для классификации опухолей ЦНС, однако до сих пор существовали проблемы с переносимостью между когортами, методологической корректностью и робастной многоклассовой оценкой. Новая работа направлена на решение этих проблем, предлагая одновременно эффективный и воспроизводимый метод.




