ArXiv начал банить авторов за «ИИ-мусор» в научных статьях — борьба с фейковыми работами

ArXiv начал банить авторов за «ИИ-мусор» в научных статьях — борьба с фейковыми работами

ArXiv, ведущий архив научных препринтов по физике, математике, информатике и смежным дисциплинам, ужесточил правила: авторов, массово загружающих «ИИ-мусор», начали банить. Решение принято после лавины статей, сгенерированных нейросетями, которые не несут научной ценности и загрязняют базу.

По данным администрации платформы, за последние месяцы число подозрительных препринтов выросло кратно. Модераторы вручную проверяют кандидатов на бан: в первую очередь блокируют тех, кто публикует десятки статей за короткий срок с однотипным содержанием, характерным для работы языковых моделей.

ArXiv не раскрывает точное количество забаненных, но отмечает, что фильтрация стала жестче — отсеяны уже несколько тысяч работ. Для научного сообщества это важный шаг, так как репозиторий является одним из главных источников свежих исследований, и засорение его «мусором» подрывает доверие.

Проблема ИИ-генерации в науке не нова: ранее с ней столкнулись издательства журналов, но ArXiv как открытая платформа оказался особенно уязвим. Теперь администрация вводит автоматические алгоритмы для выявления признаков машинного текста, а также усиливает ручную модерацию. Некоторые авторы уже жалуются на ложные срабатывания, но в целом меры поддерживаются учеными.

Эксперты отмечают, что подобные действия станут трендом для всех научных баз данных. ArXiv, как пионер в этой борьбе, задает стандарты для других репозиториев. В будущем ожидается ужесточение требований к сопроводительным метаданным и обязательная декларация использования ИИ.

Для игровой индустрии и киберспорта эта новость косвенно важна: ИИ активно используется не только в науке, но и в разработке игр, генерации контента и аналитике. Борьба с «мусором» в академической среде может повлиять на этические нормы и в смежных областях.