Китайская GLM-5.2 сравнялась с Mythos от Anthropic в поиске уязвимостей — но лишь на одном тесте

Китайская GLM-5.2 сравнялась с Mythos от Anthropic в поиске уязвимостей — но лишь на одном тесте

Китайская компания Z.ai представила открытую языковую модель GLM-5.2, которая, по данным исследования, показала уровень, сопоставимый с закрытой моделью Mythos от американской Anthropic в области поиска уязвимостей в программном коде. Эта новость вызвала интерес в ИТ-сообществе, так как открытые модели обычно уступают проприетарным аналогам в сложных задачах.

Как сообщает The Wall Street Journal со ссылкой на исследователей, в тесте на выявление уязвимостей (Vulnerability Detection benchmark) GLM-5.2 достигла показателей Mythos. Однако ключевая оговорка заключается в том, что сравнение проводилось только на одном бенчмарке, который не охватывает всё разнообразие задач кибербезопасности.

Mythos — это топовая модель Anthropic, специализирующаяся на кибербезопасности. Она является закрытой, и её точные характеристики не раскрываются. GLM-5.2, напротив, доступна для всех желающих, что делает её привлекательной для разработчиков и исследователей.

Эксперты отмечают, что результат может свидетельствовать о прогрессе в области открытых ИИ-моделей, но не стоит делать поспешных выводов об общем паритете. Узкий бенчмарк не гарантирует такого же уровня в реальных условиях, где требуется обработка разнообразных типов уязвимостей и сложных сценариев атак.

Тем не менее, сам факт, что открытая модель смогла сравниться с закрытой в конкретной задаче, подчёркивает рост конкуренции в сфере ИИ-безопасности. Это может стимулировать дальнейшие исследования и ускорить внедрение открытых решений в области киберзащиты.

В сообществе уже начались дискуссии о том, насколько репрезентативен данный тест. Некоторые специалисты скептически относятся к результату, указывая, что Mythos может превосходить GLM-5.2 в других аспектах. Другие видят в этом подтверждение того, что открытые модели постепенно догоняют коммерческие разработки.

Публикация WSJ вызвала широкий резонанс, особенно в контексте глобальной гонки ИИ-технологий. Китайские компании активно наращивают свои ИИ-мощности, и успехи в таких нишевых областях, как кибербезопасность, могут стать важным шагом вперёд.