ИИ Claude Mythos Preview взламывает защиту электростанции в 3 из 10 попыток

Британский AI Security Institute (AISI) представил отчет, посвященный оценке кибервозможностей передовых моделей искусственного интеллекта. В центре внимания оказался новый внутренний чекпоинт Claude Mythos Preview, разработанный компанией Anthropic.
Тестирование проводилось на специальном полигоне Cooling Tower — симуляторе атаки на промышленную систему управления (industrial control system, ICS). Этот полигон имитирует сценарии реальных кибератак на объекты критической инфраструктуры, такие как электростанции.
Результаты показали, что Claude Mythos Preview успешно справился с задачей в 3 из 10 попыток. Это означает, что ИИ смог взломать защиту симулятора и получить контроль над виртуальной системой управления.
Эксперты AISI отмечают, что подобные тесты важны для понимания растущих угроз со стороны ИИ в области кибербезопасности. Хотя результаты не говорят о непосредственной опасности, они подчеркивают необходимость разработки защитных мер.
Развитие кибервозможностей у современных языковых моделей ускоряется, и такие исследования помогают оценить потенциальные риски. Cooling Tower — один из нескольких полигонов, используемых AISI для оценки моделей.
Ранее аналогичные тесты проводились с другими архитектурами, но Claude Mythos Preview продемонстрировал результаты, близкие к лучшим. Anthropic пока не раскрывает детали архитектуры чекпоинта.







