Cursor представила Composer 2.5: 69.3% на тесте Terminal-Bench

Компания Cursor объявила о выходе Composer 2.5 — новой версии собственной модели искусственного интеллекта, предназначенной для помощи программистам. Обновление уже доступно в редакторе Cursor, популярном среди разработчиков благодаря интеграции AI-функций.
Главное достижение Composer 2.5 — результат на бенчмарке Terminal-Bench 2.0. Этот тест имитирует работу в терминале на реальных задачах, оценивая способность модели выполнять команды и решать проблемы. Предыдущая версия Composer 2 набрала 61.7%, а новая — 69.3%, что на 7.6 процентных пункта выше.
Разработчики Cursor подчеркивают, что Composer 2.5 лучше справляется с длинными задачами, точнее следует сложным инструкциям и в целом приятнее в использовании. Однако подробных технических деталей о том, за счет чего достигнуто улучшение, компания не раскрыла.
Terminal-Bench 2.0 считается одним из авторитетных тестов для AI-моделей, ориентированных на программирование. Высокий результат на нем указывает на практическую пользу модели для разработчиков, работающих с командной строкой.
Cursor продолжает активно развивать свои AI-инструменты, стремясь составить конкуренцию более крупным моделям. Пользователи редактора могут протестировать Composer 2.5 прямо сейчас, выбрав соответствующую опцию в настройках.







