Cursor представила Composer 2.5: 69.3% на тесте Terminal-Bench

Cursor представила Composer 2.5: 69.3% на тесте Terminal-Bench

Компания Cursor объявила о выходе Composer 2.5 — новой версии собственной модели искусственного интеллекта, предназначенной для помощи программистам. Обновление уже доступно в редакторе Cursor, популярном среди разработчиков благодаря интеграции AI-функций.

Главное достижение Composer 2.5 — результат на бенчмарке Terminal-Bench 2.0. Этот тест имитирует работу в терминале на реальных задачах, оценивая способность модели выполнять команды и решать проблемы. Предыдущая версия Composer 2 набрала 61.7%, а новая — 69.3%, что на 7.6 процентных пункта выше.

Разработчики Cursor подчеркивают, что Composer 2.5 лучше справляется с длинными задачами, точнее следует сложным инструкциям и в целом приятнее в использовании. Однако подробных технических деталей о том, за счет чего достигнуто улучшение, компания не раскрыла.

Terminal-Bench 2.0 считается одним из авторитетных тестов для AI-моделей, ориентированных на программирование. Высокий результат на нем указывает на практическую пользу модели для разработчиков, работающих с командной строкой.

Cursor продолжает активно развивать свои AI-инструменты, стремясь составить конкуренцию более крупным моделям. Пользователи редактора могут протестировать Composer 2.5 прямо сейчас, выбрав соответствующую опцию в настройках.