Anthropic выпустила Claude Opus 4.8: модель стала честнее и сильнее в агентах

Компания Anthropic выпустила очередное обновление своей флагманской языковой модели — Claude Opus 4.8. Разработчики заявили о двух ключевых улучшениях: модель стала заметно честнее сообщать о собственных ошибках и существенно прибавила в эффективности при работе в роли агента.
Повышение честности означает, что Claude теперь реже галлюцинирует и чаще признаёт свою неуверенность или невозможность выполнить запрос. По данным Anthropic, это снижает риск дезинформации и повышает доверие пользователей к выводам модели.
Второе важное новшество — усиление агентских способностей. Модель лучше справляется с длинными цепочками действий, требующими планирования, использования инструментов и адаптации к промежуточным результатам. Как сообщается в блоге компании, это открывает новые возможности для автоматизации сложных рабочих процессов.
Claude Opus 4.8 уже доступна пользователям через API и в приложении Claude. Разработчики отмечают, что обновление затронуло как базовую языковую модель, так и специализированные компоненты для выполнения задач.
Эксперты связывают улучшение агентских качеств с растущим спросом на ИИ-ассистентов, способных не просто генерировать текст, но и выполнять практические действия: бронировать билеты, оформлять заказы, управлять календарём. Anthropic стремится составить конкуренцию другим компаниям в этой сфере.
Пользователи уже начали тестировать новую версию. Первые отзывы в соцсетях подтверждают: Claude стал реже выдумывать факты и увереннее справляется с многоэтапными инструкциями.







