Meituan представила LongCat-2.0: LLM с 1,6 трлн параметров на китайских чипах

Редакция RusNews 01-июл, 20:24 Hi-tech

Meituan объявила о релизе LongCat-2.0 — крупной языковой модели с 1,6 трлн параметров. Ключевая особенность в том, что полный цикл обучения и инференса выполнен на кластере из 50 тыс. китайских ASIC-ускорителей. Это один из крупнейших публично описанных примеров полного обучения LLM на национальном «железе».

Архитектура модели использует механизм разреженного внимания LongCat Sparse Attention (LSA), который позволяет обрабатывать до 1 млн токенов контекста, снижая вычислительную сложность с квадратичной до близкой к линейной. Также применяется динамическая активация параметров в рамках архитектуры Mixture of Experts: от 33 до 56 млрд активных весов на токен в зависимости от сложности запроса.

Для повышения качества LongCat-2.0 использует метод дистилляции MOPD (Multi-Teacher On-Policy Distill). Три группы специализированных «экспертных» подмоделей (агентные, reasoning и интерактивные) обучают единый чекпоинт, что улучшает работу с инструментами, многошаговую логику и снижает галлюцинации.

По результатам бенчмарков, модель показывает конкурентоспособные результаты. В SWE-bench Pro LongCat-2.0 набрала 59,5 балла, опередив Gemini 3.1 Pro и приблизившись к уровню GPT-5.5 и Claude Opus последних версий. Также отмечены сильные показатели в Terminal-Bench 2.1 и задачах веб-агентов.

Практические демонстрации включают автоматическое построение SQL-агентов, рефакторинг крупных кодовых баз под новые API, генерацию веб-приложений по одному описанию, создание интерактивных 3D-сцен на Three.js и многоагентные системы генерации текстов с контролем согласованности на длинном контексте.

Выпуск LongCat-2.0 знаменует сразу два сдвига: переход к триллионным моделям, обученным на полностью локальной аппаратной базе, и смещение фокуса в сторону агентных сценариев. Это усиливает конкуренцию между китайской и западной экосистемами LLM и показывает, что масштабное обучение на национальных вычислительных кластерах становится практической реальностью.

Meituan представила LongCat-2.0: LLM с 1,6 трлн параметров на китайских чипах

Разделы

Навигация

Теги

Meituan представила LongCat-2.0: LLM с 1,6 трлн параметров на китайских чипах

Читайте также

Разделы

Навигация

Теги