DeepSeek открыла исходный код DSpark, ускоряющего ИИ до 85%

Китайская компания DeepSeek совместно с Пекинским университетом выпустила в открытый доступ модуль DSpark, который значительно ускоряет работу языковых моделей. Разработка опубликована на GitHub вместе с техническим отчетом.
DSpark представляет собой программный модуль, оптимизирующий процесс генерации ответов без необходимости изменять саму модель. Это позволяет повысить скорость выдачи без дополнительного обучения.
Тестирование на боевых серверах превью-версий DeepSeek-V4-Flash и V4-Pro показало прирост скорости генерации до 85% для каждого пользователя. Таким образом, модуль способен почти вдвое ускорить ответы ИИ.
В основе DSpark лежат алгоритмы, ускоряющие вычисления на этапе инференса. Код написан с использованием современных фреймворков и может быть интегрирован в существующие системы.
Открытая публикация кода позволяет разработчикам по всему миру изучить, протестировать и адаптировать модуль для своих проектов. Технический отчет содержит детальное описание архитектуры и результаты экспериментов.
Это не первый случай, когда DeepSeek делится своими наработками с сообществом. Компания ранее выпускала открытые модели, способствуя развитию open source в области ИИ. DSpark может стать полезным инструментом для ускорения работы крупных языковых моделей.
Пока модуль протестирован на конкретных версиях моделей DeepSeek, однако разработчики могут адаптировать его и для других архитектур. Полный код доступен для скачивания и модификации.







