Google DeepMind выпустила квантованные версии Gemma 4: ИИ для смартфонов и ноутбуков

Редакция RusNews 06-июн, 23:44 IT новости

Google DeepMind выложила официальные квантованные версии своей открытой модели Gemma 4. Эти специализированные чекпойнты значительно снижают требования к памяти, что открывает возможность запуска ИИ на устройствах с ограниченными ресурсами.

Самый компактный вариант в мобильном формате занимает примерно 1 ГБ памяти. Это позволяет запускать модель не только на мощных серверах, но и на ноутбуках, периферийных устройствах и даже смартфонах.

Веса моделей уже доступны на платформе Hugging Face. Разработчики могут свободно скачивать и использовать их в своих проектах, адаптируя ИИ под конкретные задачи.

Квантование — это техника сжатия нейросетей, при которой уменьшается точность вычислений (например, с 32-битных чисел с плавающей запятой до 8-битных). Это резко сокращает объём памяти и ускоряет инференс, особенно на мобильных устройствах.

Таким образом, Gemma 4 становится доступной для широкого круга разработчиков, которые хотят интегрировать ИИ в приложения для смартфонов, встраиваемых систем и edge-устройств. Это ещё один шаг к демократизации доступа к передовым языковым моделям.

Напомним, что Gemma 4 — это открытая модель от Google DeepMind, нацеленная на исследовательские и коммерческие применения. Ранее она была доступна только в полноразмерных версиях, требующих значительных вычислительных ресурсов.

Google DeepMind выпустила квантованные версии Gemma 4: ИИ для смартфонов и ноутбуков

Разделы

Навигация

Теги

Google DeepMind выпустила квантованные версии Gemma 4: ИИ для смартфонов и ноутбуков

Читайте также

Разделы

Навигация

Теги