Google DeepMind выпустила квантованные версии Gemma 4: ИИ для смартфонов и ноутбуков

Google DeepMind выложила официальные квантованные версии своей открытой модели Gemma 4. Эти специализированные чекпойнты значительно снижают требования к памяти, что открывает возможность запуска ИИ на устройствах с ограниченными ресурсами.
Самый компактный вариант в мобильном формате занимает примерно 1 ГБ памяти. Это позволяет запускать модель не только на мощных серверах, но и на ноутбуках, периферийных устройствах и даже смартфонах.
Веса моделей уже доступны на платформе Hugging Face. Разработчики могут свободно скачивать и использовать их в своих проектах, адаптируя ИИ под конкретные задачи.
Квантование — это техника сжатия нейросетей, при которой уменьшается точность вычислений (например, с 32-битных чисел с плавающей запятой до 8-битных). Это резко сокращает объём памяти и ускоряет инференс, особенно на мобильных устройствах.
Таким образом, Gemma 4 становится доступной для широкого круга разработчиков, которые хотят интегрировать ИИ в приложения для смартфонов, встраиваемых систем и edge-устройств. Это ещё один шаг к демократизации доступа к передовым языковым моделям.
Напомним, что Gemma 4 — это открытая модель от Google DeepMind, нацеленная на исследовательские и коммерческие применения. Ранее она была доступна только в полноразмерных версиях, требующих значительных вычислительных ресурсов.







