AutoMCU: Нейросети для микроконтроллеров настраиваются за 1-2 часа с помощью LLM-агентов

Разработчики из ведущих исследовательских центров представили систему AutoMCU, которая решает ключевую проблему edge-вычислений — развертывание нейросетей на микроконтроллерах (MCU). Из-за ограничений по памяти, хранилищу и вычислительной мощности такие устройства долгое время не могли эффективно запускать современные ИИ-модели.

AutoMCU использует мультиагентную систему на основе LLM. Она получает на вход требования к задаче на естественном языке и спецификации аппаратного обеспечения, после чего итеративно генерирует архитектуры нейросетей. Важной особенностью является фильтрация невыполнимых вариантов ещё до начала обучения — с помощью обратной связи от инструментов производителей чипов.

Система включает два ключевых механизма: генерацию архитектур с обратной связью от реального железа (это позволяет отсеивать варианты, не вписывающиеся в ограничения по RAM и Flash) и изолированное мультиагентное планирование, координирующее этапы предложения, обучения, оценки и развертывания.

Эксперименты на наборах данных CIFAR-10 и CIFAR-100 при жёстких ограничениях MCU показали, что AutoMCU достигает конкурентоспособной точности, сокращая время настройки до 1–2 часов. Для сравнения, традиционные методы аппаратно-ориентированного поиска архитектур (HW-NAS) требуют сотен GPU-часов.

Дополнительные тесты на бенчмарке NAS-Bench-201 (сравнение с ColabNAS и GENIUS) подтвердили эффективность и стабильность AutoMCU. Систему также успешно развернули на реальных микроконтроллерах STM32, что говорит о её практической применимости.

Таким образом, AutoMCU предлагает инженерам быстрый и надёжный способ адаптировать нейросети для устройств интернета вещей, умных датчиков и других встраиваемых систем без необходимости в глубоких знаниях аппаратной оптимизации.